说到这里,抬起头看了一眼韩路一。
“第二个,是想了解一下你们目前的算力、数据、团队情况。这个不涉及商业秘密的部分,你们大概介绍一下就行。”
“第三个,是想听听你们后续有什么规划,市里看看能不能提前做好服务。”
最后一段说完,许处长看了看旁边的陈副区长,陈副区长点了点头:“区里也是。”
说是三个问题,其实只有一个,汤圆,到底有没有水分。
毕竟如果是真的,海城突然冒出来一家能把大模型做到全球第一梯队的公司,那就不是他这个级别来对接了。
“各位领导,贾老师,我先回答第一个问题。”韩路一说道:“汤圆既不是宣传概念,也不是第三方模型套壳。”
这句话很直接,把来访者心里没说出来的疑问都解答了,剩下的就是证明了。
韩路一继续说道:“我们之前在发布会上展示的是汤圆的能力,今天可以现场复现。除了内部测试集之外,各位也可以现场出题,不限定领域,不限定形式,不限定语言。”
他顿了一下,又加了一句:“只要不涉及违法违规内容,汤圆都可以直接回答。”
许处长转头看向了贾教授。
贾教授脸上的笑意更明显了一点。
韩路一这个学生,毕业这么多年了,还和本科那会一样,直来直去。
但政府调研不是课堂答辩,有些话不能让领导问得太尖锐,得留余地。
贾教授开口道:“韩总,模型能力是一方面,大家现在真正关心的,是模型来源。网上有一种声音,说你们是调用了海外模型,或者是在别人的模型上做了包装。”
“这个问题你能不能先讲一下。”
这个问题,教授问比领导问合适,更何况贾教授和韩路一还有一段师生情谊在,就显得不那么过火。
韩路一点点头:“那当然。”
他在投屏的电脑上打开了一个本地文件夹,里面有详细的训练曲线日志。这个是模型训练中最难造假的东西,一个模型从零开始进行预训练,必须经历数月的过程,中间每一次训练收敛,损失下降,都记录了模型一点一点变强的过程。
汤圆的训练是在鼎盛的集群完成的,但是在和鼎盛达成协议之后,所有的源文件和训练记录都已经转移到了源智科技自己的机房里,经过加密之后,现在远程展现在这里。
这个东西,大部分人当然看不懂,但是贾教授作为