什么东西做的到,什么东西做不到,什么东西是真的,什么东西能作假——这些是他的第一反应。
程远没回答,转头看向刘大海。
刘大海开口道:“我一开始也寻(x)思过,但是应该是真的。”
郑晓波盯着他。
“有没有可能是在骗我们?”
刘大海摇头:“那不能够的,跑分能刷,但现场的测试是我出的题,这没法准备,而且那差距,咋说呢,老明显了。”
郑晓波往前探了探身。
“过拟合呢?”
刘大海愣了一下,没想到郑晓波会问出这么专业的问题。
“郑总之前了解过机器学习?”
“你就说有没有这个可能。”
过拟合不是在大模型时代才有的新概念了。
在机器学习里,数据会分成训练集和测试集。训练集用来教模型,测试集用来考模型。
但是你不能直接把训练集当测试集,因为模型会把答案背下来。
就像你想教一个小学生加法,教一加一,考一加一,你不知道他是背的还是真会了;教一加一,考二十三加十九,才能验证是不是真会了。
过拟合,就是模型把训练集的答案背下来了,测出来的分是虚高。
刘大海组织了一下语言,回答道:
“我也想过,不太能够。三道测试题来源完全不同,一道从鼎盛内部题库选的,一道我现场手打的,还有一道是我私人题库里最难的,内部都没几个人见过。而且三道题覆盖了三种不同类型的意图推断,他们全部精准命中。最后他们还展示了完整的基准数据,一千两百道题,十六个场景交叉验证,不是挑好的给我看的。”
“咋说呢,这个852,确实是实打实的。”
办公室安静了下来。
空调出风口的声音突然变得很清晰。
程远地下意识合上了文件夹,咽了口口水,然后尴尬的听见自己咽口水的声音怎么这么响。
刘大海盯着茶几上的花瓶,里面插着几枝干枯的棉花。
郑晓波的脸上还是古井无波,但他的手握在杯子上,既没有拿起来,也没有松开。
过了一会郑晓波才慢慢开口:“他是怎么做到的,你有想法吗?”
刘大海从背包里摸出笔记本电脑,走到郑晓波的办公桌前面,打开电脑,屏幕亮了。
上面是一份打开的文档——