三天后。
鼎盛集团,大模型研究院,ai实验室。
刘大海已经在实验室待了二十几个小时了,熬了一个通宵,眼睛通红,里面布满了血丝。
他年纪不小了,这么熬夜已经有点儿吃不消了。
但是精神还是很亢奋。
刚和韩路一见完面那次,对方用7b小模型加上一万条的数据微调出来的那个叫“汤圆”的模型给了他很大的震撼。
后来他被叫到鼎盛ceo郑晓波的办公室里去问这个模型,他实话实说,一定是标注数据好。
郑晓波问他,如果能拿到同等质量的数据,他能做出什么成绩。
刘大海说,他能给天捅出个窟窿来。
那是夸张的说法。
但是没想到,这数据还真到他手里了,战投部的vp程远亲自拿u盘送过来的。
而且里面不是一万条,是八万条。
说是鼎盛和源智科技签了合作协议,对方共享过来的。
大概浏览了一下,刘大海就能确认,这就是把“汤圆”微调出来的数据。数据能标到这种程度,怪不得能把一个7b小模型微调得这么强。
见猎心喜,刘大海拉着组里的人就开了新一轮的后训练,直接上的顶格的计算资源。
一个轮次一个轮次的看结果,效果好的超乎想象。
一不小心就通了个宵。
很多人以为做大模型是个好职业,赚的钱多,大厂争抢,全社会瞩目。
可只有真干这一行的人才知道,这活儿一点也不好干。有很多时候,损失怎么降的,奖励模型怎么收敛,各项指标怎么平衡——代码能力提升了,数学推理又掉了。
有些能有理论来解释,有些也找不到解释。
干这一行就像在一片漆黑的大海上开船。
你既看不到终点,也看不到四周,只知道自己在前进,可究竟在向着哪个方向前进?不知道。
也不知道你会先到陆地,还是先撞上冰山。
怪不得搞模型的人喜欢戏称自己是炼丹的,开炉之前,你也不知道能不能成。
太像了。
正是因为知道每让模型能力提升一点有多难,一下子拿到这么多高质量的标注数据,让模型能力提升这么多,才会让刘大海这么兴奋。
可是在最初的兴奋过去之后,他突然感觉出点儿不对来。
源智科技有这么高质量的标注,他们不用