界面板快速扫了一圈,没有什么新东西。
嗯……就这?
辛辛苦苦升了一级,就这?
不过韩路一已经习惯了,视界的开发者——如果有的话——似乎根本就没打算好好写文档,既没有教程,也没有提示,即使有什么新功能也得自己探索。
韩路一回到座位上坐下,没有接着去处理工作,而是想了想升级的事情。
他对视界会在最近升级这件事是有所预期的,自从后训练开始之后,视界的经验值就在持续的增长,这也验证了他之前认为的,视界升级和“由视界贡献”的大模型研发之间有所联系。
但是今天最后一次查看的时候,视界的经验值还是97,汤圆的训练进度也还有几天的收尾要做。
怎么突然就升级了?
韩路一思索了一下,突然有了个想法。
莫非是鼎盛那边的大模型先训练好了?
他心里知道鼎盛会用自己训练用的标注数据去训练他们自己的大模型,也为此做了准备。
但是他没想到,偷去的数据,也能被视界视为升级的标准吗?
还挺包容的。
不过鼎盛的模型对他的威胁不算大,毕竟汤圆base已经基本达到了国际一流,他的标注数据也基本是侧重于中文的意图理解,鼎盛拿到的数据也是他精心筛选过的残缺版。
综合来看,鼎盛即使率先发布,也只是能猖狂一时,让他们去吸引一下国际上竞争对手的目光也不是坏事。
只是,如果他的猜测是正确的话,现在要做的事情就是尽快收集鼎盛违规使用源智科技私有数据的证据链。
毕竟,他们做没做是一件事,能不能告赢是另一件事。
韩路一暂时放下对视界升级的思考,把精力重新放回到眼前的工作上来。
视界升级是好事,但工作还是得做。
现在给汤圆做后训练的是八万多条中文标注数据,想要让汤圆能顺利接住kaiwu的流量,还需要同等量级的英文标注,韩路一现在连个零头还没肝出来呢。
至少有一个好处,精力值上限提高,标注数据时就可以一次干得更久了——等等,这似乎也不一定是好处?
韩路一自嘲地笑了一下,把目光放在屏幕上。
这是一份英文的语料,是赵文渊从数据公司买来的,记录了用户的工具使用行为,用于进行sft微调。
「用户输入:帮我做一个周会纪要模