七点半,十三楼还没几个人。
赵文渊推开十三楼办公室的玻璃门,走廊的灯还是感应模式,一段一段地亮起来。他把背包放在工位上,打开笔记本,先去茶水间接了一杯冰水。
这是他的习惯。早到一个半小时,利用安静的时间看数据。
模型的训练面板排在浏览器第一个标签页,昨晚跑的第六轮微调结果已经出了。
他点开损失曲线。
基本是平的。
和前天一样,和大前天一样,和上周一样,后训练走到这一步,就像拧毛巾里的水,最后几滴也拧干了。
赵文渊关掉面板,喝了一口冰水。
手机亮了一下,是lked的通知。
他一般不看lked,上面十条消息九条是猎头群发的模板,“高薪内推”“期待交流”,复制粘贴都懒得改名字。但这条不一样,发件人的主题里带着“nexai”的名字。
赵文渊点开了。
站内信,来自nexai的人才招募总监,不是群发模板,第一句话就写了他在谷歌时的研究方向,第二句提到了天工模型在代码生成领域所取得的成就——昨天才刚刚在官网上公布。
信息大意是:nexai正在计划组建中国区研究团队,可能在海城或京城,看过他的背景,希望约时间聊聊。
赵文渊没有回复。
但他顺着信息里的链接点进了nexai的官网。
团队配置:四十多位研究员,核心成员来自openai、deepd、taaib。技术目标:最好的通用大模型。正在招的岗位——基座模型训练。
每一条都踩在他心里最痒的地方。
他当然不想跳槽,但他真羡慕那些资源。他手上十几个人,每天只能在后训练的天花板底下磨那点提升。
走廊那头响起了脚步声,赵文渊赶紧关掉页面。
九点差一刻,十三楼已经坐了一半人。
小牛端着咖啡拐过来:“赵哥,昨晚的消融实验跑完了,结果在共享盘里。”
“看过了。”赵文渊说。
小牛愣了一下:“你几点看的?”
“早晨。”
小牛张了张嘴,没吭声,转身回了工位。
旁边的小郭在调数据清洗脚本,扭头问他怎么处理多语言混合的token切分,赵文渊走过去看了一眼屏幕,指了指第三行:“这里换个模式,先跑一版看效果。”