周一上午十点,前滩,源码科技周会。
这是沈丛云推行的新制度,每周一固定高管周会,韩路一一开始嫌麻烦——对他自己麻烦,因为信息他用视界都收集过了,但开了两回他发现对其他人确实有用。
会议室里坐着五个人:韩路一、苏念念、沈丛云、陆明洲、赵文渊。现在开发两个组都汇报给韩路一,韩路一除了掌握公司战略,也在参与技术决策,相当于同时做ceo(首席执行官)和cto(首席技术官)的角色。
投屏上现在是赵文渊电脑上的一个数据页面,其中一个数字被选中高亮了:768。
“脱敏重训做完了,”赵文渊推了推眼镜,“准确率768,比脱敏前的784降了不到两个点,用户信息泄露率已经压到0001以下,基本干净了。”
韩路一点头,在第一轮用两个点的代价换一个干净的模型,他认为是值得的。
“但是,”赵文渊话锋一转,“我得讲讲下一步的方案。”
他切了一页ppt,一张数据量和准确率的拟合曲线,横轴从十万条拉到一百万条,纵轴是准确率,曲线在五十万条附近有一个明显的陡升区间。
“现在训练集在二十三万条左右,还在scalgw的陡升阶段,如果数据量能扩大到五十万,准确率预估能突破百分之八十五。这个数字很关键,因为乾元公开的基准数据是百分之八十四。”
所谓scalgw,说白了就是大力出奇迹,当数据量堆到一定程度,模型准确率会有一段暴涨期。但这个窗口不是无限的,过了拐点就进入边际递减,再往上堆就是烧钱换零头。韩路一看得懂那条曲线:现在正好卡在最陡的那段坡上。
会议室里安静了一会。
百分之八十四,是鼎盛倾集团之力,据说砸了三个亿做出来的代码大模型。
“数据我来想办法,”韩路一问,“训练成本要多少钱?”
“保守估计再加两百万,最近h100的租赁价又涨了,即使是年框价格也比上个月高了将近一成。”
“好,这个可以批,老陆你那边记一下。”韩路一说。
赵文渊点头,用鼠标在ppt上标注了一个箭头,指向百分之八十。
苏念念接过话头,她翻开平板上的汇报文档。文档是姜亦心准备的,排版比一个月前规范多了,苏念念的批注不是白给的。
“状态页上线三天,”她说,“用户反馈整体正面。社区里有几条帖子在说「终