虽然没有明说,但赵文渊兴奋的语气让韩路一听出来,第三条是他最想走的路。
“自训基座模型。”
“现在市面上的开源底座,不够用了?”
“别人开源的底座本身,从我们现在的角度来看,有很多的优化空间。如果我们从零开始训练一个代码专用大模型,架构可以针对代码生成做优化——上下文窗口、依赖追踪、多文件理解,全部可以从底层设计。这种方式上限最高,完全自主可控,首轮正确率有可能能做到九十以上。”
“成本也很高,对吧。”韩路一说。
“三千万人民币起步。”赵文渊说,“而且是每一次。如果跑飞了——参数配错、数据有问题、损失不收敛,那就得推倒重来,又是三千万。”
韩路一暗自为这个数字咋舌。
这就是那种,你心里早就知道它贵,真听到数字还是会感慨:真他妈的贵。
赵文渊看了他一眼,继续说:“这个方案预估时间六到十二个月,风险极高,但是如果成了——”
他没把话说完。
不需要说完。如果成了,天工就不只是微调模型,源码在ai时代就有了核心竞争力,这是谁也拿不走的王牌。
自己的模型。
自己的底座。
自己的护城河。
这一刻,韩路一其实比谁都清楚,这就是他最想要的东西。
因为ai这个行业,本质上是飞轮型竞争。
越早进场,越早积累数据,越早迭代模型,越早建立产品闭环,就越容易把后面的人甩开。
领先者不是领先一步。
而是一步之后,还能借这一小步,再滚出下一步、下下一步。
飞轮一旦转起来,后面的人想追,除非前面的人自己犯错。
韩路一看着窗外的江面,心里很清楚:
这条路,越早开始越好。
但是,自研模型是个无底洞,究竟能不能成,没人知道。
三条路,三个价格。
五百万、一千万、三千万。
最后一条路是三千万,每次。
韩路一沉默了一会儿。
赵文渊没催。
韩路一站起来走到窗边,太阳照在江面上,亮得有点晃眼。
他在想的不是技术,技术的部分赵文渊已经足够好了,即使他用视界辅助他自己自学的大模型知识,相比赵文渊的水平也高不出