盛云本来不是张弛在管吗,那张弛呢?
但是这个离他就太远了,他没再问。
不管怎么样,升职了就是好事。
刘大海开口感谢大老板的赏识,吕云又开口问了几个技术上的问题。
“现在这个版本,和当初发布会上的差多少?”
这是吕云最关心的问题。
“意图理解,尤其是中文环境下的意图理解,差距比较大,从九十多降到了不到八十。”
要说这个,其实刘大海是最委屈的。
坤元系列所有的模型都是他花了很大心血一步一步带过来的,发布会上的版本,用了那批“黄金标注”做后训练,中文的语义理解能力提升了一大块。
可是坤元本身的知识、逻辑、数学能力,也是处在闭源模型的第一梯队的。
结果发布会上着重强调的语义理解能力,和现实情境结合的能力,回退之后全没了,现在他能看到的舆论都在说坤元变笨了。
这还是被公关过的舆论,要是真让网友们在网上放开了聊,坤元11不知道会被人骂成什么样了。
多他妈委屈啊!
吕云听完刘大海的回答,缓缓点了点头,又问了一个问题:“想要做回发布会上的那个效果,你有方向了吗?”
刘大海这次来了自信:“有的,吕总,有的。咱们已经验证过了,标注要做成什么标准,就能提升意图理解,接下来只要在这方面加大投入,组建高水准的标注团队——不是普通的标注员,文科的高材生,什么学哲学的、心理学的、语言学的,花个半年的时间,我有信心做出发布会上的那个水准来。”
这才让吕云有点儿欣慰。
能快人一步自然好,如果做不快,那就做得好吧。
……
几天之后,美国,西海岸,nexai的办公室里。
ceo瑞恩再次把坤元11的实测报告看了一遍。
这已经是第三份报告了。
第一份来自产品团队,第二份来自研究团队,第三份来自外部社区数据汇总。
三份报告的结论基本一致。
坤元11的综合能力不错,但远远没有发布会表现出的压迫感。
尤其是中文复杂业务场景,它仍然有优势,却不是不可追赶的优势。
cto约翰坐在会议桌另一侧,脸上的表情明显很放松。
“所以,发布会那天他们展示的到底是什么?”瑞