书香阁 > 科幻灵异 > 首富从AI浪潮开始 > 第一百四十二章 唯一的解释

第一百四十二章 唯一的解释(3 / 4)

《汤圆模型-意图理解:可能的技术路径分析》

“这是我昨晚连夜写的。”刘大海说。

技术人的邀功还是直白了点。

他把屏幕对着郑晓波,往前推了推。

“先说排除法,指定不是架构创新。”

“意图理解这条赛道,openai的gpt现在是公认的天花板,也就78分出头。他拿一个开源的7b架构,参数量只有人家的零头,跑出852。郑总,这么跟您说吧,这就好比一个我们那县城中学的一个差生,用别人的旧课本自学,高考分数比全省状元还高三十分。我拍胸脯地说,绝对不是架构创新,7b的架构就那么点东西,翻不出花来。”

“现在大模型的竞争,已经过了参数军备竞赛的那个阶段了。几百亿参数、几千亿参数,架构上大家都整的差不多。transforr还是那个transforr,无非是层数搁(gě)那儿多一层少一层,注意力头多一个少一个。”

刘大海一边说一边仔细观察郑晓波的表情。

技术人给领导汇报,又怕说多了太多技术细节,领导听不懂。又怕说的太少太简略,领导觉得不满意。只能小心翼翼,随时调整。

“我能想到唯一的解释,除非这个县城学生用的不是别人的旧课本,而是一份全世界别的学生都没有的,黄金复习资料。”

郑晓波还是面无表情。

这时程远插话了——他没听懂,这没关系,但他主要是怕郑总也没听懂,这种问题不能让郑总来问。

“刘博士,不好意思,你这个比喻指的是?”

“是标注数据。”刘大海也意识到自己说上头了,赶紧扯回来,“郑总也大概了解,我就简单说一下。”

他把电脑转过来,去网上搜了一个流程图,再转回去面向郑晓波。

“咱们训练大模型主要分为几个阶段,先是预训练,就是堆语料,咱们恨不得把互联网上所有的东西都给它整进去。”

“然后是监督微调,找一帮人给模型做示范,教它学明白啥是好赖话儿。”

“再往后就是对齐,让模型学着按人的想法来排,回答得更像正常人说话。”

刘大海指了指屏幕上的流程图。

“第一步大家用的语料都差不多,互联网就那么多东西,你抓我也抓。真正拉开差距的是后面两步,谁的数据标注质量高,谁训出来的模型就强。”

“所以我说,那个……对方

最新小说: 开局签到荒古圣体全文免费阅读 国潮1980最新章节 重生之狂暴火法最新章节 国潮1980镶黄旗 重生之狂暴火法全文免费阅读 我是如何当神豪的最新章节 阴阳石最新章节 外科教父海与夏 白骨大圣全文免费阅读 盖世双谐最新章节