0
联系电话:4001-158-698EN

公司新闻 行业动态 产品知识

C17官方网站-C17(中国)-独家丨腾讯混元3幕后:重构架构,姚顺雨一场非典型的「逆袭」

早于三月,提起立刻要上线的混元 3.0,于腾讯混元事情的同窗左飞就对于雷峰网(公家号:雷峰网)说过:“此次混元的新版本,实在团队预期不算过高。”

一个月后,4 月 23 日晚,Hy3 的 Preview 版本正式发布,同步开源,向世界展示本身最真正的样子。雷峰网独家获悉,Hy3 范围更年夜、功效更周全的闭源旗舰版本将于五六月份发布,给人留下不少想象空间。

(腾讯混元的新进展,雷峰网正于连续存眷,接待添加作者微信:william_dong,交流信息,切磋认知。)

提及来,腾讯 Hy3 Preview 的发布也有点“生不逢时”——前有 GPT 5.5 环球围不雅,后有 DeepSeek V4 重磅回归,被夹于中间的混元,还有是于“9.7 减去 9.11”的小学数学题上犯了难,于社交平台上引起了一阵围不雅。

“实在 GPT 及 DeepSeek 的发布日期于咱们内部也不是甚么奥秘,但为何选择于这个时辰及他们一路发布,我也不太清晰。”左飞对于雷峰网如是说

Hy3 之在 4 个月前的上一个版本毕竟有哪些变化?于混元内部的同窗邰萝对于雷峰网分享道:“Hy3 基本上把以前的架构重构了一遍,但简朴来来讲,是回到了‘基本’。”

一直以来,业界的“基本”,是利用 Transformer 架谈判 Full Attention 等一系列被验证了的技能方案,如 OpenAI 实践的同样,少有花狸狐哨的操作,焦点是把 DATA 做到极致;

而 Hy2 的期间,腾讯却测验考试了不少架构上的立异——好比 Multi-Token Prediction、Mamba 等方案,反而把数据及 Infra 的“基础题”放下了。

到了 Hy3,姚顺雨则主导模子回到“基本”,从头利用颠末验证的共鸣架构。而已往没绕过,今天也不成能绕过的数据及 Infra 问题,则成为了必需下足的“苦功夫”。

腾讯同窗雷瓯对于雷峰网说,于已往,不少 SFT 数据没有颠末去重,反复、冗余的数据甚至能到达上万万条,特别是工期紧张的时辰,数据的优先级就被排于了很后面。

姚顺雨来到腾讯,拉起了一个 20 余人的预练习数据团队,专门做数据审核“最脏最累”的事情,几个月内把冗余的 SFT 数据节制于了一万多条的范围下。

而于 Infra 的角度,姚顺雨也拎起了一个团队,重构已往腾讯 RL 的管线,让万卡集群可以或许跑患上不变、安全,有应答突发环境的能力。

以前,于腾讯 TEG,内部利用的基础举措措施是一个名叫“太极”的呆板进修平台。近期,太极平台的 Feature 也于以一到两周一次的速率举行更新,做了不少迭代事情。

在是,于腾讯内部的 Benchmark 上,混元的机能可以到达 Kimi 2.5 的程度,逾越了 MiniMax,仅次在 Gemini 及 Seed 2.0。

于混元系统的革新中,姚顺雨饰演的脚色不仅是一个技能首脑:除了了数据及 Infra 举行了年夜量重构,混元的构造及职员也完成为了不小的调解。

构造上,混元被分为了预练习、后练习、Baseline Infra、模子评估及 Frontier 五年夜板块,除了 Frontier 更偏技能摸索及预研之外,四个板块十几个组,以十分扁平的布局,险些全数投入 Hy3 的研发傍边,而姚顺雨也被评价为十分亲历亲为的带领脚色,对于技能细节相称存眷,及下面同窗一路开会时辰不少;

职员上,姚顺雨入主以后,也于鞭策团队的重构,从字节、阿里、DeepSeek、Kimi 等部招揽年夜量焦点人材,姚顺雨特别喜欢信奉 AGI、技能扎实的年青人,不少校招生、实习生也插手团队,给团队注入了不少新鲜血液。

如今的姚顺雨,面对的并不是与行业巨头半斤八两的正面比武,而是一场从底层补短板、填缝隙的追逐之战——腾讯的逆袭绝非一挥而就,惟有沉下心打磨基本功,方能积贮气力迎头遇上,重回竞逐的第一梯队。

(腾讯等年夜厂于 AI 赛道上的竞逐,暗地里黑幕不少,雷峰网正连续深度查询拜访,接待添加作者微信:william_dong相识更多动静。)

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-C17官方网站-C17(中国)
1210
在线客服
在线客服

Maggie

微信咨询

黎小姐