前字节跳动 Seed 工程师:字节跳动 AI 迭代需六个月,而谷歌为三个月

Gate News 消息,4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客《Into Asia》中透露,字节跳动完成一次完整的大型语言模型训练 (预训练循环还需 )与后训练,而据称谷歌只需要三个月。张驰将这种速度差异视为中国公司在 AI 开发上难以追赶的核心原因。

张驰描述了 Seed 内部的“基准测试文化”,即团队负责人会根据其所负责的基准分数来被评估,所有成员都专注于提升数据。然而,他指出这在实践中并不会转化为更好的用户体验。尽管从纸面上看,中国头部公司的模型似乎与美国的前沿模型具有竞争力,但在实际使用中却有所欠缺。Seed 的目标是达到全球顶级水平,但张驰表示他不认为团队已经达成,且也未达到国内领导层目标。

到 2024 年底,Seed 认为自己与 GPT-4o 水平相当,但在 DeepSeek 发布之后,团队意识到差距仍然存在。张驰加入时,这个团队的整个组正紧急转向强化学习,以弥补不足。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论