前字节跳动 Seed 工程师:字节跳动 AI 迭代需六个月,介于谷歌的三个月之间

Gate News 消息,4月24日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客“Into Asia”中透露,字节跳动大约需要六个月时间才能完成一次大型语言模型训练 ( 预训练的完整循环,加上后训练 ),而据报道谷歌只需要三个月。张驰将这种速度差异视为中国公司在 AI 开发上难以追赶的核心原因。

张驰描述了 Seed 内部的“基准测试文化”:团队负责人会根据其所负责的基准分数进行评估,所有成员都专注于提升数字。不过,他指出这在实践中并不会转化为更好的用户体验。尽管从纸面上看,中国大型公司的模型似乎与美国前沿模型具有竞争力,但在实际使用中却有所不足。Seed 的目标是达到全球顶尖水平,但张驰表示他并不认为团队已经实现这一点,也没有达成国内领导层的目标。

在 2024 年下半年,Seed 认为自己与 GPT-4o 不相上下,但在 DeepSeek 发布之后,团队意识到差距仍然存在。张驰加入时,整个团队正紧急转向强化学习,以弥补这一不足。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆