前字节跳动 Seed 工程师:字节跳动 AI 迭代需要六个月,而谷歌是三个月

Gate News 消息,4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客“Into Asia”中透露,字节跳动完成一次完整的大型语言模型训练周期大约需要六个月 (预训练加上后训练),而谷歌据称只需要三个月。张驰将这种速度差异视为中国公司在 AI 开发上难以追赶的核心原因。

张驰还描述了 Seed 内部的“一种基准测试文化”,团队负责人会根据他们所负责的基准测试得分来接受考核,所有成员都专注于提升数字。不过,他指出这在实践中并不会带来更好的用户体验。尽管从纸面上看,中国主要公司的模型似乎具备与美国前沿模型竞争的实力,但在实际使用中却存在不足。Seed 的目标是达到全球顶级水平,但张驰表示他并不相信团队已经实现了这一点,也没有达到国内领导层的目标。

到 2024 年底,Seed 认为自己与 GPT-4o 不相上下,但在 DeepSeek 发布之后,团队意识到差距仍然存在。张驰加入时,整个团队正在紧急转向强化学习,以弥补这一短板。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات