前字节跳动种子工程师:字节跳动 AI 迭代需要六个月,而谷歌需要三个月

Gate News 消息,4 月 24 日——字节跳动种子团队的前工程师张弛、现任北京大学助理教授在播客“Into Asia”中透露,字节跳动完成一次大型语言模型训练(预训练以及后训练)需要大约六个月,而据称谷歌只需要三个月。张弛将这种速度差异视为中国公司在 AI 开发方面难以追赶的核心原因。

张弛描述了种子内部的一种“基准测试文化”:团队负责人会根据他们所负责的基准测试得分来接受评估,所有成员都致力于提升数据指标。不过他指出,这种做法在实践中并不会转化为更好的用户体验。尽管从纸面上看,中国大型公司的模型似乎与美国前沿模型具备竞争力,但在实际使用中却有所欠缺。种子的目标是达到全球一流水平,但张弛表示他不认为团队已经实现了这一目标,也未达成国内领导者的目标。

在 2024 年末,种子团队认为自己与 GPT-4o 处于同一水平,但在深度求索发布之后,团队意识到差距仍然存在。张弛加入时,整个团队正急切地转向强化学习,以弥补这一不足。

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев