News | Gate 新聞

2026-05-19

10:12

阿里巴巴搶先預覽 Qwen3.7 AI 模型，將於 5 月 20 日推出，並在 LM Arena 排名前列

根據《南華早報》（South China Morning Post），阿里巴巴在原定於 5 月 20 日於杭州市舉行的阿里雲峰會（Alibaba Cloud Summit）之前，先行發布其即將推出的 Qwen3.7 AI 模型預覽版本。這些預覽模型在 LM Arena 上的全球頂尖 AI 系統之列，表現優於中國的 AI 實驗室，但仍落後於 Anthropic、Google 和 OpenAI 的模型。

04:17

阿里巴巴 Qwen3.7-Max 亮相，成為中國頂級模型，並在 Arena 上全球排名第 13 名

AI 行業動態

根據 Arena 排行榜，Alibaba 的 Qwen 團隊於 5 月 19 日推出 Qwen3.7-Max 與 Qwen3.7-Plus 預覽版本，並預設啟用深度推理模式，同時暫時停用網路搜尋。Qwen3.7-Max 在文字類別全球排名第 13 名，在國內排名領先；其數學項目得分第 7 名，專家提示與軟體 IT 分別第 9 名。Qwen3.7-Plus 在視覺類別取得第 16 名，也領先於中國模型。新模型的推出距離 4 月 20 日發布 Qwen3.6-Max 預覽僅 28 天，體現出快速迭代。該發布將在 5 月 20 日於杭州舉行的 Alibaba Cloud Summit 2026 之前進行；屆時該公司將揭示新基礎模型的技術細節。

展開

08:21

三名核心 Grok 模型架構師在一週內離開 xAI，當馬斯克承諾每兩週發布新版本

AI 行業動態

根據 Beating 的監測，三位直接負責 Grok 模型開發的技術主管在過去一週內已從 xAI 離職。負責搜尋與事實性後訓練的 Tianyi Zhang 今日證實離職；預訓練團隊主管 Juntang Zhuang 早在本月初便已離開；而負責打造 Grok 語音代理能力的 David Haxton 則於 5 月 10 日離職。這些人員流失鎖定了核心產品線——負責 Grok 下一代迭代能力的搜尋後訓練、預訓練與語音。Zhang 團隊將 Grok 的事實錯誤率降低了 70-80%，使得 Grok 4.2 能在 Search Arena 領導榜登上第一。時機更是加劇壓力：Musk 在 4 月宣稱，Grok 4.4（1T 參數）將於 5 月初推出，之後每兩週發布一次，但目前仍未宣布。Grok 4.3 目前已公開，僅是 0.5T 的訓練中間版本。

展開

CORE-3.06%

GROK0.7%

XAI-1.89%

TEAM2.9%

08:21

百度以相當於可比訓練成本的 6% 發布 Ernie 5.1 模型

AI 行業動態

根據《朝鮮日報》（Chosun Daily），百度今天發布其 Ernie 5.1 模型（5 月 11 日），以約為相似模型預訓練成本 6% 的代價，提供可比的效能。在 Arena 基準測試中，Ernie 5.1 在中國模型中排名第一、整體排名第四，位於 OpenAI 的 GPT-5.5 以及 Anthropic 的 Claude Opus 4.6 和 4.7 之後。

15:11

Claw Intelligence 與 Block Sec Arena 合作以強化 BNB Chain 安全性

BNB 新聞

合作與生態

AI 行業動態

根據 Block Sec Arena 在 4 月 30 日的官方公告，Claw Intelligence（一個由 AI 驅動、建立在 BNB Chain 上的 Web3 平台）宣布與 Block Sec Arena 建立策略夥伴關係，以將先進的資安基礎設施整合進其生態系統。此次合作旨在強化 p

展開

BNB0.47%

07:52

阿里巴巴「快樂馬-1.0」以 1,299 Elo 分數登頂 Arena 影片剪輯基準測試

AI 行業動態

阿里巴巴的 Happy Horse-1.0 模型在 Arena Video Edit 全球基準測試中取得最高排名，Elo 分數為 1,299，並以顯著差距超越 xAI 的 Grok Imagine Video 與 Kling o3 Pro。

展開

04:41

GLM-5 在 AI 預測市場交易大賽中收益率達 42.99%，成唯一超越人類基準模型

預測市場

智譜 Z.ai 的全球負責人李子玄透露，GLM-5 在 Prediction Arena 預測市場中以 42.99% 的收益率領先於人類基準，成為唯一超越人類的 AI 模型。該模型執行了 98 筆交易，表現卓越。

展開

12:33

Pantera與Franklin Templeton加入Sentient Arena，共同測試企業級AI代理性能

專案進展

合作與生態

Sentient推出了Arena，一個用於評估AI代理在複雜企業工作流程中的表現的測試環境。該平台通過模擬真實條件測試AI，幫助開發者識別問題，並將發布排行榜和測試報告以總結失敗模式及修復方案。

展開

10:16

DGrid AI Arena 正式上線：模型盲測對決，投票定義AI質量並賺取收益

DGrid AI 宣布推出 DGrid AI Arena，這是一款社區驅動的匿名 AI 模型對戰平台。用戶通過公平的“盲測”方式投票選擇答案質量，積累積分並兌換獎勵，推動更智能、透明的去中心化 AI 網絡。

展開

03:01

RootData：ARENA 將於一週後解鎖價值約 108 萬美元的代幣

ChainCatcher 消息，据Web3资产数据平台 RootData 代币解锁数据，The Arena（ARENA）將於北京時間 01 月 30 日 0 時解鎖約 66025 萬枚代幣，價值約 108 萬美元。

展開