"MIMO"的搜尋結果
2026-05-27
19:38

DeepSeek 將 V4-Pro 折扣鎖定為每百萬 Tokens 0.87 美元;Xiaomi 於 5 月 26 日將 MiMo-V2.5 下調最高 99%

根據官方公告,DeepSeek 於 5 月 22 日將其 75% V4-Pro API 折扣永久化,並將輸出定價鎖定在每百萬 tokens $0.87。小米則於 5 月 26 日透過最高 99% 的降幅削減 MiMo-V2.5 快取輸入成本,將 Pro 模型的快取命中價格降至每百萬 tokens $0.0036——每 token 的成本比大多數 SMS 字元費率更便宜。 與此同時,美國實驗室採取了相反方向的調整。OpenAI 在啟動時將 GPT-5.5 的輸出價格加倍至每百萬 tokens $30;而 Anthropic 的 Claude Opus 4.7 隨新 tokenizer 上線,即使費率表未變,也可能使實際成本膨脹最高 35%。DeepSeek V4-Pro 與 GPT-5.5 Pro 的定價差距(兩者在 SWE-Verified 程式碼基準上都約 80% 分數)在輸出 tokens 上達 34 倍。中國的前沿模型目前在相近表現下,成本比美國對應模型低 15–30 倍。
展開
14:31

小米透過分層快取將 MiMo API 成本降低 80%,等同於 10 層 GQA 模型

根據 Beating,Xiaomi 在配合 DeepSeek 的近期降價之後,揭露了其 MiMo-V2.5 API 的核心最佳化技術。該公司的高負載推理引擎透過混合式注意力架構以及分層 KV 快取最佳化來維持獲利能力。 Xiaomi 的推理框架透過對滑動視窗注意力(SWA)導入分層最佳化,使快取成本降低 80%,並將 token 容量提升 5 倍。採用全域注意力(GA)層與 SWA 層之間 1:7 稀疏比例的 70 層 MiMo-V2.5-Pro 模型,其 prefill 計算效能相當於傳統 10 層全域 GQA 模型,能顯著降低推理成本。
展開
DEEPSEEK-5.37%
01:06

小米 MiMo API 降價最高 99%,推出統一的上下文計費

根據 Beating,Xiaomi 的 MiMo 大型語言模型 API 近期進行了顯著的定價調整,包括永久降價幅度最高達 99%,以及所有上下文長度的統一計費。旗艦 MiMo-V2.5-Pro 模型的快取輸入價格降至每 100 萬 tokens 0.0036 美元(下降 99%),非快取輸入降至每 100 萬 tokens 0.435 美元(下降 78%),輸出降至每 100 萬 tokens 0.87 美元(下降 86%)。標準 MiMo-V2.5 模型的快取輸入價格降至每 100 萬 tokens 0.0028 美元(下降 98%),非快取輸入降至每 100 萬 tokens 0.14 美元(下降 83%),輸出降至每 100 萬 tokens 0.28 美元(下降 93%)。 訂閱方案已透過統一的按點計價升級,維持每月價格 6、16、50 和 100 美元,同時將可用點數分別提高至 41 億、110 億、380 億與 820 億。使用者現在在相同訂閱成本下,可獲得 5 到 8 倍更多的 token 額度。另方面,Xiaomi 的 MiMo 開發者支援計畫於 4 月 28 日推出,
展開
14:01

OpenClaw 發布 v2026.4.25:重大 TTS 升級與六家新的語音服務供應商

Gate News 消息,4 月 27 日 — 根據其官方 GitHub 變更日誌,OpenClaw 已發布 v2026.4.25。此次更新在語音、外掛、可觀測性與瀏覽器自動化模組方面帶來全面升級。TTS 系統現在支援六家新的語音服務供應商:Azure Speech、Xiaomi MiMo、ElevenLabs v3、Inworld、Volcengine,以及本地 CLI。新增功能包括在對話層級的自動 TTS 控制、TTS 身分(persona)綁定,以及覆蓋跨代理/帳戶層級的設定。 透過將啟動與安裝路徑遷移到冷持久化儲存,外掛註冊表已進行最佳化,減少完整清單掃描,並提升外掛更新、修復與發現的可靠性。OpenTelemetry 遙測(instrumentation)現已覆蓋整個流程,包括模型呼叫、token 使用、工具迴圈、Harness 執行、流程執行、訊息投遞、內容組裝,以及記憶體壓力(memory pressure)指標。 瀏覽器自動化增強包括支援 iframe 的角色快照、針對 Chrome DevTools Protocol CDP 就緒的最佳化、無頭模式的一鍵啟動,以及更深入的瀏覽器診斷探測。透過修復 Windows、macOS、Linux 與 Docker 平台上的問題,已提升安裝穩定性。
展開
04:57

小米揭露 MiMo-V2-Pro 訓練細節:1T 模型參數,部署數千台 GPU

Gate 新聞訊息,4 月 24 日——小米大型語言模型團隊負責人 羅福立 在一場深入採訪中披露,MiMo-V2-Pro 模型總計擁有 1 兆(trillion)參數,訓練過程需要數千台 GPU。她指出,1T 規模代表達成性能接近 Claude Opus 4.6 等級所需的最低門檻,並取得下一階段 AI 代理的競爭性入場票。
展開
11:21

Xiaomi MiMo-V2-Pro Model Revealed: Anonymous Model Dominating AI Platform Model Hunter Alpha

An independent AI model evaluation platform has listed Xiaomi's closed-source model MiMo-V2-Pro, which supports a million-token context window and is offered free of charge, ranking first. This model is related to the anonymously launched Hunter Alpha, with the highest weekly consumption. Additionally, MiMo-V2-Omni has appeared, supporting multiple input types. Xiaomi has not yet released official information about this.
展開
04:17

小米移動端Agent “Xiaomi miclaw” 開啟小範圍封測

小米官宣推出基於MiMo大模型的AI交互測試產品Xiaomi miclaw,開啟小範圍封閉測試。該產品可讓手機理解用戶意圖並執行命令,同時具備自我學習能力。封測採用邀請制,建議用戶在可控環境下體驗。
展開