"DEEPSEEK"的搜尋結果
今天
02:34

本週全球 AI 模型呼叫量達 289 兆代幣,成長 7.4%;DeepSeek-V4-Flash 飆升 66% 登上前列

根據 Bloomberg 援引的 OpenRouter 數據,全球 AI 模型每週 API 呼叫量在 5 月 18–24 日當週達到 289 兆 tokens,較前一週成長 7.4%,並創下連續五週成長。 中國的 AI 模型占 9.223 兆 tokens,成長 19.89%,超越美國模型的 4.93 兆 tokens(成長 16.27%),這也是連續第四週。DeepSeek-V4-Flash 在全球排名第一,達到 3.43 兆的 token 呼叫量,週環比暴增 66%。
展開
DEEPSEEK-0.83%
11:49

DeepSeek 將 V4-Pro API 價格砍至原成本的 25%

根據 Guru Club 的說法,DeepSeek 於 5 月 24 日宣布,已將其 V4-Pro 模型的 API 價格永久下調至原價的 25%。此舉預期將加劇與國際 AI 競爭對手(包括 OpenAI、Anthropic 和 Google)之間的價格競爭。 DeepSeek 也正在推進一輪 70 億人民幣(9.8 億美元)的融資,可能創下中國 AI 公司單次最大募資紀錄。已被報導的投資者包括 CATL 以及中國的「國家人工智慧產業投資基金」。
展開
DEEPSEEK-0.83%
05:14
1

DeepSeek 即將在 5 月 22 日以 $7B 的估值完成 $45B 融資輪

根據消息人士稱,5 月 22 日,AI 新創公司 DeepSeek 正處於一輪約值 700 億人民幣(約 70 億美元)融資的最後階段,融資前估值約為 450 億美元。創辦人 梁文峰 承諾將持續開發開源 AI 模型,同時追求更廣泛的人工智慧目標。騰訊控股、IDG Capital 與 Monolith Capital 近乎確定將參與這輪融資。
21:31

DeepSeek 招募北京團隊打造 Claude Code 競品,V4 每百萬 tokens 售價 0.14 美元

根據 Deli Chen(一名 DeepSeek 工程師)表示,5 月 20 日,該公司宣布正在北京招募一支團隊,以打造 Code Harness,一款原生代理式編碼工具,旨在直接與 Anthropic 的 Claude Code 以及 OpenAI 的 Codex 競爭。該團隊正在招募一名產品經理與一名研發工程師。DeepSeek 的 V4 Flash 模型於 4 月 24 日推出,以每百萬輸入 token 0.14 美元運行——比 Claude Opus 4.7 的每百萬 token 15 美元便宜超過 100 倍,讓任何原生 Code Harness 工具在讓開發者以持續、循環密集的代理管線運行時,具備顯著的成本優勢。
DEEPSEEK-0.83%
07:09

前 Jane Street 量化交易員加入 DeepSeek,負責代理(Agent)產品開發,鎖定 Claude Code

根據 Beating,量化投資公司 TSY Capital 的聯合創辦人、曾任 9 年 Jane Street 分析師的 Cui Tianyi 於 2026 年 3 月加入 DeepSeek,擔任其新成立 Harness 團隊的主管。他正在領導一款桌面端 Agent 產品的開發,目標是與 Anthropic 的 Claude Code 展開競爭。DeepSeek 的核心產品架構被定義為「Model + Harness = Agent」,其中 Harness 負責上下文管理、工具呼叫、檔案操作、終端機執行,以及來自基本模型之外的測試回饋。
DEEPSEEK-0.83%
04:11

國家支持的中國投資者在最新融資行動中為 DeepSeek、Moonshot AI 追加持股

根據《中國日報》,國家支持的投資者在近期的融資輪次中已入股多家主要的中國 AI 新創公司,其中包括北京的 Moonshot AI,以及 DeepSeek。Moonshot AI 是 Kimi 聊天機器人的製造方,新增的投資者包含北京 AI 產業投資基金、上海國盛集團,以及中國移動;而美團的創投部門牽頭了最新一輪的融資。另方面,DeepSeek 正在尋求超過 500 億人民幣(73.5 億美元)的資金,估值超過 3,500 億人民幣(514 億美元),目前中國的國家支持半導體基金正與其洽談,擬領投。
06:09

DeepSeek 確認新「Harness」團隊以挑戰 Claude Code,並在北京開設 2 個職位

根據 DeepSeek 高階研究員陳德力的說法,該公司已在內部確認成立一個新的 Harness 團隊,並且直接與 Anthropic 的 Claude Code 展開競爭。DeepSeek 已在北京市海淀區開出 Harness 產品經理與研究工程師兩個關鍵職缺,且新進人員將參與「DeepSeek 桌面 Agent 產品」的開發。 該公司將其核心路徑定義為「Model + Harness = Agent」,其中包含情境管理、工具呼叫、檔案 I/O、終端機執行,以及測試回饋,皆被置於 Harness 領域,並與模型開發之外的其他工程功能並列。
展開
DEEPSEEK-0.83%
11:07

DeepSeek 將異常回應歸因於特殊字元,視為模型幻覺,並排除安全性風險

根據 PANews,5 月 19 日 DeepSeek 發布了一句話技術聲明,澄清因特殊字元輸入而觸發異常回應的原因是模型幻覺,而非安全或隱私問題。該公司的技術團隊進行了全面調查,並判定那些在輸入特定字元後回報出現非預期內容的使用者所遇到的是模型幻覺,而不是資料外洩。DeepSeek 表示,將透過針對性的訓練提升模型辨識並處理特殊字元的能力,以解決已識別的問題並改善這類情境下的效能。
DEEPSEEK-0.83%
08:09

DeepSeek 資料外洩警報遭駁斥;特殊代幣觸發模型記憶,而非多租戶遭入侵

根據 Beating 的監測,近期一則病毒式流傳的說法聲稱,在 DeepSeek 的聊天框中輸入例如 這類特殊代幣,可能會暴露其他使用者的對話,並被標為 P0 等級的多租戶隔離失敗。實際上,這種現象與資料隔離無關。當使用這類代幣觸發時,模型會進入其在訓練期間形成的格式模式,並根據自身記憶與系統提示生成捏造的對話內容,而非從其他工作階段即時擷取。這是訓練資料擷取(Training Data Extraction)——所有大型語言模型都共用的一項弱點,而非僅存在於 DeepSeek。Google DeepMind 在 2023 年發表的研究表明,特殊輸入可以從 GPT 與 PaLM 擷取訓練資料。ICLR 2025 的 Magpie 論文則直接利用了這種機制。聲稱洩露內容包含今天的日期,並不能證明發生多租戶隔離失敗,因為 DeepSeek 會在其系統提示中包含目前日期,而模型也會自然地將其整合進生成的輸出中。
展開
DEEPSEEK-0.83%