DeepSeekと北京大学が6月27日にDSpark論文を発表、創設者の梁文鋒が著者として記載された。

Guru Club によると、6月27日、DeepSeekのチームと北京大学は「DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation」と題する研究論文を発表した。この論文では、既存モデルDeepSeek-V4-ProおよびDeepSeek-V4-Flashの推論パフォーマンスを最適化するための投機的デコードモジュールを導入している。同時に、同チームはMITライセンスのもと、投機的デコードのドラフトモデルを訓練・評価するためのフルスタックコードベースDeepSpecをオープンソース化した。DeepSpecは現在、DSpark、DFlash、Eagle3の3つの実装をサポートしている。特筆すべきは、DeepSeek創業者の梁文鋒が論文著者として名を連ねている点である。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
ManeyToFuturevip
· 1時間前
レッツゴー 🔥
原文表示返信0