DeepSeek та Пекінський університет випускають статтю DSpark 27 червня, засновник Liang Wenfeng вказаний як автор

За даними Guru Club, 27 червня команда DeepSeek та Пекінський університет опублікували наукову роботу під назвою «DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation». У роботі представлено модуль спекулятивного декодування для оптимізації продуктивності інференсу на існуючих моделях DeepSeek-V4-Pro та DeepSeek-V4-Flash. Водночас команда відкрила вихідний код DeepSpec — повностекової кодової бази для навчання та оцінки моделей спекулятивного декодування-чернетки під ліцензією MIT. Наразі DeepSpec підтримує три реалізації: DSpark, DFlash та Eagle3. Зазначається, що засновник DeepSeek Лян Веньфен вказаний як співавтор роботи.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
ManeyToFuturevip
· 1год тому
Погнали 🔥
Переглянути оригіналвідповісти на0