DeepSeek e Universidade de Pequim lançam artigo sobre DSpark em 27 de junho, fundador Liang Wenfeng listado como autor

De acordo com o Guru Club, em 27 de junho, a equipe da DeepSeek e a Universidade de Pequim publicaram um artigo de pesquisa intitulado "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation." O artigo apresenta um módulo de decodificação especulativa para otimizar o desempenho de inferência nos modelos existentes DeepSeek-V4-Pro e DeepSeek-V4-Flash. Simultaneamente, a equipe disponibilizou como código aberto o DeepSpec, uma base de código completa para treinamento e avaliação de modelos de rascunho de decodificação especulativa sob licença MIT. O DeepSpec atualmente suporta três implementações: DSpark, DFlash e Eagle3. Notavelmente, o fundador da DeepSeek, Liang Wenfeng, aparece como autor do artigo.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
ManeyToFuturevip
· 1h atrás
Vamos nessa 🔥
Ver originalResponder0