DeepSeek lança em open-source o TileKernels, biblioteca de kernels de GPU para o treino e a inferência de grandes modelos

Notícia de Gate, 23 de Abril — A DeepSeek lançou em open-source o TileKernels sob a licença MIT, uma biblioteca de kernels de GPU escrita em TileLang para o treino e a inferência de grandes modelos de linguagem. O TileLang é uma linguagem específica de domínio desenvolvida pela equipa tile-ai para expressar kernels de GPU de alto desempenho em Python. A DeepSeek afirmou que a maioria dos kernels da biblioteca se aproximou dos limites de desempenho do hardware em densidade de computação e largura de banda de memória, com partes já implementadas em operações internas de treino e inferência.

A biblioteca inclui seis categorias de kernels: MoE (mixture of experts) gating e routing, incluindo seleção de especialistas Top-k, mapeamento token-para-especialista, e expandir/reduzir fundidos com normalização de pesos; quantização que suporta formatos FP8, FP4 e E5M6 com quantização por token, por bloco e por canal, incluindo operações fundidas SwiGLU+quantização; transposição em lote; Engram gating com propagação forward/backward de RMSNorm fundida e redução do gradiente de pesos; Manifold HyperConnection com normalização Sinkhorn e split/apply mistos; e interfaces de alto nível de autograd que envolvem kernels de baixo nível em camadas treináveis.

Engram e Manifold HyperConnection são componentes proprietários da arquitectura do modelo da DeepSeek, com detalhes de implementação divulgados publicamente pela primeira vez. A biblioteca requer GPUs de arquitectura NVIDIA SM90 ou SM100 (H100/H200 ou série Blackwell), CUDA Toolkit 13.1 ou superior, e PyTorch 2.10 ou superior.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O Drift Protocol esclarece o mecanismo de reembolso antecipado: acções com desconto na proporção actual do pool

De acordo com o anúncio oficial do Drift Protocol hoje, os utilizadores podem resgatar ativos a qualquer momento após a abertura do resgate, mas aqueles que optarem pelo resgate antecipado receberão ações com desconto com base na proporção atual do fundo. À medida que o fundo continua a crescer, os detentores que adiem o resgate podem receber

GateNews8m atrás

O Tesouro da Ripple Ultrapassa os 13 biliões de dólares, à medida que o CEO traça uma Estratégia de Fases para a Integração On-Chain

O CEO da Ripple, Brad Garlinghouse, delineou uma abordagem faseada para a integração da blockchain na Consensus Miami 2026, afirmando que a empresa irá “engatinhar, depois andar, depois correr” para levar os fluxos financeiros institucionais para infraestruturas on-chain. De acordo com as declarações de Garlinghouse, a Ripple Treasury já process…

CryptoFrontier2h atrás

Kelp DAO abandona o LayerZero em favor do Chainlink CCIP na sequência do exploit de $292M

Segundo o The Block, a Kelp DAO está a abandonar a LayerZero como fornecedor de infraestrutura de cross-chain, em favor da Chainlink, tornando-se o primeiro grande protocolo a afastar-se da LayerZero após os 292 milhões de dólares

GateNews2h atrás

A Gomining lança o GoBTC na Consensus Miami, visando a tão aguardada camada de pagamentos do Bitcoin

A Gomining, uma das 10 principais mineradoras de bitcoin do mundo, com cinco milhões de utilizadores, revelou a GoBTC na Consensus Miami 2026. Trata-se de um protocolo de pagamentos aberto que oferece autorização instantânea e liquidação de bitcoin onchain no prazo de 12 horas, com uma comissão de comerciante de 0,2%. Principais conclusões: A Gomining lançou a GoBTC na Conse

Coinpedia3h atrás

O Prophet lança um mercado de previsões com IA, com uma tranche de negociação em direto de $10.000 hoje

De acordo com a MetaversePost, a Prophet lançou hoje (6 de maio) um mercado de previsão baseado em IA, com 10 000 dólares em USDC alocados para negociação em direto. Os utilizadores podem negociar diretamente contra uma contraparte de IA que gera preços baseados em probabilidades para cada mercado, com alguns contratos a liquidar dentro de 24

GateNews3h atrás

WorldClaw lança o WorldRouter com WLFI, oferecendo mais de 300 modelos de IA a um custo 30% inferior

Segundo o WorldClaw, a empresa lançou o WorldRouter em parceria com World Liberty Fi, permitindo aos utilizadores aceder a mais de 300 modelos de IA através de uma única conta a custos aproximadamente 30% mais baixos do que os preços do fornecedor direto. O WorldRouter serve como o primeiro ponto de entrada para o AgentOS da WorldClaw,

GateNews3h atrás
Comentar
0/400
Nenhum comentário