A DeepSeek angaria financiamento numa avaliação de $45B num contexto de concorrência em IA

O laboratório chinês de IA DeepSeek está em conversações para angariar a sua primeira ronda de financiamento, a uma avaliação divulgada de 45 mil milhões de dólares, segundo a TechCrunch. A avaliação representa um aumento significativo face a uma avaliação estimada de 20 mil milhões de dólares apenas semanas antes, na sequência da atenção que os modelos de IA da empresa atraíram pelos seus custos de treino mais baixos. O fundador Liang Wenfeng controla quase 90% da empresa.

Motivação do financiamento e interesse dos investidores

A DeepSeek decidiu procurar financiamento depois de concorrentes terem tentado recrutar investigadores oferecendo ações da empresa como incentivo. O China Integrated Circuit Industry Investment Fund poderá liderar a ronda, enquanto a Tencent e a Alibaba também estarão, segundo informações, em conversações para participar.

Desempenho dos modelos e preços

O modelo V4 da DeepSeek é referido como tendo desempenho equivalente ao dos principais modelos da OpenAI e da Anthropic em testes de benchmark, de acordo com a empresa. A vantagem competitiva estende-se à precificação: o V4-Pro custa 1,74 dólares por milhão de tokens de entrada, enquanto o V4-Flash custa aproximadamente 0,14 dólares por milhão de tokens de entrada — significativamente abaixo do preço de modelos US comparáveis.

A estrutura de custos mais baixa resulta da arquitetura eficiente em computação da DeepSeek, incluindo um design de mistura de especialistas (MoE) que ativa apenas parte do modelo para cada tarefa, reduzindo as necessidades de computação durante a inferência. Segundo a DeepSeek, o V4-Pro utiliza 27% do poder de computação e 10% da memória exigidos pelo V3.2.

Estratégia chinesa de auto-suficiência em IA

A ronda de financiamento da DeepSeek ocorre enquanto a China procura construir uma infraestrutura de IA mais auto-suficiente, em resposta aos controlos de exportação dos EUA sobre chips avançados. O V4 é o primeiro modelo da DeepSeek afinado para chips chineses, como a série Ascend da Huawei, embora o relatório técnico da empresa indique que os chips chineses fazem a inferência, enquanto o treino poderá ainda depender principalmente do hardware da Nvidia.

A DeepSeek também disponibiliza modelos com pesos abertos — parâmetros treinados que outros podem usar, afinar e implementar — alargando o desenvolvimento de IA para além da dominância dos EUA. Esta estratégia dá ênfase à eficiência algorítmica em vez do acesso exclusivo ao hardware mais avançado dos EUA, embora o impulso da IA da China continue a depender parcialmente do hardware da Nvidia.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
LittleSunOfStainedGlassvip
· 05-09 11:36
De 2 bilhões para 4,5 bilhões, só com alguns demos de modelos? A capacidade do capital de contar histórias é sempre mais rápida do que a evolução tecnológica
Ver originalResponder0
GateUser-0aa20a11vip
· 05-07 01:27
Avaliação de 45 bilhões, até a OpenAI ficou em silêncio, o grande modelo nacional está no ritmo de ultrapassar na curva
Ver originalResponder0
GateUser-e5e2e632vip
· 05-07 01:26
DeepSeek esta avaliação subiu mais rápido do que o mercado de criptomoedas, duplicando em algumas semanas, a bolha de IA foi confirmada
Ver originalResponder0