Microsoft réduit les licences Claude alors que l'IA entre dans sa première phase déflationniste.

Microsoft a annulé la plupart de ses licences Claude Code le mois dernier pour réduire les coûts liés à l'IA, selon The Verge. Cette décision reflète un changement plus large dans le secteur, alors que les entreprises commencent à gérer les dépenses liées à l'IA comme des budgets informatiques traditionnels, plutôt que d'encourager une adoption sans restriction. Le PDG Satya Nadella a remis en question cette semaine la viabilité d'un avenir dominé par une poignée de fournisseurs de modèles de pointe, plaidant plutôt pour un écosystème d'IA plus concurrentiel. Ce changement survient alors que les modèles open source réduisent l'écart de performance avec les systèmes propriétaires, tandis que les coûts d'inférence diminuent, créant ce que les observateurs du secteur décrivent comme la première phase déflationniste de l'IA depuis le lancement par ChatGPT du boom de l'IA générative fin 2022.

Microsoft annule les licences Claude Code pour réduire les coûts de l'IA

Microsoft a commencé à annuler la plupart de ses licences Claude Code le mois dernier pour réduire les coûts, a rapporté The Verge. La décision reflète un changement dans la manière dont les entreprises abordent les dépenses liées à l'IA. Au lieu d'encourager une adoption sans restriction de l'IA, les entreprises gèrent désormais les dépenses liées à l'IA comme toute autre dépense opérationnelle, en suivant la consommation de tokens, en imposant des limites d'utilisation et en acheminant les charges de travail vers des modèles moins coûteux chaque fois que possible.

Le PDG Satya Nadella a déclaré cette semaine qu'un avenir dominé par une poignée de fournisseurs de modèles de pointe n'est peut-être pas inévitable. Il a plaidé pour un écosystème d'IA plus concurrentiel où les clients peuvent choisir parmi plusieurs modèles plutôt que de compter sur quelques fournisseurs premium.

L'économie des tokens crée des dépenses opérationnelles mesurables

Alors que de plus en plus de fournisseurs d'IA facturent les clients en fonction de l'utilisation des tokens plutôt que par abonnements forfaitaires, chaque prompt, complétion et appel API est devenu une dépense opérationnelle mesurable. Ce changement affecte l'économie naissante des tokens du secteur. Les entreprises commencent à suivre et à gérer les dépenses liées à l'IA avec la même rigueur appliquée aux autres budgets informatiques.

Ce changement présente des défis pour les entreprises d'IA de pointe comme OpenAI et Anthropic. Leur avantage concurrentiel n'est plus défini uniquement par la construction du modèle le plus performant. Elles doivent également préserver leur pouvoir de fixation des prix dans un marché où les modèles ouverts très performants prolifèrent et où les entreprises deviennent plus soucieuses des coûts.

OpenAI et Anthropic ont toutes deux déposé confidentiellement leurs introductions en bourse auprès de la Securities and Exchange Commission (SEC) des États-Unis. Cela pourrait attirer l'attention des investisseurs non seulement sur leur avance technologique, mais aussi sur leur capacité à maintenir des prix premium dans un marché de plus en plus concurrentiel.

Z.ai publie le modèle GLM-5.2 à un sixième du coût des alternatives propriétaires

Z.ai a publié son modèle GLM-5.2 ce mois-ci. Les développeurs de la Silicon Valley ont salué le modèle pour ses capacités de codage et d'agents. Le modèle figure parmi les meilleurs sur les benchmarks publics d'IA et offre des performances de codage comparables aux principaux modèles propriétaires d'OpenAI et d'Anthropic pour environ un sixième du coût, selon un rapport de Reuters citant l'entreprise et des trackers de benchmarks.

De nombreux modèles open-weight les plus compétitifs émergent de Chine, réduisant rapidement l'écart avec les offres propriétaires tout en les sous-cotant sur les prix. Des entreprises chinoises, dont Z.ai, DeepSeek et Alibaba, adoptent de plus en plus des versions open-weight qui permettent aux entreprises d'héberger et de personnaliser elles-mêmes les modèles plutôt que de compter exclusivement sur des API premium.

Les contrôles à l'exportation américains liés au développement de l'IA ouverte en Chine

Des chercheurs de l'Université de Chicago et de l'Université Chapman soutiennent que les contrôles à l'exportation américains sur les puces d'IA avancées ont involontairement encouragé la Chine à investir dans des écosystèmes d'IA ouverts et dans l'innovation efficace en calcul. Les chercheurs ont constaté qu'après les principales mesures de contrôle à l'exportation américaines, les développeurs chinois ont augmenté leur engagement avec les dépôts de LLM open source bien plus que leurs homologues américains.

La recherche chinoise s'est orientée vers l'optimisation de l'inférence, la compression des modèles et le fine-tuning efficace des paramètres après les restrictions. Les conclusions des chercheurs suggèrent que les contrôles à l'exportation ont peut-être accéléré plutôt qu'entravé le développement par la Chine de modèles d'IA ouverts économes en coûts.

Les ETF IA enregistrent des gains de 44 à 47 % sur les 12 derniers mois

Le Global X Artificial Intelligence & Technology ETF (AIQ) a augmenté de 47 % au cours des 12 derniers mois. L'iShares U.S. Technology ETF (IYW) a augmenté de 44 % sur la même période.

FAQ

Pourquoi Microsoft a-t-il annulé les licences Claude Code ? Microsoft a annulé la plupart de ses licences Claude Code le mois dernier pour réduire les coûts liés à l'IA, comme l'a rapporté The Verge. Cette décision reflète une tendance plus large du secteur où les entreprises gèrent les dépenses liées à l'IA comme des budgets informatiques traditionnels plutôt que d'encourager une adoption sans restriction.

Quelle est la différence de coût entre le GLM-5.2 de Z.ai et les modèles propriétaires ? Le modèle GLM-5.2 de Z.ai offre des performances de codage comparables aux principaux modèles propriétaires d'OpenAI et d'Anthropic pour environ un sixième du coût, selon un rapport de Reuters citant l'entreprise et des trackers de benchmarks. Le modèle a été publié ce mois-ci et figure parmi les meilleurs sur les benchmarks publics d'IA.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire