Coinbase réduit ses coûts de 50% grâce à l'IA open source chinoise, l'utilisation de tokens connaît une croissance exponentielle sur la même période.

Le PDG de Coinbase, Brian Armstrong, a déclaré le 26 juin que Coinbase avait défini les modèles GLM 5.2 de Zhipu AI et Kimi 2.7 de Beijing Moonshot AI comme modèles de langage par défaut pour ses ingénieurs en interne. Les dépenses AI de Coinbase ont été réduites de près de moitié, tandis que l'utilisation de tokens continue de croître de façon exponentielle.

Répartition des tâches et cas d'utilisation de GLM 5.2 et Kimi 2.7 chez Coinbase

Armstrong a expliqué que GLM 5.2 et Kimi 2.7 sont principalement déployés pour les tâches courantes, comme l'assistance standard au codage dans les workflows d'ingénierie générale. Pour les tâches nécessitant une planification complexe, les ingénieurs peuvent toujours choisir des modèles de pointe. Lors des revues de code, Coinbase adopte une stratégie multi-modèles parallèle, où différents modèles se vérifient mutuellement les résultats pour maintenir les normes de qualité.

Stratégie de restructuration de l'infrastructure AI en trois couches annoncée par Armstrong

Armstrong attribue la réduction de près de moitié des dépenses AI de Coinbase à la restructuration suivante en trois couches :

Routage intelligent : Le système prétraite les prompts, combine le taux de hit du cache et la tarification des modèles, et distribue automatiquement les tâches au modèle le plus adapté et le plus économique.

Cache agressif : Toutes les requêtes doivent être conscientes du cache. Le taux de hit du cache de LibreChat est passé de 5 % à 60 %.

Contexte simplifié : Les ingénieurs sont invités à ouvrir une nouvelle session lors du changement de tâche et à réduire la portée des fichiers pour diminuer les tokens gaspillés.

Objectif d'expansion AI durable d'Armstrong et positionnement de cette stratégie

Armstrong a souligné que l'objectif de cette optimisation des coûts n'est pas de freiner l'utilisation, mais d'élargir l'adoption de l'IA. Il a déclaré que le but est de permettre aux ingénieurs d'utiliser librement n'importe quel nombre de tokens et de modèles, sans plafond de coûts, tout en liant l'utilisation à l'impact commercial. Armstrong estime que ce modèle peut être adopté par toute entreprise, ces déclarations étant publiques et personnelles.

Questions fréquentes

Quels sont les produits respectifs de GLM 5.2 et Kimi 2.7 ?

GLM 5.2 est le dernier modèle publié par l'entreprise chinoise d'IA Zhipu AI ; Kimi 2.7 est un modèle de langage de Beijing Moonshot AI. Les deux modèles sont publiés en open source. Armstrong a expliqué que Coinbase les déploie pour les tâches d'ingénierie courantes, tandis que les tâches complexes utilisent toujours des modèles de pointe.

Quelle est la principale raison de la réduction de près de moitié des dépenses AI de Coinbase ?

Selon Armstrong, le cœur de la réduction des coûts est la restructuration en trois couches : routage intelligent (distribution automatique des tâches au modèle le plus économique), cache agressif (taux de hit du cache de LibreChat passant de 5 % à 60 %), et contexte simplifié (réduction des tokens gaspillés). Sur cette base, l'utilisation de modèles open source chinois moins chers pour remplacer une partie des tâches courantes des modèles américains de pointe permet de réduire davantage les dépenses globales.

Armstrong a-t-il mentionné dans sa déclaration publique des arrangements de vérification de sécurité des données concernant l'utilisation de modèles open source chinois ?

Selon la déclaration publique d'Armstrong du 26 juin 2026, il n'a pas mentionné les détails de la vérification de sécurité des données ou les arrangements de conformité liés à l'adoption de GLM 5.2 et Kimi 2.7. Coinbase étant une plateforme d'échange de crypto-actifs régulée aux États-Unis, le contenu spécifique du cadre de conformité n'a pas été divulgué dans cette déclaration.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire