Anthropic identifie trois changements au niveau de la couche produit à l’origine de la baisse de qualité de Claude Code, et non un problème de modèle

Message de Gate News, 23 avril — L’équipe d’ingénierie d’Anthropic a confirmé que la dégradation de la qualité de Claude Code signalée par les utilisateurs au cours du mois écoulé provenait de trois changements indépendants au niveau de la couche produit, et non de problèmes liés à l’API ou au modèle sous-jacent. Les trois problèmes ont été corrigés respectivement les 7 avril, 10 avril et 20 avril, avec désormais une version finale en v2.1.116.

Le premier changement est intervenu le 4 mars, lorsque l’équipe a abaissé le niveau d’effort de raisonnement par défaut pour Claude Code de “high” à “medium” afin de traiter des pics de latence extrêmes occasionnels dans Opus 4.6 lorsque l’intensité de raisonnement est élevée. Après de nombreuses plaintes d’utilisateurs concernant une baisse des performances, l’équipe a annulé le changement le 7 avril. Le paramètre par défaut actuel est désormais “xhigh” pour Opus 4.7 et “high” pour les autres modèles.

Le second problème était un bug introduit le 26 mars. Le système était conçu pour effacer d’anciens enregistrements de raisonnement après que l’inactivité de la conversation dépassait une heure afin de réduire les coûts de récupération de session. Toutefois, une erreur dans l’implémentation a fait que l’effacement s’exécutait à répétition à chaque tour ultérieur, au lieu de s’exécuter une seule fois, ce qui a entraîné une perte progressive du contexte de raisonnement antérieur. Cela s’est manifesté par une augmentation de l’oubli, des opérations répétées et des invocations d’outils anormales. Le bug a également entraîné des ratés de cache à chaque requête, accélérant la consommation des quotas des utilisateurs. Deux expériences internes sans lien ont masqué les conditions de reproduction, prolongeant le processus de débogage à plus d’une semaine. Après la correction intervenue le 10 avril, l’équipe a examiné le code problématique à l’aide d’Opus 4.7 et a constaté qu’Opus 4.7 pouvait identifier le bug, contrairement à Opus 4.6.

Le troisième changement a été lancé le 16 avril en même temps que Opus 4.7. L’équipe a ajouté des instructions au prompt système pour réduire la sortie redondante. Les tests internes menés sur plusieurs semaines n’ont montré aucune régression, mais après le lancement, les interactions avec d’autres prompts ont dégradé la qualité du codage. Une évaluation prolongée a révélé une baisse de 3 % des performances pour Opus 4.6 et 4.7, entraînant un rollback le 20 avril.

Ces trois changements ont touché différents groupes d’utilisateurs à des moments différents, et leur effet combiné a entraîné une baisse de qualité généralisée et incohérente, compliquant le diagnostic. Anthropic a indiqué qu’elle exigera désormais que davantage d’employés internes utilisent la même version de build publique que les utilisateurs, qu’ils exécutent des suites complètes d’évaluation du modèle pour chaque modification de prompt système et qu’ils mettent en œuvre des périodes de déploiement progressif. En guise de compensation, Anthropic a réinitialisé les quotas d’utilisation pour tous les utilisateurs disposant d’un abonnement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Nvidia et MediaTek s’associent pour construire ensemble l’avenir des assistants natifs d’IA pour les véhicules

NVIDIA et MediaTek collaborent pour créer une architecture automobile native à l’IA : la périphérie est assurée par DRIVE AGX, pour des missions à faible latence et axées sur la confidentialité, avec prise en charge de modèles 7B+ ; le cloud joue le rôle d’usine d’IA pour mener des inférences et des entraînements de haut niveau. Grâce à l’orchestration par agents et au partage de scénarios, elles offrent une UX sans couture. Dimensity AX gère le divertissement haut de gamme et l’IVI, tandis que Drive OS est partagé. Les deux assurent un échange transparent de données à haut débit via PCIe et l’API NvStreams, formant une architecture informatique centrale.

ChainNewsAbmediaIl y a 3m

OpenAI révoque demain le certificat de signature macOS, le 8 mai, désactivant les applications obsolètes

Selon Beating, le certificat de signature macOS d’OpenAI sera révoqué le 8 mai, rendant les versions obsolètes de ChatGPT Desktop, Codex, Codex CLI et Atlas inutilisables et incapables de recevoir des mises à jour. Les utilisateurs disposant de versions macOS doivent mettre à jour immédiatement via les mises à jour intégrées à l’application ou en téléchargeant depuis Ope

GateNewsIl y a 16m

Chrome supprime et réinstalle un modèle d’IA de 4 Go, selon un chercheur, à cause de la violation des lois européennes sur la confidentialité

Selon Decrypt, le 7 mai, Google Chrome télécharge en silence, sans obtenir le consentement de l’utilisateur, environ 4 Go du modèle d’IA Gemini Nano sur les appareils éligibles. Le chercheur en matière de confidentialité Alexander Hanff a découvert cette pratique en effectuant un audit automatisé de profils de nouveaux utilisateurs, affirmant que cela pourrait enfreindre la directive européenne « ePrivacy ».

MarketWhisperIl y a 28m

Des documents judiciaires montrent qu’Altman a proposé d’acquérir Microsoft pour conserver son rôle de PDG en novembre 2023

D’après des documents judiciaires publiés le 7 mai, des éléments de l’affaire Musk contre Altman ont révélé des messages entre Sam Altman et l’ancienne directrice technique Mira Murati datant du 19 novembre 2023, lorsque le conseil d’administration d’OpenAI a soudainement révoqué Altman de son poste de PDG. Pendant la crise, Altman a proposé que Microsoft acquière OpenAI pour

GateNewsIl y a 32m

Un grand CEX ajoute des échanges pré-IPO pour SpaceX, OpenAI et Anthropic

D'après des informations, une bourse centralisée de premier plan a lancé aujourd'hui (7 mai) les paires de négociation SPACEX/USDT, OPENAI/USDT et ANTHROPIC/USDT pour une entrée en bourse avant l'introduction en bourse (Pre-IPO). La plateforme prend en charge le trading avec effet de levier sur ces instruments.

GateNewsIl y a 40m

Cloudflare déclenche 1 milliard de réponses HTTP 402 par jour à Consensus 2026, et lance le cadre de confiance des agents avec Visa et Experian

Selon Foresight News, la directrice de la technologie chez Cloudflare, Stephanie Cohen, a annoncé lors de Consensus 2026 que la plateforme déclenche environ 1 milliard de réponses HTTP 402 par jour, reflétant la demande des agents IA pour un accès payant au contenu web. La société, aux côtés de Visa et d’Experian, a dévoilé la technologie Agent Trust

GateNewsIl y a 56m
Commentaire
0/400
Aucun commentaire