Qwable 27B : un modèle d’IA local réplique le raisonnement de Fable 5 sur du matériel grand public

2026-06-23 22:12:28

La développeuse Mia a publié Qwable 27B sur Hugging Face : un ajustement complet (full fine-tune) du modèle Qwen3.6-27B d'Alibaba, entraîné sur un jeu de données de raisonnement de style Fable 5, à la suite d'une annonce du 15 juin 2026. Le modèle reproduit l’approche de pensée structurée de Fable 5 d’Anthropic tout en fonctionnant entièrement sur du matériel local, sans frais d’API et sans politiques obligatoires de conservation des données. Peu de temps après, le contributeur open-source Huihui-ai a publié une version abliterée qui supprime le comportement de refus intégré en modifiant les poids du modèle via le cvector-generator de llama.cpp. Les sorties ont été précédées d’une semaine au cours de laquelle le gouvernement américain a ordonné le retrait de Fable 5 pour tous les ressortissants étrangers, suite à une constatation contestée de jailbreak. Les deux variantes de Qwable offrent des alternatives locales aux services d’IA basés sur le cloud, éliminant les dépendances serveur et les exigences de traitement des données par des tiers.

Architecture Qwable 27B et méthodologie d’entraînement

Qwable 27B est un ajustement complet du modèle de base Qwen3.6-27B d’Alibaba, construit par la développeuse Mia à partir d’un jeu de données d’exemples de raisonnement de style Fable 5. La méthode d’entraînement est un instruction fine-tuning sur des exemples de type trace, où la développeuse a collecté des exemples formatés comme les réponses étape par étape de Fable 5 et a entraîné Qwen pour produire des structures de sortie similaires. Le modèle résultant de 27 milliards de paramètres cible la structure d’instructions de Fable 5, produisant des sorties de réalisation de tâches plus guidées, plus explicatives et davantage étape par étape que le modèle Qwen de base.

Le modèle fonctionne au format GGUF, un type de fichier compressé compatible avec LM Studio et llama.cpp. La version quantifiée Q4 nécessite environ 16,5 GB de stockage. Tout le traitement s’effectue localement sans envoyer de données à des serveurs externes, supprimant l’exigence obligatoire de conservation des données sur 30 jours que Fable 5 imposait à l’ensemble du trafic, y compris aux clients professionnels, malgré des accords précédents de zéro conservation.

Processus d’abliteration : suppression des mécanismes de refus

Huihui-ai a appliqué l’abliteration pour produire Huihui-Qwable-3.6-27b-abliterated, une variante qui élimine le comportement de refus du modèle. Le processus identifie une direction de refus intégrée dans les poids du modèle en exécutant le modèle sur de grands ensembles d’invites nuisibles et inoffensives, en mesurant les différences d’activations internes, puis en modifiant les poids pour éliminer cette différence. Après ablitération, le modèle ne contient plus les signaux mathématiques qui déclenchent des réponses de refus.

Huihui-ai a appliqué la technique directement au Qwable GGUF à l’aide du cvector-generator de llama.cpp, sans nécessiter d’environnement Python, de réentraînement complet des poids, ni de serveurs loués. Le processus diffère du jailbreaking en modifiant durablement l’architecture du modèle plutôt qu’en exploitant des vulnérabilités liées aux invites. La fiche modèle indique que la version abliterée est destinée uniquement à la recherche et à des environnements contrôlés, avec une responsabilité juridique et éthique reposant entièrement sur les utilisateurs.

Construits disponibles et exigences matérielles

Le Qwable abliteré est disponible sur Hugging Face en trois versions. La version recommandée Q4_K_M_Q8, pesant environ 19 GB, représente l’option la plus petite et la plus adaptée aux consommateurs. Une version prenant en charge la prédiction multi-token est disponible pour les systèmes disposant de ressources de calcul suffisantes, offrant une génération de réponses plus rapide. Les versions standard de Qwable et abliterée fonctionnent toutes deux sur du matériel grand public via des runtimes locaux comme LM Studio.

Cas d’usage pour les versions standard et abliterée

La version standard de Qwable convient à l’assistance à la programmation, au débogage technique et aux workflows nécessitant des modèles qui affichent des processus de raisonnement plutôt que de produire des réponses directes. Elle s’exécute dans des configurations d’agents locaux et sur la plupart des runtimes locaux. La version abliterée est destinée aux chercheurs en sécurité qui ont besoin du comportement brut du modèle sans filtrage côté fournisseur, aux pipelines de données synthétiques nécessitant des sorties sur des sujets sensibles, et aux travaux d’évaluation testant les capacités du modèle sans interférence de politiques de contenu. La fiche modèle avertit que la réduction du filtrage de sécurité signifie que les sorties peuvent être sensibles, controversées ou inappropriées.

FAQ

Qu’est-ce que Qwable 27B et quand a-t-il été publié ?

Qwable 27B est un ajustement complet du modèle Qwen3.6-27B d’Alibaba entraîné sur un jeu de données de raisonnement de style Fable 5, annoncé par la développeuse Mia le 15 juin 2026. Le modèle s’exécute localement au format GGUF et nécessite environ 16,5 GB dans sa version quantifiée Q4.

En quoi la version abliterée diffère-t-elle du modèle Qwable standard ?

La version abliterée, créée par Huihui-ai, supprime le comportement de refus en modifiant les poids du modèle à l’aide du cvector-generator de llama.cpp. Le processus élimine les signaux mathématiques qui déclenchent les réponses de refus, ce qui aboutit à un modèle qui traite toutes les invites sans filtrage de contenu tout en conservant l’ensemble des fonctionnalités.

Quelles sont les exigences matérielles pour exécuter des modèles Qwable ?

La version quantifiée Q4 nécessite environ 16,5 GB de stockage, tandis que la version abliterée recommandée Q4_K_M_Q8 pèse environ 19 GB. Les deux modèles s’exécutent sur du matériel grand public via des runtimes locaux comme LM Studio ou llama.cpp, avec une version à prédiction multi-token disponible pour les systèmes disposant d’une capacité de calcul plus élevée.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

Il y a 16h

Le ministère américain du Commerce exige qu’Anthropic suspende les modèles d’IA Fable 5 et Mythos pour les utilisateurs étrangers après la divulgation de failles de sécurité

Il y a 20h

Bytedance publie le modèle Doubao 2,1 Pro le 23 juin

06-22 23:13

Apple expédie l’iPhone Fold en petites séries, prévu pour un lancement en septembre 2026 à partir de 2 325 dollars pour le prix de départ