A developer Mia lançou o Qwable 27B no Hugging Face, um fine-tune completo de Qwen3.6-27B da Alibaba treinado num conjunto de dados de raciocínio ao estilo de Fable 5, na sequência de um anúncio de 15 de junho de 2026. O modelo replica a abordagem de pensamento estruturado da Fable 5 da Anthropic, funcionando inteiramente em hardware local sem custos de API nem políticas obrigatórias de retenção de dados. Pouco depois, o contribuinte open-source Huihui-ai lançou uma versão abliterada que remove o comportamento de recusa embutido ao modificar os pesos do modelo usando o cvector-generator do llama.cpp. Os lançamentos ocorreram após uma semana em que o governo dos EUA ordenou que a Fable 5 fosse retirada para todos os nacionais estrangeiros devido a uma descoberta de jailbreak contestada. Ambas as variantes do Qwable fornecem alternativas locais a serviços de IA baseados na nuvem, eliminando dependências do servidor e requisitos de processamento de dados de terceiros.
Qwable 27B Arquitetura e Metodologia de Treino
O Qwable 27B é um fine-tune completo do modelo base Qwen3.6-27B da Alibaba, construído pela developer Mia num conjunto de dados com exemplos de raciocínio ao estilo de Fable 5. A abordagem de treino é um instruction fine-tuning em exemplos de estilo trace, em que a developer recolheu exemplos formatados como as respostas passo a passo da Fable 5 e treinou o Qwen para produzir estruturas de saída semelhantes. O modelo resultante, com 27 mil milhões de parâmetros, visa a estrutura de instrução-following da Fable 5, produzindo saídas mais orientadas, explicativas e com conclusão de tarefas passo a passo do que o modelo base Qwen.
O modelo corre em formato GGUF, o tipo de ficheiro comprimido compatível com LM Studio e llama.cpp. A versão quantizada Q4 requer aproximadamente 16,5 GB de armazenamento. Todo o processamento ocorre localmente sem enviar dados para servidores externos, eliminando o requisito obrigatório de retenção de dados de 30 dias que a Fable 5 impôs a todo o tráfego, incluindo clientes empresariais com acordos anteriores de retenção zero.
Processo de Abliteração Remove Mecanismos de Recusa
Huihui-ai aplicou a abliteration para produzir Huihui-Qwable-3.6-27b-abliterated, uma variante que elimina o comportamento de recusa do modelo. O processo identifica uma direção de recusa embutida nos pesos do modelo ao executar o modelo em grandes conjuntos de prompts nocivos e inofensivos, medindo diferenças em ativações internas, e depois modificando os pesos para eliminar essa diferença. Após a abliteração, o modelo já não contém os sinais matemáticos que disparam respostas de recusa.
Huihui-ai aplicou a técnica diretamente ao Qwable GGUF usando o cvector-generator do llama.cpp, sem exigir ambiente Python, retraining total dos pesos, ou servidores alugados. O processo difere de jailbreaking ao modificar permanentemente a arquitetura do modelo em vez de explorar vulnerabilidades de prompts. O cartão do modelo indica que a versão abliterada é apenas para investigação e ambientes controlados, com a responsabilidade legal e ética a recair inteiramente sobre os utilizadores.
Builds Disponíveis e Requisitos de Hardware
O Qwable abliterado está disponível no Hugging Face em três builds. A versão recomendada Q4_K_M_Q8 pesa aproximadamente 19 GB e representa a opção mais pequena e mais amigável para consumidores. Existe uma versão com suporte para previsão multi-token para sistemas com recursos computacionais suficientes, proporcionando geração de respostas mais rápida. Tanto o Qwable padrão como a variante abliterada correm em hardware de consumo através de runtimes locais como o LM Studio.
Casos de Uso para Versões Padrão e Abliteradas
O Qwable padrão serve para apoio à programação, depuração técnica e fluxos de trabalho que exigem modelos que apresentem processos de raciocínio em vez de produzir respostas diretas. Corre em setups locais de agentes e na maioria dos runtimes locais. A versão abliterada destina-se a investigadores de segurança que necessitam de comportamento bruto do modelo sem filtragem do lado do fornecedor, pipelines de dados sintéticos que precisam de saídas sobre tópicos sensíveis, e trabalho de avaliação que testa capacidades do modelo sem interferência de políticas de conteúdo. O cartão do modelo alerta que a redução da filtragem de segurança significa que as saídas podem ser sensíveis, controversas ou inadequadas.
FAQ
O que é Qwable 27B e quando foi lançado?
O Qwable 27B é um fine-tune completo do Qwen3.6-27B da Alibaba treinado num conjunto de dados de raciocínio ao estilo de Fable 5, anunciado pela developer Mia em 15 de junho de 2026. O modelo corre localmente em formato GGUF e requer aproximadamente 16,5 GB na sua build quantizada Q4.
Como é que a versão abliterada difere do modelo Qwable padrão?
A versão abliterada, criada pela Huihui-ai, remove o comportamento de recusa ao modificar os pesos do modelo usando o cvector-generator do llama.cpp. O processo elimina os sinais matemáticos que disparam respostas de recusa, resultando num modelo que processa todos os prompts sem filtragem de conteúdo, mantendo ao mesmo tempo plena funcionalidade.
Quais são os requisitos de hardware para correr modelos Qwable?
A build quantizada Q4 requer aproximadamente 16,5 GB de armazenamento, enquanto a versão abliterada recomendada Q4_K_M_Q8 pesa cerca de 19 GB. Ambos os modelos correm em hardware de consumo através de runtimes locais como o LM Studio ou o llama.cpp, com uma versão de previsão multi-token disponível para sistemas com maior capacidade computacional.