AiHubMix Documentation Hub

Problemas de acesso / Não consigo conectar à API — o que fazer?

Se o domínio principal https://aihubmix.com estiver inacessível (por exemplo, falhas de conexão ou tempos limite), substitua a URL da requisição pelo domínio de backup https://api.inferera.com. Todos os demais parâmetros (API Key, modelo, corpo da requisição etc.) permanecem inalterados.

1. Uso do Modelo e Segurança

A AIHubMix armazena dados das requisições de API dos usuários?

Por padrão, a AIHubMix não armazena nenhum conteúdo das requisições que você envia através da nossa API, nem registramos as respostas retornadas pelos provedores de modelos. A AIHubMix atua apenas como um proxy, encaminhando com segurança sua requisição ao provedor de modelo apropriado e retornando a resposta dele sem modificações.

A única exceção

Se você proativamente relatar um problema, enviar um ticket de erro ou solicitar ajuda com depuração, a AIHubMix pode armazenar temporariamente informações técnicas relacionadas ao erro (como stack traces, metadados de invocação ou status de endpoint) para nos ajudar a diagnosticar e resolver o problema.
Esses logs não incluem seus dados de negócios, conteúdo de prompt ou o payload completo da requisição/resposta.

Por que produtos oficiais como Claude ou GPT retornam resultados diferentes da API?

O modelo subjacente é o mesmo; a diferença vem de otimizações de engenharia adicionais na versão web. Explicação:

A versão web é como um apartamento totalmente mobiliado, com recursos integrados como busca, memória, calculadora e prompts de sistema.
As chamadas de API são como um apartamento sem acabamento, fornecendo apenas as capacidades essenciais. Os desenvolvedores precisam configurar contexto e ferramentas por conta própria.

Por que usar GPT-5 ou modelos da série “o” pode resultar em suspensão da conta AiHubMix?

Se você solicitar ao GPT-5 ou aos modelos da série “o” para “mostrar etapas de raciocínio”, “exibir a cadeia de pensamento” ou “trace de raciocínio”, o sistema pode acionar políticas de segurança, o que pode restringir ou suspender temporariamente sua conta. Explicação:

As políticas oficiais de segurança para GPT-5 e modelos da série “o” são mais rigorosas; o uso normal não acionará um banimento.
Se sua conta for sinalizada por engano ou você vir mensagens anormais, entre em contato com o suporte por e-mail: feedback@aihubmix.com para obter assistência.
Para visualizar resumos de raciocínio do modelo, use a Response API em vez de perguntar diretamente ao modelo no prompt, evitando acionar políticas de segurança.

O que fazer quando sua conta for desativada?

Se sua conta foi desativada, você pode entrar em contato com o atendimento online ou enviar um e-mail para feedback@aihubmix.com para solicitar assistência ou a reativação da conta. Suspensões de conta geralmente são acionadas automaticamente pelos mecanismos de controle de risco do sistema. Razões comuns se enquadram nas duas categorias a seguir:

Uso de Modelos da Série GPT-5 em Cenários de Tradução Imersiva Esta série de modelos foi projetada para raciocínio complexo e geração de conteúdo estruturado, tornando-a inadequada para tarefas de tradução em tempo real e alta frequência. Chamadas frequentes nesses cenários podem acionar as políticas de controle de risco do sistema, levando a restrições temporárias ou suspensão da conta. Para garantir a operação estável da conta, priorize o uso de modelos sem raciocínio para tarefas de tradução, como:
- gpt-4.1-mini
- gpt-4o-mini
Envio de Conteúdo Violador Durante o Uso do Modelo Grok Durante o uso do modelo Grok, se o conteúdo solicitado for considerado pelo sistema como uma violação das normas de uso (por exemplo, envolvendo violência, gore, pornografia, etc.), isso acionará diretamente o mecanismo de suspensão. Certifique-se de que o conteúdo de sua requisição esteja em conformidade com as diretrizes de uso da plataforma e do modelo para evitar o envio de conteúdo ilegal ou inadequado.

Se você encontrar uma suspensão indevida ou restrições incomuns, pode enviar um recurso através do atendimento ou e-mail. Porém, observe que se sua conta acionar registros de suspensão várias vezes, pode não ser possível reativá-la novamente.

Se você é desenvolvedor, pode usar a API de Moderação da AIHUBMIX para realizar verificações de conformidade no conteúdo de entrada antes de fazer requisições, reduzindo assim o risco de violações. Esta etapa é opcional, mas é fortemente recomendada em cenários onde o conteúdo é aberto ou a entrada do usuário é incontrolável.

Por que minha conta ainda falha ao chamar certos modelos (como Claude Opus ou GPT-5.4-Pro) mesmo tendo saldo?

Usamos um mecanismo de pré-cobrança. Ao chamar modelos de maior custo (como Claude Opus ou GPT-5.4-Pro), o sistema estima o custo máximo possível de saída com base no limite configurado de tokens de saída e verifica seu saldo quando a requisição é iniciada. Se o saldo da sua conta for menor que o preço do token de saída × tokens máximos de saída, a requisição pode ser rejeitada. Para evitar isso, garanta que o saldo da sua conta seja suficiente antes de chamar esses modelos e defina um limite razoável de tokens máximos de saída; se não especificado, o sistema usará o valor padrão para estimativa. Observe que o nome do parâmetro de saída máxima difere por modelo: modelos Claude e GPT usam max_tokens, enquanto modelos Gemini usam max_output_tokens.

Por que o GPT-5 não é recomendado para ferramentas de tradução?

GPT-5 é um modelo de raciocínio projetado para inferência complexa e geração estruturada, não para tarefas em tempo real de alta frequência. Razões:

Tempos de resposta mais lentos devido a várias etapas de inferência.
Maior uso de tokens (prompts de sistema longos e contexto de raciocínio).
Plugins de tradução podem acionar acidentalmente políticas de segurança.

Para cenários de tradução ou chat, use modelos leves como GPT-4o mini ou Gemini para respostas mais rápidas e estáveis.

Por que o GPT-5 às vezes responde “Sou o GPT-4” quando perguntado “Quem é você”?

Esta é uma alucinação conhecida de LLM, onde o modelo descreve imprecisamente sua própria base, origem ou capacidades. Desenvolvedores usando GPT-4, GPT-5, Claude, etc., podem encontrar autoidentificações confiantes, mas incorretas. Explicação:

Esse comportamento não se deve a modificações da plataforma ou adulteração de saída; é normal para LLMs.
O GPT-5 não recebeu o nome “GPT-5” durante o treinamento; o nome foi atribuído posteriormente pelo lançamento oficial.
O modelo não conhece seu próprio nome ou data de corte do conhecimento; a versão web pode responder corretamente porque possui prompts de sistema integrados. Nossa versão de API é a API oficial não-web.
Perguntar diretamente ao modelo via API pode produzir respostas aleatórias ou imprecisas porque ele não possui autoconsciência.

O que devo fazer se chamadas a alguns modelos (como Gemini-3-Pro) atingirem o tempo limite com frequência?

Tente aumentar a duração do timeout. Gemini-3-Pro é um modelo grande, e seu processo de inferência geralmente requer um tempo de raciocínio mais longo — especialmente para tarefas complexas onde a resposta pode levar mais de 30 segundos. Como resultado, o timeout padrão de 30 segundos pode facilmente levar a erros.

Se você precisa usar o Gemini-3-Pro, certifique-se de estender o timeout adequadamente.
Se um tempo de resposta rápido é essencial, considere mudar para um modelo mais leve, como o Gemini 2.0, que funciona melhor com configurações de timeout mais curtas.

Por que enviar apenas “Olá” consumiu tantos Tokens?

Algumas ferramentas de terceiros (como Cline ou Claude Code) incluem automaticamente contexto ou prompts de sistema nas requisições, que também contam para o uso de Tokens. Mesmo que você digite apenas “Olá”, a requisição do backend pode conter um histórico extenso de chat ou texto predefinido. Esses tokens extras vêm da ferramenta, não da plataforma AiHubMix.

Por que vejo uso do 4o-mini mesmo tendo chamado apenas o GPT-4o?

Algumas ferramentas de terceiros podem chamar modelos leves (como o 4o-mini) para sumarização de conversa, busca ou computação auxiliar.
Assim, sua fatura ou logs podem mostrar o uso de Tokens de vários modelos. Esse uso extra vem das configurações da ferramenta, não da AiHubMix trocando modelos automaticamente.

Qual é o limite de concorrência para requisições de API?

A AiHubMix atualmente não impõe um limite uniforme de concorrência. Entre em contato com o suporte via feedback@aihubmix.com se encontrar problemas de concorrência.

Por que os resultados variam para o mesmo prompt?

Os grandes modelos de linguagem usam amostragem probabilística (por exemplo, temperature, top-p) para gerar texto, escolhendo aleatoriamente entre múltiplos tokens possíveis a cada vez.

Reduzir a temperatura ou desabilitar a amostragem pode tornar os resultados mais consistentes.
Variações também podem ser afetadas pelo contexto, prompts de sistema ou condições de rede.

Por que as respostas do modelo Claude terminam prematuramente?

Para o modelo Claude, a AIHubMix atualmente suporta dois métodos de chamada:

Interface compatível com OpenAI Chat
Interface nativa Anthropic Claude

Ao invocar o modelo Claude através da interface compatível com OpenAI Chat, o sistema usa por padrão max_tokens=4096. Se um max_tokens maior não for explicitamente definido na requisição, o modelo automaticamente parará de gerar saída ao atingir esse limite. Portanto, a ocorrência de “respostas terminando antes da conclusão” geralmente não se deve a um mau funcionamento do modelo, mas sim porque atingiu a restrição padrão de comprimento de saída. Como gerar textos mais longos? Sob a interface compatível com OpenAI Chat, você pode definir manualmente um parâmetro max_tokens maior, por exemplo:

completion = client.chat.completions.create(
  model="claude-sonnet-4-6",
  max_tokens=6000,
  messages=[
    {
      "role": "assistant",
      "content": "Always respond in Chinese"
    },
    {
      "role": "user",
      "content": "What is the meaning of life?, over 6000 words"
    }
  ]
)

O max_tokens não deve exceder o limite máximo suportado pelo modelo correspondente. Se o truncamento ainda ocorrer após configurar, forneça o nome do modelo e os parâmetros completos da requisição para investigação adicional.

2. Chamadas de API e Dados

Quais endpoints de API estão disponíveis?

A AiHubMix fornece um gateway unificado compatível com vários padrões de modelos principais:

Endpoint padrão OpenAI: https://aihubmix.com/v1 (suporta GPT e modelos compatíveis)
Endpoint Dedicado Gemini: https://aihubmix.com/gemini (compatível com padrões nativos do Google)
Endpoint de Auto-Encaminhamento Claude: https://aihubmix.com (suporta chamadas via SDK da Anthropic)

Quais dados são registrados durante o uso da API?

Registramos apenas os dados de uso necessários: informações da conta, registros de chamadas, modelos usados, consumo de Tokens e informações de pagamento. Garantia de privacidade:

Entrada do usuário e saída do modelo não são armazenadas.
Os dados são usados apenas para faturamento e otimização de serviços, não para análise de conteúdo ou compartilhamento com terceiros.
A AiHubMix não retém dados detalhados das requisições; no entanto, provedores de nuvem subjacentes podem registrar acessos por segurança ou conformidade, regidos por suas próprias políticas de privacidade.

Veja a Política de Privacidade da AiHubMix para detalhes.

3. Conhecimento do Modelo e Fenômenos Comuns

O que é alucinação de IA?

A alucinação de IA ocorre quando um grande modelo de linguagem gera informações que são factualmente incorretas, não suportadas ou totalmente fictícias. Causas possíveis:

Vieses ou lacunas nos dados de treinamento.
Overfitting dos parâmetros do modelo.
Aleatoriedade durante a geração.

As alucinações são comuns a todos os LLMs e não indicam falha do sistema.

4. Uso e Solução de Problemas

Como posso monitorar o uso e consumo da API?

Você pode visualizar o volume de chamadas, uso de Tokens e detalhes de cobrança através do dashboard da AiHubMix. Suporta categorização por modelo e período de tempo, ajudando a otimizar o uso e gerenciar custos.

O que devo fazer se uma chamada falhar ou retornar um erro?

Erros de API incluem um código de erro e explicação. Causas comuns:

Formato incorreto da requisição.
Modelo indisponível ou limite de uso excedido.

Consulte o Guia da API para solução de problemas, ou entre em contato com o suporte via feedback@aihubmix.com.

Como gerencio minha chave de API?

Os usuários podem gerar, revogar ou atualizar chaves de API via dashboard.

Não exponha chaves de API em ambientes públicos.
Use chaves separadas para projetos diferentes.
Rotacione chaves periodicamente para garantir a segurança da conta.

Última atualização: 2026-06-01

Começar

Recursos de gateway

Capacidades do modelo

Referência de protocolo

Gestão de plataforma

Privacidade e termos

Perguntas Frequentes

Problemas de acesso / Não consigo conectar à API — o que fazer?

1. Uso do Modelo e Segurança

A AIHubMix armazena dados das requisições de API dos usuários?

A única exceção

Por que produtos oficiais como Claude ou GPT retornam resultados diferentes da API?

Por que usar GPT-5 ou modelos da série “o” pode resultar em suspensão da conta AiHubMix?

O que fazer quando sua conta for desativada?

Por que minha conta ainda falha ao chamar certos modelos (como Claude Opus ou GPT-5.4-Pro) mesmo tendo saldo?

Por que o GPT-5 não é recomendado para ferramentas de tradução?

Por que o GPT-5 às vezes responde “Sou o GPT-4” quando perguntado “Quem é você”?

O que devo fazer se chamadas a alguns modelos (como Gemini-3-Pro) atingirem o tempo limite com frequência?

Por que enviar apenas “Olá” consumiu tantos Tokens?

Por que vejo uso do 4o-mini mesmo tendo chamado apenas o GPT-4o?

Qual é o limite de concorrência para requisições de API?

Por que os resultados variam para o mesmo prompt?

Por que as respostas do modelo Claude terminam prematuramente?

2. Chamadas de API e Dados

Quais endpoints de API estão disponíveis?

Quais dados são registrados durante o uso da API?

3. Conhecimento do Modelo e Fenômenos Comuns

O que é alucinação de IA?

4. Uso e Solução de Problemas

Como posso monitorar o uso e consumo da API?

O que devo fazer se uma chamada falhar ou retornar um erro?

Como gerencio minha chave de API?

​Problemas de acesso / Não consigo conectar à API — o que fazer?

​1. Uso do Modelo e Segurança

​A AIHubMix armazena dados das requisições de API dos usuários?

​A única exceção

​Por que produtos oficiais como Claude ou GPT retornam resultados diferentes da API?

​Por que usar GPT-5 ou modelos da série “o” pode resultar em suspensão da conta AiHubMix?

​O que fazer quando sua conta for desativada?

​Por que minha conta ainda falha ao chamar certos modelos (como Claude Opus ou GPT-5.4-Pro) mesmo tendo saldo?

​Por que o GPT-5 não é recomendado para ferramentas de tradução?

​Por que o GPT-5 às vezes responde “Sou o GPT-4” quando perguntado “Quem é você”?

​O que devo fazer se chamadas a alguns modelos (como Gemini-3-Pro) atingirem o tempo limite com frequência?

​Por que enviar apenas “Olá” consumiu tantos Tokens?

​Por que vejo uso do 4o-mini mesmo tendo chamado apenas o GPT-4o?

​Qual é o limite de concorrência para requisições de API?

​Por que os resultados variam para o mesmo prompt?

​Por que as respostas do modelo Claude terminam prematuramente?

​2. Chamadas de API e Dados

​Quais endpoints de API estão disponíveis?

​Quais dados são registrados durante o uso da API?

​3. Conhecimento do Modelo e Fenômenos Comuns

​O que é alucinação de IA?

​4. Uso e Solução de Problemas

​Como posso monitorar o uso e consumo da API?

​O que devo fazer se uma chamada falhar ou retornar um erro?

​Como gerencio minha chave de API?

Problemas de acesso / Não consigo conectar à API — o que fazer?

1. Uso do Modelo e Segurança

A AIHubMix armazena dados das requisições de API dos usuários?

A única exceção

Por que produtos oficiais como Claude ou GPT retornam resultados diferentes da API?

Por que usar GPT-5 ou modelos da série “o” pode resultar em suspensão da conta AiHubMix?

O que fazer quando sua conta for desativada?

Por que minha conta ainda falha ao chamar certos modelos (como Claude Opus ou GPT-5.4-Pro) mesmo tendo saldo?

Por que o GPT-5 não é recomendado para ferramentas de tradução?

Por que o GPT-5 às vezes responde “Sou o GPT-4” quando perguntado “Quem é você”?

O que devo fazer se chamadas a alguns modelos (como Gemini-3-Pro) atingirem o tempo limite com frequência?

Por que enviar apenas “Olá” consumiu tantos Tokens?

Por que vejo uso do 4o-mini mesmo tendo chamado apenas o GPT-4o?

Qual é o limite de concorrência para requisições de API?

Por que os resultados variam para o mesmo prompt?

Por que as respostas do modelo Claude terminam prematuramente?

2. Chamadas de API e Dados

Quais endpoints de API estão disponíveis?

Quais dados são registrados durante o uso da API?

3. Conhecimento do Modelo e Fenômenos Comuns

O que é alucinação de IA?

4. Uso e Solução de Problemas

Como posso monitorar o uso e consumo da API?

O que devo fazer se uma chamada falhar ou retornar um erro?

Como gerencio minha chave de API?