Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Las APIs de IA gratuitas son la forma más rápida de lanzar funciones de IA en 2026, pero la mayoría de las plataformas “gratuitas” exigen tarjeta de crédito, tienen pruebas que caducan o sorprenden con topes de uso. AIHubMix adopta un enfoque distinto: un gateway unificado y compatible con OpenAI con más de 27 modelos LLM y de generación de imágenes genuinamente gratuitos subvencionados por la plataforma, incluidos GPT-5.5 y GPT-Image-2 de OpenAI, Gemini 3 de Google, Zhipu GLM-5.1, Kimi, MiniMax y Xiaomi MiMo. Sin tarjeta de crédito. Sin caducidad de prueba. Una clave API, todos los modelos principales.

🚀 Última actualización: GPT-5.5 y GPT-Image-2 ahora son gratuitos

AIHubMix se compromete a obtener el máximo valor para sus usuarios. En esta actualización, las versiones gratuitas de dos de los modelos insignia más recientes de OpenAI — GPT-5.5 y GPT-Image-2 — están oficialmente disponibles. Dado que la API oficial de OpenAI no ofrece acceso gratuito a estos modelos, AIHubMix sigue invirtiendo en subvencionar los costos de inferencia, reduciendo a cero la barrera de entrada a los modelos de primer nivel. GPT-5.5-free Una mejora integral en profundidad de razonamiento, orquestación de agentes, uso de herramientas, generación de código y análisis de datos: actualmente, el modelo más capaz disponible de OpenAI en términos generales. El acceso gratuito en AIHubMix es la forma más rápida de comparar GPT-5.5 con Claude Opus 4.6, Gemini 3.1 Pro y GLM-5.1 sin pagar por token. Ejemplos de uso de la API de GPT-5.5-free
import openai

client = openai.OpenAI(
    api_key="<AIHUBMIX_API_KEY>",  # Replace with the key generated in AIHubMix
    base_url="https://aihubmix.com/v1"
)

response = client.chat.completions.create(
    model="gpt-5.5-free",  # The reasoning depth of the model defaults to medium
    messages=[
        {"role": "user", "content": "Hello, how are you?"}
    ],
    temperature=0.7  # Default is 1
)

print(response.choices[0].message.content)
GPT-Image-2-free Fotografía de producto, carteles, avatares, ilustraciones, recursos para e-commerce, gráficos para redes sociales, miniaturas de streaming en vivo: todos los casos de uso habituales de generación de imágenes cubiertos con una sola llamada, con calidad de salida a nivel comercial. Es el primer modelo de imagen de OpenAI con razonamiento integrado y una precisión de renderizado de texto a nivel de carácter de aproximadamente el 99 % en alfabetos latinos, CJK, hindi y otros. Ejemplos de uso de la API
import base64

from openai import OpenAI

client = OpenAI(
    api_key="<AIHUBMIX_API_KEY>",  # Replace with the key generated in AIHubMix
    base_url="https://aihubmix.com/v1"
)

response = client.images.generate(
    model="gpt-image-2-free",
    prompt="A vase of flowers on a table, with intense contrasting colors and thick, expressive brushstrokes. Render the image so it looks painted in Fauvist style.",
    n=1,           # Number of images to generate, supports 1-10
    size="auto",   # Image size: 1024x1024, 1024x1536, 1536x1024, 4096x4096, auto (default)
    quality="auto" # Image quality: high, medium, low, auto (default)
)

image_bytes = base64.b64decode(response.data[0].b64_json)
with open("output.png", "wb") as f:
    f.write(image_bytes)

Bono para nuevos usuarios: tras registrarte, recibe 10 llamadas gratuitas a cada uno de los modelos gratuitos, incluidos GPT-5.5 y GPT-Image-2. Recarga para desbloquear más cuota. Usuarios de pago: reciben 10 llamadas adicionales y una recarga de un millón de tokens.


¿Por qué usar APIs de IA gratuitas en 2026?

Las APIs de modelos de IA gratuitos desbloquean cuatro beneficios concretos que el acceso solo de pago no puede igualar:
  • Evaluación lado a lado de modelos: Compara GPT-5.5, Claude Opus 4.6, Gemini 3.1 Pro, GLM-5.1 y Kimi con los mismos prompts antes de comprometerte con un plan de pago.
  • Prototipado a costo cero: Construye pruebas de concepto de agentes, chatbots y pipelines de automatización sin gastar tu tarjeta de crédito durante la fase de descubrimiento.
  • Enrutamiento en producción con conciencia de costos: Dirige el tráfico de bajo riesgo (resumen por lotes, análisis de logs, generación de borradores) a modelos gratuitos, reservando la cuota de pago para las rutas críticas para los ingresos.
  • Acceso para aficionados y estudiantes: Desarrolladores independientes, estudiantes y creadores de proyectos paralelos obtienen acceso a modelos de frontera que de otro modo costarían cientos al mes.
El problema con la mayoría de los proveedores de “API gratuita de LLM” es la fragmentación: Google AI Studio te da Gemini, Groq te da Llama, OpenRouter te da una mezcla diferente cada semana, y cada uno requiere una cuenta separada, una clave API y una estrategia de límites de tasa. AIHubMix consolida más de 27 modelos gratuitos detrás de un único endpoint compatible con OpenAI con failover automático entre proveedores: un reemplazo directo para cualquier llamada al SDK de OpenAI existente.

Catálogo completo de modelos gratuitos (más de 27 modelos, mayo de 2026)

AIHubMix ofrece actualmente más de 27 modelos gratuitos que abarcan a los principales proveedores, incluidos OpenAI, Google, Zhipu, Kimi, MiniMax y Xiaomi, y la lista sigue creciendo a medida que se lanzan nuevos modelos.

Modelos de chat y razonamiento de propósito general

Cubre las familias GPT-4o y GPT-4.1, además de Gemini Flash y modelos insignia nacionales: adecuado para Q&A cotidiano, generación de contenido, análisis de documentos y chat multilingüe. gpt-4o-free admite entrada mixta de texto e imagen, gemini-3-flash-preview-free ofrece contexto ultralargo (más de 1M de tokens) y el resto equilibra de manera diferente velocidad y capacidad.
ModeloContextoAspectos destacados
gpt-4o-free128KMultimodal, con capacidad de visión
gpt-4.1-free1MSeguimiento de instrucciones complejas, generación de texto largo
gpt-4.1-mini-free1MEquilibrio entre velocidad y capacidad
gpt-4.1-nano-free1MLigero, para tareas de alta frecuencia
gemini-3-flash-preview-free1M+Contexto ultralargo, entrada multimodal
glm-4.7-flash-free128KRespuesta rápida, soporte multilingüe
mimo-v2-flash-free128KConversación de baja latencia
ling-2.6-flash-free128KFuerte coherencia contextual

Modelos gratuitos de programación (la categoría más amplia)

La categoría más profunda del nivel gratuito, que reúne series de modelos especializados en programación de Kimi, MiniMax, Zhipu GLM y Qwen. Si estás buscando una alternativa gratuita a GitHub Copilot o un backend gratuito para Cursor, este es el punto de partida.
ModeloFortaleza
kimi-for-coding-freeContexto multiarchivo, refactorización, depuración
k2.6-code-preview-freeCódigo algorítmico y a nivel de sistemas
coding-minimax-m2-freeSerie de programación de MiniMax
coding-minimax-m2.1-freeSerie de programación de MiniMax
coding-minimax-m2.5-freeSerie de programación de MiniMax
coding-minimax-m2.7-freeÚltima versión de programación de MiniMax
coding-glm-4.6-freeSerie de programación de GLM
coding-glm-4.7-freeSerie de programación de GLM
coding-glm-5-freeGLM-5, 745B MoE, paridad con Claude Opus 4.5
coding-glm-5-turbo-freeEdición acelerada de programación de GLM
coding-glm-5.1-freeN.º 1 en SWE-bench Pro (58,4 %)
step-3.5-flash-freeCompletado ligero, baja latencia

Modelos gratuitos de generación de imágenes

GPT-Image-2-free El modelo de generación de imágenes de próxima generación de OpenAI, lanzado en abril de 2026, y su primer modelo de imagen con razonamiento integrado. Antes de generar, planifica automáticamente la composición, recupera referencias visuales de la web y autocomprueba la salida, lo que produce una calidad notablemente superior a la de GPT Image 1.5. Admite hasta resolución 4096×4096, genera aproximadamente 2x más rápido que GPT Image 1.5 y produce hasta 8 imágenes estilísticamente consistentes a partir de un solo prompt. La renderización de texto es un punto fuerte particular: cubre alfabetos latinos, CJK, hindi y otros con una precisión a nivel de carácter de alrededor del 99 %, lo que lo hace ideal para carteles, recursos de marketing, prototipos de UI y cualquier escenario que requiera una tipografía precisa. gemini-3.1-flash-image-preview-free (Nano Banana 2) Lanzado por Google DeepMind en febrero de 2026, combina la calidad de imagen al nivel Pro con la velocidad al nivel Flash, generando una imagen 4K en solo 4-6 segundos. A diferencia de los modelos de imagen tradicionales, Nano Banana 2 se integra directamente en la API estándar de Chat Completions, sin necesidad de un endpoint de imágenes separado. Solo describe lo que necesitas en la conversación para generar una imagen, y continúa editando entre turnos; por ejemplo, genera primero una toma de producto y luego cambia el fondo a una escena de atardecer con una sola frase. También admite el grounding visual en tiempo real desde la web, renderizando con precisión puntos de referencia específicos, productos de marca y otros objetos del mundo real.

Modelos gratuitos de agentes y razonamiento

La serie MiMo de Xiaomi está diseñada específicamente para razonamiento complejo, llamada a funciones y uso de herramientas: adecuada para flujos de trabajo de agentes autónomos que requieren planificación de múltiples pasos y ejecución encadenada de herramientas.
ModeloAspectos destacados
xiaomi-mimo-v2-pro-freeRazonamiento avanzado, llamada a funciones, más de 1T de parámetros
xiaomi-mimo-v2.5-free1,02T parámetros, 42B activos, 1M de contexto, más de 1000 llamadas a herramientas

Los 5 mejores modelos gratuitos en AIHubMix 🔥

coding-glm-5.1-free — Mejor modelo gratuito de programación

Lanzado por Zhipu AI en abril de 2026 con alrededor de 754B de parámetros. GLM-5.1 se convirtió en el primer modelo de código abierto en liderar SWE-bench Pro con un 58,4 %, superando a GPT-5.4 (57,7 %), Claude Opus 4.6 (57,3 %) y Gemini 3.1 Pro (54,2 %). A lo largo de 12 benchmarks que abarcan razonamiento, programación, agentes, uso de herramientas y navegación, muestra un perfil de capacidad equilibrado adecuado para flujos de trabajo exigentes de desarrollo. A través de AIHubMix, es una actualización directa para cualquier configuración de Cursor, Cline, Aider o Claude Code sin costo.

coding-glm-5-free — Potencia de código abierto para programación

Predecesor de GLM-5.1: una arquitectura MoE de 745B parámetros (44B activos), lanzada en febrero de 2026. Puntuó un 77,8 % en SWE-bench Verified, logrando el estado del arte de código abierto en tablas de clasificación de programación con agentes, incluido Terminal Bench 2.0, con una capacidad general de programación a la altura de Claude Opus 4.5.

gpt-4.1-free Hot — Mejor modelo gratuito con contexto de 1M

Contexto 1M · Latencia 0,529s · Rendimiento 72 TPS · Entrada y salida gratuitas
Modelo insignia de próxima generación de OpenAI, lanzado en abril de 2025. Supera ampliamente a GPT-4o en programación y seguimiento de instrucciones: 54,6 % en SWE-bench Verified, 87,4 % en IFEval. El contexto ultralargo de 1M es excepcionalmente adecuado para análisis de documentos a gran escala, comprensión de bases de código y flujos de trabajo complejos de agentes. La versión gratuita se aloja en Azure, ofreciendo respuesta rápida y alta estabilidad.

xiaomi-mimo-v2-pro-free New — Mejor modelo gratuito de agente

Contexto 256K · Latencia 1,673s · Rendimiento 41 TPS · Entrada y salida gratuitas
El modelo de razonamiento grande de Xiaomi: arquitectura MoE con más de 1T de parámetros totales y aproximadamente 42B activos durante la inferencia. Clasificado en el puesto 8 del Intelligence Index global (2.º entre los modelos chinos). La capacidad de programación supera a Claude Sonnet 4.6, y la capacidad general como agente se acerca a Opus 4.6, lo que lo convierte en una opción sólida para la generación compleja de código y los flujos de trabajo de cadena larga con múltiples herramientas.

xiaomi-mimo-v2.5-free — El modelo abierto de razonamiento gratuito más potente

La cumbre actual de la serie MiMo, con una puntuación de 54 en Artificial Analysis Intelligence Index. Construido sobre una arquitectura MoE de atención híbrida (1,02T total / 42B activos) con una ventana de contexto de 1M tokens. Mejora de forma integral respecto a V2-Pro en capacidad general como agente, ingeniería de software compleja y tareas de largo recorrido, admitiendo flujos de trabajo de agente con más de 1000 llamadas a herramientas en una sola sesión.

AIHubMix frente a OpenRouter

¿Qué API de IA gratuita deberías elegir? Si has buscado “API de IA gratuita”, “alternativa a OpenRouter” o “API gratuita de Claude”, probablemente hayas visto un panorama fragmentado. OpenRouter es el nombre más citado en esta categoría, pero su nivel gratuito y el de AIHubMix resuelven problemas fundamentalmente diferentes: uno optimiza la amplitud de modelos de código abierto, el otro el acceso a modelos propietarios de frontera sin pagar.

Dónde gana OpenRouter

  • Variedad de código abierto: si tu trabajo se centra en DeepSeek, Llama 3.3, Qwen o modelos comunitarios ajustados, el catálogo de OpenRouter es más amplio.
  • Enrutamiento aleatorio entre modelos gratuitos: el modelo virtual openrouter/free selecciona cualquier modelo gratuito de código abierto disponible, útil para cadenas de fallback baratas.
  • Reconocimiento de marca consolidado en la comunidad indie de OSS.

Dónde gana AIHubMix

  • Acceso gratuito a modelos propietarios de frontera: GPT-5.5, GPT-Image-2, Gemini 3 y capacidad de clase Claude vía GLM-5.1 son utilizables a $0. El nivel gratuito de OpenRouter excluye deliberadamente estos modelos.
  • Integración nativa con Claude Code: AIHubMix expone tanto /v1/chat/completions (formato OpenAI) como /v1/messages (formato Anthropic con reenvío de las cabeceras anthropic-beta y anthropic-version). Conéctate mediante ANTHROPIC_BASE_URL sin capa de proxy ni traducción.
  • Generación de imágenes en el mismo gateway: llama a GPT-Image-2 o a Nano Banana 2 con la misma clave API que usas para el chat.
  • Failover multi-proveedor por modelo: cuando un upstream limita o se degrada, las solicitudes se redirigen de forma transparente, elevando tu techo efectivo más allá de lo que ofrece un gateway de upstream único.
  • Cuota gratuita acumulada más alta: los topes diarios se distribuyen entre más de 27 modelos, no en un único depósito de 200 solicitudes.
Cuándo elegir AIHubMix: quieres los modelos insignia de OpenAI/Anthropic/Google gratis, un único endpoint compatible con OpenAI y generación de imágenes en el mismo gateway. Cuándo elegir OpenRouter: solo necesitas modelos de código abierto (Llama, DeepSeek, Qwen, Gemma) y prefieres el catálogo de código abierto más amplio antes que el acceso a modelos propietarios de frontera.

Cómo obtener una clave API de un modelo de IA gratuito (3 pasos)

El flujo completo para acceder a modelos gratuitos a través de AIHubMix:
  1. Regístrate en aihubmix.com: correo electrónico o OAuth, sin tarjeta de crédito.
  2. Crea una clave API en la página API Keys. Formato: sk-...
  3. Elige un modelo del catálogo de modelos gratuitos y empieza a llamar.

Casos de uso e integraciones

Modelos gratuitos en Claude Code (CLI de Anthropic)

Claude Code es la CLI oficial de programación con IA de Anthropic, ahora una parte central de muchos flujos de trabajo de desarrolladores. Con una sola línea de variable de entorno, puedes enrutar Claude Code a través de AIHubMix y usar cualquier modelo gratuito de programación como backend, sin necesidad de facturación de Anthropic.
export ANTHROPIC_BASE_URL="https://aihubmix.com"
export ANTHROPIC_AUTH_TOKEN="sk-YOUR_KEY"
claude
Estrategia práctica de enrutamiento: delega la generación de código cotidiana a kimi-for-coding-free o coding-glm-5.1-free, usa gpt-4.1-free para documentación y comentarios, y deja que xiaomi-mimo-v2-pro-free gestione la planificación y orquestación de tareas complejas. La pipeline completa de asistencia al desarrollo se ejecuta a costo cero de inferencia. Consulta la documentación de integración con Claude Code para más detalles de configuración, también disponible directamente en Claude Desktop.

Modelos gratuitos en Cursor, Cline, Aider y otros editores de programación con IA

Cualquier editor de programación con IA que admita un endpoint personalizado compatible con OpenAI funciona con los modelos gratuitos de AIHubMix. Configura https://aihubmix.com/v1 como base URL y elige un modelo *-free: reemplazo directo del uso de pago de GPT-5 o Claude en los asistentes de IDE.

Modelos gratuitos en agentes de IA y flujos de trabajo autónomos

OpenClaw: plataforma de agentes de IA autónomos de código abierto lanzada en noviembre de 2025, con actualmente más de 3,2M de usuarios. Admite casi todos los canales de mensajería principales (WhatsApp, Telegram, Slack, Discord), permitiendo que los agentes de IA ejecuten tareas directamente dentro de las plataformas en las que los usuarios ya trabajan. A través de AIHubMix, tanto xiaomi-mimo-v2-pro-free como coding-glm-5.1-free funcionan sin problemas como modelos backend, con soporte completo para llamada a funciones, contexto multiturno y salida estructurada. Hermes Agent: el framework de agentes de NousResearch, profundamente optimizado para el uso de herramientas y la salida JSON estructurada. Su herramienta execute_code comprime pipelines de múltiples pasos en una única llamada de inferencia, reduciendo drásticamente los viajes de ida y vuelta. Ideal para pipelines de automatización que requieren salida JSON estricta: la rotación automática de límites de tasa de AIHubMix entre proveedores garantiza que las tareas de larga duración no se interrumpan cuando un único proveedor alcance su cuota.

Modelos gratuitos con clientes de código abierto

AIHubMix es un proveedor de API oficialmente admitido para varias aplicaciones populares de código abierto:
  • Clientes de chat de escritorio: Cherry Studio es uno de los clientes locales de chat con IA más populares, con una UI limpia y una cómoda gestión multi-modelo. Selecciona AIHubMix como proveedor de API para usar GPT-4.1, Gemini Flash, GLM-5.1 y otros modelos gratuitos en una interfaz de chat de escritorio.
  • Proxy multi-modelo y traducción: LiteLLM proporciona gestión unificada de llamadas y balanceo de carga entre múltiples modelos gratuitos; NextAI Translator admite modelos gratuitos para traducción multilingüe de alta calidad.
  • Integraciones MCP/IDE: Claude Desktop, Continue, Open WebUI y cualquier herramienta que acepte un endpoint compatible con OpenAI.

Límites de tasa y cuota gratuita

Los modelos gratuitos en AIHubMix operan bajo límites de tasa por modelo expresados como solicitudes por minuto (RPM) y topes diarios de tokens. Los detalles aparecen en la página de cada modelo en aihubmix.com/models. En comparación con los niveles gratuitos de un único proveedor:
  • Más margen que OpenRouter: múltiples proveedores respaldan cada modelo, con failover automático cuando un upstream limita.
  • Mayor techo acumulado que Google AI Studio: en lugar de 1500 solicitudes/día en un único modelo, AIHubMix te permite distribuir el tráfico entre más de 27 modelos gratuitos.
  • Sin caducidades sorpresa: las cuotas se restablecen diariamente; sin acantilados de prueba a los 30 días.
Para tráfico en producción, el patrón recomendado es cuota de pago para la ruta crítica, modelos gratuitos para cargas auxiliares (resumen por lotes, enriquecimiento de logs, generación de borradores, funciones no críticas para los ingresos).

Preguntas frecuentes

P: ¿Por qué elegir AIHubMix frente a OpenRouter, AIMLAPI o Google AI Studio? R: AIHubMix ofrece una API unificada compatible con OpenAI que agrega más de 500 modelos globales, incluidos más de 27 modelos gratuitos actualizados continuamente, y, a diferencia de OpenRouter, el nivel gratuito incluye modelos propietarios de frontera como GPT-5.5, GPT-Image-2 y Gemini 3 (no solo código abierto). Los modelos de pago tienen precios más competitivos. La plataforma está operada oficialmente por AIHubMix, LLC (EE. UU.) con autorización formal de los principales proveedores de nube, lo que la hace confiable tanto en estabilidad como en cumplimiento. P: ¿Necesito una tarjeta de crédito para usar los modelos gratuitos de AIHubMix? R: No. Regístrate con correo electrónico u OAuth, crea una clave API y empieza a llamar. Los modelos gratuitos se pueden usar de inmediato sin ningún método de pago registrado. P: ¿Los modelos gratuitos de AIHubMix tienen un límite de tiempo o caducidad de prueba? R: Sin caducidad de prueba. Los modelos gratuitos permanecen disponibles dentro de sus respectivas cuotas por minuto y diarias de forma indefinida. Los límites se expresan como RPM y topes diarios de tokens: consulta la página de cada modelo para más detalles. P: ¿Qué modelo gratuito ofrece la mayor capacidad general de programación? R: En mayo de 2026, coding-glm-5.1-free lidera: su puntuación del 58,4 % en SWE-bench Pro supera a GPT-5.4 (57,7 %), Claude Opus 4.6 (57,3 %) y Gemini 3.1 Pro (54,2 %), lo que lo convierte en el primer modelo de código abierto en liderar la tabla SWE-bench Pro. kimi-for-coding-free destaca particularmente en la comprensión de contexto multiarchivo y la refactorización de código. P: ¿Los modelos gratuitos de AIHubMix son adecuados para producción? R: Para tráfico moderado de producción, sí, con una planificación cuidadosa de la cuota. El failover automático de AIHubMix equilibra la carga entre múltiples proveedores, aumentando la cuota efectiva disponible. Para escenarios de producción con mayor tráfico, ejecuta la inferencia principal en cuota de pago y dirige el trabajo auxiliar (resumen por lotes, análisis de logs, rutas no críticas) a modelos gratuitos para un equilibrio entre costo y estabilidad. P: ¿Puedo usar los modelos gratuitos de AIHubMix con el SDK de OpenAI para Python o Node.js? R: Sí, AIHubMix es totalmente compatible con OpenAI. Establece base_url en https://aihubmix.com/v1 y usa cualquier SDK oficial de OpenAI, integración de LangChain, pipeline de LlamaIndex o gateway de IA. No se requiere reescritura de código. P: ¿AIHubMix admite APIs gratuitas de generación de imágenes? R: Sí. La generación gratuita de imágenes incluye GPT-Image-2 (el primer modelo de imagen de OpenAI con capacidad de razonamiento, hasta 4096×4096) y Nano Banana 2 (gemini-3.1-flash-image-preview-free, 4K en 4-6 segundos). Ambos se acceden a través de endpoints estándar de chat-completions o imágenes, sin un sistema de facturación o cuota separado.

Empieza hoy

¿Listo para lanzar funciones de IA sin agotar tu runway? Regístrate en aihubmix.com, consigue una clave API gratuita y empieza a llamar a más de 27 modelos de frontera en minutos. Para guías de integración más profundas, especificaciones de rendimiento del modelo, detalles de cuota y ejemplos de SDK, consulta la documentación oficial de AIHubMix. El catálogo completo de modelos gratuitos está en aihubmix.com/models. Guías relacionadas: Configuración de Claude Code · Integración con Cherry Studio · Gateway LiteLLM · Plataforma de agentes OpenClaw · Hermes Agent para salida estructurada
Referencias y fuentes Última actualización: 7 de mayo de 2026