AiHubMix Documentation Hub

2026

17 jul

Nuevos modelos

Se agrego kimi-k3: Kimi K3 es el modelo abierto de contexto largo de clase 3T de Moonshot AI, con 2,8T parametros, ventana de contexto de 1M tokens y soporte nativo para entrada visual. Es adecuado para programacion de largo horizonte, trabajo de conocimiento, razonamiento complejo y comprension multimodal. Consulte la guía práctica de Kimi K3 (ejemplos de las tres API y matriz de compatibilidad).
Se agrego hy-3d-3.1: modelo Tencent Hunyuan 3D Professional para texto a 3D, imagen a 3D y generacion 3D multivista. Es adecuado para activos de juegos, presentaciones de ecommerce, impresion 3D y diseno de productos; la version 3.1 mejora geometria y texturas y admite entrada de ocho vistas.

API de generacion 3D disponible

Se agrego la API asincrona /v1/3d/generations, inicialmente conectada a Tencent TokenHub Hunyuan 3D. Permite enviar tareas y consultar resultados, facilitando integrar generacion de activos 3D en flujos automatizados.

Compatibilidad con herramientas dinamicas de Kimi K3

Las herramientas cargadas dinamicamente a nivel de mensaje en solicitudes Kimi K3 ahora se conservan y se reenvian, evitando errores 400 upstream por declaraciones de herramientas perdidas. Los clientes que usan dynamic tool loading de Kimi tienen mejor compatibilidad.

Errores de conversion de solicitud mas claros

Mejoro la compatibilidad para custom tools de Chat Completions, bloques de texto de Cohere y solicitudes con assistant.content: null. Las solicitudes validas llegan de forma mas estable al upstream; las entradas mal formadas o no admitidas devuelven errores estructurados en vez de ser reportadas como HTTP 200 vacios.

Facturacion de imagenes Seedream actualizada

La generacion de imagenes doubao-seedream-5-0-pro ahora admite facturacion por nivel de pixeles de salida y cantidad de imagenes de entrada, de modo que las solicitudes texto-a-imagen e imagen-a-imagen se cobren mas cerca de sus especificaciones reales.

15 jul

Mejor compatibilidad de llamadas a herramientas en Gemini

Al llamar a Gemini o Vertex mediante la API compatible con OpenAI, las solicitudes cuyas definiciones de herramientas o esquemas de salida estructurada contienen valores enum de cadena vacia ya no fallan con un error 400 de validacion ascendente. Los flujos de herramientas y JSON Schema son ahora mas fiables.

14 jul

Nuevos modelos de audio

Se agrego gpt-audio-1.5, el primer modelo de audio de OpenAI disponible de forma general. Acepta entradas y salidas de audio y puede usarse mediante la API REST de Chat Completions, para conversaciones de voz, comprension de audio y generacion de audio.
Se agrego gpt-4o-transcribe-diarize, un modelo ASR con diarizacion de hablantes integrada que asocia segmentos de audio con distintos hablantes en una conversacion. Este modelo solo esta disponible en la API de Transcription.

Pagina de presentacion de LLM Router disponible

La pagina de presentacion de LLM Router ya esta disponible y muestra las puntuaciones publicas por dimension de enrutamiento y los modelos en el pool. Ademas se agregaron dos endpoints abiertos: Alcance de modelos de la estrategia de LLM Router devuelve las puntuaciones de los modelos en 5 categorias y 23 subdimensiones, los coeficientes de precio, la latencia del primer token y los modelos en el pool, e Iconos de proveedores de modelos devuelve los nombres de visualizacion y los iconos de los proveedores de modelos; las dimensiones de generacion de imagen y video aun no se incluyen. Consulta la documentacion de LLM Router (enrutamiento inteligente de modelos) para el uso.

13 jul

Respuestas de error de API mas consistentes

Cuando /v1/responses se llama con un modelo desconocido, ahora devuelve HTTP 400 no_available_channel, igual que otros puntos de entrada de la API. Asi los clientes pueden tratarlo como “sin servicio disponible” en lugar de recibir un 500.

Los fallos de validacion vuelven antes

Si falla la conversion del cuerpo o la validacion de parametros, la API devuelve directamente el 400/error correspondiente en vez de reenviar la solicitud original al servicio ascendente, reduciendo llamadas invalidas y fallos confusos.

Cache mas estable para Claude Code

Las llamadas de Claude Code a Claude a traves de Bedrock tienen ahora aciertos de prompt cache mas estables dentro de la misma sesion, lo que ayuda a bajar el coste de escrituras duplicadas y la latencia del primer token.

Mayor precision en Gemini multivuelta y cache

Las solicitudes Gemini solo permanecen en el mismo servicio cuando la respuesta contiene realmente firmas de pensamiento o actividad de cache. Esto reduce desajustes de firma o estado de cache en multivuelta, mientras que trabajos sin estado como generacion de imagen no quedan fijados innecesariamente.

10 de julio

Nuevos modelos

Se añadieron los tres modelos de la serie GPT-5.6: gpt-5.6-sol, gpt-5.6-terra y gpt-5.6-luna (lanzamiento oficial de OpenAI el 2026-07-09). Los tres niveles tienen ventana de contexto de 1.050.000, salida máxima de 128K y corte de conocimiento el 2026-02-16, admiten entrada de texto e imagen, y pueden llamarse mediante Chat Completions, Responses y la interfaz Messages compatible con Claude. Sol es el nivel insignia, orientado a trabajo profesional complejo, descrito oficialmente como el mejor modelo de programación actual; Terra tiene rendimiento equivalente a GPT-5.5 a mitad de precio; Luna está orientado a escenarios sensibles al costo.

Documentación de la caché de prompts de GPT publicada

Se añadió la documentación de Caché de prompts de GPT: desde la serie GPT-5.6, la escritura en caché se factura a 1,25 veces el precio de entrada, la lectura a 0,1 veces y la caché se conserva al menos 30 minutos; cubre la descripción de los parámetros prompt_cache_key y puntos de corte de caché explícitos, la lógica de facturación, ejemplos de la interfaz y la resolución de fallos de acierto. El criterio de caché de OpenAI en Almacenamiento en caché de prompts y Caché de prompts de Claude se actualizó en consecuencia.

Compatibilidad de thinking para Claude Fable/Mythos

Las solicitudes a Claude Fable y Mythos con reasoning_effort ahora usan adaptive thinking, reduciendo errores 400 del upstream en estas familias de modelos sin cambios del lado del cliente.

Soporte de stop sequences para Claude y Gemini

Los ajustes stop compatibles con OpenAI ahora se asignan a solicitudes nativas de Claude y Gemini. Los stops en blanco inválidos para Claude se filtran, y los límites de OpenAI/Gemini se aplican por proveedor.

Compatibilidad de límite de tokens para gpt-chat-latest

gpt-chat-latest y futuros alias latest de GPT/ChatGPT ahora conservan max_completion_tokens cuando el upstream lo requiere, reduciendo errores 400 causados por el campo antiguo max_tokens.

Mensaje más claro al agotar el límite de una Key

Cuando se agota el límite de uso de una Key, la API ahora devuelve una guía más clara para ajustar y reactivar el límite de la Key, en lugar de solo un error de quota de bajo nivel.

Formato de tool calls alineado con OpenAI

Las respuestas chat no streaming con tool_calls y sin texto ahora devuelven explícitamente content: null, mejorando la compatibilidad con SDKs y parsers estilo OpenAI.

9 de julio

Reparación de salida estructurada: corrección automática de errores de formato JSON

Se añadió la capacidad de Reparación de salida estructurada a nivel de Key, desactivada por defecto. Una vez activada, para las solicitudes no en streaming que declaran una salida JSON estructurada, cuando el JSON devuelto por el modelo presenta errores de formato como truncamiento, comas finales o envoltura en bloques de código, la pasarela lo repara automáticamente a un JSON válido y parseable antes de devolverlo, conservando los valores tal cual y sin cambios en el cliente. Compatible con los cuatro protocolos Chat Completions, Responses, Claude y Gemini; cuando se produce una reparación, la respuesta incluye la cabecera X-JSON-Repaired: true.

Documentación de la caché de prompts de Claude: umbrales mínimos de tokens por modelo completados

Se actualizó la documentación de Caché de prompts de Claude y Almacenamiento en caché de prompts con los umbrales mínimos de tokens almacenables en caché por modelo (512 / 1.024 / 2.048 / 4.096), añadiendo modelos actuales como Claude Opus 4.8, Opus 4.7 y Fable 5. El umbral no es proporcional a la versión del modelo; un prefijo por debajo del umbral no se almacena en caché ni siquiera con cache_control.

Alineacion entre dashboard de uso y detalles de liquidacion

La agregacion del dashboard de uso ahora se acerca mas a los registros de liquidacion basados en logs de solicitud, al reducir perdidas por concurrencia y unificar el bucket horario usado en reprocesos diferidos. Los datos historicos del dashboard aun pueden tener pequenas diferencias; para conciliacion y liquidacion, los logs de solicitud siguen siendo la fuente de verdad.

Nuevo modelo

Se anadio grok-4.5, un modelo para programacion, tareas agenticas y trabajo de conocimiento, con razonamiento configurable, llamadas a herramientas y ventana de contexto de 500K. Es adecuado para reparar codigo, tareas complejas de ingenieria, preguntas de conocimiento y flujos de agentes.

8 de julio

Las llamadas con tools en gpt-5.5+ se puentean automaticamente a Responses

Al usar el endpoint compatible con OpenAI /v1/chat/completions con gpt-5.5 o modelos posteriores, las solicitudes que incluyen tools y reasoning_effort ahora usan automaticamente capacidades de Responses. Esto reduce errores 400 del upstream para esa combinacion de parametros sin exigir que los clientes migren a /v1/responses. Consulta: Responses API

7 de julio

Compatibilidad de salida estructurada entre protocolos

response_format compatible con OpenAI y output_config.format nativo de Claude ahora se adaptan en las rutas relevantes. Los clientes que alternan entre protocolos estilo OpenAI y Claude pueden conservar mejor las restricciones de salida estructurada. Consulta: Structured Output.

Llamadas /v1/messages mas estables en Vertex AI

Al llamar modelos Gemini u otros no Claude mediante Vertex AI, las solicitudes /v1/messages ahora se enrutan por familia de modelo, reduciendo fallos not found o 404 provocados por rutas especificas de Claude.

6 de julio

Endpoints nativos de Gemini completados

Al usar el SDK @google/genai mediante la entrada Gemini de AIHubMix, ahora se admiten workflows nativos de embeddings, interactions create y context caching. Estas rutas antes podian devolver errores de ruta no registrada o 404; ahora sirven para generar embeddings, hacer llamadas interactivas y crear/leer/actualizar/eliminar caches. Consulta: Integracion con SDK nativo de Gemini

Ampliacion de la cobertura de facturacion por tramos para modelos de contexto largo

Modelos de contexto largo como hy3-preview, ERNIE, Grok y Mimo ahora soportan facturacion por tramos segun la longitud del contexto. El calculo de tarifas es mas preciso.

Metricas de streaming de Vertex AI corregidas

Las solicitudes streaming de Vertex AI Gemini/Claude ahora registran datos mas precisos de primer token y latencia. Los logs y el monitoreo son mas confiables; esto no cambia las respuestas del modelo.

Nuevo modelo

Se anadio tencent-hy3, un modelo de generacion de texto (Tencent Hunyuan Hy3, version oficial). Arquitectura MoE con 295B de parametros totales / 21B de parametros activos y ventana de contexto de 256K. Soporta modos de inferencia combinados rapido y lento, adecuado para razonamiento complejo, generacion de codigo y flujos de trabajo de agentes. Codigo abierto bajo la licencia Apache 2.0.

3 de julio

Jina Search/Reader ahora admite POST y subida de archivos

Jina Search y Reader ahora admiten solicitudes POST. Reader puede recibir archivos locales mediante subida multipart, incluidos PDF, Word, Excel, PPT, HTML e imágenes. Las respuestas predeterminadas se acercan más al markdown nativo de Jina; los clientes que necesiten JSON pueden enviar explícitamente Accept: application/json.

Llamadas más estables a servicios tipo Azure mediante Responses

Se corrigió un problema por el que las llamadas /v1/responses puenteadas a servicios tipo Azure no GPT podían fallar con 404 porque api-version quedaba vacío, reduciendo los fallos directos de este tipo de solicitudes.

Corrección de truncamiento en streaming

Se corrigió un caso en el que algunos upstreams tipo vLLM/Azure Foundry podían truncar respuestas streaming de forma aleatoria. Los usuarios deberían recibir con más fiabilidad respuestas completas, señales de finalización e información de uso.

Nuevo modelo: Command A Plus 05-2026

Se anadio command-a-plus-05-2026, un modelo de generacion de texto para chat, generacion de contenido y flujos de trabajo con agentes.

1 de julio

APIs de búsqueda Jina y lectura de páginas web disponibles

Se añadieron las capacidades Jina Search y Reader. Ahora puedes usar tu API Key de AIHubMix para obtener resultados de búsqueda de Jina y leer contenido de páginas web, ideal para búsqueda web externa, lectura de documentos y flujos de trabajo con herramientas de agentes. Consulta: Jina AI

Veo 3.1 imagen a vídeo admite fotogramas inicial/final e imágenes de referencia

Veo 3.1 imagen a vídeo ahora admite entradas de fotograma inicial, fotograma final e imágenes de referencia, lo que permite controlar con más precisión las escenas de inicio/final, las referencias de personajes y las referencias de estilo en flujos avanzados de generación de vídeo. Consulta: Generación de vídeo

Mejor estabilidad en reintentos multicanal de Gemini

Se mejoró la compatibilidad de las solicitudes Gemini durante reintentos entre canales, reduciendo ciertos errores 400 en escenarios de fallback y aumentando la tasa de éxito de las llamadas con failover multicanal. Consulta: Guías de Gemini

Campos de respuesta compatibles con OpenAI alineados

Las respuestas no streaming y streaming compatibles con OpenAI ahora conservan valores null en campos como logprobs, refusal y finish_reason, reduciendo diferencias para SDK, agentes y analizadores de logs que esperan la estructura estándar de OpenAI.

Mejor privacidad y compatibilidad para Claude Code

Se mejoró la compatibilidad de las solicitudes cuando Claude Code llama a modelos Claude a través de AIHubMix, reduciendo la información del entorno del cliente enviada al proveedor upstream y mejorando la protección de privacidad para clientes Agent de terceros.

Mejoras en inicio de sesión, registro y perfil

El sistema de cuentas propio cubre inicio de sesión/registro con código por correo, configuración de contraseña, edición de perfil, vinculación/desvinculación de cuentas de terceros y eliminación de cuenta, con mejor aislamiento del propósito de OTP y bloqueo de cuentas deshabilitadas. Los callbacks de recarga con Stripe también se gestionan de forma más fiable.

Nuevos modelos

claude-sonnet-5 para chat, razonamiento y flujos con agentes.
gemma-4-31b y longcat-2.0 para generación de texto.
gemini-3.1-flash-lite-image para flujos con capacidades de imagen.
mai-image-2.5 y mai-image-2.5-flash para generación de imágenes.

29 de junio

Mejoras en facturación y compatibilidad de parámetros de generación de imágenes

La facturación de gpt-image-2 en los endpoints Images ahora se unifica por tokens. La generación de imágenes GLM transmite parámetros extendidos como watermark_enabled y quality, para que los ajustes de marca de agua y calidad se apliquen cuando el proveedor upstream los soporte. Consulta: Generación de imágenes

Logs más limpios para subida de archivos Gemini

Los fallos en la subida de archivos Gemini ya no crean logs normales visibles para el usuario, reduciendo ruido de endpoints que no son de inferencia en la página de logs, mientras se conservan los logs internos de diagnóstico.

27 de junio

Nuevos modelos Deep Research

Se añadieron o4-mini-deep-research y o3-deep-research, disponibles solo mediante el endpoint /v1/responses. Las solicitudes deben incluir web_search_preview o mcp tools, por lo que son adecuados para investigación web profunda y respuestas de tipo research.

25 de junio

El protocolo Responses admite cualquier modelo

El endpoint /v1/responses ya no se limita a la serie GPT y ahora puede invocar cualquier modelo de la plataforma. Gracias a ello, las herramientas basadas en el protocolo Responses (como Codex CLI) pueden usar modelos como GLM, Gemini, DeepSeek, Kimi o Qwen a través de un catálogo de modelos local, sin limitarse a los modelos propios de OpenAI.

Corrección de salida de Responses para Step 3.7 Flash

Se corrigió un problema por el que step-3.7-flash podía devolver contenido en blanco o una respuesta vacía a través de /v1/responses; el contenido de razonamiento y las respuestas finales ahora se devuelven correctamente.

Codex CLI ahora admite modelos personalizados

Se ha añadido un nuevo tutorial «Usar modelos personalizados en Codex» a la documentación de Codex CLI: declara cualquier modelo de AIHubMix (GLM, Gemini, DeepSeek, Kimi, Qwen, etc.) mediante un catálogo de modelos local (model_catalog_json) y cámbialo libremente desde la lista /model de Codex, sin limitarte a los modelos propios de OpenAI. Incluye un script de un solo comando para generar un catálogo con los 30 modelos principales y notas sobre los errores más comunes. Más información: Codex CLI · Usar modelos personalizados en Codex

24 de junio

Ahora se admite un dominio de respaldo

Se agregó el dominio de respaldo https://api.inferera.com, con endpoints y capacidades idénticos al dominio principal https://aihubmix.com. Cuando el dominio principal no esté disponible (por ejemplo, fallos de conexión o tiempos de espera), reemplaza la URL de la solicitud por el dominio de respaldo; la API Key, el modelo, el cuerpo de la solicitud y los demás parámetros se mantienen igual.

23 de junio

Nuevos modelos

Doubao doubao-seed-2-1-pro, doubao-seed-2-1-turbo.
Serie de vídeo HappyHorse happyhorse-1.1-t2v (texto a vídeo), happyhorse-1.1-r2v (generación por referencia), happyhorse-1.1-i2v (imagen a vídeo).

Mejor experiencia de pago con Stripe

El checkout de Stripe ahora prerrellena el correo de la cuenta y reduce la recopilación innecesaria de nombre y dirección de facturación, haciendo más fluida la recarga con métodos como Alipay.

Límite para cuentas con saldo negativo

Cuando el saldo de la cuenta sea inferior a -$1, no se podrán seguir usando modelos gratuitos hasta recargar la cuenta.

22 de junio

Nueva documentación de AIHubMix CLI (herramienta de línea de comandos)

Nueva documentación de AIHubMix CLI: un único binario sin dependencias (no requiere Python / Node / Go) para consultar el saldo de la cuenta, gestionar claves API y ver los modelos disponibles directamente en el terminal, con salida amigable para scripts y agentes de IA (como Claude Code).

LLM Router (enrutamiento inteligente de modelos)

Establece model en auto y la pasarela analiza tu solicitud para elegir el mejor modelo entre cientos, con políticas de coste / calidad / latencia, facturado según el modelo realmente usado, sin cambios en el código del cliente. Consulta: LLM Router (enrutamiento inteligente de modelos)

Corrección de la tasa de acierto de caché de DeepSeek

Se corrigió un problema por el que la tasa de acierto de caché de deepseek-v4-pro y deepseek-v4-flash era inferior a lo esperado.

Nueva AIHubMix Skill (extensión para asistentes de programación con IA)

Aporta capacidades de extensión local a agentes de IA compatibles con Skills (Codex, Claude Code, Cursor, Cline, etc.): integra AIHubMix, consulta modelos, elige según capacidad, genera ejemplos y resuelve errores usando lenguaje natural. La Skill lee bajo demanda información en tiempo real (modelos, precios, contratos de protocolo, etc.) desde las interfaces oficiales, evitando que el agente dependa de memoria desactualizada. Más información: Skills

17 de junio

Nuevos modelos de vídeo Kling (可灵)

Integración de todas las capacidades de generación de vídeo de Kling: texto a vídeo, imagen a vídeo, referencia con múltiples imágenes y generación multimodal omni, invocadas mediante el protocolo nativo según el nombre del modelo.

16 de junio

Problema del plugin de integración de OpenClaw corregido

El plugin de integración de OpenClaw de AIHubMix aihubmix-auth ha corregido sus problemas de integración anteriores y ahora es estable. Simplemente instálalo e introduce una clave AIHubMix para llamar simultáneamente a los modelos OpenAI / Anthropic / Gemini en OpenClaw.

Nuevos modelos

Zhipu glm-5.2.

15 de junio

Nuevo soporte de integración con Open Design

AIHubMix ya es un gateway BYOK con soporte integrado en Open Design (la alternativa de código abierto y local-first a Claude Design). En su modo API (BYOK) selecciona AIHubMix, introduce una Key y podrás impulsar a la vez la generación de chat / imágenes / vídeo / voz, enrutando según el nombre del modelo por el protocolo nativo de cada proveedor. Más información: Tutorial de integración con Open Design

Zhipu GLM 5.2 admite niveles de intensidad de razonamiento

El modelo glm-5.2 del canal nativo de Zhipu admite el ajuste de la profundidad de razonamiento por niveles mediante reasoning_effort; las versiones anteriores se enrutan automáticamente según su versión, sin que el cliente tenga que hacer cambios.

Nuevos modelos

kimi-k2.7-code-highspeed (versión de alta velocidad de código de Kimi).

13 de junio

Nuevos modelos

coding-glm-5.2 y su versión gratuita coding-glm-5.2-free.

12 de junio

Mapeo de modelos y fallback ante errores

Nuevo: Model Mapping y Fallback ante errores: Configura el mapeo de nombres de modelo y el fallback ante errores por API Key en la consola: reescribe el alias de modelo del cliente al modelo upstream real, cambia automáticamente a un modelo de respaldo cuando el modelo principal falla y factura según el modelo que finalmente responde, sin cambios en el código del cliente. Consulta: Model Mapping y Fallback

Nuevos modelos

kimi-k2.7-code.

11 de junio

step-3.7-flash con un 90 % de descuento por tiempo limitado

Oferta por tiempo limitado de step-3.7-flash con un 90 % de descuento: solo 0,022 USD por millón de tokens de entrada y 0,132 USD por millón de tokens de salida. ¡Te invitamos a probarlo!

Retirada de modelos y enrutamiento automático

claude-opus-4-20250514 y claude-sonnet-4-20250514 serán retirados oficialmente el 15 de junio; llegado ese momento, la plataforma enrutará automáticamente los modelos retirados a la versión 4-5 de la misma serie.

10 de junio

Nuevos modelos

claude-fable-5 [Retirado].

Notas sobre los nuevos modelos Claude Fable 5 / Mythos 5

Fable 5 tiene barreras de seguridad más estrictas, por lo que algunas solicitudes normales también pueden bloquearse: aplica clasificaciones adicionales en áreas como ciberseguridad, biología / química, destilación de modelos y extracción de razonamiento. Algunas investigaciones técnicas, análisis de vulnerabilidades o preguntas biomédicas pueden rechazarse o redirigirse a Opus 4.8.
Mythos 5 tiene acceso restringido y no es un modelo abierto al público general: Mythos 5 y Fable 5 comparten la misma fuente de capacidades, pero Mythos 5 usa menos clasificadores de seguridad. Actualmente solo está disponible para Project Glasswing / clientes aprobados; la mayoría de usuarios usará Fable 5 con protecciones.
Coste de API más alto: Fable 5 cuesta 10 USD por millón de tokens de entrada y 50 USD por millón de tokens de salida, aproximadamente el doble que Opus 4.8.
Privacidad: Fable 5 / Mythos 5 se clasifican como Covered Models, requieren por defecto al menos 30 días de retención de datos y no admiten Zero Data Retention.
Comportamiento de rechazo en la API: cuando Fable 5 rechaza una solicitud, la API devuelve HTTP 200, pero stop_reason es refusal.

8 de junio

La interfaz compatible con Gemini admite entrada de audio

Al llamar a Gemini a través de la interfaz compatible con OpenAI (/v1/chat/completions), ahora se admite la entrada de audio input_audio (que antes se descartaba silenciosamente), y se incluye el cómputo de audio_tokens en el campo usage de la respuesta.

5 de junio

Nuevos modelos

grok-build-0.1, hy3-preview y el modelo gratuito step-3.7-flash-free.

4 de junio

Nuevos modelos

Tongyi Qianwen qwen3.7-plus.

1 de junio

Nuevos modelos

MiniMax minimax-m3.
Baidu musesteamer-air-image (generación de imágenes).

29 de marzo

Página de detalle de registros

Latencia: Indica con qué rapidez se inicia una solicitud (tiempo desde el inicio de la solicitud hasta el primer token devuelto)
Rendimiento (Throughput): Proporciona una medida clara de la velocidad de salida del modelo
Latencia E2E: El tiempo total desde el envío hasta la finalización de la solicitud, utilizado para evaluar el rendimiento global de la solicitud
Proveedor: Identifica al proveedor del modelo que gestionó la solicitud
Estado: Muestra el resultado de la ejecución (p. ej., éxito / fallo) para detectar anomalías rápidamente
TID: Un identificador único de la solicitud que puedes compartir con soporte para resolver problemas más rápido

23 de marzo

La red de aceleración global de AIHubMix ya está disponible: construida sobre nodos perimetrales globales autogestionados y un sistema de enrutamiento inteligente, con monitorización continua y optimización dinámica, logrando un 75 % menos de latencia, un 60 % de mejora en la estabilidad y una disponibilidad del 99,99 %, ofreciendo una experiencia de IA más rápida y fiable.
Añadida la monitorización de salud en tiempo real 24/7: sondas distribuidas escanean toda la red cada minuto, rastreando la latencia, la tasa de éxito y la estabilidad. Los problemas se detectan y resuelven antes de que los usuarios lo noten, garantizando un rendimiento constante.
Enrutamiento inteligente del tráfico mejorado: la salud de los nodos se evalúa dinámicamente en múltiples ventanas de tiempo, permitiendo el cambio en milisegundos a la ruta óptima, reduciendo significativamente las fluctuaciones y los timeouts a la vez que mejora las tasas globales de éxito de las solicitudes.

8 de febrero

Nueva función: compatibilidad Chat → Responses
Esta versión introduce la compatibilidad Chat → Responses, permitiendo que la API Chat Completions invoque modelos de OpenAI que solo admiten el protocolo Responses, incluidos gpt-5.2-codex, gpt-5.1-codex-max y gpt-5.2-pro. Si quieres forzar que la Chat API de AIHubmix enrute las solicitudes a través del protocolo Responses, añade la siguiente cabecera a tu solicitud:
X-Use-Responses-Enabled: true Cuando un modelo admite tanto Chat como Responses, configurar esta cabecera forzará el uso de la Responses API.
Ten en cuenta que el protocolo Responses actualmente no admite entrada ni salida de audio, así que planifica el uso en consecuencia.
Aviso de obsolescencia de modelo:
OpenAI dejará de admitir chatgpt-4o-latest el 17 de febrero de 2026. Tras su retirada, redirigiremos automáticamente chatgpt-4o-latest a gpt-4o-2024-11-20.

2025

15 de diciembre

Nueva función: la API de Google ahora admite Files API.

22 de septiembre

Añadido soporte para la serie Qwen, Doubao Seedream 4 y los modelos de generación de imágenes de Baidu

10 de agosto

Lanzado el MCP de generación de imágenes de Aihubmix, facilitando a los desarrolladores la integración de servicios de generación de imágenes

1 de agosto

Usa cualquier modelo de lenguaje grande de la plataforma AiHubMix directamente en Claude Code

29 de julio

Añadido soporte para el AI SDK: accede a un gran número de modelos con una sola clave API

26 de julio

Añadido soporte para la API de generación de imágenes Flux, que permite imágenes de alta calidad en segundos

23 de julio

Añadido soporte para Qwen Code, aprovechando todos los modelos de lenguaje grandes disponibles en la plataforma Aihubmix

4 de julio

Añadido soporte para llms.txt: obtén navegación estandarizada por modelos con un clic para que tu asistente LLM pueda entender rápidamente todo el ecosistema de modelos

29 de junio

Añadido soporte de reenvío para Gemini CLI, con varios modos de uso flexibles
Añadidos el code interpreter y la invocación de MCP remoto en la API Responses de OpenAI

26 de junio

Añadida una API unificada de generación de imágenes que admite los principales modelos, incluidos OpenAI, Ideogram, Stability y Google Imagen

23 de junio

Lanzado APP-Code, que ofrece a los desarrolladores un descuento del 10 % en todos los modelos

18 de junio

Añadida la documentación de Códigos de estado HTTP para ayudar a los usuarios a entender mejor los mensajes de error

13 de junio

Añadido soporte para la generación de vídeo Veo 3.0 para ampliar los formatos creativos

12 de junio

Integrado Claude Code para un uso estable en China continental

9 de junio

Añadido soporte para los resúmenes de razonamiento de OpenAI en la Responses API

5 de junio

Añadida caché implícita para Gemini, con aciertos automáticos y feedback de acierto
Los desarrolladores pueden usar usage_metadata para determinar los aciertos de caché
No se garantizan ahorros de costos y dependen de la estructura de la solicitud y de los escenarios de uso

31 de mayo

Soporte completo para las nuevas funciones de Claude 4

⏳ Nuevo TTL de caché: soporte de caché de 1 hora ^Beta
🎉 Nuevas herramientas de edición de texto: Claude 4 ahora admite text_editor_20250429 y str_replace_based_edit_tool
🚫 Nuevo motivo de detención por rechazo para rechazos por seguridad
🧠 Extended Thinking: Claude 4 ahora devuelve resúmenes completos de su proceso de razonamiento
🔄 Interleaved Thinking: el uso de herramientas ahora puede intercalarse con el razonamiento extendido para conversaciones más naturales (Beta)
⚠️ Funciones obsoletas:
- undo_edit ya no se admite
- token-efficient-tools-2025-02-19 eliminado (solo Claude 3.7)
- output-128k-2025-02-19 eliminado (solo Claude 3.7)
📚 Las guías completas de migración y los ejemplos de código se han actualizado para ayudar a los usuarios a hacer una transición fluida de Claude 3.7 a Claude 4

22 de mayo

Añadido soporte para el plugin de Dify, permitiendo la integración fluida de los modelos de Aihubmix en Dify
Amplía y gestiona más de 200 modelos con una sola clave API

17 de mayo

Añadido soporte para codex-mini-latest, optimizado para tareas de programación, accesible a través de la Responses API o de Codex CLI
Añadido soporte para la generación de imágenes Google Imagen 3.0 y la generación de vídeo Veo 2.0
gemini-2.0-flash-exp actualizado a la versión preview oficial gemini-2.0-flash-preview-image-generation

9 de mayo

Añadida la API de Ideogram AI V3: el modelo más avanzado de generación de imágenes de Ideogram

6 de mayo

Añadidos scripts de utilidades de gestión para gestionar claves API, ver cuentas y listar los modelos disponibles desde la CLI

26 de abril

La esperada API de generación de imágenes de OpenAI gpt-image-1 ya está disponible, con soporte de texto a imagen e imagen a imagen
Añadido soporte nativo para la API de Gemini con control preciso del presupuesto de razonamiento para Flash 2.5

24 de abril

Integradas tres APIs principales de Jina AI para ayudar a construir agentes potentes: Embeddings, Rerank y DeepSearch

20 de abril

Añadido soporte para el endpoint de la API Responses de OpenAI con capacidades de herramientas ampliadas

17 de abril

Añadido soporte para la CLI de OpenAI CodeX: programa con lenguaje natural directamente desde la terminal

12 de abril

Añadiendo :surfing al ID de un modelo, cualquier modelo puede adquirir capacidades de búsqueda (Beta)

9 de abril

Añadida la caché de prompts de Claude, ahorrando hasta un 76 % en costos para prompts repetidos de alta frecuencia

7 de abril

Añadido soporte para la generación de imágenes de Ideogram AI con sólido renderizado de texto, generación híbrida, edición local y upscaling

5 de abril

Lanzada una experiencia de documentación totalmente renovada

30 de marzo

Añadido soporte para la herramienta Claude Text Edit Tool

24 de marzo

Lanzado el nuevo logotipo del Tridente

16 de marzo

Añadido soporte de búsqueda nativa para los modelos OpenAI y Google Gemini
La integración de búsqueda de terceros se añadirá en futuras actualizaciones

15 de marzo

Modelos añadidos: gpt-4o-mini-search-preview y gpt-4o-search-preview

7 de marzo

Los precios de o1 y o3-mini se han reducido un 10 %, en línea con los precios oficiales

6 de marzo

Debido a un aumento de precios upstream de 7× por parte de Microsoft, el precio de aihubmix-DeepSeek-R1 también aumentó 7×
Alternativa recomendada: DeepSeek-R1 de Volcano Engine (más estable y rentable)
Modelos añadidos: qwen-qwq-32b y qwen2.5-vl-72b-instruct

28 de febrero

Todos los modelos Claude han recibido una reducción de precio del 15 %
Modelo añadido gpt-4.5-preview (extremadamente caro; úsalo con precaución)

26 de febrero

Mejora de la estabilidad de DeepSeek
Las versiones de ByteDance de DeepSeek son actualmente las más estables
Modelos recomendados: DeepSeek-R1 y DeepSeek-V3

25 de febrero

Modelo añadido: claude-3-7-sonnet-20250219

24 de febrero

El modelo gpt-4o puede responder ocasionalmente muy lento debido a problemas del proveedor upstream
Se recomienda cambiar temporalmente a gpt-4o-2024-11-20
La API de Perplexity está temporalmente fuera de línea
Debido al modelo de facturación complejo de Perplexity y a sus costos más altos que la estructura de precios de esta plataforma, el servicio se relanzará tras los ajustes de precios
El descuento oficial temporal de ByteDance ha finalizado y los precios han vuelto a la normalidad
El precio de DeepSeek-R1 se ha incrementado en consecuencia
Añadida una nueva página de detalles del modelo con información completa de parámetros

23 de febrero

El descuento oficial temporal de ByteDance ha finalizado y los precios han vuelto a la normalidad
El precio de DeepSeek-V3 se ha incrementado
También se espera que el modelo R1 de ByteDance vuelva pronto a los precios normales, y esta plataforma ajustará los precios en consecuencia

18 de febrero

Modelo añadido: kimi-latest
(La facturación oficial se escalona por longitud de entrada en 8k, 32k y 128k.
Esta plataforma no admite precios escalonados y utiliza la franja intermedia de 32k como estándar de precio.
Si eres sensible al precio, úsalo con precaución.)
Optimización general del diseño del sitio web
Fusionada la página de Registro de cambios en la página de Estadísticas de uso
Movidos los anuncios a la página del Marketplace de modelos
Movidos los ajustes al menú del avatar del usuario
Reducido el precio de aihubmix-DeepSeek-R1 un 50 %
Modelos añadidos:
gemini-2.0-pro-exp-02-05-search, gemini-2.0-flash-exp-search
(Integrados con la búsqueda en línea oficial de Google)
Modelos añadidos:
gemini-2.0-flash, gemini-2.0-pro-exp-02-05, gemini-2.0-flash-lite-preview-02-05
Modelos añadidos:
o3-mini, o1
(Estos dos modelos se facturan aproximadamente un 10 % por encima del precio oficial debido a los recursos limitados de la cuenta)

4 de febrero

El modelo o1 no admite el parámetro stream en la API oficial de OpenAI
El modelo o3-mini no admite el parámetro temperature
Está disponible un nuevo parámetro reasoning_effort con los valores: "low", "medium", "high"
El valor predeterminado es "medium" si no se especifica

1 de febrero

Actualización de funciones:

Añadido soporte para entrada y salida de audio del modelo de OpenAI
El servidor de previsualización api.aihubmix.com ya está disponible
Tras una semana de funcionamiento estable, se actualizará el sitio principal
La facturación de backend es totalmente coherente con los precios oficiales
Actualmente, los registros de uso solo muestran el uso de tokens de texto
El uso de tokens de audio aún no se muestra en los registros, pero no afecta al uso normal

Nuevos modelos añadidos:

o3-mini, o1
(Facturados aproximadamente un 10 % por encima del precio oficial debido a la disponibilidad limitada de cuentas)
aihubmix-DeepSeek-R1 (recomendado, altamente estable)
qwen-max-0125 (Qwen2.5-Max), sonar-reasoning
deepseek-ai/DeepSeek-R1-Zero, deepseek-ai/DeepSeek-R1, deepseek-r1-distill-llama-70b
aihub-Phi-4
Doubao-1.5-pro-256k, Doubao-1.5-pro-32k,
Doubao-1.5-lite-32k, Doubao-1.5-vision-pro-32k
sonar, sonar-pro (lo último de Perplexity AI)
gemini-2.0-flash-thinking-exp-01-21
deepseek-reasoner (alias de DeepSeek-R1)
MiniMax-Text-01
codestral-latest (el nuevo modelo de código de Mistral, Codestral 25.01)

23 de enero

Nuevos modelos añadidos:

aihub-Phi-4
Doubao-1.5-pro-256k, Doubao-1.5-pro-32k,
Doubao-1.5-lite-32k, Doubao-1.5-vision-pro-32k
sonar, sonar-pro (lo último de Perplexity AI)
gemini-2.0-flash-thinking-exp-01-21
deepseek-reasoner (alias de DeepSeek-R1)

19 de enero

Añadidos los modelos de la API de Perplexity AI
Actualmente solo se admiten en el servidor de previsualización api.aihubmix.com
Tras pruebas estables, se desplegará en el servidor principal aihubmix.com
api.aihubmix.com es el servidor de previsualización
Las nuevas funciones se desplegarán allí primero y se promocionarán al servidor principal tras aproximadamente 1 semana de pruebas de estabilidad

Nuevos modelos añadidos:

MiniMax-Text-01
codestral-latest (Mistral Codestral 25.01)
gpt-4o-zh
Traduce automáticamente cualquier idioma de entrada al inglés antes de la inferencia,
y traduce automáticamente la salida del modelo de vuelta al chino
(Esta función está en pruebas y solo admite gpt-4o; no se admite alta concurrencia)

6 de enero

Añadido gemini-2.0-flash-exp-search, con soporte para la búsqueda en línea nativa de Google
El modelo oficial Gemini 2.0 Flash requiere parámetros adicionales para la búsqueda en línea
Aihubmix ha integrado esta funcionalidad: basta con añadir search al nombre del modelo
Modelo añadido: deepseek-ai/DeepSeek-V3

1 de enero

Lanzada la nueva página del Marketplace de modelos para reemplazar la antigua página de Modelos y Precios

2024

30 de diciembre

Corregido el problema por el que gemini-2.0-flash-thinking-exp-1219 solo devolvía el razonamiento sin respuestas finales
Corregido el problema de no entrega de correos de recordatorio de saldo

22 de diciembre

Añadida la página de Estadísticas de uso
Añadida la página de Historial de recargas
Añadidos modelos de la serie Doubao:
Doubao-lite-128k, Doubao-lite-32k, Doubao-lite-4k,
Doubao-pro-128k, Doubao-pro-256k, Doubao-pro-32k, Doubao-pro-4k
Modelo añadido: gemini-2.0-flash-thinking-exp-1219
Modelos añadidos:
gemini-2.0-flash-exp, aihubmix-Mistral-Large-2411,
aihubmix-Llama-3-3-70B-Instruct, grok-2-1212, grok-2-vision-1212
Modelos añadidos:
gemini-exp-1206, llama-3.3-70b-versatile, learnlm-1.5-pro-experimental

14 de diciembre

Modelos añadidos:
gemini-2.0-flash-exp, aihubmix-Mistral-Large-2411,
aihubmix-Llama-3-3-70B-Instruct

8 de diciembre

Modelos añadidos:
gemini-exp-1206, llama-3.3-70b-versatile, learnlm-1.5-pro-experimental
Añadida la página de Estadísticas de uso

21 de noviembre

Modelos añadidos recientemente:
gpt-4o-2024-11-20, step-2-16k, grok-vision-beta
Modelo Qwen 2.5 Turbo de un millón de tokens de contexto:
qwen-turbo-2024-11-01

7 de noviembre

Añadida compatibilidad con el SDK nativo de Claude
El endpoint v1/messages ya está activo
La caché de prompts nativa de Claude y las funciones de uso del ordenador aún no se admiten
Estas se completarán en las próximas dos semanas

5 de noviembre

Modelo añadido: claude-3-5-haiku-20241022
Añadido el último modelo de xAI de Elon Musk: grok-beta

23 de octubre

Modelo añadido: claude-3-5-sonnet-20241022

10 de octubre

La última función de caché de OpenAI ya está disponible
Modelos actualmente admitidos:
- GPT-4o
- GPT-4o-mini
- o1-preview
- o1-mini
Nota: gpt-4o-2024-05-13 no está incluido en la lista oficial admitida
Los tokens con acierto de caché serán visibles en los registros del backend cuando una solicitud acierte en la caché
Para más detalles y reglas de uso, consulta la documentación oficial de OpenAI

3 de octubre

La facturación de backend para gpt-4o se ha reducido para coincidir con el precio oficial
Modelos añadidos:
aihubmix-Llama-3-2-90B-Vision, aihubmix-Llama-3-70B-Instruct
Añadidos los últimos modelos de Cohere:
aihubmix-command-r-08-2024, aihubmix-command-r-plus-08-2024

19 de septiembre

Modelos añadidos: whisper-large-v3 y distil-whisper-large-v3-en
Nota: La facturación de los modelos Whisper se basa en los segundos de entrada
La visualización de precios actual en el sitio es incorrecta y se corregirá
La facturación de backend para whisper-1 coincide totalmente con los precios oficiales de OpenAI

13 de septiembre

Modelos añadidos: o1-mini y o1-preview
Nota: Estos modelos requieren parámetros actualizados
Algunas shells de cliente pueden lanzar errores si no se actualizan los valores predeterminados

Los resultados de las pruebas muestran que el modelo o1 NO admite:

campo system → error 400
campo tools → error 400
entrada de imagen → error 400
salida json_object → error 500
salida structured → error 400
salida logprobs → error 403
salida stream → error 400

Límites de tasa y parámetros fijos:

Serie o1: 20 RPM, 150.000.000 TPM, extremadamente bajos, posibles errores 429 frecuentes
temperature, top_p y n están fijados en 1
presence_penalty y frequency_penalty están fijados en 0

10 de septiembre

Modelo añadido: mattshumer/Reflection-Llama-3.1-70B
(Se ha informado que es una de las versiones ajustadas más potentes de LLaMA 3.1 70B)
Los precios del modelo Claude-3 han aumentado
Para garantizar un suministro estable, las llamadas a través de esta plataforma son actualmente ~10 % más caras que el uso oficial directo
Aumentada la capacidad de concurrencia para los modelos OpenAI
El sistema ahora admite teóricamente una concurrencia casi ilimitada

11 de agosto

Modelos añadidos:
Phi3medium128k, ahm-Phi-3-medium-4k, ahm-Phi-3-small-128k
Mejora de la estabilidad para modelos relacionados con LLaMA
Optimizada aún más la compatibilidad para los modelos Claude

7 de agosto

Añadido el nuevo gpt-4o-2024-08-06 lanzado por OpenAI
Consulta: https://platform.openai.com/docs/guides/structured-outputs
Añadido el último modelo de Google: gemini-1.5-pro-exp-0801

4 de agosto

Añadido pago directo en línea para recargas de cuenta
Corregido el error de formato de conversación multiturno de Claude:
messages: roles must alternate between "user" and "assistant", but found multiple "user" roles in a row
Optimizado el manejo de índices al usar function calling con modelos Claude
El servidor de respaldo https://orisound.cn quedará totalmente fuera de servicio el 7 de septiembre
Migra al servidor principal https://aihubmix.com o al servidor de respaldo https://api.aihubmix.com

27 de julio

Añadido soporte para Mistral Large 2
Nombre del modelo: Mistral-large-2407 o aihubmix-Mistral-large-2407
Optimizaciones del sistema

24 de julio

Añadidos los modelos más recientes de LLaMA 3.1:
llama-3.1-405b-instruct, llama-3.1-70b-versatile, llama-3.1-8b-instant

20 de julio

Corregidos problemas de cálculo de precios para el modelo gpt-4o-mini
- Precio de entrada de texto: 1/33 del de GPT-4o oficial
- Precio de entrada de imagen: igual al de GPT-4o
Para alinearse con los precios oficiales, los recuentos de tokens de imagen para gpt-4o-mini se multiplican por 33 durante la facturación
Consulta los precios oficiales de OpenAI para más detalles

19 de julio

Añadido soporte para el modelo gpt-4o-mini
La facturación de backend está totalmente alineada con los precios oficiales

15 de julio

Añadido soporte para el parámetro oficial include_usage de la API
Esto permite devolver datos de uso en modo stream
Consulta la documentación oficial para más detalles

14 de julio

La nueva versión de NextWeb ahora admite llamar a modelos que no son de OpenAI a través de esta plataforma
Añadido soporte de facturación de backend para los modelos Qwen de Alibaba
Las llamadas a través de esta plataforma cuestan ~10 % más que el uso directo de Alibaba Cloud
Mejorada la compatibilidad de salida de Azure OpenAI con la API estándar de OpenAI
Añadido soporte de tool calling para Claude-3
Añadidos muchos modelos nuevos (consulta Settings → Available Models)

3 de julio

Optimización general de la UI del backend
Cada entrada del registro ahora muestra el precio unitario del modelo en el momento de la solicitud
Añadida la página de Modelos y Precios

20 de junio

El nuevo claude-3-5-sonnet-20240620 ya es compatible
Consulta la guía para llamar a modelos que no son de OpenAI en esta plataforma

18 de junio

Los registros del backend ahora admiten la descarga de registros históricos de solicitudes

16 de junio

La probabilidad de enrutar aleatoriamente solicitudes a Azure OpenAI se ha reducido significativamente

13 de junio

Reducidos los costos de backend para los modelos Claude-3
(Claude 3 Haiku, Claude 3 Sonnet, Claude 3 Opus)
La facturación de backend ahora coincide con los precios oficiales
Como resultado, el costo efectivo de la API minorista en este sitio equivale a ~86 % del precio oficial

10 de junio

Optimizada la facturación de tokens de GPT-4o
El tokenizador se ha cambiado de cl100k_base a o200k_base
Como resultado, los recuentos de tokens en streaming para chino, coreano y japonés son menores que antes

8 de junio

Añadidos los últimos modelos open source Qinwen 2 de Alibaba:
- alibaba/Qwen2-7B-Instruct
- alibaba/Qwen2-57B-A14B-Instruct
- alibaba/Qwen2-72B-Instruct

20 de mayo

Modelo añadido: gemini-1.5-flash
Modelo añadido: gpt-4o
Modelos añadidos:
llama3-70b-8192, llama3-8b-8192,
gemini-1.5-pro, command-r, command-r-plus
El suministro del modelo Claude-3 se ha restaurado
Los endpoints están desplegados actualmente en AWS y Google Cloud
Para cubrir los costos de infraestructura y operativos, la facturación de backend de Claude-3 es ~10 % superior al precio oficial
Con el aumento de uso, esto se reducirá gradualmente a ~5 % o menos
Los límites de concurrencia están actualmente en pruebas y se incrementarán a medida que aumente la demanda

Última actualización: 2026-06-22

​2026

​17 jul

​15 jul

​14 jul

​13 jul

​10 de julio

​9 de julio

​8 de julio

​7 de julio

​6 de julio

​3 de julio

​1 de julio

​29 de junio

​27 de junio

​25 de junio

​24 de junio

​23 de junio

​22 de junio

​17 de junio

​16 de junio

​15 de junio

​13 de junio

​12 de junio

​11 de junio

​10 de junio

​8 de junio

​5 de junio

​4 de junio

​1 de junio

​29 de marzo

​23 de marzo

​8 de febrero

​2025

​15 de diciembre

​22 de septiembre

​10 de agosto

​1 de agosto

​29 de julio

​26 de julio

​23 de julio

​4 de julio

​29 de junio

​26 de junio

​23 de junio

​18 de junio

​13 de junio

​12 de junio

​9 de junio

​5 de junio

​31 de mayo

​22 de mayo

​17 de mayo

​9 de mayo

​6 de mayo

​26 de abril

​24 de abril

​20 de abril

​17 de abril

​12 de abril

​9 de abril

​7 de abril

​5 de abril

​30 de marzo

​24 de marzo

​16 de marzo

​15 de marzo

​7 de marzo

​6 de marzo

​28 de febrero

​26 de febrero

​25 de febrero

​24 de febrero

​23 de febrero

​18 de febrero

​4 de febrero

​1 de febrero

​23 de enero

​19 de enero

​6 de enero

​1 de enero

2026

17 jul

15 jul

14 jul

13 jul

10 de julio

9 de julio

8 de julio

7 de julio

6 de julio

3 de julio

1 de julio

29 de junio

27 de junio

25 de junio

24 de junio

23 de junio

22 de junio

17 de junio

16 de junio

15 de junio

13 de junio

12 de junio

11 de junio

10 de junio

8 de junio

5 de junio

4 de junio

1 de junio

29 de marzo

23 de marzo

8 de febrero

2025

15 de diciembre

22 de septiembre

10 de agosto

1 de agosto

29 de julio

26 de julio

23 de julio

4 de julio

29 de junio

26 de junio

23 de junio

18 de junio

13 de junio

12 de junio

9 de junio

5 de junio

31 de mayo

22 de mayo

17 de mayo

9 de mayo

6 de mayo

26 de abril

24 de abril

20 de abril

17 de abril

12 de abril

9 de abril

7 de abril

5 de abril

30 de marzo

24 de marzo

16 de marzo

15 de marzo

7 de marzo

6 de marzo

28 de febrero

26 de febrero

25 de febrero

24 de febrero

23 de febrero

18 de febrero

4 de febrero

1 de febrero

23 de enero

19 de enero

6 de enero

1 de enero