Saltar al contenido principal
GET
/
api
/
v1
/
models
API de gestión de modelos
curl --request GET \
  --url https://aihubmix.com/api/v1/models \
  --header 'Authorization: Bearer <token>'
{
  "data": [
    {}
  ],
  "model_id": "<string>",
  "desc": "<string>",
  "types": "<string>",
  "features": "<string>",
  "input_modalities": "<string>",
  "max_output": "<string>",
  "context_length": "<string>",
  "pricing": {},
  "pricing.input": 123,
  "pricing.output": 123,
  "pricing.cache_read": 123,
  "pricing.cache_write": 123
}

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Nueva versión de la API

Obtener información de los modelos

Endpoint: GET https://aihubmix.com/api/v1/models Descripción: Recupera información detallada de todos los modelos disponibles.

Descripción de los campos del objeto de modelo

data
array
Un array de objetos con la información de los modelos.
model_id
string
El identificador único del modelo.
desc
string
Una descripción de la funcionalidad del modelo (en inglés).
types
string
Tipo de modelo. Valores admitidos: llm (Modelo de lenguaje grande), image_generation, video, tts (Texto a voz), stt (Voz a texto), embedding, rerank.
features
string
Funciones admitidas. Valores admitidos: thinking (razonamiento), tools (uso de herramientas), function_calling, web (búsqueda web), deepsearch, long_context, structured_outputs.
input_modalities
string
Modalidades de entrada admitidas. Valores admitidos: text, image, audio, video, pdf.
max_output
string
Número máximo de tokens de salida.
context_length
string
Tamaño de la ventana de contexto (número máximo de tokens de entrada).
pricing
object
Objeto con la información de precios.
pricing.input
number
Precio de los tokens de entrada (por cada 1K tokens, en USD).
pricing.output
number
Precio de los tokens de salida (por cada 1K tokens, en USD).
pricing.cache_read
number
Precio de lectura desde caché (por cada 1K tokens, en USD, campo opcional).
pricing.cache_write
number
Precio de escritura en caché (por cada 1K tokens, en USD, campo opcional).

Ejemplos de solicitud

import requests

# API Endpoint
url = "https://aihubmix.com/api/v1/models"

response = requests.get(url)
print(response.json())

# Example with parameters
params = {
    "type": "llm",                   
	"modalities": "text",
	"model": "gpt-5",
	"features": "thinking",
    "sort_by": "context_length",
    "sort_order": "desc"    
}
response = requests.get(url, params=params)
print(response.json())

Descripción de los parámetros de la solicitud (para filtrado)

type
string
Tipo de modelo. Valores admitidos: llm (Modelo de lenguaje grande), image_generation, video, tts (Texto a voz), stt (Voz a texto), embedding, rerank.
modalities
string
Modalidades de entrada. Valores admitidos: text, image, audio, video, pdf. Admite consultas multimodalidad (separadas por comas).
model
string
Búsqueda difusa por nombre de modelo (admite coincidencia parcial).
features
string
Funciones del modelo. Valores admitidos: thinking (razonamiento), tools (uso de herramientas), function_calling, web (búsqueda web), deepsearch, long_context, structured_outputs. Admite consultas multifunción (separadas por comas).
sort_by
string
Campo de ordenación. Valores admitidos:
  • model_ratio: Ordena por relación coste-eficacia.
  • context_length: Ordena por longitud del contexto.
  • coding: Prioriza los modelos para programación.
  • order: Ordena por el orden predeterminado.
sort_order
string
Orden de clasificación. Valores admitidos:
  • asc (ascendente)
  • desc (descendente)

Ejemplo de respuesta exitosa

{
    "data": [
        {
            "model_id": "gpt-5",
            "desc": "GPT-5 is OpenAI's flagship model for coding, reasoning, and agentic tasks across domains.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        },
        {
            "model_id": "gpt-5-codex",
            "desc": "GPT-5-Codex is a version of GPT-5 optimized for autonomous coding tasks in Codex or similar environments. It is only available in the Responses API, and the underlying model snapshots will be updated regularly. https://docs.aihubmix.com/en/api/Responses-API You can also use it in codex-cll; see https://docs.aihubmix.com/en/api/Codex-CLI for using codex-cll through Aihubmix.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        }
    ],
    "message": "",
    "success": true
}

Ejemplos de escenarios de uso

GET https://aihubmix.com/api/v1/models?type=llm
Nota: Al usar la ordenación inteligente para modelos de programación, el sistema priorizará los modelos etiquetados con coding, y los demás modelos se mostrarán en el orden predeterminado.

Optimización del rendimiento

Mecanismo de caché

  • Política de caché: Caché HTTP, duración de la caché de 300 segundos (5 minutos).
  • Control de caché: Cache-Control: public, max-age=300, stale-while-revalidate=300
  • Validación de contenido: Admite validación de hash de contenido mediante ETag.

Ejemplo de uso de la caché

# Conditional request using ETag
curl -H "If-None-Match: \"abc123...\"" \
     https://aihubmix.com/api/v1/models
Si el contenido no se ha actualizado, el servidor devuelve un código de estado 304 Not Modified.

Manejo de errores

{
  "success": false,
  "message": "Invalid request parameter format"
}

Notas importantes

  1. Integridad de datos: Este endpoint devuelve todos los modelos que cumplen los criterios, sin paginación.
  2. Compatibilidad de tipos: Admite la asignación automática entre identificadores de tipo nuevos y antiguos:
    • t2tllm
    • t2iimage_generation
    • t2vvideo
    • rerankingrerank
  3. Lógica de filtrado: Múltiples condiciones de filtro se combinan con un Y lógico.
  4. Regla de ordenación: Cuando no se especifica un método de ordenación, los modelos se organizan en el orden predeterminado del sistema.

Versión heredada de la API

⚠️ Nota: Los siguientes son endpoints de la API heredada. Se recomienda utilizar la nueva versión de la API para obtener mejor rendimiento y funcionalidades.

Obtener la lista de modelos

Endpoint: GET /v1/models
  • Si el usuario ha iniciado sesión, recupera la lista de modelos disponibles para el grupo del usuario. Si no se ha iniciado sesión, recupera la lista del grupo default.
  • Si la cabecera contiene un campo Authorization, consulta la lista de modelos configurados para el token correspondiente.
Ejemplo de respuesta:
{
  "data": [
    {
      "id": "gpt-4o-mini",
      "object": "model",
      "created": 1626777600,
      "owned_by": "OpenAI",
      "permission": [
        {
          "id": "modelperm-LwHkVFn8AcMItP432fKKDIKJ",
          "object": "model_permission",
          "created": 1626777600,
          "allow_create_engine": true,
          "allow_sampling": true,
          "allow_logprobs": true,
          "allow_search_indices": false,
          "allow_view": true,
          "allow_fine_tuning": false,
          "organization": "*",
          "group": null,
          "is_blocking": false
        }
      ],
      "root": "gpt-4o-mini",
      "parent": null
    }
  ]
}

Respuesta

Código de estadoSignificadoDescripciónModelo de datos
200OKningunoEn línea

Estructura de datos de la respuesta

Código de estado 200
NombreTipoObligatorioDescripción
» data[object]trueninguno
»» idstringtrueID del modelo
»» objectstringtruemodel
»» createdintegertrueMarca temporal de creación
»» owned_bystringtrueDesarrollador
»» permission[object]¦nulltrueninguno
»»» idstringtrueninguno
»»» objectstringtrueninguno
»»» createdintegertrueninguno
»»» allow_create_enginebooleantrueninguno
»»» allow_samplingbooleantrueninguno
»»» allow_logprobsbooleantrueninguno
»»» allow_search_indicesbooleantrueninguno
»»» allow_viewbooleantrueninguno
»»» allow_fine_tuningbooleantrueninguno
»»» organizationstringtrueninguno
»»» groupnulltrueninguno
»»» is_blockingbooleantrueninguno
»» rootstringtrueNombre del modelo raíz
»» parentnulltrueModelo padre

Obtener información del modelo

Endpoint: GET /v1/models/:model

Parámetros de la solicitud

NombreUbicaciónTipoObligatorioDescripción
modelpathstringtrueID del modelo
Ejemplo de respuesta:
200 Response
{
  "id": "string",
  "object": "string",
  "created": 0,
  "owned_by": "string",
  "permission": [
    {
      "id": "string",
      "object": "string",
      "created": 0,
      "allow_create_engine": true,
      "allow_sampling": true,
      "allow_logprobs": true,
      "allow_search_indices": true,
      "allow_view": true,
      "allow_fine_tuning": true,
      "organization": "string",
      "group": null,
      "is_blocking": true
    }
  ],
  "root": "string",
  "parent": null
}

Respuesta

Código de estadoSignificadoDescripciónModelo de datos
200OKningunoEn línea

Estructura de datos de la respuesta

Código de estado 200
NombreTipoObligatorioDescripción
idstringtrueID del modelo
objectstringtruemodel
createdintegertrueMarca temporal de creación
owned_bystringtrueDesarrollador
permission[object]trueninguno
» idstringfalseninguno
» objectstringfalseninguno
» createdintegerfalseninguno
» allow_create_enginebooleanfalseninguno
» allow_samplingbooleanfalseninguno
» allow_logprobsbooleanfalseninguno
» allow_search_indicesbooleanfalseninguno
» allow_viewbooleanfalseninguno
» allow_fine_tuningbooleanfalseninguno
» organizationstringfalseninguno
» groupnullfalseninguno
» is_blockingbooleanfalseninguno
rootstringtrueNombre del modelo raíz
parentnulltrueModelo padre

Última actualización: 2026-06-01