Passer au contenu principal
GET
/
api
/
v1
/
models
API de gestion des modèles
curl --request GET \
  --url https://aihubmix.com/api/v1/models \
  --header 'Authorization: Bearer <token>'
{
  "data": [
    {}
  ],
  "model_id": "<string>",
  "desc": "<string>",
  "types": "<string>",
  "features": "<string>",
  "input_modalities": "<string>",
  "max_output": "<string>",
  "context_length": "<string>",
  "pricing": {},
  "pricing.input": 123,
  "pricing.output": 123,
  "pricing.cache_read": 123,
  "pricing.cache_write": 123
}

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Nouvelle version de l’API

Obtenir les informations sur les modèles

Endpoint : GET https://aihubmix.com/api/v1/models Description : récupère les informations détaillées de tous les modèles disponibles.

Description des champs de l’objet modèle

data
array
Tableau d’objets d’information sur les modèles.
model_id
string
Identifiant unique du modèle.
desc
string
Description des fonctionnalités du modèle (en anglais).
types
string
Type de modèle. Valeurs prises en charge : llm (grand modèle de langage), image_generation, video, tts (synthèse vocale), stt (reconnaissance vocale), embedding, rerank.
features
string
Fonctionnalités prises en charge. Valeurs prises en charge : thinking (raisonnement), tools (utilisation d’outils), function_calling, web (recherche web), deepsearch, long_context, structured_outputs.
input_modalities
string
Modalités d’entrée prises en charge. Valeurs prises en charge : text, image, audio, video, pdf.
max_output
string
Nombre maximal de jetons de sortie.
context_length
string
Taille de la fenêtre de contexte (nombre maximal de jetons d’entrée).
pricing
object
Objet contenant les informations tarifaires.
pricing.input
number
Prix par jeton d’entrée (par 1 000 jetons, en USD).
pricing.output
number
Prix par jeton de sortie (par 1 000 jetons, en USD).
pricing.cache_read
number
Prix de lecture du cache (par 1 000 jetons, en USD, champ optionnel).
pricing.cache_write
number
Prix d’écriture du cache (par 1 000 jetons, en USD, champ optionnel).

Exemples de requêtes

import requests

# API Endpoint
url = "https://aihubmix.com/api/v1/models"

response = requests.get(url)
print(response.json())

# Example with parameters
params = {
    "type": "llm",                   
	"modalities": "text",
	"model": "gpt-5",
	"features": "thinking",
    "sort_by": "context_length",
    "sort_order": "desc"    
}
response = requests.get(url, params=params)
print(response.json())

Description des paramètres de requête (pour le filtrage)

type
string
Type de modèle. Valeurs prises en charge : llm (grand modèle de langage), image_generation, video, tts (synthèse vocale), stt (reconnaissance vocale), embedding, rerank.
modalities
string
Modalités d’entrée. Valeurs prises en charge : text, image, audio, video, pdf. Prend en charge les requêtes multimodalités (séparées par des virgules).
model
string
Recherche approximative par nom de modèle (correspondance partielle prise en charge).
features
string
Fonctionnalités du modèle. Valeurs prises en charge : thinking (raisonnement), tools (utilisation d’outils), function_calling, web (recherche web), deepsearch, long_context, structured_outputs. Prend en charge les requêtes multifonctionnalités (séparées par des virgules).
sort_by
string
Trier par champ. Valeurs prises en charge :
  • model_ratio : tri par rapport coût/efficacité.
  • context_length : tri par longueur de contexte.
  • coding : priorité aux modèles de codage.
  • order : tri par ordre par défaut.
sort_order
string
Ordre de tri. Valeurs prises en charge :
  • asc (ascendant)
  • desc (descendant)

Exemple de réponse en cas de succès

{
    "data": [
        {
            "model_id": "gpt-5",
            "desc": "GPT-5 is OpenAI's flagship model for coding, reasoning, and agentic tasks across domains.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        },
        {
            "model_id": "gpt-5-codex",
            "desc": "GPT-5-Codex is a version of GPT-5 optimized for autonomous coding tasks in Codex or similar environments. It is only available in the Responses API, and the underlying model snapshots will be updated regularly. https://docs.aihubmix.com/en/api/Responses-API You can also use it in codex-cll; see https://docs.aihubmix.com/en/api/Codex-CLI for using codex-cll through Aihubmix.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        }
    ],
    "message": "",
    "success": true
}

Exemples de scénarios d’utilisation

GET https://aihubmix.com/api/v1/models?type=llm
Remarque : lors de l’utilisation du tri intelligent pour les modèles de codage, le système privilégiera les modèles étiquetés coding, les autres modèles étant listés dans l’ordre par défaut.

Optimisation des performances

Mécanisme de mise en cache

  • Politique de cache : mise en cache HTTP, durée du cache de 300 secondes (5 minutes).
  • Contrôle du cache : Cache-Control: public, max-age=300, stale-while-revalidate=300
  • Validation du contenu : prise en charge de la validation par hash de contenu ETag.

Exemple d’utilisation du cache

# Conditional request using ETag
curl -H "If-None-Match: \"abc123...\"" \
     https://aihubmix.com/api/v1/models
Si le contenu n’a pas été mis à jour, le serveur renvoie un code d’état 304 Not Modified.

Gestion des erreurs

{
  "success": false,
  "message": "Invalid request parameter format"
}

Remarques importantes

  1. Intégrité des données : cet endpoint renvoie tous les modèles correspondant aux critères, sans pagination.
  2. Compatibilité des types : prend en charge le mappage automatique entre les anciens et nouveaux identifiants de type :
    • t2tllm
    • t2iimage_generation
    • t2vvideo
    • rerankingrerank
  3. Logique de filtrage : plusieurs conditions de filtre sont combinées avec un ET logique.
  4. Règle de tri : si aucune méthode de tri n’est spécifiée, les modèles sont rangés dans l’ordre par défaut du système.

Version héritée de l’API

⚠️ Remarque : les endpoints suivants sont des endpoints d’API hérités. Il est recommandé d’utiliser la nouvelle version de l’API pour de meilleures performances et fonctionnalités.

Obtenir la liste des modèles

Endpoint : GET /v1/models
  • Si un utilisateur est connecté, cette opération récupère la liste des modèles disponibles pour le groupe de l’utilisateur. Si aucun utilisateur n’est connecté, elle récupère la liste pour le groupe default.
  • Si l’en-tête contient un champ Authorization, elle interroge la liste des modèles configurés pour le token correspondant.
Exemple de réponse :
{
  "data": [
    {
      "id": "gpt-4o-mini",
      "object": "model",
      "created": 1626777600,
      "owned_by": "OpenAI",
      "permission": [
        {
          "id": "modelperm-LwHkVFn8AcMItP432fKKDIKJ",
          "object": "model_permission",
          "created": 1626777600,
          "allow_create_engine": true,
          "allow_sampling": true,
          "allow_logprobs": true,
          "allow_search_indices": false,
          "allow_view": true,
          "allow_fine_tuning": false,
          "organization": "*",
          "group": null,
          "is_blocking": false
        }
      ],
      "root": "gpt-4o-mini",
      "parent": null
    }
  ]
}

Réponse

Code d’étatSignificationDescriptionModèle de données
200OKaucunInline

Structure des données de réponse

Code d’état 200
NomTypeRequisDescription
» data[object]ouiaucun
»» idstringouiID du modèle
»» objectstringouimodel
»» createdintegerouiHorodatage de création
»» owned_bystringouiDéveloppeur
»» permission[object]¦nullouiaucun
»»» idstringouiaucun
»»» objectstringouiaucun
»»» createdintegerouiaucun
»»» allow_create_enginebooleanouiaucun
»»» allow_samplingbooleanouiaucun
»»» allow_logprobsbooleanouiaucun
»»» allow_search_indicesbooleanouiaucun
»»» allow_viewbooleanouiaucun
»»» allow_fine_tuningbooleanouiaucun
»»» organizationstringouiaucun
»»» groupnullouiaucun
»»» is_blockingbooleanouiaucun
»» rootstringouiNom du modèle racine
»» parentnullouiModèle parent

Obtenir les informations sur un modèle

Endpoint : GET /v1/models/:model

Paramètres de requête

NomDansTypeRequisDescription
modelpathstringouiID du modèle
Exemple de réponse :
200 Response
{
  "id": "string",
  "object": "string",
  "created": 0,
  "owned_by": "string",
  "permission": [
    {
      "id": "string",
      "object": "string",
      "created": 0,
      "allow_create_engine": true,
      "allow_sampling": true,
      "allow_logprobs": true,
      "allow_search_indices": true,
      "allow_view": true,
      "allow_fine_tuning": true,
      "organization": "string",
      "group": null,
      "is_blocking": true
    }
  ],
  "root": "string",
  "parent": null
}

Réponse

Code d’étatSignificationDescriptionModèle de données
200OKaucunInline

Structure des données de réponse

Code d’état 200
NomTypeRequisDescription
idstringouiID du modèle
objectstringouimodel
createdintegerouiHorodatage de création
owned_bystringouiDéveloppeur
permission[object]ouiaucun
» idstringnonaucun
» objectstringnonaucun
» createdintegernonaucun
» allow_create_enginebooleannonaucun
» allow_samplingbooleannonaucun
» allow_logprobsbooleannonaucun
» allow_search_indicesbooleannonaucun
» allow_viewbooleannonaucun
» allow_fine_tuningbooleannonaucun
» organizationstringnonaucun
» groupnullnonaucun
» is_blockingbooleannonaucun
rootstringouiNom du modèle racine
parentnullouiModèle parent

Dernière mise à jour : 2026-06-01