AiHubMix Documentation Hub

GET

https://aihubmix.com

api

models

API de gestion des modèles

curl --request GET \
  --url https://aihubmix.com/api/v1/models \
  --header 'Authorization: Bearer <token>'

import requests

url = "https://aihubmix.com/api/v1/models"

headers = {"Authorization": "Bearer <token>"}

response = requests.get(url, headers=headers)

print(response.text)

{
  "data": [
    {}
  ],
  "model_id": "<string>",
  "desc": "<string>",
  "types": "<string>",
  "features": "<string>",
  "input_modalities": "<string>",
  "max_output": "<string>",
  "context_length": "<string>",
  "pricing": {},
  "pricing.input": 123,
  "pricing.output": 123,
  "pricing.cache_read": 123,
  "pricing.cache_write": 123
}

Nouvelle version de l’API

Obtenir les informations sur les modèles

Endpoint : GET https://aihubmix.com/api/v1/models Description : récupère les informations détaillées de tous les modèles disponibles.

Description des champs de l’objet modèle

data

array

Tableau d’objets d’information sur les modèles.

model_id

string

Identifiant unique du modèle.

desc

string

Description des fonctionnalités du modèle (en anglais).

types

string

Type de modèle. Valeurs prises en charge : llm (grand modèle de langage), image_generation, video, tts (synthèse vocale), stt (reconnaissance vocale), embedding, rerank.

features

string

Fonctionnalités prises en charge. Valeurs prises en charge : thinking (raisonnement), tools (utilisation d’outils), function_calling, web (recherche web), deepsearch, long_context, structured_outputs.

input_modalities

string

Modalités d’entrée prises en charge. Valeurs prises en charge : text, image, audio, video, pdf.

max_output

string

Nombre maximal de jetons de sortie.

context_length

string

Taille de la fenêtre de contexte (nombre maximal de jetons d’entrée).

pricing

object

Objet contenant les informations tarifaires.

pricing.input

number

Prix par jeton d’entrée (par 1 000 jetons, en USD).

pricing.output

number

Prix par jeton de sortie (par 1 000 jetons, en USD).

pricing.cache_read

number

Prix de lecture du cache (par 1 000 jetons, en USD, champ optionnel).

pricing.cache_write

number

Prix d’écriture du cache (par 1 000 jetons, en USD, champ optionnel).

Exemples de requêtes

import requests

# API Endpoint
url = "https://aihubmix.com/api/v1/models"

response = requests.get(url)
print(response.json())

# Example with parameters
params = {
    "type": "llm",                   
	"modalities": "text",
	"model": "gpt-5",
	"features": "thinking",
    "sort_by": "context_length",
    "sort_order": "desc"    
}
response = requests.get(url, params=params)
print(response.json())

fetch('https://aihubmix.com/api/v1/models')
  .then(response => response.json())
  .then(data => console.log(data));

// Example with parameters
const params = new URLSearchParams({
  type: 'llm',
  modalities: 'text',
  model: 'gpt-5',
  features: 'thinking',
  sort_by: 'context_length',
  sort_order: 'desc' 
});

fetch(`https://aihubmix.com/api/v1/models?${params}`)
  .then(response => response.json())
  .then(data => console.log(data));

# Get all models
curl -X GET "https://aihubmix.com/api/v1/models"

# Get models with specific filters
curl -X GET "https://aihubmix.com/api/v1/models?type=llm&modalities=text&model=gpt-5&features=thinking&sort_by=context_length&sort_order=desc"

Description des paramètres de requête (pour le filtrage)

type

string

Type de modèle. Valeurs prises en charge : llm (grand modèle de langage), image_generation, video, tts (synthèse vocale), stt (reconnaissance vocale), embedding, rerank.

modalities

string

Modalités d’entrée. Valeurs prises en charge : text, image, audio, video, pdf. Prend en charge les requêtes multimodalités (séparées par des virgules).

model

string

Recherche approximative par nom de modèle (correspondance partielle prise en charge).

features

string

Fonctionnalités du modèle. Valeurs prises en charge : thinking (raisonnement), tools (utilisation d’outils), function_calling, web (recherche web), deepsearch, long_context, structured_outputs. Prend en charge les requêtes multifonctionnalités (séparées par des virgules).

sort_by

string

Trier par champ. Valeurs prises en charge :

model_ratio : tri par rapport coût/efficacité.
context_length : tri par longueur de contexte.
coding : priorité aux modèles de codage.
order : tri par ordre par défaut.

sort_order

string

Ordre de tri. Valeurs prises en charge :

asc (ascendant)
desc (descendant)

Exemple de réponse en cas de succès

{
    "data": [
        {
            "model_id": "gpt-5",
            "desc": "GPT-5 is OpenAI's flagship model for coding, reasoning, and agentic tasks across domains.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        },
        {
            "model_id": "gpt-5-codex",
            "desc": "GPT-5-Codex is a version of GPT-5 optimized for autonomous coding tasks in Codex or similar environments. It is only available in the Responses API, and the underlying model snapshots will be updated regularly. https://docs.aihubmix.com/en/api/Responses-API You can also use it in codex-cll; see https://docs.aihubmix.com/en/api/Codex-CLI for using codex-cll through Aihubmix.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        }
    ],
    "message": "",
    "success": true
}

Exemples de scénarios d’utilisation

GET https://aihubmix.com/api/v1/models?type=llm

GET https://aihubmix.com/api/v1/models?tag=coding&sort_by=context_length&sort_order=desc

GET https://aihubmix.com/api/v1/models?model=gpt-5

GET https://aihubmix.com/api/v1/models?type=llm&modalities=text,image&features=function_calling&sort_by=model_ratio&sort_order=asc

GET https://aihubmix.com/api/v1/models?sort_by=coding

Remarque : lors de l’utilisation du tri intelligent pour les modèles de codage, le système privilégiera les modèles étiquetés coding, les autres modèles étant listés dans l’ordre par défaut.

Optimisation des performances

Mécanisme de mise en cache

Politique de cache : mise en cache HTTP, durée du cache de 300 secondes (5 minutes).
Contrôle du cache : Cache-Control: public, max-age=300, stale-while-revalidate=300
Validation du contenu : prise en charge de la validation par hash de contenu ETag.

Exemple d’utilisation du cache

# Conditional request using ETag
curl -H "If-None-Match: \"abc123...\"" \
     https://aihubmix.com/api/v1/models

Si le contenu n’a pas été mis à jour, le serveur renvoie un code d’état 304 Not Modified.

Gestion des erreurs

{
  "success": false,
  "message": "Invalid request parameter format"
}

{
  "success": false,
  "message": "Internal server error, please try again later"
}

Remarques importantes

Intégrité des données : cet endpoint renvoie tous les modèles correspondant aux critères, sans pagination.
Compatibilité des types : prend en charge le mappage automatique entre les anciens et nouveaux identifiants de type :
- t2t ↔ llm
- t2i ↔ image_generation
- t2v ↔ video
- reranking ↔ rerank
Logique de filtrage : plusieurs conditions de filtre sont combinées avec un ET logique.
Règle de tri : si aucune méthode de tri n’est spécifiée, les modèles sont rangés dans l’ordre par défaut du système.

Version héritée de l’API

⚠️ Remarque : les endpoints suivants sont des endpoints d’API hérités. Il est recommandé d’utiliser la nouvelle version de l’API pour de meilleures performances et fonctionnalités.

Obtenir la liste des modèles

Endpoint : GET /v1/models

Si un utilisateur est connecté, cette opération récupère la liste des modèles disponibles pour le groupe de l’utilisateur. Si aucun utilisateur n’est connecté, elle récupère la liste pour le groupe default.
Si l’en-tête contient un champ Authorization, elle interroge la liste des modèles configurés pour le token correspondant.

Exemple de réponse :

{
  "data": [
    {
      "id": "gpt-4o-mini",
      "object": "model",
      "created": 1626777600,
      "owned_by": "OpenAI",
      "permission": [
        {
          "id": "modelperm-LwHkVFn8AcMItP432fKKDIKJ",
          "object": "model_permission",
          "created": 1626777600,
          "allow_create_engine": true,
          "allow_sampling": true,
          "allow_logprobs": true,
          "allow_search_indices": false,
          "allow_view": true,
          "allow_fine_tuning": false,
          "organization": "*",
          "group": null,
          "is_blocking": false
        }
      ],
      "root": "gpt-4o-mini",
      "parent": null
    }
  ]
}

Réponse

Code d’état	Signification	Description	Modèle de données
200	OK	aucun	Inline

Structure des données de réponse

Code d’état 200

Nom	Type	Requis	Description
» data	[object]	oui	aucun
»» id	string	oui	ID du modèle
»» object	string	oui	`model`
»» created	integer	oui	Horodatage de création
»» owned_by	string	oui	Développeur
»» permission	[object]¦null	oui	aucun
»»» id	string	oui	aucun
»»» object	string	oui	aucun
»»» created	integer	oui	aucun
»»» allow_create_engine	boolean	oui	aucun
»»» allow_sampling	boolean	oui	aucun
»»» allow_logprobs	boolean	oui	aucun
»»» allow_search_indices	boolean	oui	aucun
»»» allow_view	boolean	oui	aucun
»»» allow_fine_tuning	boolean	oui	aucun
»»» organization	string	oui	aucun
»»» group	null	oui	aucun
»»» is_blocking	boolean	oui	aucun
»» root	string	oui	Nom du modèle racine
»» parent	null	oui	Modèle parent

Obtenir les informations sur un modèle

Endpoint : GET /v1/models/:model

Paramètres de requête

Nom	Dans	Type	Requis	Description
model	path	string	oui	ID du modèle

Exemple de réponse :

200 Response

{
  "id": "string",
  "object": "string",
  "created": 0,
  "owned_by": "string",
  "permission": [
    {
      "id": "string",
      "object": "string",
      "created": 0,
      "allow_create_engine": true,
      "allow_sampling": true,
      "allow_logprobs": true,
      "allow_search_indices": true,
      "allow_view": true,
      "allow_fine_tuning": true,
      "organization": "string",
      "group": null,
      "is_blocking": true
    }
  ],
  "root": "string",
  "parent": null
}

Réponse

Code d’état	Signification	Description	Modèle de données
200	OK	aucun	Inline

Structure des données de réponse

Code d’état 200

Nom	Type	Requis	Description
id	string	oui	ID du modèle
object	string	oui	`model`
created	integer	oui	Horodatage de création
owned_by	string	oui	Développeur
permission	[object]	oui	aucun
» id	string	non	aucun
» object	string	non	aucun
» created	integer	non	aucun
» allow_create_engine	boolean	non	aucun
» allow_sampling	boolean	non	aucun
» allow_logprobs	boolean	non	aucun
» allow_search_indices	boolean	non	aucun
» allow_view	boolean	non	aucun
» allow_fine_tuning	boolean	non	aucun
» organization	string	non	aucun
» group	null	non	aucun
» is_blocking	boolean	non	aucun
root	string	oui	Nom du modèle racine
parent	null	oui	Modèle parent

Dernière mise à jour : 2026-06-01

Informations sur l'utilisateur courantRécupère les informations de l'utilisateur courant et le solde du compte

API de gestion des modèles

curl --request GET \
  --url https://aihubmix.com/api/v1/models \
  --header 'Authorization: Bearer <token>'

import requests

url = "https://aihubmix.com/api/v1/models"

headers = {"Authorization": "Bearer <token>"}

response = requests.get(url, headers=headers)

print(response.text)

{
  "data": [
    {}
  ],
  "model_id": "<string>",
  "desc": "<string>",
  "types": "<string>",
  "features": "<string>",
  "input_modalities": "<string>",
  "max_output": "<string>",
  "context_length": "<string>",
  "pricing": {},
  "pricing.input": 123,
  "pricing.output": 123,
  "pricing.cache_read": 123,
  "pricing.cache_write": 123
}

Endpoints de modèle

API plateforme

API de gestion des modèles

Nouvelle version de l’API

Obtenir les informations sur les modèles

Description des champs de l’objet modèle

Exemples de requêtes

Description des paramètres de requête (pour le filtrage)

Exemple de réponse en cas de succès

Exemples de scénarios d’utilisation

Optimisation des performances

Mécanisme de mise en cache

Exemple d’utilisation du cache

Gestion des erreurs

Remarques importantes

Version héritée de l’API

Obtenir la liste des modèles

Réponse

Structure des données de réponse

Obtenir les informations sur un modèle

Paramètres de requête

Réponse

Structure des données de réponse

​Nouvelle version de l’API

​Obtenir les informations sur les modèles

​Description des champs de l’objet modèle

​Exemples de requêtes

​Description des paramètres de requête (pour le filtrage)

​Exemple de réponse en cas de succès

​Exemples de scénarios d’utilisation

​Optimisation des performances

​Mécanisme de mise en cache

​Exemple d’utilisation du cache

​Gestion des erreurs

​Remarques importantes

​Version héritée de l’API

​Obtenir la liste des modèles

​Réponse

​Structure des données de réponse

​Obtenir les informations sur un modèle

​Paramètres de requête

​Réponse

​Structure des données de réponse

Nouvelle version de l’API

Obtenir les informations sur les modèles

Description des champs de l’objet modèle

Exemples de requêtes

Description des paramètres de requête (pour le filtrage)

Exemple de réponse en cas de succès

Exemples de scénarios d’utilisation

Optimisation des performances

Mécanisme de mise en cache

Exemple d’utilisation du cache

Gestion des erreurs

Remarques importantes

Version héritée de l’API

Obtenir la liste des modèles

Réponse

Structure des données de réponse

Obtenir les informations sur un modèle

Paramètres de requête

Réponse

Structure des données de réponse