AiHubMix Documentation Hub

GET

https://aihubmix.com

api

models

Modellverwaltungs-API

curl --request GET \
  --url https://aihubmix.com/api/v1/models \
  --header 'Authorization: Bearer <token>'

import requests

url = "https://aihubmix.com/api/v1/models"

headers = {"Authorization": "Bearer <token>"}

response = requests.get(url, headers=headers)

print(response.text)

{
  "data": [
    {}
  ],
  "model_id": "<string>",
  "desc": "<string>",
  "types": "<string>",
  "features": "<string>",
  "input_modalities": "<string>",
  "max_output": "<string>",
  "context_length": "<string>",
  "pricing": {},
  "pricing.input": 123,
  "pricing.output": 123,
  "pricing.cache_read": 123,
  "pricing.cache_write": 123
}

Neue API-Version

Modellinformationen abrufen

Endpoint: GET https://aihubmix.com/api/v1/models Beschreibung: Liefert detaillierte Informationen zu allen verfügbaren Modellen.

Beschreibung der Felder im Modell-Objekt

data

array

Ein Array von Modellinformationsobjekten.

model_id

string

Eindeutige Kennung des Modells.

desc

string

Beschreibung der Modellfunktionalität (in Englisch).

types

string

Modelltyp. Unterstützte Werte: llm (Large Language Model), image_generation, video, tts (Text-to-Speech), stt (Speech-to-Text), embedding, rerank.

features

string

Unterstützte Funktionen. Mögliche Werte: thinking (Reasoning), tools (Tool-Nutzung), function_calling, web (Websuche), deepsearch, long_context, structured_outputs.

input_modalities

string

Unterstützte Eingabemodalitäten. Mögliche Werte: text, image, audio, video, pdf.

max_output

string

Maximale Anzahl an Ausgabe-Token.

context_length

string

Größe des Kontextfensters (maximale Anzahl an Eingabe-Token).

pricing

object

Objekt mit Preisinformationen.

pricing.input

number

Preis für Eingabe-Token (pro 1K Token, in USD).

pricing.output

number

Preis für Ausgabe-Token (pro 1K Token, in USD).

pricing.cache_read

number

Preis für Cache-Lesezugriffe (pro 1K Token, in USD, optionales Feld).

pricing.cache_write

number

Preis für Cache-Schreibzugriffe (pro 1K Token, in USD, optionales Feld).

Request-Beispiele

import requests

# API Endpoint
url = "https://aihubmix.com/api/v1/models"

response = requests.get(url)
print(response.json())

# Example with parameters
params = {
    "type": "llm",                   
	"modalities": "text",
	"model": "gpt-5",
	"features": "thinking",
    "sort_by": "context_length",
    "sort_order": "desc"    
}
response = requests.get(url, params=params)
print(response.json())

fetch('https://aihubmix.com/api/v1/models')
  .then(response => response.json())
  .then(data => console.log(data));

// Example with parameters
const params = new URLSearchParams({
  type: 'llm',
  modalities: 'text',
  model: 'gpt-5',
  features: 'thinking',
  sort_by: 'context_length',
  sort_order: 'desc' 
});

fetch(`https://aihubmix.com/api/v1/models?${params}`)
  .then(response => response.json())
  .then(data => console.log(data));

# Get all models
curl -X GET "https://aihubmix.com/api/v1/models"

# Get models with specific filters
curl -X GET "https://aihubmix.com/api/v1/models?type=llm&modalities=text&model=gpt-5&features=thinking&sort_by=context_length&sort_order=desc"

Request-Parameter (zur Filterung)

type

string

Modelltyp. Mögliche Werte: llm (Large Language Model), image_generation, video, tts (Text-to-Speech), stt (Speech-to-Text), embedding, rerank.

modalities

string

Eingabemodalitäten. Mögliche Werte: text, image, audio, video, pdf. Mehrere Modalitäten werden durch Komma getrennt.

model

string

Unscharfe Suche nach Modellname (unterstützt Teilübereinstimmung).

features

string

Modell-Features. Mögliche Werte: thinking (Reasoning), tools (Tool-Nutzung), function_calling, web (Websuche), deepsearch, long_context, structured_outputs. Mehrere Features werden durch Komma getrennt.

sort_by

string

Sortierfeld. Mögliche Werte:

model_ratio: nach Kosteneffizienz sortieren.
context_length: nach Kontextlänge sortieren.
coding: Coding-Modelle priorisieren.
order: Standardreihenfolge.

sort_order

string

Sortierreihenfolge. Mögliche Werte:

asc (aufsteigend)
desc (absteigend)

Beispiel einer erfolgreichen Antwort

{
    "data": [
        {
            "model_id": "gpt-5",
            "desc": "GPT-5 is OpenAI's flagship model for coding, reasoning, and agentic tasks across domains.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        },
        {
            "model_id": "gpt-5-codex",
            "desc": "GPT-5-Codex is a version of GPT-5 optimized for autonomous coding tasks in Codex or similar environments. It is only available in the Responses API, and the underlying model snapshots will be updated regularly. https://docs.aihubmix.com/en/api/Responses-API You can also use it in codex-cll; see https://docs.aihubmix.com/en/api/Codex-CLI for using codex-cll through Aihubmix.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        }
    ],
    "message": "",
    "success": true
}

Anwendungsbeispiele

GET https://aihubmix.com/api/v1/models?type=llm

GET https://aihubmix.com/api/v1/models?tag=coding&sort_by=context_length&sort_order=desc

GET https://aihubmix.com/api/v1/models?model=gpt-5

GET https://aihubmix.com/api/v1/models?type=llm&modalities=text,image&features=function_calling&sort_by=model_ratio&sort_order=asc

GET https://aihubmix.com/api/v1/models?sort_by=coding

Hinweis: Beim Smart-Sort für Coding-Modelle werden Modelle mit dem Tag coding priorisiert; die übrigen Modelle erscheinen in der Standardreihenfolge.

Performance-Optimierung

Caching-Mechanismus

Cache-Policy: HTTP-Caching, Cache-Dauer 300 Sekunden (5 Minuten).
Cache-Steuerung: Cache-Control: public, max-age=300, stale-while-revalidate=300
Inhaltsvalidierung: Unterstützt ETag-Validierung des Inhaltshashes.

Beispiel zur Cache-Nutzung

# Conditional request using ETag
curl -H "If-None-Match: \"abc123...\"" \
     https://aihubmix.com/api/v1/models

Wurde der Inhalt nicht aktualisiert, gibt der Server den Statuscode 304 Not Modified zurück.

Fehlerbehandlung

{
  "success": false,
  "message": "Invalid request parameter format"
}

{
  "success": false,
  "message": "Internal server error, please try again later"
}

Wichtige Hinweise

Datenintegrität: Dieser Endpoint gibt alle passenden Modelle zurück, ohne Pagination.
Typ-Kompatibilität: Unterstützt automatisches Mapping zwischen neuen und alten Typkennungen:
- t2t ↔ llm
- t2i ↔ image_generation
- t2v ↔ video
- reranking ↔ rerank
Filter-Logik: Mehrere Filterbedingungen werden mit logischem UND kombiniert.
Sortierregel: Ist keine Sortierung angegeben, werden die Modelle in der Standardreihenfolge des Systems geliefert.

Legacy-API-Version

⚠️ Hinweis: Im Folgenden handelt es sich um Legacy-API-Endpoints. Wir empfehlen die Nutzung der neuen API-Version für bessere Leistung und Funktionen.

Modellliste abrufen

Endpoint: GET /v1/models

Ist ein Benutzer angemeldet, wird die Liste der für die Gruppe des Benutzers verfügbaren Modelle abgerufen. Andernfalls wird die Liste der Gruppe default abgerufen.
Enthält der Header das Feld Authorization, wird die Modellliste des zugehörigen Tokens abgefragt.

Antwortbeispiel:

{
  "data": [
    {
      "id": "gpt-4o-mini",
      "object": "model",
      "created": 1626777600,
      "owned_by": "OpenAI",
      "permission": [
        {
          "id": "modelperm-LwHkVFn8AcMItP432fKKDIKJ",
          "object": "model_permission",
          "created": 1626777600,
          "allow_create_engine": true,
          "allow_sampling": true,
          "allow_logprobs": true,
          "allow_search_indices": false,
          "allow_view": true,
          "allow_fine_tuning": false,
          "organization": "*",
          "group": null,
          "is_blocking": false
        }
      ],
      "root": "gpt-4o-mini",
      "parent": null
    }
  ]
}

Antwort

Statuscode	Bedeutung	Beschreibung	Datenmodell
200	OK	keine	Inline

Antwort-Datenstruktur

Statuscode 200

Name	Typ	Pflicht	Beschreibung
» data	[object]	true	keine
»» id	string	true	Modell-ID
»» object	string	true	`model`
»» created	integer	true	Erstellungs-Timestamp
»» owned_by	string	true	Entwickler
»» permission	[object]¦null	true	keine
»»» id	string	true	keine
»»» object	string	true	keine
»»» created	integer	true	keine
»»» allow_create_engine	boolean	true	keine
»»» allow_sampling	boolean	true	keine
»»» allow_logprobs	boolean	true	keine
»»» allow_search_indices	boolean	true	keine
»»» allow_view	boolean	true	keine
»»» allow_fine_tuning	boolean	true	keine
»»» organization	string	true	keine
»»» group	null	true	keine
»»» is_blocking	boolean	true	keine
»» root	string	true	Root-Modellname
»» parent	null	true	Übergeordnetes Modell

Modellinformationen abrufen

Endpoint: GET /v1/models/:model

Request-Parameter

Name	In	Typ	Pflicht	Beschreibung
model	path	string	true	Modell-ID

Antwortbeispiel:

200 Response

{
  "id": "string",
  "object": "string",
  "created": 0,
  "owned_by": "string",
  "permission": [
    {
      "id": "string",
      "object": "string",
      "created": 0,
      "allow_create_engine": true,
      "allow_sampling": true,
      "allow_logprobs": true,
      "allow_search_indices": true,
      "allow_view": true,
      "allow_fine_tuning": true,
      "organization": "string",
      "group": null,
      "is_blocking": true
    }
  ],
  "root": "string",
  "parent": null
}

Antwort

Statuscode	Bedeutung	Beschreibung	Datenmodell
200	OK	keine	Inline

Antwort-Datenstruktur

Statuscode 200

Name	Typ	Pflicht	Beschreibung
id	string	true	Modell-ID
object	string	true	`model`
created	integer	true	Erstellungs-Timestamp
owned_by	string	true	Entwickler
permission	[object]	true	keine
» id	string	false	keine
» object	string	false	keine
» created	integer	false	keine
» allow_create_engine	boolean	false	keine
» allow_sampling	boolean	false	keine
» allow_logprobs	boolean	false	keine
» allow_search_indices	boolean	false	keine
» allow_view	boolean	false	keine
» allow_fine_tuning	boolean	false	keine
» organization	string	false	keine
» group	null	false	keine
» is_blocking	boolean	false	keine
root	string	true	Root-Modellname
parent	null	true	Übergeordnetes Modell

Zuletzt aktualisiert: 2026-06-01

Zurück

Aktuelle BenutzerinformationenAktuelle Benutzerinformationen und Kontostand abrufen

Weiter

Modellverwaltungs-API

curl --request GET \
  --url https://aihubmix.com/api/v1/models \
  --header 'Authorization: Bearer <token>'

import requests

url = "https://aihubmix.com/api/v1/models"

headers = {"Authorization": "Bearer <token>"}

response = requests.get(url, headers=headers)

print(response.text)

{
  "data": [
    {}
  ],
  "model_id": "<string>",
  "desc": "<string>",
  "types": "<string>",
  "features": "<string>",
  "input_modalities": "<string>",
  "max_output": "<string>",
  "context_length": "<string>",
  "pricing": {},
  "pricing.input": 123,
  "pricing.output": 123,
  "pricing.cache_read": 123,
  "pricing.cache_write": 123
}

Modell-Endpunkte

Plattform-API

Modellverwaltungs-API

Neue API-Version

Modellinformationen abrufen

Beschreibung der Felder im Modell-Objekt

Request-Beispiele

Request-Parameter (zur Filterung)

Beispiel einer erfolgreichen Antwort

Anwendungsbeispiele

Performance-Optimierung

Caching-Mechanismus

Beispiel zur Cache-Nutzung

Fehlerbehandlung

Wichtige Hinweise

Legacy-API-Version

Modellliste abrufen

Antwort

Antwort-Datenstruktur

Modellinformationen abrufen

Request-Parameter

Antwort

Antwort-Datenstruktur

​Neue API-Version

​Modellinformationen abrufen

​Beschreibung der Felder im Modell-Objekt

​Request-Beispiele

​Request-Parameter (zur Filterung)

​Beispiel einer erfolgreichen Antwort

​Anwendungsbeispiele

​Performance-Optimierung

​Caching-Mechanismus

​Beispiel zur Cache-Nutzung

​Fehlerbehandlung

​Wichtige Hinweise

​Legacy-API-Version

​Modellliste abrufen

​Antwort

​Antwort-Datenstruktur

​Modellinformationen abrufen

​Request-Parameter

​Antwort

​Antwort-Datenstruktur

Neue API-Version

Modellinformationen abrufen

Beschreibung der Felder im Modell-Objekt

Request-Beispiele

Request-Parameter (zur Filterung)

Beispiel einer erfolgreichen Antwort

Anwendungsbeispiele

Performance-Optimierung

Caching-Mechanismus

Beispiel zur Cache-Nutzung

Fehlerbehandlung

Wichtige Hinweise

Legacy-API-Version

Modellliste abrufen

Antwort

Antwort-Datenstruktur

Modellinformationen abrufen

Request-Parameter

Antwort

Antwort-Datenstruktur