Zum Hauptinhalt springen
GET
/
api
/
v1
/
models
Modellverwaltungs-API
curl --request GET \
  --url https://aihubmix.com/api/v1/models \
  --header 'Authorization: Bearer <token>'
{
  "data": [
    {}
  ],
  "model_id": "<string>",
  "desc": "<string>",
  "types": "<string>",
  "features": "<string>",
  "input_modalities": "<string>",
  "max_output": "<string>",
  "context_length": "<string>",
  "pricing": {},
  "pricing.input": 123,
  "pricing.output": 123,
  "pricing.cache_read": 123,
  "pricing.cache_write": 123
}

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

Neue API-Version

Modellinformationen abrufen

Endpoint: GET https://aihubmix.com/api/v1/models Beschreibung: Liefert detaillierte Informationen zu allen verfügbaren Modellen.

Beschreibung der Felder im Modell-Objekt

data
array
Ein Array von Modellinformationsobjekten.
model_id
string
Eindeutige Kennung des Modells.
desc
string
Beschreibung der Modellfunktionalität (in Englisch).
types
string
Modelltyp. Unterstützte Werte: llm (Large Language Model), image_generation, video, tts (Text-to-Speech), stt (Speech-to-Text), embedding, rerank.
features
string
Unterstützte Funktionen. Mögliche Werte: thinking (Reasoning), tools (Tool-Nutzung), function_calling, web (Websuche), deepsearch, long_context, structured_outputs.
input_modalities
string
Unterstützte Eingabemodalitäten. Mögliche Werte: text, image, audio, video, pdf.
max_output
string
Maximale Anzahl an Ausgabe-Token.
context_length
string
Größe des Kontextfensters (maximale Anzahl an Eingabe-Token).
pricing
object
Objekt mit Preisinformationen.
pricing.input
number
Preis für Eingabe-Token (pro 1K Token, in USD).
pricing.output
number
Preis für Ausgabe-Token (pro 1K Token, in USD).
pricing.cache_read
number
Preis für Cache-Lesezugriffe (pro 1K Token, in USD, optionales Feld).
pricing.cache_write
number
Preis für Cache-Schreibzugriffe (pro 1K Token, in USD, optionales Feld).

Request-Beispiele

import requests

# API Endpoint
url = "https://aihubmix.com/api/v1/models"

response = requests.get(url)
print(response.json())

# Example with parameters
params = {
    "type": "llm",                   
	"modalities": "text",
	"model": "gpt-5",
	"features": "thinking",
    "sort_by": "context_length",
    "sort_order": "desc"    
}
response = requests.get(url, params=params)
print(response.json())

Request-Parameter (zur Filterung)

type
string
Modelltyp. Mögliche Werte: llm (Large Language Model), image_generation, video, tts (Text-to-Speech), stt (Speech-to-Text), embedding, rerank.
modalities
string
Eingabemodalitäten. Mögliche Werte: text, image, audio, video, pdf. Mehrere Modalitäten werden durch Komma getrennt.
model
string
Unscharfe Suche nach Modellname (unterstützt Teilübereinstimmung).
features
string
Modell-Features. Mögliche Werte: thinking (Reasoning), tools (Tool-Nutzung), function_calling, web (Websuche), deepsearch, long_context, structured_outputs. Mehrere Features werden durch Komma getrennt.
sort_by
string
Sortierfeld. Mögliche Werte:
  • model_ratio: nach Kosteneffizienz sortieren.
  • context_length: nach Kontextlänge sortieren.
  • coding: Coding-Modelle priorisieren.
  • order: Standardreihenfolge.
sort_order
string
Sortierreihenfolge. Mögliche Werte:
  • asc (aufsteigend)
  • desc (absteigend)

Beispiel einer erfolgreichen Antwort

{
    "data": [
        {
            "model_id": "gpt-5",
            "desc": "GPT-5 is OpenAI's flagship model for coding, reasoning, and agentic tasks across domains.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        },
        {
            "model_id": "gpt-5-codex",
            "desc": "GPT-5-Codex is a version of GPT-5 optimized for autonomous coding tasks in Codex or similar environments. It is only available in the Responses API, and the underlying model snapshots will be updated regularly. https://docs.aihubmix.com/en/api/Responses-API You can also use it in codex-cll; see https://docs.aihubmix.com/en/api/Codex-CLI for using codex-cll through Aihubmix.",
            "pricing": {
                "cache_read": 0.125,
                "input": 1.25,
                "output": 10
            },
            "types": "llm",
            "features": "thinking,tools,function_calling,structured_outputs",
            "input_modalities": "text,image",
            "max_output": 128000,
            "context_length": 400000
        }
    ],
    "message": "",
    "success": true
}

Anwendungsbeispiele

GET https://aihubmix.com/api/v1/models?type=llm
Hinweis: Beim Smart-Sort für Coding-Modelle werden Modelle mit dem Tag coding priorisiert; die übrigen Modelle erscheinen in der Standardreihenfolge.

Performance-Optimierung

Caching-Mechanismus

  • Cache-Policy: HTTP-Caching, Cache-Dauer 300 Sekunden (5 Minuten).
  • Cache-Steuerung: Cache-Control: public, max-age=300, stale-while-revalidate=300
  • Inhaltsvalidierung: Unterstützt ETag-Validierung des Inhaltshashes.

Beispiel zur Cache-Nutzung

# Conditional request using ETag
curl -H "If-None-Match: \"abc123...\"" \
     https://aihubmix.com/api/v1/models
Wurde der Inhalt nicht aktualisiert, gibt der Server den Statuscode 304 Not Modified zurück.

Fehlerbehandlung

{
  "success": false,
  "message": "Invalid request parameter format"
}

Wichtige Hinweise

  1. Datenintegrität: Dieser Endpoint gibt alle passenden Modelle zurück, ohne Pagination.
  2. Typ-Kompatibilität: Unterstützt automatisches Mapping zwischen neuen und alten Typkennungen:
    • t2tllm
    • t2iimage_generation
    • t2vvideo
    • rerankingrerank
  3. Filter-Logik: Mehrere Filterbedingungen werden mit logischem UND kombiniert.
  4. Sortierregel: Ist keine Sortierung angegeben, werden die Modelle in der Standardreihenfolge des Systems geliefert.

Legacy-API-Version

⚠️ Hinweis: Im Folgenden handelt es sich um Legacy-API-Endpoints. Wir empfehlen die Nutzung der neuen API-Version für bessere Leistung und Funktionen.

Modellliste abrufen

Endpoint: GET /v1/models
  • Ist ein Benutzer angemeldet, wird die Liste der für die Gruppe des Benutzers verfügbaren Modelle abgerufen. Andernfalls wird die Liste der Gruppe default abgerufen.
  • Enthält der Header das Feld Authorization, wird die Modellliste des zugehörigen Tokens abgefragt.
Antwortbeispiel:
{
  "data": [
    {
      "id": "gpt-4o-mini",
      "object": "model",
      "created": 1626777600,
      "owned_by": "OpenAI",
      "permission": [
        {
          "id": "modelperm-LwHkVFn8AcMItP432fKKDIKJ",
          "object": "model_permission",
          "created": 1626777600,
          "allow_create_engine": true,
          "allow_sampling": true,
          "allow_logprobs": true,
          "allow_search_indices": false,
          "allow_view": true,
          "allow_fine_tuning": false,
          "organization": "*",
          "group": null,
          "is_blocking": false
        }
      ],
      "root": "gpt-4o-mini",
      "parent": null
    }
  ]
}

Antwort

StatuscodeBedeutungBeschreibungDatenmodell
200OKkeineInline

Antwort-Datenstruktur

Statuscode 200
NameTypPflichtBeschreibung
» data[object]truekeine
»» idstringtrueModell-ID
»» objectstringtruemodel
»» createdintegertrueErstellungs-Timestamp
»» owned_bystringtrueEntwickler
»» permission[object]¦nulltruekeine
»»» idstringtruekeine
»»» objectstringtruekeine
»»» createdintegertruekeine
»»» allow_create_enginebooleantruekeine
»»» allow_samplingbooleantruekeine
»»» allow_logprobsbooleantruekeine
»»» allow_search_indicesbooleantruekeine
»»» allow_viewbooleantruekeine
»»» allow_fine_tuningbooleantruekeine
»»» organizationstringtruekeine
»»» groupnulltruekeine
»»» is_blockingbooleantruekeine
»» rootstringtrueRoot-Modellname
»» parentnulltrueÜbergeordnetes Modell

Modellinformationen abrufen

Endpoint: GET /v1/models/:model

Request-Parameter

NameInTypPflichtBeschreibung
modelpathstringtrueModell-ID
Antwortbeispiel:
200 Response
{
  "id": "string",
  "object": "string",
  "created": 0,
  "owned_by": "string",
  "permission": [
    {
      "id": "string",
      "object": "string",
      "created": 0,
      "allow_create_engine": true,
      "allow_sampling": true,
      "allow_logprobs": true,
      "allow_search_indices": true,
      "allow_view": true,
      "allow_fine_tuning": true,
      "organization": "string",
      "group": null,
      "is_blocking": true
    }
  ],
  "root": "string",
  "parent": null
}

Antwort

StatuscodeBedeutungBeschreibungDatenmodell
200OKkeineInline

Antwort-Datenstruktur

Statuscode 200
NameTypPflichtBeschreibung
idstringtrueModell-ID
objectstringtruemodel
createdintegertrueErstellungs-Timestamp
owned_bystringtrueEntwickler
permission[object]truekeine
» idstringfalsekeine
» objectstringfalsekeine
» createdintegerfalsekeine
» allow_create_enginebooleanfalsekeine
» allow_samplingbooleanfalsekeine
» allow_logprobsbooleanfalsekeine
» allow_search_indicesbooleanfalsekeine
» allow_viewbooleanfalsekeine
» allow_fine_tuningbooleanfalsekeine
» organizationstringfalsekeine
» groupnullfalsekeine
» is_blockingbooleanfalsekeine
rootstringtrueRoot-Modellname
parentnulltrueÜbergeordnetes Modell

Zuletzt aktualisiert: 2026-06-01