AiHubMix Documentation Hub

1️⃣ Echtzeit-Websuche: Die zeitliche Begrenzung von LLMs durchbrechen für genauere und zuverlässigere Ausgaben

Wir haben die Modelle der OpenAI- und Gemini-Serie um die Fähigkeit erweitert, die neuesten Informationen aus dem Web abzurufen, damit Sie:

✅ Aktuelle Informationen erhalten: Echtzeit-Updates zu aktuellen Ereignissen, neuester Forschung oder Live-Daten
✅ Wissenslücken schließen: Die zeitlichen Beschränkungen der Trainingsdaten überwinden, indem Sie auf Informationen nach dem Training zugreifen
✅ Halluzinationen reduzieren: Faktenbasierte Antworten durch Echtzeit-Websuche liefern und KI-Konfabulationen deutlich verringern
✅ Entscheidungsqualität verbessern: Sichere Entscheidungen auf Basis aktueller Analysen und Empfehlungen treffen

Unterstützte Modelle: Derzeit unterstützt für die Modellserien OpenAI und Gemini mit zwei Integrationsmethoden: 1. Modelle mit nativen Suchfunktionen Gemini-Serie (Ground with Google search):

gemini-3.1-pro-preview-search
gemini-3-flash-preview-search
gemini-2.5-pro-search
gemini-2.5-flash-search

OpenAI-Serie (Search Preview):

gpt-4o-search-preview
gpt-4o-mini-search-preview

2. Parameter-basierte Unterstützung Fügen Sie den Parameter web_search_options={} hinzu, um die Web-Anbindung für Gemini- und OpenAI-Modelle zu aktivieren, die diesen Parameter unterstützen. Wenn die API Unknown parameter: 'web_search_options' zurückgibt, akzeptiert das aktuelle Modell oder die Upstream-API diesen Parameter nicht. Verwenden Sie eines der nativen Suchmodelle oben oder den unten beschriebenen Suffix :surfing. Für Gemini-Suchpreise gelten die Angaben in der Konsole und auf der Modelldetailseite.

Verwendungsanleitung

Führen Sie vor der Nutzung pip install -U openai aus, um das openai-Paket zu aktualisieren, und setzen Sie Ihren AIHubMix API Key als Umgebungsvariable:

export AIHUBMIX_API_KEY="<AIHUBMIX_API_KEY>"

Windows PowerShell:

setx AIHUBMIX_API_KEY "<AIHUBMIX_API_KEY>"

Beispiel:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["AIHUBMIX_API_KEY"], # Replace with the key you generated in AiHubMix
    base_url="https://aihubmix.com/v1"
)

chat_completion = client.chat.completions.create(
    model="gemini-3.5-flash",
    # 🌐 Enable search
    web_search_options={},
    messages=[
        {
            "role": "user",
            "content": "Search for information about the AIhubmix LLM API platform, provide a brief introduction, and include relevant links."
        }
    ]
)

print(chat_completion.choices[0].message.content)

import OpenAI from 'openai';

const client = new OpenAI({
    apiKey: process.env.AIHUBMIX_API_KEY,
    baseURL: 'https://aihubmix.com/v1'
});

async function main() {
    const chatCompletion = await client.chat.completions.create({
        model: 'gemini-3.5-flash',
        // 🌐 Enable search
        web_search_options: {},
        messages: [
            {
                role: 'user',
                content: 'Search for information about the AIhubmix LLM API platform, provide a brief introduction, and include relevant links.'
            }
        ]
    });

    console.log(chatCompletion.choices[0].message.content);
}

main().catch(console.error);

curl "https://aihubmix.com/v1/chat/completions" \
    -H "Content-Type: application/json" \
    -H "Authorization: Bearer $AIHUBMIX_API_KEY" \
    -d '{
    "model": "gemini-3.5-flash",
    "web_search_options": {},
    "messages": [
        {
            "role": "user",
            "content": "Provide information about Van Gogh on the Google Arts & Culture website, with a brief introduction and relevant links."
        }
    ],
    "stream": false
}'

2️⃣ Smart Surfing: KI das freie Surfen im Internet ermöglichen

Indem Sie an die Modell-ID :surfing anhängen, kann jedes große Sprachmodell mit Suchfunktionen ausgestattet werden.

Einfach das Suffix anhängen, keine komplexe Integration erforderlich
Diese Methode leitet die Anfrage des Benutzers standardmäßig an den Tavily-Suchdienst weiter, und das LLM berücksichtigt die Suchergebnisse bei seiner Antwort
Suchgebühr: $0,006 pro Suche
Die Gebühr wird derzeit direkt vom „Credit-Saldo” abgezogen, im „Log-Detail” wird die Suchgebühr noch nicht aufgeführt, dies wird jedoch zukünftig angezeigt

Die Modell-ID können Sie aus der Modellgalerie kopieren.

Beispiel:

import requests
import json
import os

try:
    response = requests.post(
        url="https://aihubmix.com/v1/chat/completions",
        headers={
            "Authorization": f"Bearer {os.environ.get('AIHUBMIX_API_KEY')}",
            "Content-Type": "application/json",
        },
        json={
            "model": "gpt-5.5:surfing", # Append :surfing to the model id to support searching
            "messages": [
                {
                    "role": "user",
                    "content": "Search for recent AIHubMix model updates, return concise German bullet points with source links."
                }
            ],
            "stream": False
        },
        timeout=60
    )

    result = response.json()
    if response.status_code >= 400:
        print("Request failed:", response.status_code)
    print("API response:", json.dumps(result, ensure_ascii=False, indent=2))

except requests.exceptions.RequestException as e:
    print(f"Request error: {e}")
except json.JSONDecodeError as e:
    print(f"JSON decode error: {e}")
except Exception as e:
    print(f"Other error: {e}")

Beispiel für eine API-Antwort:

{
  "id": "chatcmpl-xxxx",
  "model": "gpt-5.5-2026-04-24",
  "object": "chat.completion",
  "created": 1760000000,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "AIHubMix ist eine API-Plattform, die Modellfunktionen mehrerer Anbieter bündelt. Die offizielle Website ist https://aihubmix.com."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 220,
    "completion_tokens": 240,
    "total_tokens": 460,
    "prompt_tokens_details": {
      "audio_tokens": 0,
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "accepted_prediction_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 196,
      "rejected_prediction_tokens": 0
    }
  }
}

Zuletzt aktualisiert: 2026-06-15

Erste Schritte

Gateway-Funktionen

Modellfähigkeiten

Protokoll-Referenz

Plattform-Verwaltung

Datenschutz und Bedingungen

LLM Search

1️⃣ Echtzeit-Websuche: Die zeitliche Begrenzung von LLMs durchbrechen für genauere und zuverlässigere Ausgaben

Verwendungsanleitung

2️⃣ Smart Surfing: KI das freie Surfen im Internet ermöglichen

​1️⃣ Echtzeit-Websuche: Die zeitliche Begrenzung von LLMs durchbrechen für genauere und zuverlässigere Ausgaben

​Verwendungsanleitung

​2️⃣ Smart Surfing: KI das freie Surfen im Internet ermöglichen

1️⃣ Echtzeit-Websuche: Die zeitliche Begrenzung von LLMs durchbrechen für genauere und zuverlässigere Ausgaben

Verwendungsanleitung

2️⃣ Smart Surfing: KI das freie Surfen im Internet ermöglichen