Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

1️⃣ Echtzeit-Websuche: Die zeitliche Begrenzung von LLMs durchbrechen für genauere und zuverlässigere Ausgaben

Wir haben die Modelle der OpenAI- und Gemini-Serie um die Fähigkeit erweitert, die neuesten Informationen aus dem Web abzurufen, damit Sie:
  • Aktuelle Informationen erhalten: Echtzeit-Updates zu aktuellen Ereignissen, neuester Forschung oder Live-Daten
  • Wissenslücken schließen: Die zeitlichen Beschränkungen der Trainingsdaten überwinden, indem Sie auf Informationen nach dem Training zugreifen
  • Halluzinationen reduzieren: Faktenbasierte Antworten durch Echtzeit-Websuche liefern und KI-Konfabulationen deutlich verringern
  • Entscheidungsqualität verbessern: Sichere Entscheidungen auf Basis aktueller Analysen und Empfehlungen treffen
Unterstützte Modelle: Derzeit unterstützt für die Modellserien OpenAI und Gemini mit zwei Integrationsmethoden: 1. Modelle mit nativen Suchfunktionen Gemini-Serie (Ground with Google search):
  • gemini-2.0-pro-exp-02-05-search
  • gemini-2.0-flash-exp-search
  • gemini-2.0-flash-search
OpenAI-Serie (Bing-Suche):
  • gpt-4o-search-preview
  • gpt-4o-mini-search-preview
2. Parameter-basierte Unterstützung Fügen Sie einfach den Parameter web_search_options={} hinzu, um die Web-Anbindung für alle Gemini- und OpenAI-Modelle zu aktivieren. Die Suchgebühr für Gemini-Modelle beträgt $35 pro tausend Suchanfragen.

Verwendungsanleitung

Führen Sie vor der Nutzung pip install -U openai aus, um das openai-Paket zu aktualisieren. Beispiel:
from openai import OpenAI

client = OpenAI(
    api_key="AIHUBMIX_API_KEY", # Replace with the key you generated in AiHubMix
    base_url="https://aihubmix.com/v1"
)

chat_completion = client.chat.completions.create(
    model="gemini-2.0-flash-exp",
    # 🌐 Enable search
    web_search_options={},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Search for information about the AIhubmix LLM API platform, provide a brief introduction, and include relevant links."
                }
            ]
        }
    ]
)

print(chat_completion.choices[0].message.content)

2️⃣ Smart Surfing: KI das freie Surfen im Internet ermöglichen

Indem Sie an die Modell-ID :surfing anhängen, kann jedes große Sprachmodell mit Suchfunktionen ausgestattet werden.
  • Einfach das Suffix anhängen, keine komplexe Integration erforderlich
  • Diese Methode leitet die Anfrage des Benutzers standardmäßig an den Tavily-Suchdienst weiter, und das LLM berücksichtigt die Suchergebnisse bei seiner Antwort
  • Suchgebühr: $0,006 pro Suche
  • Die Gebühr wird derzeit direkt vom „Credit-Saldo” abgezogen, im „Log-Detail” wird die Suchgebühr noch nicht aufgeführt, dies wird jedoch zukünftig angezeigt
Die Modell-ID können Sie aus der Modellgalerie kopieren.
Beispiel:
import requests
import json
import os

try:
    response = requests.post(
        url="https://aihubmix.com/v1/chat/completions",
        headers={
            "Authorization": f"Bearer {os.environ.get('AIHUBMIX_API_KEY')}",
            "Content-Type": "application/json",
        },
        data=json.dumps({
            "model": "gpt-4o-mini:surfing", # Append :surfing to the model id to support searching
            "messages": [
                {
                    "role": "user",
                    "content": "Search the last fact about ChatGPT memory feature, return with the URL"
                }
            ]
        })
    )

    result = response.json()
    print("API response:", json.dumps(result, ensure_ascii=False, indent=2))

except requests.exceptions.RequestException as e:
    print(f"Request error: {e}")
except json.JSONDecodeError as e:
    print(f"JSON decode error: {e}")
except Exception as e:
    print(f"Other error: {e}")
Beispiel für eine API-Antwort:
{
  "id": "chatcmpl-BLN21dGcrv8MrbeHfForjY4bYZHBF",
  "model": "gpt-4o-mini-2024-07-18",
  "object": "chat.completion",
  "created": 1744433121,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The latest update about ChatGPT's memory feature indicates that it now has expanded memory capabilities that allow it to recall information in two ways: through “saved memories” that users manually ask it to remember, and “reference chat history” for improving future interactions. For more details, you can visit the URL: [The Verge Article](https://www.theverge.com/news/646968/openai-chatgpt-long-term-memory-upgrade)."
      },
      "finish_reason": "stop"
    }
  ],
  "system_fingerprint": "fp_ded0d14823",
  "usage": {
    "prompt_tokens": 604,
    "completion_tokens": 89,
    "total_tokens": 693,
    "prompt_tokens_details": {
      "audio_tokens": 0,
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "accepted_prediction_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Zuletzt aktualisiert: 2026-06-01