Passer au contenu principal

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

1️⃣ Recherche web en temps réel : repousser les limites temporelles des LLM pour des sorties plus précises et fiables

Nous avons enrichi les séries de modèles OpenAI et Gemini de la capacité d’accéder aux dernières informations du web, vous permettant de :
  • Accéder aux informations les plus récentes : obtenir des mises à jour en temps réel sur l’actualité, les dernières recherches ou les données en direct
  • Éliminer les lacunes de connaissances : dépasser les limites temporelles des données d’entraînement des LLM en accédant aux informations postérieures à l’entraînement
  • Réduire les hallucinations : fournir des réponses fondées sur des faits grâce à des recherches web en temps réel, réduisant considérablement les inventions de l’IA
  • Améliorer la qualité des décisions : prendre des décisions plus assurées en s’appuyant sur des analyses et recommandations ancrées dans les faits actuels
Modèles pris en charge : Actuellement, les séries de modèles OpenAI et Gemini sont prises en charge avec deux méthodes d’intégration : 1. Modèles avec capacités de recherche natives Série Gemini (ancrage avec Google search) :
  • gemini-2.0-pro-exp-02-05-search
  • gemini-2.0-flash-exp-search
  • gemini-2.0-flash-search
Série OpenAI (recherche Bing) :
  • gpt-4o-search-preview
  • gpt-4o-mini-search-preview
2. Prise en charge via paramètre Ajoutez simplement le paramètre web_search_options={} pour activer la connectivité web sur tous les modèles Gemini et OpenAI. Le coût de la recherche pour les modèles Gemini est de $35 pour mille recherches.

Guide d’utilisation

Avant utilisation, exécutez pip install -U openai pour mettre à jour le package openai. Exemple :
from openai import OpenAI

client = OpenAI(
    api_key="AIHUBMIX_API_KEY", # Replace with the key you generated in AiHubMix
    base_url="https://aihubmix.com/v1"
)

chat_completion = client.chat.completions.create(
    model="gemini-2.0-flash-exp",
    # 🌐 Enable search
    web_search_options={},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Search for information about the AIhubmix LLM API platform, provide a brief introduction, and include relevant links."
                }
            ]
        }
    ]
)

print(chat_completion.choices[0].message.content)

2️⃣ Smart Surfing : permettre à l’IA d’explorer Internet librement

En ajoutant :surfing à l’ID du modèle, tout grand modèle de langage peut être doté de capacités de recherche.
  • Ajoutez simplement le suffixe, aucune intégration complexe n’est requise
  • Cette méthode redirige par défaut la requête de l’utilisateur vers le service de recherche Tavily, et le LLM utilisera les résultats de recherche pour formuler sa réponse
  • Frais de recherche : $0,006 par recherche
  • Le coût est actuellement déduit directement de la « variation de crédit » et le « détail du journal » ne liste pas encore les frais de recherche, mais cela sera affiché à l’avenir
L’ID du modèle peut être copié depuis la galerie de modèles.
Exemple :
import requests
import json
import os

try:
    response = requests.post(
        url="https://aihubmix.com/v1/chat/completions",
        headers={
            "Authorization": f"Bearer {os.environ.get('AIHUBMIX_API_KEY')}",
            "Content-Type": "application/json",
        },
        data=json.dumps({
            "model": "gpt-4o-mini:surfing", # Append :surfing to the model id to support searching
            "messages": [
                {
                    "role": "user",
                    "content": "Search the last fact about ChatGPT memory feature, return with the URL"
                }
            ]
        })
    )

    result = response.json()
    print("API response:", json.dumps(result, ensure_ascii=False, indent=2))

except requests.exceptions.RequestException as e:
    print(f"Request error: {e}")
except json.JSONDecodeError as e:
    print(f"JSON decode error: {e}")
except Exception as e:
    print(f"Other error: {e}")
Exemple de réponse API :
{
  "id": "chatcmpl-BLN21dGcrv8MrbeHfForjY4bYZHBF",
  "model": "gpt-4o-mini-2024-07-18",
  "object": "chat.completion",
  "created": 1744433121,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The latest update about ChatGPT's memory feature indicates that it now has expanded memory capabilities that allow it to recall information in two ways: through “saved memories” that users manually ask it to remember, and “reference chat history” for improving future interactions. For more details, you can visit the URL: [The Verge Article](https://www.theverge.com/news/646968/openai-chatgpt-long-term-memory-upgrade)."
      },
      "finish_reason": "stop"
    }
  ],
  "system_fingerprint": "fp_ded0d14823",
  "usage": {
    "prompt_tokens": 604,
    "completion_tokens": 89,
    "total_tokens": 693,
    "prompt_tokens_details": {
      "audio_tokens": 0,
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "accepted_prediction_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Dernière mise à jour : 2026-06-01