Documentation Index
Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
Use this file to discover all available pages before exploring further.
1️⃣ Búsqueda web en tiempo real: superando las limitaciones temporales del LLM para obtener salidas más precisas y fiables
Hemos mejorado las series de modelos OpenAI y Gemini con la capacidad de acceder a la información más reciente de la web, ayudándote a:
- ✅ Acceder a la información más reciente: Obtén actualizaciones en tiempo real sobre eventos actuales, las últimas investigaciones o datos en vivo
- ✅ Eliminar lagunas de conocimiento: Supera las limitaciones temporales de los datos de entrenamiento del LLM accediendo a información posterior al entrenamiento
- ✅ Reducir alucinaciones: Proporciona respuestas basadas en hechos mediante búsquedas web en tiempo real, reduciendo significativamente las fabulaciones de la IA
- ✅ Mejorar la calidad de las decisiones: Toma decisiones con mayor confianza basadas en análisis y recomendaciones fundamentadas en hechos actuales
Modelos admitidos:
Actualmente se admiten las series de modelos OpenAI y Gemini con dos métodos de integración:
1. Modelos con capacidades de búsqueda nativa
Serie Gemini (Grounding con la búsqueda de Google):
- gemini-2.0-pro-exp-02-05-search
- gemini-2.0-flash-exp-search
- gemini-2.0-flash-search
Serie OpenAI (Búsqueda con Bing):
- gpt-4o-search-preview
- gpt-4o-mini-search-preview
2. Soporte basado en parámetros
Simplemente añade el parámetro web_search_options={} para habilitar la conectividad web en todos los modelos Gemini y OpenAI. La tarifa de búsqueda para los modelos Gemini es de $35 por mil búsquedas.
Guía de uso
Antes de usarlo, ejecuta pip install -U openai para actualizar el paquete openai.
Ejemplo:
from openai import OpenAI
client = OpenAI(
api_key="AIHUBMIX_API_KEY", # Replace with the key you generated in AiHubMix
base_url="https://aihubmix.com/v1"
)
chat_completion = client.chat.completions.create(
model="gemini-2.0-flash-exp",
# 🌐 Enable search
web_search_options={},
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "Search for information about the AIhubmix LLM API platform, provide a brief introduction, and include relevant links."
}
]
}
]
)
print(chat_completion.choices[0].message.content)
2️⃣ Smart Surfing: permitir a la IA explorar internet libremente
Añadiendo :surfing al ID del modelo, cualquier modelo de lenguaje grande puede equiparse con capacidades de búsqueda.
- Solo tienes que añadir el sufijo; no se requiere una integración compleja
- Este método reenviará por defecto la solicitud del usuario al servicio de búsqueda Tavily, y el LLM hará referencia a los resultados de búsqueda en su respuesta
- Tarifa de búsqueda: $0.006 por búsqueda
- Actualmente, la tarifa se deduce directamente del “cambio de saldo”, y los “detalles del registro” aún no muestran la tarifa de búsqueda, pero se incluirán en el futuro
Ejemplo:
import requests
import json
import os
try:
response = requests.post(
url="https://aihubmix.com/v1/chat/completions",
headers={
"Authorization": f"Bearer {os.environ.get('AIHUBMIX_API_KEY')}",
"Content-Type": "application/json",
},
data=json.dumps({
"model": "gpt-4o-mini:surfing", # Append :surfing to the model id to support searching
"messages": [
{
"role": "user",
"content": "Search the last fact about ChatGPT memory feature, return with the URL"
}
]
})
)
result = response.json()
print("API response:", json.dumps(result, ensure_ascii=False, indent=2))
except requests.exceptions.RequestException as e:
print(f"Request error: {e}")
except json.JSONDecodeError as e:
print(f"JSON decode error: {e}")
except Exception as e:
print(f"Other error: {e}")
Ejemplo de respuesta de la API:
{
"id": "chatcmpl-BLN21dGcrv8MrbeHfForjY4bYZHBF",
"model": "gpt-4o-mini-2024-07-18",
"object": "chat.completion",
"created": 1744433121,
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "The latest update about ChatGPT's memory feature indicates that it now has expanded memory capabilities that allow it to recall information in two ways: through “saved memories” that users manually ask it to remember, and “reference chat history” for improving future interactions. For more details, you can visit the URL: [The Verge Article](https://www.theverge.com/news/646968/openai-chatgpt-long-term-memory-upgrade)."
},
"finish_reason": "stop"
}
],
"system_fingerprint": "fp_ded0d14823",
"usage": {
"prompt_tokens": 604,
"completion_tokens": 89,
"total_tokens": 693,
"prompt_tokens_details": {
"audio_tokens": 0,
"cached_tokens": 0
},
"completion_tokens_details": {
"accepted_prediction_tokens": 0,
"audio_tokens": 0,
"reasoning_tokens": 0,
"rejected_prediction_tokens": 0
}
}
}
Última actualización: 2026-06-01