Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt

Use this file to discover all available pages before exploring further.

1️⃣ Búsqueda web en tiempo real: superando las limitaciones temporales del LLM para obtener salidas más precisas y fiables

Hemos mejorado las series de modelos OpenAI y Gemini con la capacidad de acceder a la información más reciente de la web, ayudándote a:
  • Acceder a la información más reciente: Obtén actualizaciones en tiempo real sobre eventos actuales, las últimas investigaciones o datos en vivo
  • Eliminar lagunas de conocimiento: Supera las limitaciones temporales de los datos de entrenamiento del LLM accediendo a información posterior al entrenamiento
  • Reducir alucinaciones: Proporciona respuestas basadas en hechos mediante búsquedas web en tiempo real, reduciendo significativamente las fabulaciones de la IA
  • Mejorar la calidad de las decisiones: Toma decisiones con mayor confianza basadas en análisis y recomendaciones fundamentadas en hechos actuales
Modelos admitidos: Actualmente se admiten las series de modelos OpenAI y Gemini con dos métodos de integración: 1. Modelos con capacidades de búsqueda nativa Serie Gemini (Grounding con la búsqueda de Google):
  • gemini-2.0-pro-exp-02-05-search
  • gemini-2.0-flash-exp-search
  • gemini-2.0-flash-search
Serie OpenAI (Búsqueda con Bing):
  • gpt-4o-search-preview
  • gpt-4o-mini-search-preview
2. Soporte basado en parámetros Simplemente añade el parámetro web_search_options={} para habilitar la conectividad web en todos los modelos Gemini y OpenAI. La tarifa de búsqueda para los modelos Gemini es de $35 por mil búsquedas.

Guía de uso

Antes de usarlo, ejecuta pip install -U openai para actualizar el paquete openai. Ejemplo:
from openai import OpenAI

client = OpenAI(
    api_key="AIHUBMIX_API_KEY", # Replace with the key you generated in AiHubMix
    base_url="https://aihubmix.com/v1"
)

chat_completion = client.chat.completions.create(
    model="gemini-2.0-flash-exp",
    # 🌐 Enable search
    web_search_options={},
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Search for information about the AIhubmix LLM API platform, provide a brief introduction, and include relevant links."
                }
            ]
        }
    ]
)

print(chat_completion.choices[0].message.content)

2️⃣ Smart Surfing: permitir a la IA explorar internet libremente

Añadiendo :surfing al ID del modelo, cualquier modelo de lenguaje grande puede equiparse con capacidades de búsqueda.
  • Solo tienes que añadir el sufijo; no se requiere una integración compleja
  • Este método reenviará por defecto la solicitud del usuario al servicio de búsqueda Tavily, y el LLM hará referencia a los resultados de búsqueda en su respuesta
  • Tarifa de búsqueda: $0.006 por búsqueda
  • Actualmente, la tarifa se deduce directamente del “cambio de saldo”, y los “detalles del registro” aún no muestran la tarifa de búsqueda, pero se incluirán en el futuro
El ID del modelo se puede copiar desde la galería de modelos.
Ejemplo:
import requests
import json
import os

try:
    response = requests.post(
        url="https://aihubmix.com/v1/chat/completions",
        headers={
            "Authorization": f"Bearer {os.environ.get('AIHUBMIX_API_KEY')}",
            "Content-Type": "application/json",
        },
        data=json.dumps({
            "model": "gpt-4o-mini:surfing", # Append :surfing to the model id to support searching
            "messages": [
                {
                    "role": "user",
                    "content": "Search the last fact about ChatGPT memory feature, return with the URL"
                }
            ]
        })
    )

    result = response.json()
    print("API response:", json.dumps(result, ensure_ascii=False, indent=2))

except requests.exceptions.RequestException as e:
    print(f"Request error: {e}")
except json.JSONDecodeError as e:
    print(f"JSON decode error: {e}")
except Exception as e:
    print(f"Other error: {e}")
Ejemplo de respuesta de la API:
{
  "id": "chatcmpl-BLN21dGcrv8MrbeHfForjY4bYZHBF",
  "model": "gpt-4o-mini-2024-07-18",
  "object": "chat.completion",
  "created": 1744433121,
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The latest update about ChatGPT's memory feature indicates that it now has expanded memory capabilities that allow it to recall information in two ways: through “saved memories” that users manually ask it to remember, and “reference chat history” for improving future interactions. For more details, you can visit the URL: [The Verge Article](https://www.theverge.com/news/646968/openai-chatgpt-long-term-memory-upgrade)."
      },
      "finish_reason": "stop"
    }
  ],
  "system_fingerprint": "fp_ded0d14823",
  "usage": {
    "prompt_tokens": 604,
    "completion_tokens": 89,
    "total_tokens": 693,
    "prompt_tokens_details": {
      "audio_tokens": 0,
      "cached_tokens": 0
    },
    "completion_tokens_details": {
      "accepted_prediction_tokens": 0,
      "audio_tokens": 0,
      "reasoning_tokens": 0,
      "rejected_prediction_tokens": 0
    }
  }
}

Última actualización: 2026-06-01