Documentation Index
Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
Use this file to discover all available pages before exploring further.
Beschreibung
Wir haben die drei Kern-Schnittstellen von Jina AI integriert, mit denen Sie einfach leistungsfähige intelligente Agenten aufbauen können. Diese Schnittstellen eignen sich vor allem für folgende Szenarien:- Vektor-Embeddings (Embeddings): Geeignet für multimodale RAG-Frage-Antwort-Szenarien wie intelligenten Kundenservice, intelligentes Recruiting und Wissensdatenbank-Q&A.
- Reranking (Rerank): Optimiert die Embedding-Kandidaten und ordnet sie nach Themenrelevanz neu, was die Antwortqualität großer Sprachmodelle deutlich verbessert.
- Tiefe Suche (DeepSearch): Führt tiefe Suche und Reasoning durch, bis die optimale Antwort gefunden wird – besonders geeignet für komplexe Aufgaben wie Forschungsprojekte und Produktlösungsentwicklung.
Schnellstart
Ersetzen SieAPI_KEY durch AIHUBMIX_API_KEY und den Modell-Endpoint-Link – alle anderen Parameter und die Verwendung sind vollständig konsistent mit Jina AI offiziell.
Endpoint-Ersetzung:
- Vektor-Embeddings (Embeddings):
https://jina.ai/embeddings→https://aihubmix.com/v1/embeddings - Reranking (Rerank):
https://api.jina.ai/v1/rerank→https://aihubmix.com/v1/rerank - Tiefe Suche (DeepSearch):
https://deepsearch.jina.ai/v1/chat/completions→https://aihubmix.com/v1/chat/completions
Embeddings
Jina AIs Embedding unterstützt sowohl reinen Text als auch multimodale Bilder und überzeugt insbesondere bei mehrsprachigen Aufgaben.Anfrage-Parameter
Modellname, verfügbare Modellliste:
jina-clip-v2: Multimodal, mehrsprachig, 1024 Dimensionen, 8K-Kontextfenster, 865M Parameterjina-embeddings-v3: Textmodell, mehrsprachig, 1024 Dimensionen, 8K-Kontextfenster, 570M Parameterjina-colbert-v2: Mehrsprachiges ColBERT-Modell, 8K-Token-Kontext, 560M Parameter, verwendet für Embedding und Rerankingjina-embeddings-v2-base-code: Für Code- und Dokumentensuche optimiertes Modell, 768 Dimensionen, 8K-Kontextfenster, 137M Parameter
Eingabetext oder -bild; unterschiedliche Modelle unterstützen unterschiedliche Eingabeformate. Für Text: ein Array von Strings; für multimodale Modelle: ein Array von Objekten mit den Feldern
text oder image.Rückgabedatentyp, mögliche Werte:
float: Standard, gibt ein Float-Array zurück. Häufigstes und am einfachsten zu nutzendes Formatbinary_int8: Rückgabe als gepacktes int8-Binärformat. Effizienter für Speicherung, Suche und Übertragungbinary_uint8: Rückgabe als gepacktes uint8-Binärformat. Effizienter für Speicherung, Suche und Übertragungbase64: Rückgabe als base64-kodierter String. Effizienter für die Übertragung
Anzahl der bei der Berechnung verwendeten Dimensionen. Unterstützte Werte:
- 1024
- 768
1. Multimodale Nutzung
2. Nutzung mit reinem Text
Geben Sie nur ein Array von Text-Strings an; das Feldimage wird nicht angegeben.
Rerank
Reranker zielt darauf ab, die Suchrelevanz und RAG-Genauigkeit zu verbessern. Er analysiert die ursprünglichen Suchergebnisse tiefgehend, berücksichtigt die subtilen Wechselwirkungen zwischen Anfrage und Dokumentinhalt und ordnet die Suchergebnisse neu, sodass die relevantesten Treffer ganz oben stehen.Anfrage-Parameter
Modellname, verfügbare Modellliste:
jina-reranker-m0: Multimodaler mehrsprachiger Dokument-Reranker, 10K-Kontext, 2,4B Parameter, für die Sortierung visueller Dokumente
Suchanfrage-Text, der mit den Kandidatendokumenten verglichen wird
Anzahl der zurückzugebenden relevantesten Dokumente. Standardmäßig werden alle Dokumente zurückgegeben.
Array der Kandidatendokumente, die nach Relevanz zur Anfrage neu geordnet werden
Maximale Chunk-Länge pro Dokument, gilt nur für Cohere (nicht von Jina unterstützt). Standardwert: 4096.
Lange Dokumente werden automatisch auf die angegebene Token-Anzahl gekürzt.
1. Multimodale Nutzung
Antwortbeschreibung
model: Name des verwendeten Modellsresults: Array der Reranking-Ergebnisse, absteigend nach Relevanz-Score sortiert. Jedes Element enthält:index: Indexposition im ursprünglichen Dokument-Arrayrelevance_score: Relevanzwert zwischen 0 und 1; höhere Werte bedeuten höhere Relevanz zur Anfrage
usage: Nutzungsstatistiktotal_tokens: Gesamtanzahl der in dieser Anfrage verarbeiteten Tokens
2. Text-Nutzung
Text-Reranking unterstützt sowohl mehrsprachige als auch reguläre Aufgaben, ähnlich der Embedding-Nutzung: Übergeben Sie ein Array.DeepSearch
DeepSearch kombiniert Such-, Lese- und Reasoning-Fähigkeiten, um die bestmögliche Antwort zu liefern. Vollständig kompatibel mit dem OpenAI Chat-API-Format — ersetzen Sie einfachapi.openai.com durch aihubmix.com, um loszulegen.
Der Stream gibt den Denkprozess zurück.
Anfrage-Parameter
Modellname, verfügbare Modelle:
jina-deepsearch-v1: Standardmodell, sucht, liest und reasoniert, bis die beste Antwort gefunden ist
Ob Streaming-Antworten aktiviert werden. Es wird dringend empfohlen, diese Option aktiviert zu lassen — DeepSearch-Anfragen können lange dauern; ohne Streaming kann es zu einem
524 Timeout-Fehler kommen.Liste der Konversationsnachrichten zwischen Nutzer und Assistent. Unterstützt mehrere Typen (modal) wie Text (.txt, .pdf), Bilder (.png, .webp, .jpeg) usw. Maximale Dateigröße: 10MB.
Multimodales Nachrichtenformat
DeepSearch unterstützt mehrere Nachrichtenformate, darunter reinen Text (message), Dateien (file) und Bilder (image). Beispiele für verschiedene Formate:
1. Reine Textnachricht
2. Nachricht mit Datei-Anhang
3. Nachricht mit Bild
Aufruf-Beispiel
Bitte beachten Sie: Der Python-Streaming-Aufruf von Jina AI auf der offiziellen Website liefert keine Antwort — verwenden Sie stattdessen unser Beispiel.Antwortbeschreibung
Die Antwort von DeepSearch wird standardmäßig gestreamt — sowohl Zwischenschritte des Reasonings als auch die endgültige Antwort. Der letzte Stream-Block enthält die finale Antwort, eine Liste der besuchten URLs und Details zur Token-Nutzung. Ohne Streaming wird nur die endgültige Antwort zurückgegeben — Zwischenschritte des „Denkens” werden weggelassen. Hinweis: Dieses JSON-Objekt unterscheidet sich vom Format, das Jina AI verwendet.Python
Zuletzt aktualisiert: 2026-06-01