
Auto Router
Setzen Sie den Modellnamen aufauto, und das Gateway wählt anhand Ihrer Anfrage das beste Modell aus den Hunderten auf der Plattform aus — mit kostenorientierten, qualitätsorientierten oder latenzarmen Strategien, abgerechnet nach dem Modell, das tatsächlich angesprochen wird. Kein manuelles Vergleichen oder Umschalten von Modellen und keine Änderungen am Client-Code. Siehe Auto Router.
Beliebiges Modell über das Responses-Protokoll
Der Endpunkt/v1/responses ist nicht länger auf die GPT-Familie beschränkt — er kann jetzt jedes Modell auf der Plattform ansprechen. Auf dem Responses-Protokoll aufbauende Tools (wie die Codex CLI) können daher GLM, Gemini, DeepSeek, Kimi, Qwen und mehr über einen lokalen Modellkatalog nutzen, statt auf die offiziellen Modelle von OpenAI beschränkt zu sein. Siehe Codex CLI · Custom Models.
Model Mapping & Fallback
Konfigurieren Sie Alias-Mapping und Fehler-Fallback pro API-Schlüssel in der Konsole: Ihr Client kann einen beliebigen Modellnamen verwenden, den das Gateway auf das echte Upstream-Modell umschreibt; fällt das primäre Modell aus, wird automatisch auf ein Backup umgeschaltet, abgerechnet nach dem Modell, das letztlich antwortet. Ein einzelner Aussetzer lässt Ihren Produktiv-Traffic nicht abbrechen, und der Client-Code bleibt unberührt. Siehe Model Mapping & Fallback.AIHubMix CLI
Eine einzelne Binärdatei ohne Abhängigkeiten — kein Python, Node oder Go erforderlich. Fragen Sie Ihr Guthaben ab, verwalten Sie API-Schlüssel und listen Sie verfügbare Modelle direkt im Terminal auf, mit erstklassiger Unterstützung für Skripte und KI-Agenten wie Claude Code. Siehe AIHubMix CLI.AIHubMix Skill (Erweiterung für KI-Coding-Agenten)
Eine lokale Erweiterung für KI-Agenten, die Skills unterstützen — Codex, Claude Code, Cursor, Cline und mehr. Verwenden Sie natürliche Sprache, um AIHubMix zu integrieren, Modelle abzufragen, nach Fähigkeit auszuwählen, Beispiele zu generieren und Fehler zu beheben. Anstatt eine feste Modellliste zu bündeln, liest die Skill bei Bedarf aktuelle Modell-, Preis- und Protokollinformationen aus den offiziellen APIs von AIHubMix, sodass sich der Agent nie auf veralteten Speicher verlässt. Siehe Skills.Backup-Domain: api.inferera.com
Wenn die Hauptdomainaihubmix.com nicht erreichbar ist oder Zeitüberschreitungen auftreten, richten Sie Ihre Anfragen an https://api.inferera.com. Endpunkte und Funktionen sind identisch — Ihr API-Schlüssel, Modell und Anfrage-Body ändern sich nicht.
Außerdem ausgeliefert
- Gemini-Audioeingabe: Der OpenAI-kompatible Endpunkt (
/v1/chat/completions) akzeptiert jetztinput_audiound gibt audio_tokens in der Nutzung zurück. - GLM 5.2 Reasoning Effort: Der native Zhipu-Kanal unterstützt
reasoning_effortfür eine anpassbare Denktiefe. - Open-Design-Integration: AIHubMix ist jetzt ein integriertes BYOK-Gateway für Open Design.
- OpenClaw-Plugin-Fix: aihubmix-auth ist behoben und stabil nutzbar.
Stabilität & Fixes
- Verbesserte Abrechnungsgenauigkeit und präzisere Cache-Messung.
- Fehlende Modelle in
/v1/modelsbehoben. - Mehrere Probleme bei der Videogenerierung und beim Kanaltest behoben.
Neue Modelle in diesem Monat (~20)
Chat / Allgemein- claude-fable-5 [Eingestellt]: Claudes neueste Generation, mit stärkeren Sicherheitsleitplanken (siehe Changelog · Fable 5 notes).
- minimax-m3, qwen3.7-plus, glm-5.2 und Doubao doubao-seed-2-1-pro / doubao-seed-2-1-turbo.
- kimi-k2.7-code und kimi-k2.7-code-highspeed: Kimis Code-Serie, einschließlich einer Highspeed-Variante.
- coding-glm-5.2 und das kostenlose coding-glm-5.2-free.
- Kling: Text-zu-Video, Bild-zu-Video, Multi-Bild-Referenz und omnimodale Generierung.
- happyhorse-1.1: Text-zu-Video (t2v), Referenz (r2v) und Bild-zu-Video (i2v).
- Baidu musesteamer-air-image für die Bildgenerierung.
- grok-build-0.1, hy3-preview und das kostenlose step-3.7-flash-free.
Preise & Hinweise
- step-3.7-flash, 90 % Rabatt (begrenzte Zeit): 0.132 / M Ausgabe-Tokens.
- Einstellung & Auto-Routing:
claude-opus-4-20250514undclaude-sonnet-4-20250514wurden am 15. Juni upstream eingestellt; die Plattform leitet sie automatisch auf die 4-5-Versionen derselben Familie um.
FAQ
Welche Modelle wurden diesen Monat hinzugefügt? Rund 20, verteilt auf Chat (claude-fable-5 [Eingestellt], minimax-m3, qwen3.7-plus, glm-5.2, doubao-seed-2-1-Serie), Code (kimi-k2.7-code-Serie, coding-glm-5.2), Video (Kling, happyhorse-1.1) und Bild (musesteamer-air-image). Wie verwende ich den Auto Router? Setzen Sie den Modellnamen in Ihrer Anfrage aufauto; das Gateway wählt anhand Ihrer Anfrage das beste Modell aus und rechnet nach dem Modell ab, das tatsächlich angesprochen wird, ohne Änderungen am Client-Code. Siehe Auto Router.
Was ist, wenn die Hauptdomain nicht erreichbar ist?
Ersetzen Sie die Anfrageadresse durch die Backup-Domain https://api.inferera.com. Endpunkte und Funktionen sind identisch, und es müssen keine Parameter geändert werden.
Wie lautet der zeitlich begrenzte Preis für step-3.7-flash?
0.132 / M Ausgabe-Tokens.
Durchsuchen Sie alle Modelle im Modellkatalog und finden Sie Integrationsdetails in der Dokumentation.
Aktualisiert: 2026-06-30