Zum Hauptinhalt springen
AIHubMix Release Spotlight Juni 2026: neue Modelle und Plattformfunktionen
In diesem Monat hat AIHubMix rund 20 neue Modelle für Chat, Code, Video und Bild hinzugefügt und mehrere Plattformfunktionen ausgeliefert. Mit demselben API-Schlüssel erreichen Sie nun noch mehr. Hier sind die Highlights.

Auto Router

Setzen Sie den Modellnamen auf auto, und das Gateway wählt anhand Ihrer Anfrage das beste Modell aus den Hunderten auf der Plattform aus — mit kostenorientierten, qualitätsorientierten oder latenzarmen Strategien, abgerechnet nach dem Modell, das tatsächlich angesprochen wird. Kein manuelles Vergleichen oder Umschalten von Modellen und keine Änderungen am Client-Code. Siehe Auto Router.

Beliebiges Modell über das Responses-Protokoll

Der Endpunkt /v1/responses ist nicht länger auf die GPT-Familie beschränkt — er kann jetzt jedes Modell auf der Plattform ansprechen. Auf dem Responses-Protokoll aufbauende Tools (wie die Codex CLI) können daher GLM, Gemini, DeepSeek, Kimi, Qwen und mehr über einen lokalen Modellkatalog nutzen, statt auf die offiziellen Modelle von OpenAI beschränkt zu sein. Siehe Codex CLI · Custom Models.

Model Mapping & Fallback

Konfigurieren Sie Alias-Mapping und Fehler-Fallback pro API-Schlüssel in der Konsole: Ihr Client kann einen beliebigen Modellnamen verwenden, den das Gateway auf das echte Upstream-Modell umschreibt; fällt das primäre Modell aus, wird automatisch auf ein Backup umgeschaltet, abgerechnet nach dem Modell, das letztlich antwortet. Ein einzelner Aussetzer lässt Ihren Produktiv-Traffic nicht abbrechen, und der Client-Code bleibt unberührt. Siehe Model Mapping & Fallback.

AIHubMix CLI

Eine einzelne Binärdatei ohne Abhängigkeiten — kein Python, Node oder Go erforderlich. Fragen Sie Ihr Guthaben ab, verwalten Sie API-Schlüssel und listen Sie verfügbare Modelle direkt im Terminal auf, mit erstklassiger Unterstützung für Skripte und KI-Agenten wie Claude Code. Siehe AIHubMix CLI.

AIHubMix Skill (Erweiterung für KI-Coding-Agenten)

Eine lokale Erweiterung für KI-Agenten, die Skills unterstützen — Codex, Claude Code, Cursor, Cline und mehr. Verwenden Sie natürliche Sprache, um AIHubMix zu integrieren, Modelle abzufragen, nach Fähigkeit auszuwählen, Beispiele zu generieren und Fehler zu beheben. Anstatt eine feste Modellliste zu bündeln, liest die Skill bei Bedarf aktuelle Modell-, Preis- und Protokollinformationen aus den offiziellen APIs von AIHubMix, sodass sich der Agent nie auf veralteten Speicher verlässt. Siehe Skills.

Backup-Domain: api.inferera.com

Wenn die Hauptdomain aihubmix.com nicht erreichbar ist oder Zeitüberschreitungen auftreten, richten Sie Ihre Anfragen an https://api.inferera.com. Endpunkte und Funktionen sind identisch — Ihr API-Schlüssel, Modell und Anfrage-Body ändern sich nicht.

Außerdem ausgeliefert

  • Gemini-Audioeingabe: Der OpenAI-kompatible Endpunkt (/v1/chat/completions) akzeptiert jetzt input_audio und gibt audio_tokens in der Nutzung zurück.
  • GLM 5.2 Reasoning Effort: Der native Zhipu-Kanal unterstützt reasoning_effort für eine anpassbare Denktiefe.
  • Open-Design-Integration: AIHubMix ist jetzt ein integriertes BYOK-Gateway für Open Design.
  • OpenClaw-Plugin-Fix: aihubmix-auth ist behoben und stabil nutzbar.

Stabilität & Fixes

  • Verbesserte Abrechnungsgenauigkeit und präzisere Cache-Messung.
  • Fehlende Modelle in /v1/models behoben.
  • Mehrere Probleme bei der Videogenerierung und beim Kanaltest behoben.

Neue Modelle in diesem Monat (~20)

Chat / Allgemein
  • claude-fable-5 [Eingestellt]: Claudes neueste Generation, mit stärkeren Sicherheitsleitplanken (siehe Changelog · Fable 5 notes).
  • minimax-m3, qwen3.7-plus, glm-5.2 und Doubao doubao-seed-2-1-pro / doubao-seed-2-1-turbo.
Code
  • kimi-k2.7-code und kimi-k2.7-code-highspeed: Kimis Code-Serie, einschließlich einer Highspeed-Variante.
  • coding-glm-5.2 und das kostenlose coding-glm-5.2-free.
Video
  • Kling: Text-zu-Video, Bild-zu-Video, Multi-Bild-Referenz und omnimodale Generierung.
  • happyhorse-1.1: Text-zu-Video (t2v), Referenz (r2v) und Bild-zu-Video (i2v).
Bild
  • Baidu musesteamer-air-image für die Bildgenerierung.
Ebenfalls neu
  • grok-build-0.1, hy3-preview und das kostenlose step-3.7-flash-free.

Preise & Hinweise

  • step-3.7-flash, 90 % Rabatt (begrenzte Zeit): 0.022/MEingabeTokens,0.022 / M Eingabe-Tokens, 0.132 / M Ausgabe-Tokens.
  • Einstellung & Auto-Routing: claude-opus-4-20250514 und claude-sonnet-4-20250514 wurden am 15. Juni upstream eingestellt; die Plattform leitet sie automatisch auf die 4-5-Versionen derselben Familie um.

FAQ

Welche Modelle wurden diesen Monat hinzugefügt? Rund 20, verteilt auf Chat (claude-fable-5 [Eingestellt], minimax-m3, qwen3.7-plus, glm-5.2, doubao-seed-2-1-Serie), Code (kimi-k2.7-code-Serie, coding-glm-5.2), Video (Kling, happyhorse-1.1) und Bild (musesteamer-air-image). Wie verwende ich den Auto Router? Setzen Sie den Modellnamen in Ihrer Anfrage auf auto; das Gateway wählt anhand Ihrer Anfrage das beste Modell aus und rechnet nach dem Modell ab, das tatsächlich angesprochen wird, ohne Änderungen am Client-Code. Siehe Auto Router. Was ist, wenn die Hauptdomain nicht erreichbar ist? Ersetzen Sie die Anfrageadresse durch die Backup-Domain https://api.inferera.com. Endpunkte und Funktionen sind identisch, und es müssen keine Parameter geändert werden. Wie lautet der zeitlich begrenzte Preis für step-3.7-flash? 0.022/MEingabeTokensund0.022 / M Eingabe-Tokens und 0.132 / M Ausgabe-Tokens. Durchsuchen Sie alle Modelle im Modellkatalog und finden Sie Integrationsdetails in der Dokumentation.
Aktualisiert: 2026-06-30