> ## Documentation Index
> Fetch the complete documentation index at: https://docs.aihubmix.com/llms.txt
> Use this file to discover all available pages before exploring further.

# Release Spotlight Juni 2026: ~20 neue Modelle

> Im Juni 2026 hat AIHubMix rund 20 neue Modelle hinzugefügt — claude-fable-5 [Eingestellt], glm-5.2, minimax-m3, qwen3.7-plus, kimi-k2.7-code, Kling-Video und mehr — und den Auto Router, das Responses-Protokoll für beliebige Modelle, Mapping & Fallback, die AIHubMix CLI und Skill sowie eine Backup-Domain ausgeliefert.

<Frame>
  <img src="https://mintcdn.com/aihubmix/KfVPdfHEI_4FVLQw/images/blogs/aihubmix-2026-06-recap.webp?fit=max&auto=format&n=KfVPdfHEI_4FVLQw&q=85&s=7af8996a5bc985f3996cf796e3299a4f" alt="AIHubMix Release Spotlight Juni 2026: neue Modelle und Plattformfunktionen" width="2400" height="1260" data-path="images/blogs/aihubmix-2026-06-recap.webp" />
</Frame>

In diesem Monat hat AIHubMix rund 20 neue Modelle für Chat, Code, Video und Bild hinzugefügt und mehrere Plattformfunktionen ausgeliefert. Mit demselben API-Schlüssel erreichen Sie nun noch mehr. Hier sind die Highlights.

## Auto Router

Setzen Sie den Modellnamen auf `auto`, und das Gateway wählt anhand Ihrer Anfrage das beste Modell aus den Hunderten auf der Plattform aus — mit kostenorientierten, qualitätsorientierten oder latenzarmen Strategien, abgerechnet nach dem Modell, das tatsächlich angesprochen wird. Kein manuelles Vergleichen oder Umschalten von Modellen und keine Änderungen am Client-Code. Siehe [Auto Router](/de/api/auto-router).

## Beliebiges Modell über das Responses-Protokoll

Der Endpunkt `/v1/responses` ist nicht länger auf die GPT-Familie beschränkt — er kann jetzt jedes Modell auf der Plattform ansprechen. Auf dem Responses-Protokoll aufbauende Tools (wie die Codex CLI) können daher GLM, Gemini, DeepSeek, Kimi, Qwen und mehr über einen lokalen Modellkatalog nutzen, statt auf die offiziellen Modelle von OpenAI beschränkt zu sein. Siehe [Codex CLI · Custom Models](/de/api/Codex-CLI#custom-models).

## Model Mapping & Fallback

Konfigurieren Sie Alias-Mapping und Fehler-Fallback pro API-Schlüssel in der Konsole: Ihr Client kann einen beliebigen Modellnamen verwenden, den das Gateway auf das echte Upstream-Modell umschreibt; fällt das primäre Modell aus, wird automatisch auf ein Backup umgeschaltet, abgerechnet nach dem Modell, das letztlich antwortet. Ein einzelner Aussetzer lässt Ihren Produktiv-Traffic nicht abbrechen, und der Client-Code bleibt unberührt. Siehe [Model Mapping & Fallback](/de/api/Model-Mapping-Fallback).

## AIHubMix CLI

Eine einzelne Binärdatei ohne Abhängigkeiten — kein Python, Node oder Go erforderlich. Fragen Sie Ihr Guthaben ab, verwalten Sie API-Schlüssel und listen Sie verfügbare Modelle direkt im Terminal auf, mit erstklassiger Unterstützung für Skripte und KI-Agenten wie Claude Code. Siehe [AIHubMix CLI](/de/api/aihubmix-cli).

## AIHubMix Skill (Erweiterung für KI-Coding-Agenten)

Eine lokale Erweiterung für KI-Agenten, die Skills unterstützen — Codex, Claude Code, Cursor, Cline und mehr. Verwenden Sie natürliche Sprache, um AIHubMix zu integrieren, Modelle abzufragen, nach Fähigkeit auszuwählen, Beispiele zu generieren und Fehler zu beheben. Anstatt eine feste Modellliste zu bündeln, liest die Skill bei Bedarf aktuelle Modell-, Preis- und Protokollinformationen aus den offiziellen APIs von AIHubMix, sodass sich der Agent nie auf veralteten Speicher verlässt. Siehe [Skills](/de/skills).

## Backup-Domain: api.inferera.com

Wenn die Hauptdomain `aihubmix.com` nicht erreichbar ist oder Zeitüberschreitungen auftreten, richten Sie Ihre Anfragen an `https://api.inferera.com`. Endpunkte und Funktionen sind identisch — Ihr API-Schlüssel, Modell und Anfrage-Body ändern sich nicht.

## Außerdem ausgeliefert

* **Gemini-Audioeingabe**: Der OpenAI-kompatible Endpunkt (`/v1/chat/completions`) akzeptiert jetzt `input_audio` und gibt audio\_tokens in der Nutzung zurück.
* **GLM 5.2 Reasoning Effort**: Der native Zhipu-Kanal unterstützt `reasoning_effort` für eine anpassbare Denktiefe.
* **Open-Design-Integration**: AIHubMix ist jetzt ein integriertes BYOK-Gateway für [Open Design](/de/clients/Open-Design).
* **OpenClaw-Plugin-Fix**: [aihubmix-auth](https://github.com/akakenle/aihubmix-auth) ist behoben und stabil nutzbar.

## Stabilität & Fixes

* Verbesserte Abrechnungsgenauigkeit und präzisere Cache-Messung.
* Fehlende Modelle in `/v1/models` behoben.
* Mehrere Probleme bei der Videogenerierung und beim Kanaltest behoben.

## Neue Modelle in diesem Monat (\~20)

**Chat / Allgemein**

* **claude-fable-5** \[Eingestellt]: Claudes neueste Generation, mit stärkeren Sicherheitsleitplanken (siehe [Changelog · Fable 5 notes](/de/update/News#10-juni)).
* **minimax-m3**, **qwen3.7-plus**, **glm-5.2** und Doubao **doubao-seed-2-1-pro / doubao-seed-2-1-turbo**.

**Code**

* **kimi-k2.7-code** und **kimi-k2.7-code-highspeed**: Kimis Code-Serie, einschließlich einer Highspeed-Variante.
* **coding-glm-5.2** und das kostenlose **coding-glm-5.2-free**.

**Video**

* **Kling**: Text-zu-Video, Bild-zu-Video, Multi-Bild-Referenz und omnimodale Generierung.
* **happyhorse-1.1**: Text-zu-Video (t2v), Referenz (r2v) und Bild-zu-Video (i2v).

**Bild**

* Baidu **musesteamer-air-image** für die Bildgenerierung.

**Ebenfalls neu**

* **grok-build-0.1**, **hy3-preview** und das kostenlose **step-3.7-flash-free**.

## Preise & Hinweise

* **step-3.7-flash, 90 % Rabatt (begrenzte Zeit)**: $0.022 / M Eingabe-Tokens, $0.132 / M Ausgabe-Tokens.
* **Einstellung & Auto-Routing**: `claude-opus-4-20250514` und `claude-sonnet-4-20250514` wurden am 15. Juni upstream eingestellt; die Plattform leitet sie automatisch auf die 4-5-Versionen derselben Familie um.

## FAQ

**Welche Modelle wurden diesen Monat hinzugefügt?**
Rund 20, verteilt auf Chat (claude-fable-5 \[Eingestellt], minimax-m3, qwen3.7-plus, glm-5.2, doubao-seed-2-1-Serie), Code (kimi-k2.7-code-Serie, coding-glm-5.2), Video (Kling, happyhorse-1.1) und Bild (musesteamer-air-image).

**Wie verwende ich den Auto Router?**
Setzen Sie den Modellnamen in Ihrer Anfrage auf `auto`; das Gateway wählt anhand Ihrer Anfrage das beste Modell aus und rechnet nach dem Modell ab, das tatsächlich angesprochen wird, ohne Änderungen am Client-Code. Siehe [Auto Router](/de/api/auto-router).

**Was ist, wenn die Hauptdomain nicht erreichbar ist?**
Ersetzen Sie die Anfrageadresse durch die Backup-Domain `https://api.inferera.com`. Endpunkte und Funktionen sind identisch, und es müssen keine Parameter geändert werden.

**Wie lautet der zeitlich begrenzte Preis für step-3.7-flash?**
$0.022 / M Eingabe-Tokens und $0.132 / M Ausgabe-Tokens.

Durchsuchen Sie alle Modelle im [Modellkatalog](https://aihubmix.com) und finden Sie Integrationsdetails in der [Dokumentation](https://docs.aihubmix.com).

***

Aktualisiert: 2026-06-30