
Auto Router
モデル名をauto に設定すると、ゲートウェイがリクエストに応じてプラットフォーム上の数百種のモデルから最適なものを選択します——コスト優先・品質優先・低レイテンシのいずれかの戦略で、実際にヒットしたモデルに基づいて課金されます。手動での比較やモデル切り替えは不要で、クライアントコードの変更も必要ありません。詳しくは Auto Router をご覧ください。
Responses プロトコルで任意のモデルを利用
/v1/responses エンドポイントは、もはや GPT ファミリーに限定されません——プラットフォーム上の任意のモデルを呼び出せるようになりました。そのため、Responses プロトコルの上に構築されたツール(Codex CLI など)も、OpenAI 公式モデルに制限されることなく、ローカルのモデルカタログを通じて GLM、Gemini、DeepSeek、Kimi、Qwen などを利用できます。詳しくは Codex CLI · Custom Models をご覧ください。
Model Mapping & Fallback
コンソールで API キーごとにエイリアスのマッピングと障害時のフォールバックを設定できます:クライアントは任意のモデル名を使用でき、ゲートウェイがそれを実際の上流モデルへ書き換えます。プライマリが失敗した場合は自動的にバックアップへ切り替わり、最終的に応答したモデルに基づいて課金されます。一度の不具合で本番トラフィックが落ちることはなく、クライアントコードも一切変更不要です。詳しくは Model Mapping & Fallback をご覧ください。AIHubMix CLI
依存関係ゼロの単一バイナリ——Python、Node、Go は不要です。残高の照会、API キーの管理、利用可能なモデル一覧の取得をターミナルから直接実行でき、スクリプトや Claude Code のような AI エージェントを第一級でサポートします。詳しくは AIHubMix CLI をご覧ください。AIHubMix Skill(AI コーディングエージェント向け拡張)
Skills をサポートする AI エージェント——Codex、Claude Code、Cursor、Cline など——向けのローカル拡張です。自然言語で AIHubMix を統合し、モデルを照会し、能力で選択し、サンプルを生成し、エラーをトラブルシューティングできます。固定のモデルリストを同梱するのではなく、Skill は必要に応じて AIHubMix の公式 API からモデル・価格・プロトコル情報をリアルタイムで読み取るため、エージェントが古い記憶に頼ることはありません。詳しくは Skills をご覧ください。バックアップドメイン:api.inferera.com
メインドメインaihubmix.com に到達できない、またはタイムアウトする場合は、リクエストを https://api.inferera.com に向けてください。エンドポイントと機能は同一です——API キー、モデル、リクエストボディは変更不要です。
その他のリリース
- Gemini 音声入力:OpenAI 互換エンドポイント(
/v1/chat/completions)がinput_audioを受け付け、usage に audio_tokens を返すようになりました。 - GLM 5.2 reasoning effort:Zhipu ネイティブチャネルが
reasoning_effortをサポートし、思考の深さを調整できます。 - Open Design 連携:AIHubMix が Open Design の組み込み BYOK ゲートウェイになりました。
- OpenClaw プラグイン修正:aihubmix-auth が修正され、安定して利用できるようになりました。
安定性と修正
- 課金精度とキャッシュ計測の正確性を向上しました。
/v1/modelsでモデルが欠落する問題を修正しました。- 動画生成およびチャネルテストに関するいくつかの問題を修正しました。
今月の新モデル(約20種)
チャット / 汎用- claude-fable-5【提供終了】:Claude の最新世代。より強力な安全ガードレールを備えています(Changelog · Fable 5 notes を参照)。
- minimax-m3、qwen3.7-plus、glm-5.2、および Doubao の doubao-seed-2-1-pro / doubao-seed-2-1-turbo。
- kimi-k2.7-code と kimi-k2.7-code-highspeed:Kimi のコードシリーズ。高速版を含みます。
- coding-glm-5.2 と無料版の coding-glm-5.2-free。
- Kling:テキストから動画、画像から動画、複数画像参照、そしてオムニマルチモーダル生成。
- happyhorse-1.1:テキストから動画(t2v)、参照(r2v)、画像から動画(i2v)。
- 画像生成向けの Baidu musesteamer-air-image。
- grok-build-0.1、hy3-preview、および無料版の step-3.7-flash-free。
価格とお知らせ
- step-3.7-flash、90% オフ(期間限定):入力トークン 0.132 / M。
- 廃止と自動ルーティング:
claude-opus-4-20250514とclaude-sonnet-4-20250514は6月15日に上流で廃止されました。プラットフォームはこれらを同ファミリーの 4-5 バージョンへ自動ルーティングします。
FAQ
今月追加されたモデルは何ですか? 約20種で、チャット(claude-fable-5【提供終了】、minimax-m3、qwen3.7-plus、glm-5.2、doubao-seed-2-1 シリーズ)、コード(kimi-k2.7-code シリーズ、coding-glm-5.2)、動画(Kling、happyhorse-1.1)、画像(musesteamer-air-image)にわたります。 Auto Router はどのように使いますか? リクエスト内のモデル名をauto に設定するだけです。ゲートウェイがリクエストに応じて最適なモデルを選択し、実際にヒットしたモデルに基づいて課金します。クライアントコードの変更は不要です。詳しくは Auto Router をご覧ください。
メインドメインに到達できない場合はどうすればよいですか?
リクエストアドレスをバックアップドメイン https://api.inferera.com に置き換えてください。エンドポイントと機能は同一で、パラメータの変更は必要ありません。
step-3.7-flash の期間限定価格はいくらですか?
入力トークン 0.132 / M です。
すべてのモデルはモデルカタログで閲覧でき、連携の詳細はドキュメントでご確認いただけます。
更新日: 2026-06-30