更新履歴
6月29日
- 新たに Gemini Cli の転送機能を追加し、多様な利用方法で柔軟にコントロール可能になりました。
- OpenAI Responses API にコード解析器と Remote MCP 呼び出し機能を追加しました。
6月26日
- 汎用グラフィックインターフェース を新規対応。OpenAI、Ideogram、Stability、Google Imagen など主要モデルを幅広くサポートしています。
6月23日
- 開発者向けに全モデル10%割引の アプリ識別コード APP-Code をリリースしました。
6月18日
- 利用者がエラーコードを理解しやすいように、HTTPステータスコード のドキュメントを新設しました。
6月15日
- Veo3.0の逆呼び出し方式を導入し、1回の動画生成費用をわずか$0.41に抑えました。
6月12日
- 国内でも安定して利用可能な Claude Code を統合しました。
6月9日
- OpenAIのResponses APIで推論サマリー表示をサポートしました。
6月5日
- Geminiのインパシットキャッシュ機能を追加。自動ヒット判定とフィードバックが可能で、usage_metadataでヒット状況を確認できます。コスト削減は保証されませんが、リクエスト構造や利用状況により効果が異なります。
5月31日
Claude 4の新機能をフルサポート開始
- ⏳ 新しいキャッシュサイクル(1時間単位、ベータ版)
- 🎉 Claude 4モデルで新テキスト編集ツール
text_editor_20250429
とstr_replace_based_edit_tool
を導入 - 🚫 セキュリティ上の理由で生成拒否時に使う新しい停止理由
refusal
を追加 - 🧠 Claude 4は思考過程の要約を返し、拡張思考の知能を活用可能に
- 🔄 ツール利用と拡張思考を交差させる自然な対話体験をベータ提供
- ⚠️ サポート終了機能:
- Claude 4のテキスト編集ツールで
undo_edit
コマンドの非対応化 token-efficient-tools-2025-02-19
とoutput-128k-2025-02-19
のサポートを削除(Claude 3.7限定)
- Claude 4のテキスト編集ツールで
- 📚 移行ガイドとコード例を更新し、Claude 3.7からのスムーズな移行を支援
5月22日
- Difyプラグイン対応を追加し、AihubmixモデルをDify上でシームレスに利用可能に。APIキー1つで200以上のモデルを拡張・管理できます。
5月17日
- プログラミング特化型の codex-mini-latest を Responses API または Codex CLI から利用可能に。
- Google Imagen 3.0の画像生成と Veo 2.0の動画生成をサポートし、クリエイティブ表現を強化。
- gemini-2.0-flash-exp を正式プレビュー版 gemini-2.0-flash-preview-image-generation にアップグレード。
5月9日
- Ideogram AI V3 インターフェースを追加し、最先端の画像生成モデル Ideogram を利用可能に。
4月26日
- 待望の OpenAI画像生成インターフェース
gpt-image-1
を正式リリース。テキストから画像、画像から画像の両方に対応。 - Geminiのネイティブ呼び出しに対応し、Flash 2.5の推論予算を精密にコントロール可能。
4月24日
- Jina AIの3つの主要インターフェース(Embeddings、Rerank、DeepSearch)を統合し、高機能なエージェント構築を支援。
4月22日
- GPT 4o画像生成インターフェースの先行体験(逆呼び出し)を開始。
4月20日
- OpenAI Responses APIエンドポイントをサポートし、ツールの対応範囲を拡大。
4月17日
- OpenAI CodeX CLI対応 を追加し、コマンドラインで自然言語プログラミングが可能に。
4月12日
- モデルIDに
:surfing
を付加することで、任意モデルに検索機能を付与(Beta) できるようになりました。
4月9日
- Claudeのプロンプトキャッシュをサポート。頻出するフレーズの再利用で最大76%のコスト削減が可能です。
4月7日
- Ideogram AI画像生成インターフェースに対応。テキスト描画に強みがあり、生画像、ミックス、部分編集、拡大など多彩な機能を提供。
4月5日
- ドキュメントを全面刷新し、より良いユーザー体験を実現しました。
3月30日
- Claudeのテキスト編集ツール(Claude Text Edit Tool)に対応しました。
3月24日
- 新しい三叉戟ロゴを導入しました。
3月16日
- OpenAIとGoogle Geminiモデルのネイティブ検索対応を追加。今後、第三者検索の拡張も予定しています。
3月15日
- 新モデル
gpt-4o-mini-search-preview
とgpt-4o-search-preview
を追加しました。
3月7日
- o1 と o3-mini モデルの価格を10%引き下げ、公式価格に合わせました。
3月6日
- aihubmix-DeepSeek-R1 はMicrosoftの価格が7倍に上昇したため、同様に価格改定。代わりに火山の DeepSeek-R1 を推奨します。
- 新モデル
qwen-qwq-32b
とqwen2.5-vl-72b-instruct
を追加。
2月28日
- Claudeモデルを15%値下げ。新モデル
gpt-4.5-preview
を追加。価格が非常に高いためご注意ください。
2月26日
- Deepseekの安定性を向上。Byte社の安定モデル DeepSeek-R1 と DeepSeek-V3 を推奨しています。
2月25日
- 新モデル
claude-3-7-sonnet-20250219
を追加。
2月24日
- gpt-4oモデルで稀に応答が遅くなる問題が発生(ベンダー側の問題)。当面は
gpt-4o-2024-11-20
の利用を推奨。 - Perplexity API は一時停止。複雑な課金体系のため、価格調整後に再開予定。
- Byte社の期間限定割引終了に伴い DeepSeek-R1 の価格が戻りました。
- モデル詳細ページとパラメータ情報を新設。
2月23日
- Byte社の期間限定割引終了により DeepSeek-V3 の価格が戻りました。R1モデルも近日中に価格改定予定です。
2月18日
- 新モデル
kimi-latest
を追加(公式課金は入力長に応じて3段階ですが、当サイトは中間の32kプランで固定。価格に敏感な方はご注意ください)。 - サイト構造を最適化。
- ログページを使用量統計ページに統合。
- お知らせをモデル広場ページに移動。
- 設定メニューをアバター下に移設。
- aihubmix-DeepSeek-R1 の価格を50%引き下げ。
- 新モデル
gemini-2.0-pro-exp-02-05-search
とgemini-2.0-flash-exp-search
でGoogle公式検索連携を実装。 - 新モデル
gemini-2.0-flash
、gemini-2.0-pro-exp-02-05
、gemini-2.0-flash-lite-preview-02-05
、およびo3-mini
、o1
を追加(後者2つは公式価格より約10%高価、アカウント数制限あり)。
2月4日
- o1モデルはOpenAI公式で
stream
パラメータ非対応。 - o3-miniは
temperature
パラメータ非対応。代わりにReasoning effort
パラメータ(“low”, “medium”, “high”)を追加。未指定時は “medium” がデフォルト。
2月1日
- 新機能:OpenAIの音声モデルの入出力対応を追加。api.aihubmix.comサーバーで利用可能。主サーバーは約1週間後に対応予定。
- バックエンド課金は公式と同等。ログにはテキスト部分のみ表示、音声料金は現時点で未表示ですが利用には影響ありません。
新モデル一覧:
- o3-mini、o1(公式価格より約10%高い、アカウント数制限あり)
- aihubmix-DeepSeek-R1(推奨、安定版)
- qwen-max-0125(Qwen2.5-Max)、sonar-reasoning
- deepseek-ai/DeepSeek-R1-Zero、deepseek-ai/DeepSeek-R1、deepseek-r1-distill-llama-70b
- aihub-Phi-4
- Doubao-1.5-pro-256k、Doubao-1.5-pro-32k、Doubao-1.5-lite-32k、Doubao-1.5-vision-pro-32k
- sonar、sonar-pro(Perplexity AI最新モデル)
- gemini-2.0-flash-thinking-exp-01-21
- deepseek-reasoner(DeepSeek-R1)
- MiniMax-Text-01
- codestral-latest(Mistralの新コードモデル Codestral 25.01)
1月23日
- 新モデル追加:
- aihub-Phi-4
- Doubao-1.5シリーズ各種(pro-256k、pro-32k、lite-32k、vision-pro-32k)
- sonar、sonar-pro(Perplexity AI最新モデル)
- gemini-2.0-flash-thinking-exp-01-21
- deepseek-reasoner(DeepSeek-R1)
1月19日
- Perplexity AI APIモデルを追加。現在は api.aihubmix.com のプレビューサーバーのみ対応。問題なければ主サーバー aihubmix.com に順次展開予定。
- 新モデル:
- MiniMax-Text-01
- codestral-latest(Mistralの新コードモデル Codestral 25.01)
- gpt-4o-zh:多言語入力を英語に自動翻訳し、出力は日本語に自動翻訳するモデル。テスト段階で高負荷時のリクエストは非対応。
1月6日
- gemini-2.0-flash-exp-search を追加し、Google純正のネット検索機能をサポート。モデル名に
search
を付けるだけで利用可能。 - 新モデル deepseek-ai/DeepSeek-V3 を追加。
1月1日
- モデル/価格ページを廃止し、新たにモデル広場ページを開設しました。
12月30日
- gemini-2.0-flash-thinking-exp-1219モデルの思考のみ出力される問題を修正。
- 残高通知メールが届かない問題を解消しました。
12月22日
- 利用状況統計ページとチャージ履歴ページを新設。
- 豆包シリーズモデル(Doubao-lite-128k、32k、4k、pro-128k、256k、32k、4k)を追加。
- 新モデル:gemini-2.0-flash-thinking-exp-1219、gemini-2.0-flash-exp、aihubmix-Mistral-Large-2411、aihubmix-Llama-3-3-70B-Instruct、grok-2-1212、grok-2-vision-1212、gemini-exp-1206、llama-3.3-70b-versatile、learnlm-1.5-pro-experimental。
12月14日
- 新モデル:gemini-2.0-flash-exp、aihubmix-Mistral-Large-2411、aihubmix-Llama-3-3-70B-Instruct を追加しました。
12月8日
- 新モデル:gemini-exp-1206、llama-3.3-70b-versatile、learnlm-1.5-pro-experimental を追加。
- 利用状況統計ページを新設。
11月21日
- 最近追加されたモデル:gpt-4o-2024-11-20、step-2-16k、grok-vision-beta。
- 千問2.5turbo百万コンテキストモデル:qwen-turbo-2024-11-01。
11月7日
- ClaudeのネイティブSDKに対応し、v1/messagesエンドポイントが利用可能に。
- ただし、プロンプトキャッシュとコンピューター機能はまだ未対応で、今後2週間以内に対応予定です。
11月5日
- 新モデル:claude-3-5-haiku-20241022 を追加。
- マスクのx.ai最新モデル grok-beta を追加。
10月23日
- 新モデル:claude-3-5-sonnet-20241022 を追加。
10月10日
- OpenAIの最新キャッシュ機能が利用可能になりました。対応モデルは以下の通り:
- GPT-4o
- GPT-4o-mini
- o1-preview
- o1-mini
- ただし、gpt-4o-2024-05-13バージョンは公式非対応です。
- キャッシュヒット時はバックエンドログにキャッシュトークンデータが表示されます。
- 詳細と利用ルールはOpenAI公式サイトをご参照ください:OpenAI キャッシュ機能詳細
10月3日
- gpt-4oモデルのバックエンド料金を公式価格に合わせて引き下げ。
- 新モデル:aihubmix-Llama-3-2-90B-Vision、aihubmix-Llama-3-70B-Instruct。
- 最新のCohereモデル aihubmix-command-r-08-2024、aihubmix-command-r-plus-08-2024 を追加。
9月19日
- 新モデル:whisper-large-v3 と distil-whisper-large-v3-en を追加。
- Whisperモデルの課金は入力秒数に基づきますが、価格表示に一部不具合があり、今後修正予定です。課金はOpenAI公式に完全準拠しています。
9月13日
- 新モデル o1-mini と o1-preview を追加。
- 注意点:これらのモデルはパラメータ仕様が変更されており、古いクライアントではエラーが発生する可能性があります。
ご注意ください
o1モデルは以下の利用がサポートされておらず、使用するとエラーになります:
- systemフィールド(400エラー)
- toolsフィールド(400エラー)
- 画像入力(400エラー)
- json_object出力(500エラー)
- structured出力(400エラー)
- logprobs出力(403エラー)
- stream出力(400エラー)
- o1シリーズは20 RPM、1億5千万 TPMの低制限で、頻繁に429エラーが発生します。
- temperature、top_p、nは固定で1、presence_penaltyとfrequency_penaltyは0に固定されています。
9月10日
- 新モデル:mattshumer/Reflection-Llama-3.1-70B を追加。llama3.1-70bの最強微調整版とされています。
- Claude-3モデルの価格を引き上げ。安定供給のため当サイトでは公式より約10%高い価格で提供し、今後徐々に下げる予定です。
- OpenAIシリーズの同時実行性能を強化し、理論上無制限の並列処理が可能になりました。
8月11日
- 新モデル:Phi3medium128k、ahm-Phi-3-medium-4k、ahm-Phi-3-small-128k を追加。
- Llama関連モデルの安定性を向上。
- Claudeモデルの互換性をさらに最適化しました。
8月7日
- OpenAIの最新4oモデル gpt-4o-2024-08-06 を追加(詳細は https://platform.openai.com/docs/guides/structured-outputs を参照)。
- Googleの最新モデル gemini-1.5-pro-exp-0801 を追加。
8月4日
- オンライン決済によるチャージ機能を強化。
- Claudeの多層対話フォーマットのエラー(役割の連続不整合)を修正。
- Claudeモデルのfunction利用時のインデックス問題を改善。
- https://orisound.cn のバックアップサーバーは9月7日に廃止予定。使用中の方は https://aihubmix.com または https://api.aihubmix.com に切り替えてください。
7月27日
- Mistral Large 2(モデル名:Mistral-large-2407 または aihubmix-Mistral-large-2407)を新規対応。
- システム全体の最適化を実施。
7月24日
- 最新の llama-3.1シリーズ(llama-3.1-405b-instruct、llama-3.1-70b-versatile、llama-3.1-8b-instant)を追加。ぜひお試しください。
7月20日
-
gpt-4o-miniモデルの価格計算問題を修正。
- テキスト入力価格はOpenAI公式のgpt-4o-miniがgpt-4oの約1/33。
- 画像入力価格はgpt-4oと同等。
-
gpt-4o-miniの画像入力トークン数は33倍に換算し、公式価格と整合させています。
-
詳細は Open AI公式価格 をご覧ください。
7月19日
- gpt-4o-miniモデルのサポートを開始し、バックエンド課金を公式価格に同期しました。
7月14日 公告
- 新バージョンのnextwebで非OpenAIモデルの呼び出しをサポートしました。非OpenAIモデルの呼び出し方法をご覧ください。
- Alibabaの千問モデルのバックエンド課金を追加し、当サイト経由のコストは公式より約10%高くなっています。
- Azure OpenAIの出力互換性を改善。
- Claude-3のツールコーリングに対応。
- 多数の新モデルを設定画面の利用可能モデルに追加しました。
6月20日 公告
- 最新の claude-3-5-sonnet-20240620 をサポート開始。利用方法は 非OpenAIモデル呼び出しガイド をご参照ください。
6月18日 公告
- 管理画面のログページで利用履歴のダウンロード機能を追加しました。
6月16日 公告
- Azure OpenAIへのランダム割り当て確率を低減し、ほぼ発生しないレベルにしました。
6月13日 公告
- Claude-3関連モデル(Haiku、Sonnet、Opus)の料金を引き下げ、公式価格の約86%相当で提供中です。
6月10日 公告
- サービス基盤を全面Azureへ移行。
- 今後はOne APIのオープンソース版をベースに二次開発・最適化を進めます。
- ログデータが膨大(1億件超)なため、過去ログの移行は困難。必要な方はお問い合わせください。
- gpt-4oのトークン課金方式を改善し、中国語・韓国語・日本語のストリームリクエストのトークン数が従来より減少しました。
6月8日 公告
- Alibabaの最新オープンモデル Qinwen2 を追加。
- alibaba/Qwen2-7B-Instruct、alibaba/Qwen2-57B-A14B-Instruct、alibaba/Qwen2-72B-Instruct を対応。
5月20日 公告
- 新モデル:gemini-1.5-flash、gpt-4o を追加。
- 江蘇省でチャージページにアクセスできない問題が発生。電信によるドメイン乗っ取りのため、サポートにお問い合わせ の上チャージをお願いいたします。
- llama3シリーズ(llama3-70b-8192、llama3-8b-8192)、gemini-1.5-pro、command-r、command-r-plus を追加。
- Claude-3モデルは供給再開し、AWSとGoogle Cloudに展開中。
- サーバーコストと運営費用維持のため、Claude-3モデルは公式より約10%高い価格で提供。
- 今後、利用増加に応じて価格を5%以下まで段階的に引き下げ予定。
- 同時実行数はテスト中で、利用増加に伴い上限引き上げを申請予定です。