OpenAIのResponses APIの多機能インターフェースをサポートしており、現在利用可能な機能インターフェースは以下の通りです。

  • Text input:テキスト入力
  • Image input:画像とテキストの入力
  • Streaming:ストリーミング呼び出し
  • Web search:検索
  • Reasoning:推論の深さ、3段階をサポート
  • Functions:関数呼び出し
  • image_generation:描画ツール呼び出し、画像生成部分は gpt-image-1 で課金されます
  • Code Interpreter:コード解析器
  • Remote MCP:MCP呼び出し
  • Computer Use:自動操作

使用方法 (Python 呼び出し):

公式のOpenAI呼び出し方法と同じで、api_keybase_urlを置き換えて転送するだけです。 中国本土からも直接アクセスできます。

client = OpenAI(
    api_key="AIHUBMIX_API_KEY", # バックエンドで生成したキー "sk-***" に置き換えてください
    base_url="https://aihubmix.com/v1"
)

推論モデルの場合、以下のパラメータを使用して推論の要約を出力できます。要約の詳細度は detailed > auto > None で、auto が最適なバランスです。

"summary": "auto" 
from openai import OpenAI
import os

client = OpenAI(
    api_key="AIHUBMIX_API_KEY", # バックエンドで生成したキー "sk-***" に置き換えてください
    base_url="https://aihubmix.com/v1"
)

response = client.responses.create(
  model="gpt-4o-mini", # codex-mini-latest が利用可能
  input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

注意:

  1. 最新の codex-mini-latest は検索をサポートしていません
  2. Computer use は Praywright と連携して使用する必要があります。詳細は公式リポジトリを参照してください。

既知の詳細な問題:

  • 呼び出し例が複雑
  • スクリーンショットが多く、時間がかかり、タスクの成功率が低い
  • CAPTCHA認証またはCloudflareの人間認証がトリガーされ、無限ループに陥る可能性があります