1️⃣ gpt-image-1 インターフェースの説明
OpenAIの描画インターフェースgpt-image-1
は、テキストから画像を生成する機能(generate)と、画像とテキストから画像を編集する機能(edit)をサポートしています。
使用する前に、pip install -U openai
を実行して最新のOpenAIパッケージにアップグレードしてください。
注意事項
- 生成中に、いかなる状況で中断または失敗した場合でも、インターフェース呼び出しが一度発行されると、料金が請求されます
- 存命のアーティスト名(例:「宮崎駿」、「新海誠」など)は
moderation_blocked
エラーをトリガーし、生成が失敗します。これを回避するには、「ジブリ」、「明るい現代的な日本のアニメスタイル」などの非機密語を使用できます。露出度の高い服装や暗示的な画像も同様です。 - 全体的に、「スタイル」は「アーティスト」よりも安全です。「ピクサー」などもサポートされています。
- より確実な方法は、故人アーティストまたは対応するスタイルを使用することです。例:「ゴッホ」、「モナリザ」など。
モデルと料金
モデル | 品質 | 1024x1024 | 1024x1536 | 1536x1024 |
---|---|---|---|---|
gpt-image-1 | low | $0.011 | $0.016 | $0.016 |
gpt-image-1 | medium | $0.042 | $0.063 | $0.063 |
gpt-image-1 | high | $0.167 | $0.25 | $0.25 |
注意:入力テキストトークン部分の料金は100万トークンあたり$5で、別途計算されます。
呼び出し方法
エンドポイント (Endpoints)- 描画:
https://aihubmix.com/v1/images/generations
- 編集:
https://aihubmix.com/v1/images/edits
出力例
拒否されるケース
リクエストが拒否された場合のエラーメッセージは以下の通りです。moderation_blocked
はスローされません。
したがって、作成時には潜在的な知的財産権(IP)や著作権の問題を積極的に回避し、システムによる生成ブロックのリスクを減らし、作成がスムーズに完了するようにしてください。
✍️ 重要なヒント:
- 既知の著作権保護されたキャラクター、ブランドロゴ、有名人の肖像などを直接使用することは避けてください。
- 「スタイルを参考にする」「クリエイティブな改変」「一般的な記述」などの方法で表現できます。
- 特定の要素を引用する必要がある場合は、その要素がパブリックドメインにあることを事前に確認してください。
実用的なヒント
- どの言語でもサポートされており、中国語の描画も非常に安定していますが、大量のテキストを描画することはお勧めしません。
- sizeパラメータは
size="auto"
を明示的に渡すことをサポートしていません。デフォルトはautoです。 - 描画比率はプロンプトで指定できます。2:3、3:2、1:1をサポートしており、sizeパラメータで設定することもできます。
- 敏感度を制御する
moderation
パラメータをサポートしていますが、このパラメータをlowに設定しても拒否される可能性があります。例えば、ヴィーナスが露出度が高すぎる場合などです。 - editsポートは
moderation
パラメータをサポートしていません。 - テキスト記述と参照画像を組み合わせることで、画像合成の効果がより正確になります。
- アップロードする画像を圧縮前処理することで、速度を向上させることができます。
- 透明な背景をサポートしており、切り抜き不要です。——プロンプトで要求を追加するだけです。
2️⃣ GPT描画の先行体験(逆方向)
ユーザーの強い要望に応えるため、gpt-4o-image
とgpt-4o-image-vip
という2つの逆方向インターフェースを特別にリリースしました。このうち、VIPモデルは性能と安定性において優れています。
これらの逆方向インターフェースは完全に安定しているとは限らず、🕐 Queuing...
のキューイング状態や生成失敗が発生する可能性があるため、新機能の体験やテストにのみ使用することをお勧めします。
OpenAIがgpt-image-1
インターフェースを正式にリリースしたことを考慮し、呼び出しコストの観点から、これらの逆方向インターフェースは一時的に保持し、完全に互換性のある呼び出し方法を提供します。
注意事項
- 生成中に、いかなる状況で中断または失敗した場合でも、インターフェース呼び出しが一度発行されると、料金が請求されます
- 存命のアーティスト名(例:「宮崎駿」、「新海誠」など)は
input_moderation
エラーをトリガーし、生成が失敗します。これを回避するには、「ジブリ」、「明るい現代的な日本のアニメスタイル」などの非機密語を使用できます - 全体的に、「スタイル」は「アーティスト」よりも安全です。「ピクサー」などもサポートされています
- より確実な方法は、故人アーティストまたは対応するスタイルを使用することです。例:「ゴッホ」、「モナリザ」など
モデルと料金
モデル | バックエンド料金 (米ドル/回) | 約 (日本円/回) |
---|---|---|
gpt-4o-image-vip | $0.009 | 約 ¥0.06 |
gpt-4o-image | $0.005 | 約 ¥0.04 |
- バックエンド料金は米ドルに基づいています。
- 逆方向インターフェースの維持コストが増加したため、1回あたりの呼び出し価格が引き上げられました。(更新日:20250604)
- 正式な
gpt-image-1
インターフェースの入力テキストトークン部分の料金は100万トークンあたり$5ですが、逆方向インターフェースは画像描画回数のみで計算されます。
Python呼び出し例
おなじみのv1/completions
エンドポイントを使用してサポートを提供します。完全に互換性があり、具体的な使用方法は以下を参照してください。
出力例
OpenAI 正式インターフェース互換
OpenAIが最近リリースした画像生成の呼び出し方法を好む場合は、以下の処理を参照してください。3つの点に注意するだけです。- 品質パラメータを渡すことはできません。モデル
gpt-4o-image-vip
とgpt-4o-image
はそれ自体にバンドルされています。 - トークン使用量を追跡するusageフィールドの出力はサポートされていません。
- 最新の出力はBase64画像データであり、ユースケースは自動保存されています。
Python
効果展示
真珠の耳飾りの少女
- 名画を再解釈し、レイアウトと透かしを直接出力。

ピクサーカートゥーン
- ピクサー3Dカートゥーンスタイル、安定性抜群。

3D
- 最も人気のあるジブリ
実用的なヒント
- どの言語でもサポートされており、中国語の描画も非常に安定していますが、大量のテキストを描画することはお勧めしません。
- 描画比率はプロンプトで指定します。指定しない場合、4oが自動的に判断します。2:3、3:2、1:1をサポートします。
- インスピレーションがない場合は、参照画像を提供してください。単一画像と複数画像をサポートします。
- アップロードする画像を圧縮前処理することで、速度を向上させることができます。
- 透明な背景をサポートしており、切り抜き不要です。——プロンプトで要求を追加するだけです。