API
GPT Image
インターフェースの説明
OpenAIの描画インターフェースgpt-image-1
は、テキストから画像を生成する機能(generate)と、画像とテキストから画像を編集する機能(edit)をサポートしています。
使用する前に、pip install -U openai
を実行して最新のOpenAIパッケージにアップグレードしてください。
注意事項
- 生成中に、いかなる状況で中断または失敗した場合でも、インターフェース呼び出しが一度発行されると、料金が請求されます
- 存命のアーティスト名(例:「宮崎駿」、「新海誠」など)は
moderation_blocked
エラーをトリガーし、生成が失敗します。これを回避するには、「ジブリ」、「明るい現代的な日本のアニメスタイル」などの非機密語を使用できます。露出度の高い服装や暗示的な画像も同様です。 - 全体的に、「スタイル」は「アーティスト」よりも安全です。「ピクサー」などもサポートされています。
- より確実な方法は、故人アーティストまたは対応するスタイルを使用することです。例:「ゴッホ」、「モナリザ」など。
モデルと料金
モデル | 品質 | 1024x1024 | 1024x1536 | 1536x1024 |
---|---|---|---|---|
gpt-image-1 | low | $0.011 | $0.016 | $0.016 |
gpt-image-1 | medium | $0.042 | $0.063 | $0.063 |
gpt-image-1 | high | $0.167 | $0.25 | $0.25 |
注意:入力テキストトークン部分の料金は100万トークンあたり$5で、別途計算されます。
呼び出し方法
エンドポイント (Endpoints)
- 描画:
https://aihubmix.com/v1/images/generations
- 編集:
https://aihubmix.com/v1/images/edits
Python呼び出しの例は以下の通りです。
その他のパラメータの詳細については、OpenAI公式ドキュメントを参照してください。
出力例
拒否されるケース
リクエストが拒否された場合のエラーメッセージは以下の通りです。
一度のリクエストで2〜10枚の画像を生成する場合、システムがリクエストがプラットフォームポリシーに違反していると判断した場合、そのリクエストの違反部分は生成されません。これにより、実際に生成される画像の数がユーザーが要求した数よりも少なくなる可能性がありますが、複数枚の場合、moderation_blocked
はスローされません。
したがって、作成時には潜在的な知的財産権(IP)や著作権の問題を積極的に回避し、システムによる生成ブロックのリスクを減らし、作成がスムーズに完了するようにしてください。
✍️ 重要なヒント:
- 既知の著作権保護されたキャラクター、ブランドロゴ、有名人の肖像などを直接使用することは避けてください。
- 「スタイルを参考にする」「クリエイティブな改変」「一般的な記述」などの方法で表現できます。
- 特定の要素を引用する必要がある場合は、その要素がパブリックドメインにあることを事前に確認してください。
実用的なヒント
- どの言語でもサポートされており、中国語の描画も非常に安定していますが、大量のテキストを描画することはお勧めしません。
- sizeパラメータは
size="auto"
を明示的に渡すことをサポートしていません。デフォルトはautoです。 - 描画比率はプロンプトで指定できます。2:3、3:2、1:1をサポートしており、sizeパラメータで設定することもできます。
- 敏感度を制御する
moderation
パラメータをサポートしていますが、このパラメータをlowに設定しても拒否される可能性があります。例えば、ヴィーナスが露出度が高すぎる場合などです。 - editsポートは
moderation
パラメータをサポートしていません。 - テキスト記述と参照画像を組み合わせることで、画像合成の効果がより正確になります。
- アップロードする画像を圧縮前処理することで、速度を向上させることができます。
- 透明な背景をサポートしており、切り抜き不要です。——プロンプトで要求を追加するだけです。