AIモデルを使用してテキストを自然な音声に変換し、複数の音声スタイルと出力形式をサポート
wav
または pcm
を使用することをお勧めします。高品質のオーディオには tts-1-hd
を、より高速な生成には tts-1
を、スマートな音声アプリケーションには gpt-4o-mini-tts
を使用することをお勧めします。音色のプレビュー: OpenAI.fm でさまざまな音色の効果を試聴できます。/v1/audio/speech
エンドポイントを使用し、client.audio.speech.create()
メソッドを介して呼び出します。
/v1/audio/speech
エンドポイントを使用し、高度な音声制御のために instructions
パラメータをサポートします。
/v1/chat/completions
エンドポイントを使用し、modalities: ["text", "audio"]
と audio
設定が必要です。
tts-1
、tts-1-hd
、gpt-4o-mini-tts
alloy
、echo
、fable
、onyx
、nova
、shimmer
mp3
、opus
、aac
、flac
、wav
、pcm
。デフォルトは mp3
注意:gpt-4o-mini-ttsはこのパラメータをサポートしていませんが、自然言語で速度を制御できます
gpt-4o-mini-tts
モデルのみ)。音声スタイル、イントネーション、感情などの特性を詳細に指定できます。gpt-4o-audio-preview
に設定します。["text", "audio"]
に設定します。voice
と format
フィールドを含むオーディオ設定オブジェクト。