使用 AI 模型將文字轉換為自然語音,支援多種語音風格和輸出格式
wav
或 pcm
作為響應格式。對於高品質音頻,建議使用 tts-1-hd
;對於更快的生成速度,使用 tts-1
;對於智慧語音應用,推薦使用 gpt-4o-mini-tts
。音色預覽: 你可以在 OpenAI.fm 試聽不同音色效果。/v1/audio/speech
端點,透過 client.audio.speech.create()
方法調用。
/v1/audio/speech
端點,支援 instructions
參數進行進階語音控制。
/v1/chat/completions
端點,需要設定 modalities: ["text", "audio"]
和 audio
配置。
tts-1
、tts-1-hd
、gpt-4o-mini-tts
alloy
、echo
、fable
、onyx
、nova
、shimmer
mp3
、opus
、aac
、flac
、wav
、pcm
。預設為 mp3
注意:gpt-4o-mini-tts 不支援此參數,但你可以透過自然語言描述來控制語速
gpt-4o-mini-tts
模型),可以詳細指定語音風格、語調、情感等特性gpt-4o-audio-preview
["text", "audio"]
啟用音頻輸出voice
和 format
欄位