使用 AI 模型将文本转换为自然语音,支持多种语音风格和输出格式
wav
或 pcm
作为响应格式。对于高质量音频,建议使用 tts-1-hd
;对于更快的生成速度,使用 tts-1
;对于智能语音应用,推荐使用 gpt-4o-mini-tts
。音色预览: 你可以在 OpenAI.fm 试听不同音色效果。/v1/audio/speech
端点,通过 client.audio.speech.create()
方法调用。
/v1/audio/speech
端点,支持 instructions
参数进行高级语音控制。
/v1/chat/completions
端点,需要设置 modalities: ["text", "audio"]
和 audio
配置。
tts-1
、tts-1-hd
、gpt-4o-mini-tts
alloy
、echo
、fable
、onyx
、nova
、shimmer
mp3
、opus
、aac
、flac
、wav
、pcm
。默认为 mp3
注意:gpt-4o-mini-tts 不支持此参数,但你可以通过自然语言描述来控制语速
gpt-4o-mini-tts
模型),可以详细指定语音风格、语调、情感等特性gpt-4o-audio-preview
["text", "audio"]
启用音频输出voice
和 format
字段