AI 모델을 사용하여 텍스트를 자연스러운 음성으로 변환, 다양한 음성 스타일과 출력 형식 지원
wav
또는 pcm
을 응답 형식으로 사용하는 것을 권장합니다. 고품질 오디오의 경우 tts-1-hd
를 권장하고, 더 빠른 생성 속도를 위해서는 tts-1
을 사용하며, 스마트 음성 애플리케이션에는 gpt-4o-mini-tts
를 권장합니다.음성 미리보기: OpenAI.fm에서 다양한 음성 효과를 들어볼 수 있습니다./v1/audio/speech
엔드포인트를 사용하고, client.audio.speech.create()
메서드를 호출합니다.
/v1/audio/speech
엔드포인트를 사용하고, 고급 음성 제어를 위한 instructions
매개변수를 지원합니다.
/v1/chat/completions
엔드포인트를 사용하고, modalities: ["text", "audio"]
및 audio
구성을 설정합니다.
tts-1
, tts-1-hd
, gpt-4o-mini-tts
alloy
, echo
, fable
, onyx
, nova
, shimmer
mp3
, opus
, aac
, flac
, wav
, pcm
. 기본값은 mp3
gpt-4o-mini-tts
는 이 매개변수를 지원하지 않지만, 자연어 설명을 통해 속도를 제어할 수 있습니다gpt-4o-mini-tts
모델에만 적용), 음성 스타일, 톤, 감정 등을 지정할 수 있습니다.gpt-4o-audio-preview
로 설정["text", "audio"]
로 설정voice
및 format
필드를 포함하는 오디오 구성 객체