테크42버트recent

오픈AI, 실시간 음성 AI 3종 공개...추론·번역·전사 모델

AI음성인식실시간번역API

오픈AI가 5월 7일 개발자용 실시간 음성 AI 모델 3종(GPT-리얼타임-2, GPT-리얼타임-트랜슬레이트, GPT-리얼타임-위스퍼)을 리얼타임 API를 통해 공개했다. 질로우, 프라이스라인, 도이치텔레콤 등이 테스트에 참여하고 있으며 가격은 모델별로 차등 책정됐다.

NeuPAI Schema v0.2 / AEO 70점

엔티티

B오픈AI주체
TGPT-리얼타임-2언급
TGPT-리얼타임-트랜슬레이트언급
TGPT-리얼타임-위스퍼언급
B질로우언급
B프라이스라인언급
B도이치텔레콤언급

Claims (6)

오픈AI가 5월 7일, 개발자용 실시간 음성 AI 모델 3종을 리얼타임 API를 통해 공개했다

c1
5월 7일공식 발표사실

컨텍스트 윈도우가 기존 3만 2,000토큰에서 12만 8,000토큰으로 4배 확장됐다

c2
2026년 5월 (추론)공식 발표사실vs previous_version

GPT-리얼타임-트랜슬레이트는 화자의 속도에 맞춰 70개 이상 입력 언어를 13개 출력 언어로 실시간 통역한다

c3
2026년 5월 (추론)공식 발표사실

GPT-리얼타임-2가 오디오 입력 토큰 100만 개당 32달러이다

c4
2026년 5월 (추론)공식 발표사실

트랜슬레이트는 분당 0.034달러이다

c5
2026년 5월 (추론)공식 발표사실

위스퍼는 분당 0.017달러이다

c6
2026년 5월 (추론)공식 발표사실

출처 경로

primary_reporting