OpenAI API新增语音智能功能，支持实时对话与多语种翻译 | 菜鸟博客

当前位置：首页
» 科技 » OpenAI API新增语音智能功能，支持实时对话与多语种翻译

OpenAI API新增语音智能功能，支持实时对话与多语种翻译

Mark Do 暂无评论阅读 5 次

OpenAI API新增语音智能功能，支持实时对话与多语种翻译

OpenAI推出API语音智能新功能，赋能开发者打造智能语音应用

三大核心功能解析

OpenAI于周四宣布，其API将新增一系列语音智能功能，帮助开发者构建能与用户对话、转录及翻译交流的智能应用。其中，全新推出的GPT-Realtime-2语音模型旨在生成逼真的语音模拟效果，支持与用户进行自然对话。与上一代GPT-Realtime-1.5相比，该模型基于GPT-5级推理能力构建，可处理用户更复杂的请求，提升交互深度。

同时推出的GPT-Realtime-Translate功能专注于实时翻译服务，能“跟上”用户对话节奏。该功能支持超过70种输入语言（可识别的语言）和13种输出语言（转译后的语言），满足跨语言交流需求。

此外，GPT-Realtime-Whisper作为实时转录功能，可捕捉对话过程中的语音并实时转换为文本，为用户提供即时文字记录。

应用场景广泛，覆盖多领域

这些新功能的应用场景十分广泛。企业可通过其扩展客户服务能力，提升用户体验；教育、媒体、活动及创作者平台等也能从中受益，例如实现多语种教学、实时字幕生成或跨语言内容创作。

安全防护机制，防范滥用风险

尽管功能强大，OpenAI也关注潜在滥用问题。公司表示已内置防护措施，防止新功能被用于生成垃圾信息、欺诈或其他网络滥用行为。系统内嵌特定触发机制，一旦检测到违反有害内容准则的对话，将立即中断交流，确保使用安全。

所有新语音模型均集成于OpenAI的Realtime API中。其中，翻译和Whisper功能按分钟计费，GPT-Realtime-2则按令牌消耗计费。

关注微信号：智享开源 ，可及时获取信息

0 0

评论列表

还没有任何评论，你来说两句吧！

发表评论

为你推荐

迪士尼拟合并多款应用，打造一站式“超级应用

ZAYA1-8B：AMD GPU训练的高效开源推理模型

Sakana用7B模型协调GPT-5等：强化学习破解多LLM协同瓶颈

Ramp 正在洽谈达到 400 亿美元以上估值，6 个月前刚达到 320 亿美元

OpenAI推出新语音智能功能，API支持实时对话、翻译与转写

Sakana训练7B模型，指挥GPT-5、Claude Sonnet 4与Gemini 2.5 Pro

迪士尼拟打造统一“超级应用”，整合多个平台

迪士尼拟合并多款应用，打造一站式“超级应用

迪士尼拟合并多款应用，打造一站式“超级应用

ZAYA1-8B：AMD GPU训练的高效开源推理模型

ZAYA1-8B：AMD GPU训练的高效开源推理模型

Sakana用7B模型协调GPT-5等：强化学习破解多LLM协同瓶颈

Sakana用7B模型协调GPT-5等：强化学习破解多LLM协同瓶颈

Ramp 正在洽谈达到 400 亿美元以上估值，6 个月前刚达到 320 亿美元

Ramp 正在洽谈达到 400 亿美元以上估值，6 个月前刚达到 320 亿美元

OpenAI推出新语音智能功能，API支持实时对话、翻译与转写

OpenAI推出新语音智能功能，API支持实时对话、翻译与转写

Sakana训练7B模型，指挥GPT-5、Claude Sonnet 4与Gemini 2.5 Pro

Sakana训练7B模型，指挥GPT-5、Claude Sonnet 4与Gemini 2.5 Pro

Mark Do Ta的个人站点

Mark Do发布文章557篇

关注微信

近期文章

标签

近期评论

Mark Do 发表在《今天我终于找到了加快网站速度的办法》
mb 发表在《如何成为超级个体？》
mb 发表在《像ChatGPT一样记笔记》
mb 发表在《python 如何将电子表格按照某一列相同数据分到一个一个工作表中》
mb 发表在《python 如何将电子表格按照某一列相同数据分到一个一个工作表中》

分类

热门文章

Python Pandas DataFrame append 方法报错原因及解决方法 6,349 人阅

pandas 将多列数据字符串拼接在一起 4,505 人阅

pandas 筛选列数据中包含某个字符串的数据？ 3,506 人阅

要凤凰涅槃须经历一番心灵的洗涤 3,169 人阅

python 如何将电子表格按照某一列相同数据分到一个一个工作表中 2,740 人阅