OpenAI 填补了语音代理中的推理空白

PLUS:使用相同的提示快速测试多个AI模型

阿洛

阿洛

发布于 2026年5月9日

每日简报概述

早上好,人工智能爱好者们。打字让AI变得有用,但语音才是智能体必须证明自己能够跟上现实生活节奏的地方。
OpenAI的新一代实时语音模型三重奏专为更加混乱的界面而打造,它实现了重大的推理升级,能够在思考的同时进行对话,并且能够自如地使用工具,使人工智能语音代理更接近以自然对话的速度执行任务。
今日人工智能简报:

  • OpenAI的语音代理推理升级
  • Google将Fitbit纳入其人工智能健康业务版图
  • 用相同的提示测试多个AI模型
  • 人类对自我构建的人工智能的规划
  • 4款全新AI工具、社区工作流程等
1 / 10

🗣️ OpenAI’s 语音代理推理升级

🗣️ OpenAI’s 语音代理推理升级

AI资讯:OpenAI刚刚推出了GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,这三款API语音模型为AI语音代理和实时语音带来了新的推理能力、流媒体功能、工具使用能力、真实感以及更多功能升级。
细节如下:

  • Realtime-2为实时语音带来了GPT-5级别的推理能力,能够同时使用多种工具,边思考边对话,并具有更好的语调控制以实现更真实的体验。
  • 在Big Bench Audio测试中,Realtime-2的准确率达到了96.6%,而其前身仅为81.4%,在语音AI实时推理能力方面提升了15个百分点。
  • OpenAI还推出了涵盖70多种语言的实时翻译器和流式转录模型,构成了一个完整的语音代理工具包。
  • OAI表示,Zillow、Priceline和德国电信已经在房地产人工智能代理、语音管理旅行和客户支持方面基于这些模型进行开发。
    为何重要:人工智能语音的回合制时代似乎即将结束,OAI的新模型转向了能够更好地推理、利用工具并完成工作flow的系统,而不会出现令人尴尬的中断,让用户脱离自然的flow状态。

人工智能行业目前聚焦于文本代理,但下一波浪潮将是与语音交互,而非打字。

2 / 10

📊 15+位企业领导者分享如何让数据为人工智能做好准备

📊 15+位企业领导者分享如何让数据为人工智能做好准备

人工智能资讯:AWS Marketplace刚刚发布了一本免费书籍,书中收录了来自摩根大通、西门子、梅赛德斯-奔驰、罗氏等公司的高级数据和人工智能领导者的15个章节——每位领导者都分享了关于构建代理分析和智能代理所需数据基础设施的实用建议。
章节涵盖的主题包括:

  • 为代理式人工智能开发数据策略并扩展数据产品
  • 以务实、业务优先的方法在现有基础设施的基础上进行建设
  • 利用经典机器学习、语义层和跨团队协作来释放价值
  • 来自不同行业领导者的真实视角
    立即获取您的免费电子版。
3 / 10

⌚️ Google 将Fitbit纳入其人工智能健康领域

⌚️ Google 将Fitbit纳入其人工智能健康领域

AI资讯:经过数月的测试后,Google向公众开放了其AI健康教练功能,将Fitbit应用程序整合到一个新的Google健康平台中,并配以一款新的99美元的无屏幕追踪器,该追踪器可追踪身体数据并将其传输至AI。
细节如下:
在Gemini上运行,AI教练能够为用户定制每周锻炼计划,解读上传的医疗记录,并通过手机照片识别用户所吃食物。

  • Google正在将Fitbit应用程序、Health Connect、Apple Health、可穿戴设备数据以及美国医疗记录整合到一个单一的Google健康中心。
  • 售价99美元的新款Fitbit Air没有屏幕,重量仅12克,搭载心率、血氧和温度传感器,为AI教练提供身体数据。
  • Apple Watch、Garmin和Oura用户将在今年晚些时候获得AI教练访问权限,届时Google将向其自有硬件以外的设备开放该权限。
    为何重要:人工智能在个人健康领域的作用日益增强,将所有功能整合于一身有助于Google使人工智能层成为核心产品,同时拥有一个值得信赖的可穿戴产品线,为用户提供其他追踪器和连接性较差的产品通常所不具备的个性化指导context。
4 / 10

✏️ 用相同提示测试多个AI模型

✏️ 用相同提示测试多个AI模型

AI资讯:在本指南中,您将学习如何使用OpenRouter Fusion一次性测试多个AI模型对同一提示的响应。

您无需打开五个应用程序并逐一猜测,而是可以并排比较输出结果,并为工作制作一份快速备忘录。
逐步说明:

  • Create 拥有一个OpenRouter账户,打开OpenRouter Fusion,并选择您想要支付AI使用费用的方式——OpenRouter积分或API您已经付费的密钥
    在Fusion中,选择你想要比较的模型——我们测试了Opus 4.7与GPT 5.4和Grok——并每次运行一个基准测试提示,保持测试条件一致
  • 提示如下:“你正在为一家20人的SaaS公司提供建议,该公司正考虑是否用异步书面更新来取代每周的例会。

请撰写一份建议备忘录,包括3个好处、3个风险以及一个为期2周的实施计划。

请保持简洁且实用。

  • 打开响应,阅读并排分析,并注意哪个模型最强。在演示中,大约10次比较的成本约为40美分
    专业建议:先运行几个你常用的提示,记录下哪个模型在每个任务中胜出,然后在投入更多资金之前,使用OpenRouter的模型浏览器来比较价格和速度。
5 / 10

🐝 新指南:开发人工智能代理的工具和工作流程

🐝 新指南:开发人工智能代理的工具和工作流程

人工智能资讯:人工智能代理可以显著提高生产力和创新能力,但将其推向现实世界需要多次迭代。

无论您是首次探索代理,还是优化当前方法,本入门指南都将提供可操作的见解,助力您的团队在人工智能时代取得成功并蓬勃发展。
获取学习指南:

  • 代理应用程序的定义是什么,以及可观察性为何重要
  • 一个经过验证的构建自主AI应用程序的工作流程
  • 当今,先锋企业是如何构建和部署人工智能代理的
    下载一本关于构建成功人工智能代理的入门指南。
6 / 10

🔬 自我构建的人工智能人类计划

🔬 自我构建的人工智能人类计划

人工智能资讯:Anthropic新成立的研究机构——Anthropic研究所发布了其正式研究议程,该文件将人工智能系统自我改进的可能性视为公司正在积极准备应对的问题。
细节如下:
TAI嵌入Anthropic系统,让研究人员在产品推向更广泛市场之前,能够研究Claude的使用情况、内部工作流程以及安全信号。
该研究所的议程涵盖安全威胁、经济混乱、治理以及自我完善模式的规划。
该团队还提议在实验室和政府之间设立冷战式的热线,并进行“消防演习”以应对突然的能力提升。

  • TAI表示,其致力于发布经济指数数据、月度员工调查、威胁研究,以及更多关于其内部由人工智能驱动的研发的详细信息。
    为何重要:我们之前曾撰文介绍过Anthropic联合创始人杰克·克拉克(Jack Clark)关于自我改进系统的博客,而TAI的研究议程则对此给予了高度关注。

Anthropic所谈及的“消防演习”和冷战式系统,是为了应对我们可能比许多人预期更快地迎来的“智能爆炸”。

7 / 10

🛠️ 热门人工智能工具

  • ✈️ Serko.ai - 这款人工智能旅行助手能为您规划、预订并管理整个商务旅行,让您免去繁琐事务*
  • 🗣️ GPT-Realtime-2 - 会思考、会调用工具、能维持对话的语音AI flow
  • 🎥 Studio Agent - ElevenLabs' 人工智能编辑器,用于草拟视频、添加音效
  • 🎆 Grok Imagine 质量模式 - xAI的图像生成,具有更高的真实感
    *赞助列表
8 / 10

📰 今日人工智能其他资讯

Spotify推出了“个人播客”功能,该工具允许代理人在用户的Spotify曲库中直接将简报或课堂笔记等内容转化为个人播客。
OpenAI推出了“信任联系人”功能,这是一项ChatGPT的可选功能,当检测到有自残风险迹象时,会向指定的朋友或家人发出警报。
Scale AI获得五角大楼一份价值5亿美元的军事数据分析合同,较去年9月的1亿美元合同增长了5倍。
Perplexity向所有Mac用户推出了个人电脑版,使其能够在用户的本地电脑、文件以及通过Comet浏览器采取代理行动。
Mozilla发布了一篇关于使用Claude Mythos Preview进行安全测试的博客,称该模型在4月份修复的漏洞数量超过了过去15个月的总和。

9 / 10

🤝 社区人工智能工作流程

在每一期通讯中,我们都会展示一位读者是如何利用人工智能更高效地工作、节省时间或让生活更轻松的。
今天的工作流程来自加利福尼亚州旧金山的读者塔蒂亚娜·B:
“我是一家初创公司的首席运营官,同时也是一个两岁半孩子的母亲。兼顾两者非常辛苦,除了工作,还要处理家里所有需要做的事情,这真的会让人心力交瘁。
因此,我利用人工智能(AI)帮我整理了一份涵盖我在家需要帮助处理的所有事项的文档:我女儿的饮食偏好、她的日常安排以及家务事。

我把这当作一个工作项目,与AI反复交流,思考我实际需要做的事情,填补我未曾想到的空白,并将所有这些从我的脑海中转移到我可以交给别人的东西上。
现在,每当有新帮手来家里帮忙时,我就不必从头开始解释一切了。

这样我就可以腾出时间,在和女儿相处时真正陪伴她,不在她身边时则专注于工作。

我也知道,能雇佣帮手是件幸运的事,但利用人工智能来清晰地思考自己的需求,并将这些需求从脑海中提取出来,是每个人都能做到的。


你是如何使用人工智能的?请在此处告诉我们。

10 / 10

🎓 亮点:新闻、指南与活动

  • 阅读我们上一期人工智能通讯:Anthropic与SpaceXAI成为不太可能的合作伙伴
  • 阅读我们上一期科技通讯:GameStop 收购 eBay 的大胆尝试
  • 阅读我们上一期的机器人通讯:创世纪机器人制作早餐
  • 今日AI工具指南:使用相同的提示快速测试多个AI模型

相关文章推荐