Anthropic刚刚超越了OpenAI

附加：使用Codex在一个提示中构建一个功能齐全的游戏

阿洛

发布于 2026年5月30日

每日简报概述

早上好，人工智能爱好者们。Anthropic刚刚从OpenAI手中夺得领先地位——不仅凭借更强大的前沿模型，在市场上也是如此。
随着新的Opus 4.8在基准测试中表现出色，更强大的Mythos即将推出，且估值接近1万亿美元，达里奥及其团队似乎终于为轰动一时的公开上市做好了所有准备。
今日人工智能简报：

Anthropic的Opus 4.8，估值近1万亿美元
苹果公司的新款人工智能助手Siri将与ChatGPT一决高下
使用Codex，一键构建游戏
人工智能使开发产出翻倍，但并非对每个人都有效
4款全新AI工具、社区工作流程等

1 / 10

🚀 Anthropic的Opus 4.8，估值近1万亿美元

人工智能资讯：Anthropic在同一天宣布了两项重大消息——Claude Opus 4.8，该系统几乎在所有主要基准测试中均表现出色；以及一轮巨额融资，使其成为全球最具价值的AI实验室。
细节如下：

Opus 4.8与4.7价格相同，在代理编码、计算机使用、财务分析和《人性的最后考验》方面优于GPT-5.5和Gemini 3.1 Pro。
在所有Anthropic模型中，4.8模型最不懒惰，也更诚实，它更倾向于标记不确定性，而不是做出未经证实的断言。
该模型的快速模式成本降低了3倍，此外，claude.ai获得了新的努力控制功能，而Claude Code则获得了并行子代理，以处理复杂且长时间运行的任务。
Anthropic在发布的同时宣布融资650亿美元，使其估值达到9650亿美元（超过OpenAI），并承诺“未来几周”将推出一款Mythos级人工智能
为何重要：虽然竞争尚未结束，但Anthropic已经跨越了一个两年前看似不可能实现的里程碑——估值高于OpenAI，并且其模型在几乎所有基准测试中均处于领先地位。

显然，其“安全第一”的策略在商业上取得了成效，尽管萨姆·奥特曼（Sam Altman）称这一策略为“基于恐惧的营销”

2 / 10

⚡ 看看Oura是如何自动化客户反馈分析的

AI资讯：Unpack的客户智能平台可将您的所有反馈（调查、评论、支持工单、社交评论）整合到一个视图中，然后利用人工智能技术筛选出最具操作性的见解，并将其发送到您的收件箱。

Perplexity、Stripe、Oura、lululemon和DoorDash等团队均依赖Unpack来确保不遗漏任何客户的声音。
使用 Unwrap，您将获得：

所有客户反馈均已自动分类
使用Unpack Assistant进行查询反馈，或使用Unpack的MCP在您喜欢的工具中进行查询反馈
实时反馈警报，随时获取
客户情绪的清晰洞察
Unwrap正在为Rundown AI的订阅用户提供免费试用！与团队一起领取15个minutes，即可完成设置。

3 / 10

🧠 苹果全新人工智能Siri将迎战ChatGPT

人工智能资讯：苹果公司期待已久的AI Siri似乎终于初具雏形，彭博社一窥这款经过改造的助手的风采，它基于Google Gemini重新构建，拥有专门的ChatGPT风格应用程序，并支持第三方人工智能代理。
细节如下：

Siri将内置于动态岛中，通过下拉界面，利用设备数据、屏幕内容和网络，执行人工智能搜索、聊天或iOS任务。
该助手基于Google和Gemini重新构建，将运行类似于Perplexity的基于人工智能的网络搜索，搜索结果将以动态卡片的形式在动态岛中呈现。
在卡片上进一步向下滑动，会弹出一个专门的ChatGPT风格的Siri应用，用户可以选择将查询发送给外部AI模型。
经过改进的Siri将登陆相机应用，同时基于人工智能的高级照片编辑、壁纸以及自然语言快捷方式创建功能也在筹备中。
为何重要：苹果在人工智能竞赛中进展缓慢，2024年承诺的功能从未推出，而OpenAI和Google则遥遥领先。

如果此次重大改革得以实现，苹果的10亿多iPhone用户将通过他们日常使用的手机体验到人工智能。

但如果未能实现，约翰·特努斯（John Ternus）接任新任首席执行官后将面临诸多挑战。

4 / 10

👾 使用 Codex 仅凭一个提示即可构建游戏

人工智能资讯：在本指南中，您将学习如何使用Codex /goal构建一个小型浏览器游戏，而无需每隔minutes就推动智能体一次。

此游戏仅为演示，但真正的进步在于学会为Codex设定一个它能够自行努力实现的终点线。
分步说明：

打开终端并启用目标功能：“codex 功能启用目标。”然后，想一个简短且简单的游戏创意，并制定可测试的游戏规则
如果这个想法感觉模糊不清，请ChatGPT用100字或更少的文字重新表述，并附上客观测试。如果无法做到这一点，那么这个范围对于一个目标来说可能太大了
将描述粘贴到/goal之后，然后按照Codex创建的清单进行。对于一个简单的游戏，预计需要5-6个minutes用于构建、测试和修复
在测试时，以另一个/目标指令的形式给出反馈。

指令要具体明确，例如：“为用户可以执行的每个操作添加不同的动画”
专业提示：这不仅适用于游戏。列出三个业务流程，选择一个指标来证明每个流程的有效性，然后要求Codex根据该指标改进流程。

5 / 10

📊 自信地扩展您的大型语言模型（LLM）应用

AI资讯：Datadog的免费指南指导团队将可观察性构建到其大型语言模型（LLM）stack中，这样工程师们就可以在生产环境中快速推进AI项目，而不会在错误、成本或安全风险方面毫无头绪。
在本指南中，您将学习如何：
监控大型语言模型（LLM）工作流的错误、延迟和令牌成本

在提示注入和敏感数据泄露问题升级之前，及时检测并处理
通过内置和自定义检查，大规模评估输出质量
免费下载《大型语言模型（LLM）可观察性最佳实践指南》。

6 / 10

🧑‍💻 人工智能使开发产出翻倍，但并非对每个人都适用

AI资讯：Cursor根据其自有产品和工程数据发布了《开发者习惯报告》，报告显示开发者产出已翻倍，但成果分布不均，一小部分高级用户遥遥领先于其他人。
细节如下：

在18个月内，每位开发人员每周新增的代码行数从3.6K行增加到8.6K行，涉及1K+行代码更改的大型合并请求（PR）变得越来越常见。
代理正在执行更多的端到端工作，两个月内工具调用次数增加了30%，且未经人工审查即提交的AI所做更改数量增加了5倍。
不同模型中，每个代理请求的成本相差9倍（Opus 4.7的成本最高），这意味着一个工作流程的成本可能会因底层AI的不同而大相径庭。
然而，收益仍然高度集中，前1%的开发人员编写的代码量是中位数活跃用户的46倍，且这一差距每月都在扩大。
为何重要：人工智能从事更深层次的工作并贡献更多代码，这与日益增强的能力相吻合，但使用上的差距值得注意。

并非所有人都获得了全部的生产力提升，而且由于不同模型中每个代理请求的成本差异很大，许多团队可能并未为其任务使用最具成本效益的人工智能。

7 / 10

🛠️ 热门人工智能工具

💡 创始人入门套件 - Pika的Claude skills，助您从产品开发到成功推出
🎙 配音V2 - ElevenLabs’全新配音AI，支持90种语言
📽 Paris 2.0 - Bagel的高效、去中心化训练的视频生成人工智能
💻 电脑 - Perplexity的代理，现已集成到Excel、Word和PowerPoint中

8 / 10

📰 今日人工智能的其他所有内容

Workday DevCon数字体验活动，⟦第5季度⟧第2场和第4场 — 构建代理。构建⟦第1季度⟧。在Workday开发者平台上打造你的职业生涯。立即注册。*
Google为Ultra用户提供了双倍的Omni生成次数，并通过免费Flash-Lite提示、限制高成本请求以及改进跟踪功能，解决了Gemini的使用限制问题。
埃隆·马斯克表示，SpaceX与Anthropic的计算机协议期限为180天，而非三年（如S-1申请文件中所述），但他表示也有可能签订更长期的协议。
美国有线电视新闻网（CNN）对Perplexity提起诉讼，指控该初创公司的人工智能工具在提供被付费墙锁定的信息的同时，生成了其文章的“逐字”副本。
一位人工智能顾问向Axios透露，由于未对员工Claude许可证的使用设置限制，他们的客户在一个月内意外花费了近5亿美元。
*赞助列表

9 / 10

🤝 社区AI工作流程

在每一期通讯中，我们都会展示一位读者是如何利用人工智能更高效地工作、节省时间或让生活变得更轻松的。
今天的工作流程来自德克萨斯州奥斯汀的读者加布里埃拉：
“我真的很想知道自己最适合的颜色是什么。

我向ChatGPT上传了几张自拍，并要求它进行调色板分析。

结果与我猜测的相符，于是我又根据脸型选择了发型，并根据我的体型选择了服装。

我上传了更多照片，并分享了我的尺寸，让它对颜色、风格、形状等细节进行精确分析。
接下来，我让ChatGPT将这些内容写成了自定义指令，create作为ChatGPT中的一个项目，仅供样式参考。

我使用了它所写的内容，并做了小幅修改，然后启动了该项目，并添加了一些额外的照片（一些是我的照片，一些是为了寻找灵感）。
现在我用那个项目来获取关于日常穿搭、发型、新衣服等方面的反馈。效果非常好，我感到更加自信，也更加像我自己了。
”
你是如何使用人工智能的？请在此处告诉我们。

10 / 10

🎓 亮点：新闻、指南与活动

阅读我们上一期人工智能通讯：蛋白质的世界模型现已推出
阅读我们上一期的科技通讯：由乔尼·艾夫设计的法拉利首款电动汽车
阅读我们上一期的机器人通讯：Figure的人形机器人找到了零售工作
今日AI工具指南：使用Codex，一键生成游戏
请回复参加下一场研讨会，June 18：打造营销创意工作室