Anthropic刚刚超越了OpenAI

附加:使用Codex在一个提示中构建一个功能齐全的游戏

阿洛

阿洛

发布于 2026年5月30日

每日简报概述

早上好,人工智能爱好者们。Anthropic刚刚从OpenAI手中夺得领先地位——不仅凭借更强大的前沿模型,在市场上也是如此。
随着新的Opus 4.8在基准测试中表现出色,更强大的Mythos即将推出,且估值接近1万亿美元,达里奥及其团队似乎终于为轰动一时的公开上市做好了所有准备。
今日人工智能简报:

  • Anthropic的Opus 4.8,估值近1万亿美元
  • 苹果公司的新款人工智能助手Siri将与ChatGPT一决高下
  • 使用Codex,一键构建游戏
  • 人工智能使开发产出翻倍,但并非对每个人都有效
  • 4款全新AI工具、社区工作流程等
1 / 10

🚀 Anthropic的Opus 4.8,估值近1万亿美元

🚀 Anthropic的Opus 4.8,估值近1万亿美元

人工智能资讯:Anthropic在同一天宣布了两项重大消息——Claude Opus 4.8,该系统几乎在所有主要基准测试中均表现出色;以及一轮巨额融资,使其成为全球最具价值的AI实验室。
细节如下:

  • Opus 4.8与4.7价格相同,在代理编码、计算机使用、财务分析和《人性的最后考验》方面优于GPT-5.5和Gemini 3.1 Pro。
  • 在所有Anthropic模型中,4.8模型最不懒惰,也更诚实,它更倾向于标记不确定性,而不是做出未经证实的断言。
  • 该模型的快速模式成本降低了3倍,此外,claude.ai获得了新的努力控制功能,而Claude Code则获得了并行子代理,以处理复杂且长时间运行的任务。
  • Anthropic在发布的同时宣布融资650亿美元,使其估值达到9650亿美元(超过OpenAI),并承诺“未来几周”将推出一款Mythos级人工智能
    为何重要:虽然竞争尚未结束,但Anthropic已经跨越了一个两年前看似不可能实现的里程碑——估值高于OpenAI,并且其模型在几乎所有基准测试中均处于领先地位。

显然,其“安全第一”的策略在商业上取得了成效,尽管萨姆·奥特曼(Sam Altman)称这一策略为“基于恐惧的营销”

2 / 10

⚡ 看看Oura是如何自动化客户反馈分析的

⚡ 看看Oura是如何自动化客户反馈分析的

AI资讯:Unpack的客户智能平台可将您的所有反馈(调查、评论、支持工单、社交评论)整合到一个视图中,然后利用人工智能技术筛选出最具操作性的见解,并将其发送到您的收件箱。

Perplexity、Stripe、Oura、lululemon和DoorDash等团队均依赖Unpack来确保不遗漏任何客户的声音。
使用 Unwrap,您将获得:

  • 所有客户反馈均已自动分类
  • 使用Unpack Assistant进行查询反馈,或使用Unpack的MCP在您喜欢的工具中进行查询反馈
  • 实时反馈警报,随时获取
  • 客户情绪的清晰洞察
    Unwrap正在为Rundown AI的订阅用户提供免费试用!与团队一起领取15个minutes,即可完成设置。
3 / 10

🧠 苹果全新人工智能Siri将迎战ChatGPT

🧠 苹果全新人工智能Siri将迎战ChatGPT

人工智能资讯:苹果公司期待已久的AI Siri似乎终于初具雏形,彭博社一窥这款经过改造的助手的风采,它基于Google Gemini重新构建,拥有专门的ChatGPT风格应用程序,并支持第三方人工智能代理。
细节如下:

  • Siri将内置于动态岛中,通过下拉界面,利用设备数据、屏幕内容和网络,执行人工智能搜索、聊天或iOS任务。
  • 该助手基于Google和Gemini重新构建,将运行类似于Perplexity的基于人工智能的网络搜索,搜索结果将以动态卡片的形式在动态岛中呈现。
  • 在卡片上进一步向下滑动,会弹出一个专门的ChatGPT风格的Siri应用,用户可以选择将查询发送给外部AI模型。
  • 经过改进的Siri将登陆相机应用,同时基于人工智能的高级照片编辑、壁纸以及自然语言快捷方式创建功能也在筹备中。
    为何重要:苹果在人工智能竞赛中进展缓慢,2024年承诺的功能从未推出,而OpenAI和Google则遥遥领先。

如果此次重大改革得以实现,苹果的10亿多iPhone用户将通过他们日常使用的手机体验到人工智能。

但如果未能实现,约翰·特努斯(John Ternus)接任新任首席执行官后将面临诸多挑战。

4 / 10

👾 使用 Codex 仅凭一个提示即可构建游戏

👾 使用 Codex 仅凭一个提示即可构建游戏

人工智能资讯:在本指南中,您将学习如何使用Codex /goal构建一个小型浏览器游戏,而无需每隔minutes就推动智能体一次。

此游戏仅为演示,但真正的进步在于学会为Codex设定一个它能够自行努力实现的终点线。
分步说明:

  • 打开终端并启用目标功能:“codex 功能启用目标。”然后,想一个简短且简单的游戏创意,并制定可测试的游戏规则
  • 如果这个想法感觉模糊不清,请ChatGPT用100字或更少的文字重新表述,并附上客观测试。如果无法做到这一点,那么这个范围对于一个目标来说可能太大了
  • 将描述粘贴到/goal之后,然后按照Codex创建的清单进行。对于一个简单的游戏,预计需要5-6个minutes用于构建、测试和修复
  • 在测试时,以另一个/目标指令的形式给出反馈。

指令要具体明确,例如:“为用户可以执行的每个操作添加不同的动画”
专业提示:这不仅适用于游戏。列出三个业务流程,选择一个指标来证明每个流程的有效性,然后要求Codex根据该指标改进流程。

5 / 10

📊 自信地扩展您的大型语言模型(LLM)应用

📊 自信地扩展您的大型语言模型(LLM)应用

AI资讯:Datadog的免费指南指导团队将可观察性构建到其大型语言模型(LLM)stack中,这样工程师们就可以在生产环境中快速推进AI项目,而不会在错误、成本或安全风险方面毫无头绪。
在本指南中,您将学习如何:
监控大型语言模型(LLM)工作流的错误、延迟和令牌成本

  • 在提示注入和敏感数据泄露问题升级之前,及时检测并处理
  • 通过内置和自定义检查,大规模评估输出质量
    免费下载《大型语言模型(LLM)可观察性最佳实践指南》。
6 / 10

🧑‍💻 人工智能使开发产出翻倍,但并非对每个人都适用

🧑‍💻 人工智能使开发产出翻倍,但并非对每个人都适用

AI资讯:Cursor根据其自有产品和工程数据发布了《开发者习惯报告》,报告显示开发者产出已翻倍,但成果分布不均,一小部分高级用户遥遥领先于其他人。
细节如下:

  • 在18个月内,每位开发人员每周新增的代码行数从3.6K行增加到8.6K行,涉及1K+行代码更改的大型合并请求(PR)变得越来越常见。
  • 代理正在执行更多的端到端工作,两个月内工具调用次数增加了30%,且未经人工审查即提交的AI所做更改数量增加了5倍。
  • 不同模型中,每个代理请求的成本相差9倍(Opus 4.7的成本最高),这意味着一个工作流程的成本可能会因底层AI的不同而大相径庭。
  • 然而,收益仍然高度集中,前1%的开发人员编写的代码量是中位数活跃用户的46倍,且这一差距每月都在扩大。
    为何重要:人工智能从事更深层次的工作并贡献更多代码,这与日益增强的能力相吻合,但使用上的差距值得注意。

并非所有人都获得了全部的生产力提升,而且由于不同模型中每个代理请求的成本差异很大,许多团队可能并未为其任务使用最具成本效益的人工智能。

7 / 10

🛠️ 热门人工智能工具

  • 💡 创始人入门套件 - Pika的Claude skills,助您从产品开发到成功推出
  • 🎙 配音V2 - ElevenLabs’全新配音AI,支持90种语言
  • 📽 Paris 2.0 - Bagel的高效、去中心化训练的视频生成人工智能
  • 💻 电脑 - Perplexity的代理,现已集成到Excel、Word和PowerPoint中
8 / 10

📰 今日人工智能的其他所有内容

Workday DevCon数字体验活动,⟦第5季度⟧第2场和第4场 — 构建代理。构建⟦第1季度⟧。在Workday开发者平台上打造你的职业生涯。立即注册。*
Google为Ultra用户提供了双倍的Omni生成次数,并通过免费Flash-Lite提示、限制高成本请求以及改进跟踪功能,解决了Gemini的使用限制问题。
埃隆·马斯克表示,SpaceX与Anthropic的计算机协议期限为180天,而非三年(如S-1申请文件中所述),但他表示也有可能签订更长期的协议。
美国有线电视新闻网(CNN)对Perplexity提起诉讼,指控该初创公司的人工智能工具在提供被付费墙锁定的信息的同时,生成了其文章的“逐字”副本。
一位人工智能顾问向Axios透露,由于未对员工Claude许可证的使用设置限制,他们的客户在一个月内意外花费了近5亿美元。
*赞助列表

9 / 10

🤝 社区AI工作流程

在每一期通讯中,我们都会展示一位读者是如何利用人工智能更高效地工作、节省时间或让生活变得更轻松的。
今天的工作流程来自德克萨斯州奥斯汀的读者加布里埃拉:
“我真的很想知道自己最适合的颜色是什么。

我向ChatGPT上传了几张自拍,并要求它进行调色板分析。

结果与我猜测的相符,于是我又根据脸型选择了发型,并根据我的体型选择了服装。

我上传了更多照片,并分享了我的尺寸,让它对颜色、风格、形状等细节进行精确分析。
接下来,我让ChatGPT将这些内容写成了自定义指令,create作为ChatGPT中的一个项目,仅供样式参考。

我使用了它所写的内容,并做了小幅修改,然后启动了该项目,并添加了一些额外的照片(一些是我的照片,一些是为了寻找灵感)。
现在我用那个项目来获取关于日常穿搭、发型、新衣服等方面的反馈。效果非常好,我感到更加自信,也更加像我自己了。

你是如何使用人工智能的?请在此处告诉我们。

10 / 10

🎓 亮点:新闻、指南与活动

  • 阅读我们上一期人工智能通讯:蛋白质的世界模型现已推出
  • 阅读我们上一期的科技通讯:由乔尼·艾夫设计的法拉利首款电动汽车
  • 阅读我们上一期的机器人通讯:Figure的人形机器人找到了零售工作
  • 今日AI工具指南:使用Codex,一键生成游戏
  • 请回复参加下一场研讨会,June 18:打造营销创意工作室

相关文章推荐