OpenAI的超级应用隐藏在Codex之中

另外:使用Ollama,您可以在笔记本电脑上免费运行大型语言模型(LLM)

阿洛

阿洛

发布于 2026年4月17日

每日简报概述

早上好,人工智能爱好者们。OpenAI数月来一直在宣传一款超级应用。今天,它发布了首个重要版本。
随着Codex重大更新的推出,带来了诸如后台计算机使用、应用内浏览器、并行代理等新功能,这是OpenAI迄今为止朝着其一直公开构建的一体化平台迈出的最明确的一步。
今日人工智能简报:

  • OpenAI的超级应用转型与Codex更新
  • Anthropic的Opus 4.7超越竞争对手,但落后于Mythos
  • 使用Ollama在您的笔记本电脑上免费运行大型语言模型(LLM)
  • OpenAI的第一个科学领域专用模型
  • 4款全新AI工具、社区工作流程等
1 / 10

🧰 OpenAI的超级应用转型与Codex更新

🧰 OpenAI的超级应用转型与Codex更新

AI资讯:OpenAI刚刚更新了其Codex平台,将其从编码代理转变为具有后台计算机使用、并行代理、应用内浏览器、图像生成等功能的整合性ChatGPT + Atlas + Codex app。
细节如下:

  • 背景:计算机使用让Codex能够独立运行任何Mac应用程序,即使在没有应用程序编程接口(API)的应用程序中,也能同时运行多个代理。
  • 内存(预览版)现在可以在不同会话之间保留偏好设置和context,而自动化功能则让Codex能够在几天后继续执行长时间运行的任务。
  • 由Atlas驱动的应用内浏览器允许开发者标记页面以指引Codex,而内联的gpt-image-1.5则可在不切换应用的情况下创建原型。
  • Codex拥有300万周活跃用户,月环比增长70%,Codex负责人蒂博·索蒂奥表示,OpenAI正在“公开打造super应用”
    为何重要:Anthropic凭借Claude Code和Cowork大获成功,而OpenAI则是其迄今为止面临的最大挑战——将Codex带入一个类似的竞技场,其功能扩展远不止是一个代理编码助手。

随着该公司构建“superapp”,这似乎是朝着这一愿景迈出的重要第一步。

2 / 10

🛠️ 你的应用创意无需开发团队

🛠️ 你的应用创意无需开发团队

人工智能资讯:过去,聘用开发人员或学习编程是将产品推向市场的唯一途径。

Lovable彻底消除了这一障碍——其人工智能能够根据简单的文本描述构建出真实、可用的应用程序和网站。
已有数百万用户在使用Lovable进行构建:

  • 在minutes内,从创意到功能齐全、客户可用的应用,无需数月
  • 通过简单提示即可快速启动Shopify商店、管理工具、落地页等
  • 开展实际业务,验证想法,并节省数千美元的开发成本
    即日起,在lovable.dev免费开始构建。
3 / 10

⚙️ Anthropic的Opus 4.7超越对手,落后于Mythos

⚙️ Anthropic的Opus 4.7超越对手,落后于Mythos

AI资讯:Anthropic刚刚发布了Claude Opus 4.7,这是该公司最新的顶级公开模型,在代理编码方面超越了GPT-5.4和Gemini 3.1 Pro——尽管仍落后于该公司尚未发布的Mythos预览版。
细节如下:

  • 在SWE-bench Pro编码基准测试中,Opus 4.7的性能从4.6版本的53.4%跃升至64.3%,而门控Mythos预览版的性能仍然领先,达到77.8%。
  • 该型号的价格与Opus 4.6在API使用情况下的价格相同,但升级速度明显快于其前代产品。
  • 其他新功能包括一个介于高和最大之间的Claude Code默认“xhigh”级别,以及一个用于标记错误和设计问题的/ultrareview斜杠命令。
    此次发布之际,用户纷纷抱怨4.6版本的性能有所下降,而尽管有基准测试,但4.7版本的早期反馈在功能上也存在分歧。
    为何重要:Anthropic目前正同时运行两条轨道:一条是两个月一次的快速公开发布节奏,另一条是Mythos中的封闭前沿线,仅对独家合作伙伴开放。

这种划分让公司能够对其最强大的模型进行压力测试,但也标志着公众首次感到真正的技术前沿似乎遥不可及。

4 / 10

🦙 使用Ollama,在您的笔记本电脑上免费运行大型语言模型(LLM)

🦙 使用Ollama,在您的笔记本电脑上免费运行大型语言模型(LLM)

人工智能资讯:在本指南中,您将学习如何在笔记本电脑上免费安装Ollama并运行一个真正的AI模型。无需订阅,无需账户,且数据不会离开您的设备。
分步说明:

  • 前往ollama.com/download,下载适用于Mac、Linux或Windows PC的安装程序,并进行安装设置。安装完成后,打开该应用程序
  • 在应用中,进入“新建聊天”,选择一个轻量级模型,如gemma3(约3GB,适用于任何8GB RAM的笔记本电脑),然后等待下载
  • 模型下载完成后,输入一个提示并按下回车键。就是这样。你正在与一个完全在你的笔记本电脑上运行的真实AI聊天
  • 尝试开启飞行模式,然后再次发送信息,观察在完全无网络连接的情况下,信息能否成功发送
    专业提示:您可以使用Ollama的API为您的模型提供网络和其他工具的访问权限。您还可以将像Claude Code这样的编码代理指向模型并免费运行。
5 / 10

💸 削减对大规模评估人工智能代理的信托税

💸 削减对大规模评估人工智能代理的信托税

AI资讯:使用外部大型语言模型(LLM)评估代理似乎成本不高。

但当你的代理流量增长时,情况就不同了。

Fiddler’s Guide详细介绍了如何在消除生产中的风险漏洞的同时降低总体拥有成本。
学习如何:

  • 评估每条轨迹,不进行采样
  • 使用包含电池的信任模型在环境中评估代理
  • 大规模降低API成本
    立即下载Agentic TCO指南。
6 / 10

🧬 OpenAI的首个科学领域专用模型

🧬 OpenAI的首个科学领域专用模型

AI资讯:继周二的GPT-5.4-Cyber之后,OpenAI推出了GPT-Rosalind,这是专为药物发现和生物研究打造的新生命科学系列中的首个模型,也是该公司首次真正涉足领域专用推理。
细节如下:

  • 罗莎琳德能够阅读科学论文、查询实验室数据库、设计实验并提出生物学假设,从而简化了研究过程。
  • 该模型在生物化学、实验设计、工具使用等科学特定基准测试中的表现优于GPT-5.4。
    在基因疗法实验室Dyno Therapeutics进行的一项RNA盲测中,Rosalind在预测任务上的表现优于95%的人类科学家。
  • 在测试阶段,该模型已向符合资格的企业用户开放,安进、莫德纳和艾伦研究所等公司已在使用该模型。
    为何重要:周二是GPT-5.4-Cyber,而今天是GPT-Rosalind。

三天内推出两个领域模型,这显示出一种趋势——旗舰模型可能样样精通,但在网络防御或药物设计等行业的高端领域,真正的大规模楔形模型可能需要purpose构建的模型。

7 / 10

🛠️ 热门人工智能工具

  • 🤖 Claude Opus 4.7 - Anthropic全新顶级人工智能,采用先进的智能体编码技术
  • ⚙️ Windsurf 2.0 - 带有全新指挥中心和Devin云代理的Agentic集成开发环境(IDE)
  • 🚀 Codex - OAI的编码代理,现已支持电脑使用、应用内浏览器等功能
  • 🧠 HY-World 2.0 - 腾讯的世界模型,可创建交互式3D场景
8 / 10

📰 今日人工智能其他要闻

Perplexity推出了“个人电脑”这款顶级Mac应用,该应用可跨20多个前沿模型运行代理,以驱动本地应用、读取文件,并全天候引导其Comet浏览器。
Windsurf推出了2.0版本,新增了一个代理指挥中心,该中心为并行云代理和本地代理的集群提供了一个全新的指挥中心视图,并将Devin集成到了集成开发环境(IDE)中。
腾讯的浑源团队开源了HY-World 2.0,这是一个能够生成具有物理感知运动的可编辑3D场景的世界模型,可直接应用于3D流程。
据报道,尽管Anthropic公司已被列入黑名单且目前正与公司进行法律诉讼,美国政府仍准备允许某些机构使用Anthropic的Mythos AI。
阿里巴巴的ATH团队推出了测试版Happy Oyster,这是一种全新的世界模型,能够根据多模态输入即时生成交互式3D环境。

9 / 10

🤝 社区人工智能工作流程

在每一期通讯中,我们都会展示一位读者如何利用人工智能更高效地工作、节省时间或让生活更轻松。
今日的工作流程来自华盛顿州吉格港的读者杰瑞·G:
“我是一位73岁的作家和编剧。

我一直在使用Claude来打造我的最后两本书。

Claude帮助设计了书籍封面,编排了内文格式,甚至为我的故事提供了书名建议。

现在书已经印刷出来,Claude还帮我向读书俱乐部、图书馆和社交媒体网站推销。

Claude帮助我在Substack上建立了关注者群体,并在Instagram和BlueSky上每两周发布一篇新故事。

我已经彻底爱上了Claude,以后写书再也不会寻求他的帮助了。


你是如何使用人工智能的?请在此处告诉我们。

10 / 10

🎓 亮点:新闻、指南与活动

  • 阅读我们上一期人工智能简报:Allbirds放弃运动鞋业务,转投人工智能计算领域
  • 阅读我们上一期的科技通讯:Meta即将摘得Google广告桂冠
  • 阅读我们上一期机器人通讯:优步(Uber)100亿美元转向自动驾驶出租车业务
  • 今日AI工具指南:使用Ollama,在笔记本电脑上免费运行大型语言模型(LLM)

相关文章推荐