Google 超越 OpenAI 的数学突破——9比1

PLUS:打造一个AI秘书,规划你的每一天

阿洛

阿洛

发布于 2026年5月25日

每日简报概述

早上好,人工智能爱好者们。

上周,OpenAI因宣布其人工智能破解了一个有80年历史的数学问题而登上头条新闻。

事实证明,它并不是唯一一个。

GoogleDeepMind悄无声息地超越了它们,做出了八项(而非一项)更好的成绩。
该公司的AlphaProof Nexus系统自主解决了九个公开的厄多斯问题——这些问题被认为是数学领域一些最难解决的未解问题——每个问题的成本仅为几百美元。
今日人工智能简报:

  • Google的人工智能破解了九个未解的数学问题
  • AI资讯圆桌会议:我们的AI应用案例
  • 打造一个AI秘书,帮你规划一天的生活
  • Claude Mythos发现10,000多个关键漏洞
  • 4款全新AI工具、社区工作流程等
1 / 10

🧮 Google的人工智能破解了九个未解的数学问题

🧮 Google的人工智能破解了九个未解的数学问题

人工智能资讯:Google DeepMind的AlphaProof Nexus是一款能够生成机器验证数学证明的AI系统proofs,在OpenAI宣布其自身在埃尔德什问题上的突破仅一天后,该系统就解决了九个公开的埃尔德什问题,其中包括两个悬而未决56年的问题。
细节如下:
该系统将大型语言模型(LLM)与证明助手Lean相结合,为组合学和图论中的九个问题生成了机器验证的proofs。

  • 每个问题解决需要花费数百美元,同时,该人工智能还证明了《整数序列在线百科全书》中的44个公开猜想。
  • 一个更简单的代理版本虽然能得出相同的结果,但成本更高,而需要新数学结构的问题仍然无法解决。
  • OpenAI上周的胜利见证了其人工智能(AI)推翻了已有80年历史的埃尔多斯猜想——就在几个月前,该团队还曾声称解决了10个新问题,但后来又收回了这一说法。
    为何重要:Google在解决数十年未解的数学问题方面所取得的进展,展示了人工智能在寻找原创解决方案方面的迅速进展,以及形式验证如何改变游戏规则。

该系统生成proofs,在Lean中进行验证,并重复此过程直至其中一个通过。

随着时间的推移,这将帮助研究人员以机器的速度做出新发现。

2 / 10

💡 掌握代理式人工智能,Google助力初创企业

💡 掌握代理式人工智能,Google助力初创企业

AI资讯创业学校:Agentic AI是一项沉浸式的全球培训计划,旨在帮助创始人和开发者超越基本的聊天机器人,利用Google云构建稳健、可投入生产的自主工作流程。
在该项目中,你将探索:

  • 与Gemini Live合作开发实时语音AI原型。
  • 利用多模态RAG进行高级数据基础构建。
  • 构建双向视觉代理以进行数据提取。
    注册参加现场培训系列。
3 / 10

💡 AI资讯 圆桌会议:我们的AI应用案例

💡 AI资讯 圆桌会议:我们的AI应用案例

AI资讯:AI资讯圆桌会议是一个每周例行活动,我们会向AI资讯团队成员进行调查,了解我们在工作和日常生活中如何使用人工智能。
内容经理马尤尔:过去六个月里,我的下载文件夹里堆满了各种随机文件,我一直迟迟没有清理。

于是,我授权Claude Cowork访问该文件夹,并请求它“帮我整理这个文件夹”
在短短minutes内,它处理了近100GB的文件,按文件类型和文件夹进行了整理,并在短短minutes内删除了重复文件,这原本可能需要我花费数小时的工作时间。
舒布哈姆(Shubham),编辑:我使用Claude帮助我的姐夫为他的电子商务店铺搭建了一个Shopify网站。

通过分享截图、设计参考和业务需求,我让Claude生成了Liquid代码,解决了主题问题,修改了页面布局,并详细说明了在Shopify中需要进行更改的具体位置。
Claude不再需要为每个问题在论坛和文档中翻找,而是像一位随需应变的Shopify开发人员一样,提供全方位的帮助。

它加快了开发速度,使网站能够更快地从概念阶段过渡到上线阶段。

4 / 10

📆 打造一个AI秘书,规划你的每一天

📆 打造一个AI秘书,规划你的每一天

人工智能资讯:在本指南中,您将学习如何使用Codex或Claude Code来构建一个AI任务管理器,该管理器每天早上会检查Slack、Gmail以及您的日历。

它能够将杂乱无章的任务转化为一个按优先级排序的待办事项列表,并且随着您的使用,列表会日益完善。
逐步说明:

  • Create 一个文件夹,打开其中的 Claude Code,并要求它 create 一个技能,该技能会查看你的 Slack、Gmail 和每日日历,将任务按优先级从高到低排序,并将它们放在 MonoNote.md 的顶部,同时显示日期、反馈和状态复选框
  • 告诉代理去create MonoNote.md和task-rules.md,并让它将每个任务的高/低优先级规则添加到task-rules.md中
  • 运行该技能并查看列表。MonoNote.md的顶部应显示今天的日期,分组任务,源链接以及全天可用的复选框
  • 首次运行后,请客服人员create自动化系统。该系统将审核前一天的反馈,处理被搁置的任务,更新规则,然后生成新列表
    专业提示:Create 每周审核技能,扫描您的任务列表,找出重复的任务,并建议哪些任务可以通过人工智能实现自动化。
5 / 10

🎧 Oura如何利用人工智能倾听客户心声

🎧 Oura如何利用人工智能倾听客户心声

AI资讯:真正围绕客户打造产品,而不仅仅是嘴上说说,到底是怎么一回事?

Oura就做到了。

5月27日,加入Oura团队,了解他们如何通过产品、工程和领导力方面的unify会员反馈,以及真实的会员声音如何影响他们做出的每一个决定。
本节课程你将学到:

  • 人工智能在揭示成员实际言论中所起的作用
  • 将客户意见转化为路线图决策的工作流程
  • 对任何将客户反馈作为工作一部分的团队而言,这些经验教训都值得借鉴
  • 与Oura和Unpack的领导进行现场问答
    请在此处预留您的席位。如果您无法在27日到场,别担心!只需注册,您就会在会议结束后自动获得会议录像。
6 / 10

🛡 Claude Mythos 发现 10,000+ 个严重漏洞

🛡 Claude Mythos 发现 10,000+ 个严重漏洞

AI资讯:Anthropic分享了Glasswing项目的首批成果,揭示了Claude Mythos Preview及其约50个合作伙伴在短短一个月内发现了10,000多个高严重性或关键严重性的漏洞。
细节如下:

  • 仅Cloudflare就发现了2000个漏洞,其误报率优于人工测试。Mozilla在Firefox 150中发现了271个漏洞并进行了修复。
  • Anthropic还扫描了1000多个开源项目,其中Mythos标记了6202个为高风险/关键风险。经过独立分类后,62%(即近3900个)被保留。
    Mythos的检测功能不仅限于标记漏洞,一家合作银行利用Mythos检测并阻止了一笔150万美元的欺诈性电汇。
  • 现在,Glasswing将扩展到更多的合作伙伴,包括美国和盟国政府,随后将全面发布Mythos级模型。
    为何重要:Anthropic表示,Mythos仍处于封闭状态,因为包括该公司自身在内的任何公司都没有足够强大的防护措施来防止滥用。

但随着OpenAI加强其网络模型,以及中国参与者迎头赶上,同样强大(甚至更强大)的人工智能将会出现。

届时,世界能以多快的速度进行修复,将是一个真正的考验。

7 / 10

🛠️ 热门AI工具

  • ⚡ CData Connect AI - 让ChatGPT、Claude、Copilot或任何AI工具在一个统一层中,对您的业务数据进行实时、受控、可读写的访问*
  • 🤖 DeepSeek V4-Pro - DeepSeek的旗舰版人工智能,成本比竞争对手低9倍
  • 🚀 Gemini 3.5 闪光灯 - Google 的全新闪光灯型号,速度提升 4 倍,价格减半
  • 🧠 Polsia - 人工智能联合创始人,全天候规划、构建和运营业务
    *赞助列表
8 / 10

📰 今日人工智能其他资讯

DeepSeek 将 V4-Pro 的定价永久性下调 75%,使其降至每百万输入代币 0.435 美元和每百万输出代币 0.87 美元,远低于闭源竞争对手。
Perplexity 开源的 Bumblebee 是一款适用于 macOS 和 Linux 的扫描工具,可在供应链事件中检查有风险的软件包、扩展程序和 AI 工具配置。
NVIDIA发布了NV-Generate-MR-Brain,这是一个基础模型,能够生成合成3D脑部MRI扫描图像和标注,以加速医学影像人工智能的发展。
据英国《金融时报》报道,麦肯锡正在重新考虑其计费模式,因为人工智能降低了计费小时的价值,而客户要求费用与业务成果挂钩。
据《纽约时报》报道,白宫批准拨款90亿美元,以帮助美国间谍机构获取先进的人工智能芯片,因为人们担心他们在部署前沿模型方面落后了。
星巴克在九个月后取消了其人工智能库存系统,理由是北美各门店持续存在盘点错误和产品标签错误的问题。

9 / 10

🤝 社区人工智能工作流程

在每一期通讯中,我们都会展示一位读者如何利用人工智能更高效地工作、节省时间或让生活更轻松。
今天的流程来自加利福尼亚州弗雷斯诺的读者艾丽西亚:
“在多个网站上自行搜索大学、比较各种选择,并试图找到一个可能与我的全职工作和收入水平相匹配的项目后,我请ChatGPT帮助我搜索并比较各大学的课程、费用,以及它们是线下授课还是在线授课。
然后我让ChatGPT帮我构建了一些问题,以便向招生顾问提问。

ChatGPT帮我提出了所有我没想到的重要问题,帮助我缩小了选择范围,确定哪个学校项目更适合我目前的生活和工作状况。

你是如何使用人工智能的?请在此处告诉我们。

10 / 10

🎓 亮点:新闻、指南与活动

  • 阅读我们上一期人工智能通讯:对Google首席执行官的独家专访
  • 阅读我们上一期的科技通讯:马斯克的SpaceX首次公开募股透露出终身首席执行官的意味
  • 阅读我们上一期的机器人通讯:应用派遣人形机器人进行家庭清洁
  • 今日AI工具指南:打造一个AI秘书,帮你规划一天日程
  • 5月27日下一场工作坊的回复:成为AI原生领导者

相关文章推荐