Gemini在Google I/O的忙碌代理日

PLUS:利用人工智能构建自动化业务报告

阿洛

阿洛

发布于 2026年5月21日

每日简报概述

早上好,人工智能爱好者们。Google在I/O大会上展示了很多内容,但主题比发布列表还要清晰:Gemini正在成为Google每一款产品背后的代理引擎。
新推出的产品,包括Omni、Gemini 3.5 Flash、Spark、Antigravity 2.0,以及一次搜索功能的大幅改进,都指向了同一个战略——让Gemini功能强大、运行迅速且价格低廉,足以覆盖用户所在的任何地方,并由代理完成相关工作。
今日人工智能简报:

  • Gemini在Google I/O大会上忙碌的一天
  • Anthropic lands OpenAI联合创始人安德烈·卡尔帕西
  • 利用人工智能构建自动化业务报告
  • Google推出“智能眼镜”智能眼镜
  • 4款全新AI工具、社区工作流程等
1 / 10

🚀 Gemini在Google I/O大会上忙碌的一天

🚀 Gemini在Google I/O大会上忙碌的一天

AI资讯:Google在其旗舰I/O活动上推出了一系列由Gemini驱动的新版本和功能,包括新的Omni模型、3.5 Flash、Spark代理、Antigravity 2.0以及新的代理搜索升级。
细节如下:

  • Gemini Omni可以将文本、图像、音频或视频输入转换为视频输出,Google将该模型描述为“视频界的Nano Banana”。
  • Gemini 3.5系列以Flash为开端,在各种基准测试中,其速度接近Opus 4.7和GPT-5.5等竞争对手,但成本仅为后者的二分之一。
  • Gemini Spark是一个全新的全天候个人代理,它运行在Google Cloud虚拟机上,能够在工作区、Chrome浏览器、电子邮件和聊天中执行代理操作。
  • Google 标志着 Search 的一次重大更新,这是近一代产品中最大的一次重新设计,增加了跨模态输入、全天候信息代理和用于自定义布局的生成式用户界面。
  • 还包括其他功能和工具,如Gemini for Science、智能眼镜(更多信息见下文)、街景模拟、SynthID AI水印等。
    为何重要:这些升级中最大的主题在于:一个更具代理性、多模态的Gemini正在大规模整合到Google的套件中。

他们的3.5 Flash基准测试虽然并未将竞争对手远远甩开,但将快速、低廉的接近前沿的能力与数百万用户已经习惯使用的普通友好型工具相结合,其威力不容小觑。

2 / 10

🚀 减少猜测,更快发货

🚀 减少猜测,更快发货

人工智能资讯:Datadog LLM Observability 为团队提供从提示和工具调用到基础设施性能和成本的端到端可视化,确保生产环境中的 AI 系统保持可靠、安全,且投资物有所值。
使用Datadog,您可以:

  • 在多步骤AI工作流程引发事故之前对其进行调试
  • 监控质量并检测不同模型版本之间的性能退化
  • 保护大型语言模型(LLM)流程免受提示注入和数据风险的威胁
    下载《大型语言模型(LLM)可观察性最佳实践指南》。
3 / 10

🚪 Anthropic lands OpenAI 联合创始人 安德烈·卡尔帕西

🚪 Anthropic lands OpenAI 联合创始人 安德烈·卡尔帕西

AI资讯:OpenAI联合创始人兼著名AI研究员安德烈·卡尔帕西(Andrej Karpathy)刚刚宣布,他已加入Anthropic,据报道,他将致力于create一个专注于利用Claude自动化AI训练流程的内部团队。
细节:

  • 卡帕蒂于2015年参与创立了OpenAI,并一直领导特斯拉的自动驾驶部门直至2022年,之后他短暂回归OAI,并于2024年离开,创办了一家人工智能教育初创公司。
  • Karpathy将加入Nick Joseph领导的预训练团队,并负责领导新的内部项目,将Claude应用于Anthropic自有的训练流程。
    “在大型语言模型(LLM)的前沿领域,接下来的几年将尤其具有塑造性,”卡帕西(Karpathy)在X上写道,并补充说他计划“及时”恢复他的教育工作
    为何重要:这对Anthropic来说是一个巨大的收获。

Karpathy是世界上最受尊敬的人工智能研究人员之一,在离开OAI(再次)后将他吸引回这一前沿领域是值得注意的。

同样值得注意的是他在那里所做的工作,即推动我们今年在整个行业中看到的相同的自我构建模型探索。

4 / 10

📈 利用人工智能构建自动化业务报告

📈 利用人工智能构建自动化业务报告

AI资讯:在本指南中,您将学习如何使用名为Composio的免费工具将Codex(或Claude Code)连接到Google Analytics。

您将通过简单的提示来探索您的数据,并构建一个可安排每周运行的Markdown报告。
分步说明:

  • Create 一个 Composio 账户,连接 Google 分析工具包,在终端中打开 Codex,然后从此处复制并粘贴您的自定义安装脚本
  • 在Codex中,提示:“使用Composio CLI工具检查我们的Google Analytics设置。

识别可用的账户和属性,找到跟踪[SITE_OR_APP]的属性,并告诉我你会使用哪些维度和指标来制作一份有用的流量报告。

暂时不要create报告。

  • 审核后,提示:“使用Composio + GA识别过去90天内最重要的三个趋势。返回一份包含执行摘要、表格、来源注释和建议行动的Markdown报告”
  • 指示Codex将报告可视化成PDF格式或网站,并最终将这些步骤转化为可重复使用的skills,同时设置自动化功能,以便每日/每周/每月运行这些skills
    专业提示:请Codex审核Composio工具包,寻找有用的连接。在其他连接器(如YouTube或Shopify)上使用探索、分析、可视化框架。
5 / 10

🧮 计算一下你的人工智能评估的总体拥有成本(TCO)

🧮 计算一下你的人工智能评估的总体拥有成本(TCO)

AI资讯:外部大型语言模型(LLM)评估会按每API调用向您收费,并且费用会随着您规模的扩大而增加。

如果您试图通过减少抽样来控制支出,则可能会发生事件未被检测到的情况。

Fiddler Centor模型会在您自己的基础设施中运行评估,没有按调用计费,从而在您扩展规模时降低评估的总拥有成本。
输入你的数字来看看:

  • 在您的跟踪流量下,GPT、Claude和Gemini模型的年度评估成本
  • 你添加的每个评估者如何增加你的每次追踪支出
  • 评估成本曲线如何随着代理流量的增长而变化
    计算我的评估总成本(TCO)。
6 / 10

👓 Google的智能眼镜以“智能眼镜”为卖点

👓 Google的智能眼镜以“智能眼镜”为卖点

AI资讯:Google刚刚发布了其智能眼镜Gemini的预告片,该眼镜搭载了智能眼镜技术,由Warby Parker和Gentle Monster合作打造,主打语音优先的AI镜框,将于今年秋季上市,随后还将推出配备显示屏的Project Aura。
细节:

  • 音频框架与Android或iOS手机配对,运行Gemini进行语音、导航、消息传递、照片编辑(使用Nano Banana编辑器)以及实时翻译。
    这款眼镜将配备摄像头、麦克风、耳罩式扬声器,并通过“Hey Google”或轻敲镜框来快速获取帮助,实现Gemini的访问。
  • 这是自Google Glass倒闭后,Google首次进军眼镜市场,由三星负责硬件,Gentle Monster和Warby Parker负责镜框。
  • XReal的Android XR“Project Aura”显示眼镜则更进一步,它将使用户能够观看视频或内容,从而获得交互式体验。
    为何重要:Google的Meta雷朋(Ray-Ban)竞争对手正式登场,其首款产品较为轻便——其音频优先的镜框相较于竞争对手已配备屏幕的选项稍显落后。

但Google和Gemini生态系统的吸引力无疑对消费者更具粘性,能将他们的人工智能生活紧密相连。

7 / 10

🛠️ 热门人工智能工具

  • 📱 Metabind - 构建具有交互式用户界面的原生MCP应用。一键连接ChatGPT、Claude或您的iOS/Android AI助手*
  • 🧠 Gemini 3.5 闪存 - Google 的新型闪存型号,速度提升 4 倍,价格减半
  • 🤖 Gemini Spark - Google 的个人代理,在云端虚拟机上全天候运行
  • 🎥 Gemini Omni Flash - Google的多模态视频模型,可通过聊天进行编辑
    *赞助列表
8 / 10

📰 今日人工智能的其他所有内容

📰 今日人工智能其他资讯
最新报道显示,GoogleDeepmind的Demis Hassabis是Anthropic的早期天使投资人,Google还单独向这家人工智能领域的竞争对手投资了数十亿美元。
Anthropic为Claude Managed Agents推出了沙箱和MCP隧道,使团队能够在不公开暴露内部服务器的情况下运行工具执行并访问内部服务器。
METR发布了首份《前沿风险报告》,报告发现,来自顶尖实验室的代理能够自主完成持续数周的工程工作,但在难以验证的任务上却面临困难。
OpenAI正在为ChatGPT images采用Google的SynthID水印技术,同时还推出了一个公共验证工具,用于检测图像是否来自其模型。
Google与黑石集团组建了一家联合人工智能云企业,以出租Google的TPU芯片,这家私募股权巨头的50亿美元投资标志着其深度进军人工智能基础设施领域。

9 / 10

🤝 社区人工智能工作流程

在每一期通讯中,我们都会展示一位读者是如何利用人工智能更高效地工作、节省时间或让生活变得更轻松的。
今日的工作流程来自读者“匿名”:
“我偶尔会在Facebook上看到一个‘赞助’广告,这引起了我的兴趣。

在翻阅了一页又一页的广告,宣扬产品的夸张价值,以及更多页的推荐信之后,如果我相信一半的宣传和场景,价格最终才会出现。
我曾突发奇想,在给我的人工智能(AI)输入链接前,先问“这是骗局吗?

”,然后我会得到一个详细的回答,包括是、否、可能,并附带详细信息、背景,通常还会给出“避免此链接,前往‘其他网站/商店’查看同款商品”的建议。
你是如何使用人工智能的?请在此处告诉我们。

10 / 10

🎓 亮点:新闻、指南与活动

  • 阅读我们上一期人工智能简报:OpenAI在时间上击败马斯克
  • 阅读我们上一期的科技通讯:Meta为士兵打造的电子人智能眼镜
  • 阅读我们上一期的机器人通讯:Figure的人形机器人狂欢仍在继续
  • 今日AI工具指南:利用AI构建自动化业务报告
  • 5月27日下一场工作坊的回复:成为AI原生领导者

相关文章推荐