一、评测背景
在刚刚落幕的谷歌 I/O 2026 大会上,Gemini 3.5 家族正式亮相,共推出 Omni、Flash 与 Spark 三个不同定位的版本。本文基于官方公布的基准数据及现场演示,对这一系列模型进行技术向的梳理与评估。
二、Gemini 3.5 Flash 性能实测
2.1 关键指标对比
| 测试项 | Gemini 3.5 Flash | Gemini 3.1 Pro | GPT-5.5 | Claude Opus 4.7 |
|---|---|---|---|---|
| Terminal-Bench 2.1 | 76.2% | 68.5% | 74.5% | 72.8% |
| GDPval-AA (Elo) | 1656 | 1420 | 1580 | 1520 |
| MCP Atlas | 83.6% | 75.2% | 81.2% | 79.5% |
| CharXiv 推理 | 84.2% | 78.5% | 82.1% | 80.3% |
| 输出速度 (tokens/秒) | 289 | 145 | 70 | 65 |
2.2 表现解读
- 编程能力:在 Terminal-Bench 2.1 上,Flash 取得了 76.2% 的成绩,超过了 GPT-5.5(74.5%),代码生成与调试能力令人印象深刻。
- 智能体规划:GDPval-AA 的 1656 Elo 分明显领先竞品,说明该模型在复杂任务的拆解与执行规划上具备显著优势。
- 工具调用:MCP Atlas 得分 83.6%,印证了 Flash 在多步骤工具链调用及推理方面的出色表现。
- 响应速度:289 tokens/秒 的生成速率,约为 GPT-5.5 的 4 倍、Claude Opus 4.7 的 4.5 倍,适合实时交互场景。
三、Gemini Omni 视频生成能力
3.1 核心特性
| 特性 | 能力描述 |
|---|---|
| 任意模态输入 | 图文、音频、视频可混合作为输入 |
| 视频输出 | 直接生成高质量视频内容 |
| 对话式编辑 | 通过自然语言指令修改视频片段 |
| 物理规律模拟 | 正确呈现重力、动能等基础物理效果 |
| 跨场景一致性 | 角色与背景在不同镜头中保持统一 |
3.2 演示案例回顾
- 黏土动画讲解蛋白质折叠:科学上准确展示了氨基酸链形成 α 螺旋和 β 折叠的过程,同时保持了有趣的黏土动画视觉风格。
- 字母与物体匹配:输入 C→水豚、D→迪斯科球、L→熔岩灯,模型能准确理解语义并生成对应图像。
- 自拍视频实时魔改:手掌画圈变成黑洞、街道一键转为赛博朋克风格,交互响应极快,效果惊艳。
四、Antigravity 2.0 智能体开发平台
4.1 主要升级点
| 功能 | 说明 | 体验评分 |
|---|---|---|
| 动态子智能体 | 自动将大任务拆解为若干子任务并行执行 | ⭐⭐⭐⭐⭐ |
| 异步任务管理 | 长时操作不阻塞主流程 | ⭐⭐⭐⭐⭐ |
| 定时任务 | 按计划执行脚本或工作流 | ⭐⭐⭐⭐ |
| 斜杠命令 | /goal、/grill-me、/browser 等快捷指令 | ⭐⭐⭐⭐⭐ |
4.2 实战案例:93 个 Agent 协同构建操作系统
- 子智能体数量:93 个
- 模型请求总量:超过 15,000 次
- 处理 Token 数:26 亿
- 总耗时:12 小时
- 总成本:低于 1000 美元
该案例展示了 Antigravity 2.0 在超大规模多智能体编排上的潜力。
五、Gemini Spark 个人智能管家
5.1 功能概览
- 7×24 小时持续运行:部署在云端专用虚拟机,随时待命。
- 办公生态深度整合:可调用 Gmail、Google Docs、日历等应用。
- 自定义技能学习:能够模仿用户的口吻与习惯,完成个性化任务。
- 语音连续输入:支持长语音转多步骤指令,无需手动拆解。
5.2 应用场景举例
- 工作辅助:自动整理会议要点并起草回复邮件。
- 生活规划:协助策划社区派对,生成 RSVP 登记表与宣传材料。
六、企业级落地建议
对于需要大规模集成多种大模型的企业,通过 API 聚合平台(例如星链4SAPI这类中转接入服务)可以统一对接 Gemini 3.5、GPT-5.5、Claude 等主流模型。这类平台通常提供标准的接口封装、智能限流与熔断机制,以及可视化的调用监控,帮助技术团队更高效地构建高可用的 AI 服务架构,降低同时维护多个厂商 API 的复杂度。
总结
| 产品 | 定位 | 推荐指数 |
|---|---|---|
| Gemini 3.5 Flash | 旗舰级智能体模型 | ⭐⭐⭐⭐⭐ |
| Gemini Omni | 全模态视频生成 | ⭐⭐⭐⭐⭐ |
| Gemini Spark | 个人 AI 管家 | ⭐⭐⭐⭐ |
| Antigravity 2.0 | 智能体开发平台 | ⭐⭐⭐⭐⭐ |
Gemini 3.5 系列整体表现亮眼,尤其是 Flash 版本在性能与速度上达到了新的平衡点,为开发者与企业提供了更多高性价比的选择。




