2月26日 AI 速报 · 第 63 期

2026-02-26 16:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-25 审核状态: 待编辑审核 AI速报速报官方

AI 正加速从「模型能力竞赛」转向「智能体工程落地」，Perplexity Computer、Claude 的 UI 自动化能力与Cursor 专用计算环境标志着 AI 从对话工具升级为可执行、可审计、可协作的数字同事；与此同时，扩散式推理...

## 🔍 核心洞察 AI 正加速从「模型能力竞赛」转向「智能体工程落地」，**Perplexity Computer**、**Claude 的 UI 自动化能力**与**Cursor 专用计算环境**标志着 AI 从对话工具升级为可执行、可审计、可协作的数字同事；与此同时，**扩散式推理模型 Mercury 2** 和**斯坦福 Theory of Space 基准**正重构我们对“深度思考”与“空间智能”的技术定义。 ## 🚀 重点动态 - **Perplexity 推出 Computer 功能**：面向 Max 用户开放，支持实时竞对分析、自动化工作流等 10 大业务场景，强调**零本地文件访问**的安全架构。 - **Anthropic 收购 Vercept**：整合其 VyUI 模型，显著增强 **Claude 的 UI 理解与跨应用计算机操作能力**，直指“AI 操作系统”级进化。 - **Cursor 编程 Agent 升级为专用计算环境**：Agent 可自主运行、调试、测试代码，并通过 `/repro` 实现**Bug 复现→修复→视频验证**全闭环。 - **Qwen3.5 首日即支持 MLX-VLM**：在 Apple Silicon 设备上实现高效视觉语言推理，凸显国产大模型对**端侧部署生态**的快速响应能力。 - **Mercury 2 发布：全球首个扩散式深度思考大模型**：抛弃自回归范式，实现**每秒超 1000 tokens 并行编辑**，推理速度跃升一个量级。 - **谷歌 Gemini 上线手机 App 操控功能**：首批打通外卖、打车等高频场景，标志**多模态 Agent 进入真实生活自动化阶段**。 - **斯坦福 SAIL 推出 Theory of Space 基准**：首次系统评估大模型构建**空间心理地图**与主动探索能力，填补具身智能关键评测空白。 - **傅盛演示 AI 助理“三万”长记忆能力**：可关联**5 天前上下文**并主动预警突发状况，展现面向个人生产力的**主动服务范式突破**。

AI 正加速从「模型能力竞赛」转向「智能体工程落地」，Perplexity Computer、Claude 的 UI 自动化能力与Cursor 专用计算环境标志着 AI 从对话工具升级为可执行、可审计、可协作的数字同事；与此同时，扩散式推理模型 Mercury 2 和斯坦福 Theory of Space 基准正重构我们对“深度思考”与“空间智能”的技术定义。

🚀 重点动态

Perplexity 推出 Computer 功能：面向 Max 用户开放，支持实时竞对分析、自动化工作流等 10 大业务场景，强调零本地文件访问的安全架构。
Anthropic 收购 Vercept：整合其 VyUI 模型，显著增强 Claude 的 UI 理解与跨应用计算机操作能力，直指“AI 操作系统”级进化。
Cursor 编程 Agent 升级为专用计算环境：Agent 可自主运行、调试、测试代码，并通过 /repro 实现Bug 复现→修复→视频验证全闭环。
Qwen3.5 首日即支持 MLX-VLM：在 Apple Silicon 设备上实现高效视觉语言推理，凸显国产大模型对端侧部署生态的快速响应能力。
Mercury 2 发布：全球首个扩散式深度思考大模型：抛弃自回归范式，实现每秒超 1000 tokens 并行编辑，推理速度跃升一个量级。
谷歌 Gemini 上线手机 App 操控功能：首批打通外卖、打车等高频场景，标志多模态 Agent 进入真实生活自动化阶段。
斯坦福 SAIL 推出 Theory of Space 基准：首次系统评估大模型构建空间心理地图与主动探索能力，填补具身智能关键评测空白。
傅盛演示 AI 助理“三万”长记忆能力：可关联5 天前上下文并主动预警突发状况，展现面向个人生产力的主动服务范式突破。

← 返回更新速报