2月26日 AI 速报 · 第 63 期
## 🔍 核心洞察
AI 正加速从「模型能力竞赛」转向「智能体工程落地」,**Perplexity Computer**、**Claude 的 UI 自动化能力**与**Cursor 专用计算环境**标志着 AI 从对话工具升级为可执行、可审计、可协作的数字同事;与此同时,**扩散式推理模型 Mercury 2** 和**斯坦福 Theory of Space 基准**正重构我们对“深度思考”与“空间智能”的技术定义。
## 🚀 重点动态
- **Perplexity 推出 Computer 功能**:面向 Max 用户开放,支持实时竞对分析、自动化工作流等 10 大业务场景,强调**零本地文件访问**的安全架构。
- **Anthropic 收购 Vercept**:整合其 VyUI 模型,显著增强 **Claude 的 UI 理解与跨应用计算机操作能力**,直指“AI 操作系统”级进化。
- **Cursor 编程 Agent 升级为专用计算环境**:Agent 可自主运行、调试、测试代码,并通过 `/repro` 实现**Bug 复现→修复→视频验证**全闭环。
- **Qwen3.5 首日即支持 MLX-VLM**:在 Apple Silicon 设备上实现高效视觉语言推理,凸显国产大模型对**端侧部署生态**的快速响应能力。
- **Mercury 2 发布:全球首个扩散式深度思考大模型**:抛弃自回归范式,实现**每秒超 1000 tokens 并行编辑**,推理速度跃升一个量级。
- **谷歌 Gemini 上线手机 App 操控功能**:首批打通外卖、打车等高频场景,标志**多模态 Agent 进入真实生活自动化阶段**。
- **斯坦福 SAIL 推出 Theory of Space 基准**:首次系统评估大模型构建**空间心理地图**与主动探索能力,填补具身智能关键评测空白。
- **傅盛演示 AI 助理“三万”长记忆能力**:可关联**5 天前上下文**并主动预警突发状况,展现面向个人生产力的**主动服务范式突破**。