3月14日 AI 速报 · 第 112 期
## 🔍 核心洞察
**CursorBench** 正式挑战 SWE-Bench 地位,揭示顶级模型在真实场景智能体任务中的显著效率差异;**Anthropic** 全面开放 **100 万 token 上下文**并推出 Claude Code「全效模式」,而 **OpenClaw** 生态加速爆发——从 **Chrome MCP 实时浏览器控制**到 **并行工具调用**、**Teams 深度集成**,AI Agent 的工程化落地已进入「可编程交互+可规模化商用」新阶段。
## 🚀 重点动态
- **Cursor 发布 CursorBench 编程评测基准**:首个聚焦真实场景与线上线下混合评估的 AI Coding Agent 基准,直击复杂智能体任务效率瓶颈
- **Anthropic 开放 100 万上下文窗口**:Opus 4.6 与 Sonnet 4.6 全面支持,且长短上下文统一费率,大幅降低长文档推理成本
- **OpenClaw Beta 集成 Chrome MCP 浏览器控制**:实现 AI Agent 对真实浏览器会话的实时、细粒度操作,为自动化营销等场景铺平道路
- **OpenClaw 即将支持并行工具调用**:提升多步骤任务执行效率,补齐智能体高并发工作流关键能力
- **微软正深度协作 OpenClaw 团队**:推进 Microsoft Teams 原生集成,强化企业级 AI Agent 协作入口
- **FluxA 推出 Agent Wallet(龙虾版支付宝)**:首个面向 AI Agent 的可编程支付协议,打通智能体自主消费“最后一公里”
- **LessWrong 上线 Lexical + AI 智能体编辑器**:强制 LLM 内容视觉归因,树立 AI 原生内容平台治理新范式
- **Claude Code 推出 `/effort max` 全效模式**:支持深度链式推理与超长 token 消耗,专为复杂代码生成与重构任务优化