3月5日 AI 速报 · 第 83 期

2026-03-05 08:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-25 审核状态: 待编辑审核 AI速报速报官方补档

## 🔍 核心洞察 **Claude** 与 **Qwen 3.5** 在「胡言乱语检测」基准测试中表现突出，成为当前少数能主动拒绝无意义指令的模型；与此同时，**Gemini 3.1 Pro** 和 **Kling 3.0** 分别在**多源推理**与**电影级视频生成**能力上刷新 SOTA，凸显多模态AI正加速向高可靠性、强可控性演进。 ## 🚀 重点动态 - **Claude 与 Qwen 3.5 成功通过 BullshitBench v2 检测**：仅二者能有效识别并拒绝无意义指令，凸显**抗幻觉能力**显著优于多数推理模型。 - **Kling 3.0 全面上线 Omni 与 Motion Control**：支持精准运镜控制与物理级动作建模，已用于生成电影级动作短片。 - **Gemini 3.1 Pro 实现 CLI 多源跨文档推理**：支持对本地代码、PDF、文本等混合输入进行**SOTA 级逻辑推演与分析**。 - **Qwen Image 2 发布**：文本渲染精度与排版能力跃升，输出达**2K 写实级别**，推理速度提升超 40%。 - **Google Search AI Mode Canvas 全美开放**：面向英文用户全面启用，支持**多轮对话、写作辅助与实时编程交互**。 - **OpenAI 开源 Windows 原生智能体沙箱**：提供安全隔离环境，为**Windows 平台 AI 智能体**提供可审计、可复现的执行基座。 - **黄仁勋称 OpenClaw 为史上增长最快开源软件**：三周内下载量超越 Linux，成新一代**AI 基础设施级开源项目**。 - **Anthropic CEO 批评 OpenAI“安全剧场”实践**：内部备忘录直指其与政府合作中的**安全叙事与实际治理脱节**问题。

Claude 与 Qwen 3.5 在「胡言乱语检测」基准测试中表现突出，成为当前少数能主动拒绝无意义指令的模型；与此同时，Gemini 3.1 Pro 和 Kling 3.0 分别在多源推理与电影级视频生成能力上刷新 SOTA，凸显多模态AI正加速向高可靠性、强可控性演进。

🚀 重点动态

Claude 与 Qwen 3.5 成功通过 BullshitBench v2 检测：仅二者能有效识别并拒绝无意义指令，凸显抗幻觉能力显著优于多数推理模型。
Kling 3.0 全面上线 Omni 与 Motion Control：支持精准运镜控制与物理级动作建模，已用于生成电影级动作短片。
Gemini 3.1 Pro 实现 CLI 多源跨文档推理：支持对本地代码、PDF、文本等混合输入进行SOTA 级逻辑推演与分析。
Qwen Image 2 发布：文本渲染精度与排版能力跃升，输出达2K 写实级别，推理速度提升超 40%。
Google Search AI Mode Canvas 全美开放：面向英文用户全面启用，支持多轮对话、写作辅助与实时编程交互。
OpenAI 开源 Windows 原生智能体沙箱：提供安全隔离环境，为Windows 平台 AI 智能体提供可审计、可复现的执行基座。
黄仁勋称 OpenClaw 为史上增长最快开源软件：三周内下载量超越 Linux，成新一代AI 基础设施级开源项目。
Anthropic CEO 批评 OpenAI“安全剧场”实践：内部备忘录直指其与政府合作中的安全叙事与实际治理脱节问题。

← 返回更新速报