3月5日 AI 速报 · 第 83 期
## 🔍 核心洞察
**Claude** 与 **Qwen 3.5** 在「胡言乱语检测」基准测试中表现突出,成为当前少数能主动拒绝无意义指令的模型;与此同时,**Gemini 3.1 Pro** 和 **Kling 3.0** 分别在**多源推理**与**电影级视频生成**能力上刷新 SOTA,凸显多模态AI正加速向高可靠性、强可控性演进。
## 🚀 重点动态
- **Claude 与 Qwen 3.5 成功通过 BullshitBench v2 检测**:仅二者能有效识别并拒绝无意义指令,凸显**抗幻觉能力**显著优于多数推理模型。
- **Kling 3.0 全面上线 Omni 与 Motion Control**:支持精准运镜控制与物理级动作建模,已用于生成电影级动作短片。
- **Gemini 3.1 Pro 实现 CLI 多源跨文档推理**:支持对本地代码、PDF、文本等混合输入进行**SOTA 级逻辑推演与分析**。
- **Qwen Image 2 发布**:文本渲染精度与排版能力跃升,输出达**2K 写实级别**,推理速度提升超 40%。
- **Google Search AI Mode Canvas 全美开放**:面向英文用户全面启用,支持**多轮对话、写作辅助与实时编程交互**。
- **OpenAI 开源 Windows 原生智能体沙箱**:提供安全隔离环境,为**Windows 平台 AI 智能体**提供可审计、可复现的执行基座。
- **黄仁勋称 OpenClaw 为史上增长最快开源软件**:三周内下载量超越 Linux,成新一代**AI 基础设施级开源项目**。
- **Anthropic CEO 批评 OpenAI“安全剧场”实践**:内部备忘录直指其与政府合作中的**安全叙事与实际治理脱节**问题。