2月20日 AI 速报 · 第 45 期
## 🔍 核心洞察
**Gemini 3.1 Pro** 正式发布,逻辑推理能力在 ARC-AGI-2 基准中**跃升至 77.1%**(前代仅 31%),多项指标**超越竞品**;与此同时,**推理算力**被 OpenAI 总裁 Greg Brockman 明确定义为当前**软件生产力的核心瓶颈与关键驱动因素**。
## 🚀 重点动态
- **Gemini 3.1 Pro 正式发布**:谷歌宣布该模型在逻辑推理、视觉编程与长上下文处理上实现跨越式提升,**定价不变**,已接入 Perplexity Pro 及企业服务。
- **ChatGPT 推出交互式代码块**:全面支持 Mermaid、Vega、HTML、React 等格式,用户可**直接编辑、运行并预览图表与微型应用**。
- **Claude Code 负责人称编程问题“基本解决”**:Boris Cherny 表示自去年11月起**100% 代码由 AI 生成**,印证“为六个月后的模型而构建”的前瞻性策略。
- **Google Research 发布统一隐变量(UL)框架**:聚焦**隐层表示优化训练**,旨在提升多模态与长序列任务中的表征效率与泛化能力。
- **Mobile-Agent-v3.5 开源**:首个真正跨平台(iOS/Android/Web)的**GUI 智能体系统**,支持细粒度界面操作与多步任务编排。
- **Coding Agent 范式转向 AI 友好工程**:行业共识正从复杂框架编排,转向**轻量级直连架构**(如 pi-mono)与面向 AI 的代码库设计。
- **Perplexity Finance 新增 SEC 文件审计功能**:支持对金融数据点**一键溯源至 SEC 备案原文具体页码**,强化可信计算基础设施。
- **“Vibecoding”概念落地**:Replit 发布 AI 驱动的**视频动画创作工具 Replit Animation**,拓展 AI 编程从代码到多模态内容生产的边界。