2月20日 AI 速报 · 第 45 期
Gemini 3.1 Pro 正式发布,逻辑推理能力在 ARC-AGI-2 基准中跃升至 77.1%(前代仅 31%),多项指标超越竞品;与此同时,推理算力被 OpenAI 总裁 Greg Brockman 明确定义为当前软件生产力的核心瓶...
## 🔍 核心洞察
**Gemini 3.1 Pro** 正式发布,逻辑推理能力在 ARC-AGI-2 基准中**跃升至 77.1%**(前代仅 31%),多项指标**超越竞品**;与此同时,**推理算力**被 OpenAI 总裁 Greg Brockman 明确定义为当前**软件生产力的核心瓶颈与关键驱动因素**。
## 🚀 重点动态
- **Gemini 3.1 Pro 正式发布**:谷歌宣布该模型在逻辑推理、视觉编程与长上下文处理上实现跨越式提升,**定价不变**,已接入 Perplexity Pro 及企业服务。
- **ChatGPT 推出交互式代码块**:全面支持 Mermaid、Vega、HTML、React 等格式,用户可**直接编辑、运行并预览图表与微型应用**。
- **Claude Code 负责人称编程问题“基本解决”**:Boris Cherny 表示自去年11月起**100% 代码由 AI 生成**,印证“为六个月后的模型而构建”的前瞻性策略。
- **Google Research 发布统一隐变量(UL)框架**:聚焦**隐层表示优化训练**,旨在提升多模态与长序列任务中的表征效率与泛化能力。
- **Mobile-Agent-v3.5 开源**:首个真正跨平台(iOS/Android/Web)的**GUI 智能体系统**,支持细粒度界面操作与多步任务编排。
- **Coding Agent 范式转向 AI 友好工程**:行业共识正从复杂框架编排,转向**轻量级直连架构**(如 pi-mono)与面向 AI 的代码库设计。
- **Perplexity Finance 新增 SEC 文件审计功能**:支持对金融数据点**一键溯源至 SEC 备案原文具体页码**,强化可信计算基础设施。
- **“Vibecoding”概念落地**:Replit 发布 AI 驱动的**视频动画创作工具 Replit Animation**,拓展 AI 编程从代码到多模态内容生产的边界。
Gemini 3.1 Pro 正式发布,逻辑推理能力在 ARC-AGI-2 基准中跃升至 77.1%(前代仅 31%),多项指标超越竞品;与此同时,推理算力被 OpenAI 总裁 Greg Brockman 明确定义为当前软件生产力的核心瓶颈与关键驱动因素。
🚀 重点动态
- Gemini 3.1 Pro 正式发布:谷歌宣布该模型在逻辑推理、视觉编程与长上下文处理上实现跨越式提升,定价不变,已接入 Perplexity Pro 及企业服务。
- ChatGPT 推出交互式代码块:全面支持 Mermaid、Vega、HTML、React 等格式,用户可直接编辑、运行并预览图表与微型应用。
- Claude Code 负责人称编程问题“基本解决”:Boris Cherny 表示自去年11月起100% 代码由 AI 生成,印证“为六个月后的模型而构建”的前瞻性策略。
- Google Research 发布统一隐变量(UL)框架:聚焦隐层表示优化训练,旨在提升多模态与长序列任务中的表征效率与泛化能力。
- Mobile-Agent-v3.5 开源:首个真正跨平台(iOS/Android/Web)的GUI 智能体系统,支持细粒度界面操作与多步任务编排。
- Coding Agent 范式转向 AI 友好工程:行业共识正从复杂框架编排,转向轻量级直连架构(如 pi-mono)与面向 AI 的代码库设计。
- Perplexity Finance 新增 SEC 文件审计功能:支持对金融数据点一键溯源至 SEC 备案原文具体页码,强化可信计算基础设施。
- “Vibecoding”概念落地:Replit 发布 AI 驱动的视频动画创作工具 Replit Animation,拓展 AI 编程从代码到多模态内容生产的边界。