2月20日 AI 速报 · 第 45 期

2026-02-20 16:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-06-25 审核状态: 待编辑审核 AI速报速报官方

Gemini 3.1 Pro 正式发布，逻辑推理能力在 ARC-AGI-2 基准中跃升至 77.1%（前代仅 31%），多项指标超越竞品；与此同时，推理算力被 OpenAI 总裁 Greg Brockman 明确定义为当前软件生产力的核心瓶...

## 🔍 核心洞察 **Gemini 3.1 Pro** 正式发布，逻辑推理能力在 ARC-AGI-2 基准中**跃升至 77.1%**（前代仅 31%），多项指标**超越竞品**；与此同时，**推理算力**被 OpenAI 总裁 Greg Brockman 明确定义为当前**软件生产力的核心瓶颈与关键驱动因素**。 ## 🚀 重点动态 - **Gemini 3.1 Pro 正式发布**：谷歌宣布该模型在逻辑推理、视觉编程与长上下文处理上实现跨越式提升，**定价不变**，已接入 Perplexity Pro 及企业服务。 - **ChatGPT 推出交互式代码块**：全面支持 Mermaid、Vega、HTML、React 等格式，用户可**直接编辑、运行并预览图表与微型应用**。 - **Claude Code 负责人称编程问题“基本解决”**：Boris Cherny 表示自去年11月起**100% 代码由 AI 生成**，印证“为六个月后的模型而构建”的前瞻性策略。 - **Google Research 发布统一隐变量（UL）框架**：聚焦**隐层表示优化训练**，旨在提升多模态与长序列任务中的表征效率与泛化能力。 - **Mobile-Agent-v3.5 开源**：首个真正跨平台（iOS/Android/Web）的**GUI 智能体系统**，支持细粒度界面操作与多步任务编排。 - **Coding Agent 范式转向 AI 友好工程**：行业共识正从复杂框架编排，转向**轻量级直连架构**（如 pi-mono）与面向 AI 的代码库设计。 - **Perplexity Finance 新增 SEC 文件审计功能**：支持对金融数据点**一键溯源至 SEC 备案原文具体页码**，强化可信计算基础设施。 - **“Vibecoding”概念落地**：Replit 发布 AI 驱动的**视频动画创作工具 Replit Animation**，拓展 AI 编程从代码到多模态内容生产的边界。

Gemini 3.1 Pro 正式发布，逻辑推理能力在 ARC-AGI-2 基准中跃升至 77.1%（前代仅 31%），多项指标超越竞品；与此同时，推理算力被 OpenAI 总裁 Greg Brockman 明确定义为当前软件生产力的核心瓶颈与关键驱动因素。

🚀 重点动态

Gemini 3.1 Pro 正式发布：谷歌宣布该模型在逻辑推理、视觉编程与长上下文处理上实现跨越式提升，定价不变，已接入 Perplexity Pro 及企业服务。
ChatGPT 推出交互式代码块：全面支持 Mermaid、Vega、HTML、React 等格式，用户可直接编辑、运行并预览图表与微型应用。
Claude Code 负责人称编程问题“基本解决”：Boris Cherny 表示自去年11月起100% 代码由 AI 生成，印证“为六个月后的模型而构建”的前瞻性策略。
Google Research 发布统一隐变量（UL）框架：聚焦隐层表示优化训练，旨在提升多模态与长序列任务中的表征效率与泛化能力。
Mobile-Agent-v3.5 开源：首个真正跨平台（iOS/Android/Web）的GUI 智能体系统，支持细粒度界面操作与多步任务编排。
Coding Agent 范式转向 AI 友好工程：行业共识正从复杂框架编排，转向轻量级直连架构（如 pi-mono）与面向 AI 的代码库设计。
Perplexity Finance 新增 SEC 文件审计功能：支持对金融数据点一键溯源至 SEC 备案原文具体页码，强化可信计算基础设施。
“Vibecoding”概念落地：Replit 发布 AI 驱动的视频动画创作工具 Replit Animation，拓展 AI 编程从代码到多模态内容生产的边界。

← 返回更新速报