更新速报

官方发布的简报与分析文章

更新文章

2月22日 AI 速报 · 第 50 期

Gemini 3.1 Pro 展现出将前沿学术论文(如 Local-First CRDT)直接转化为可运行模拟程序的惊人能力;与此同时,OpenAI Batch API 首次支持GPT 图像模型,批量任务成本直降 50%,标志着多模态规模化...

2月22日 AI 速报 · 第 49 期

AI 基础设施正经历ASIC 硬件革命与推理成本断崖式下降双重冲击:Taalas HC1 芯片实现 17,000 token/s 推理速度,定价低至 $0.0075/百万 token;与此同时,英伟达转向战略级资本绑定,以 300 亿美元直...

2月21日 AI 速报 · 第 48 期

AI 硬件与软件栈正同步加速重构:Taalas 以每秒 17,000 token 的专用 ASIC 芯片挑战英伟达算力霸权,而英伟达则转向战略级资本绑定——300 亿美元直接入股 OpenAI;与此同时,Claude Code 全面升级智能...

2月21日 AI 速报 · 第 47 期

Gemini 3.1 Pro、Lyria 3 与 Claude Code 构成本周AI工程演进“三叉戟”:谷歌强化系统性工程推理与多模态创作能力,Anthropic 则以 1M Token 上下文、Code Security 研究预览版及全...

2月21日 AI 速报 · 第 46 期

Llama.cpp 正式接入 Hugging Face 生态,标志着轻量级推理与模型分发体系深度协同;GPT-5.2 Thinking 在世界知识推理任务中超越 Gemini 3 DeepThink,凸显「思考链深度」正成为新一代大模型关键...

2月20日 AI 速报 · 第 45 期

Gemini 3.1 Pro 正式发布,逻辑推理能力在 ARC-AGI-2 基准中跃升至 77.1%(前代仅 31%),多项指标超越竞品;与此同时,推理算力被 OpenAI 总裁 Greg Brockman 明确定义为当前软件生产力的核心瓶...

2月20日 AI 速报 · 第 44 期

Gemini 3.1 Pro 正式登顶多维基准测试,逻辑推理能力翻倍提升(ARC-AGI-2 达 77.1%),推动 Google 重回 AI 模型第一梯队;与此同时,OpenAI、Perplexity、Replit 和 Anthropic...

2月20日 AI 速报 · 第 43 期

日语AI落地迎来关键突破:NTT DATA 借助 NVIDIA Nemotron-Personas-Japan 合成数据集,将模型准确率从15.3%跃升至79.3%;与此同时,Anthropic 收紧生态权限,OAuth 接入全面禁用,凸显...

2月19日 AI 速报 · 第 42 期

AI 正加速跨越工具层迈向决策层:Claude Opus 4.6以100万上下文窗口与动态计算重塑能力边界;Ling-2.5-1T、Qwen3.5-397B-A17B等国产大模型在开源赛道强势跻身全球前列;而分发能力与Agent 安全架构,...

2月18日 AI 速报 · 第 41 期

Qwen 3.5 系列(含 397B-A17B 与 Plus 版本)正引发全栈生态爆发式适配——从 NVIDIA NeMo、AMD Instinct GPU 到 Ollama Cloud、ZenMux 和 mlx-vlm,主流硬件平台与开发...

2月18日 AI 速报 · 第 40 期

Qwen 3.5 系列正引发全栈生态爆发——从 NVIDIA、AMD 到 Ollama Cloud、ZenMux 和 mlx-vlm,主流硬件厂商与开发平台均实现首日支持;与此同时,LlamaIndex加速向 AI Agent 基建层演进,...

2月17日 AI 速报 · 第 39 期

Qwen 3.5 系列强势引爆开源大模型生态,397B 参数、原生多模态与MoE + Linear Attention 架构获 NVIDIA、AMD、Ollama、ZenMux、LMSYS 及 mlx-vlm 全栈首日支持;与此同时,Lla...

2月17日 AI 速报 · 第 38 期

AI 正加速从能力增强迈向角色替代:LLM 代码翻译、视觉化 UI 编辑与记忆驱动型智能体成为新生产力基座;Qwen3.5-397B等开源大模型持续强化 B2B 实战能力,而傅盛团队和Google Antigravity则同步验证了 AI ...

2月17日 AI 速报 · 第 37 期

阿里巴巴正式开源 Qwen3.5-397B-A17B——全球首个原生多模态、稀疏 MoE 架构的开源大模型,支持 1M 超长上下文与消费级硬件 4-bit 本地推理;与此同时,Manus Agents在 Telegram 上落地长期记忆与工...

2月16日 AI 速报 · 第 36 期

OpenAI 正以战略级动作加速布局个人智能体生态,高调招揽 OpenClaw 创始人 Peter Steinberger;与此同时,MiniMax 凭借极致推理性价比技术路径实现估值跃升,而 Claude Code 已支撑起年化 25 亿...

2月16日 AI 速报 · 第 35 期

OpenAI 正以空前力度押注个人智能体赛道,通过高调招揽OpenClaw 创始人 Peter Steinberger、加速推进OpenClaw 开源化,并明确将智能体定位为下一代核心产品;与此同时,Claude Code 已实现高达 25...

2月16日 AI 速报 · 第 34 期

AI 正加速从“信息处理工具”跃迁为“认知延伸系统”:Gemini 3 Deep Think 直出可打印 STL 文件、AdaReasoner 以 7B 小模型超越 GPT-5 的视觉推理能力、Cloudflare 边缘 Markdown ...

2月15日 AI 速报 · 第 33 期

AI 行业正加速从模型性能竞赛转向系统级能力构建:蚂蚁集团开源三大全模态/思考/扩散模型,字节 Seed 2.0 展现 Agent Team 协作实力,而Klarna与LangGraph的落地实践则印证了智能体工程已进入规模化应用阶段;与此...

2月15日 AI 速报 · 第 32 期

GPT-5.3-Codex 正式落地 Droid 平台并展现突出的 UI 设计能力,获 OpenAI 联合创始人格雷格·布罗克曼公开点赞;与此同时,LangGraph 与 Claude MCP 连接器 双线推进智能体工程化落地,Klarna...

2月14日 AI 速报 · 第 31 期

GPT-5.2 在理论物理与量子场论领域实现历史性突破,首次独立推导并证明胶子相互作用新公式,获物理学家 Andy Strominger 认证为“人类可能无法解决”的难题;与此同时,Gemini 3 Deep Think、WebMCP 协议...

2月14日 AI 速报 · 第 30 期

万亿参数混合线性架构(Ring-2.5-1T)与自修改 AI Agent(OpenClaw)成为本周技术演进双焦点;Qwen3 Agent、Claude 4.6 和 Kimi K2.5 推动多模态智能体实用化加速,而 OpenAI 对 De...

2月13日 AI 速报 · 第 29 期

Anthropic 完成 300 亿美元融资、估值飙升至 3800 亿美元,其 Claude Code 周活用户翻倍成关键驱动力;与此同时,Gemini 3 Deep Think、GPT-5.3-Codex-Spark 与 DM0(2.4B...

2月13日 AI 速报 · 第 28 期

Anthropic 凭借 Claude Code 的爆发式增长完成 300 亿美元融资,投后估值达 3800 亿美元;与此同时,OpenAI 推出超低延迟的 GPT-5.3-Codex-Spark(推理速度超 1000 tokens/sec...

2月13日 AI 速报 · 第 27 期

GLM-5(7440 亿参数)、Xiaomi-Robotics-0(80ms 极低延迟 VLA 模型)与华为 MindScale(KV Cache 减少 5.7 倍)三大技术突破同步引爆,标志着中国 AI 正从模型规模竞赛迈向Agentic...

2月12日 AI 速报 · 第 26 期

GLM-5 正式登顶 LMArena 开源模型榜首,性能直逼 Claude Opus 4.5;OpenAI Codex 已在 NVIDIA 全公司规模落地,覆盖 3 万名工程师,标志 AI 编程从实验走向核心生产基础设施。...

2月12日 AI 速报 · 第 25 期

GLM-5(744B 参数、28.5T 训练 Token)正式发布,性能对标 Claude Opus 4.5 且成本显著降低;与此同时,Devin Review 日运行量突破 4 万次,并强化团队协作能力;语义化定时任务与Skills 驱动...

2月12日 AI 速报 · 第 24 期

长上下文能力与Agent 原生架构正成为技术竞争新高地:Deepseek 实现 100 万 token 上下文,面壁智能以 SALA 混合注意力在消费级显卡跑通 9B 百万级推理;同时,MiniMax、NemoVideo 和 Entire ...

2月11日 AI 速报 · 第 23 期

GPT-5.2、Claude Opus 4.6 与 Seedance 2.0 集体亮相,标志多模态大模型能力迈入临界跃迁期;Anthropic 提交 ASL-4 级破坏风险报告,首次将商用模型安全评估推向监管前沿;而 Entire、Agme...

2月11日 AI 速报 · 第 22 期

Windows 生态迎来AI 编程工具规模化落地,Claude Cowork、Cowork AI 双平台同步上线;Autofix 功能标志着 AI 软件智能体正式迈入全自动 PR 修复与 CI 闭环阶段;与此同时,MCP(Model Con...

2月11日 AI 速报 · 第 21 期

Qwen-Image-2.0 以2K分辨率、1K token长指令支持和突破性的中文文本渲染能力重塑多模态生成基准;ElevenLabs 全面升级 Expressive Mode,覆盖70+语言并深度赋能ElevenAgents;达摩院 R...

2月10日 AI 速报 · 第 20 期

扩散语言模型(DLLM)Agent与具身大脑基模 RynnBrain双线突破,华为与阿里分别在全局规划能力和物理空间长程推理上实现范式跃迁;与此同时,Video-RAG、撤销机制与桌面级AI办公套件正加速推动AI从实验走向规模化落地。...

2月10日 AI 速报 · 第 19 期

Codex 应用首周下载破 100 万,OpenAI GPT-5.3-Codex 已在 Cursor、GitHub 与 VS Code 全面上线;与此同时,Claude Opus 4.6 登顶 LMArena 代码与文本双榜,而 Perpl...

2月10日 AI 速报 · 第 18 期

Seedance 2.0 的爆发式真实感正引发全行业对AI 生成内容伦理边界与数据合规框架的紧急重构;与此同时,RaBiT 二值化训练、InfLLM-V2 稀疏注意力和LongCat-Flash-Lite MoE 架构三大技术突破,正同步推...

2月9日 AI 速报 · 第 17 期

本周AI前沿聚焦工程化降本增效与长程智能跃迁:宝玉提出封面风格的正交分解方法实现万级变体低成本生成;Nvidia发布通用机器人世界模型 DreamDojo;InftyThink+ 和多语言推理新范式共同突破无限长程推理瓶颈;Context-...

2月9日 AI 速报 · 第 16 期

多模态生成、LLM 测试标准化与语音智能体商业化成为本周技术演进与资本动向的三大锚点;ElevenLabs以110 亿美元估值完成5 亿美元融资,凸显语音AI基础设施正加速进入规模化落地阶段。...

2月9日 AI 速报 · 第 15 期

上下文管理能力、Claude Skills 架构与视觉语言模型精准感知成为本周技术演进三大焦点;美团开源轻量化 68.5B MoE 模型 LongCat-Flash-Lite,微软×清华联合提出 BiPS 框架攻克 VLM「看图胡说」顽疾。...

2月8日 AI 速报 · 第 14 期

AI 辅助编程正从“写代码”迈向“治代码”——微软×清华 BiPS 框架攻克视觉语言模型“看错图”顽疾,OpenAI GPT-5.3 Codex与Anthropic Claude Opus 4.6密集迭代提速,而中国首批不发论文的实践型工科...

2月8日 AI 速报 · 第 13 期

Claude Opus 4.6 快速模式以 2.5 倍速度提升成为本周最显著的工程突破,已通过 Anthropic API、Claude Code、Cursor、Windsurf 及 GitHub Copilot 多平台落地;与此同时,个人...

2月8日 AI 速报 · 第 12 期

AI 创新正加速向具身智能与系统级效率优化双轨演进:清华团队开源的Motus世界模型性能超越硅谷标杆40%,小米MiMo 团队以HySparse 架构实现 KV Cache 减负80%,而数据格式选择不当竟致 LLM Token 成本激增7...

2月7日 AI 速报 · 第 11 期

AI 正加速从能力展示迈向高价值落地:TrafficVLM驱动的“鹰眼守护”系统已投入春运实战,Genie 3支撑Waymo攻克长尾驾驶场景,而Kimi K2.5 Instant与可灵Kling 3.0则标志着国产大模型在多模态性能与视频生...

2月7日 AI 速报 · 第 10 期

AI 编程正加速迈向自然语言编译范式,Claude Opus 4.6 登顶 LM Arena 全维度榜首,而Genie 3与Gemini深度赋能 Waymo 构建生成式自动驾驶仿真世界——模型能力、智能体基础设施与垂直沙箱技术三线并进,重构...

2月7日 AI 速报 · 第 9 期

Anthropic 在 Claude Opus 4.6 中首次系统揭示“答案抖动”这一关键对齐风险,同时其智能体集群已能自主构建10万行Rust实现的C编译器;清华刘知远团队用严格实验证明,强化学习可真正教会大模型组合式新能力,而非简单记忆...

2月6日 AI 速报 · 第 8 期

Claude Opus 4.6 与 GPT-5.3-Codex 同日发布,标志着大模型竞争正式迈入「智能体原生时代」;人形机器人定制成本骤降90%至20万美元,叠加Robocafe、团子(Nextie) 等开源/商用多智能体系统落地,AI ...

2月6日 AI 速报 · 第 7 期

GPT-5.3-codex 与 Claude Opus 4.6 正在编程智能领域展开高强度技术对垒,前者依托 NVIDIA Blackwell 架构实现SOTA跑分与自动化部署,后者则驱动智能体团队两周内构建出可编译Linux内核的C编译器...

2月6日 AI 速报 · 第 6 期

OpenAI Frontier 正式落地,首批获准企业包括 Oracle、Uber、HP;与此同时,Agentic Engineering 已成行业新范式,从 Claude Code /insights 到 SOUL.md 智能体人格化定义...

2月5日 AI 速报 · 第 5 期

GPT-5.2 在长程任务中达成业界领先(SOTA)性能;Gemini 月活飙升至7.5 亿,Token 吞吐量达每分钟 100 亿;Codex 活跃用户突破100 万,并深度集成至 GitHub Agent HQ——AI 基础模型能力、工...

2月5日 AI 速报 · 第 4 期

Gemini 月活用户突破 7.5 亿,API 每分钟处理 100 亿 Token;OpenAI Codex 正式集成 GitHub Agent HQ 并达成 50 万次下载;行业范式加速转向 Agentic Engineering 与商业实用性优先的评估新标准...

2月5日 AI 速报 · 第 3 期

Qwen3-Coder-Next 以 3B 激活参数 MoE 架构实现十倍级大模型编程能力,成本仅为闭源方案的 1/11;ElevenLabs 获红杉领投 5 亿美元融资,估值达 110 亿美元...

2月4日 AI 速报 · 第 2 期

Clawdbot 正以颠覆性 AI Agent 架构和可扩展硬件形态,成为2026年首个现象级产品,其技术路径正加速重构企业级智能体部署范式与组织协作逻辑...

2月4日 AI 速报 · 第 1 期

AI 工程范式正加速转向轻量化、文件优先、上下文原生——MiniCPM-o 4.5 成为首款开源全双工多模态模型,Claude Code 原生集成 Xcode 实现代理式编程,而 Jerry Liu 等专家力推「文件即接口」,挑战传统 RA...