更新速报

官方发布的简报与分析文章

更新文章

3月6日 AI 速报 · 第 86 期

GPT-5.4 正式发布,以100 万 token 上下文和原生计算机使用能力重塑知识工作范式;与此同时,DRAM 短缺推动 Apple 调整 Mac Studio 高端配置,凸显 AI 硬件需求对供应链的实质性冲击。

3月6日 AI 速报 · 第 85 期

本周AI领域迎来多线突破:Anthropic发布新一代推理模型Sonnet 4.6,聚焦深度思考Token优化;Meta与AMD达成巨额AI芯片采购协议,强化大模型训练基础设施;Qwen团队核心成员变动引发开源大模型生态关注;苹果则以低价MacBook Neo切入AI终端普惠赛道。

3月5日 AI 速报 · 第 84 期

GPT-5.3 Instant 和 Claude Code Auto Mode 双双落地,标志着大模型交互范式正从“能力优先”转向“体验优先”;与此同时,Google Workspace CLI 的密集发布与开源生态(如 Paperclip、AIRI)的爆发,共同指向一个新共识:AI Agent 的工业化部署已进入基础设施就绪阶段。

3月5日 AI 速报 · 第 83 期

Claude 与 Qwen 3.5 在「胡言乱语检测」基准测试中表现突出,成为当前少数能主动拒绝无意义指令的模型;与此同时,Gemini 3.1 Pro 和 Kling 3.0 分别在多源推理与电影级视频生成能力上刷新 SOTA,凸显多模态AI正加速向高可靠性、强可控性演进。

3月5日 AI 速报 · 第 82 期

Google 正式发布 Gemini 3.1 Flash(代号“Nano Banana 2”)图像生成模型,以毫秒级响应速度、高精度文字渲染能力和跨长宽比角色一致性刷新轻量级多模态推理边界;与此同时,Dify 团队落地首个生产级财务AI工作流,实现费用对账从分钟级到秒级的跃迁。

3月4日 AI 速报 · 第 81 期

Human Input Node、OpenClaw Agent 与 端侧20亿参数大模型 成为本周技术落地关键突破;Anthropic 凭借 Claude 系列确立市场主导地位,而 OpenAI 在军事合作、代码平台自建及 GPT-5.3-...

3月4日 AI 速报 · 第 80 期

GPT-5.4(200 万上下文窗口)、Claude Opus 4.6(文档推理榜首)与 SleepFM(症状前6年预测130+疾病)共同勾勒出AI能力边界的三重跃迁;与此同时,OpenAI、Anthropic 与 Qwen 三大阵营正经历...

3月4日 AI 速报 · 第 79 期

AI 智能体正加速从“辅助工具”跃迁为自主执行单元:Math Inc. 的 Gauss Agent 一周内完成菲尔兹奖级数学定理形式化,威斯康星大学实现 Transformer 充当物理 CPU(99.5% 准确率),而 OpenClaw ...

3月3日 AI 速报 · 第 78 期

Qwen 3.5 系列小模型(0.8B–9B)密集落地,支持 MLX/Ollama/LM Studio 多平台部署,实现在 iPhone 17、路由器等边缘设备端侧运行;与此同时,Claude Code 推出免费语音模式,OpenClaw ...

3月3日 AI 速报 · 第 77 期

AGI 毁灭论警告正意外加速不可靠AI商业化进程,Gary Marcus 指出其已助推Anthropic、Spotify、Shopify等公司大规模部署未成熟系统,并导致美国财政部紧急叫停Claude使用;与此同时,Claude Code与...

3月3日 AI 速报 · 第 76 期

Claude Code 的 Computer PTC 功能正式落地,显著优化智能体执行效率;Qwen 3.5 小模型系列(0.8B–9B)实现边缘端高性能突破;FireRed-OCR 以2B参数登顶文档解析榜单;Nano Banana 2 ...

3月2日 AI 速报 · 第 75 期

AI 正加速从工具层迈向工程范式重构:Agentic Engineering 逐步取代“Vibe Coding”,CLI 在 AI Agent 架构中力压专用协议 MCP,而 SWE-1.6、GPT-5.3-Codex 等新一代编程模型密集...

3月2日 AI 速报 · 第 74 期

SWE-1.6 成为本周最强技术信号:Cognition Labs 与 Windsurf 先后发布该模型早期预览版,其在 SWE-Bench Pro 基准上全面超越 SWE-1.5 及当前顶尖开源模型;与此同时,Clay 实现对每月 3 亿...

3月2日 AI 速报 · 第 73 期

AI Agent 正从单点工具迈向多智能体协同范式,傅盛“龙虾”、Anthropic 设计体系与Claude Code 新技能架构共同印证:自主进化能力、人机角色重构与会话上下文压缩技术已成为下一代智能体落地的关键分水岭。...

3月1日 AI 速报 · 第 72 期

Claude Prompt Caching 技术正成为性能优化关键路径,而 AI Agent 自愈部署 与 跨职能可靠性治理 正共同定义下一代智能基础设施的工程范式;与此同时,Perplexity 的“一步到位”生成能力 和 Ollama ...

3月1日 AI 速报 · 第 71 期

OpenAI 与美国战争部达成历史性涉密AI部署协议,同步推出业界首个面向国家安全的多层安全栈;与此同时,Perplexity Computer、Claude Agent SDK 和 Google Nano Banana 2 共同指向一个关...

3月1日 AI 速报 · 第 70 期

美国AI监管格局正经历剧烈重构:OpenAI 与美国国防部达成涉密网络AI部署协议,确立禁止自主武力与反大规模监控等安全红线;而Anthropic 却被特朗普政府单方面列为“供应链风险”并遭联邦禁用令,凸显政策执行中的显著双重标准。...

2月28日 AI 速报 · 第 69 期

美国AI地缘政治格局剧烈重构:OpenAI 正式获准在国防部涉密网络部署模型,确立禁止自主武力与反大规模监控两大安全红线;与此同时,Anthropic 因政治立场被特朗普政府下达联邦禁用令,贴上“供应链风险”标签——政策倾斜与伦理博弈正深度...

2月28日 AI 速报 · 第 68 期

AI 编程范式正加速跃迁至 Agent 协作阶段,Replit 正式设立 “Vibe Coder” 职位,Cognition 证实 Devin 已成其代码库最大贡献者;与此同时,Anthropic 拒绝军事化应用引发行业集体声援,凸显技术伦...

2月28日 AI 速报 · 第 67 期

OpenAI 完成 1100 亿美元史诗级融资,投前估值达7300 亿美元,由Amazon、NVIDIA 与 SoftBank三方联合领投;与此同时,通用世界模型迎来理论突破,“一致性三位一体”原则被提出为新基石,而Nano Banana ...

2月27日 AI 速报 · 第 66 期

AI 正加速从工具层迈向代理层与基础设施层:QuiverAI登顶 SVG 生成 SOTA,OpenAI Stargate启动实体基建,Google押注百小时长效电池支撑无碳算力,而Claude Code 自动记忆与 Anthropic 拒绝...

2月27日 AI 速报 · 第 65 期

Google 正式发布 Nano Banana 2(即 Gemini 3.1 Flash Image),以Flash级速度+Pro级质量刷新图像生成SOTA,登顶 Image Arena 排行榜;与此同时,Perplexity AI 成为三...

2月27日 AI 速报 · 第 64 期

DeepMind 的 AlphaEvolve 框架实现代码级自主进化,发现超越人类直觉的多智能体算法;傅盛多次强调 Token 即劳动力、算力即生产力,印证 AI 经济正从“模型能力”转向“智能体生产力”的范式迁移。...

2月26日 AI 速报 · 第 63 期

AI 正加速从「模型能力竞赛」转向「智能体工程落地」,Perplexity Computer、Claude 的 UI 自动化能力与Cursor 专用计算环境标志着 AI 从对话工具升级为可执行、可审计、可协作的数字同事;与此同时,扩散式推理...

2月26日 AI 速报 · 第 62 期

OpenClaw 架构正加速推动“一人公司”范式落地,配合 Qwen 3.5 中量级模型系列 全面登陆 Ollama 与企业平台,叠加 MaxClaw 零门槛部署和 Ring-2.5 万亿参数长效Agent能力,AI Agent 已从工具跃...

2月26日 AI 速报 · 第 61 期

Qwen 3.5 系列密集落地——不仅正式开源、实现更低算力下的更强智能,更全系接入 Ollama 平台支持本地部署;与此同时,AI Agent 正加速从“工具”跃迁为具备自主权限与自我进化能力的 7×24 小时“数字员工”,以 MaxCl...

2月25日 AI 速报 · 第 60 期

Claude Code 在一周年之际实现双重突破:p99 内存占用骤降 40 倍,并正式上线跨设备Remote Control功能;与此同时,行业共识加速凝聚——从 “为人类编程” 全面转向 “为 AI Agent 构建”,以 CLI、可观...

2月25日 AI 速报 · 第 59 期

GPT-5.3-Codex 正式全面登陆 OpenAI Responses API 与 OpenRouter,Token 效率提升 3–4 倍,并在 Terminal Bench 等多项编程基准中登顶;与此同时,Anthropic 推出 C...

2月25日 AI 速报 · 第 58 期

视频扩散模型的时序鸿沟正被 Rolling Sink 机制系统性弥合;Anthropic 以 Claude Cowork 和行业插件矩阵加速企业级 AI 协作落地;Qdrant 1.17 首次实现向量索引原生的相关性反馈(Relevance...

2月24日 AI 速报 · 第 57 期

Anthropic 公开指控 DeepSeek、Moonshot AI 与 MiniMax 实施“工业级蒸馏攻击”,引发模型安全与知识产权边界大讨论;与此同时,行业加速向 AI Agent 工程化演进,OpenAI Codex App、Ti...

2月24日 AI 速报 · 第 56 期

OpenAI 全面升级实时能力:发布 gpt-realtime-1.5 模型并为 Responses API 引入 WebSockets 支持,实现最高 40% 的首字节时间(TTFT)降低;与此同时,Anthropic 提出全新 “人格选...

2月24日 AI 速报 · 第 55 期

Anthropic正式推出「AI 流利度指数」,以11 种协作行为为标尺重构人机协同评估范式;与此同时,Llama 3.1 8B推理速度突破18,000 tokens/sec,依托硬件级参数固化技术刷新端侧性能边界。...

2月23日 AI 速报 · 第 54 期

AI 推理性能迎来硬件级突破——Llama 3.1 8B 实现 18,000 tokens/sec 推理速度;与此同时,GLM-5 全栈适配国产芯片、COMI 框架在 32 倍长文本压缩下反超 25 个点,标志着模型效率与国产化能力双线跃进...

2月23日 AI 速报 · 第 53 期

AI 正加速从智能体工程(GLM-5、Antigravity)向系统级重构演进:文件系统即数据库、代码即工具(MCP 架构)、草图即应用成为新范式;而SaaS 护城河持续瓦解,印证 AI 正在重定义软件复杂度与商业壁垒。...

2月23日 AI 速报 · 第 52 期

2026 年开年,中美 AI 进入47天30次更新的高频竞速期;GLM-5正式发布,以DSA稀疏注意力与异步强化学习基础设施推动AI迈向“智能体工程”新范式;北京海淀成为全模态、全产业链突破的最强主场。...

2月22日 AI 速报 · 第 51 期

LangChain 以「Harness Engineering」系统性方法推动编程智能体跃居 Terminal Bench 2.0 前5,同时其 Agent Builder 记忆系统融合程序性与语义记忆;Gemini 3.1 Pro 展现出...

2月22日 AI 速报 · 第 50 期

Gemini 3.1 Pro 展现出将前沿学术论文(如 Local-First CRDT)直接转化为可运行模拟程序的惊人能力;与此同时,OpenAI Batch API 首次支持GPT 图像模型,批量任务成本直降 50%,标志着多模态规模化...

2月22日 AI 速报 · 第 49 期

AI 基础设施正经历ASIC 硬件革命与推理成本断崖式下降双重冲击:Taalas HC1 芯片实现 17,000 token/s 推理速度,定价低至 $0.0075/百万 token;与此同时,英伟达转向战略级资本绑定,以 300 亿美元直...

2月21日 AI 速报 · 第 48 期

AI 硬件与软件栈正同步加速重构:Taalas 以每秒 17,000 token 的专用 ASIC 芯片挑战英伟达算力霸权,而英伟达则转向战略级资本绑定——300 亿美元直接入股 OpenAI;与此同时,Claude Code 全面升级智能...

2月21日 AI 速报 · 第 47 期

Gemini 3.1 Pro、Lyria 3 与 Claude Code 构成本周AI工程演进“三叉戟”:谷歌强化系统性工程推理与多模态创作能力,Anthropic 则以 1M Token 上下文、Code Security 研究预览版及全...

2月21日 AI 速报 · 第 46 期

Llama.cpp 正式接入 Hugging Face 生态,标志着轻量级推理与模型分发体系深度协同;GPT-5.2 Thinking 在世界知识推理任务中超越 Gemini 3 DeepThink,凸显「思考链深度」正成为新一代大模型关键...

2月20日 AI 速报 · 第 45 期

Gemini 3.1 Pro 正式发布,逻辑推理能力在 ARC-AGI-2 基准中跃升至 77.1%(前代仅 31%),多项指标超越竞品;与此同时,推理算力被 OpenAI 总裁 Greg Brockman 明确定义为当前软件生产力的核心瓶...

2月20日 AI 速报 · 第 44 期

Gemini 3.1 Pro 正式登顶多维基准测试,逻辑推理能力翻倍提升(ARC-AGI-2 达 77.1%),推动 Google 重回 AI 模型第一梯队;与此同时,OpenAI、Perplexity、Replit 和 Anthropic...

2月20日 AI 速报 · 第 43 期

日语AI落地迎来关键突破:NTT DATA 借助 NVIDIA Nemotron-Personas-Japan 合成数据集,将模型准确率从15.3%跃升至79.3%;与此同时,Anthropic 收紧生态权限,OAuth 接入全面禁用,凸显...

2月19日 AI 速报 · 第 42 期

AI 正加速跨越工具层迈向决策层:Claude Opus 4.6以100万上下文窗口与动态计算重塑能力边界;Ling-2.5-1T、Qwen3.5-397B-A17B等国产大模型在开源赛道强势跻身全球前列;而分发能力与Agent 安全架构,...

2月18日 AI 速报 · 第 41 期

Qwen 3.5 系列(含 397B-A17B 与 Plus 版本)正引发全栈生态爆发式适配——从 NVIDIA NeMo、AMD Instinct GPU 到 Ollama Cloud、ZenMux 和 mlx-vlm,主流硬件平台与开发...

2月18日 AI 速报 · 第 40 期

Qwen 3.5 系列正引发全栈生态爆发——从 NVIDIA、AMD 到 Ollama Cloud、ZenMux 和 mlx-vlm,主流硬件厂商与开发平台均实现首日支持;与此同时,LlamaIndex加速向 AI Agent 基建层演进,...

2月17日 AI 速报 · 第 39 期

Qwen 3.5 系列强势引爆开源大模型生态,397B 参数、原生多模态与MoE + Linear Attention 架构获 NVIDIA、AMD、Ollama、ZenMux、LMSYS 及 mlx-vlm 全栈首日支持;与此同时,Lla...

2月17日 AI 速报 · 第 38 期

AI 正加速从能力增强迈向角色替代:LLM 代码翻译、视觉化 UI 编辑与记忆驱动型智能体成为新生产力基座;Qwen3.5-397B等开源大模型持续强化 B2B 实战能力,而傅盛团队和Google Antigravity则同步验证了 AI ...