每周 AI 热点 · 2026-05-29

2026-05-29 09:00

作者: RadarAI Editorial 编辑: RadarAI 编辑部最后更新: 2026-07-14 审核状态: 待编辑审核每周热点周报官方 AI热点

Claude Code /usage 命令上线，首次实现 Skills/Agents/MCPs/Plugins 四类智能体能力的 Token 级细粒度消耗追踪，AI 工程进入「成本可计量」时代。

## 本周总览 - Claude Code `/usage` 命令上线，首次实现 Skills/Agents/MCPs/Plugins 四类智能体能力的 Token 级细粒度消耗追踪，AI 工程进入「成本可计量」时代。 - DeepSeek V4-Pro API 永久降价至原价 25%，小米 MiMo-V2.5 直击 0.025 元/百万 Token，国产大模型正式开启「Token 价格战」，推理经济性成为产品生死线。 - 面壁智能发布全球首个由 AI 编写的生产级预训练框架 **ForgeTrain**，并训练出 MiniCPM5-1B 模型，标志「AI 制造 AI」从概念验证迈入工程闭环。 - 华为提出芯片演进新范式「韬定律」，以时间常数 τ 替代晶体管密度为标尺，通过逻辑折叠与立体堆叠重构算力进化路径，挑战摩尔定律底层逻辑。 - Anthropic 开源 **Cybersecurity Skills** 项目（754 个结构化安全技能），首次为 AI 智能体提供可执行、可验证、可组合的实战型网络安全知识库，Agent 能力正从「能做」转向「该做」。 - OPPO ColorOS 16 与 vivo 官网 AI 导购同步验证「无感智能」落地路径：意图识别小模型 + Agent 工作流 + RAG 知识库，手机 AI 终极形态已脱离显性交互。 ## 热点清单 1. Claude Code 新增 `/usage` 命令支持 Skills/Agents/MCPs/Plugins Token 消耗明细查询 https://www.bestblogs.dev/status/2057584283448205353?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：这是首个面向多智能体架构（非单次调用）的生产级 Token 计量工具，将 Skills 等抽象能力转化为可审计、可归因、可优化的成本单元，直接支撑企业级 Agent 的 ROI 测算与预算管控。 ——可能：个人开发者立即在本地 Codex 中运行 `/usage` 查看当前会话中各 Skill 的 Token 分布；产品侧可基于该数据设计「按 Skill 调用计费」的 SaaS 模式，例如将「代码审查 Skill」单独打包为付费插件，并用 `/usage` 数据生成客户账单。 2. DeepSeek V4-Pro API 永久降价至原价 25%，启动「Harness」工程计划对标 Claude Code https://www.bestblogs.dev/article/5e68673c?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：降价不是促销，而是以低价倒逼工程层重构——V4-Pro 专为 Agent 场景优化，配合 Harness 计划构建中国版 Claude Code 工具链，标志着编程智能体竞争从模型参数转向系统可用性。 ——可能：开发者立即用 `curl` 调用 V4-Pro API 对比原版 V4 在 `/goal` 多任务场景下的延迟与 Token 消耗；产品侧可基于其低价高并发特性，快速搭建垂直领域（如法律合同审查）的 CLI Agent 服务，并用 `/side` 实时监控进度。 3. 面壁智能发布 ForgeTrain：全球首个由 AI 编写的生产级预训练框架，训练出 MiniCPM5-1B https://www.bestblogs.dev/article/1ac2cf11?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：AI 不再仅是训练结果，更成为基础设施的构建者——ForgeTrain 自动编写分布式训练逻辑、梯度同步策略与故障恢复机制，使 1B 级模型训练效率超越 Megatron，验证「AI 基建自举」可行性。 ——可能：个人开发者克隆 ForgeTrain 仓库，在 Colab 上用 1 张 A10G 复现 MiniCPM5-1B 的轻量训练流程；产品侧可将 ForgeTrain 封装为「模型工厂」SaaS，让客户上传私有数据后一键生成专属小模型。 4. 华为正式提出「韬定律」，以时间常数 τ 为标尺重构芯片演进范式 https://www.bestblogs.dev/article/083617dd?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：放弃晶体管微缩路径，转而通过逻辑折叠、3D 堆叠与异构集成优化「性能/功耗/面积/延迟」四维平衡，τ 成为可测量、可比较的新芯片竞争力指标，为国产算力自主提供非尺寸依赖的破局路径。 ——可能：硬件工程师用华为昇腾 SDK 测量现有模型在不同芯片上的 τ 值（如 LLM 推理延迟/瓦特），绘制「τ-精度」帕累托前沿图；产品侧可基于 τ 指标重新定义终端 AI 设备参数表，例如将「手机端大模型响应 τ < 800ms」作为下一代旗舰机核心卖点。 5. Anthropic 开源 Cybersecurity Skills：覆盖 26 领域、754 个结构化安全技能的知识库 https://www.bestblogs.dev/status/2058414217162895622?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：将零散的安全经验（如「OWASP Top 10」）转化为 Agent 可直接调用的原子化技能（如 `scan_spring_boot_actuator`），首次实现网络安全能力的「可编排、可验证、可审计」，突破传统安全工具链孤岛。 ——可能：安全工程师将该知识库导入本地 Claude Code，用 `/goal "对某 Spring Boot 应用执行全栈渗透测试"` 触发自动技能组合；产品侧可基于此构建「红队 Agent 即服务」，客户上传应用 URL 后自动生成含 PoC 验证的渗透报告。 6. OPPO ColorOS 16 实现「无感 AI」：意图识别小模型 + Agent 工作流 + RAG 知识库深度系统集成 https://www.bestblogs.dev/article/c5f3c6a3?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：手机 AI 彻底告别弹窗/入口/指令，转为在系统层静默感知用户状态（如会议日程、邮件附件、剪贴板内容），通过轻量模型触发 Agent 执行 RAG 检索与工作流调度，达成「存在即服务」。 ——可能：App 开发者接入 ColorOS AI SDK，注册 `onMeetingStart` 事件钩子，自动触发本地 Agent 整理会议纪要并推送到飞书；产品侧可复刻该模式，为电商 App 构建「浏览商品页 → 自动比价 → 生成决策摘要」的无感导购链路。 7. 小米 MiMo-V2.5 API 最高降价 99%，锚定 0.025 元/百万 Token 基准线 https://www.bestblogs.dev/article/6c061586?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：这不是价格内卷，而是以极致低价倒逼工程极限——通过 OSCAR 2-bit KV Cache 量化、高频缓存命中与混合精度推理，将推理成本压至物理下限，迫使所有 Agent 产品必须重构成本模型。 ——可能：创业者用小米 API 快速搭建 MVP，实测「每处理 1 条客服工单」的 Token 成本是否低于人工成本的 1/10；产品侧可设计「Token 预充值+超额熔断」机制，当单次对话 Token 超过阈值时自动降级为规则引擎，保障 SLA。 8. Alook 开源 CLI Agent 协作平台：支持角色分配、邮箱通信与共享记忆的 AI 团队编排 https://www.bestblogs.dev/status/2059729329119006928?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：将 Claude Code 等单体 Agent 升级为可管理的组织——通过邮箱协议模拟人类协作（如 `reviewer@ai` 收到 PR 后自动执行代码审查），首次实现 CLI 层面的「AI 团队自治」。 ——可能：开发者克隆 Alook 仓库，配置 `claude@ai` 和 `tester@ai` 两个角色，用 `alook run --task "修复登录页 XSS 漏洞"` 启动跨角色协作；产品侧可将其嵌入 DevOps 流水线，当 GitHub Action 触发时自动派发给 AI 团队执行代码扫描、测试与文档更新。 9. Codex 新增 `/side` 指令实现侧边对话，实时查询 `/goal` 长任务进度而不中断主会话 https://www.bestblogs.dev/status/2058612576775229669?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：解决 Agent 多任务不可观测的核心痛点——`/side` 创建独立上下文通道，使用户能在调试主逻辑的同时，随时查看后台任务（如「部署到 staging」）的实时日志与资源消耗，大幅提升复杂开发流可控性。 ——可能：程序员在 VS Code 中用 Codex 插件输入 `/side /goal deploy-staging`，新开侧边栏持续显示部署进度；产品侧可基于此设计「AI 工程师仪表盘」，聚合所有 `/goal` 任务的 `/side` 输出，形成团队级 Agent 运维视图。 10. Qwen3.7 Max 登顶 Vibe Coding 全球第二，在真实编码体验场景中力压 Claude/Gemini https://www.bestblogs.dev/article/392bb55d?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item 本质：Vibe Coding 测评聚焦「开发者主观体验」——包括意图理解准确率、上下文保持时长、错误恢复自然度等软性指标，Qwen3.7 Max 的登顶证明国产模型在人机协同直觉层面已建立代际优势。 ——可能：前端开发者用 Qwen

Claude Code /usage 命令上线，首次实现 Skills/Agents/MCPs/Plugins 四类智能体能力的 Token 级细粒度消耗追踪，AI 工程进入「成本可计量」时代。
DeepSeek V4-Pro API 永久降价至原价 25%，小米 MiMo-V2.5 直击 0.025 元/百万 Token，国产大模型正式开启「Token 价格战」，推理经济性成为产品生死线。
面壁智能发布全球首个由 AI 编写的生产级预训练框架 ForgeTrain，并训练出 MiniCPM5-1B 模型，标志「AI 制造 AI」从概念验证迈入工程闭环。
华为提出芯片演进新范式「韬定律」，以时间常数 τ 替代晶体管密度为标尺，通过逻辑折叠与立体堆叠重构算力进化路径，挑战摩尔定律底层逻辑。
Anthropic 开源 Cybersecurity Skills 项目（754 个结构化安全技能），首次为 AI 智能体提供可执行、可验证、可组合的实战型网络安全知识库，Agent 能力正从「能做」转向「该做」。
OPPO ColorOS 16 与 vivo 官网 AI 导购同步验证「无感智能」落地路径：意图识别小模型 + Agent 工作流 + RAG 知识库，手机 AI 终极形态已脱离显性交互。

热点清单

Claude Code 新增 /usage 命令支持 Skills/Agents/MCPs/Plugins Token 消耗明细查询
https://www.bestblogs.dev/status/2057584283448205353?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：这是首个面向多智能体架构（非单次调用）的生产级 Token 计量工具，将 Skills 等抽象能力转化为可审计、可归因、可优化的成本单元，直接支撑企业级 Agent 的 ROI 测算与预算管控。
——可能：个人开发者立即在本地 Codex 中运行 /usage 查看当前会话中各 Skill 的 Token 分布；产品侧可基于该数据设计「按 Skill 调用计费」的 SaaS 模式，例如将「代码审查 Skill」单独打包为付费插件，并用 /usage 数据生成客户账单。
DeepSeek V4-Pro API 永久降价至原价 25%，启动「Harness」工程计划对标 Claude Code
https://www.bestblogs.dev/article/5e68673c?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：降价不是促销，而是以低价倒逼工程层重构——V4-Pro 专为 Agent 场景优化，配合 Harness 计划构建中国版 Claude Code 工具链，标志着编程智能体竞争从模型参数转向系统可用性。
——可能：开发者立即用 curl 调用 V4-Pro API 对比原版 V4 在 /goal 多任务场景下的延迟与 Token 消耗；产品侧可基于其低价高并发特性，快速搭建垂直领域（如法律合同审查）的 CLI Agent 服务，并用 /side 实时监控进度。
面壁智能发布 ForgeTrain：全球首个由 AI 编写的生产级预训练框架，训练出 MiniCPM5-1B
https://www.bestblogs.dev/article/1ac2cf11?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：AI 不再仅是训练结果，更成为基础设施的构建者——ForgeTrain 自动编写分布式训练逻辑、梯度同步策略与故障恢复机制，使 1B 级模型训练效率超越 Megatron，验证「AI 基建自举」可行性。
——可能：个人开发者克隆 ForgeTrain 仓库，在 Colab 上用 1 张 A10G 复现 MiniCPM5-1B 的轻量训练流程；产品侧可将 ForgeTrain 封装为「模型工厂」SaaS，让客户上传私有数据后一键生成专属小模型。
华为正式提出「韬定律」，以时间常数 τ 为标尺重构芯片演进范式
https://www.bestblogs.dev/article/083617dd?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：放弃晶体管微缩路径，转而通过逻辑折叠、3D 堆叠与异构集成优化「性能/功耗/面积/延迟」四维平衡，τ 成为可测量、可比较的新芯片竞争力指标，为国产算力自主提供非尺寸依赖的破局路径。
——可能：硬件工程师用华为昇腾 SDK 测量现有模型在不同芯片上的 τ 值（如 LLM 推理延迟/瓦特），绘制「τ-精度」帕累托前沿图；产品侧可基于 τ 指标重新定义终端 AI 设备参数表，例如将「手机端大模型响应 τ < 800ms」作为下一代旗舰机核心卖点。
Anthropic 开源 Cybersecurity Skills：覆盖 26 领域、754 个结构化安全技能的知识库
https://www.bestblogs.dev/status/2058414217162895622?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：将零散的安全经验（如「OWASP Top 10」）转化为 Agent 可直接调用的原子化技能（如 scan_spring_boot_actuator），首次实现网络安全能力的「可编排、可验证、可审计」，突破传统安全工具链孤岛。
——可能：安全工程师将该知识库导入本地 Claude Code，用 /goal "对某 Spring Boot 应用执行全栈渗透测试" 触发自动技能组合；产品侧可基于此构建「红队 Agent 即服务」，客户上传应用 URL 后自动生成含 PoC 验证的渗透报告。
OPPO ColorOS 16 实现「无感 AI」：意图识别小模型 + Agent 工作流 + RAG 知识库深度系统集成
https://www.bestblogs.dev/article/c5f3c6a3?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：手机 AI 彻底告别弹窗/入口/指令，转为在系统层静默感知用户状态（如会议日程、邮件附件、剪贴板内容），通过轻量模型触发 Agent 执行 RAG 检索与工作流调度，达成「存在即服务」。
——可能：App 开发者接入 ColorOS AI SDK，注册 onMeetingStart 事件钩子，自动触发本地 Agent 整理会议纪要并推送到飞书；产品侧可复刻该模式，为电商 App 构建「浏览商品页 → 自动比价 → 生成决策摘要」的无感导购链路。
小米 MiMo-V2.5 API 最高降价 99%，锚定 0.025 元/百万 Token 基准线
https://www.bestblogs.dev/article/6c061586?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：这不是价格内卷，而是以极致低价倒逼工程极限——通过 OSCAR 2-bit KV Cache 量化、高频缓存命中与混合精度推理，将推理成本压至物理下限，迫使所有 Agent 产品必须重构成本模型。
——可能：创业者用小米 API 快速搭建 MVP，实测「每处理 1 条客服工单」的 Token 成本是否低于人工成本的 1/10；产品侧可设计「Token 预充值+超额熔断」机制，当单次对话 Token 超过阈值时自动降级为规则引擎，保障 SLA。
Alook 开源 CLI Agent 协作平台：支持角色分配、邮箱通信与共享记忆的 AI 团队编排
https://www.bestblogs.dev/status/2059729329119006928?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：将 Claude Code 等单体 Agent 升级为可管理的组织——通过邮箱协议模拟人类协作（如 reviewer@ai 收到 PR 后自动执行代码审查），首次实现 CLI 层面的「AI 团队自治」。
——可能：开发者克隆 Alook 仓库，配置 claude@ai 和 tester@ai 两个角色，用 alook run --task "修复登录页 XSS 漏洞" 启动跨角色协作；产品侧可将其嵌入 DevOps 流水线，当 GitHub Action 触发时自动派发给 AI 团队执行代码扫描、测试与文档更新。
Codex 新增 /side 指令实现侧边对话，实时查询 /goal 长任务进度而不中断主会话
https://www.bestblogs.dev/status/2058612576775229669?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：解决 Agent 多任务不可观测的核心痛点——/side 创建独立上下文通道，使用户能在调试主逻辑的同时，随时查看后台任务（如「部署到 staging」）的实时日志与资源消耗，大幅提升复杂开发流可控性。
——可能：程序员在 VS Code 中用 Codex 插件输入 /side /goal deploy-staging，新开侧边栏持续显示部署进度；产品侧可基于此设计「AI 工程师仪表盘」，聚合所有 /goal 任务的 /side 输出，形成团队级 Agent 运维视图。
Qwen3.7 Max 登顶 Vibe Coding 全球第二，在真实编码体验场景中力压 Claude/Gemini
https://www.bestblogs.dev/article/392bb55d?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质：Vibe Coding 测评聚焦「开发者主观体验」——包括意图理解准确率、上下文保持时长、错误恢复自然度等软性指标，Qwen3.7 Max 的登顶证明国产模型在人机协同直觉层面已建立代际优势。
——可能：前端开发者用 Qwen

← 返回更新速报