作者: RadarAI Editorial
编辑: RadarAI 编辑部
最后更新: 2026-05-30
审核状态: 待编辑审核
每周热点
周报
官方
AI热点
Claude Code /usage 命令上线,首次实现 Skills/Agents/MCPs/Plugins 四类智能体能力的 Token 级细粒度消耗追踪,AI 工程进入「成本可计量」时代。
## 本周总览
- Claude Code `/usage` 命令上线,首次实现 Skills/Agents/MCPs/Plugins 四类智能体能力的 Token 级细粒度消耗追踪,AI 工程进入「成本可计量」时代。
- DeepSeek V4-Pro API 永久降价至原价 25%,小米 MiMo-V2.5 直击 0.025 元/百万 Token,国产大模型正式开启「Token 价格战」,推理经济性成为产品生死线。
- 面壁智能发布全球首个由 AI 编写的生产级预训练框架 **ForgeTrain**,并训练出 MiniCPM5-1B 模型,标志「AI 制造 AI」从概念验证迈入工程闭环。
- 华为提出芯片演进新范式「韬定律」,以时间常数 τ 替代晶体管密度为标尺,通过逻辑折叠与立体堆叠重构算力进化路径,挑战摩尔定律底层逻辑。
- Anthropic 开源 **Cybersecurity Skills** 项目(754 个结构化安全技能),首次为 AI 智能体提供可执行、可验证、可组合的实战型网络安全知识库,Agent 能力正从「能做」转向「该做」。
- OPPO ColorOS 16 与 vivo 官网 AI 导购同步验证「无感智能」落地路径:意图识别小模型 + Agent 工作流 + RAG 知识库,手机 AI 终极形态已脱离显性交互。
## 热点清单
1. Claude Code 新增 `/usage` 命令支持 Skills/Agents/MCPs/Plugins Token 消耗明细查询
https://www.bestblogs.dev/status/2057584283448205353?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:这是首个面向多智能体架构(非单次调用)的生产级 Token 计量工具,将 Skills 等抽象能力转化为可审计、可归因、可优化的成本单元,直接支撑企业级 Agent 的 ROI 测算与预算管控。
——可能:个人开发者立即在本地 Codex 中运行 `/usage` 查看当前会话中各 Skill 的 Token 分布;产品侧可基于该数据设计「按 Skill 调用计费」的 SaaS 模式,例如将「代码审查 Skill」单独打包为付费插件,并用 `/usage` 数据生成客户账单。
2. DeepSeek V4-Pro API 永久降价至原价 25%,启动「Harness」工程计划对标 Claude Code
https://www.bestblogs.dev/article/5e68673c?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:降价不是促销,而是以低价倒逼工程层重构——V4-Pro 专为 Agent 场景优化,配合 Harness 计划构建中国版 Claude Code 工具链,标志着编程智能体竞争从模型参数转向系统可用性。
——可能:开发者立即用 `curl` 调用 V4-Pro API 对比原版 V4 在 `/goal` 多任务场景下的延迟与 Token 消耗;产品侧可基于其低价高并发特性,快速搭建垂直领域(如法律合同审查)的 CLI Agent 服务,并用 `/side` 实时监控进度。
3. 面壁智能发布 ForgeTrain:全球首个由 AI 编写的生产级预训练框架,训练出 MiniCPM5-1B
https://www.bestblogs.dev/article/1ac2cf11?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:AI 不再仅是训练结果,更成为基础设施的构建者——ForgeTrain 自动编写分布式训练逻辑、梯度同步策略与故障恢复机制,使 1B 级模型训练效率超越 Megatron,验证「AI 基建自举」可行性。
——可能:个人开发者克隆 ForgeTrain 仓库,在 Colab 上用 1 张 A10G 复现 MiniCPM5-1B 的轻量训练流程;产品侧可将 ForgeTrain 封装为「模型工厂」SaaS,让客户上传私有数据后一键生成专属小模型。
4. 华为正式提出「韬定律」,以时间常数 τ 为标尺重构芯片演进范式
https://www.bestblogs.dev/article/083617dd?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:放弃晶体管微缩路径,转而通过逻辑折叠、3D 堆叠与异构集成优化「性能/功耗/面积/延迟」四维平衡,τ 成为可测量、可比较的新芯片竞争力指标,为国产算力自主提供非尺寸依赖的破局路径。
——可能:硬件工程师用华为昇腾 SDK 测量现有模型在不同芯片上的 τ 值(如 LLM 推理延迟/瓦特),绘制「τ-精度」帕累托前沿图;产品侧可基于 τ 指标重新定义终端 AI 设备参数表,例如将「手机端大模型响应 τ < 800ms」作为下一代旗舰机核心卖点。
5. Anthropic 开源 Cybersecurity Skills:覆盖 26 领域、754 个结构化安全技能的知识库
https://www.bestblogs.dev/status/2058414217162895622?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:将零散的安全经验(如「OWASP Top 10」)转化为 Agent 可直接调用的原子化技能(如 `scan_spring_boot_actuator`),首次实现网络安全能力的「可编排、可验证、可审计」,突破传统安全工具链孤岛。
——可能:安全工程师将该知识库导入本地 Claude Code,用 `/goal "对某 Spring Boot 应用执行全栈渗透测试"` 触发自动技能组合;产品侧可基于此构建「红队 Agent 即服务」,客户上传应用 URL 后自动生成含 PoC 验证的渗透报告。
6. OPPO ColorOS 16 实现「无感 AI」:意图识别小模型 + Agent 工作流 + RAG 知识库深度系统集成
https://www.bestblogs.dev/article/c5f3c6a3?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:手机 AI 彻底告别弹窗/入口/指令,转为在系统层静默感知用户状态(如会议日程、邮件附件、剪贴板内容),通过轻量模型触发 Agent 执行 RAG 检索与工作流调度,达成「存在即服务」。
——可能:App 开发者接入 ColorOS AI SDK,注册 `onMeetingStart` 事件钩子,自动触发本地 Agent 整理会议纪要并推送到飞书;产品侧可复刻该模式,为电商 App 构建「浏览商品页 → 自动比价 → 生成决策摘要」的无感导购链路。
7. 小米 MiMo-V2.5 API 最高降价 99%,锚定 0.025 元/百万 Token 基准线
https://www.bestblogs.dev/article/6c061586?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:这不是价格内卷,而是以极致低价倒逼工程极限——通过 OSCAR 2-bit KV Cache 量化、高频缓存命中与混合精度推理,将推理成本压至物理下限,迫使所有 Agent 产品必须重构成本模型。
——可能:创业者用小米 API 快速搭建 MVP,实测「每处理 1 条客服工单」的 Token 成本是否低于人工成本的 1/10;产品侧可设计「Token 预充值+超额熔断」机制,当单次对话 Token 超过阈值时自动降级为规则引擎,保障 SLA。
8. Alook 开源 CLI Agent 协作平台:支持角色分配、邮箱通信与共享记忆的 AI 团队编排
https://www.bestblogs.dev/status/2059729329119006928?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:将 Claude Code 等单体 Agent 升级为可管理的组织——通过邮箱协议模拟人类协作(如 `reviewer@ai` 收到 PR 后自动执行代码审查),首次实现 CLI 层面的「AI 团队自治」。
——可能:开发者克隆 Alook 仓库,配置 `claude@ai` 和 `tester@ai` 两个角色,用 `alook run --task "修复登录页 XSS 漏洞"` 启动跨角色协作;产品侧可将其嵌入 DevOps 流水线,当 GitHub Action 触发时自动派发给 AI 团队执行代码扫描、测试与文档更新。
9. Codex 新增 `/side` 指令实现侧边对话,实时查询 `/goal` 长任务进度而不中断主会话
https://www.bestblogs.dev/status/2058612576775229669?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:解决 Agent 多任务不可观测的核心痛点——`/side` 创建独立上下文通道,使用户能在调试主逻辑的同时,随时查看后台任务(如「部署到 staging」)的实时日志与资源消耗,大幅提升复杂开发流可控性。
——可能:程序员在 VS Code 中用 Codex 插件输入 `/side /goal deploy-staging`,新开侧边栏持续显示部署进度;产品侧可基于此设计「AI 工程师仪表盘」,聚合所有 `/goal` 任务的 `/side` 输出,形成团队级 Agent 运维视图。
10. Qwen3.7 Max 登顶 Vibe Coding 全球第二,在真实编码体验场景中力压 Claude/Gemini
https://www.bestblogs.dev/article/392bb55d?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:Vibe Coding 测评聚焦「开发者主观体验」——包括意图理解准确率、上下文保持时长、错误恢复自然度等软性指标,Qwen3.7 Max 的登顶证明国产模型在人机协同直觉层面已建立代际优势。
——可能:前端开发者用 Qwen
- Claude Code
/usage 命令上线,首次实现 Skills/Agents/MCPs/Plugins 四类智能体能力的 Token 级细粒度消耗追踪,AI 工程进入「成本可计量」时代。
- DeepSeek V4-Pro API 永久降价至原价 25%,小米 MiMo-V2.5 直击 0.025 元/百万 Token,国产大模型正式开启「Token 价格战」,推理经济性成为产品生死线。
- 面壁智能发布全球首个由 AI 编写的生产级预训练框架 ForgeTrain,并训练出 MiniCPM5-1B 模型,标志「AI 制造 AI」从概念验证迈入工程闭环。
- 华为提出芯片演进新范式「韬定律」,以时间常数 τ 替代晶体管密度为标尺,通过逻辑折叠与立体堆叠重构算力进化路径,挑战摩尔定律底层逻辑。
- Anthropic 开源 Cybersecurity Skills 项目(754 个结构化安全技能),首次为 AI 智能体提供可执行、可验证、可组合的实战型网络安全知识库,Agent 能力正从「能做」转向「该做」。
- OPPO ColorOS 16 与 vivo 官网 AI 导购同步验证「无感智能」落地路径:意图识别小模型 + Agent 工作流 + RAG 知识库,手机 AI 终极形态已脱离显性交互。
热点清单
-
Claude Code 新增 /usage 命令支持 Skills/Agents/MCPs/Plugins Token 消耗明细查询
https://www.bestblogs.dev/status/2057584283448205353?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:这是首个面向多智能体架构(非单次调用)的生产级 Token 计量工具,将 Skills 等抽象能力转化为可审计、可归因、可优化的成本单元,直接支撑企业级 Agent 的 ROI 测算与预算管控。
——可能:个人开发者立即在本地 Codex 中运行 /usage 查看当前会话中各 Skill 的 Token 分布;产品侧可基于该数据设计「按 Skill 调用计费」的 SaaS 模式,例如将「代码审查 Skill」单独打包为付费插件,并用 /usage 数据生成客户账单。
-
DeepSeek V4-Pro API 永久降价至原价 25%,启动「Harness」工程计划对标 Claude Code
https://www.bestblogs.dev/article/5e68673c?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:降价不是促销,而是以低价倒逼工程层重构——V4-Pro 专为 Agent 场景优化,配合 Harness 计划构建中国版 Claude Code 工具链,标志着编程智能体竞争从模型参数转向系统可用性。
——可能:开发者立即用 curl 调用 V4-Pro API 对比原版 V4 在 /goal 多任务场景下的延迟与 Token 消耗;产品侧可基于其低价高并发特性,快速搭建垂直领域(如法律合同审查)的 CLI Agent 服务,并用 /side 实时监控进度。
-
面壁智能发布 ForgeTrain:全球首个由 AI 编写的生产级预训练框架,训练出 MiniCPM5-1B
https://www.bestblogs.dev/article/1ac2cf11?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:AI 不再仅是训练结果,更成为基础设施的构建者——ForgeTrain 自动编写分布式训练逻辑、梯度同步策略与故障恢复机制,使 1B 级模型训练效率超越 Megatron,验证「AI 基建自举」可行性。
——可能:个人开发者克隆 ForgeTrain 仓库,在 Colab 上用 1 张 A10G 复现 MiniCPM5-1B 的轻量训练流程;产品侧可将 ForgeTrain 封装为「模型工厂」SaaS,让客户上传私有数据后一键生成专属小模型。
-
华为正式提出「韬定律」,以时间常数 τ 为标尺重构芯片演进范式
https://www.bestblogs.dev/article/083617dd?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:放弃晶体管微缩路径,转而通过逻辑折叠、3D 堆叠与异构集成优化「性能/功耗/面积/延迟」四维平衡,τ 成为可测量、可比较的新芯片竞争力指标,为国产算力自主提供非尺寸依赖的破局路径。
——可能:硬件工程师用华为昇腾 SDK 测量现有模型在不同芯片上的 τ 值(如 LLM 推理延迟/瓦特),绘制「τ-精度」帕累托前沿图;产品侧可基于 τ 指标重新定义终端 AI 设备参数表,例如将「手机端大模型响应 τ < 800ms」作为下一代旗舰机核心卖点。
-
Anthropic 开源 Cybersecurity Skills:覆盖 26 领域、754 个结构化安全技能的知识库
https://www.bestblogs.dev/status/2058414217162895622?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:将零散的安全经验(如「OWASP Top 10」)转化为 Agent 可直接调用的原子化技能(如 scan_spring_boot_actuator),首次实现网络安全能力的「可编排、可验证、可审计」,突破传统安全工具链孤岛。
——可能:安全工程师将该知识库导入本地 Claude Code,用 /goal "对某 Spring Boot 应用执行全栈渗透测试" 触发自动技能组合;产品侧可基于此构建「红队 Agent 即服务」,客户上传应用 URL 后自动生成含 PoC 验证的渗透报告。
-
OPPO ColorOS 16 实现「无感 AI」:意图识别小模型 + Agent 工作流 + RAG 知识库深度系统集成
https://www.bestblogs.dev/article/c5f3c6a3?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:手机 AI 彻底告别弹窗/入口/指令,转为在系统层静默感知用户状态(如会议日程、邮件附件、剪贴板内容),通过轻量模型触发 Agent 执行 RAG 检索与工作流调度,达成「存在即服务」。
——可能:App 开发者接入 ColorOS AI SDK,注册 onMeetingStart 事件钩子,自动触发本地 Agent 整理会议纪要并推送到飞书;产品侧可复刻该模式,为电商 App 构建「浏览商品页 → 自动比价 → 生成决策摘要」的无感导购链路。
-
小米 MiMo-V2.5 API 最高降价 99%,锚定 0.025 元/百万 Token 基准线
https://www.bestblogs.dev/article/6c061586?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:这不是价格内卷,而是以极致低价倒逼工程极限——通过 OSCAR 2-bit KV Cache 量化、高频缓存命中与混合精度推理,将推理成本压至物理下限,迫使所有 Agent 产品必须重构成本模型。
——可能:创业者用小米 API 快速搭建 MVP,实测「每处理 1 条客服工单」的 Token 成本是否低于人工成本的 1/10;产品侧可设计「Token 预充值+超额熔断」机制,当单次对话 Token 超过阈值时自动降级为规则引擎,保障 SLA。
-
Alook 开源 CLI Agent 协作平台:支持角色分配、邮箱通信与共享记忆的 AI 团队编排
https://www.bestblogs.dev/status/2059729329119006928?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:将 Claude Code 等单体 Agent 升级为可管理的组织——通过邮箱协议模拟人类协作(如 reviewer@ai 收到 PR 后自动执行代码审查),首次实现 CLI 层面的「AI 团队自治」。
——可能:开发者克隆 Alook 仓库,配置 claude@ai 和 tester@ai 两个角色,用 alook run --task "修复登录页 XSS 漏洞" 启动跨角色协作;产品侧可将其嵌入 DevOps 流水线,当 GitHub Action 触发时自动派发给 AI 团队执行代码扫描、测试与文档更新。
-
Codex 新增 /side 指令实现侧边对话,实时查询 /goal 长任务进度而不中断主会话
https://www.bestblogs.dev/status/2058612576775229669?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:解决 Agent 多任务不可观测的核心痛点——/side 创建独立上下文通道,使用户能在调试主逻辑的同时,随时查看后台任务(如「部署到 staging」)的实时日志与资源消耗,大幅提升复杂开发流可控性。
——可能:程序员在 VS Code 中用 Codex 插件输入 /side /goal deploy-staging,新开侧边栏持续显示部署进度;产品侧可基于此设计「AI 工程师仪表盘」,聚合所有 /goal 任务的 /side 输出,形成团队级 Agent 运维视图。
-
Qwen3.7 Max 登顶 Vibe Coding 全球第二,在真实编码体验场景中力压 Claude/Gemini
https://www.bestblogs.dev/article/392bb55d?utm_source=rss&utm_medium=feed&utm_campaign=resources&entry=rss_article_item
本质:Vibe Coding 测评聚焦「开发者主观体验」——包括意图理解准确率、上下文保持时长、错误恢复自然度等软性指标,Qwen3.7 Max 的登顶证明国产模型在人机协同直觉层面已建立代际优势。
——可能:前端开发者用 Qwen
← 返回更新速报