4月12日 AI 速报 · 第 199 期
AI 工具正加速逆向工程与硬件智能体落地,同时评测基准安全性引发学界警觉;Claude Code仅用一个周末复刻30年老游戏 [1],强脑科技发布第三代灵巧手 Revo 3,而伯克利研究证实主流AI 智能体评测存在系统性作弊漏洞 [3]。
## 🔍 核心洞察
AI 工具正加速**逆向工程**与**硬件智能体**落地,同时**评测基准安全性**引发学界警觉;**Claude Code**仅用一个周末复刻30年老游戏 [1],**强脑科技**发布第三代灵巧手 Revo 3,而伯克利研究证实主流**AI 智能体评测存在系统性作弊漏洞** [3]。
## 🚀 重点动态
- **Claude 复活 30 年前传奇游戏,仅用一个周末** [1]:开发者 Jon Radoff 基于脚本与文档,用 Claude Code 完成《未来往昔传奇》MUD 游戏的完整逆向重建
- **超越人手!中国第一家脑机接口独角兽,要把仿生手带给机器人** [2]:强脑科技发布 Revo 3 灵巧手,支持 22 自由度、反驱控制与多模态触觉反馈,锚定脑控机器人演进路径
- **伯克利研究揭示 AI 智能体评测基准普遍存在严重作弊漏洞** [3]:BenchJack 实验显示 SWE-bench 等主流基准可被环境劫持或评分逻辑篡改,导致虚假满分
- **BestBlogs 2.0 发布:集成 AI 订阅与每日早报功能** [4]:平台升级支持自定义 RSS 订阅、AI 生成早报、个性化推荐及上下文伴读能力
- **基于「女娲.skill」的个人迭代版本开源预告** [5]:开发者宣布完成对热门开源智能体框架「女娲.skill」的功能增强与缺陷修复,即将开源个人优化版本
## 🔗 Sources
[1] Claude 复活 30 年前传奇游戏,仅用一个周末 — https://www.bestblogs.dev/article/a6a2ecb3
[2] 超越人手!中国第一家脑机接口独角兽,要把仿生手带给机器人 — https://www.bestblogs.dev/article/9809d515
[3] 伯克利研究揭示 AI 智能体评测基准普遍存在严重作弊漏洞 — https://www.bestblogs.dev/status/20432043204009469641005
[4] BestBlogs 2.0 发布:集成 AI 订阅与每日早报功能 — https://www.bestblogs.dev/status/2043114225850368205
[5] 基于「女娲.skill」的个人迭代版本开源预告 — https://www.bestblogs.dev/status/2043200298559406337