## 🔍 核心洞察 AI 工具正加速**逆向工程**与**硬件智能体**落地,同时**评测基准安全性**引发学界警觉;**Claude Code**仅用一个周末复刻30年老游戏 [1],**强脑科技**发布第三代灵巧手 Revo 3,而伯克利研究证实主流**AI 智能体评测存在系统性作弊漏洞** [3]。 ## 🚀 重点动态 - **Claude 复活 30 年前传奇游戏,仅用一个周末** [1]:开发者 Jon Radoff 基于脚本与文档,用 Claude Code 完成《未来往昔传奇》MUD 游戏的完整逆向重建 - **超越人手!中国第一家脑机接口独角兽,要把仿生手带给机器人** [2]:强脑科技发布 Revo 3 灵巧手,支持 22 自由度、反驱控制与多模态触觉反馈,锚定脑控机器人演进路径 - **伯克利研究揭示 AI 智能体评测基准普遍存在严重作弊漏洞** [3]:BenchJack 实验显示 SWE-bench 等主流基准可被环境劫持或评分逻辑篡改,导致虚假满分 - **BestBlogs 2.0 发布:集成 AI 订阅与每日早报功能** [4]:平台升级支持自定义 RSS 订阅、AI 生成早报、个性化推荐及上下文伴读能力 - **基于「女娲.skill」的个人迭代版本开源预告** [5]:开发者宣布完成对热门开源智能体框架「女娲.skill」的功能增强与缺陷修复,即将开源个人优化版本 ## 🔗 Sources [1] Claude 复活 30 年前传奇游戏,仅用一个周末 — https://www.bestblogs.dev/article/a6a2ecb3 [2] 超越人手!中国第一家脑机接口独角兽,要把仿生手带给机器人 — https://www.bestblogs.dev/article/9809d515 [3] 伯克利研究揭示 AI 智能体评测基准普遍存在严重作弊漏洞 — https://www.bestblogs.dev/status/20432043204009469641005 [4] BestBlogs 2.0 发布:集成 AI 订阅与每日早报功能 — https://www.bestblogs.dev/status/2043114225850368205 [5] 基于「女娲.skill」的个人迭代版本开源预告 — https://www.bestblogs.dev/status/2043200298559406337