The AI Scientist-v2 过了 ICLR workshop 盲审,但更值得讨论的是:自动化科研 pipeline 到底走到了哪一步?

2026-04-11 15:260阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

Sakana AI 的 AI Scientist-v2 这个项目最近正式发了 Nature 论文,标题是 Towards end-to-end automation of AI research。它干的事情是把 3 篇完全由 AI 端到端生成的论文(从 idea、文献检索、写代码跑实验、画图分析到写完整稿子,全程无人修改)投到了 ICLR 2025 的 ICBINB workshop。审稿人事先被告知有少量稿件可能是 AI 生成的,但不知道具体是哪篇,也可以选择 opt out。结果 3 篇里有 1 篇拿到了 6/7/6(均分 6.33),按 Sakana 官方博客的说法,这个分数高于该 workshop 的 average acceptance threshold。

不过有几个背景得说清楚:这是 workshop 不是 ICLR 主会,workshop 的 acceptance rate 大概 60–70%,跟主会 20–30% 差很远;Sakana 团队自己内部也评估过,认为三篇都没达到主会水平;所有 AI 生成的投稿按照预先设定的实验协议,在评审结束后都主动撤回了,不存在"被退稿"的说法。GitHub 上有两个 repo,v1 更依赖固定 template 做特定方向的研究,v2 走的是 template-free 路线,用 agentic tree search 做更开放的探索,不过 v2 也不是所有场景下都比 v1 好。

这条 pipeline 本身——idea → 文献检索 → 代码 → 实验 → 写作,这整个链路到底跑到了什么程度。

阅读全文
问题描述:

Sakana AI 的 AI Scientist-v2 这个项目最近正式发了 Nature 论文,标题是 Towards end-to-end automation of AI research。它干的事情是把 3 篇完全由 AI 端到端生成的论文(从 idea、文献检索、写代码跑实验、画图分析到写完整稿子,全程无人修改)投到了 ICLR 2025 的 ICBINB workshop。审稿人事先被告知有少量稿件可能是 AI 生成的,但不知道具体是哪篇,也可以选择 opt out。结果 3 篇里有 1 篇拿到了 6/7/6(均分 6.33),按 Sakana 官方博客的说法,这个分数高于该 workshop 的 average acceptance threshold。

不过有几个背景得说清楚:这是 workshop 不是 ICLR 主会,workshop 的 acceptance rate 大概 60–70%,跟主会 20–30% 差很远;Sakana 团队自己内部也评估过,认为三篇都没达到主会水平;所有 AI 生成的投稿按照预先设定的实验协议,在评审结束后都主动撤回了,不存在"被退稿"的说法。GitHub 上有两个 repo,v1 更依赖固定 template 做特定方向的研究,v2 走的是 template-free 路线,用 agentic tree search 做更开放的探索,不过 v2 也不是所有场景下都比 v1 好。

这条 pipeline 本身——idea → 文献检索 → 代码 → 实验 → 写作,这整个链路到底跑到了什么程度。

阅读全文