AI科研不完全指北:Top10 PhD烧了上万刀的真实经验。 Context Is All You Need
- 内容介绍
- 文章标签
- 相关推荐
写这篇文章的起因很简单:我在 Twitter 上看到一个帖子,标题是"全网最完整AI科研终极指南"。点进去被浪费了人生的5分钟。
作者显然就是把几篇文章丢给ai,自动化的生产出一篇垃圾。流程图画得花里胡哨,工具列表也罗列得无比齐全,从文献检索到论文生成一条龙,看完让人觉得 AI 做科研这件事已经被彻底解决了。但凡真正用AI跑过一整套深度学习实验的人,都知道这篇东西有多离谱:它把科研最难、最脏、最痛苦的那部分,直接用漂亮的方框和箭头抹平了,就好像这个世界有一条通往成功的路,没有任何分叉和转折,AI就在那条路上一直往前走。
既然这种文章都有人点赞、有人收藏、有人转发,那我干脆也写一篇,把我自己踩过的坑、踩出来的经验,原原本本分享出来。
我是TOP10 的CS PhD 在读,发过 CVPR、ICCV、ICML、NeurIPS 等顶会,也担任过基本上所有主流顶会的审稿人。我有能力判断AI产出的东西到底有没有基本科研质量。
我用的主力模型是Claude Opus 4.6、GPT-5.4 xHigh,以及Gemini 3.1 Pro。我强烈不建议任何人拿低智能模型去做任何形式的科研探索,那纯粹是在浪费生命。
我目前订阅了Claude Max 20x、两个ChatGPT Pro、五个GPT Plus、Gemini家庭组Ultra,还有Super Grok。每个月Claude的额度基本能烧完,其中一大半都砸在了research上。这些订阅不是为了炫富,而是想证明:我真的把这套workflow从零搭起来、反复迭代过N次、真实跑通过,而不是看两篇教程就跑来分享。
Paper2Code、Sakana AI的The AI Scientist、Oh My Research、Hermes research skill,以及市面上能找到的各种“自动化科研框架”,我基本都clone下来对比过。结论很残酷:这些通用库对你真正发出一篇有价值的工作,几乎没有任何帮助。
注意,我不是说AI做科研没用,而是说“开箱即用的agent system”没用。你必须根据自己的领域、自己的方向,去定制一套真正属于自己的workflow。
写这篇文章的起因很简单:我在 Twitter 上看到一个帖子,标题是"全网最完整AI科研终极指南"。点进去被浪费了人生的5分钟。
作者显然就是把几篇文章丢给ai,自动化的生产出一篇垃圾。流程图画得花里胡哨,工具列表也罗列得无比齐全,从文献检索到论文生成一条龙,看完让人觉得 AI 做科研这件事已经被彻底解决了。但凡真正用AI跑过一整套深度学习实验的人,都知道这篇东西有多离谱:它把科研最难、最脏、最痛苦的那部分,直接用漂亮的方框和箭头抹平了,就好像这个世界有一条通往成功的路,没有任何分叉和转折,AI就在那条路上一直往前走。
既然这种文章都有人点赞、有人收藏、有人转发,那我干脆也写一篇,把我自己踩过的坑、踩出来的经验,原原本本分享出来。
我是TOP10 的CS PhD 在读,发过 CVPR、ICCV、ICML、NeurIPS 等顶会,也担任过基本上所有主流顶会的审稿人。我有能力判断AI产出的东西到底有没有基本科研质量。
我用的主力模型是Claude Opus 4.6、GPT-5.4 xHigh,以及Gemini 3.1 Pro。我强烈不建议任何人拿低智能模型去做任何形式的科研探索,那纯粹是在浪费生命。
我目前订阅了Claude Max 20x、两个ChatGPT Pro、五个GPT Plus、Gemini家庭组Ultra,还有Super Grok。每个月Claude的额度基本能烧完,其中一大半都砸在了research上。这些订阅不是为了炫富,而是想证明:我真的把这套workflow从零搭起来、反复迭代过N次、真实跑通过,而不是看两篇教程就跑来分享。
Paper2Code、Sakana AI的The AI Scientist、Oh My Research、Hermes research skill,以及市面上能找到的各种“自动化科研框架”,我基本都clone下来对比过。结论很残酷:这些通用库对你真正发出一篇有价值的工作,几乎没有任何帮助。
注意,我不是说AI做科研没用,而是说“开箱即用的agent system”没用。你必须根据自己的领域、自己的方向,去定制一套真正属于自己的workflow。

