看到挺多人对自动化ai科研感兴趣,我来分享一点自己的经验

2026-04-11 08:120阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

更新:Claude支持Monitor tool了。让我测试一下是否能解决我们这套监控的问题

开场先叠个甲,CS PhD 在读,发过 CVPR、ICCV、ICML、NeurIPS等。Claude官方max订阅。ChatGPT pro订阅,以及Gemini Ultra。
首先,现在 AI 写论文这件事已经非常成熟了。如果你只是写一些不需要任何实验的论文,我觉得它是完全可以胜任的,甚至它会写得比你还好,只不过需要一些 Harness 以及skill来适配你的工作流。

重新编辑把所有内容放到主楼层了。

但是我现在想讨论的是 Deep Learning 方向的科研任务。AI 是否能完整地解决 Deep Learning 的任务,主要分为以下几个过程:

  1. 文献调研
  2. 确定 Baseline
  3. 确定 Idea
  4. 写代码跑实验(实现 Idea)
  5. 分析实验
  6. 写论文

我真正尝试了几次,自己也搭了多套系统,纯skill方式,agent方式,魔改omc/omcodex等,都会发现最起码到目前为止,它还是没有办法完全自由推进。过程中确实会有一些让人 Amazing 的点,但更多的时候,它还是会在一个地方陷进去打转。
先说模型使用的问题,如果你想拥有最好的性能,三家模型肯定都是要用的。因为首先它们擅长的侧重点不同,其次,多元模型交叉可以互相 review。

这种情况下是防止幻觉以及提升能力最好的办法,类似于只要写过代码都知道,ensemble 是无痛提点的最好方式。

其次,关于文献调研。

首先,AI 的文献调研能力一定是比人强的。我发现找调研(survey)这个过程中有很多值得探索的点,比如大模型是怎么读内容的:是让它自己通过 Web Search 读原文,还是你给它下载好 PDF 之后再喂给它读?以及是直接读PDF还是转markdown在读,这里面有很大的探索空间,也就是怎么把这个流程做到最稳定、最可用。

另外我发现,如果让它读一些论文,因为论文动辄三四十页,它其实会“偷懒”,只读前三页。

阅读全文
问题描述:

更新:Claude支持Monitor tool了。让我测试一下是否能解决我们这套监控的问题

开场先叠个甲,CS PhD 在读,发过 CVPR、ICCV、ICML、NeurIPS等。Claude官方max订阅。ChatGPT pro订阅,以及Gemini Ultra。
首先,现在 AI 写论文这件事已经非常成熟了。如果你只是写一些不需要任何实验的论文,我觉得它是完全可以胜任的,甚至它会写得比你还好,只不过需要一些 Harness 以及skill来适配你的工作流。

重新编辑把所有内容放到主楼层了。

但是我现在想讨论的是 Deep Learning 方向的科研任务。AI 是否能完整地解决 Deep Learning 的任务,主要分为以下几个过程:

  1. 文献调研
  2. 确定 Baseline
  3. 确定 Idea
  4. 写代码跑实验(实现 Idea)
  5. 分析实验
  6. 写论文

我真正尝试了几次,自己也搭了多套系统,纯skill方式,agent方式,魔改omc/omcodex等,都会发现最起码到目前为止,它还是没有办法完全自由推进。过程中确实会有一些让人 Amazing 的点,但更多的时候,它还是会在一个地方陷进去打转。
先说模型使用的问题,如果你想拥有最好的性能,三家模型肯定都是要用的。因为首先它们擅长的侧重点不同,其次,多元模型交叉可以互相 review。

这种情况下是防止幻觉以及提升能力最好的办法,类似于只要写过代码都知道,ensemble 是无痛提点的最好方式。

其次,关于文献调研。

首先,AI 的文献调研能力一定是比人强的。我发现找调研(survey)这个过程中有很多值得探索的点,比如大模型是怎么读内容的:是让它自己通过 Web Search 读原文,还是你给它下载好 PDF 之后再喂给它读?以及是直接读PDF还是转markdown在读,这里面有很大的探索空间,也就是怎么把这个流程做到最稳定、最可用。

另外我发现,如果让它读一些论文,因为论文动辄三四十页,它其实会“偷懒”,只读前三页。

阅读全文