[v0.2] 科研流程 skills 更新,codexcc 再次拉磨:重构 survey-latex,上线 idea-brainstorm 与毕业论文 skills

2026-04-11 12:261阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

Preface

github.com

GitHub - WILLOSCAR/research-units-pipeline-skills: Research pipelines as semantic execution units:...

Research pipelines as semantic execution units: each skill declares inputs/outputs, acceptance criteria, and guardrails. Evidence-first methodology prevents hollow writing through structured intermediate artifacts.

[v0.1] 我把科研流程拆成了一堆 Skills,让codex/cc像打工人一样拉磨 搞七捻三
如果大家觉得有帮助,欢迎点个star支持一下。 最近在疯狂更新,帖子不一定来得及更新,以 Github 为准 Motivation 这个 project 的初衷,源于我读到的 Anthropic 的 skills 设计,对这种即插即用、可组合的范式产生了强烈兴趣,觉得在抽象层面非常优雅。由此引出了一个问题:能否像搭积木一样,通过编排 skills 来完成科研流程(好吧,我承认其实是懒癌…

蹲蹲关注和 star !!!

Motivation

回头看之前的 latex survey Pipeline,发现还有不少坑没填,整体写法和链路设计也存在一些问题,所以这次想顺手把它系统补一补、重构一下。与此同时,也想把之前零散想到但还没真正补齐的几个 Pipeline 功能一起推进,比如 idea-brainstorm 和毕业论文撰写。再加上最近出了不少新模型, vibe coding 的热情进度条叠满了,也顺便感谢各位佬友之前在帖子里提的建议,还有帮我发现的一些问题 。

image1024×559 207 KB

Changelog (省流版)

  1. 升级了 survey-latex Pipeline。之前这条链路整体更像一条比较严谨的流水线,强调分阶段推进、强 gate 控制和证据先行,整体偏工程化和兜底思路,稳定是稳定,但有些地方也会显得比较僵硬。新版主要是为了让写作过程更贴近真实场景:而是先做更广覆盖的检索,优先把 chapter / section 这一层框架实现,再逐步细化到 subsection 和段落,同时允许中间小循环持续回跳、补文献、改结构和修内容。整体来说,新版更强调写作过程中的动态收敛,而不是一条固定链路线性跑到底。(后续还会更新,还有不少提升空间)
  2. 新增了 idea-brainstorm 功能,用于辅助发散、筛选和沉淀想法,当前的形态最后是个 md(之前设计的是卡片式的),后续还需要改进
  3. 新增了面向毕业论文写作的相关 skills,用于支持中文毕业论文场景下的检索、规划、写作与迭代优化
  4. 重构了整个 project 的组织编排,精简了 README,并新增 readme 文件夹,将各项功能的介绍文档统一放到该目录下,整体说明也写得更详细了
  5. skills 数量变多了,可以按需使用

usage

  1. 部分 Pipeline(例如 survey-latex、idea-brainstorm)本身就是端到端设计的;graduate-paper 也可以按端到端方式来组织。但这个任务相对较重,需要human in the loop,中间各阶段仍然需要反复迭代,推荐先跑个大致的及格产物出来,后续按需加载 skills 反复修改
  2. example 中有例子,Pipeline 中是对应的流程
  3. 项目里面的 agents.md 可用可不用,主要用于记录流程

Method

注:比较详细的介绍可以参考readme 里面的分块功能

latex survey

旧版其实更像一条比较硬的流水线:先大范围检索、攒论文池,然后很快往下拆到更细的 H3 结构,再围绕这些小点去组织证据和写内容。这样做的好处是很工程化,流程清楚,也方便回放、审计和复现,但问题是有时候会有点太死板,写作过程不太像人真的在写 survey。新版主要就是想把这件事改得更贴近真实写作:不再一开始就急着写到很细的层级,而是先做广覆盖检索,先把 chapter / section 这一层的大框架先构建出来,再慢慢往 subsection 和段落细化;中间如果发现文献不够、结构不顺、内容有偏,也可以随时去补检索、改绑定、修大纲。整体上,新 pipeline 更强调一种动态收敛的过程,也就是边检索、边绑定、边修结构、边写内容,而不是按一条固定链路线性跑到底。

理论上,写作一开始就应该先有一个当前版本的普通大纲或目录,作为整体结构的基础。随后,围绕这个初始框架尽可能广泛地收集相关论文,并通过分档、分点或某种高效筛选策略,将文献逐步绑定到不同的 section 和 subsection 上。基于这些绑定的文献,再分别为每个 section / subsection 提炼出对应的初版写作思路和局部大纲,然后进入正式写作阶段。

在写作过程中,大纲、文献和内容本身都不应是一次定死的,而应该允许持续迭代:发现论据不够就继续补论文,发现结构不顺就继续改大纲,发现表达或逻辑有问题就继续修改内容。也就是说,整个过程本质上是“目录—文献绑定—局部大纲—正文写作—补充检索—结构修正—内容润色”的循环迭代,直到各层级内容逐步收敛并最终达成一致。

具体来说,可以先从 section 层面完成论文分配与思路整理,再继续细化到 subsection,必要时甚至到段落级别,一段一段推进。每完成一个 subsection,就先做一轮局部润色与一致性检查;等多个 subsection 拼接成完整 section 后,再对 section 做整体润色;最后再回到全文层面,反复核对内容是否与当前大纲、各级标题及文献支撑保持对齐,直到整体结构、论证逻辑和表达质量都稳定下来。

毕业论文

可以参考pipelines/graduate-paper-pipeline.md的流程去组织,有 skills 会帮助一开始初始化缺的项目内容,类似新手导引,当然最好的办法就是让 codex 大人直接扫下 skills 和 Pipeline然后手把手教学一下

简单来说:这套毕业论文的写法,不是直接在 tex 里边改边写,不是硬拼现有的论文,会先参考 graduate-paper-pipeline.md,把整篇论文当成一条围绕某个问题逐步重构的故事线来做。先用 thesis-workspace-init 之类的 skills,把缺的目录、材料索引、问题清单和中间工作文件先补齐;再把现有的模板、PDF、Overleaf 源稿、bib 和旧章节材料,对应到毕业论文各个章节里该放的位置。接下来,不是去回到 TeX 里直接修改,而是先在 Markdown 这一层把章节结构、术语表述、图表规划和证据链慢慢理顺,等主线和内容都确定没什么问题了,再统一写回到 chapters/*.tex,最后在本地装个 tex 编译,免受 overleaf 编译速度之苦,另外先在中间层把这些问题想清楚,能少掉很多直接在 TeX 层来回改造成的混乱、返工和排版上面的干扰

画图方面:overleaf源文件有图片基本可以实现无感迁移,需要重画推荐nano banana+edit banana

idea-brainstorm

idea-brainstorm 这条流程,先把用户的研究方向、限制条件和这次讨论到底想解决什么,整理成一份清楚的 brief,接着再去检索、筛选文献,把材料收敛到一个真正值得讨论的核心集合,然后基于这些文献,梳理里面的分歧、缺口和可能的切入点,再往下提出几条值得展开聊的 research directions,经过一轮轮筛选和收敛,最后整理成一份 memo。(之前的写法,本质上更接近对论文 insight 做笛卡尔积式的拼接,即把 A + B + C 这样的要素直接组合生成结果)

网友解答:
--【壹】--:

我理解自动做实验技术上可以搭建 multi-agent+workflow做到,中间还是需要人参与去验证,现有链路的误差累计比较多


--【贰】--:

牛逼牛逼真牛逼,支持


--【叁】--:

收藏备用


--【肆】--:

之前创智学院+日行迹有个 100 篇论文自动化挑战直播+最近有个 autoresearch 找个 agent 监督 gpu


--【伍】--:

除了研究过程固化,实验是不是也自动化了


--【陆】--:

来学习啦!


--【柒】--:

学习一下佬的杰作


--【捌】--:

感谢佬友分享


--【玖】--:

我在这个后面接了一些idea to paper,还有ai写论文的一些东西 可以半自动的制造似是而非的学术论文。


--【拾】--:

佬真牛!


--【拾壹】--:

研究一下


--【拾贰】--:

star了,加油啊!


--【拾叁】--:

感谢大佬!


--【拾肆】--:

最近有些比较麻烦的工程问题,学界也没找到比较好的实现,感觉用自动化论文调研建模的方式可能会轻松一点,如果能自动做实验验证那真是轻松很多