求助各位佬，有没有能“静默”帮我记录深度学习实验思路、改动和结果的开源工具？

2026-04-29 09:212阅读0评论SEO资讯

内容介绍
文章标签
相关推荐

问题描述：

各位佬，我自己做深度学习实验（炼丹），有个需求一直特别头疼：实验太多，细节太杂，事后根本想不起来“当时为什么这么改”、“改了啥”、“跑出来啥结果”。

我理想中的工具是：

自动/静默记录 ，不需要我一边跑实验一边手动写文档；
能记下每次实验的思路动机 （为什么做这个实验）、具体改动 （参数、结构、数据处理等）和最终结果 ；
最好有 AI 参与 ，比如能自动根据代码 diff 生成一段“实验改动说明”，或者对比上次实验指标自动总结一句“验证集涨了1.5%但训练时间多了20%”这种；
开源（之前在抖音刷到一个类似项目，但不开源，而且看实战跟我想的也不太一样）。

我现在知道像 MLflow、W&B 这种能自动记参数和指标，但它们不负责“理解”我的实验思路。
有没有什么现成的、能把 Git diff + 训练日志 + LLM 自动总结 结合起来的开源轮子？或者大家有没有同样的痛点，怎么解决的？
没现成的话，这种需求值得自己造一个吗？

求推荐项目/思路，一起讨论也行。

下面这个图是抖音刷到的那个项目：
image1346×1831 147 KB

网友解答：

--【壹】--：

我现在的实验记录包括起实验、拿结果、分析，都已经全权让 codex 老师帮我了，我一直相信的原则是 all in one 简洁统一的强大模型，会比那些更复杂的系统更优雅，更稳定

--【贰】--：

当然不排除，如果我从盈利的角度，我可能会做个类似你最开始发帖提到的 note 类似的产品，但是如果是我自己用，我会更偏向于直接用 codex，让他做好实验记录，写好实验线，将你自己想要的东西，沉淀为一个 skill，这样更适用于你

--【叁】--：

话说如果找到有趣的方案欢迎分享哇我也想学习一下先读厚再读薄

--【肆】--：

感谢佬，这种方案之前没试过，学到了。感谢感谢！

--【伍】--：

我一般项目目录下放个记忆文件夹，每次git commit的时候根据diff自动更新这次提交做了些啥，决策的原因是啥。

--【陆】--：

可以使用cc,codex等的hook
例如你固定几个训练的bash命令,命中后就直接添加一段提示,要求进行记录.
这样的不难实现的,让ai自己去实现这个hook.
还有一种比较花费多的,就是hook中用llm识别是否是训练的命令,然后提醒.(这个成本也不是很高,例如longcat,modelscope白嫖一下差不多的模型就可以实现.)

也可以考虑hydra(好像是),trackio等py库,可以和上面结合者,也可以单独使用.
但是我自己调试的不是特别好.

最佳的方法我觉得还是直接hook强制约束.这对于实验来说算是很推荐的,毕竟入口函数一般比较固定,所以hook的命中比较好做.

--【柒】--：

明白了，就是全权交给 Claude 自己维护，连记忆文件都自动更新，学到了，感谢分享

--【捌】--：

佬的这个思路很好啊，想请教一下，你那个记忆文件是每次 commit 前手动写，还是写了脚本根据 diff 自动生成条目？我现在想搞的是：训练的时候自动抓 git diff + 超参 + 指标，跑完让 LLM 自动生成一条“本实验思路/改动说明”并写回日志。如果你那套已经是半自动的，脚本或者提示词方面有什么经验可以分享一下吗？

--【玖】--：

佬说的有道理，先读厚再读薄，之后如果有好用的方案，会分享的

--【拾】--：

你是否在找 “科研龙虾” 科研 agent 智能体，I 自动搜集论文数据，实验数据记录，反思总结

--【拾壹】--：

我也是写在 codex 里面的，让他做每一次修改都做一套留痕文档。后续直接让另外一个模型进行总结就行。

--【拾贰】--：

我也想要这种开源工具，佬们，同求同求同求

--【拾叁】--：

我是写在AGENTS.md文档里了，要求ai在每次进行完测试之后，将测试结果重定向到指定的目录下，然后将其与之前的结果进行分析对比，并将有价值的信息记录到MEMORY.md文档里，可以要求同时记录下时间和commit hash，便于之后跟踪和分析结果

--【拾肆】--：

蹲个结果，用ai后改动了啥自己也不清楚，搞得一塌糊涂

--【拾伍】--：

谢谢佬！我之前看过 Research-Claw（也就是你说的科研龙虾），它确实强，不过感觉更偏“科研全流程自动化 Agent”，从读论文到写稿都想包。
我个人目前的需求更聚焦一点——只想安静地记录每次深度学习实验的思路、改动和结果，并让 AI 帮我总结然后做一个实验思路演化树，所以还在琢磨更轻量、更靠近 MLflow / Git 组合的方案。

--【拾陆】--：

好的佬，我平时做工作项目也是 all in one 的思路，跑通之后就把可复用的功能沉淀成 skill。只不过这种感兴趣项目我当探索学习来做，希望能做得复杂些，把里面各个组件都亲手摸透。感谢佬的分享。

--【拾柒】--：

图片1807×609 110 KB
我是直接写在CLAUDE.md里面了，每次claude改完代码自己提交，自己更新记忆文件。

标签：人工智能软件开发