求助各位佬,有没有能“静默”帮我记录深度学习实验思路、改动和结果的开源工具?
- 内容介绍
- 文章标签
- 相关推荐
各位佬,我自己做深度学习实验(炼丹),有个需求一直特别头疼:实验太多,细节太杂,事后根本想不起来“当时为什么这么改”、“改了啥”、“跑出来啥结果”。
我理想中的工具是:
- 自动/静默记录 ,不需要我一边跑实验一边手动写文档;
- 能记下每次实验的思路动机 (为什么做这个实验)、具体改动 (参数、结构、数据处理等)和最终结果 ;
- 最好有 AI 参与 ,比如能自动根据代码 diff 生成一段“实验改动说明”,或者对比上次实验指标自动总结一句“验证集涨了1.5%但训练时间多了20%”这种;
- 开源 (之前在抖音刷到一个类似项目,但不开源,而且看实战跟我想的也不太一样)。
我现在知道像 MLflow、W&B 这种能自动记参数和指标,但它们不负责“理解”我的实验思路。
有没有什么现成的、能把 Git diff + 训练日志 + LLM 自动总结 结合起来的开源轮子?或者大家有没有同样的痛点,怎么解决的?
没现成的话,这种需求值得自己造一个吗?
求推荐项目/思路,一起讨论也行。
下面这个图是抖音刷到的那个项目:
image1346×1831 147 KB
--【壹】--:
我现在的实验记录包括起实验、拿结果、分析,都已经全权让 codex 老师帮我了,我一直相信的原则是 all in one 简洁统一的强大模型,会比那些更复杂的系统更优雅,更稳定
--【贰】--:
当然不排除,如果我从盈利的角度,我可能会做个类似你最开始发帖提到的 note 类似的产品,但是如果是我自己用,我会更偏向于直接用 codex,让他做好实验记录,写好实验线,将你自己想要的东西,沉淀为一个 skill,这样更适用于你
--【叁】--:
话说 如果找到有趣的方案 欢迎分享哇 我也想学习一下 先读厚再读薄
--【肆】--:
感谢佬,这种方案之前没试过,学到了。感谢感谢!
--【伍】--:
我一般项目目录下放个记忆文件夹,每次git commit的时候根据diff自动更新这次提交做了些啥,决策的原因是啥。
--【陆】--:
可以使用cc,codex等的hook
例如你固定几个训练的bash命令,命中后就直接添加一段提示,要求进行记录.
这样的不难实现的,让ai自己去实现这个hook.
还有一种比较花费多的,就是hook中用llm识别是否是训练的命令,然后提醒.(这个成本也不是很高,例如longcat,modelscope白嫖一下差不多的模型就可以实现.)
也可以考虑hydra(好像是),trackio等py库,可以和上面结合者,也可以单独使用.
但是我自己调试的不是特别好.
最佳的方法我觉得还是直接hook强制约束.这对于实验来说算是很推荐的,毕竟入口函数一般比较固定,所以hook的命中比较好做.
--【柒】--:
明白了,就是全权交给 Claude 自己维护,连记忆文件都自动更新,学到了,感谢分享
--【捌】--:
佬的这个思路很好啊,想请教一下,你那个记忆文件是每次 commit 前手动写,还是写了脚本根据 diff 自动生成条目?我现在想搞的是:训练的时候自动抓 git diff + 超参 + 指标,跑完让 LLM 自动生成一条“本实验思路/改动说明”并写回日志。如果你那套已经是半自动的,脚本或者提示词方面有什么经验可以分享一下吗?
--【玖】--:
佬说的有道理,先读厚再读薄,之后如果有好用的方案,会分享的
--【拾】--:
你是否在找 “科研龙虾” 科研 agent 智能体,I 自动搜集论文数据,实验数据记录,反思总结
--【拾壹】--:
我也是写在 codex 里面的,让他做每一次修改都做一套留痕文档。后续直接让另外一个模型进行总结就行。
--【拾贰】--:
我也想要这种开源工具,佬们,同求同求同求
--【拾叁】--:
我是写在AGENTS.md文档里了,要求ai在每次进行完测试之后,将测试结果重定向到指定的目录下,然后将其与之前的结果进行分析对比,并将有价值的信息记录到MEMORY.md文档里,可以要求同时记录下时间和commit hash,便于之后跟踪和分析结果
--【拾肆】--:
蹲个结果,用ai后改动了啥自己也不清楚,搞得一塌糊涂
--【拾伍】--:
谢谢佬!我之前看过 Research-Claw(也就是你说的科研龙虾),它确实强,不过感觉更偏“科研全流程自动化 Agent”,从读论文到写稿都想包。
我个人目前的需求更聚焦一点——只想安静地记录每次深度学习实验的思路、改动和结果 ,并让 AI 帮我总结然后做一个实验思路演化树,所以还在琢磨更轻量、更靠近 MLflow / Git 组合的方案。
--【拾陆】--:
好的佬,我平时做工作项目也是 all in one 的思路,跑通之后就把可复用的功能沉淀成 skill。只不过这种感兴趣项目我当探索学习来做,希望能做得复杂些,把里面各个组件都亲手摸透。感谢佬的分享。
--【拾柒】--:
图片1807×609 110 KB
我是直接写在CLAUDE.md里面了,每次claude改完代码自己提交,自己更新记忆文件。
各位佬,我自己做深度学习实验(炼丹),有个需求一直特别头疼:实验太多,细节太杂,事后根本想不起来“当时为什么这么改”、“改了啥”、“跑出来啥结果”。
我理想中的工具是:
- 自动/静默记录 ,不需要我一边跑实验一边手动写文档;
- 能记下每次实验的思路动机 (为什么做这个实验)、具体改动 (参数、结构、数据处理等)和最终结果 ;
- 最好有 AI 参与 ,比如能自动根据代码 diff 生成一段“实验改动说明”,或者对比上次实验指标自动总结一句“验证集涨了1.5%但训练时间多了20%”这种;
- 开源 (之前在抖音刷到一个类似项目,但不开源,而且看实战跟我想的也不太一样)。
我现在知道像 MLflow、W&B 这种能自动记参数和指标,但它们不负责“理解”我的实验思路。
有没有什么现成的、能把 Git diff + 训练日志 + LLM 自动总结 结合起来的开源轮子?或者大家有没有同样的痛点,怎么解决的?
没现成的话,这种需求值得自己造一个吗?
求推荐项目/思路,一起讨论也行。
下面这个图是抖音刷到的那个项目:
image1346×1831 147 KB
--【壹】--:
我现在的实验记录包括起实验、拿结果、分析,都已经全权让 codex 老师帮我了,我一直相信的原则是 all in one 简洁统一的强大模型,会比那些更复杂的系统更优雅,更稳定
--【贰】--:
当然不排除,如果我从盈利的角度,我可能会做个类似你最开始发帖提到的 note 类似的产品,但是如果是我自己用,我会更偏向于直接用 codex,让他做好实验记录,写好实验线,将你自己想要的东西,沉淀为一个 skill,这样更适用于你
--【叁】--:
话说 如果找到有趣的方案 欢迎分享哇 我也想学习一下 先读厚再读薄
--【肆】--:
感谢佬,这种方案之前没试过,学到了。感谢感谢!
--【伍】--:
我一般项目目录下放个记忆文件夹,每次git commit的时候根据diff自动更新这次提交做了些啥,决策的原因是啥。
--【陆】--:
可以使用cc,codex等的hook
例如你固定几个训练的bash命令,命中后就直接添加一段提示,要求进行记录.
这样的不难实现的,让ai自己去实现这个hook.
还有一种比较花费多的,就是hook中用llm识别是否是训练的命令,然后提醒.(这个成本也不是很高,例如longcat,modelscope白嫖一下差不多的模型就可以实现.)
也可以考虑hydra(好像是),trackio等py库,可以和上面结合者,也可以单独使用.
但是我自己调试的不是特别好.
最佳的方法我觉得还是直接hook强制约束.这对于实验来说算是很推荐的,毕竟入口函数一般比较固定,所以hook的命中比较好做.
--【柒】--:
明白了,就是全权交给 Claude 自己维护,连记忆文件都自动更新,学到了,感谢分享
--【捌】--:
佬的这个思路很好啊,想请教一下,你那个记忆文件是每次 commit 前手动写,还是写了脚本根据 diff 自动生成条目?我现在想搞的是:训练的时候自动抓 git diff + 超参 + 指标,跑完让 LLM 自动生成一条“本实验思路/改动说明”并写回日志。如果你那套已经是半自动的,脚本或者提示词方面有什么经验可以分享一下吗?
--【玖】--:
佬说的有道理,先读厚再读薄,之后如果有好用的方案,会分享的
--【拾】--:
你是否在找 “科研龙虾” 科研 agent 智能体,I 自动搜集论文数据,实验数据记录,反思总结
--【拾壹】--:
我也是写在 codex 里面的,让他做每一次修改都做一套留痕文档。后续直接让另外一个模型进行总结就行。
--【拾贰】--:
我也想要这种开源工具,佬们,同求同求同求
--【拾叁】--:
我是写在AGENTS.md文档里了,要求ai在每次进行完测试之后,将测试结果重定向到指定的目录下,然后将其与之前的结果进行分析对比,并将有价值的信息记录到MEMORY.md文档里,可以要求同时记录下时间和commit hash,便于之后跟踪和分析结果
--【拾肆】--:
蹲个结果,用ai后改动了啥自己也不清楚,搞得一塌糊涂
--【拾伍】--:
谢谢佬!我之前看过 Research-Claw(也就是你说的科研龙虾),它确实强,不过感觉更偏“科研全流程自动化 Agent”,从读论文到写稿都想包。
我个人目前的需求更聚焦一点——只想安静地记录每次深度学习实验的思路、改动和结果 ,并让 AI 帮我总结然后做一个实验思路演化树,所以还在琢磨更轻量、更靠近 MLflow / Git 组合的方案。
--【拾陆】--:
好的佬,我平时做工作项目也是 all in one 的思路,跑通之后就把可复用的功能沉淀成 skill。只不过这种感兴趣项目我当探索学习来做,希望能做得复杂些,把里面各个组件都亲手摸透。感谢佬的分享。
--【拾柒】--:
图片1807×609 110 KB
我是直接写在CLAUDE.md里面了,每次claude改完代码自己提交,自己更新记忆文件。

