Codex 我的更好的学术搭子
- 内容介绍
- 文章标签
- 相关推荐
今日早晨闲来读论文,突发奇想发现没用过codex来翻译论文(大炮打蚊子这一块)今天一试,效果果然不俗。
=======================================================
这些年的AI翻译,或者说AI论文阅读器,诸如沉浸式翻译(之前也报过雷),Aminer,moonlight等等,UI设计都很美观,但是本人体验下来实际效果不佳,一来是可用的模型并不优秀,要么就是pay 2 win。最重要的是,他们的翻译效果并不好。最常见的情况就是翻译后的只有文本,公式格式混乱,可读性差。moonlight通过在可视窗口的论文侧边栏引入翻译对照,一定程度上解决了这个问题,但是对于没有大屏幕的人来说体验还是很痛苦,而且提供的问答AI也不强力。
立足于现在L站codex公益站百家争鸣的盛况,我目前感觉最合适的就是在vscode或者其它ide中安装codex插件,实现翻译,阅读,笔记,归档一站化的体验。codex作为agent,性能优秀,搜索性能也不差,最重要的是其是目前最量大管饱的强力模型(对L站佬哥来说)。
另一方面,有了skill的加持,使得这一任务的可玩性和可拓展性潜力很广泛。你可以将翻译过程细化成翻译skill,可以用记忆skill ,搭建自己的codex记忆数据库,养成自己的外置大脑,也许未来能让他来给你提供idea,跟你一起讨论算法的具体实现,不再是代码逻辑的讨论,更涉及数学性质和可解释性的讨论。
附上正在阅读的翻译后的论文,以供参考
ICRA2022_multi_amp_zh.zip (716.9 KB)
二编,再开始使用站内大佬的Obsidian插件YOLO之后,我想这无疑是双剑合璧。
我觉得这的确是Obisidian截止到目前最好的插件,(叠甲,我不算是深度用户)
站内大佬帖子指路: 【开源自荐】YOLO——可能是目前最棒的 Obsidian AI 笔记插件?
搭配上站内各路神仙的codex公益站,我今日使用体验已经起飞。
再次鸣谢冰佬等公益站维护者以及YOLO插件作者,太感动了
网友解答:--【壹】--:
我现在是MinerU+LLM的方案,给佬提供个思路。
image482×438 35.6 KB
image551×424 25.5 KB
我在找AI读论文的Agent,现在大多在搞写论文,很少有读论文的Agent,特别是多模态能读图的Agent,不知道佬有没有好的推荐?
--【贰】--:
感谢推荐,我觉得目前最适用的还是coding领域的SOTA模型。一方面他们都适配读图能力,像gpt-5.4。对于实际的生产环境,不管是论文搭配代码仓库,或者是单独一篇论文,都很适用。需要做的只是通过编写skill类的md,来规范或者强调重点。各家的CLI现在也都配置了搜索功能,对于专有名词等等需要的人为规范我觉得已经缩小甚至不需要手动设置。且先翻译后追问本身也适合Agent。对于格式,agent得到的翻译版本只需要在规范中提示,甚至能做到调用现有环境裁切图片并按照原文位置放置,算是最短时间最大效果的一个方案了我个人觉得。
今日早晨闲来读论文,突发奇想发现没用过codex来翻译论文(大炮打蚊子这一块)今天一试,效果果然不俗。
=======================================================
这些年的AI翻译,或者说AI论文阅读器,诸如沉浸式翻译(之前也报过雷),Aminer,moonlight等等,UI设计都很美观,但是本人体验下来实际效果不佳,一来是可用的模型并不优秀,要么就是pay 2 win。最重要的是,他们的翻译效果并不好。最常见的情况就是翻译后的只有文本,公式格式混乱,可读性差。moonlight通过在可视窗口的论文侧边栏引入翻译对照,一定程度上解决了这个问题,但是对于没有大屏幕的人来说体验还是很痛苦,而且提供的问答AI也不强力。
立足于现在L站codex公益站百家争鸣的盛况,我目前感觉最合适的就是在vscode或者其它ide中安装codex插件,实现翻译,阅读,笔记,归档一站化的体验。codex作为agent,性能优秀,搜索性能也不差,最重要的是其是目前最量大管饱的强力模型(对L站佬哥来说)。
另一方面,有了skill的加持,使得这一任务的可玩性和可拓展性潜力很广泛。你可以将翻译过程细化成翻译skill,可以用记忆skill ,搭建自己的codex记忆数据库,养成自己的外置大脑,也许未来能让他来给你提供idea,跟你一起讨论算法的具体实现,不再是代码逻辑的讨论,更涉及数学性质和可解释性的讨论。
附上正在阅读的翻译后的论文,以供参考
ICRA2022_multi_amp_zh.zip (716.9 KB)
二编,再开始使用站内大佬的Obsidian插件YOLO之后,我想这无疑是双剑合璧。
我觉得这的确是Obisidian截止到目前最好的插件,(叠甲,我不算是深度用户)
站内大佬帖子指路: 【开源自荐】YOLO——可能是目前最棒的 Obsidian AI 笔记插件?
搭配上站内各路神仙的codex公益站,我今日使用体验已经起飞。
再次鸣谢冰佬等公益站维护者以及YOLO插件作者,太感动了
网友解答:--【壹】--:
我现在是MinerU+LLM的方案,给佬提供个思路。
image482×438 35.6 KB
image551×424 25.5 KB
我在找AI读论文的Agent,现在大多在搞写论文,很少有读论文的Agent,特别是多模态能读图的Agent,不知道佬有没有好的推荐?
--【贰】--:
感谢推荐,我觉得目前最适用的还是coding领域的SOTA模型。一方面他们都适配读图能力,像gpt-5.4。对于实际的生产环境,不管是论文搭配代码仓库,或者是单独一篇论文,都很适用。需要做的只是通过编写skill类的md,来规范或者强调重点。各家的CLI现在也都配置了搜索功能,对于专有名词等等需要的人为规范我觉得已经缩小甚至不需要手动设置。且先翻译后追问本身也适合Agent。对于格式,agent得到的翻译版本只需要在规范中提示,甚至能做到调用现有环境裁切图片并按照原文位置放置,算是最短时间最大效果的一个方案了我个人觉得。

