老潘总结的算法工程师经验有哪些?

2026-05-05 22:471阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计4617个文字,预计阅读时间需要19分钟。

老潘总结的算法工程师经验有哪些?

算法工程师老隋总结的一些经验+前期一段时间一直在优化部署模型。这几天终于迎来了需求,又要开始重新训练一些新模型了。趁着这次机会,总结一下之前的一些训练模型笔记,可能有所帮助。

算法工程师老潘总结的一些经验

前一段时间一直在优化部署模型。这几天终于来了需求,又要开始重操训练一些新模型了。趁着这次机会总结了下之前的一些训练模型的笔记,可能比较杂,抛砖引玉!当然这是不完全统计的经验,除了训练部分,还有很多部署的坑没有写。

  • 算法工程师50%的时间是和数据打交道,有时候拷贝数据(分别从多个文件夹拷贝到某一文件夹);有时候筛选数据(过滤掉一些质量不好的数据);有时候把数据换个名字、加个前缀(为了后续训练的时候区分数据的特性,比如多尺度、多种图像增强策略)等等,这些工作可能一个月要重复n多次,因此最好总结起来;可以用Python或者shell脚本来处理,或者用jupyter notebook存自己常用的文件处理代码。

  • 如果你不清楚拿到数据的来源和可靠度,可以先用 find ./ -size -1k -exec rm {} \ 等命令简单过滤一下,刚才这个命令是扫描1k(或者其他值)以下的损坏图像并删除掉,当然也可以设置其他的参数。很多时候给你的图不一定都是正常的图,最好提前筛一遍,要不然后续处理很麻烦

  • 并不所有的数据都已经有标注信息,如果收集了一批数据要拿去标注,正好公司也有标注人力,可以尝试将这批数据打上预标框让他们再去调整或者补充标框,这样效率更高些。

阅读全文

本文共计4617个文字,预计阅读时间需要19分钟。

老潘总结的算法工程师经验有哪些?

算法工程师老隋总结的一些经验+前期一段时间一直在优化部署模型。这几天终于迎来了需求,又要开始重新训练一些新模型了。趁着这次机会,总结一下之前的一些训练模型笔记,可能有所帮助。

算法工程师老潘总结的一些经验

前一段时间一直在优化部署模型。这几天终于来了需求,又要开始重操训练一些新模型了。趁着这次机会总结了下之前的一些训练模型的笔记,可能比较杂,抛砖引玉!当然这是不完全统计的经验,除了训练部分,还有很多部署的坑没有写。

  • 算法工程师50%的时间是和数据打交道,有时候拷贝数据(分别从多个文件夹拷贝到某一文件夹);有时候筛选数据(过滤掉一些质量不好的数据);有时候把数据换个名字、加个前缀(为了后续训练的时候区分数据的特性,比如多尺度、多种图像增强策略)等等,这些工作可能一个月要重复n多次,因此最好总结起来;可以用Python或者shell脚本来处理,或者用jupyter notebook存自己常用的文件处理代码。

  • 如果你不清楚拿到数据的来源和可靠度,可以先用 find ./ -size -1k -exec rm {} \ 等命令简单过滤一下,刚才这个命令是扫描1k(或者其他值)以下的损坏图像并删除掉,当然也可以设置其他的参数。很多时候给你的图不一定都是正常的图,最好提前筛一遍,要不然后续处理很麻烦

  • 并不所有的数据都已经有标注信息,如果收集了一批数据要拿去标注,正好公司也有标注人力,可以尝试将这批数据打上预标框让他们再去调整或者补充标框,这样效率更高些。

阅读全文