在台湾 AI 新创 UmboCV 实习,让我感受到真切的深度

  • 作者:
  • 时间:2020-06-27

在台湾 AI 新创 UmboCV 实习,让我感受到真切的深度

作者 / 黄意尧

在 UmboCV 实习满一年又两个星期的我,明天即将去当兵了。我在公司最后的专案做到一半还没有做完,有点遗憾,但这一年的收穫真的是太大了,让我迫不及待想把我的想法写下来,跟大家分享。

我以前在学校,学的是机器学习,到了公司我发现,我来学的是实务机器学习。这一年,我在公司经历过了四个不同的专案,分别是 Data Labeling Tool, a Slackbot for Evaluation, Object Detection, Action Recognition. 这四个专案,让我走过 machine learning 最基础的表记 data 到最后的模型实作。

以下,我会分享几点我觉得在这一年实习,学到最多的概念。希望这些概念可以帮助其他也正在做 Machine Learning 的朋友。

Machine Learning 就是个 Data Learning 的问题

到公司的第一天,大家就很强调 Data 的重要性。但这点大家都知道,所以这里我想强调的是, Data 的重要性不是指 Data 有多少,而是指你对你的 Data 了解多深 ! 收集很多 Data 不难,Lable 很多 Data 不难,但收集到重要的 Data 而且标记高品质的 Data,才是最难的。我自己做到最后,经常自己下去 Lable data,因为没有自己看过资料,是没有办法真正的深入了解你要解决的问题。这点也是在学校做研究跟在业界做研究最不一样的地方。 学校通常会拿公开的资料来做实验,但在业界,我们通常会遇到没有公开资料的问题,刚到公司时,也很常抱怨,没有 Data,但后来发现, 如果有人有跟你一样的 Data,那你这个问题就没有价值了。 所以,停止抱怨,自己收集资料、标记资料、了解资料!

要建立一个可以有效率评估模型效能的系统

如果今天,做研究的目的是会了发表论文时,我们比较的对象,通常是官方的量测标準。但如果今天,我们做研究的目的,是为了解决顾客的问题,可不能只有一个冷冰冰的数字来决定了。为了评估机器学习的系统,我们会希望建立更多不一样的量化方式,甚至我们会花费时间,来打造方便的 Demo 系统。我在实习阶段,有做一个 slackbot,使用者可以上传影片给这个 slackbot,它会回传经过我们 deep learning 服务的结果。这只是一个例子,还有很多即时评估顾客资料的方法。这些事看起来很简单,但他会大幅的加速我们对模型的理解。 建立一个有效率评估模型效能的系统,不只是为了开发者,可以更快速的理解自己在做什幺东西,更可以让其他使用者,也可以跟你一起互动,帮助你找到使用者的痛点!

Engineering 能力超级重要!

以前以为,做研究,就可以不用当一个码农。来这边实习以后,发现大错特错了!如果不具备超强的工程能力,对深深地影响做研究的能力!首先,你不会想花太多时间,在处理资料。工程能力好的话,就会使用更多有效率的工具,来帮助自己理解资料、观察资料。第二,如果工程能力不好,会没有办法实作太複杂的模型,许多先进的 Deep Learning 模型,不是呼叫 Tensorflow 或 Pytorch 的 API 就可以搞定的,往往会需要写到底层的 C 语言。第三,训练机器学习的模型,最需要的就是时间了,如果说对计算机结构、作业系统,不够了解的话,很容易开发出浪费时间的模型,在超大型 Dataset 上,也会被这些速度瓶颈,拖累开发速度。最后,在这个 AI 当红的时代,每天都有一堆超强超厉害的模型被发表,如果你写 code 比别人慢,你就等着被海量的方法淹没吧!

学习团队合作吧!你做不完事情的

如果说,你看完前 3 点,你就会发现,开发一个实务上可以使用的 Machine Learning 模式,至少需要包含资料整理、演算法研究,还有评估效能,每一步都必须要有做好的品质,才有可能开发出好的服务。一个人做不完的,团队合作特别重要。 如果有好的前端工程师, 他可以帮助我们用更轻鬆更简单的方式,理解资料。好的后端工程师,可以帮我们打造简单易懂的评估系统。好的研究员,可以帮助我们更快速的开发模型,跟理解最新的研究方向 。 这些东西,缺一不可!

在 UmboCV 实习的一年,让我体验到,开发一个 AI 系统到底有多难,也让我明白 AI 在地化,真的不是一个简单的事。这一年学到的东西真的太多了, 完全打通了大学四年,学的所有学科,知道为什幺要学数学,为什幺要学工程,为什幺要学使用者经验,为什幺要学网页 。 一个伟大的产品,必定是由好的文化跟丰富的知识组成, UmboCV 让我看到了这一切!

About AI

台湾 AI 新创盾心科技,再获 2 亿台币 A 轮融资

台湾发展 AI 慢了世界一步? AI 独角兽商汤科技执行长徐立:后发仍有优势

完整盘点 2017 年 AI 圈大小事,从语音辨识到深度学习全都包啦!