继续发明,加快生长!这是我参加「日新方案 10 月更文挑战」的第20天,点击检查活动概况

导读

运用数学,代码和数据来揭示大自然的隐秘。

自学成才的机器学习工程师十诫

写代码可能会让人变得有点沮丧,需求让自己的周围充满颜色

自律和自学这两个词不能漫不经心。一个人有必要对自己的教育和启蒙担任。假如你疏忽它,他人就会为你做选择。

1. 数学,代码和数据是你最重要的三大项

任何有用的机器学习管道都是数学、代码和数据的交叉。每一项只有和另一项在一起时才会有用果。

假如你的数据质量很差,那么不管你的数学核算多么优雅或代码多么高效都没用。

假如你的数据质量最高,但你的数学核算错误,那么你的成果可能会不是很好,甚至会更糟,形成伤害。

假如你的数据和数学都是国际级的,可是你的代码功率很低,那么你将无法取得扩展带来的好处。

数据为你供给了一个包括自然瑰宝的采矿地点。数学便是你的鹤嘴锄。代码能够让你树立一支挥舞着鹤嘴锄的机器人队伍。

自学成才的机器学习工程师十诫

这三大项是你体系的输入(你拥有的)和输出(你想要的)之间的桥梁。

注:三大项中的数学分支也包括计算和概率。

2. 三大项之外的仅有例外

除了不能平衡这三大项之外,还有一个更大的罪过:忘掉这三大项是为谁服务的。即使是履行得最好、由最优雅的数学驱动的代码,假如不能为客户供给服务,从最丰厚的数据中取得洞察也毫无意义。

工程师常常会发现自己迷失在一个进程中,忘掉了开端想要的成果。尽管他们怀着良好的意图进行,但他们忘掉了,意图并不像行动那么重要。

三大项至少要为客户供给点好处,总比什么都不供给要好。

需求弄清的是,假如你的先进模型需求47倍的时刻才干进步1%的准确率,那么它是否供给了最好的体验?

3. 不要被三大项给骗了

不管你多么崇拜这三大项,你都不应该被你的爱蒙蔽。自学成才的机器学习工程师是他们自己的最大的置疑者。

他们知道,数据不能进行证明,只能进行辩驳(只要在十亿数据中有一个数据点就能证明之前的概念是错误的),一点点糟糕的数学运算就会产生极端的成果(自然不是线性的),代码的功率只有在它最单薄的当地才有。

不管三大项多么崇高,直觉也不应被忽视。假如一个成果好得令人难以置信,除非你很走运,否则它很可能便是错的。

4. 和你需求供给服务的客户保持好联系

让机器做它们拿手的工作(重复重复进程)。让你去做你拿手的工作时(关怀、设身处地、提问、倾听、领导、教育)。

你的客户不像你那样关怀三大项。他们关怀他们的需求是否得到满意。

5. 向那些为你奠定根底的人问候

当你想到核算机、机器学习、人工智能、数学等范畴时,你会想到谁的姓名?

Ada Lovelace,Geoffrey Hinton,Yann LeCun,Yoshua Bengio,Alan Turing,Fei Fei Li,Grace Hopper,Andrew Ng,Jon Von Neumann,Alan Kay,Stuart Russel,Peter Norvig?

当然,在你听到或记住的一切姓名中,有1000个姓名功不可没,但却从前史书中消失了。

后起之秀应该认可长辈们做出的巨大尽力,但也应该认可他们中的每一个人都会告诉这位新晋的机器学习工程师同样的工作:这个范畴的未来取决于你的工作。

6. 不要轻视了彻底重写的力气

你的方针应该是在第一时刻构建牢靠的东西。但随着技术的进步,你可能会想重构之前的著作,拆掉它们,用新的视角从头发明它们。

自学成才的机器学习工程师都理解,就像大自然一样,软件和机器学习项目永久不会完成,它们一向在运动。数据改变,代码在新的硬件上履行,一个天才发现了一个核算高效,低内存依赖的优化器适合,并称之为Adam。

你不只应该对这些改变持开放态度,还应该欢迎它们。一旦它们出现,请运用你最好的判断力来判断它们是否值得实现到你的体系中 —— 只是由于有些东西是新的,并不意味着它是必需的。

7. 防止在东西上滥情

在编程界,一个常见的轶事是粉刷自行车棚。它说的是一个程序员,或许一组程序员,担心的是车棚应该是什么颜色,而不是问一些重要的问题,比如车棚是否真的能够存放自行车。

当然,这个自行车棚也能够用电脑程序来替代。

在机器学习的国际里,你会听到关于R仍是PythonTensorFlow仍是PyTorch、书籍仍是课程、数学仍是code first(两者都有,记得这三位一体吧)、Spark仍是Hadoop、Amazon Web Services仍是谷歌云渠道、VSCode仍是Jupyter、Nvidia仍是……的无休止的争论。

一切的比较都是有用的,但没有一个值得与对方争论。

你应该答复的真正问题是:用什么能够让我以最快、最牢靠的方法树立我的主意?

一旦你问自己这个问题,你会发现其他人都在问自己同样的问题。

工程师的咒骂是从东西开端,然后寻觅问题,而不是从问题开端,然后寻觅东西,只有到了那个时分,假如没有适宜的东西,才应该去构建它。

学习资源也是如此。数学、代码和数据的三大项,在你学习它的时分便是不变的,仅有重要的是你如何运用它。

不要忘掉:许多问题能够在没有机器学习的情况下处理。

8. 你的主意是商品

不要把一个履行好主意的人与盗取你主意的人混为一谈。你的主意在他人手中比在你的头脑中更有价值。

作为一名工程师,你的角色不只是树立自己的主意,而且还要与他人交流,向他们展示如何从这些主意中获益。假如你缺乏这样的交流才能,你应该与有这种才能的人协作,或许寻求培育这种才能。

在一个没人知道该相信什么的国际里,你能够通过做实在的自己来区别自己。诚实面临你做的东西所能供给的和你所不知道的。能够供认自己的无知是一种优势,而不是缺点。

好的技术总是成功的,说谎永久不会成功。构建技术。不要说谎。

9. 你的邻居、同事、同学和同伴也在思考这个问题

你看到他人的进步而妒忌吗?或许你把它看作是你能做到的工作的动力?

你对他人的成功的感觉便是你自己成功时分的感觉。

10. 不能贪

你应该寻求树立你运用三大项的技术,答复那些你想要供给服务的人的问题,但你不应该带着愿望这样做。愿望会咒骂你,让你永久过于严厉地看待未来,而不是享用你现在所拥有的。

对进步技术的巴望的治疗方法是培育对学习的酷爱。

自学成才的机器学习工程师能够很快地学习使用数学、代码和数据力气所需的概念,但不能匆忙行事。他们理解学习任何有价值的技术都需求时刻,假如是这样的话,还不如享用这个进程。

从一开端,你便是对自己的启蒙和教育担任的人。知道了这一点,你就应该选择那些不管你有什么样的运气都能成功的项目。这个项目是否满意了你的好奇心?它是否对你的技术构成挑战?它能够让你遵守这些戒律吗?假如是这样,就足够了。

最后,在沿着自己的路途行进的一起,自学成才的机器学习工程师在他们的脑海中一向保持着这样的形象:

  • 没有常识就没有资质
  • 没有行动就没有思维
  • 没有享用就没有学习
  • 没有风格就没有发明
  • 没有实践就没有技巧
  • 没有东西就没有意图
  • 没有展示没有交易
  • 没有置疑就没有假定
  • 没有奉献就没有消费
  • 没有对现在的爱,就没有对未来的巴望
  • 最重要的是,没有三大项就没有机器学习

英文原文:towardsdatascience.com/the-10-comm…