我帮助初学者开始机器学习。但一次又一次地在心态和行动上看到同样的错误。
在这篇文章中,您将发现我认为初学者在开始机器学习时出现失误的 5 种最常见方式。
我坚信,任何人都可以开始,使用应用机器学习并做得很好。希望您能在下面的一个或多个陷阱中认出自己,并采取一些纠正措施以重回正轨。

传统的机器学习教学方法是自下而上的。
努力学习数学背景。
努力学习机器学习的理论。
努力从头开始实现算法。
迷茫阶段。
最后开始使用机器学习(你的目标!)。
这种方法很慢而且很难(专为想要扩展最新技术的学者而设计,不是为想要结果的从业者设计的)
陷阱
如果您想或说出以下内容,您就知道自己陷入了这个陷阱:
我需要先完成这门线性代数课程。
我需要回去攻读博士学位。第一的。
我必须先阅读这本教科书。
建议
学习 4 年的数学或深奥的算法理论如何让你到达你想要的目标?你更有可能停下来,失败。
解决方法是翻转模型。
如果机器学习对市场的宝贵贡献是一组准确的预测,那么学习如何对问题建模并做出准确的预测。从这里开始。
然后真的擅长运用它。
如果需要,请阅读、窃取、利用理论,但仅限于为您的目标服务。只有当它让你更好地交付价值时。
机器学习是一个非常大的研究领域。
它是计算机学习过程的自动化,与人工智能有很深的重叠。
从深奥的学习理论到机器人技术。该领域是巨大的。
这个领域太大了,你无法承担所有。
如果您有以下想法,您就知道自己已经屈服于这个陷阱:
我需要了解新网站上提到的每一项新技术。
我需要先学习计算机视觉、自然语言处理、语音等。
我需要知道一切。
选择一个小角落并专注于它。然后再次缩小范围。
机器学习最有价值的领域是预测建模。从数据创建模型以进行预测。
接下来,专注于一种与您最相关或最有趣的预测建模。
然后坚持下去。
也许你是通过技术来选择的,比如深度学习。或者您可以按问题类型进行选择,例如推荐系统。
也许你不确定,所以随便选一个。变得优秀或至少精通。
然后,稍后,绕回另一个区域。
机器学习实际上是关于算法的。
有很多算法。每个算法都是一个复杂的系统,它有自己的小研究领域。它有自己的生态系统。
迷失在算法中的人称之为学者,这个并不是大众的目标。
如果您发现自己说:
在我使用它之前,我需要知道它为什么有效。
我需要先深入了解超参数。
我需要在调整时解释原因和结果。
算法不是结果。它们是达到结果的手段。
事实上,机器学习算法是一种商品。
把它们换掉。针对你的问题尝试大量的方法。对它们进行一些调整,但继续前进。
您可以了解有关算法的更多信息以获得更好的结果,但要知道何时停止。
使用系统的过程。设计调优实验并自动执行和分析。
机器学习是关于算法的良好使用,但应用机器学习不仅仅是摆弄算法。
专注于从每个项目交付结果的目标,即一组预测或可以实现它们的模型。
您可以从从头开始实现算法中学到很多东西。
有时您甚至需要实现一种技术,因为没有合适或可用的实现。
但是,通常情况下,您不必也不应该这样做。
如果出现以下情况,您就会陷入这个陷阱:
您正在编写代码来加载 csv 文件(到底是什么!?)
您正在为线性回归等标准算法编写代码。
您正在编写用于交叉验证或超参数调整的代码。
停下来。
使用由数以万计或数十万其他开发人员使用的通用库,该库处理所有边缘情况并且已知是正确的。 使用高度优化的库,从硬件中压缩每个最后一个周期和每个最后一个字节的内存。 为您自己的项目使用图形用户界面,并完全避免代码。 每次你想使用它时都实现它是机器学习入门的一种非常缓慢的方式。
如果您是为了学习而实施,那么对自己诚实,并将其与学习如何通过应用机器学习交付价值分开。
有很多很棒的机器学习工具。
事实上,出色的工具、数据可用性和快速的硬件是我们看到机器学习复兴的原因。
但是,您可能会陷入跳到偶然发现的每个新工具的陷阱。
如果你发现自己,你就陷入了这个陷阱:
使用您听说的每个新工具。
发现自己每周或每月都在学习一种新工具或语言。
学习一个图书馆并把它抛在后面去一个新的图书馆。
学习和使用新工具。
但要有战略眼光。
将新工具集成到您解决机器学习问题的系统流程中。
如果您选择大型主要平台之一并坚持使用它,您在解决问题时会更有效率,至少直到您熟练或精通它为止。
还有其他工具,如果这是您所在的领域,还有更多专业工具。
跟随别人的脚步是业余爱好者和专业人士之间的区别。
#机器学习##数据分析##人工智能##工作方法#