原文:
www.kdnuggets.com/2018/02/machine-learning-algorithm-2118.html
那么你脑海中闪现的答案是什么?随机森林、支持向量机、K 均值、K 最近邻,还是深度学习及其变体?
现在你们中的一些人可能会笑,说你怎么可能预测得这么远,预测 100 年后的事情简直疯狂。
是什么让你说回归将继续在 2118 年使用?
那么答案是林迪效应。是的,我用来预测的启发式方法就是林迪效应。
好的,下一个逻辑问题是什么是林迪效应?
林迪效应
维基百科将林迪效应定义为
林迪效应是一个概念,指的是一些非易腐物品(如技术或想法)的未来预期寿命与其当前年龄成正比,因此每一个额外的存活期都意味着更长的剩余寿命。
我最喜欢的作者之一纳西姆·尼古拉斯·塔勒布在他著名的书《反脆弱:从混乱中受益的事物》中定义了林迪效应如下。
如果一本书已经出版了四十年,我可以期望它再出版四十年。但是,主要的不同在于,如果它再存活一个十年,那么它将被期望再出版五十年。简而言之,这个规则告诉你为什么那些存在了很长时间的东西不像人一样“衰老”,而是“逆向衰老”。每经过一年没有灭绝,额外的寿命就会翻倍。这是一些坚韧性的指标。一个物品的坚韧性与其寿命成正比!
他关于林迪效应的文章‘一个叫林迪的专家’是一个极力推荐的阅读。
那么回归为什么会存活这么久?
好吧,因为它已经存活了这么久。 回归(最小二乘法)作为一个概念最早由卡尔·弗里德里希·高斯和阿德里安-玛丽·勒让德在 19 世纪发明。他们用它来确定行星及其他天体绕太阳的轨道。
“回归”一词由弗朗西斯·高尔顿创造,用来描述一个观察结果:较高的父亲往往有相对较矮的儿子,而较矮的父亲则往往有相对较高的儿子!!
好吧,很明显,回归分析已经存在超过 200 年了!!因此,根据 Lindy 效应启发式,它将再持续 200 年。因此,我可能有点保守地说,回归分析将在 2118 年继续使用。
回归分析长寿的秘密是什么?
一个相关的例子是 2016 年的Kdnuggets 调查报告
实际上,在 2011 年 kdnuggets 进行的另一项调查中,回归分析紧随其后。因此,根据 Lindy 效应,它在过去 5 年中变得‘更加永恒’了!!
(更新:在撰写本文时,我不知道还有2017 年调查。2017 年的调查中,回归分析仍然位居榜首)
回归分析仍然是广泛使用的机器学习算法。人们使用回归分析或继续使用回归分析是因为
它很简单
高度可解释(即使是Dilbert的老板也能理解 :P)
它有效
‘它有效’部分
各个领域的人们继续使用回归分析,因为它对他们有效。使用回归分析带来的投资回报率是明确的。例如,在市场营销中,市场混合建模的驱动力是回归分析。它仍然是一种流行的技术,许多快消品公司相信 MMM 的输出。其他领域也是如此。如果回归分析在提供结果方面无用,它早已消失。它仍然被工业界和学术界使用,因为‘它有效’。
神经网络及其变体怎么样?它们会在 2118 年被使用吗?
目前,Lindy 效应对神经网络或称为 AI 并不友好。它已经经历了AI 冬天。20 世纪的‘AI 冬天’阻碍了神经网络及其变体的长寿。这种中断对技术或算法的长寿而言并不是一个好兆头。
但另一方面,过去十年中 AI 相关的进展不断增强。作为一个永远的学生,我仍然对最新的 AI 突破感到着迷。因此,一个安全的预测是,我们可能会看到神经网络及其变体再持续 10-20 年,希望‘奇点’的恐惧不会造成另一个 AI 冬天。
什么可以减轻机器学习算法的 Lindy 效应?
机器学习的过度使用:是的,Lindy 效应将因为机器学习算法的错误应用和过度使用而减弱。我遇到过一些情况,人们使用了机器学习算法,而一个简单的常识性基线方法本可以奏效。拉玛·拉姆克里希南在他的文章中很好地捕捉了这一精髓。
最近数据科学被称为最性感工作的潮流也没有帮助。机器学习算法已经变成了数据科学家手中的锤子。一切看起来都像是需要敲打的钉子。在这个过程中,机器学习的错误应用或过度使用将会导致人们失望,因为它没有带来预期的价值。这将是自我造成的“AI 冬季”。
但就目前而言,回归分析将会有最后的笑声,也许在 2118 年依然如此。
你可以通过以下方式联系我
原文。经许可转载。
相关
1. Google 网络安全证书 - 快速开启网络安全职业之路。
2. Google 数据分析专业证书 - 提升你的数据分析技能
3. Google IT 支持专业证书 - 支持你的组织的信息技术