人工智能堪称今年最红火的风口。无数人告诉你投资人工智能,却没有告诉你方法。真正的认知从这篇文章开始吧~
我们这个时代最重要的通用技术是人工智能,特别是机器学习技术(ML)――机器不需要人类对所担负任务作出明确指令,有能力自主提升表现。
为什么这件事意义重大呢?原因有两个。首先,人类所知胜于其所能言:我们无法准确说明很多任务的操作过程,从人脸识别到亚洲传统策略游戏围棋。在开发ML之前,我们还不能清楚解释自身所具备的知识,所以多项任务都不能实现自动化。但现在我们有能力了。
其次,ML系统往往是出色的学生,在多种活动中都有超越人类表现,比如侦查欺诈交易和监测疾病。“优秀”的数字ML系统在经济的层层面面中都得到应用,未来影响不可小觑。
人工智能(AI)将在商业领域中产生巨大影响,在极大程度上扩大早前多个通用技术的应用规模。虽然现在全球数千家公司已经在应用人工智能,但绝大多数重要机会尚未发掘。现在,瓶颈出现在管理、执行和商业想象力方面。
然而AI像很多新技术一样,也让人们产生多种不切实际的期望。我们看到不少商业计划书随随便便提到机器学习、神经网络和其他技术,但和这些技术的实际能力并没有多大关联。比如,仅仅称一个约会网站“受AI驱动”,该网站不会因此变得更有效(但可能获得筹款)。本文求真务实,旨在描述AI的真正潜力、实际应用和阻碍其应用的障碍。
如今的AI能做什么?
AI最大的进步出现在以下两大领域:感知和认知。
前一类别中出现的一些重大实践进展与说话有关。虽然语音识别仍有很大改善空间,但数百万人都在使用该功能,相关应用比如Siri、Alexa和谷歌助手。你正在读的文字最开始是口述给计算机,然后计算机提供足够准确的速记稿,比打字速度更快。斯坦福计算机科学家刘哲明(James Landay)及同事发现,语音识别现在比手机打字平均大约快3倍。误差率也从之前的8.5%下降到4.9%。令人震惊的是,这一显著改进在过去10年中都没有出现,仅仅在2016年夏才有突破。
图像识别也有显著提升。你可能已经注意到,Facebook和其他应用软件如今能认出你所上传照片中很多朋友的脸,并提示你标出他们的名字。你的智能手机上运行的应用软件几乎可以识别出野外所有的鸟类。图像识别甚至取代了公司总部的身份证件。大型数据库ImageNet识别数百万张普通、模糊或离奇的图像,最优系统的误差率在2010年为30%多,2016年时降到了约4%。
第二类重大突破是认知和问题解决能力的提升。机器已经打败了最优秀的人类扑克牌和围棋选手,虽然专家曾预言这一成就起码还要再等上10年才能实现。谷歌的DeepMind团队利用ML系统,在人类专家对系统的优化基础之上,将数据中心的冷却效率进一步提高15%以上。网络安全公司Deep Instinct和PayPal分别利用智能代理检测恶意代码和防止洗钱。搭载IBM技术的系统将新加坡某保险公司的索赔流程自动化。多家公司都利用ML决定执行华尔街的哪项交易,更多信贷决策都会借助于ML。
机器学习系统不仅正在取代多个应用软件中的传统算法,还在很多人类曾经最擅长的任务中有更优秀的表现。虽然这些系统还远远谈不上完美,但在ImageNet数据库中5%的误差率已经和人类的表现持平,甚至更优异。即使在喧闹环境中,语音识别现也能和人类有近乎持平的表现。系统到达这一水平后,就会为工作场所和经济改革开启无数新的可能性。
一旦基于AI的系统在某项任务中超越人类,就有很大可能迅速得到大规模应用。比如制造无人机的Aptonomy和制造机器人的Sanbot正使用升级后的视觉系统,将多数安保工作自动化。软件公司Affectiva正用这些系统识别焦点小组中快乐、惊讶和生气等情绪。深度学习初创公司Enlitic使用视觉系统扫描医学图像,辅助癌症诊断。
以上都是AI系统的杰出成就,但其应用领域依然有限。比如,这些系统在ImageNet数据库上表现出色,能识别出上百万张图像,但并不代表它们“在自然环境下”也能有同样优秀的表现,因为照明条件、角度、图片清晰度和背景可能非常不同。
我们会很自然地认为,在某项任务中表现良好的人也会在相关任务中展现同等实力。但ML系统只得到特定任务的培训,还不能举一反三。人们错误地以为,计算机能够不断扩展自己相对狭隘的知识面――这可能是他们现在困惑不已的原因,也是他们夸大AI进步程度的根本原因。现在的机器还远远不能在多个领域中表现出通才。
了解机器学习
我们最应该了解ML的一点是,ML代表与传统方法截然不同的软件制作方式:“机器从实例中学习,而非针对某个目标,提前设定好编程。”
在过去50年中,信息技术的进步和应用主要是将既有知识和程序编成代码并录入机器。实际上,“编程”这个词指的就是程序员费尽心思,将脑中知识转化成机器可以理解和执行形式的过程。这种方式有个致命缺点:我们具备的多数知识都是不可言喻的,也就是说我们无法解释清楚这些知识的内容和获取方式。我们总结不出学习骑自行车,或识别朋友脸部特征的方式,也不可能写下来给其他人做借鉴。
换句话说,人类所知远胜于其所能言传。哲学家兼博学家迈克尔・波拉尼(Michael Polanyi)于1964年首次阐释了这一重要课题,被后世称为波拉尼悖论(Polanyi’s Paradox)。该理念不仅界定了我们能够阐释的知识,还在历史上首次严格限制了我们赋予机器智能的能力。波拉尼悖论在很长时间内限制了机器在经济领域中的工作范围。机器学习正在突破这些局限。
机器学习的不同形式
监督学习系统
人工智能和机器学习的形式多种多样,但近年来多数成功案例都属于同一类别:监督学习系统(supervised learning systems),即机器会得到大量有正确答案的实例,并利用实例解决特定问题。该流程一般是把一组输入信息映射到输出组中。
成功的系统往往会用到包含数千甚至数百万实例的训练数据组,每个数据组都被标记出正确答案。系统接下来可随意查看新实例。如果培训进行顺利,系统就可以预测答案,而且正确率会很高。
深度学习算法
带来以上成就的算法倚赖所谓的“深度学习”方法。深度学习使用神经网络,其算法可以高效利用大型数据组,和早期的ML算法相比有很大优势。随着训练数据中实例的增加,传统系统也会升级,但提升程度有限,之后即使数据增长,预测准确率也不会提高。该领域顶尖专家吴恩达(Andrew Ng)表示,深度神经网络不会陷入这类瓶颈期,相反,数据越多,它们的预测越精确。
如果你手上有海量行为数据并想要预测结果,就极有可能要用到监督学习系统。亚马逊消费者业务主管杰夫・威尔克(Jeff Wilke)称,监督学习系统在很大程度上已经取代了基于记忆的滤波算法,后者曾用于确定个性化客户推荐。
增强学习算法
这一领域中另一不断增长的小板块是“增强学习”(reinforcement learning)。会玩雅达利视频游戏和围棋等棋类游戏的系统就使用“增强学习”方法。该方法还有助于优化数据中心的电力使用,协助制定股市的交易策略。
如果人类规定好目标,系统就能顺利执行任务;但若没有目标,系统就不知道怎么做了。比如微软使用增强学习挑选MSN网站新闻报道的标题。微软会“奖赏”得分最高,即吸引最多访客点击链接的系统。系统试图按照设计者给它的规则,尽可能得到最多分。这说明增强学习系统可以高效完成明确的目标,但未必能实现你真正关心的目标,比如顾客终身价值。所以你必须明确规定好你的目标。
应用机器学习
现在寻求应用ML的组织有三大利好消息:
1、AI技能普及迅速
从世界范围看,数据科学家和机器学习专家的人数还远远不够,但在线教育资源和大学可以满足对这类人才的需求。Udacity、Coursera、fast.ai等在线培训佼佼者不仅教授入门级概念,还能教聪慧好学的学生创建工业级ML系统。对ML感兴趣的公司除了培训自己的员工外,还可以利用Upwork、Topcoder、Kaggle等在线人才平台寻找有专业证书的ML专家。
2、根据所需可购买或租赁AI必需的算法和硬件
谷歌、亚马逊、微软、赛富时(Salesforce)等公司通过云端搭建强大的ML基础架构。现在这几家公司之间的刀光剑影,意味着未来冀图使用或创建ML的公司将看到更多廉价ML能力出现在市场中。
3、你也许不需要太多数据,就可以有效利用ML
最后一条好消息可能得到的重视程度最低。多数机器学习系统的表现随着所得数据的增多而提升,所以我们似乎有足够理由认为,拥有最多数据的公司是赢家。如果“赢家”意味着“在某一项应用上称霸全球市场,比如广告投放或语音识别应用霸主”,这个结论可能成立。但若成功的定义是将公司表现显著提升,那么获取足够数据的目标就显得微不足道了。
比如Udacity联合创始人塞巴斯蒂安・特龙(Sebastian Thrun)观察到,他手下一些销售人员回复聊天室查询问题的效率比其他人高。特龙和研究生宰德・伊纳姆(Zayd Enam)意识到,他们的聊天室日志本质上是一组带标签的训练数据,而且正是监督学习系统需要的数据。达成交易的互动被标记为成功,其他则都被标记为失败。宰德利用数据预测,优秀销售人员在回复某常见查询问题时会给出哪些回答,然后将预测结果分享给其他销售人员,鼓励他们提升表现。销售人员经过1000个训练周期,整体效率提高54%,而且每次服务的客户人数翻倍。
“机器学习正从三个层面上驱动改革:任务和职业层面、商业流程层面和商业模式层面。”
任务和职业层面改革的案例是,机器视觉系统被用来确定潜在癌细胞,放射科医生从此有更多时间研究真正紧急的病例、与病人交流、和其他医生协作。
另一个流程改革例子是,亚马逊运营中心引入机器人,优化基于机器学习的算法后,其工作流和布局彻底改变。
我们须反思商业模式,利用ML系统为客户提供个性化的音乐或电影智能推荐。更好的模式不是基于消费者选择售卖固定歌曲,而是收取个性化电台的会员费。这类电台预测并播放会员喜爱的音乐,即便他本人可能从来没有听过这些歌。
注意,机器学习系统仍不能完全取代工作、流程或商业模式。这些系统会辅助人类,这也彰显了其价值。新分工形式的最有效准则肯定不是“将所有任务都交给机器”。相反,这意味着原本需要10步才能成功完成的流程,现在其中一两步可以自动化,而人类完成其他更有价值的步骤。比如Udacity的聊天室销售支持系统没有创建负责所有聊天任务的机器人程序,其ML系统只是为人类销售人员提供提高绩效的建议。人类依旧掌控大局,但效率大大提升。相比设计能够为人类做所有事的机器,这一方式要可行性更大。新分工形式下,人类的工作效率和质量都会提升,而客户也会享受到更佳成果。
只有做好全面的创新和规划,才能将设计和执行技术、人类技能和资本资产的结合起来,设计出全新的组合并投入使用,进而满足客户需求。创新和规划是机器不太擅长的任务,也是创业家或业务经理成为ML时代最有价值社会职业的原因。
我们认为,ML强势开启新时代后,人工智能最大、最重要的机遇出现在以下两大能力的交叉处:找到待解决的问题,以及说服很多人解决该问题并就解决方案达成一致。这也是对领导力的恰当定义,而领导力的重要性在第二机器时代与日俱增。
人类和机器的分工正发生剧变。坚持当前分工形式的公司将失去越来越多竞争优势,但有的公司愿意在恰当地方应用ML,也知道如何将ML与人类能力进行有效结合――这些公司将在竞争中占有更大主动权。
虽然我们很难准确预测哪些公司会在新环境中称霸,但有一条原则明显具有普适性:最敏捷、适应力最强的公司和高管将崭露头角。能够迅速感知并抓住机会的组织将在AI的天下占领高地。所以,要想取得成功,你必须愿意实验、快速学习。
如果管理者不加大在机器学习领域的实验力度,就是不尽职的领导。虽然AI还不能在下一个10年中取代管理者,但使用AI的管理者将取代其他管理者。
埃里克・布林约尔松(Erik Brynjolfsson)、安德鲁・麦卡菲(Andrew McAfee)|文
埃里克・布林约尔松是麻省理工学院斯隆商学院“许塞尔家族”管理学教席教授兼数字商务中心院长,也是美国国家经济研究局研究员。布林约尔松著有多部书,其中包括和安德鲁・麦卡菲合著的两本书:2017年出版的《机器、平台、群众:掌控我们的数字未来》、2014年出版的《纽约时报》畅销书《第二个机器时代:先进科技时代的人类工作、进步和社会繁荣》。
安德鲁・麦卡菲是麻省理工学院首席研究科学家,麻省理工学院数字商务中心创始人之一。他研究数据技术如何改变商业、经济和社会。
刘筱薇 | 译 牛文静 | 校 李全伟 | 编辑
本文有删节,原文刊载于《哈佛商业评论》中文版2017年10月刊《人工智能概览》。