立即打开
通用人工智能,一场科技巨头们输不起的比赛

通用人工智能,一场科技巨头们输不起的比赛

Jeremy Kahn 2020-02-26
Alphabet和微软等科技巨头正在投入巨资,开发一项可能全盘重塑商业世界的技术:通用人工智能。如果研发成功,现在狭义人工智能领域里的技术会变得像石器时代的斧头一样古老。

在2019年7月,微软公司的首席执行官萨蒂亚·纳德拉与34岁的企业家萨姆·奥尔特曼拍摄了一段短片。纳德拉掌管的微软价值居全球前列,市值逾万亿美元,奥尔特曼则因为执掌硅谷卓越的新创企业加速器Y Combinator而知名。

纳德拉在LinkedIn的个人资料里发布了时长为3分钟的视频,形式很像网络节目《蕨间访谈》里的一集,该集里喜剧演员扎克·加利菲亚纳基斯故意搞怪地采访贝拉克·奥巴马和女演员查理兹·塞隆等一线嘉宾。纳德拉这一版中,黑色背景前两人坐在普通椅子里,中间放着小咖啡桌,桌上摆着两杯水和一棵小植物。52岁的纳德拉担任主持人,手拿记事本向奥尔特曼提问题。

纳德拉这版视频可不是为了搞笑,讨论的话题对两位高管来说非常重要:微软以10亿美元投资新创企业OpenAI,该公司的总部位于旧金山,目前由奥尔特曼经营。

“我们的任务是开发通用人工智能,即可以超越人类,完成很多任务的广义人工智能系统。”奥尔特曼向纳德拉解释说。“我认为这会是人类历史上最重要的技术发展。人类拥有真正能够思考和学习的计算机,具有革新意义。”

微软向OpenAI投资颇为引人瞩目,纳德拉也亮明了公司的承诺。从战略角度来看,他正式携微软加入技术军备竞赛,努力开发有可能全盘重塑商业世界的技术,对手为谷歌的母公司Alphabet和其他几家公司。竞赛的结果很可能决定20年后的微软、Alphabet等公司还会不会是全世界最有价值的公司。

纳德拉向OpenAI投资的决定也相当于承认,原本希望内部研发人工智能技术保持领先,但现在看来很难做到。微软需要迎头赶上。

“此举是为了争夺科技领域里的下一处金矿。”科技分析公司Forrester Research的一名分析师克雷格·莱克莱尔表示。他认为人工智能的潜在影响堪比电能。纳德拉的竞争对手,Alphabet的首席执行官桑达尔·皮查伊更为看重,他认为人工智能是人类有史以来最重要的项目,“比火的意义还大”。

想象一下将火的发明变现会是什么场景。再想象一下错过用火变现会有多么可惜。

狭义人工智能 vs 广义人工智能

OpenAI成立于2015年,创始人包括奥尔特曼,还有创立特斯拉的亿万富翁埃隆·马斯克。OpenAI的目标是开发通用人工智能,但该公司表示,希望可以在确保“造福全人类”的前提下开发技术。因此,OpenAI最初是非营利公司。去年公司成立了营利性部门,也正是微软投资的实体。根据投资协议,OpenAI在开发技术商业化时将选择微软为首选合作伙伴,开发通用人工智能后也会优先授权给微软。

通用人工智能的“通用”一词是为了跟普通的“狭义”人工智能区别。近年来,狭义的人工智能带来了不少突破性的技术,例如Alexa和Siri;面部识别解锁iPhone;以及Facebook上传照片时自动标记朋友。狭义人工智能系统还协助亚马逊的订单发货,安排哪家经纪公司处理你打给银行的客服电话。

不管是狭义还是广义人工智能,目前令人兴奋的突破主要是依靠算法、数据科学和计算。但两种系统在能力上大有不同,目前实际存在的只有狭义人工智能,而通用人工智能只是理论上存在的技术。

狭义人工智能通常被称为低能,只擅长某种特定的技能,比如语音识别或面部识别,而且需要成千上万的例子才能够习得。即便如此,该系统还是很有价值的,而且价值只会越来越高。麦肯锡全球研究院估计,到2030年,狭义人工智能应用将为全球经济增加约13万亿美元,从金额来看,其影响力将超过19世纪的蒸汽机。

人工智能学得越来越快

过去两年,新的算法和计算机硬件令人工智能系统的运算速度大为提高。上图红点表示在不同的时期,训练人工智能像人类一样精确识别1000个物体的照片,所需要花费多少时间。例如,在2017年10月,需要10天完成训练,而到了2019年5月,这个时间缩短到2分43秒。但在如此狭窄的领域里所取得的进展,是否可以等同于迈向通用人工智能的进步,还有待观察。

通用人工智能的价值则要高得多。通用人工智能更类似于好莱坞和科幻书里描述的场景。如果研发成功,现在狭义人工智能领域里的技术会变得像石器时代的斧头一样古老。通用人工智能可以通过一款软件,以人类或超越人类的水平学习几乎所有任务,而且掌握起来非常迅速。可能观看单个演示或仅仅通过阅读即能习得,完全不需要培训,而且可以主动完成。

想象一下,与其指派15人的工作组决定公司应该在哪里新建工厂,还不如直接询问公司的通用人工智能。系统可以立即开始研究各项因素:距离供应商和客户远近、运输环节、土地购置成本、当地劳动力市场、税收优惠等。系统能够提出建议,生成报告并解释推演过程。在几分钟内就可以完成所有的任务,不用等待数周或数月。之后如果管理层批准,系统能够立刻发布相关工作指令启动流程。

对于微软或其他开发公司来说,该系统的价值堪称巨大。对麦肯锡等收费昂贵的咨询公司来说,则可能面临生存威胁。OpenAI为最早的财务支持者回报率限制为100倍,其余资金均投向公司内部的非营利部门。(微软和OpenAI不愿意透露商定的具体上限。)当然,正如马斯克曾经警告过,超智能技术可能会像核能一样危险。

通用人工智能向来是小说家、电影制片人、哲学家和未来学家的素材。至少从20世纪50年代开始,该技术就是计算机科学分支里时而隐含、时而明确的目标,不过之前通用人工智能只是研究项目,一直没有成为商业计划,现在才正式被列入。

科技巨头已经开始投巨资开发通用人工智能。微软和Alphabet都不只赞助了一个项目,而是两家独立的研发实体,专门开发先进的人工智能。Facebook投资了大胆的人工智能实验室。中国搜索巨头百度成立了实验室。Uber、Salesforce等公司也成立了小型实验室。总部位于西雅图的研究公司Mind Commerce发布报告显示,预计到2023年,通用人工智能的投资将达到500亿美元。

尽管多位计算机科学家认为通用人工智能到实现应用可能还需要几十年,但投资还是已经开始。对于全世界最大的科技公司来说,通用人工智能是一场输不起的比赛,即便结果证明没有人赢过。“关键在于加强技术领导者和创新者的形象,以及引领前沿的地位。”研究公司Gartner的一名新兴技术分析师大卫·史密斯表示。如果能够保住该地位,销售云计算服务和招聘工程人才比较容易。不过,通用人工智能不仅是为了防守,推动相关研究也有助于狭义人工智能的研究进展。达拉斯小牛队的老板、亿万富翁科技企业家马克·库班说:“人工智能领域有个特点,只要加大研究力度,下游的应用不可思议。”库班也投资了一系列的人工智能新创企业。

****

“这可不是狼来了”

在2015年夏天的一个晚上,当时掌管Y Combinator的奥尔特曼曾经邀请马斯克到位于硅谷中心区域的瑰丽酒店共进晚餐。酒店坐落于豪华的石头牧场,可以俯瞰圣克鲁斯山脉,非常舒适宜人,很适合想象世界末日,也适合思考如何阻止末日。

马斯克之所以认为通用人工智能相当危险,主要是因为作为早期投资者,他投资了一家名为DeepMind的新创企业,总部挺特别地位于伦敦。该公司在2010年成立,领导者为前国际象棋神童出身的电子游戏企业家德米斯·哈萨比斯,拥有计算机科学本科学位和认知神经科学博士学位。他直觉认为,DeepMind可以从人脑的工作方式汲取灵感,从而实现通用人工智能。DeepMind的使命非常直接,甚至有些可笑:“先解决智力问题,再用来解决其他问题。”

不过,2013年1月,DeepMind首次公布的算法确实让计算机科学家吃了一惊,使命宣言也变得没有那么可笑。该算法自学了7款经典Atari公司的电子游戏,如《乒乓游戏》、《太空入侵者》和《逃脱》,成绩都超过了人类。这次突破像起跑线指令枪响一般,在硅谷激起了不小的水花。人们听到的是,通用人工智能的竞争开始了,于是数字巨头迫不及待地加入。

2014年,已经拥有高级人工智能研究实验室“谷歌大脑”的谷歌以6.5亿美元收购了DeepMind,对于并无产品也没有一美元收入的公司来说可谓巨资。与此同时,之前也曾经寻找机会收购DeepMind的Facebook也成立了自家的高级人工智能研究实验室,由业内的顶尖研究者之一杨立昆负责。

尽管马斯克从DeepMind中获利颇丰,但该笔收购还是让他震惊。交易宣布后不久,他在博客上写道:“人工智能的发展速度(我不是指狭义人工智能)快得难以置信。如果没有直接接触过DeepMind等公司,就根本无法了解发展的速度到底有多快。可能在五年内就会出现严重的危险事件。最多10年……这可不是狼来了。”

马斯克与谷歌的联合创始人拉里·佩奇是朋友。他告诉记者,担心佩奇的公司在可能成功地开发出超人智能后失去控制。马斯克说,即便不会发生,一家公司控制如此强大的技术还是令人担心。

晚餐时,奥尔特曼介绍了当时在谷歌大脑工作的29岁的计算机科学家伊利亚·莎士科尔与马斯克认识。虽然莎士科尔很年轻,但在人工智能研究圈里已经是传奇人物了。2012年,他协助开发的人工智能软件在ImageNet测试中前所未有地成功识别出了1000种物体的图片。出席晚宴的还有26岁的编程天才格雷格·布罗克曼,他刚辞去独角兽支付公司Stripe的首席技术官一职。两人希望获得马斯克的支持,建立新的人工智能公司,只做公开研究,不受任何公司控制。

几人共进晚餐后,当年晚些时候,OpenAI创立。马斯克加入董事会,还担任联合创始人。早期出资者包括马斯克、奥尔特曼、布罗克曼和马斯克在贝宝的老同事、亿万富翁彼得·蒂尔,以及LinkedIn的联合创始人里德·霍夫曼等,承诺提供10亿美元支持研究团队。莎士科尔担任OpenAI的首席科学家。

微软奋起直追

在2014年被任命为微软的首席执行官后不久,纳德拉就开始围绕人工智能重新定位。纳德拉宣称,微软旗下的所有产品和服务都会“加入人工智能”,还宣布人工智能是塑造未来的三项基本技术之一(另外两项是“混合现实”和量子计算)。纳德拉认为微软的各项业务都潜力巨大,也包括占微软收入三分之二的办公软件和云计算服务。纳德拉可不想让谷歌或其他竞争对手抢占地盘。

微软内部有个成立已久的研究机构,在世界各地都建有实验室,研究从虚拟现实到网络安全领域里最先进的技术,当然也包括人工智能。但在公司层面,微软最感兴趣的还是“增强人类智能”。换句话说,狭义人工智能微软实验室并没有像DeepMind和谷歌大脑一样追求浮华的突破。有时微软给人的印象是,通用人工智能只是不切实际的目标,不值得追求。

但缺席通用人工智能的竞赛后,微软也面临实际问题。由于Alphabet的DeepMind和谷歌大脑取得了一系列突破性进展,人们公认Alphabet在狭义人工智能应用领域里处于领先地位,在招聘学界最优秀的研究人员以及销售云服务方面也享有优势。2016年,DeepMind的人工智能算法AlphaGo在古老的策略游戏围棋中击败了全世界最优秀的棋手,进一步巩固了相关印象。之前多数人工智能研究人员认为,系统要想在围棋方面追上人类至少还得等十年。(《乒乓游戏》也一样。)“收购DeepMind是谷歌在营销方面有史以来最值的一笔支出。”Pathmind的联合创始人及首席执行官克里斯·尼克尔森说,Pathmind是位于旧金山的协助企业配置人工智能的公司。

纳德拉不得不采取措施提升微软在人工智能领域里的地位。2016年,他重组了公司的研究业务,专门成立机构从事微软产品中人工智能的研究和应用,比如必应搜索引擎和Cortana数字助理。他还开始每周召开高管会议,讨论人工智能相关项目的进展。但这些都是渐进式的变化。微软仍然缺乏人工智能的大项目。

批评声音

OpenAI位于旧金山的教会区,三层灰墙建筑,内部有阁楼,带有明显的震前建筑风格。目前公司有120名研究人员。过去一年,公司围绕“重大挑战”发布了一系列公告,主要介绍通用人工智能方面的进展并提高公众形象。

OpenAI用5台人工智能软件机器人组成团队玩对战游戏《刀塔2》,该游戏经常用于职业电竞比赛。去年4月在旧金山,三场最佳演示赛中,OpenAI的5机器人团队击败了人类卫冕冠军队。

另外,OpenAI还研究了语言算法,能够提取一些人类写的句子,然后即兴组合,生成连贯的散文,这是自然语言处理领域里的重大飞跃。

最终,10月,该公司首次推出了能够还原魔方的仿人机器人手。多年来,机器人学家一直在努力模仿灵巧的人手。OpenAI研发的机器手做得很好,经常可以顺利还原魔方。

通过三项声明,能够看出为何OpenAI对进入通用人工智能领域非常自信,以及为何引发多方批评。

首先介绍些背景:目前通用人工智能的推动力,以及当前的人工智能热潮都建立在神经网络基础之上,神经网络是大致基于人脑的软件。人工神经元呈多层排列,将图像中的像素等原始数据输入,转换成输出数据,例如标签“猫”。由于神经网络依赖的人工神经元中间层很多,所以有人称之为“深度”,利用该技术执行任务称为深度学习。

目前对通用人工智能的研究基本上分为两大阵营:一方阵营认为只有深度学习才可以实现通用人工智能,另一个阵营则认为必须与其他方面(如逻辑规则)结合。在深度学习阵营中,还有进一步的划分:一群强调算法创新,另一群则更关注构建神经网络的规模以及提供的数据量。OpenAI坚定支持“规模越大越好”。

OpenAI的标志性成就便构建了庞大的模型,消耗大量计算能力。举例来说,在5台《刀塔2》机器人程序中,每台都由算法控制,每个算法包含1.59亿个参数或数据变量。训练10个月后,机器人积累了相当于人类玩4.5万次《刀塔2》游戏的经验。

7月,奥尔特曼在视频聊天中告诉纳德拉:“增加训练的最大模型,不断解决看似不可能的任务。”奥尔特曼、布罗克曼和莎士科尔都表示,建立更大的神经网络是成功研发通用人工智能的重要途径。

然而,外部研究人士很少有人同意OpenAI的观点。纽约大学的一位心理学和神经科学名誉教授加里·马库斯目前在新创企业Robust AI担任首席执行官,他认为现有证据并不能够证明大型神经网络可以突然掌握接近人类水平的技能,比如常识推理或概念思维。“还是要依靠魔法一样的深度学习。”他认为OpenAI并未证明其系统可以构建世界。“如果做不到这一点,就不可能成功研发通用人工智能。”他说。加州大学伯克利分校的一位计算机科学家本·雷克特对OpenAI的批评则更为严厉。“难道这些人从没有听说过收益递减规律吗?”他说。

对OpenAI的另一种批评声音,即公司为了博得关注不合理地夸大了成就。OpenAI在宣布GPT-2语言算法时告诉记者,由于担心该软件被滥用,制造假新闻和造谣活动,所以拒绝发布软件功能最强大的版本。一些计算机科学家指责OpenAI夸大风险以获得公众关注。(9个月后,该公司确实发布了全功能版,表示功能较弱的版本基本没有滥用风险。)

卡内基梅隆大学的一位教授扎卡里·利普顿公开批评OpenAI,指责该公司的研究与其他公司基本类似,为了募集资金而“积极操纵媒体”。“它们想时刻维持一种错觉,即历史性的事情正在发生,而OpenAI就在事件中心。”利普顿说,结果营销“很不道德也不负责任”。

OpenAI的发言人阿什利·皮利皮兹恩在一封电子邮件回复中否认公司从事操纵性营销活动,并表示应该“根据公司研发成果的影响”,而不是“根据我们(或其他人)说的话”来判断公司的价值。

资金问题

OpenAI的方法里有一点毫无争议,就是昂贵。庞大的模型需要强大的运算能力,必须向云服务提供商租用。而且,顶尖的人工智能研究人员的薪水往往达6位数甚至7位数。虽然OpenAI并没有透露烧钱情况,但可以从竞争对手窥得一斑。英国的财报申报数据显示,仅在2018年,员工约900人的竞争对手DeepMind的员工薪水和运算成本等管理费用就达到7.46亿美元。

“要实现目标所需的资金比原先想象中多得多。”奥尔特曼在去年接受《连线》杂志采访时说。更为复杂的是,OpenAI失去了最重要的支持者:马斯克。2018年年初,马斯克宣布辞任OpenAI董事,理由是经营特斯拉和SpaceX需要大量精力,而且由于特斯拉越发介入人工智能领域,可能招聘与OpenAI相同的研究人员,从而存在利益冲突。

为了获得更多资金,OpenAI的董事会决定彻底改变架构。今年3月,奥尔特曼宣布成立营利部门。在新架构下,OpenAI可以从事风险投资。最重要的是,公司还能够发放股票期权,吸引并留住顶尖的计算机科学家。里德·霍夫曼的慈善基金会,还有著名的硅谷风险投资公司Khosla Ventures成为营利性部门的首批投资者,投资金额未知。之后的7月,微软投入了10亿美元。

随着OpenAI从微软的云计算部门Azure购买数据中心时间,部分投资资金将返还给微软,而且微软已经同意OpenAI享有Azure的独家使用权。如果OpenAI成功开发通用人工智能,微软的投资并不能够享有通用人工智能的所有权。届时,通用人工智能仍然属于OpenAI的非营利业务,OpenAI也保留了对营利部门的投票控制权。(如果你怀疑微软的投资到底是不是真与通用人工智能有关,放心,别人也一样。)

微软和OpenAI都拒绝就合作关系接受采访。但只要看看谷歌如何通过谷歌大脑和DeepMind获益,便大致可以判断出微软的目的,其实就算最终没有获得通用人工智能的所有权也不影响。

谷歌大脑开发的算法协助改进了谷歌的搜索引擎、谷歌翻译、谷歌地图和云计算基础设施。“这些对公司来说价值巨大。”高级软件工程师杰夫·迪恩表示,他曾经协助创立谷歌大脑,现在负责谷歌的人工智能研究。

与此同时,DeepMind还有一个名为DeepMind for Google的团队,负责跟姊妹公司和Alphabet的其他业务部门合作。“我们不会选择产品的问题去研究如何解决。”DeepMind的研究副总裁科瑞·卡武库奥格鲁说。但如果DeepMind的研究碰巧对Alphabet旗下的其他公司正在研究的问题有帮助,DeepMind for Google团队通常会合作寻找解决方案。2016年,DeepMind曾经表示,帮助谷歌找到了更有效管理数据中心冷却系统的方式,降低了40%的冷却费用。后来,DeepMind又使用相同算法的另一版本协助延长了安卓手机的电池寿命。2017年,DeepMind的一款算法成为了谷歌数字助理电脑语音生成的引擎。

类似于宗教的讨论

说起各个公司在通用人工智能领域竞争最大的问题,其实在于提供资金的大型科技公司是否真的相信,甚至关心有没有可能创造出类似于人类或超人类的智能程序。“在硅谷,通用人工智能是类似于宗教的讨论。”Pathmind的尼克尔森说。“要么是信徒,要么不是。”

麻省理工学院的一位计算认知科学教授乔希·特南鲍姆就是个信徒:他负责的实验室主要研究人类智能逆向工程,搭建更类似于人类的人工智能。但与很多业内人士一样,特南鲍姆认为通用人工智能“非常遥远”。他也认为竞相研究人工智能的大公司的动机并不透明。

在特南鲍姆看来,DeepMind、谷歌大脑和OpenAI的研究人员确实希望实现通用人工智能,但Alphabet和微软等公司其实更关注狭义人工智能的发展,公司只希望找到更好的工具搭建一系列狭义系统,比如能够鉴别信用卡欺诈、面部识别或分析法律文件的算法。狭义系统可以在内部使用,也可以卖给云计算客户。

微软与OpenAI的合作肯定有望推出类似的创新。两家公司已经达成协议,提升Azure的超级计算能力,其中包括开发新芯片提升人工智能系统的训练和运行效率。

不管纳德拉投资OpenAI的真正目标是什么,这位首席执行官通过10位数的投资在人工智能研究领域里树立了标杆。微软也正式加入了通用人工智能的竞争。即便微软最终落败,这可能也是他有史以来最值的10亿美元投资。

玩个游戏吗?

图片来源:Courtesy of DeepMind

在人工智能的发展过程中,游戏一直是里程碑式的标志,因为游戏可以在简化的环境下提供智能挑战。以下是计算机的几场引人注意的胜利:

2015年:Atari

在原有游戏系统研究的基础上,DeepMind展示了人工智能如何在训练仅几个小时便能够掌握从《乒乓游戏》到《太空入侵者》等49个Atari游戏,而且达到超人类水平。

2017年:扑克

Libratus是卡内基梅隆大学的研究人员发明的一款会玩扑克游戏的人工智能,在无限注的得州扑克游戏中击败了4名职业选手。

2019年:《星际争霸2》

DeepMind的AlphaStar人工智能在复杂的即时战略游戏《星际争霸2》中名列全球玩家的前99.8%,非常精通长期战略和街机式战斗。(财富中文网)

译者:MS

热读文章
热门视频
扫描二维码下载财富APP