马克·扎克伯格
首席执行官、董事长、创始人,Meta — 美国
这是Meta的人工智能转型之路:创始人牵头,以Llama平台为核心对企业进行重塑,在生成式人工智能竞赛中重新杀回舞台中央。

Meta的新愿景
马克·扎克伯格正在推动Meta将Llama植入其旗下所有产品与服务之中,包括目前处于原型阶段的Orion增强现实眼镜。图片来源:DAVID PAUL MORRIS—BLOOMBERG/GETTY IMAGES
那是2023年的夏天,当时亟待回答的问题是,是否要公开发布Llama,让其在广阔天地中经受考验。
这里所说的“Llama”并非是一种动物。Llama 2是Meta旗下的生成式人工智能(GenAI)模型(OpenAI开发的GPT-4的潜在挑战者)的后续版本。初代Llama于此前数月问世。该模型原本仅面向研究人员提供服务,但在网上泄露后,该模型赢得了众多开发者的青睐,其之所以能够走红,有两方面原因:一是免费,这一点与OpenAI、谷歌(Google)和Anthropic开发的大型语言模型(LLM)不同;二是其先进性。此外,与其竞争对手不同的是,其为开源模型,也就意味着研究人员、开发者和其他用户可以访问该模型的底层代码及“权重”(权重决定着模型处理信息的方式),对其进行使用、修改或者改进。
Meta的首席人工智能科学家杨立昆(Yann LeCun)与负责人工智能研究的副总裁兼Meta FAIR(Fundamental AI Research,基础人工智能研究)团队的负责人乔尔·皮诺(Joelle Pineau)希望以开源方式对Llama 2进行公开发布。他们强烈认为,开源Llama 2能够让该模型以更低的成本、更快的速度实现更加强大的功能。如此甚至可以帮助公司走出之前向元宇宙转型的阴霾,在生成式人工智能竞赛中迎头赶上。此前,该公司被认为在人工智能竞赛中严重落后于竞争对手,并且因为转型将元宇宙作为自身核心业务、推出了一系列缺乏吸引力的产品和没有腿的俗气化身而让投资者和客户大失所望。
但反对走这条路的理由也很充分。一旦用户习惯了免费产品,应该如何利用此类产品进行变现?而且,正如其他高管在就此话题进行辩论时指出的那样,由此可能造成严重的法律后果:如果有人劫持该模型,大肆进行黑客攻击怎么办?Meta早前发布的两款开源人工智能产品都是适得其反,招致从科学家到美国参议员各方的口诛笔伐。
打破僵局的重任落在了首席执行官马克·扎克伯格(Mark Zuckerberg,Meta创始人、控股股东)的身上。扎克伯格长期以来一直是开源技术(Facebook本身就建立在开源软件基础之上)的忠实拥趸,但他也乐于听取各方意见。Meta的生成式人工智能主管艾哈迈德·阿尔-达赫勒(Ahmad Al-Dahle)回忆道,在开源问题上,扎克伯格与“所有持支持、反对或者中间立场的人士”都进行了交谈。但杨立昆称,最终还是扎克伯格本人做出了把Llama 2作为开源模型对外发布的决定,“当时他说:‘好吧,我们就这么办吧。’”2023年7月18日,Meta正式发布Llama 2,“免费用于研究和商业用途”。
扎克伯格在他的Facebook个人主页上发表了一篇文章,进一步肯定了自己的决定。他强调,他相信能够通过开源让更多的开发者用相关技术进行开发,从而推动创新。他在文中写道:“我相信,生态系统越开放,就越可以带来更大的进步。”
在人工智能飞速发展的进程上,这段插曲可能只是一个不起眼的注脚。但从事后看来,Llama 2的发布对Meta和扎克伯格来说无疑是一大里程碑事件,开启了一段东山再起的辉煌旅程,而这一切都要归功于这个以毛茸茸的骆驼命名的技术。到2024年4月和7月Llama 3系列模型发布时,Llama在速度和准确性上已经基本赶上了其他闭源竞争对手。在多项基准测试中,Llama 3系列中的最大模型与OpenAI和Anthropic的最优秀闭源模型的表现已经不相上下,甚至在有些方面还更胜一筹。Llama还有一个优势,那就是Meta能够使用来自数十亿Facebook和Instagram账户的公开共享数据来对其人工智能模型进行训练。
在有关开源人工智能模型(通常更透明、更灵活、更具成本效益,但可能更容易被滥用)与闭源模型(通常控制更严格,但缺乏透明度,开发成本更高)孰优孰劣的哲学辩论中,Llama或将成为影响结果的“胜负手”。同样重要的是,Llama在Meta全面转向生成式人工智能的战略中占据着核心地位。在硅谷开发者的眼中,扎克伯格目前已经成为“技术民主化”的旗手,而就在两年前,扎克伯格和他的公司还因为全力投入元宇宙(metaverse)而饱受质疑,有时甚至还会遭到嘲笑,背负着“助长政治两极化、极端主义、损害青少年心理健康”的恶名。
虽然ChatGPT依旧是大众眼中最主流的生成式人工智能工具,但Llama模型也已经在为许多甚至大多数Meta产品提供支持,每天服务的消费者数以十亿计。Meta的人工智能助手(覆盖Facebook、Instagram、WhatsApp和Messenger)即基于Llama构建而来,用户可以使用AI Studio来创建自己的人工智能聊天机器人。面向广告商的文本生成工具同样基于Llama开发而来。Llama为Meta的热门产品——雷朋(Ray-Ban)眼镜的对话助手以及Quest耳机中让用户就周围环境提问的功能提供了支持。据称,该公司还在开发自己的人工智能搜索引擎。在该公司之外,Llama模型在开源人工智能社区Hugging Face等网站上的下载量已经超过6亿次。
尽管如此,许多关注Meta的人士仍然对这一战略调整的未来感到迷茫。该公司在搭建Llama模型上的投入已经达到数十亿美元,在第三季度财报电话会议上,Meta公司宣布,预计2024年的资本支出将高达400亿美元,2025年可能还会有“大幅”增长。与此同时,它还向数千家公司免费赠送Llama,其中包括高盛集团(Goldman Sachs)、美国电话电报公司(AT&T)和埃森哲(Accenture)等巨头企业。一些投资者无法想象,Meta何时才能够通过营收回报来证明如此天量投入的合理性。
美国加州大学伯克利分校(University of California at Berkeley)的哈斯商学院(Haas School of Business)的副教授阿比舍克·纳加拉杰(Abhishek Nagaraj)表示,很难说明为何开源Llama对Meta而言是一个合理选择。他还补充道,单纯从经济角度很难证明这一做法的合理性。
尽管如此,Llama逆势而上的成功已经让扎克伯格得以摆脱市场对其元宇宙雄心的冷淡反应,并让公司走出2022年年底至2023年年初痛苦的“效率年”阴影。Llama的崛起也给了扎克伯格一个机会,来解决他辉煌职业生涯中的一个长期存在的痛点:无论是过去的Facebook,还是现在的Meta,其所提供服务和产品都经常受到苹果(Apple)、谷歌强加规则的限制(在移动设备时代,苹果、谷歌的应用程序商店是Meta的主要推广渠道)。正如他在2024年7月的一篇贴文中写道的那样:“我们必须确保自己始终可以获得最优秀的技术,避免被竞争对手的封闭生态限制了自己的发展。”
通过Llama,Meta和扎克伯格获得了制定全新行业标准的机会。在Meta公司于2024年7月举办的财报电话会议上,扎克伯格说:“我认为,未来我们在回望Llama 3.1时,会发现其是开源人工智能开始成为行业标准的行业拐点,就像Linux一样。”他在谈话中提及的Linux是另一个开源项目,打破了微软(Microsoft)的Windows等专有操作系统的主导地位。
也许正是这种可能性让扎克伯格又神气了起来。进入不惑之年,在他与别人共同创建Facebook的20年后,扎克伯格似乎正在享受着许多人口中所谓的“扎克复兴”,无论个人生活,还是职业生涯,都“熠熠生辉”。他曾经的短发变成了蓬松的卷发,单调的连帽衫换成了金链和超大号的黑色T恤衫,刚毅的表情也变得柔和,变成了轻松的微笑。2024年11月,扎克伯格甚至抽空与美国男歌手T-Pain合作,翻唱了嘻哈名曲《Get Low》,作为送给妻子普莉希拉·陈(Priscilla Chan)的周年纪念礼物。
从长远来看,OpenAI的ChatGPT可能会被视为点燃生成式人工智能热潮的烈火。但至少就现在来说,由于Llama自己的未来太过耀眼,连扎克伯格也不得不戴上人工智能赋能的雷朋墨镜。
Meta于2013年开始耕耘人工智能领域,当时扎克伯格钦点纽约大学(New York University)的长期教授、人工智能专家杨立昆负责管理Facebook新成立的FAIR实验室。杨立昆回忆道,从刚开始讨论这个职务时,他提出的第一个问题就是Facebook是否会对相关工作进行开源。他对扎克伯格说:“没有人能够垄断好点子,我们需要尽可能多地进行合作。”杨立昆得到的答案让他兴奋不已:“啊,这点不用担心。我们的平台软件和所有产品早就已经开源了。”
但在生成式人工智能热潮掀起之前,Meta对人工智能的使用大多在幕后进行,要么专注于研究,要么集成于其推荐算法和内容管理背后。该公司此前并未制定开发面向消费者的人工智能产品(例如聊天机器人)的宏伟计划,尤其是当时扎克伯格的注意力还都集中在元宇宙上。
随着OpenAI发布ChatGPT,生成式人工智能开始腾飞,此时Meta却在进行着格外莫名其妙的转型。一方面是元宇宙投入的飞速增长,另一方面却是消费者完全不感兴趣,Meta的股价创下七年新低,“马克·扎克伯格的麻烦有多大?”之类的新闻标题接踵而至,该公司也开始裁员,数千人失去了自己的岗位。
Meta首次为人所知的向生成式人工智能领域进军的尝试也不尽如人意。2022年11月,FAIR发布了大型语言模型聊天机器人——Galactica的演示版本,该机器人基于科学文本训练而来。与FAIR之前发布的模型一样,Galactica同样为开源发布,允许用户免费访问该模型的“大脑”,目的是让研究人员可以研究Galactica的运作原理。
但那时公众尚未充分认识到大型语言模型容易产生“幻觉”(有时会吐出令人信服、自信满满但错误百出的答案)。许多科学家对Galactica聊天机器人非常不科学的输出(包括引用根本不存在的研究论文)感到震惊,其无厘头的输出包括:如何在浴缸里制造凝固汽油弹、吃碎玻璃的好处,以及“同性恋为何是一种邪恶行为”。批评者称,Galactica“不道德”,是“Meta最危险的产品”。
在经受三天的激烈批评之后,Meta的研究人员关闭了Galactica。12天后,OpenAI发布ChatGPT,并且迅速在全球范围内蹿红,迎合了文化时代精神(尽管它本身也存在严重的幻觉问题)。
虽然饱受挫折,但FAIR的研究人员并未气馁,他们用一整个冬天的时间对名为LLaMA(Large Language Models Meta AI的缩写)的新版生成式人工智能系列模型进行了优化。在经历了Galactica事件的反弹之后,Meta公司变得谨慎起来,其并未向所有人完全开放代码和模型权重,而是要求研究人员申请访问权限,并且未提供任何商业许可。在被问及原因时,杨立昆在X上回应道:“因为此前我们向所有人开放大型语言模型时……大家恶评如潮,说我们这么做会破坏社会结构。”
尽管有上述的种种限制,但完整版模型却还是在几周之内就泄露到了网上,在4chan等人工智能社区中传播开来。Meta公司的全球事务总裁尼克·克莱格(Nick Clegg)称:“感觉有点像瑞士奶酪。”Meta向在网上发布该模型的网站发出了删除请求,试图控制其传播范围。一些批评者警告道,这种传播将造成严重后果,并对Meta进行了抨击。网络安全研究员杰弗里·拉迪什(Jeffrey Ladish)在X上发帖说:“等着收到大量个性化垃圾邮件和网络钓鱼攻击吧。”
这种担忧情绪甚至传导到了美国的国会山(Capitol Hill)。2023年6月,两位美国参议员致信扎克伯格,批评Llama的发布,并警告称该模型可能在欺诈、恶意软件、骚扰和隐私侵犯等领域遭到滥用。信中说,Meta公司发布高级人工智能的方式“引发了关于可能发生误用或者滥用的严重质疑”。
但与此同时,杨立昆说,研究人员与开发者对外泄Llama模型的巨大需求也让他和其他Meta的高管大吃一惊。这些潜在用户希望能够公开访问这种具有强大功能的大型语言模型,想要获得由此带来的灵活性和控制权。比如,律师事务所可以使用该模型来训练专门的法律模型,并且拥有相应的知识产权。医疗保健公司能够对模型背后的数据进行审计和管理,确保符合《健康保险流通与责任法案》(HIPAA)的规定。研究人员可以进行相关实验,对模型的内部运作情况进行检查。杨立昆称:“我们收到了一些人的请求,他们说:‘你们必须把这些东西开源。其价值不可估量,或能创造一个像新互联网一样的全新行业。’”
这些信息直接报告给了扎克伯格、首席技术官安德鲁·“博兹”·博斯沃思(Andrew “Boz” Bosworth)和杨立昆,并直接导致该公司决定每周召开一次电话会议,让高管们在电话中就下步计划进行辩论。下个版本是否应该开源?是否利大于弊?到了仲夏时节,扎克伯格已经下定决心,在皮诺和杨立昆的支持下,于2023年7月完成了那场重磅发布。
Llama 2并非完全开源。Meta没有披露其用于训练该模型的数据集(包括Facebook和Instagram的所有资料),而大家普遍认为,这些数据集是其重要竞争优势。该公司还限制了月活用户超过7亿的公司对该模型的使用,此举主要是为了遏制Meta的科技巨头竞争对手。不过,源代码和模型权重都能够下载,Meta还鼓励用户向协作社区提出改进意见,协助修正错误,完善结果。
甚至在Llama 2发布之前,扎克伯格就已经准备好把其作为Meta的下一款拳头产品。2023年2月,初代Llama模型发布之后,扎克伯格迅速在包括FAIR在内的全公司范围内征集精兵强将,组建了一支以加快生成式人工智能研发速度为核心任务的团队,目的是把该技术部署到Meta应用程序的各项功能和工具之中。他选择了苹果公司的一位前高管艾哈迈德·阿尔-达赫勒来领导这个新团队。
在2023年6月的一次内部全员会议上,扎克伯格分享了自己对Meta的人工智能未来的愿景。他说,Meta正在将生成式人工智能融入其所有产品之中,他还重申了公司在人工智能研究方面将采取“开放、科学方式”的承诺。阿尔-达赫勒说:“我肩上的担子可不轻。不仅要开发出最先进的模型,还要以最快的速度将其应用到产品之中。”
换句话说,属于Llama的时间到了。
对于一家年收入高达1,350亿美元的公司而言,Meta采用如此战略似乎有悖常理。开源软件经常被视为实现技术民主化的一种方式,利好小型新创企业或者资源不足的团队,也就是那些努力与Meta这样的巨头竞争的团队。
2024年7月,扎克伯格在一篇名为《开源才是前进方向》(Open Source Is the Path Forward)的博文中明确表示,开源Llama并非利他之举。他说,开源将使Meta在人工智能竞赛中获得竞争优势,并最终使Llama成为生成式人工智能领域的首选平台。同样重要的是,他写道:“与闭源提供商(例如OpenAI或者谷歌)不同,公开发布Llama不会对我们的收入、可持续发展或者对研究进行投资的能力产生负面影响。”
现在,Llama已经用一年多的时间证明了自己,一些人认为扎克伯格的理由很有说服力。沃尔夫研究公司(Wolfe Research)负责研究Meta的分析师什维塔·卡朱里亚(Shweta Khajuria)称,以开源软件形式发布Llama可谓“天才之举”,使得Meta可以吸引到顶尖人才,加速自身平台创新,创造全新收入来源,并延长其寿命。她解释道,开源Llama基本上已经让Meta迅速赶上了OpenAI、谷歌和Anthropic,而其之所以能够取得如此亮眼的成绩,部分是因为有成千上万的开发人员正在以惊人的速度构建和改进Llama。她说:“如果Meta没有把Llama开源,那么其可能需要花费更长的时间才可以赶上其他前沿模型。”
卡朱里亚认为,Meta未来会有很多新的变现机会,比如能够为基于Llama开发的Meta AI功能配备订阅和广告选项,以及开发人工智能赋能的应用程序内业务通知功能。“Meta的优势在于其拥有数十亿用户,而Perplexity、Claude和ChatGPT不一定有这样的用户基础。”她说,“一旦在全球范围内获得足够数量的用户和使用量,他们就可以进行变现了。”
扎克伯格还曾经暗示,人工智能生成的内容本身将会产生价值(尽管有人批评这类内容“乏善可陈”)。在最近的财报电话会议上,扎克伯格说:“我认为我们应当增加一个全新的内容类别,即人工智能生成或整理的内容,或者说由人工智能以某种方式整合的现有内容,我认为,随着时间的推移,这在Facebook和Instagram,或许还有Threads,或者其他类型的信息流体验方面,都有非常激动人心的应用空间。”
帕特里克·温德尔(Patrick Wendell)是数据与人工智能公司Databricks的首席技术官及联合创始人,该公司于2024年7月在其平台上发布了Meta的Llama 3.1模型。在他看来,Meta此举的意义更为深远。如果说互联网是推动Facebook诞生的第一波技术浪潮,而移动是苹果和谷歌主导的第二波技术浪潮,“我认为,(扎克伯格)的算盘是,第三次科技浪潮即将到来,他不想让人工智能成为一两家公司的禁脔。”温德尔说,“要想避免出现这种情况,方法之一就是把市场商品化,免费赠送核心知识产权……这样就不会有人获得垄断地位。”
有些批评者认为,Meta根本就不应该使用“开源”一词。当前版本的Llama保留有传统开源软件不会设置的限制(包括无法访问数据集)。2024年10月,创造了“开源”一词的“开源倡议”组织(Open-Source Initiative)批评Meta“忽悠”了用户,“污染”了开源一词,并指出谷歌和微软已经放弃使用这一词汇(而是改用“开放权重”)。Meta的全球事务主管克莱格直言不讳地进行了反驳。他表示,这场争论让他想起了“那些喋喋不休争论‘只有黑胶唱片才符合真正好音乐定义’的人”。他继续说道,只有少数低性能科学模型能够契合这一定义,“没人拥有‘开源’二字的解释权。”
如果不咬文嚼字,我们就可以看到,Meta在各大关键领域都处于领先位置。非营利组织艾伦人工智能研究所(Allen Institute for AI)的研究科学家内森·兰伯特(Nathan Lambert)称,虽然大家对定义可能存在争议,但目前使用的开源人工智能模型中,90%以上是基于Llama开发而来。他指出,开源程序员已经接受了扎克伯格“面临着一些企业现实,会扭曲其真实想法”的说法。“说到底,还是因为社区需要Llama模型。”
在Meta公司内部,Llama与各大创收业务之间的联系也越来越紧密。2024年1月,扎克伯格将人工智能研究小组FAIR与在Meta的应用程序中部署生成式人工智能产品的团队调整到了同一部门。杨立昆和皮诺现在都直接向首席产品官克里斯·考克斯(Chris Cox)汇报工作,阿尔-达赫勒也是如此。皮诺说:“我认为把(FAIR)放在靠近应用程序产品的部门非常合理。”她表示,即便在重组发生之前,她的团队所做的研究往往也会在几个月内就出现在Meta的产品之中。
扎克伯格还交给了FAIR一项更为雄心勃勃的任务,那就是开发人工通用智能(AGI),一种拥有人类智能的人工智能。该公司更喜欢使用AMI(advanced machine intelligence,高级机器智能)一词,但不管叫什么,皮诺说,Meta现在已经为实现该技术制定了实实在在的“路线图”,而这个路线图的完成大概也要依赖Llama的茁壮成长。与此同时,该公司也在努力开发Llama 4模型,目前正在一个由10多万个价格昂贵的英伟达(Nvidia)的GPU组成的GPU集群上进行训练,扎克伯格最近表示,这个集群“比我所见过的任何其他公司在用的集群的规模都要大”。
并非所有人都乐见Llama做成行业龙头。为实现个性化新闻推送、方便内容管理、推送定向广告,扎克伯格和他的公司在Facebook、Instagram和WhatsApp上也应用了使其他类型的人工智能技术,而公众对其应用上述技术的方式充满不信任感,成了困扰二者多年的难题。批评者指责其算法加剧了政治两极分化、青少年心理健康危机和错误信息的传播(Meta公司否认或者反驳了这些指责)。Llama面临额外审查或许已成定局。
有一些批评者担心,由于Llama的开放程度过高,一旦这样的开源模型落入不法之徒手中,将会成为危险武器。在当今紧张的地缘政治气氛下,这种担忧可能会进一步加剧。
第二次上台的唐纳德·特朗普(Donald Trump)政府可能会给Llama保持开源增加更多的障碍。特朗普的经济民族主义意味着,他肯定不希望中国(或者任何其他国家)获得美国制造的最先进的人工智能模型。不过,Llama的未来可能取决于特朗普能够听进谁的意见,当选副总统詹姆斯·戴维·万斯(JD Vance)过去曾经表示支持开源人工智能,而埃隆·马斯克(Elon Musk)的xAI则开源了其聊天机器人Grok(众所周知,马斯克参与创建OpenAI时,目标也是打造一个开源实验室)。
就连扎克伯格的一些老朋友也对这种“军备竞赛”表示担忧。达斯汀·莫斯科维茨(Dustin Moskovitz)是Facebook的联合创始人之一,现任Asana公司的首席执行官(也是各大人工智能安全项目的最大资助者之一——Open Philanthropy的创始人),他说,虽然他并不反对开源大型语言模型,但“我认为不断发布功能更强大的版本并不合适”。
但扎克伯格和他的盟友们,无论是在Meta内部还是外部,都认为开源模式的风险实际要小于那些闭门造车的闭源模式。他们认为,以开源人工智能理论上存在的危害为由进行预防性监管会扼杀创新。扎克伯格和Spotify的联合创始人丹尼尔·艾克(Daniel Ek)在2024年8月共同撰写的一篇文章中指出,开源开发是“利用人工智能推动进步、为每个人创造经济机会与安全的最佳方式”。
无论Meta声量越来越高的开源活动将会如何收场,许多人认为,扎克伯格正是推动这项事业的合适人选。业内人士一致认为,扎克伯格亲自参与推进Llama和开源工作是Meta可以如此心无旁骛地实现高速发展的关键原因。克莱格说:“在这些科技巨头企业中,目前还在任的创始人为数不多,而他正是其中之一,这样做的一大好处是指挥链条非常短。”
扎克伯格还积极招募人工智能人才,经常亲自出马。2024年3月的一份报告称,扎克伯格一直在用私人邮件招揽谷歌的DeepMind的研究人员,还会在电子邮件中强调人工智能对其公司的重要性。
2022年11月被裁员前,埃里克·梅耶尔(Erik Meijer)在Meta工作了八年,负责领导一个专注于机器学习的团队,他认为只有由像扎克伯格这样的人领导的公司才能够实现这种彻底转变。他说:“这项任务的难度与推动巨型超级油轮掉头一般无二。在公司里,他有点像是‘偶像派英雄’,褒义的那种,在我看来,这种特点有助于推动所有人朝着同一个方向努力。”梅耶尔认为,扎克伯格的新造型“也许正是以明显的外在变化来表明改弦更张的态度”。
由于资本支出激增,扎克伯格的改头换面和Meta的转型肯定会考验投资者的耐心。供职于沃尔夫研究公司的分析师卡朱里亚认为,投资者目前会容忍这种情况,“因为Meta已经打好基础,告诉了大家机会在哪里”。话虽如此,但她也警告道,如果营收在2025年年底到2026年年初依然不能开始加速增长,“我认为投资者就将开始失去耐心”。(在某种程度上说,扎克伯格其实不太受投资者不满情绪影响,其本人控制着Meta公司约61%的有投票权股份。)
杨立昆说,有一点很清楚,Meta的这种豪赌,在GPU和生成式人工智能的各个方面进行的巨额投资,需要一位愿意大赌一把的领导者。而Meta不仅拥有这样的领导者,还有盈利丰厚的核心业务来为这一愿景提供资金支持。得益于此,Meta才又重返科技与商业交叉领域最重要舞台的中央,只不过这次没有那些没有腿的元宇宙化身什么事了。
译者:Feb