立即打开
ChatGPT出圈,何处寻找喂饱它的算力?

ChatGPT出圈,何处寻找喂饱它的算力?

2023-04-05
人类对算力的需求正“失速”增长

3月30日,广州。《财富》全球科技论坛现场,三位嘉宾从左至右依次为上海交通大学教授、图灵量子创始人兼首席执行官金贤敏;中国计算机学会量子计算专业组副主任、本源量子总经理张辉;曦智科技联合创始人兼首席技术官孟怀宇

ChatGPT火爆出圈后,已数度出现访问量激增导致云算力不足而宕机的情况。随着更多生成式AI的落地,以及模型参数的不断增加,人类对算力的需求预计将以每五到六个月翻一倍的速度“失速”增长。而随着摩尔定律逼近物理极限,传统计算机的算力提升空间已所剩不多,人类迫切需要寻求到全新架构的计算方式。

3月30日,在广州举办的《财富》全球科技论坛上,《财富》上海执行主编王昉与三位算力科学家对话,探讨了量子计算、光子计算等未来计算力的发展趋势、商业前景,以及如何确保算力“向善”。这三位科学家分别是:上海交通大学教授、图灵量子创始人兼首席执行官金贤敏;中国计算机学会量子计算专业组副主任、本源量子总经理张辉;曦智科技联合创始人兼首席技术官孟怀宇。以下为编辑后的对话实录。

王昉:先给大家出一道题目,523乘以597等于多少?如果大家拿出手机,就可以很快算出答案:312,231。但是反过来,已知312,231,请你倒推出它是哪两个质数的乘积呢?就难了很多。再进一步,假如给你一个今天互联网上通用的2048位的密钥,要推导出它由哪两个质数相乘而得,一台传统计算机需要算上1万亿年,但假如用一台量子计算机,大约几个小时就能算出来了。张辉博士,您是研究量子计算的,很多年锦衣夜行,突然之间这个领域爆发了,能否跟我们讲讲,为什么量子计算可以实现指数级的算力的提高?

张辉:我们今天用的手机、电脑和超算使用的运算物理载体都是晶体管。晶体管的工作原理就像三峡大坝,有个开关,控制电流的通和不通。但是今天这样的结构面临一个巨大挑战——晶体管已经做到5纳米、3纳米了,而1纳米就是10个原子的厚度,大家可以想象,这就仿佛这个大坝越做越薄,如果它做到比一张纸还薄几百倍、几千倍,水就会渗过去。在微观体系下确实是这样,电子可能会穿过这个开关。所以经典计算机正面临着“后摩尔时代”,原来每18个月晶体管缩小1倍,现在这样的路径走下去非常困难,人类一定要寻找下一代更强的算力。

与传统计算机建大坝不同,量子计算不再建大坝,不再做晶体管,而是把计算需要的比特信息0、1编译在电子上或者原子上,比如说编译在电子的自旋上。大家可以想象,电子就像我们的地球一样在自转,左转和右转分别表示0和1,但是大家如果观察地球仪,把两个卡点去掉,它就不仅可以左转右转,还可以上转、下转或者各种角度转,这就是量子里的叠加效应。也就是说,经典计算机的晶体管只能表示0或者1,是确定态的,但量子的比特可以处在0到1之间的叠加状态,这就使得它表达的信息量大很多。我们经常打比方,经典计算机就像一个传统的开关,控制灯亮和不亮,只有这两种状态,量子计算机就像一个旋钮开关,它不仅能控制开和关,还能调节不同的亮度。当我们利用这个量子叠加效应去做我们的计算工具时,就可以从编码上实现天然的并行运算,这使得量子计算处理数据的能力非常强。

王昉:本源量子最近发布的“悟空”量子计算机,搭载了72个物理比特。目前全球最领先的IBM搭载了433个物理比特。这些比特的数量决定了计力?

张辉:对。悟空搭载了72个比特,也就是说,我们能控制72个电子或者72个原子。当这些电子或原子并行处理时,一次能处理的数据量大概是2的72次方,非常惊人。经典计算机可能要串行的2的72次方的处理,量子芯片只要几步就能完成,这就是量子计算带来的非常惊人的变化。

王昉:假如说比特数量增加到73个,那就是2的73次方?

张辉:对,每多一个比特,它的计算曾经就会提升一倍。这个指数的威力是非常强大的。

王昉:要破解我刚才说的2048位的密钥,大概需要一台什么样的量子计算机?

张辉:理论上说,需要大概2000万个物理比特的规模。我们现在才几十个,所以还有一段很长的路要走,所以现在的量子计算大概处于传统计算机的电子管时代。

王昉:最近很热的ChatGPT回答问题的能力已经非常惊人,但有时我们也能感觉到延迟,甚至宕机。当ChatGPT与量子计算相遇,它会有什么更惊人的表现?

金贤敏:不只是延迟的问题,目前大模型只是应用于一些方向,比如说聊天机器人。未来它将被运用到各种场景,而且数据更新后还需要重新训练,碰到的限制还是很多的,有多少公司有这个资金去做这个训练?微软CEO说ChatGPT是一场工业革命级别的创新,但工业革命的定义是非常高的,哪怕互联网都不太被认为是第三次工业革命,那ChatGPT就意味着第四次工业革命?我觉得仅靠大模型、暴力美学肯定不行,需要一种算力去与它结合,才能让它暴发出真正的威力。

刚才张辉讲到,摩尔定律基本上已经走向终结,不仅算力跟不上,成本也降不下去,物理局限已经到来。人类需要通过一种新型架构的计算,换一种方式去继续推进算力,不能像现在的成本这么高,要相对廉价,然后和ChatGPT这种暴力美学的大模型结合起来,我感觉这就够一场工业革命级别了。

王昉:量子计算其实是有不同的技术路径的,能否简单介绍一下目前最主流的几种?

金贤敏:技术路径包括原子、离子、超导、光量子等等,有几十种,但现在基本上已经收缩到三大主流方向:光量子、超导和离子阱。它们各有各的特点,目前在专用处理器上都有发挥作用的空间,现在产业化公司和投资也基本上集中在这三个主流方向。要操控量子极具挑战性,量子革命就是以能够去驯服并操控每一个粒子或者每一个单元为典型特色的。光量子、超导和离子阱相对比较容易驯服,其他不好用的,就慢慢被淘汰了。

王昉:所以说,量子计算机不仅仅要研究清楚量子是怎么工作的,它更多是一个工程问题,也就是要创造出一个几乎完美的环境,让量子受到最少的干扰,这些干扰包括温度、湿度、轻微的振动、电磁波等。

金贤敏:是的,这样才能去驯服它们。

王昉:我们今天讨论的主题是未来计算力,不仅仅是量子计算。在计算力的推进上,兄弟登山,各自努力,传统计算机也在不断地迭代。比如曦智科技的光芯片,是介于传统芯片和量子芯片之间的一个技术路径,对吗?

孟怀宇:我先稍微解释一下光子计算的概念,它要比量子计算更接近现实应用一些。一个比较好的比方是我们戴的眼镜或者摄像机的镜头,假如说你有近视,如果不戴眼镜,你看这个世界是模糊的,戴上眼镜后,世界就变清晰了,这是因为眼镜对你眼前的光信号产生了一系列的运算,使得它变得更清晰。这其实就是光子计算的原理。当然,眼镜不可编程,只能做一件事情,而光子计算的硬件底层必须是可编程的,这样才能够使得它适合做各种各样的事情。

王昉:未来计算力将会重塑各行各业。比如有人说,未来的量子计算可以帮助普通人在全球各大股市中挑选股票,或者预测蛋白结构,大大加速制药过程,还能模拟新材料,用来捕捉大气中的二氧化碳。本源量子是全球第三家投产工程化量子计算机的厂商,“悟空”现在用在什么领域?

张辉:首先,各个国家会把尖端科技首先放在军事上,这是大家不计代价会去研究的。现在“悟空”还是用于民用,比如用在金融行业,这里有特别大的数据量要处理,有优化组合问题、快速检索问题。还有人工智能、机器深度学习等都是量子计算机特别擅长的。还有你说到的模拟分子、原子的过程,未来可以用在新药、新材料的研制中。比如说制药行业,中国古代讲炼丹师,我们凭着经验去合成,在小白鼠、大型动物、人体上进行一期、二期,一个新药的研制需要数十年时间,到最后还不一定成功,代价非常大。未来如果我们有一个很先进的工具去大大缩短这个过程,可能只需几周时间就能帮我们找到最优解,最后完成一些人体的临床实验就可以,这就完全可以颠覆这个行业。

王昉:您提到的这个场景大概多少年之后能够发生?

张辉:大家春节期间有没有看过《流浪地球2》?我觉得它里面的时间轴还是比较有科学依据的,大概在二零四几年,还是比较现实的,确实还需要十几二十年的时间。

王昉:有一个说法是,现在的量子计算机可以把一件非常专业的事情干得非常好,打个比方,下五子棋可以下得很好,打败一切人类,但是在通用的事情上做得不够好,比不上任何一台传统计算机。能否解释一下专用和通用之间的区别?

张辉:未来五到十年,是专用量子计算机的时代。现在的量子计算机还不能解决纠错容错的问题。经典计算机里的晶体管也会出错,在我们给它纠错容错之后,它能成为一个通用的机器,能解各种问题。在量子计算机领域,我们现在只能是用一些含噪声的、中等规模,大概在几百个、几千个比特的规模的量子计算机来解一些问题,这个时代可能会延迟到未来的五到十年。所以这五到十年里,专用的量子计算机就像经典计算机的一个加速器,某些特定的量子计算机特别擅长的问题,就交给量子计算机去处理。就像今天的GPU、人工智能专用芯片一样,都是用来辅助经典计算机的,加速解决实际问题。

王昉:我们现在经常会说,某一个行业迎来了它的“iPhone moment(iPhone时刻)”。距离量子计算的iPhone moment——它深入到千家万户,成为我们每个人手里的一个通用型的计算机——还有很长一段时间。现在业界普遍使用的仍然是传统计算机的硬件软件,要让各行各业转向量子计算去寻求算力,这需要一整个生态的建立吧?

金贤敏:是的。短期内,比如说五到十年,专用量子计算机可以在难解问题上去协同传统计算机,起到加速器的作用,这是一方面。另一方面就是你刚才说的生态。现在国产芯片,包括GPU在内,做出来以后别人不用,就是因为大家在软件生态上已经形成习惯。图灵的光量子处理器非常重视能够协同进去,同时慢慢建立软硬一体的软件算法库、软件堆栈,慢慢地从协同到发挥巨大作用,到形成大家使用的方便性,最后才能让大家都慢慢用起来。否则即使爆点已经产生,但是别人不愿意用我们的,我们以前也吃过很多这样的亏。从国家层面来说,早期的布局非常重要。

王昉:曦智的光芯片技术比较成熟,落地场景是不是离我们近一些?

孟怀宇:我可以介绍一下我们近两年来已经实现的一个应用场景。回到眼镜的比喻,可以想象一下,当我们眼镜前的图像发生变化,眼镜后的结果也会瞬间发生变化,这个计算所要消耗的时间很好理解,就是光穿越这段距离的时间。刚才提到的难解问题,有一种解法,就是用一个矩阵不停地转,这种转是连续性的,前一个矩阵的结果经过处理之后,被喂到下一个矩阵的起始点,这样使得计算无法被并行,必须连续转,光子计算对于这样的解法来说就是特别好的匹配,因为我们每次转的时间特别快,假如解一个问题要转5000次、10000次,每次节省的时间加起来就非常可观了。比如说,去年,在一个特定问题——我们称为“伊辛问题(Ising)”上,曦智的PACE光子计算处理器的速度达到了当时最强的GPU的800倍。

王昉:刚才有一位听众问到量子计算与隐私计算之间的关系。有很多人担心,在量子计算可以带来真正的“善”——比方说研制新药、缓解气候变化之前,它能更早更快地被用来“作恶”,比如攻击互联网赖以存在的加密系统。您怎么看?

张辉:大家是否还记得一上来主持人给出的质数分解题?今天我们80%-90%的加密技术都是基于质数分解。编译密码的人很清楚两个数乘起来的结果,但是要倒推出它是哪两个数乘起来的,暴力破解很困难,而量子计算机解决这类问题有得天独厚的优势。但不要忘记,这些尖端的科技,包括经典计算机,最早都是用来破译密码、计算导弹轨迹的,量子计算对现有的密码体系也可以形成一个致命的打击。这个信息安全问题已经受到了中美一些大国高度的关注。但是我刚才说了,要破解现在1000多位或者2000多位的密码,还需要十年二十年时间,所以目前大家的银行卡、互联网账号相对还是安全的。

王昉:前几天马斯克和上千位科学家一起写了一封公开信,试图叫停ChatGPT的继续升级,体现出人类对于呼啸而来的人工智能技术的警觉。在座各位会不会对算力的狂飙突进也有自己的警觉意识?如果算力跑得很快,我们是不是要给它也划定一个跑道,确保它最终符合人类利益?

金贤敏:不像基因编辑可能带来很多负面的东西,算力提升本身没有什么负面影响。我觉得人类文明、地球资源的使用都是有一定时限的,我们应该不停地在整个人类层面中推动科技的进步,使得我们最后能够不断进步,甚至变成非单一行星的、更厉害的文明,不然文明用完了以后、资源用完了以后,我们就只能局限在这个地方。我觉得科技进步是不应该阻拦的。

孟怀宇:我认为技术本身是中性的。今天的很多科技最早都是冷战期间作为武器研究发现的,最后大家都发现了它们对生活产生正向影响的应用场景。我觉得技术可以继续狂飙,我相信人类的智慧。

张辉:我觉得人类的科技整体是向善的,因为最好的技术一定掌握在希望可以更好的服务人类的方向上。

王昉:有一个说法,在工业革命时代,马力就是国力,在信息时代,算力就是国力。三位科学家正在算力的前沿上努力奔跑,谢谢你们的精彩分享。(财富中文网)

编辑:王昉

热读文章
热门视频
扫描二维码下载财富APP