丨划重点
人工智能的初衷是希望能让机器像人类一样,代替人类完成任务,广义的人工智能约等于计算机科学。
Google旗下的AlphaFold这类人工智能产品在科学领域的应用,未来30-50年,有望变革生命科学。
算法、算力、数据的不断发展和完善,为人工智能的发展打下了坚实的基础。
技术从不成熟到成熟,一方面是技术本身迭代,另一方面也需要有社会性的力量,来帮助它成长起来。
人工智能是把人从无聊的、重复的,疲倦的,不安全的事情当中解放出来,人不需要和机器比效率。
丨概述
人工智能,作为计算机科学的分支,一度成为科技互联网创业的风口,但从幕后走向公众视野,却与几场棋局和科学研究有关。
20世纪90年代,IBM曾推出DeepBlue人工智能项目,并于年与国际象棋世界冠军加里·卡斯帕罗夫,展开首场对垒,结局是DeepBlue告负,次年性能大幅提升后卷土重来,首次战胜人类。
另一场经典,则是年谷歌AlphaGo与李世石的对战,AlphaGo以4-1的绝对优势,赢下比赛。
人机博弈之外,AI在科学方面的应用研究也不断突破,日前DeepMind官宣,AlphaFold可以预测出2亿多个蛋白质结构,几乎覆盖了整个「蛋白质宇宙」。
作为AlphaGo和AlphaFold的创始团队负责人,DeepMindCEO哈萨比斯曾表示,「我们将开始看到诺奖级别的科学挑战被一个接一个地击倒。」
问题在于,除了下棋和晦涩的科学研究,人工智能还有哪些价值?日常生活中,人工智能又有什么样的应用?
8月24日晚间,亮见07期,邀请到了商汤科技创新工程院院长,集团副总裁沈徽,对话亮见主理人刘兴亮,讲述人工智能的技术演进、场景应用等话题,以下是直播精华版内容:
01
广义的理解:计算机科学约等于人工智能
刘兴亮:沈老师能否先科普一下人工智能的含义,包括是谁提出人工智能的概念?
沈徽:人工智能是Artificialintelligence直接翻译而来,年达特茅斯会议上麦卡锡首先提出,该会议确定了人工智能的目标是「实现能够像人类一样利用知识去解决问题的机器」,它的初衷是希望能让机器像人类一样,代替人类完成任务。
让一个机器具有一定的思考能力,就叫做智能,但这样一件事情的发生,其实是早于年,年更像是一个里程碑。
年达特茅斯会议参与学者,被誉为「AI之父」,图源:网络
比如年所提出的图灵测试,人与一个黑盒子进行对话,看我们是否有办法判定黑盒子后面到底是一台机器还是一个人。
此外,年学界就已经提出机器翻译的概念。比方从英文翻译到中文或者从中文翻译到法文,机器翻译的概念,它是归属于我们现在的自然语言理解,也属于比较大的人工智能领域之一。
其实「Artificialintelligence」分开看这两个词,Artificial的意思是人工的、人造的。「intelligence」实际上是智能。智能不光是人具备,生物界很多的动物它们都具有一定的智能,但从某种程度上来看它们的智能所涵盖的范畴,跟人类不是完全相同的。
如果从一个相对更广泛的含义上去理解,我觉得人工智能就是人能够去制作出具有一定思考能力或者决策能力、感知和判断能力的机器或者产品。从这个角度去思考,计算机科学与人工智能很大程度上两者可以约等。
举个最简单的例子:数据库系统。数据库系统主要做两件事,记忆和检索,以及在记忆和检索的基础上做出查询,统计和推导。
如果我们把数据库系统当成一个黑盒子,它是不是具有一定的智能?坦率来讲,具备一定的智能。因为记忆本身就是智能的一种属性,在记忆的基础上做分析和推导,也是智能的一种属性。所以从这个角度来看,我觉得大量的计算机科学领域相关的,包括数学领域相关的一些内容,都成为人工智能的基础甚至某种智能形态。
人们对于人工智能可能更多的是从「它与人的相似程度」的角度去思考,就会把范畴变得更加狭窄一点。
日常生活中人们会困惑:人工智能技术到底是怎么样的?我个人理解是人工智能的构建方法有两个比较大的流派。一派是基于符号逻辑的规则体系构建,另外一派是基于数据统计模型的模型构建。
人的思考过程或者人的智能过程中基本上有两类方法,一类叫演绎,一类叫总结或者归纳。演绎是「我」有一套不证自明的公理,在这个公理之上,我能构建出很强大的一套逻辑系统。这套逻辑系统在人工智能中的一个例子,就是专家系统。
专家系统就是针对一个特定的领域,列出大量的规则以及规则间的推导关系,人们将遇到的该领域的问题放到专家系统,就会得出一个结论,而且结论所能够涵盖知识库是相对比较精准的,也可以说,专家系统是基于符号逻辑的。
但深度学习和阿尔法狗更多的是基于统计模型。在统计模型之下,「我」有大量的数据,数据间蕴含着一些关系,即人利用机器学习的办法或者模拟人的神经网络去习得这种关系,或者叫模型。
人的大脑里有一套神经网络,用机器去模拟这套神经网络,大量的数据经过神经网络以后,不断的反推神经网络结构,这个神经网络系统就是最后的产品,当你抛出一个问题,它就会给你一个答案,并且它具有泛化能力比较强的特点,即使问题可能不完全是在它之前涉及的样例范围中,可能稍有偏差,得到问题后它仍然能够得出一个相对满意的结果,缺陷则是很难达到%的满意度。
在近15年到20年的时间内,基于我们的深度学习或者深度神经网络这类统计模型,取得了非常大的进步。一方面得益于半导体技术以及计算机体系结构不断的迭代,算力得到极大的增强。另一方面是从上个世纪90年代末期开始,互联网帮助我们将世界很大程度进行数字化,我们得到大量的数据以后,数据本身变成AI的燃料,变成人工智能的燃料,去推动人工智能技术的发展。
最后一方面,在人工智能的理论化和工程化,人类也取得了很大的突破,最早可能是从语音识别开始以及搜索引擎上的内容排序,之后慢慢就到自然语言理解,甚至一些深度的内容理解。过去计算机视觉在面对不确定环境的情况下,决策最后往往是人工决定,现在智能方面,很大程度上已经能够用计算机自主得出比较精准的结果,这也是为什么最近几年,人工智能话题在进入公众的视野后也变得特别火。
02
人工智能未来30年-50年,有望变革生命科学
刘兴亮:人工智能如何突破科学课题,实际应用层面,它的意义有哪些表现?
沈徽:人工智能的历史至少与计算机的历史一样长,甚至更长。在上百年的历史过程中,是在不断的开花结果,只不过有的效果可能看得比较清楚,有的可能是一个潜在长期的过程。
我们知道医学虽然历史很长,但现代医学其实很短的。真正有理论支撑、有实验支撑的医学可能只有两三百年,其中真正有效的、能为普罗大众带来好处的药物品种相对比较少,但是这个问题会随着蛋白质测序的发展而得到改变。
每个人都有自己的遗传基因DNA,蛋白质是从DNA当中产生出来的,DNA只能决定蛋白质的组成成分是什么,不能决定构成什么样的形状。
蛋白质的形态实际上是粒子之间的相互作用力,但因为蛋白质是非常大的分子,是由几千个几万个甚至更大的粒子构成,当你去预测它的结构形态,可以想想它的搜索空间是极大的。
Google下属的Deepmind部门研制出了AlphaFold系统,用来预测蛋白质的折叠方式。
AlphaFold系统实际上是用一种深度学习的方法能够比较精准的去预测蛋白质的结果,这与我们又有什么关系?
AlphaFold预测蛋白质模拟图,图源:新智元
很多的疾病,尤其是一些比较个性化的疾病,由于身体里面的某些蛋白质缺失或者蛋白质改变导致,近几十年出现了靶向药的概念,尤其是针对癌症治疗靶向药的患者,可能基因里出现问题,这类问题的修复,其实是针对它产生的蛋白质去做修复,就能够防止某一类疾病的发生。但是靶向药的开发投入巨大,耗时耗力。
所以说,所以AlphaFold系统所代表的技术,将来可能以非常高效的手段发现并帮助人类解决问题。
也许若干年之后,我们探索发现到最后研制生产和使用靶向药的速度会更快,成本更低,可能我们可以针对任何一个单独的人,用极低的成本和快速的研发,就对他的特定疾病进行靶向药的针对治疗,从而更快的恢复健康。尽管这是一个畅想,我觉得可能会慢慢实现,也许是30年,也许是50年之后,所以人工智能的实际意义肯定是巨大的。
03
工业红线是AI可用与否的关键
刘兴亮:如果让您来当裁判,评估人工智能的发展水平,满分一百分,您觉得目前能得多少分?
沈徽:其实我们谈论更多的是人工智能技术的发展水平是不是已经超越了一个「工业红线」,当一个技术,它在工业红线之下的时,不太可用,会出现大大小小的问题,但它超越红线之后就变得可用或者人是可以在相当程度上依赖它的。
所以评估的标准,要看人工智能在它相关的一些应用领域上是不是已经越过了工业红线,以及在多大程度上越过?对这个回答我是相当乐观的。
拿计算机视觉来说,这是AI很重要的一个领域。我们的AI技术很早就在物体识别和人的识别上超过人类,人眼的错误率大概在6%左右,机器的错误率则远远低于这个数字。
再比方AI创作,去画一个风格画,或者是做一个特效,现在AI很大程度上不一定以假乱真,但基本上已经是非常接近一个实际的人去作画,所以AI技术已经超过工业红线,甚至远远超过专家的水准,但我们不能下结论说AI已经超过人,它离人的智慧还是差得很远。
AI作画成品图,图源:量子位
到底差在什么地方?
首先,我觉得物体识别它超过了人类,仅限于非常细分的、垂直,定义好的场景,但是如果想要把能力泛化到任何一个领域去,这样的一个泛化能力是相对缺乏的。
换句话说,可能我的某一个特定的算法它做识别类任务特别好,但是其他类型的任务,是否还能够做准确的分类?需要打个问号,如果是AI没有见过的,可能得到的结果并不好。
其次,我觉得需要解决技术的资源消耗,或者说成本问题。如何能够让一个针对特定领域的AI技术,很快、很容易的应用,就涉及到投资回报率的问题,只有当投资回报率足够好时,它才有可能会大量应用。
如果拿人脑举例,我们人脑的功耗是大约20瓦,当你仔细思认真思考问题时,大概功耗是20瓦。今天一块GPU卡很轻易就能达到瓦,这样的一块GPU卡,功耗远超人脑,如果需要0块的卡,才能解决某个特定问题,并且做的比人类好,那么投入产出比就是不理想的。
再者,AI它作为一个技术,本身很难体现出使用价值,它必须要跟实际的场景做结合,进行赋能,必须要与实际的问题做结合。这时它的价值、使用价值,才会体现出来,而且把AI技术跟实际问题结合的前提,是开发人员必须了解实际的问题。
比方说新能源汽车电池,有很多重要的质量检测环节,如果检测不严格是有安全风险的。过去产线上可能有道工序,就有个检测的环节,如果不到电池厂去观察生产流水线,去与技术员交流,不了解电池的电化学、热化学理,很难设计出符合应用场景的AI算法,去解决问题。
所以AI的技术应用,它不是单门靠计算机科学家、人工智能研究员、算法工程师就能完成的,它是需要跟行业的专家交流来进行技术结合。彼此越了解,它产生的效果就会更大。
04
算法、算力和数据是人工智能发展的关键
刘兴亮:人工智能技术它的关键到底是什么?
沈徽:人工智能,特别是近20年,基于深度学习的人工智能技术,我觉得有三个非常重要的因素:算力、算法、数据,以及我个人的看法:应用落地。因为我认为应用落地或者是对用户需求的满足,实际上是为三要素做一个方向的指引,用需求去引导供给。人工智能的技术爆发或者成熟度的提升,是与三要素不断的被满足或者不断的取得突破,有非常紧密的联系。
先从算力说起,算力的增长,我觉得是一个很客观的因素。算力与摩尔定律有关,具体到半导体上,芯片产业每隔18个月,它的性能提升一倍,价格下降一半。这其实是非常可怕的规律,因为它是一个幂指数的上升,而不是一个线性的增长。
第二个是数据,我觉得数据很重要的原因有几个推手。第一个推手是互联网应用产生大量的资讯、数据,不断将其结构化、网络化,变得容易获取,能够共享聚合。另外一只推手是世界范围内所谓的数字化转型。
数字化转型其实就是把企业内部以及企业之间经营的相关的内容能够以一个数据的方式呈现出来,记录下来,进行分析。这些内容都为深度学习提供了大量的燃料,这些燃料能够去帮助深度学习技术去产生更好的模型,帮助人类解决问题。如果没有互联网以及数字化转型的浪潮,他们在过去15-20年做的铺垫,就会变成巧妇难为无米之炊,AI的发展也正是是受益于此。
第三个算法,其实算法的背后就是人以及人在思考上的突破。一方面体现在高校、研究院的众多科研人员对于深度学习本身的认知,包括神经网络、深度学习网络的认知,也包括实践上的认知和数学上的认知。此外还有大量的应用在落地之后,是对研究方向以及研究课题提出反馈或者提出引导。而这些引导会吸引大量的工程技术人员去尝试此类方向。其实这就形成了一个很好的循环,从高校研究所到企业到政府再到用户,这样一个闭环。
所以我觉得算法、算力、数据三个要素在过去的一段时间里,是不断完善的,同时也为人工智能的发展提供很重要的基础。
刘兴亮:目前人工智能在哪一些行业已经开始应用,效果怎么样?为什么消费者对人工智能的感知不明显?
沈徽:坦率的说,人工智能的应用已经是在广泛落地。举几个例子,其实人工智能最初的落地。可能是在商业用户领域。比如去商场停车,以前都有岗亭检票,依据票上的起始时间最后计算停车费用。如今再去商场的停车场,它会有机器识别车牌号,当你准备离开时它会语音播报你的停车时间和停车费用,之后你再去扫码付费,在这个过程中,有相当多的AI技术。
第一个AI技术是出入停车场识别同一辆车,通过追踪你的轨迹,包括最后的停车位置。另一个是扫码支付过程中的识别,甚至现在有扫脸的方式进行自动支付,只不过在此过程当中,可能大家没有那么深切的感受到是AI技术在发挥作用。
另外一个例子比如所用到的腾讯会议的美颜功能,就涉及到大量的计算机视觉技术。如果AI错误地识别人脸上一个位置,可能我的鼻子就会「消失」,应该找到正确的地方去皱纹、皮肤增亮。这些都是对人整体的各个五官,各个部分的一个识别,在识别的基础上去做相应的AI技术应用。
为什么消费者对AI的感受不是很明显,我觉得历史发展本就需要时间,一个新技术都是从不成熟到成熟的。
当它还不成熟时,却又跨越了工业红线,就会比较容易在B端落地,原因是:
第一,B端的需求和环境是比较明确的,比方说停车场,它其实不是在任意一个位置去识别你的车牌,它是在出入口识别,会有高光的灯打在车牌的位置让它环境变得相对可控。
第二是使用场景相对单一,是收费停车场,去完成一个车牌识别收费的动作。车牌识别其实在我们生活当中可以发生在很多地方,商厦只一个特定的场景。
第三是技术的使用者。B端的技术的使用者往往是有一定的技术能力的,受过训练的,使用产品是工作的一部分,他就更容易去接受一个相对来说需要去有一定学习曲线的新东西。
但是,我觉得一个新技术,要让普罗大众受益,一定要走到C端,去