疫情加速智能经济到来
2.1、基于深度学习的人工智能:一种新的通用技术
当前人工智能技术的发展距离科幻小说中可以在各方面和人相比的通用人工智能(人可以做的机器都可以做)相差甚远,而且目前技术也并没有在这个方向取得突破。然而,基于深度学习的人工智能可以利用大量的来自特定领域的数据训练机器识别数据和期望结果之间的关联性,从而为想要的结果做出最佳决策。尽管局限在一些领域,这种识别规律,得出最优解,和做出决策的能力是人类智能的重要体现,其广泛的用途使得深度学习成为了可以与蒸汽机、电动机、计算机和互联网相提并论的又一项通用技术的突破。深度学习的广泛应用可以大幅提升人类生活各个领域的智能化水平。
2.1.1、通用技术与人类进步
现代经济增长理论中把对经济增长和经济结构变迁产生广泛影响的技术定义为通用技术[2]。通用技术的典型特征包括几乎可以运用到人类经济的所有领域,能有效提高生产效率,并且在该技术进步的同时能够催生其它领域的新的技术形成良性循环等。
尽管有关通用技术具体包含哪些技术学界内尚无明确定论,但人工取火、轮子以及为人类社会进入到机械化、电气化、信息化时代起到决定作用的蒸汽机、电动机、计算机和互联网都是公认的通用技术。
2.1.2、从人工智能到基于深度学习的人工智能
智能一般指知识和智力的总和,前者是智能的基础,而后者是指获取和运用知识求解的能力,或多或少的具有依靠过去经验处理新问题的创造力。在计算机和控制技术帮助机器实现自动化(在人预先设定之后,依据设定的安排自动执行)之后,从上个世纪50年代开始,人类就开始了让机器具有人类某些智能——人工智能的探索。
迄今为止的研究表明,实现通用人工智能还远不现实,在伦理和安全性方面也有巨大的风险。即使是实现狭义人工智能(在一些特殊领域里面可以预测、分类和决策的人工智能),也一直面临重重的困难。直到近10多年来,以深度学习作为基础的人工智能算法在实现狭义人工智能的功能方面取得了突破,才真正令人工智能被普遍视作可以与蒸汽机等相比的通用技术。
那么什么是深度学习呢?一种使得机器具有智能的思路是让机器具有学习能力(机器学习),而一些科学家试图模仿人脑的结构来搭建机器学习硬件和软件基础(神经网络),其中通过多层神经网络实现机器学习又被称为深度学习。
这类网络包括输入层,中间层,和输出层等多层结构(图4)。输入层的每一个单一节点类似于一个多元函数(如y=f(x1,x2……)),接受一些外部输入数据(x1,x2等)。当然,f的选择有讲究,而f的参数(其实就是各个输入变量的权重)在初始阶段通常是随机设定的。这个函数会根据输入的数据计算输出一个数值y,y会给到下一层网络的每个节点作为输入变量。输入层的其它节点也都是如此(当然初始的f的参数因为随机设定都不一样)。中间层和输出层也都是类似的多元函数,接受数据输入并运算进行输出。最终在输出层会得到一个输出的数值。算法的设计者可以要求机器按照某个规则进行判定(例如大于0.5则“是”,小于则“非”)。
由于初始输入的数据是经过标注的,也就是我们知道输入数据和判定结果之间的关系,也就是知道机器的判断是否正确。如果判断错误,那么就通过类似求导等的方式修正函数的参数(从f变成f‘)。然后用更多的数据来训练/优化网络上每个节点函数的参数。如果数据量足够大,研究者发现在许多领域机器的判别就能够得到比较满意的结果。
举例而言,如果让机器识别一个物体是否是猪,输入的信息可以是该物体重量,长度,宽度等多方面的数据(如果是图像识别则是图像上一些点的颜色、亮度等)。在整个网络各个参数都是初始随机设定之后,输入的数据经过几层网络会计算出一个数值。可以设定判定的规则是大于0.5机器就认为该物体是猪,而小于0.5则不是。如果机器判断错误,程序就会对参数进行修正。通过大量的数据(经过标识的猪和非猪的样本)不断训练、修正各层网络上的各个节点的参数,最终就可以得到一个可以对物体是不是猪进行识别的有效的人工智能算法。
2.1.3、 过去十年的突破与数据瓶颈
过去十多年间深度学习人工智能技术的突破性进展与数据、算力与算法共同的突破与进步有关。
伴随着互联网的运用足够广泛,人类才搜集出了足够多的数据足以训练深度学习算法下的人工智能;大量的数据输入和巨大的参数规模对计算能力也有要求,近10年以来包括GPU在内的一些技术的运用也才使得处理深度学习的硬件条件逐步成熟;当然,被誉为人工智能之父的杰弗里·辛顿同样居功至伟——为了能够使人工神经网络处理复杂的问题,必须增加神经元的层数,但是多层网络在参数调整方面存在一些特殊的困难,辛顿在2006年终于找到了对于多层神经网络进行训练的方法才使得深度学习成为了可以媲美蒸汽机、互联网的通用技术。
在本文中,除非专门指出,后续所有提到的“人工智能”一词都特指基于深度学习的人工智能应用。
目前看来,虽然人工智能算法的优化,支持算力的硬件的改善都需要资金的支持和技术的持续进步,而人才更是昂贵,但是缺少数据特别是经过标签的大规模数据仍然是人工智能应用的主要瓶颈[3]。当然,研发者也采取了各种方式来获取数据,包括在提供产品和服务的同时搜集数据,雇佣人员为数据贴标签等等。
2.1.4、 人工智能的优势与局限
基于机器学习的人工智能可以在一些特定领域识别规律,进行优化,做出决策。与人类智能比,人工智能不仅仅速度更快,处理的频次更多,而且在精度方面可以做的更好(质量更高);除此以外,人工智能还可以发现人类所忽视的弱相关(例如用户手机上输入生日的手速和个人信用之间的关系[4]),更好的为优化和决策服务。
当然,人工智能也存在着非常明显的局限:
-
尽管算法、算力与数据已经有了大幅提高,人工智能算法仍然只能在一些特定领域解决问题,而且有关控制论的一些研究证明过度复杂和精细的动作难以被机器所模仿[5]。算法、算力、数据、特别是经过标识的数据的数量的不足(包括大量数据属于不同所有者形成“数据孤岛”、难以整合)以及控制技术的缺陷仍然大大限制了人工智能应用的领域。
-
由于人工智能缺乏归纳、抽象、推理(如举一反三)等能力,人工智能不能完成需要相关能力的复杂的任务,包括进行刑事调查、根据现象提出假设并验证科学理论,提出或解答开放式的问题等等。也因为缺乏这些能力,面对动态变化的环境,人工智能在短时间和信息不对称下做出决策和采取行动就比较困难[6]。因此,举例而言,在封闭、干扰较少的区域(如洋山港)的自动驾驶卡车已经进入应用阶段了,但是需要处理复杂环境的私家车自动驾驶还遥遥无期。
-
当前的人工智能由于缺乏人类的各类心理特征,因而在需要创造力,移情与沟通技巧等方面表现较弱。例如人工智能的语言翻译在基本意思的能力方面,比如翻译一般性的新闻等已经基本够用了,但是在要求“信达雅”的情况下,则与人类的专业翻译还相差十万八千里。
总体而言,当前的人工智能更多看起来像是一种工具,距离想象中的智能仍然有相当距离。即使是在中长期而言,基于深度学习的人工智能对于人的替代也有明显的局限:对于体力劳动而言,越是需要高动作技巧,且越是容易面临新的、不确定的环境的工作越不容易被替代;对于脑力劳动,则越是需要创意和决策能力等能力的工作越难以被替代。不论是对于体力劳动还是脑力劳动,需要社交能力更强的工作均较不容易被人工智能替代[7],但是传统上较高端的、着眼于优化的工作(如设置最优保险费率)则有较高的风险被人工智能替代。
2.1.5、 智能经济的四阶段
基于数据获取的先后次序和难易程度,人工智能在应用层面可能包括四个阶段:互联网应用智能化,商业活动智能化,实体世界智能化,和机器行动自主智能化。
-
互联网智能化:用互联网服务获取的各类数据训练人工智能,实现一些互联网服务的智能化,也是人工智能应用最早落地的领域。互联网智能化的代表应用就是智能营销:互联网公司运用用户使用互联网的各类痕迹(如:浏览历史,点赞,搜索记录)来训练人工智能,了解、研究、学习用户的个人喜好,进而为用户推荐专门的针对性内容。
-
商业活动智能化:各类传统商业企业运营(金融、医疗等)而产生的数据也可以被用于训练人工智能,使得相关商务服务的智能化程度提高。举例而言,银行在发放贷款时积累的有关借款者收入、财产、信用历史等方面的数据可以训练人工智能来控制信贷风险;常年的诊疗数据也可以被用于训练人工智能,从而使今后的诊疗更加高效。
-
实体世界智能化:随着大量的传感器以及物联网(IoT Internet of Things)设备的推出,大量的实体世界的数据被收集并上传至互联网,这样一来,即便人类并没有上网留下痕迹或者像去银行贷款一样填写个人信息,人类的一举一动都会被作为数据记录起来。自然这些数据也可以被用于训练人工智能。通过这些数据所训练出的人工智能相应地也获得了感知实体世界的能力,如识别图像,识别声音,识别正在附近发生的事情。
这种情况下,日常生活中各类物品都会拥有感知和反馈能力并且彼此连接:例如家中的空调或许能够了解用户对温度的需求从而自动调整;冰箱或许能够通过识别冰箱中各种食物进而判断用户缺乏何种营养并通过超市的购物车在主人购物之际提出合理化建议;课堂上,人工智能或许能够通过识别学生微表情来判断每个学生对不同内容的掌握程度,进而输出针对每个学生的个性化教学方案。人工智能对用户一举一动的识别使得用户永远处在线上,人类与机器的关系深度融合。
-
机器行动自主智能化:随着机器通过人工智能获得对声音,图像等外界信息的识别能力后,进一步地,在实时获取外界信息的情况下进行决策,并借助控制技术采取自主行动。举例而言,无人驾驶人工智能可以驾驶汽车;采摘机器人可以通过图像识别等技术自动判断果实的成熟度进而进行采摘。这一阶段的智能化集以上三个阶段之大成[8]。
2.2、 疫情加速智能经济到来
西谚有云“上帝为你关上一扇门就会为你打开一扇窗。”新冠疫情的爆发和防疫的长期化虽然对中国和全球经济形成了明显的冲击,一些行业受到的打击尤其惨烈,但是却产生了对于医疗人工智能、非接触式人工智能产品的大量需求。大量活动的互联网化也在为训练强大的人工智能算法奠定数据基础,而出于应对需求和刺激经济等多方面的考虑,企业与政府也在智能经济所必须的基础设施和软硬件方面加大投入——包括扩充服务器、加速5G网络、物联网建设和相关规则的制订等。人工智能在诸多领域的应用正在加速落地,而智能经济也正在加速到来。
2.2.1、 疫情直接催化对人工智能产品的需求
疫情爆发对于医疗资源的挤兑直接推动了医疗领域人工智能的加速落地;同时,为了防范疫情传播而产生的对非接触式服务的需求显著催化了对于无人消毒、智能监控、无人配送、无人零售、远程智能教育、远程贷款催收等人工智能产品的应用变成现实。
医疗人工智能显著提升了相关领域医疗服务的效率和质量,在对抗疫情的一线直接发挥作用。针对新冠疫情的诊断带来了CT识别需求的急剧上升,阿里宣布向全球医院免费开放新冠肺炎人工智能诊断技术,20秒即可完成一次疑似病例的CT诊断,准确率高达96%以上。
为了防范疫情传播,减少人与人接触的需求也同样催生了或加速了大量人工智能的应用。无人机器人在防控疫情期间的消毒、测温、巡逻中都表现出色;大规模的智能监控明显降低了居家隔离等措施的落实难度;由于疫情发生期间网购订单的激增,以及人工配送可能带来的交叉感染风险,京东、苏宁等企业第一时间就在武汉等一些地区启用了智能配送车和配送机器人,机器人可以自行判断路线、乘坐电梯、以及提醒消费者取货,实现“无接触式配送”——实际上,由于机器人快递牵扯的安全、法律等问题较少,很有可能比无人驾驶汽车等要更早全面落地。
疫情冲击之下,无人零售热点重燃,智能教育迎来新的发展机遇,而一些新的人工智能的应用更令人惊叹。2月2日,一家由湖北中百仓储和阿里巴巴合力搭建的无人超市在武汉火神山医院开始营业,消费者从挑选到支付全程都是自助式完成。在2020年新春期间数亿人远程上学之际,一些企业提供的人工智能自主学习系统,则提供了形成个人学习画像,规划最佳学习路径,推荐针对弱项的视频学习和针对练习等定制化的智能教育服务内容。疫情爆发之后,中邮消费金融等消费金融公司暂停人工现场催收,启动智能机器人远程催收——与人工催收相比,智能机器人可以批量呼叫,全年无休,情绪稳定,没有语言暴力,保障合规,而且不存在人员培训和流失的问题,效率大幅提升。
2.2.2、 疫情加速数据积累和整合——为人工智能的训练提供素材
疫情的爆发在直接催生了对于人工智能产品的需求的同时,也改变了用户的消费习惯和活动方式。大量活动的互联网化显著增加了数据量的积累,企业、政府也对数据进一步整合,这为进一步优化现有的人工智能以及训练其它的人工智能算法打下了基础。
疫情的爆发首先推动了数据大规模的积累,包括在此前数据积累相对薄弱的领域,和一些新兴的领域。例如,今年春节七天长假和在家办公期间生鲜类APP的平均日活同比增幅超过了100%[9],非接触支付等传统的线上活动也进一步的增长,积累了更多的数据。义务教育阶段的在线教育由于获客成本、消费习惯、政府管制等多方面的原因,发展一直存在一些瓶颈,疫情的爆发和教育线上化也推动了相关数据的积累,统计显示学生学习类APP的平均日活同比增幅出现了翻倍。疫情爆发之后,不少房企推出“线上售楼”的营销模式,利用VR技术提供线上立体化展示;部分车企也推出线上看车等业务;“直播带货”的火爆和网络明星成为了社会广泛关注的现象,这些新兴营销手段也带来了大量的新场景下的数据积累。
在数据整合方面,疫情也起到了催化剂的作用。例如,各省市都建立了新型肺炎疫情监控平台,将医疗数据与大数据结合,实现了同行车次查询、同行航班查询、周边社区确诊查询等应用,分散在各个部门的数据有机会被统一调取、分析和用于人工智能的训练——有助于打破“数据孤岛”。由于涉及病人隐私、数据标注需要医学专家等原因,医疗领域的人工智能企业获取数据一直存在一些挑战,疫情爆发以后腾讯与钟南山院士团队共同成立大数据及人工智能联合实验室,以大数据及人工智能攻坚流行病、呼吸疾病和胸部疾病的筛查和防控预警。医疗人工智能的应用在一定程度上获取了官方的认可,在数据整合方面的便利程度大幅上升。
2.2.3、 疫情进一步推动人工智能硬件设施升级
在对在线活动以及人工智能需求显著上升之际,互联网和科技巨头们也都抓住时机升级自身的硬件系统,为未来人工智能的发展铺好道路。例如,以腾讯会议、阿里钉钉为代表互联网服务商在数亿人线上办公、线上教学之际大幅的扩充了自身的云服务器。
部分的因为疫情冲击,政府不仅仅看到了人工智能应用的巨大潜力,而且结合对经济的刺激计划,大力推动5G网络、数据中心、物联网、人工智能等新型基础设施建设的进度。其中5G网络因为其传输数据量的显著扩大和延迟时间的显著缩短是实现实体世界的智能化和机器行动自主智能化的重要基础设施。例如,如果自动驾驶的信息输入和运算输出之间存在数秒延迟,安全性肯定无法保障。
2.2.4、 全球面临人工智能风口
截至北京时间4月26日,美国约翰斯·霍普金斯大学的统计显示,全球新冠确诊病例约达280万例。伴随着疫情持续扩散和防控疫情的长期化,与中国类似全球人工智能产业也都迎来了跨越式发展的契机。
人工智能技术首当其冲被用于疫情的预测和诊断,帮助缓解医疗资源的高度紧张。例如,BlueDot公司基于自然语言处理技术来搜寻新闻报道、公共健康数据和其他资源,在新冠爆发之初发挥了监测的功能。谷歌宣布与政府合作搭建在线问诊网站,利用人工智能技术帮助人们进行自我筛查。
基于人工智能技术的机器人、无人机、语音外呼等应用也同样在生产生活领域显示出其巨大的发展潜力。在疫情期间,美国沃尔玛在商店中继续推广自动驾驶机器人的使用。谷歌旗下的 Wing 无人机也于近期开始大规模进军物流配送业,两周内完成了超过 1000 次送货服务。韩国著名人工智能企业Hancom集团引进了外呼机器人的方案和技术,并于3月24日正式在韩国上线使用。
此外,随着疫情的加重,人们外出减少,线下的需求也纷纷转为线上,这为人工智能未来的发展提供了潜在的数据资源。在美国,苹果、谷歌在内的多家企业都选择远程在线办公。疫情也拉动了韩国网购消费增长,根据韩国产业通商资源部发布的调查数据,2月网络零售额与去年同期相比增长幅度为34.3%,是自有相关分类统计以来单月最大同比增幅。网上交易规模的扩大也将改变用户习惯,进一步带动在线支付产业的发展和消费数据的积累。实际上,在网络购物等领域具有优势的亚马逊等美国科技企业的股票也在近日创出新高。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2.本站的原创文章,请转载时务必注明文章作者和"来源",不尊重原创的行为本站或将追究责任;