i. 显示屏:早期的电脑显示屏只能显示单色图案,后来出现了彩色显示屏,能显示的信息更加丰富。不过一开始的CRT显示器屏幕是弯曲的,显示效果有较大的失真。之后出现的平面直角显示器缓解了这一问题。之后新的成像方式代替了原有的显像管成像,液晶显示器走上了舞台,人们开始追求更高的分辨率,从800*600到1024*768的15、17寸CRT显示器,到1440*900的19寸LCD,到近年来主流的1080P显示器,以及崭露头角的2560*1440分辨率2K显示器和4096*2160分辨率的4K显示器,一块屏幕所能显示的内容翻了数翻。
ii. 鼠标:苹果设计的世界第一款大众普及鼠标“Lisa”,它在位置指示上比键盘更加人性化,是“图形人机交互”的始祖,随后鼠标逐步成为计算机的标配;刚开始发明的鼠标仅有两个滚轮和一个按键,也就是只能实现指针移动和单击的功能。随后鼠标的传动装置由原先的滚轮变为滚动球再变为现在流行的光电转换器。鼠标移动的速度和位置检测的精度都在不断上升。鼠标按键的功能也在不断增加。从开始的单键,到双键、三键、到滚轮的加入,侧键的加入。不仅可以实现单击、双击等功能,还能实现页面滚动,自定义组合键等。同时,键盘和鼠标的连接方式也在不断进化,由原先的有线式,发展到2.4GHz 无线连接再到蓝牙连接。现在的鼠标键盘已经能够实现一键在多设备之间进行切换,一套设备就能控制多台电脑。而高端鼠标键盘一直在向低延迟和高舒适度方向发展,力求将用户的指令尽快送入电脑。
iii. 触屏技术:经历了从单点触控到多点触控。触屏技术的早期载体是PDA(Personal Digital Assistant,个人数字助理),PDA的一大特点就是手写输入,它的基本的功能包括通讯簿、行事历、记事本、计算器等。从此,图形交互的输入方式有了新的发展,实现了触控输入,能够直接在屏幕上操作设备。早期手写笔输入主要的控制方式是通过点按屏幕上的按钮,后来智能手机的出现将这一操作方式继续推进,此时的触控输入不仅仅局限于点击按钮,还能够识别多点触控和多种手势,例如双指缩放等。随后,触控操作从智能手机普及到电脑上,带有触摸屏的笔记本电脑出现了。
2) Nvidia Tesla P100芯片:2016年4月6日,英伟达CEO黄仁勋在其公司GPTech 峰会上发布了一款支持深度学习的新型芯片Tesla P100。这是英伟达第一次设计一个专门用于该领域的芯片,专门用于加速人工智能,专门用于加速深度学习,并且英伟达决定全力投入人工智能。Tesla P100芯片安装了150亿个晶体管,是目前市场上许多处理器、图形芯片的3倍;芯片面积为600平方毫米,双精度运算速度5.3万亿次,单精度运算速度10.6万亿次,半精度运算速度21.2万亿次。Nvidia同时发布了一款搭载了八个P100芯片、可用于深度学习的计算机DGX-1。
3) IBM TrueNorth芯片:2014年8月7日,IBM宣布研发出一款可以像大脑一样工作的计算机芯片TrueNorth。TrueNorth使用了54亿个晶体管,分成4096个“神经突触内核(neurosynaptic cores)”的结构;每一个“神经突触内核”结构都能使用crossbar(交叉)通讯模式来存储、处理并向其它结构传输数据,这些计算内核产生的效果相当于100万个神经元和2.56亿个突触。TrueNorth芯片只要几厘米的方寸,功耗只有65毫瓦。TrueNorth是IBM参与DARPA的研究项目SyNapse的最新成果;SyNapse全称是Systems of Neuromorphic Adaptive Plastic Scalable Electronics(自适应可塑可伸缩电子神经系统,而SyNapse正好是突触的意思),其终极目标是开发出打破冯诺依曼体系的硬件
报告:机器人产业发展趋势及投资前景分析
智能化“大脑”来袭,人与机器的深度交互和应用成为关键。智能手机之后,市场一直找不到能像PC和智能手机一样具有爆发性的消费级产品。但新型智能硬件将孕育出下一代爆款产品已被市场接受并预期,无人机、VR等产品也被寄予厚望,产业一度非常火热。从我们观察的角度讲,抛开现象看本质,无论PC还是智能手机的普及,都解决了人和机器面临的两个最关键问题:交互和应用。我们认为只有更好的解决这两个问题的智能硬件,才能是下一代全面普及的智能硬件产品。
智能机器人:下一代消费级人机交互中心。 “机器人→智能机器人”将是大势所趋,我们认为智能机器人之所以能够爆发有两大主因:1)有望极大的改善人机交互方式;2)强大的数据获取、处理以及应用能力。根据电子产品发展规律,改善人机交互一直是不变的追求,机器人有望通过图像和声音等全方位识别技术极大改善人机交互。与此同时数据量指数增长,机器人有足够空间集成各类芯片,形成一个整体的智能化应用产品。我们认为智能机器人很有可能成为继PC和智能手机之后新一代的杀手锏级别产品,极大方便我们的生活,并带动AI和软件等相关产业链快速爆发。
AI是智能机器人产业核心推动力。AI的发展直接决定了智能机器人的人机交互能力和数据的获取与处理能力。AI的实现可以分为对“外”的语音识别、图像识别等感知技术,以及对“内”的算法+数据+硬件技术。对外方面,AI对感知技术的提升直接决定了人机交互的体验和准确度。而对内的算法及AI处理芯片的进步则决定了数据的获取与运算处理能力。
投资建议。以智能机器人为代表的智能硬件产业随时可能爆发,AI将扮演决定性作用,我们强烈看好国内具备AI能力及应用,以及智能机器人产业链的上市公司,重点推荐:东方网力、科大讯飞、中科创达、同花顺(智能投顾)。
风险提示:1、AI技术进度低于预期;2、产业受制于政策等因素发展缓慢。
一、智能化“大脑”推动产业进入关键历史时期
全球机器人市场规模不断扩大,亚洲成最大市场:据国际机器人联合会(IFR)统计,2015年全球工业机器人销量超过24万台,同比增长8%。2006-2015年,全球工业机器人销量年均增速约为14%。2014年亚洲销量约占2/3,中国、韩国、日本、美国和德国五大市场的销量占全球工业机器人总销量的75%左右。从地域上看,亚洲是目前最大的机器人市场,2014年中国、日本、韩国的工业机器人新装机量分别在全球排名第一、第二、第四,三个国家工业机器人市场规模占全球工业机器人销量的47%。此外,根据《中国制造2025》的规划,2020、2025和2030年工业机器人销量的目标,分别是15万台、26万台和40万台,预计未来10年中国机器人市场将达6000亿元人民币,增长前景诱人。
国内市场,本土品牌迎良机,市场份额稳步提升:据统计,2015年在中国购买的工业机器人中,外国制造商占了69%,中国本土品牌的份额继续上升,占比31%,而2013年中国本土品牌的份额只占25%,2014年占比为28%,2015年首次国内市场份额占比超过30%。国内机器人企业2015年销量增速为27.5%,同期外资企业在国内销量增速为12.7%。在全球机器人市场规模不断提升,亚洲市场不断扩大的前提下,国内本土企业迎来发展机遇,国产工业机器人的发展仍不失为制造业转型升级的一大亮点。
智能化“大脑”来袭,机器人→智能机器人,产业正经历关键历史时期:过去的机器人以半自动化地机械性劳动为主,而近年随着图像识别、语音识别、深度学习等技术的快速发展和突破,机器人产业也迎来了关键的历史时期,AI技术的快速发展为机器人植入了智能化的“大脑”,智能化将成为机器人产业的升级方向。根据Gartner最新发布的2016年新兴科技技术成熟度曲线图,智能机器人已经进入期望膨胀器,并处于上升阶段。未来“智能”二字将成为机器人行业的主旋律。
二、智能机器人爆发的两大主因:交互+应用
我们为什么认为机器人将迎来爆发?其实上面的讨论已经间接回答了这个问题,由于近几年人工智能技术的发展,机器人产业已经来到了关键的历史时期,即将迎来“智能升级”的大潮,“机器人→智能机器人”将是大势所趋。而这也成就了机器人行业爆发的两大动力:1)更强的人机互动能力与新颖的互动形式;2)其背后强大的数据获取、处理与应用能力。智能手机之后,市场一直找不到能像PC和智能手机一样具有爆发性的消费级产品。但新型智能硬件将孕育出下一代爆款产品已被市场接受并预期,无人机、VR等产品也被寄予厚望。从我们观察的角度讲,抛开现象看本质,无论PC还是智能手机的普及,都解决了人和机器面临的两个最关键问题:交互和应用。我们认为只有更好的解决这两个问题的智能硬件,才能是下一代全面普及的智能硬件产品。我们认为机器人有望结合人机互动和数据处理这两大优势,就像曾经的PC和智能手机的爆发历程一样,成为下一代消费级人机交互中心,颠覆我们的生活。
1、主因一:机器人有望成为下一代人机互动新交口
1.1、人机交互有望再次被颠覆
人机交互可划分为四个阶段:随着信息技术的发展,人机互动的模式也在不断丰富,我们认为人机交互的发展可以分为四个阶段:1)基本交互、2)图形式交互、3)语音式交互、4)感应式交互(体感交互)。科技的发展推动人机交互向更加快捷、简便的方式前进,当前我们正经历着感应式互动技术给人机交互带来的新变革。
1) 基本交互:最早期的人机交互形态。例如转盘式电话是通讯设备的早期形态,通过转动拨盘产生脉冲信号输入信息。按钮式电话则通过按键产生多频信号。早期的固定电话或移动电话都只能通过按键或者转盘输入数字号码,通过听筒向用户输出声音。最早的计算设备是中国的算盘。人们通过拨动算珠进行计算输入,查看算珠状态得到计算结果。1642年,世界上第一台加减法计算机出现,它通过手摇方式操作运算,只能计算加减法。它通过转动拨轮输入数字,通过表盘输出结果。截止到这里,人机交互的形态还基本停留在以数字的形式作为输入和输出,直到打字机的出现,人机交互的形式进入文字时代,20世纪中叶,随着电脑的发明,打字机演变为电脑的基本输入设备——键盘。
2) 图形交互:显示屏和鼠标的出现推动人机交互迈入图形交互时代,触屏技术的普及又将图形交互推至全新高度。
i. 显示屏:早期的电脑显示屏只能显示单色图案,后来出现了彩色显示屏,能显示的信息更加丰富。不过一开始的CRT显示器屏幕是弯曲的,显示效果有较大的失真。之后出现的平面直角显示器缓解了这一问题。之后新的成像方式代替了原有的显像管成像,液晶显示器走上了舞台,人们开始追求更高的分辨率,从800*600到1024*768的15、17寸CRT显示器,到1440*900的19寸LCD,到近年来主流的1080P显示器,以及崭露头角的2560*1440分辨率2K显示器和4096*2160分辨率的4K显示器,一块屏幕所能显示的内容翻了数翻。
ii. 鼠标:苹果设计的世界第一款大众普及鼠标“Lisa”,它在位置指示上比键盘更加人性化,是“图形人机交互”的始祖,随后鼠标逐步成为计算机的标配;刚开始发明的鼠标仅有两个滚轮和一个按键,也就是只能实现指针移动和单击的功能。随后鼠标的传动装置由原先的滚轮变为滚动球再变为现在流行的光电转换器。鼠标移动的速度和位置检测的精度都在不断上升。鼠标按键的功能也在不断增加。从开始的单键,到双键、三键、到滚轮的加入,侧键的加入。不仅可以实现单击、双击等功能,还能实现页面滚动,自定义组合键等。同时,键盘和鼠标的连接方式也在不断进化,由原先的有线式,发展到2.4GHz 无线连接再到蓝牙连接。现在的鼠标键盘已经能够实现一键在多设备之间进行切换,一套设备就能控制多台电脑。而高端鼠标键盘一直在向低延迟和高舒适度方向发展,力求将用户的指令尽快送入电脑。
iii. 触屏技术:经历了从单点触控到多点触控。触屏技术的早期载体是PDA(Personal Digital Assistant,个人数字助理),PDA的一大特点就是手写输入,它的基本的功能包括通讯簿、行事历、记事本、计算器等。从此,图形交互的输入方式有了新的发展,实现了触控输入,能够直接在屏幕上操作设备。早期手写笔输入主要的控制方式是通过点按屏幕上的按钮,后来智能手机的出现将这一操作方式继续推进,此时的触控输入不仅仅局限于点击按钮,还能够识别多点触控和多种手势,例如双指缩放等。随后,触控操作从智能手机普及到电脑上,带有触摸屏的笔记本电脑出现了。
3) 语音交互:早期的语音交互体现为语音识别,就是将输入的声音转化为文字。此时的设备还不具有对声音命令直接作出反馈的能力。由传统的基于标准模板的匹配向基于统计模型的转化使语音识别技术完成了由小词汇量、孤立词的识别向大词汇量、非特定人连续语音识别的转化。自2009年以来,借助机器学习领域深度学习研究的发展以及大数据语料的积累,语音识别技术得到突飞猛进的发展。微软公司的研究人员率先取得了突破性进展,他们使用深层神经网络模型后,语音识别错误率降低了30%,是近20年来语音识别技术方面最快的进步。随后各种智能助理的出现将语音识别这一技术的运用范围从单向听写拓展至双向互动。例如微软的cortana,小冰,Google的google now,苹果的Siri。如今,通过语音识别实现人机交互已经成为越来越普遍的形式。
4) 体感交互:体感交互是下一代人机交互的大势所趋。图像识别技术开启了体感交互时代的大门,如英特尔的实感技术能够通过摄像机模仿人类视觉,从而为设备带来对物体大小和距离的感知。此外,利用多重摄像机装置,英特尔实感技术还能够还原一个完整真实的三维世界。而惠普的投影键盘HP Sprout利用投影技术为人们带来了键盘输入的全新方式——投影键盘。与英特尔实感技术相似,HP Sprout也是利用摄像机作为核心部件,通过感知用户对投影键盘的操作来判断用户录入的字符内容。但体感交互又远远不止于此,可以说体感交互未来将成为先前各种人机交互技术的结合,包括即时动态捕捉、图像识别、语音识别、VR等技术,最终衍生出多样化的交互形式,而机器人有望在未来成为体感交互的载体。
1.2、智能机器人符合人机交互的发展规律
通过以上对人机交互发展历程的梳理,我们可以总结出如下四点人机交互的发展规律和趋势:
低反馈延迟:人机交互的必要条件就是能及时给予用户对当前命令的反馈,以便用户判断当前指令是否符合自己的意愿,从而做出调整。
命令要求的模糊化:随着智能设备的普及,使用智能设备的用户群也相应扩大。从原先具有专业知识的操作人员扩展到从未接触过智能设备的老人、孩子。因此智能设备需要能够识别更加模糊的指令,也就是指令识别系统需要变得更加智能。一开始的计算机只有输入准确的命令代码才能完成操作,而现在可以通过说一句话让手机自动打车正是这一趋势的体现。
输出内容多样化和真实化:为了更好地对用户命令作出反馈,设备必须采取多种输出方式对应不同的输出结果。例如电脑在发明之初只能显示文字,而现在手机可以实现声音,画面,震动的多重输出方式。此外VR技术和3D显示技术的热门也反映了用户对更真实的输出方式的期望。
输入方式便捷化和多样化:智能设备出现的目的就是为了节省用户的时间。因此输入方式的便捷化是必然的要求。例如鼠标的出现使文件的复制粘贴操作变得极为简便。语音识别技术不仅简化了用户手动输入文字的过程,而且让用户能够不接触设备发布指令。用户使用智能设备场景的多样化决定了输入方式的多样化。传统的只依赖动手输入的方式已经不能满足现代智能设备的要求。语音、触控、体感多种方式输入才是未来输入方式发展的方向。
机器人符合人机交互的发展趋势,具备强大爆发力:无论从以上四点中的哪点看,机器人都符合下一代人机交互的需求和特征,因此我们认为机器人在人机交互方面的巨大潜力将成为其迎来爆发的重要动力之一。未来智能化的机器人将更多地增强“人”的属性,从以往的“工具”变为人类的“伙伴”。
2、主因二:愈发强大的数据获取、处理与应用能力
机器人是下一个智能手机?我们认为除了强大的人机交互功能之外,机器人背后愈发强大的数据获取和处理运行及应用能力也将成为产业爆发的重要推手。随着硬件方面处理芯片技术的不断提升,以及近年以神经网络算法为代表的AI技术在“软”的方面的进步,机器人未来在数据获取与处理方面的潜力无疑是巨大的,这意味着机器人将拥有更加强大的功能和更加智能的信息处理方式。就像当初智能手机的快速爆发一样,机器人有望成为下一个获得大量爆发的智能硬件。
智能机器人之于传统机器人,类似于智能手机之于传统手机:做个简单的类比,我们认为智能机器人对于传统机器人行业的意义可以类比于智能手机对于传统手机行业的意义,过去几年智能手机的发展轨迹对于智能机器人未来的发展具有一定参考作用。根据IDC和Gartner的统计数据,从2008年到2013年,全球手机销量从12.8亿部增长至18.8亿部,值得关注的是,这5年正是智能手机为整个传统手机行业带来变革的5年,全球智能手机的销量占比从2008年的11%快速提升至2013年的52%。整个手机行业经过“智能升级”后在2013年迎来了销量新高。这5年间,苹果和安卓的崛起,以及诺基亚的没落标志着手机产业结构和市场格局迎来了大换血。手机在最开始只是个打电话的硬件,但随着数据处理能力的提升和功能的扩充,人们开始更多地关注其背后对于各类应用和资源的调用,于是智能手机迎来了快速的普及和爆发。因此我们认为,机器人产业也即将步入这样的关键历史时期,智能机器人占传统机器人的比重有望不断提升,成为生力军,迅速崛起。
处理器性能的提升赋予了机器人强大的数据处理能力:CPU从诞生以来到如今的发展从未停滞,英特尔CPU架构变革与制程进化隔年交替进行的 Tick Tock 发展模式将CPU制程不断缩短,从10微米向10纳米稳步迈进。制程的不断缩小和架构的升级使得CPU的发热量和功耗得以随之降低,系统集成度更高,计算性能更强,从而使CPU在移动设备领域的应用不断扩张。随后GPU开始异军突起,GPU在“深度学习”领域发挥着巨大的作用,因为GPU可以平行处理大量琐碎信息。深度学习所依赖的是神经系统网络——与人类大脑神经高度相似的网络——而这种网络出现的目的,就是要在高速的状态下分析海量的数据。国内人工智能硬件研究项目“寒武纪”小组的最新研究结果表明,GPU能够提供平均 58.82X 倍于CPU的速度。不断提升的处理器性能为机器人提供了强大的数据处理能力,大大提升机器人功能的可扩展性与丰富性。
普及在望,应用性能的提升将促使“机器人+”模式诞生:随着数据获取与处理能力的提升,传统机器人的硬件属性将逐渐弱化,“软”的方面的功能将进一步凸显,形成软硬一体化的模式。未来智能机器人作为一种全行业技术整合后的入口,将以软硬功能兼具,且兼强大的形式促生“机器人+”模式:机器人+工业、农业、医疗、教育、生活、交通、物流、海洋、航天、救灾、军事等等,将无处不用,快速提高智能机器人的普及率。
三、AI——智能机器人发展的核心推动力
我们为什么说AI是智能机器人发展的核心推动力?因为AI的发展直接决定了上文中提到的智能机器人产业爆发的“两大主因”:(1)人机交互能力和(2)数据的获取、处理与应用能力。我们曾经在深度报告《AI:重构IT未来》中讨论过AI的技术构成,AI的实现可以分为对“外”的语音识别、图像识别等感知技术,以及对“内”的算法+数据+硬件技术。对外的感知技术直接决定了未来人机交互的体验和准确度。而对内的算法、数据和硬件技术则决定了数据的获取、处理与应用能力:
对外——探测,感知技术是关键:即对外界信息的正确获取。这个环节主要涉及的技术是图像识别与声音识别等感知技术,探测的有效性和真实性直接决定了AI的智能程度,以及后期匹配时的正确率。
对内——训练,算法、数据、硬件是关键:即自我学习与进化。AI进行训练学习时需要输入大量的样本数据,这是AI吸收知识并消化知识的过程,因此数据的获取、高性能的算法、和高性能低能耗的硬件是前设条件。
对内——匹配,算法和硬件是关键:即将外界获取的信息与训练时学到的信息相匹配,做出决策。同样,在这个环节高性能的算法和高性能低能耗的硬件也是前设条件。
机器人产业链——AI有决定性作用:机器人产业的产业链可以归纳为四个主要部分:零部件厂商、本体制造、系统集成以及行业应用。零部件厂商环节包括了控制器、减速器、伺服电机等核心零部件,而行业应用涵盖了制造业、医疗、食品加工、家用等各行各业。AI技术涉及到的无论是智能芯片、感知识别、还是机器学习算法,都主要影响了机器人产业链的相对上游环节,主要提升的是机器人关键零部件的性能,具有决定性作用。
1、AI是提升人机交互体验的关键
AI决定了语音识别和图像识别等感知技术的成熟度,进而决定了人机交互的体验和准确性:
借助AI,语音识别得到突破:自2009年以来,借助机器学习领域深度学习研究的发展以及大数据语料的积累,语音识别技术得到突飞猛进的发展。微软公司的研究人员率先取得了突破性进展,他们使用深层神经网络模型后,语音识别错误率降低了30%,是近20年来语音识别技术方面最快的进步。根据玛丽·米克尔的互联网趋势报告统计,近几年各大语音识别的主流平台的准确率均得到了快速提升,目前单词的语音识别准确率的已经超过90%。
AI使语音识别的普及率快速提升:AI增强了语音识别的体验和准确度,使语音识别的普及程度快速提升。据统计,美国智能手机用户使用语音助手的比例从2013年的30%提升至2015年的65%,实现翻倍。随着语音识别率的提升,通过语音识别技术进行搜索也逐渐被越来越多的人所接受,截止2014年9月,百度搜索中每10次查询就有1次来自语音;截止2015年6月,Siri每周处理超过10亿条语音请求;截止2016年5月,Windows10任务栏中25%的搜索为语音搜索;而谷歌语音搜索量从2013年开始飞速增长,到目前为止较2008年增长了35倍以上。根据百度首席科学家吴恩达的预计,到2020年,所有搜索中至少有50%将来自图像搜索或语音搜索。目前在语音识别市场,国内和国际上均表现出寡头垄断的格局。国际市场上Nuance市场份额遥遥领先,占据了62%的市场份额。排在第二名的谷歌市场份额也相对较大,占据了17%的份额。接下来分别是微软7%、苹果4%、IBM 4%、科大讯飞3%、其它3%。在国内市场方面,科大讯飞优势明显,占据了54%的市场份额排名第一,接下来分别是百度13%、苹果12%、Nuance 6%、捷通华声5%、中科信利3%、其它7%。
AI提升图像识别性能,机器视觉市场快速增长:AI同样提升了图像识别的性能,相比起声音识别,图像识别目前的识别率更高,已经达到95%以上。在智能机器人领域,图像识别的主要应用形式是机器视觉,得益于AI技术为图像识别性能带来的提升,近年机器视觉市场规模保持着较高的增速。根据资料显示,2014年我国机器视觉市场规模为19亿,预计到2016年市场规模将达到38亿元。与此同时,我国机器视觉的“玩家”数量也在快速增长,相关企业在2013年超过了100家,竞争加剧,但行业集中度还相对较低,市场空间具备充足弹性。
2、AI显著提升机器人的数据处理与应用性能
大数据时代,AI算法提升数据挖掘效率:AI的深度学习的一大价值在于其对于大体量数据的挖掘与应用能力,相比起传统的算法,越是在大体量的数据下,AI的深度学习算法的优势就越明显。这对于大数据时代数据的获取和数据的运算处理,均大有裨益。今天在互联网和移动互联网上已经积累了海量的数据,并且每天产生的数据量依然在指数型增长。以微信为例,用户每天在朋友圈上传的图片达到10亿张,大数据“数字宇宙”约每两年翻一番。然而根据统计,仅有约0.4%的全球数据得到了分析。目前对于这些海量数据的挖掘需求是很强的,AI显然在这方面有很大的用武之地,是提升机器人对于数据处理和应用能力的关键。
AI专用处理器芯片提升数据运算效率:在传统的CPU和GPU处理器在飞速发展的同时,一些针对人工智能的专用处理器芯片也开始出现,AI专用处理器芯片的最大优势在于其成本和功耗降低,并且将大幅提升算法的运行效率,因此AI专用处理器芯片也将成为机器人的数据运算能力突飞猛进的重要动力。传统的算法在通用芯片(CPU和GPU)上效率不高,功耗比较大,因此从芯片的设计角度来说,通用型往往意味着更高的成本,而AI专用的处理芯片可以用来加速包括卷积神经网络、递归神经网络在内的各种神经网络算法。
1) 谷歌的张量处理器TPU——Tensor Processing Unit:今年5月,谷歌展示了一款专门针对人工智能定制的新型芯片TPU (Tensor Processing Unit)。TPU由谷歌与OpenPower Foundation合作开发,是一款为机器学习而定制的芯片,经过了专门深度机器学习方面的训练,使之具备了更高效能。大致上,相对于现在的处理器有7年的领先优势,宽容度更高,每秒在芯片中可以挤出更多的操作时间,使用更复杂和强大的机器学习模型,将之更快的部署,用户也会更加迅速地获得更智能的结果。其研发目的是为了替代GPU,实现更高效率的深度学习。
2) Nvidia Tesla P100芯片:2016年4月6日,英伟达CEO黄仁勋在其公司GPTech 峰会上发布了一款支持深度学习的新型芯片Tesla P100。这是英伟达第一次设计一个专门用于该领域的芯片,专门用于加速人工智能,专门用于加速深度学习,并且英伟达决定全力投入人工智能。Tesla P100芯片安装了150亿个晶体管,是目前市场上许多处理器、图形芯片的3倍;芯片面积为600平方毫米,双精度运算速度5.3万亿次,单精度运算速度10.6万亿次,半精度运算速度21.2万亿次。Nvidia同时发布了一款搭载了八个P100芯片、可用于深度学习的计算机DGX-1。
3) IBM TrueNorth芯片:2014年8月7日,IBM宣布研发出一款可以像大脑一样工作的计算机芯片TrueNorth。TrueNorth使用了54亿个晶体管,分成4096个“神经突触内核(neurosynaptic cores)”的结构;每一个“神经突触内核”结构都能使用crossbar(交叉)通讯模式来存储、处理并向其它结构传输数据,这些计算内核产生的效果相当于100万个神经元和2.56亿个突触。TrueNorth芯片只要几厘米的方寸,功耗只有65毫瓦。TrueNorth是IBM参与DARPA的研究项目SyNapse的最新成果;SyNapse全称是Systems of Neuromorphic Adaptive Plastic Scalable Electronics(自适应可塑可伸缩电子神经系统,而SyNapse正好是突触的意思),其终极目标是开发出打破冯诺依曼体系的硬件
4) IBM随机相变神经元芯片:2016年,IBM苏黎世研究中心宣布,制造出世界首个人造纳米级随机相变神经元,该神经元能用于制造高密度、低功耗的认知学习芯片,可实现人工智能的高速无监督学习。该神经元尺寸最小能到纳米量级,因而信号传输速度极快,同时功耗较低,这就使得随机相变神经元具有生物神经元的特性。IBM相变神经元的整个架构包括输入端、神经薄膜、信号发生器和输出端,其中输入端类似生物神经元的树突,神经薄膜类似生物神经元的双分子层,信号发生器类似生物神经元的神经细胞主体,输出端类似生物神经元的轴突。而神经薄膜是整个神经元产生作用的关键物质,它类似生物神经细胞中的液态薄膜,当能量吸收到一定程度时就会产生信号并向外发射。这些信号经过输出端(轴突)传导,然后被其他神经元接收,以此循环形成信息处理过程目前,IBM已经构建了由500个该神经元组成的阵列,并让该阵列以模拟人类大脑的工作方式进行信号处理
5) 英特尔Knights Mill芯片:2016年8月17日,英特尔数据中心集团执行副总裁戴安·布莱恩特在开发者大会(IDF)上宣布,将在2017年推出专为机器深度学习设计的芯片,Xeon Phi家族新成员,代号Knights Mill。Knights Mill芯片可以独自充当处理器,不再需要单独的主机处理器和辅助处理器,可以直接接入RAM系统;英伟达的GPU和谷歌的TPU芯片,都是辅助处理器,必须和CPU一起工作。Xeon Phi是Intel针对高性能计算市场推出的加速卡,主要与NVIDIA的Tesla、AMD的FirePro S等产品竞争,不过后两者是基于GPU的,而Xeon Phi是X86众核架构的。Xeon Phi目前已经发展了三代,第一代Knights Corner,22nm工艺,最多61个核心,浮点性能1TFLOPS;第二代是Knights Landing,14nm工艺,最多72核心,浮点性能3+TFLOPS;英特尔于2014年宣布第三代Knights Hill,制程工艺升级到10nm。请加微信号:robotinfo 学习工业智能化知识
6) 嵌入式神经网络处理器(NPU)芯片“星光智能一号”:中星微在今年6月20日,率先推出中国首款嵌入式神经网络处理器芯片,这是全球首颗具备深度学习人工智能的嵌入式视频采集压缩编码系统级芯片,并取名“星光智能一号”。这款基于深度学习的芯片运用在人脸识别上,最高能达到98%的准确率,超过人眼的识别率。该芯片于今年3月6日实现量产,目前出货量为十几万件。NPU采用了“数据驱动”并行计算的架构,单颗NPU(28nm)能耗仅为400mW,极大地提升了计算能力与功耗的比例,可以广泛应用于高清视频监控、智能驾驶辅助、无人机、机器人等嵌入式机器视觉领域。
中星微的“星光智能一号”与IBM人工神经元相比,共同之处是,都是属于受到生物人脑机理的启发而通过半导体电路与器件去实现的,都是采用CMOS半导体工艺来生产的。而不同之处在于,所采用的架构和实现方式不同,前者采用卷积型架构,用数据驱动的并行数字电路来实现,后者采用脉冲型架构,用数模混合电路来实现。
7) 寒武纪“DianNao”芯片:2016年3月,中国科学院计算技术研究所发布了全球首个能够“深度学习”的“神经网络”处理器芯片,名为“寒武纪”。寒武纪不是用来代替CPU中央处理器的颠覆式革命,更像是一款针对智能认知等应用的专用芯片,优势集中在人脸识别、声音识别等人工智能方面。目前,寒武纪系列已包含三种原型处理器结构:寒武纪1号(英文名DianNao,面向神经网络的原型处理器结构);寒武纪2号(英文名DaDianNao,面向大规模神经网络);寒武纪3号(英文名PuDianNao,面向多种机器学习算法)。DianNao是寒武纪系列的第一个原型处理器结构,包含一个处理器核,主频为0.98GHz,峰值性能达每秒4520亿次神经网络基本运算,65nm工艺下功耗为0.485W,面积3.02mm2。在若干代表性神经网络上的实验结果表明,DianNao的平均性能超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级;DianNao的平均性能与主流GPGPU相当,但面积和功耗仅为主流GPGPU百分之一量级。
要降低处理器功耗,仅仅降低运算功耗是不够的,必须优化片上数据搬运。中科院计算所提出对神经网络进行分块处理,将不同类型的数据块存放在不同的片上RAM中,并建立理论模型来刻画RAM与RAM、RAM与运算部件、RAM与内存之间搬运次数,进而优化神经网络运算所需的数据搬运次数。相对于CPU/GPU上基于cache层次的数据搬运,DianNao可将数据搬运减少10~30倍。
DaDianNao在DianNao的基础上进一步扩大了处理器的规模,包含16个处理器核和更大的片上存储,并支持多处理器芯片间直接高速互连,避免了高昂的内存访问开销。在28nm 工艺下,DaDianNao的主频为606MHz,面积67.7 mm2,功耗约16W。单芯片性能超过了主流GPU的21倍,而能耗仅为主流GPU的1/330。64芯片组成的高效能计算系统较主流GPU的性能提升甚至可达450倍,但总能耗仅为1/150。
虽然神经网络已成为模式识别等领域的主流算法,但用户很多时候可能倾向于使用其他一些经典的机器学习算法。例如程序化交易中经常使用线性回归这类可解释性好、复杂度低的算法。在此背景下,寒武纪3号多用途机器学习处理器PuDianNao应运而生,当前已可支持k-最近邻、k-均值、朴素贝叶斯、线性回归、支持向量机、决策树、神经网络等近十种代表性机器学习算法。PuDianNao的主频为1GHz,峰值性能达每秒10560亿次基本操作,面积3.51mm2,功耗为0.596W(65nm工艺下)。PuDianNao运行上述机器学习算法时的平均性能与主流GPGPU相当,但面积和功耗仅为主流GPGPU百分之一量级。
四、产业趋势:重心向服务类机器人转移
机器人的分类:按照机器人的应用领域,可以将其分为工业机器人和服务机器人两大类。在工业机器人中,包括搬运机器人、装配机器人、处理机器人、焊接机器人、喷涂机器人几类;在服务机器人中又可分为个人/家用机器人和专业服务机器人。
工业机器人:目前大部分应用场景是工业化生产过程中用于协助完成生产线上重复性较高和技术要求相对较低的任务。如agv(Automated Guided Vehicle)机器人,是一款轨道穿梭车,具有分拣特性,可用于自动化立体仓库库前输送,也可以成为装配线的移动载体。又如机器人全自动点焊系统,包括机器人点焊和机器人抓取工件自动打点工艺过程,使用自动换手装置实现机器人对抓手与伺服点焊钳自动更换等。
个人/家用机器人:目标群体大,受众面广。主要用于满足现代家庭生活中的保洁、娱乐、看护、安保等需求。如扫地机器人、监控机器人、残障辅助机器人等。
专业服务机器人:主要用于工业化生产领域以外的各行业的应用。如:1)医疗行业:可应用于微创外科手术,医生只需要通过计算机遥控,就能进行需要多人才能完成的手术。机器手可以突破人手的极限,内部的探视镜头突破了人眼的极限。机器手臂的虚拟力触觉反馈能力能够将手术过程中患者的触觉传递给操作医生,随时调整、制定精确的手术方案;2)物流行业:机器人系统作业效率要比传统的物流作业提升2-4倍,机器人每小时可跑30英里,准确率达到99.99%。200台机器人每天可帮助工人处理10000至20000个订单商品。3)建筑机器人:如澳大利亚机器人公司Fastbrick Robotics推出的建筑机器人Hadrian X,每天可以不间断工作24小时,1小时内能够砌好1000块砖,建成一栋房屋只需两天时间。
服务机器人潜力待发掘,未来将成为新增长点:服务类机器人相对工业机器人的应用历史较短,其功能和价值有待被挖掘。随着现代社会的发展,出现了许多新的需求刺激着服务型机器人的普及,如:1)随着人口老龄化趋势的上升以及残障人士比例增加等社会问题的出现,机器人有望代替人工协助实现社会保障的功能;2)社会治安和反恐救灾等公共安全需求也在不断增强,机器人可以代替人力实现高危场所的作业和监控;3)互联网时代下的自动化家庭生活需求也愈发强烈,智能家居、娱乐和出行等均有服务型机器人的用武之地;4)优化劳动力的分配,随着劳动力成本的提升,单纯重复性和枯燥的工作可以依靠机器人实现,优化劳动力的分配结构。因此,我们认为服务型机器人有望发力,代替工业机器人成为机器人产业未来新的增长点。
服务机器人CAGR预计达17.4%:根据IFR的统计,2014年,全球服务机器人市场销售额约59.7亿美元,专业服务机器人2014年全球销量约为2.42万台;销售额37.7亿美元,销量同比增加11.49%,销售额同比增加5.6%;个人/家庭服务机器人2014年全球销量约为470万台;销售额22亿美元,销量同比增加17.5%,销售额同比增加29.41%。根据IFR的预测,全球服务机器人市场规模预计2012-2017年年复合增长率将达到 17.4%,到2017年达到461.8亿美元,行业空间巨大。
产业重心转移过程中,AI意义更加凸显:服务机器人呈现出了巨大的潜力,产业重心有望向服务机器人转移,但这也对机器人的功能提出了更高的要求。和服务机器人相比,工业机器人的功能要求相对单一,与人交互的要求也相对较低,而服务机器人是以直接和人交流、服务于人为目的,因此AI技术对于服务机器人的意义更加凸显。AI技术的成熟度直接从产业链上游决定了服务型机器人在下游的应用及市场接受程度。未来随着服务机器人的需求增强,AI也将因此受益而迎来更多发展机遇。
免责声明:本文来自作者——WPR,不代表超天才网的观点和立场。文章及图片来源网络,版权归作者所有,如有投诉请联系删除。