当前位置: 主页 > 国内 >

地平线智能解决方案与芯片事业部总经理张永谦:AI芯片是千万行业智能化的发动机丨CCF-GAIR 2018

时间:2018-07-06来源:互联网 作者:编辑 点击:
雷锋网按 :2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市政府的大力指导,是国内人

雷锋网按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。

在CCF-GAIR 2018第三天的峰会现场,地平线智能解决方案与芯片事业部总经理,中国半导体行业资深商业专家张永谦在AI芯片专场分享了他的行业观点和地平线公司的最新进展。

张永谦表示,AI目前趋势分为三点:第一,计算从中央到边缘;第二,智能终端成长潜力;第三,智能是个性化趋势。基于这样的判断,张永谦认为,AI碎片化需求对创业公司有好处,传统行业的大公司想用规模、人海战术、资金实力、渠道能力在AI时代碾压创新创业公司,几乎不太可能。

此外,张永谦还介绍了目前地平线的第一代芯片和即将推出的第二代芯片,他表示,第一代芯片系列是成熟、量产化的系列解决方案,好处有两点,一是快,一周集成, 三个月量产;二是高度平台化,能快速让广大行业客户和产品客户直接使用的方案。

旭日系列第二代芯片是基于伯努利架构,内核已经设计完毕。从现在开始到今年年底,地平线将着力做流片并同步适配算法解决方案。

以下是张永谦在现场的演讲,雷锋网做了不改变原意的编辑整理。

张永谦:大家好,非常高兴今天下午为大家介绍地平线的思考和落地的情况。

我今天的演讲主题是“AI芯片,千万行业智能化的发动机”,听魏少军所长和英特尔的同事说了非常多的渠道,今天我说得更加接地气。作为创业AI公司,特别是在AI目前的阶段,最重要的是AI能落地,今天主要谈谈我们AI落地的工作以及我们在这方面做的事情。

我认为现在最大的趋势是AI,分为几点:

第一,计算从中央到边缘。

在过去几十年,从2000年开始,PC时代到智能手机,现在到Internet of Smart things,AI越来越跟着人走。云端从过去的大计算率、大功耗完成任务,慢慢向端上扩展。我们认为人工智能是端+云,构成整个系统的平衡,让整个功耗、性价比变得最优。端上的智能和云上的智能都是需要的。地平线必须解决端上智能的问题。

第二,智能终端成长潜力。

中国可能是全球最大智能摄像头生产国和使用地, 每年生产上亿个智能摄像头。考虑家用、嵌入式 摄像头场景,每年会有10亿个终端需要智能。目前可以看到终端的智能渗透 率只有1%,从现在开始,我觉得大概在两三年内,大家会看到所有的摄像头智能渗透率达到百分百。大家问产品视觉公司明年的产品会 不会涉及AI,偏人脸相关也是实际AI,答案是百分百。

我判断2020年,所有跟智能摄像头的产品百分百标配现在所谓的人工智能,只是处理的强弱 。现在处理不到1%到两三年后的百分百,可想而知 这个市场多么大,这个窗口多么大。行业中做芯片和AI的公司一定要抓住这个窗口,错过这个窗口便难以有发展前途。

第三,智能是个性化趋势。

这是百花齐放的情况,行业会重构。我们看到整个AI和互联网一样,它都是一个非常基本的底层技术,这个技术会重构整个行业,甚至重构整个社会 。互联网在过去20年里是最火的行业,大家可以看到它颠覆 了多认知和行业,AI技术也是如此。AI技术对人产生很大的影响 ,它是更加本质的颠覆 。所有的AI是智能,它一定是个性化的,在后面很长一段时间内,大家对AI诉求非常个性化、碎片化的。

得到几个推论:1,对创业公司有好处,传统行业的大公司想用规模、人海战术、资金实力、渠道能力在AI时代碾压创新创业公司,几乎不太可能。因为AI的需求非常碎片化;

2,AI是底层技术,行业要用AI就像行业要用互联网,不是你坐在空调房敲几行代码就能重构的,必须是公司的业务体系架构、业务软件甚至是整个行业都会被重构。AI对整个行业的颠覆只是刚刚开始,未来它会让整个行业重构。过程中一 定会冒出非常多的黑马,这对地平线来说是非常好的机会。

简单介绍地平线目前做的事情,希望今天我们介绍的东西可以帮助合作伙伴和行业客户。地平线成立于2015年7月,至今将近三年时间。正式员工500多人,60%以上是硕士和博士学位,是一家比较偏重底层AI技术的公司。

魏少军所长谈到软件定义硬件,这是地平线成立以来一直秉承的思想,现在尚未达到强人工智能的AI,软件定义硬件。但我们确实往这个方向走,2015年我们提出地平线AI芯片想法,先由算法解决实际问题, 根据算法架构做芯片,这是软件定义硬件。谷歌2016年推出TPU,用在云端AI服务器。魏少军所长谈到传统处理器架构在AI时代一定会被淘汰,因为他们无法在端上使用。

地平线公司成立三年时间,去年年底完成A+轮融资。这是我们推出的BPU,2015年7月首次提出,2017年首次发布BPU处理器及整体解决方案,历时两年多,过程非常辛苦。

今天重点谈谈Edge AI在IoT领域侧的应用 ,目前智能楼宇 、智慧社区、自动驾驶 、智能安防 、智慧商 业,Edge AI处理器是我们目标应用市场。芯片解决方案,我们希望完成智能开放的生态,生态的合作伙伴中有行业客户,原来应用处理器的厂商可以和我们智能处理器匹配,做一个完整的智能解决方案,包括OEM、ODM和IDH。

现在包括智能安防、智慧社区、智慧零售、智能楼宇等各个方向,我们会提供一套完整的解决方案,包括底层芯片。重点我们有针对场景做的网络模型、上层简单应用SDK,目的是希望帮助行业用户快速使用AI。

核心点是我们希望AI变成平民化的东西,现在真正想把AI用起来,需要很大的算法团队,这是非常不亲民 的。我们希望行业客户、合作伙伴可以站在我们的肩膀之上,我们会针对重大场景,把AI软件算法结构固化到我们的芯片中。我们的合作伙伴可以直接使用我们整套解决方案,也可以利用他们的大数据在我们芯片架构中做训练,训练出他们自己的模型。他所需投入的资源、时间都会非常少,让AI在行业中快速落地,这是我们公司的核心产品和市场思考、策略。

这同时会带来其他的好处,很多芯片公司、算法公司可以共同形成解决方案,我拜访客户时,客户使用这个模式时比较纠结 。芯片公司和算法公司,算法和芯片不是最早期互相适配设计,中间会遇到各种各样适配问题。芯片公司和算法公司同时支持客户做产品的公司,中间会遇到各种各样的问题。如何定义是谁的问题,如何快速解决,如何分配利益,这都是比较麻烦的问题。我说得比较直接, 但确实是现实中大家面临的问题。我们的客户现在不需要有任何算法团队,使用我们整体解决方案,从第一次拿到我们的方案到推出他们智能化的产品只需要三个月。我们会提供一整套工具链,简单易用,四步可以训练出自己的模型 。

针对重要的场景,智慧社会、智慧商业场景、智能安防场景,我们提供基础算法模型和算法模板。如果我们的客户具有一定的算法能力和大数据,可以快速开发出自有个性化的算法模型,解决他面临的丰富多彩的行业AI所需解决的问题。我们的交付层次不一 样,不管你是怎样的行业客户和合作伙伴,都可以使用我们东西,快速完成AI落地。

这是训练模型的流程,整个训练工具,UI做得非常友好,我们有一个非常好的界面,用户可以快速简单的使用它。简单介绍旭日X系列,第一代、第二代和第三代的整体规划,以及我们所需要解决的问题。

旭日系列有三代体系架构,高斯架构、伯努利架构和贝叶斯架构。高 斯架构,可以支持1080p的图像数据处理, 检测200个目 标,支持多达8个类别的目标检测。具体看应用路标,第一代芯片系列是去年11月份布,目前基于第一代系列的芯片解决方案用户,三季度在市场上会发布他们的产品。面向的应用主要是前端智能摄像头、大规模人脸抓拍、高精度人脸识别、商业客流分析,这是主要的场景,下面我就这几个场景为大家介绍我们目前的主要工作。

第一代芯片系列,我们和NVDIA TX1做对比,其功耗是我们的10倍,我们只需要2瓦,每帧处理30个目标,1080P/12fps,我们针对重大场景做优化,量身定做AI处理器,功耗和性价比做得非常好,快速为客户提供完整的解决方案。

第一代芯片处理层次针对目标进行处理,现在看到在复杂的场景下,我们对车、人、路上标识牌做目标处理。实际落地的案例和解决方案:第一,大规模 、全场景人脸抓拍,主要面对智慧城市和智慧商业两个场景。这是在北京故宫门槛,现在国内公安要做开放式场景布控,在广场、车站、码头、楼宇和园区里,上下班、吃饭、高峰期都会面临大规模人流,这时候布控需要很大的挑战。

现在整体抓拍解决方案,从人脸检测 、跟踪、优选、去重等一系列做了深度的优化,加上年龄和属性,可以很好的应对这种场景。即便是人脸抓拍这个小事情,行业内的人知道这非常不容易。除了要在非常复杂的情况下,把最好的人脸抓出来,最大的挑战是光线,有逆光、低照、侧脸,地平线整体解决方案经过非常多实际场景中做的经验,不停的迭代优化。

我们拿到采用旭日第一代芯片人脸抓拍解决方案的相机,我们选择业界一款采用TX1的人脸识别相机做对比。我们列出正常光线、晚上弱光、阴阳脸、逆光、弱光+复杂光线、正常光线+密集通道等,人脸抓拍是重要指标,我们的抓拍率和TX1在同一水平。在高峰期吃饭 时,人数一旦上来,我们仍然保持很高的抓拍率,TX1性能开始下降,出现误抓和漏抓。我们可以让这个解决方案做得更实用 、更好。现在我们的人脸抓拍解决方案做得非常成熟,目前市场上有十几家客户都在使用我们的解决方案,下个月可以推出产品。

第二,前端、高性能人脸识别,大家知道最早由公安使用,接下来向民用渗透。公安行业更多的需要前端抓拍、后端 识别,主要由于犯罪库比较大, 监察库至少30万,大家知道日常生活中,尤其是民用场景,我们的前端可以把识别小库做好,高性价比和低功耗方案非常实用,适用于城市安防、智慧社区、智能楼宇和智慧商业,我们已经开始在市场上做推广。

这是我们在办公室录的视频录像,现在性能在1080P30帧处理的情况下,我们准确率高于95%。这是门禁级别,不是简单的布控,用在用户体验最苛刻的场景中。

第三,商业客流分析解决方案,可以广泛应用在商业地产、零售门店和智能货柜 。由于新零售比较火,我们希望通过AI解决方案,让线下商业场景数字化,让行业客户对它进行数字化管理和运营,对人、货、场进行分析。除了人脸识别、属性、客流统计以及动线跟踪,我们在第一代芯片上做的是单摄像头。第二代芯片会做多摄像头融合以及商品识别。

现在第一代芯片系列是成熟、量产化的系列解决方案,我认为它带来最大的好处,一是快,一周集成, 三个月量产;二是高度平台化的,它可以同时做人脸抓拍、识别、商业客流分析,如果你需求足够大,可以拿我们的开发工具和你的数据做更加个性化的场景处理。我认为这个方案是目前情况下最接地气,最能快速让广大行业客户和产品客户直接使用的方案。

旭日第二代芯片系列是基于伯努利架构,内核设计完毕。从现在开始到今年年底,一是做流片,二是同步适配算法解决方案。当明年1月份和3月份,大家 拿到我们芯片时,会同时拿到我们整体基于算法+AI的解决方案。这是4K乘2K的30fps处理,不仅可以做前端,还可以做边缘计算产品。大库容人脸识别,基于像素级语义、动作行为分析、多路视频流结构化、全面升级、开放性做得更好。

第二代芯片是基于像素级的语义分割和理解,三维物体检测,这个应用更加多样化。我们跟NVDIA TX2做了分类任务比较,早期我们可以做到2倍,现在我们可以做到TX2的10倍,我们的功耗在2瓦左右。语义分割任务的性能,我们对标对象不是TX2,这种情况下我们的IoU对目标进行语义级、像素级分割时,分割区域和 原始区域的重合率。业界可以看论文,70%是业界比较好的水平,在这个水平之下可以做到每秒处理16帧,我们的功耗只有2瓦。这里有很多好玩的应用 ,原来做智能家电的朋友说你的电视做热剧 ,我能否把时尚时装、包抠出来做检测、识别、分类,实时推送到用户终端中。基于第二代芯片的架构,做这件事非常有意思、非常好玩,把它变成现实。

第二代芯片几个大方向:一是大库容 ,在2瓦过程中做50万人动态比对,公共安防行业以后不需要GPU服务器,在实时布控场景中也不需要GPU服务器。全国30万的抓逃库可以布置在2瓦多芯片中,可以做成便携式盒子,随时随地布控。智慧商业场景也是如此,现在很多智慧商业无法落地,你不可能把服务器部署在一个门店中,从功耗、可部署性和成本上都无法接受。当我们推出第二代芯片时,这个问题迎刃而解,我们把它 做在小盒子里,做大规模VRP、黑名单、 白名单处理。

二是复杂场景,视频结构化,这个事情出来很久了,业界老大哥公司做智能安防,他们推出基于GPU服务做了很多,但至今没有大规模商用,我认为性价比是很重要的原因。在推出第二代芯片解决方案时,可以把猎鹰、脸谱等服务器上做好。

三是基于像素级的语义分割和理解,行为分析和多摄像头融合。更多的用于安防、智慧社区、教育、智 慧零售、医疗等各个场所可以做越来越多有意思的AI应用,让它真正落地。这是我们公司做的基于像素级 的Python功能。现在它在服务器上,利用第二代芯片的架构进行模拟,等第二代芯片出来后,直接在2瓦的芯片上实现。

地平线的目标是通过AI芯片和核心算法,打造一整套解决方案,帮助我们行业客户。我们的行业客户并不需要建立庞大的算法团队,甚至他们不需要有硬件团队,现在有非常多的行业客户,他们原来和硬件、行业设备不沾边,他们做硬件也会跟我们交流,他们懂行业和需求,国内资源非常多,我们希望通过AI赋能行业,让AI真正和行业结合,帮助大家解决一些问题。

地平线,中国芯。AI的路刚刚开始,如果您是行业客户,我们非常欢迎您跟我们交流,现在各行各业的客户都来找我们。如果你是智能设备厂商 ,我们可以帮助您三个月达到智能设备量产, 投入的资源非常少,可能只需要一个硬件工程师和一个软件工程师就够了。如果您是AP、Sensor厂商 ,我们可以联合打造解决方案。这是我的联系方式,我们是创业公司,如果大家有合作需求可以直接联系我。谢谢大家!

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
文章导航
推荐内容