10月27日,由雷锋网 & AI掘金志主办的「全球AI芯片·城市智能峰会」,在深圳大中华喜来登酒店盛大召开。
延续雷锋网大会一贯的高水准、高人气,「全球AI芯片·城市智能峰会」以“城市视觉计算再进化”为主题,全面聚焦城市视觉与城市算力领域,是业内首个围绕“算法+算力”展开的大型智能城市论坛。
峰会邀请到了业内极具代表性的14位业内知名专家,世界顶尖人工智能科学家、芯片创业大牛、产业巨头首席技术高管、明星投资人齐聚,为行业资深从业者们分享前瞻的技术研究与商业模式方法论。
在大会上午场,大华股份研发中心副总裁、先进技术研究院院长殷俊以《AI构建数字世界的基础》为主题发表精彩演讲。
在殷俊看来,数据世界是四维的:通过感知获得一维数据,来观测真实世界;第二维,通过人工智能对感知数据进行特征提取,真实地反映世界;第三维,随着空间数据的融合,构建空间矩阵,构建与真实场景业务有匹配的数据场景化;第四维,则是全面计算的过程,通过时空数据的维度来构建时空矩阵,充分描述和表达真实世界。
他表示,在二维世界里面,人脸、语音识别或者很多检测识别真正构筑了二维特征数据的空间,数据的准确率是最高要求。因为只有构建精准的二维数据世界,才能准确表达世界上的万世万物。对行人的特征描述,则是典型的应用三维数据来形成更精准的定位。四维空间内,系统可以加入时域的分析,做更多预测、决策和评估的工作。
算力方面,殷俊认为,数据在不断升迁,算力增加是必然的,往后更需要大算力芯片。而大算力的芯片除了感知之外,还可以在边缘侧提取特征和空间分析;到了中心侧,能够完成二维、三维、四维数据的分析。
同时他也强调,尽管随着数据迁移,数据大幅度浓缩,从单点来看要求下降,但四维数据要求的路数和要获得的感知数据更多,网络成本反而增加。到越高维,网络代价越高。所以,需要根据业务综合部署,考量网络和计算的分布,看到底如何形成最佳的计算网络。
以下是殷俊的大会现场演讲内容,雷锋网做了不改变原意的整理及编辑:
大家好,非常荣幸今天能够代表大华为大家分享我们对AI的认识以及对AI的定位。
首先我提一个观点:AI是构建数字世界的基础,那什么是数字世界,以及为什么数据会成为数字世界的必要条件?
首先我们来看一下AI做了什么事情。
其实我们正在构筑一个数字世界,用数字化世界描述真实世界。实际上数字世界和真实世界有很大差异,真实世界中物质由很多元素构成,数据世界数据是唯一的元素,只有数据才能构建我们的数字世界。
我们的数据世界如何构建?在大华看来,我们构建了四维的数字世界。首先,我们通过感知获得一维感知数据,来观测真实世界发生了什么事情。
第二维,通过人工智能对感知数据进行特征提取,真实地反映真实世界到底是什么东西,比如是一个人、一个人脸、一辆车。
在第三维世界,随着空间数据的融合,我们构建空间矩阵,构建与真实场景业务有匹配的数据场景化。
第四维,我们认为是一个全面计算的过程,通过时空数据的维度来构建时空矩阵,充分描述和表达真实世界到底发生什么事情、出现什么行为、出现什么事件。
这个过程中,我们用感知和物联网技术构建一维数据,用人工智能构建第二维、第三维、第四维数据,而且不同维度都会进行数据检索。随着数据维度增多,数据的价值也会快速提升。以往我们看一个小时的数据,一维世界可能会消耗多达几个G的存储空间,到四维数据可以通过简单描述告诉观察者这段时间发生什么事情、观测对象是什么,所以数据是高度浓缩的。这个过程中,我们消耗了大量计算能力。每一维数据升迁需要耗费很大计算力,这是AI真正帮助我们构建的数字世界。
我们认为在二维世界里面,人脸、语音识别或者很多检测识别真正构筑了二维特征数据的空间。在这里,我们认为数据的准确率是最高要求,因为只有构建精准的二维数据世界,才能准确表达世界上的万世万物。我们大华在前几年一直把每项指标做到最高的精度,以交通为例,在车辆抓拍、车辆识别、车型车系方面提升精度,在出口都会大幅度运用优秀的特征,对车辆有完整的描述。
同时,我们会把真实商用化的算法做评测,确立所有的算法在业内的领先性。同时,我们在人脸识别方面,去年也持续在提升,今年在NIST全球综合排名第五。同时,现实生活中有很多跨年龄的问题,我们可以做到国内第一。在整个评测过程中,我们是全球算法速度第二快的的公司,这也意味着这一套算法我们直接可以商用,这个是我们觉得在整个人脸进度中最重要的环节。
我们还在目标检测、跟踪、识别、场景分析方面在构建二维、三维的数据能力。我们年初在market-1501测试集上准确率达到了96.7%的水平,这种性能提升真正帮助我们刻画真实的数字世界。
所有人工智能都围绕业务场景,正在加速业务场景的扩展,人工智能不仅仅是人脸和车辆等物体,而是能真实的表现真实世界,包括我们和零售做商品识别、货架空置率识别,来提升对商品的认知。
在能源方面,大华有几百种检测手段,原来一个人爬山涉水去观测每条线的输油管道、燃气线的安全事故,现在我们可以通过智能手段来快速检测,实时预警。
还有动物的检测,比如在养猪上的应用,来做猪的计数,确定猪有没有丢失等等。
机场是比较封闭的,我们识别飞机下降到入位、移位以及停靠过程中廊桥的状态,安全车辆与飞机匹配的状态,通过自动化解决航站人工的痛点。
在社区里面,高空抛物是痛苦的事情,我们会做这个识别,精准识别谁家把东西抛出来,提升安全。
人工智能不只是处理图像问题,还要处理很多感知数据的问题。举个例子,这是普通的烟感,传统烟感的误报率会很高,比如受到水气、蚊虫的影响,还会受到烟和PM2.5的影响,都会影响它的准确率。我们通过人工智能的手段去分析它采集到的数据。真正落地之后,我们发现可以把误报降低90%以上,实现精准的报警。
我们把人工智能利用在编解码上,像H265、H266,我们通过AI赋能,可以把码流压低80%,用20%的带宽(200多kb带宽)可以传输原先需要4M编码的性能。H266的研究中,我们发现同样可以降低70%以上的码流,这都是人工智能带来的数字化改造。我们认为未来有更多的利用场景需要我们扩展,而且我们也在积极拓展各个行业的应用。
人工智能离不开训练中心,实际上我们的工程师团队也是希望我们的训练中心能够实现各个行业的愿望,他们把人工智能平台取名于巨灵,源于阿拉丁神灯的灯神,希望可以达成我们的各种愿望。我们在想如何加速产业化落地,过往三年,大华建成了三地三中心的算力平台,算力提升了20倍,每天在线任务数提升了40倍以上,满足我们对行业场景的覆盖和定制化,满足场景需求。
在这里我们会想一个问题,是不是算力越大,不断增加计算的算力可以帮助我们增加很多。我们认为算力增加是必然的,更重要的是中心除了算力训练和算法之外还有很多东西要做,比如现在有这么多芯片,算力芯片层出不穷,我们要做芯片适配,有很多应用程序,需要做应用场景的适配,这将需要很大的人力物力和时间解决这个问题,所以我们在人工智能平台里面把芯片面向业务的集成部署作为我们的一部分。同时我们想这样够不够?其实对于工程化是不够的,因为作为产业化和商业化的公司,我们希望提供给客户的每个算法都是可靠、高质量的,能够达到高性能要求的。所以,在我们的人工智能平台里面加入了自动化测试模块,每一个发布的算法经过这个平台发布之后,都经过自动化测试导出结果,能够快速告诉你这个算法版本的性能和质量是否满足要求,从而提供给最终用户高质量的性能产品。
那么如何在三维空间空间进行应用呢?我们在二维空间做过交通业务,比如布一个电子相机分析红绿灯的状态,通过流量分析流量状态,通过结构化数据分析路面的车和物。但是我们发现每部分都是断层,都是单层看问题,所以我们构建了空间的路网,构建了整个道路的全要素,这时候就可以做更多,因为可以从路网分析道路堵塞情况、跨区域红绿灯情况,因此可以做全路面拥堵测试定位、全路面信号灯配适,自学对路网进行调整,以此达到最优的通行效果。这是在三维空间进行人工智能分析给我们带来的最大的优势。
关于人和人脸的识别,早期简单的特征识别是不够的,因为我们发现有时候人不会对着你走,有时候侧着走,有时候背着走,那怎么办?在第二代描述人的特征向量的时候,我们用了特征融合,人脸、人体融合的一体化特征模型。但是这样还不够,因为我们会碰到很多奇怪的问题,比如一个人今天走路,明天骑着电动车,今天是从可见光上面走过,到晚上可能是红外光拍到的热力成像,那怎么办?我们做第三代人员特征描述的时候,引入静态特征和动态特征融合的模型,通过人脸、人体、行走姿态、步态和标准行为动作的分析,构建人的描述的特征,这也是通过三维数据的描述来形成更精准的定位,能够描述清楚这个人是谁。
到四维空间更有意思,刚才讲三维空间交通做了很多事情,到四维空间我们有很多时间参数,我们可以看到过往一年、一个月、一周、每天的交通态势。结合我们时域的分析,我们可以看到时间维度上各个因素对交通的影响,比如刮风下雨、节假日,比如今天是“双11”或者今天有什么活动,对道路可能有影响,交通因素中对我们最大的影响是我们可以做预测和决策。在轨道交通方面,我们可以对红绿灯进行优化,可以对路面基于活动的情况、基于每天的状态做道路面的优化,还可以对未来城市道路优化产生价值,可以指导城市道路如何优化,比如哪条十字路口非常拥堵,是不是要建高架,这是通过大数据分析可以得到的一些参考性建议。所以,到第四维数据的时候可以做更多预测、决策和评估的工作。
同时,我们认为数据在不断升迁,计算力是非常之大的,因为到后面需要大量计算来满足计算的要求和数据分析的要求。幸运的是,我们现在很多芯片出来了,有很多大算力的芯片,除了感知之外我们还可以提取特征。在边缘侧,既能提特征,又能做空间分析。到了中心侧,我们可以做二维、三维、四维数据的分析,这时候我们可以做更多事情,因为我们有了更大的算力。
实际上我们还是得从业务出发,在大量业务上要分析清楚到底用二维数据还是三维数据来做业务闭环,所以要考虑网络部署。随着数据维度迁移,数据是大幅度浓缩的,从单点来看对网络的要求下降,但是到四维数据,要求的路数和要获得的感知数据更多,所以网络成本反过来是增加的。维度越高,网络代价越高。所以,我们会根据业务来综合部署,考量网络和计算的分布,看到底如何形成最佳的计算网。我们认为未来每个系统都是一张全网计算的能力。
要建设这样一张网就够了吗?从我们的时间来讲,还是不够。为什么?因为我们的用户持续会发生系统升级、系统扩容、系统变更,这时候要求更多的是在网络建设的时候要弹性适配、有灵活性,要适配未来业务需求的动力。我们在扩容的时候,我们增加产品是线性扩容,对当前的全网计算有了新的挑战和要求。
在人工智能行业有很多优秀的合作伙伴,对大华来说,我们希望以开放的心态和各位合作伙伴一起应用我们的业务场景,我们提供人工智能提供大华的优质算法,希望跟合作伙伴互补,同时在智能端、算法仓库也希望在算法上和行业合作伙伴互补,形成行业的应用场景的竞争力,真正实现构筑数据世界的真实性的能力。
刚刚介绍很多能力方面的优势,但实际上最终是由业务牵引整个数字世界,数字世界的价值闭环来自业务牵引。在交通、高铁、机场等各个方面,要能帮助交通便利的出行;在秩序方面做很多违章类的检测,本身是要提升城市管理运营的效率;环境方面我们做了煤气、水电的检测。虽然做到数字化解决这些问题,但是回到本质问题,还是要解决客户的问题,解决为生态建设服务的能力,最终数据要形成一个价值闭环。所以我们一直强调,业务驱动通过数字化建设、数字世界搭建回归到真实世界,通过数字世界改造帮助真实世界提升整体的运营效率。
在制造业、物流和零售有同样的问题,在制造业通过智能化改造面向中国制造2025、工业4.0升级,通过自动化报表的产生提升工厂和工人运营效率。物流方面,通过人车场货的匹配提供包裹的可追溯,物流车辆可以快速匹配。零售方面通过管理在线、消费在线、商品在线、服务在线提升商场运营效率,提升客户满意度和货、场的匹配能力,这都是通过业务实践用数字世界服务真实世界。
这是今天分享的大华对于AI数字世界的理解和想法,谢谢大家!
关于全球AI芯片·城市智能峰会
「全球AI芯片·城市智能峰会」是雷锋网 & AI掘金志安防团队继「中国人工智能安防峰会」、「CCF-GAIR视觉智能论坛」后,全力打造的又一大品牌活动。
在上述三大论坛中,组委会先后邀请到了高文、Demetri Terzopoulos、权龙、华先胜、贾佳亚、孙剑、颜水成、田奇、程浩、张鹏国、浦世亮、殷俊、余虎、李子青、申省梅、王晓刚、杨帆、陈宁、温浩、陈瑞军、张永谦、肖洪波、胡大鹏等在产学两界享有盛誉的权威专家。
论坛内容围绕「摄像机」这一介质入口展开,覆盖AI安防产品、图像与视觉智能算法、视频芯片&服务器、投融资、商业模式等多个维度的主题,旨在打造业内最完整的智能城市论坛体系。