7月12日至7月14日,2019年第四届全球人工智能与机器人峰会(CCF-GAIR 2019)在深圳正式召开。本次峰会由中国计算机联合会(CCF)主办,雷锋同志承办。由深圳人工智能与机器人研究所联合举办,深圳市政府大力指导。是国内人工智能与机器人学界、产业界、投资界三大领域的顶级交流与博览会盛会,旨在打造国内人工智能领域强大的跨境交流合作平台。
7月14日下午,在“智慧城市视觉智能”专场上,云带来了联合创始人的主题分享《泛在智能城市下的人机协同平台》。
文浩提出,在AI大规模落地的过程中,需要构建感知、认知、决策的智能经济AI闭环,初创企业也必须参与感知、认知、决策。
另一方面,场景可以分为边缘场景和云场景,但边缘场景和云场景应该根据场景智能分配。
边缘和终端承担需要本地实时响应的推理任务,独立完成数据采集、环境感知、人机交互和部分决策控制。
在边缘,比如在自动驾驶的场景中,当网络断开时,进行独立的本地处理;在智能安全中,需要对海量数据进行本地处理;移动互联网场景,保证低功耗和数据安全;智能家居和智能制造场景需要异构和实时响应。
云负责承载智能数据分析、模型训练和一些传输带宽要求较低的推理任务。
文浩认为,AI目前还不成熟,很多行业都有很多需求。要解决这个问题,就要实现“人机协同”。
人机协作有几个阶段。首先是做人机交互。首先,让机器知道你是谁,这就是为什么我们应该先做人脸识别。
第二步是人机融合。比如银行的产品经理只能设计十几个产品,但是基于大数据和AI,他可以为每个小微企业设计上百个AI金融产品。
然后是人机共创,未来可以创造一些新场景、新业务、新服务、新流程。比如零售店可以进行二次展示和精准引流,就是人机共创。
以下是雷锋从云联合创始人文浩达的讲话全文。在不改变初衷的情况下编译和编辑:
今天,看到这么多学生和观众参加会议,我很惊讶。大家的热情让我很惊讶。会议组织得很好,邀请了很多平时很难见到的大咖。
以前的大咖都是关于学术内容的。今天,我将从产业的角度与大家分享从云在人工智能产业落地方面的经验,希望能给大家带来一些思考。
首先,我们来解释一下人工智能。事实上,中国先贤已经对这方面进行了很多思考和总结。荀子在两千多年前就提出了“智”的概念。
他说“知是人所知”,意思是我们感受事物、认识事物的能力叫知觉。“知事即智”,如果符合客观规律,可以引申为把事情说清楚,这就是智慧的概念。
另一个是“人的能力叫能力”。人天生就有许多本能。我们都知道天冷的时候需要添衣,口渴的时候需要喝水,“有共同点的人的能力叫能力”。如果这个能力能够高效的形成一个方法,那么这个时候就是一个稳定的能力。这就是处理事情的能力,可以延伸到所有人身上去学习。
因此,我们不仅要知道事情,还要处理事情。这就是人类智力的概念。
那么,我们如何让人工智能着陆呢?
从传统经济到数字经济再到互联网,我们有电商、娱乐、游戏、虚拟货币。在过去的20年里,数字经济给我们的生活带来了巨大的变化。
现在人们打车、网上购物都很方便,很多信息都可以实时、便捷地获取,但这就够了吗?明显的
收集了这么多数据,我们需要做一些更聪明的事情。比如叫车方便,但是车需要有人开,所以我们要自动驾驶,所以今天我们提出了智能经济。
智慧经济如何改变?
在处理事情之前,我们需要先了解事情。我们的脸、人体、声音和文字都可以通过感知来收集。提取这些信息后,我们可以通过语言理解来了解其内涵。
之后,知识图谱可以对这些知识进行归纳,通过机器学习对模型进行训练,从而实现认知。当然,这个认知过程可以是线下的,也可以是线上的,只要有量表数据就可以运行。
最后,系统需要做决策,即不仅要知道事情,还要处理事情。在处理事情时,需要反馈相关信息,例如,反馈给商家,以促进促销;给银行降低风险;引导汽车让人们安全快速地到达目的地。
这些步骤的结合就是AI落地的闭环。所以AI创业公司要想真正落地,必须涉及感知、认知、决策三个阶段,否则场景的价值很小。
现在我们都在谈论云、边缘和端。事实上,它是整个智慧城市的基本框架。
构。
每个城市都会有一个城市大脑,它在云端,会将数据融合、集中处理,然后进行算法训练;端上就会有各种各样的智能设备做万物感知、万物计算。
随着5G时代的到来、IoT的成熟,得益于算力的可动态分配,云边端的协同是可以期待的。
目前云从在很多场景里面都会做基于类似智能的服务。
在金融领域,我们提供VIP的识别、刷脸支付、刷脸取款、刷脸购物,这些智能服务目前都可以在银行里体验到。
再来就是银行里面对机房或者是ATM机的管控、运维,这些属于认知层面、决策层面的。
在机场,所有的安检通道都可以进行人脸比对,当用户进入候机楼之后,系统可以把相关人的登机口信息推送到他的手机上。
在学校或者是开放场景中,利用行人的轨迹分析、行人的识别技术,可以实现实时、在线追踪。
在开放道路上,可以实现车牌、车型、车标、颜色的区分,可以为公安民警精准地追踪到每一辆车的轨迹。
在自然场景下的OCR,可以对包括零售店广告、文字进行识别;除了室内,还可以做室外比较密集的场景识别、人体追踪等等。
在零售店,我们还做了一些基于AR的体验,比如说基于二维视频的3D人体建模,我们做到了200帧每秒,40多毫米的误差,达到世界第一,利用这个技术可以做虚拟试衣。
另外,还有智慧能源行业的安全管理,比如说安全帽、工作服、防火等等方面的管理。
除此之外,还包括人员的精细管理、场站周界入侵、车辆监控、异响检测、设备状态检测等等,这些都是智慧城市里各行各业都可以用得上的视觉认知和决策场景。
找到了这些场景之后,我们需要做些什么呢?
首先需要将计算做分配,每个场景里的计算要求是不一样的,比如说在自动驾驶场景下,需要断网下独立本地处理;比如说智能安防场景下,需要超大数据量本地处理;而在移动互联网方面,实时性要高、功耗要低。
所以,面对不对的场景,需要不同的算法、不同的芯片,也就是说:芯片与算法的结合肯定是未来的一个大趋势。
比如说AI安防市场,最早的摄像机只是做一些ISP、图像处理;后面升级为网络摄像机,做一些网络编解码、数字传输;今天的AI安防摄像头,需要做本地结构化,由于它一天会产生20GB的数据,这对于带宽和存储都是很大挑战,也就是说必须要做结构化提取。
上图是我们的一个800万像素的全功能AI相机,它可以做到同时检测200个以上人脸,最大支持30万人脸库。
现在来说,其实AI发展还不是太成熟,很多产业的需求是非常多样的,这时候该怎么办呢?
在未来的30年内,云从认为技术趋势应该是人机协同。
人有人的优势,人有创造力、有抽象力,我们可以从书本上学习知识、推而广之;而机器的计算力、大数据分析能力明显高于人类。
人机协同发展可以分为几个阶段,第一个是要做人机交互,首先要让机器知道你是谁,这也是为什么我们要先做人脸识别的原因。
除了它有比较成熟的算法,更关键的是它有一个视觉入口。互联网世界,每个产业都需要找到正确的入口,APP是一个入口,手机也是一个入口,而视觉技术就是AI的入口,它可以知道你是谁,后面才可以做一系列交互动作。
第二步需要做人机融合,我们现在有很多事情可以让机器和人一起去做,比如说银行的产品经理,他可以根据他的经验、能力,设计一个产品的风控,但他最多只能设计十几种产品;基于AI,可以针对每个小微企业设计成百上千种AI金融产品,这就是人机融合。
如此,便可以做得更高效、更精准、更有价值,这是在未来10年中,大家可以看到的应用,目前很多工作都可以与机器协同完成。
再来就是人机共创,AI落地之后,未来我们可以创造一些新的场景、新的业务、新的服务、新的流程,这叫人机共创。
那么,做到这三步是不是就够了呢?还需要做到“三化”:行业化、场景化、个性化。
行业化方面我们刚才举了很多例子,每个行业的需求都是不一样的,人脸识别在金融和安防里面的应用是完全不一样的。安防要求的是开放场景、快速搜索;金融要求的是百万分之一甚至千万分之一的误识率及及活体检测。
第二是要场景化,每个场景都要有具体的解决方案;第三是个性化,这是大数据时代最大的利处,每个人都可以得到精准的服务。
接下来谈多模态应用,我们做人机交互,为什么要提多模态?
举个例子,现在大热的新零售,以后肯定是个技术落地趋势。(虽然现在做稍微早了一些,目前的技术货损率比雇一个店员更高,还不如不做。)
但就技术层面来看,AI未来可以做些什么?
其实新零售可以分为人、货、场三个方面,货有一套供应链,场就是现在的电商一直在做的事,比如说把信息流提到线上去它会更高效,但线下做也有它的好处,可以在真实场景中体验产品。
还有就是资金,在线上更便捷,但是在线下更安全、可靠;还有一个就是延时,线上是有延时的,线下是没有的。
所以,我们认为AI应该围绕人去建设的,我们有很多与人相关的技术,可以将流量变成转化率,然后变成客单价,再来提高复购率。
在人的方面,我们可以做很多事情,比如做前端感应、广告推荐,它会根据用户的年龄、属性、会员,分析你可能爱好的东西,或者你上次买过什么东西,之后把信息推荐出来,后台会做一个数据建模。
再比如做游戏引流,可以在用户玩游戏的过程中,送打折劵的形式去采集数据,之后做产品推荐。
后台用户的特征建模,可以从5个维度,几十个特征去分析,我们通过双塔稀疏神经网络做深度学习,从200个广告里面提取用户感兴趣的100个广告,这100个广告在线下就可以完成,等用户到店后就可以推送10个精准广告。
传统的线上电商,都有一套跟踪模型,从用户浏览、点击、放到购物篮,最后生成订单、支付,它是有一套转化模型的,叫漏斗模型;而线下是没有的,线下都是靠经营主自己的脑袋,靠自己的经验去决定的,而这种方式的效率是非常不高的。
刚才我讲的银行融合是一个人机共创的例子,现在还可以做二次陈列。
我们可以通过一些购物小票去做一些引流动作:通过对购物小票的分析去重新摆设商品,计算出单坪空间的更多价值。
现在AI主流的玩法不外于B端或者C端,这些都不重要,重要的是云和端的产品和服务如何更好结合在一起,最终达到人机协同。
所以,云从现在全力打造一个人机协同平台,面向包括金融、安防、零售、电力等各个行业。目前已经有400多家银行、70%的枢纽机场、一万多路公安视频都与云从有深度合作。
今天我的分享就到这里,谢谢大家。雷锋网
关于中美贸易战,这些消息都是假的!搜“中国网”抖音号(787874450),看你想看