张学勇移民公司
微信扫一扫 分享朋友圈

已有 140 人浏览分享

开启左侧

商汤徐持衡:将与汽车厂商合作开发无人驾驶技术

[复制链接]
140 0


商汤科技联合创始人徐持衡

  新浪科技讯,12月16日午间消息,在品玩举办的《HAY!17?无限奇境》活动上,商汤科技联合创始人徐持衡发表了题为《身边的人工智能》的主题演讲。

  徐持衡表示,人脸识别技术将成为勾连线上与线下服务的关键。通过人脸识别,可以为线下店面提供用户的线上数据,给用户提供具有连续性的购物体验。

  徐持衡还宣布,商汤将与世界前五的汽车厂商合作开发无人驾驶技术。他调侃道,“百度之前无人车上路遭到了触发,但也许五年后,你开车上路才会被判违反交规。”

  徐持衡认为,人工智能能够部分解放人类的脑力劳动。让一些需要依赖经验的工作,不再需要那么多年的积累。

  以下为徐持衡演讲实录:

  今天给大家带来的分享是关于我们身边的人工智能。

  首先,我们讲一讲商汤科技。

  我们是一个专注于深度学习和机器视觉的这么一家公司。其实我们做的很多东西很好理解,因为机器看到的和我们人自己看到的很一致。

  在讲人工智能之前,我想给大家回顾一下前一段时间经常出现的一张图。这张照片我估计很多人都看过,当时很多人在那争执,它到底是粉白还是灰绿这么一个问题,我们且不说它最终的结果或者它真实的一面什么样。我只想说的是,这两波人他们互相争执不下,谁也说服不了谁。

  从我们的角度来理解这件事情,我们看到同样的东西,不同的人会有不同的判断。再放到另外一个场景中去,这是卫星上拍的一个遥感这个图像,这个遥感图像要做的事情,它首先拍的不是人口密集的地方,它是一些相对偏的地方。它需要做的一个事情是,我们要把遥感图像中很高分辨率的图像,区分出哪些地方是地面,哪些地方是被雪覆盖的,哪些地方是被云覆盖的。区分了这些以后,我们能够让这样的遥感图像它的数据和信息价值自动化。左边这张图,很明显都是积雪。右边这张图,很明显都是云。当我们再去看中间这一张,它既既有雪,又有云,而且都是白色的情况下,我发现这个事情对一般人来讲,他不熟悉这个场景,他也没法很好的做出判断。这个时候我们怎么办呢,能不能给我一些例子,告诉我到底哪些是,它的特征什么样,通过一定的训练,或者说通过我自身对这个东西的学习,对于样例的学习,我就能做这个事情。

  讲了这么两个场景,其实我想讲的是,我们自己对于看到的东西所做出的判断,某种意义上也是要经过一定的经验积累和学习的过程,我们才能给出一个比较准确的答案。同样的事情我们可以放在机器上,放到计算机上,放到人工智能上。现在我们已经积累了超过100亿的数据,覆盖了18个不同的行业,我们用大量的计算机集群,让深度学习在这些数据中挖掘特征,学习它们里面的关联,然后我们再把这个能力放到实际应用场景中。我们发现,人工智能能做的非常多。今天时间有限,我按照时间维度给大家分享一下身边出现的,即将出现,或者已经出现的人工智能是什么样的。

  现在每个人都离不开手机,拿起手机第一步是解锁,现在oppo、vivo都已经用上了我们人脸解锁功能,对手机的交互有一个很好的提升。除此以外,其实我们也可以做更多的识别能力,让你的手机能看懂你的表情,你的姿态,看懂你的手势,等等等等,我们相应都可以形成交互。今年非常火的直播和短视频行业,已经把这样的技术大规模做应用,像这些简单的渲染,快速实时渲染效果,都可以直接呈现在手机上做直接交互。

  最后一个视频是另外一个交互方式,不是和人、和你自己进行交互,而是和真实场景进行交互。我们做的技术可以实现三维定位和构图,我们把一个平面定位出来之后,把真实场景布置在场景中去,甚至有三维定位以后可以把一个物体绕着它飞,逼真的效果,增加整个交互的体验。同样,我们可以把上面东西随意拜访,做一些设计相关的仿真的事情。

  到了10点,城市处于非常活跃的状态,高速运转,城市中有大量摄像头,它可以看整个城市不断发生的变化。这样一些摄像头不仅仅是在这个时间节点运行,一天24小时都在运作。大量监测数据和录像没有二次利用价值。我们做的事情是让这样的摄像头更好的理解这个城市现在发生的到底是什么样的情况。比如这个场景中我们理解的是交通三要素,人车,非机动车,以及他们的特征,以及他们所附带的属性,来帮助我们对于这样一个事情做结构化,特定模式状态分析。比如行人闯红灯,或者车辆进入了不可进入的比较危险的区域。类似的,我们可以用在人脸的布控,对于一个监控摄像头来讲,它要布控不仅仅是一个人,或者十个人,我们自己能记住100张人脸,但是当我们看实时监控录像的时候,我很难对里面每个人做判断。但实际需求是我们要对潜在10万量级,甚至更大量级人员进行布控,提升我们整体周边的安全性。机器可以做到这一点,可以非常好的记录下所有待布控人员,实时24小时做这样的工作。

  右边是另外一个对人群维度的判断。在这个场景中,如果说人数达到一定数量时,需要借助更多安保力量,这个人数谁说了算,谁能给出准确答案?计算机可以做这个事情,估计人的密度和总数,即使有10%的误差,我相信它对于安保执行都是一个很大的帮助。到了中午,这是一个适合大家聚餐、拍照的场景,对于手机上我们现在非常常见的双摄区块,我们可以做的是视频中截取单照片区块,能够达到这样一个效果。现在双摄中也有很多应用,在手机上见到我们的算法和技术,做到实时的虚化效果,拍照效果也可以做一定的美化,很多优化功能,来提升整个照片的质量。当你拍了大量照片,或者你出去玩以后,发现手机上存很多照片,为什么我们一直讲手机上?因为手机承载了我们现在获取照片,获取视频图像数据一个非常重要的载体,在这上面我们可以得到大量照片数据。你会发现,手机上超过1000张,甚至超过更多照片,很难再次利用,需要上传电脑上和云端再去做。未来我们希望你的手机上就能把这样的照片做分类和优化,做特定的效果处理。同样的,我们可以根据手机拍摄到的人做相册分类,这样的功能现在都已经在我们身边有很多应用了。

  再说一点不一样的,我们也做了一个超过50类的照片场景分类,这个场景分类包括宠物猫狗,也包括吃的,风景,建筑。举一个场景,我可以把所有你拍的文档照片找出来,让你去看,这里是不是有一些比较敏感的信息,是不是你拍完发给某一个人希望把这样的数据删掉,而不是希望他放到网上。我们要做的是让你手机中更多的照片很容易的能够被二次利用,体现出拍完照片以后的价值。

  到了下午,很多人会出去活动一下,在活动过程中,通过一个摄像头我们可以获取到活动姿态,可以理解你的行为,观察你的运动过程。这个过程对于每个人来讲,我们平时会看体育直播,对于你自己参加的每一场活动用一个摄像头,它可以帮你完成整个精彩镜头的集锦。这样的场景我们可以识别不同运动,不同运动可以理解他所发生的事情,他当前状态冲撞程度。类似这样的信息我们能够帮助你形成你个人的运动记录。到了晚上六点是一个商场活动的高峰期,在商场中有很多人群。我们的人脸识别,我们现在能够做到一分之一的准确率,90%的通过率。一分之一意味着8位数密码级别,可以把它作为人脸支付的工具了,可以全自动完成这样的事情。除了人脸支付以外,我想讲的另外一点是我们线下消费和线上消费竞争中,人脸是非常关键的入口,为什么?线上有天然用户画像,有你的消费记录,这些数据都可以帮助做更多推广营销,线下很缺少这样的数据。通过对人的识别,能够关联你的历史消费记录,提供更好的定制化的消费钱的服务,消费钱的服务正是我们在手机端网上消费很难体会到的。比如我们网上买东西,第二条快递上门了,这都是在你消费后产生的服务,在线下,我们可以根据你的需求,根据不同的状况,给你很多建议,给你很多针对性服务。这些东西真正能够让线下带动它更大的发展。

  到了晚上八点,离城市安静下来远没有结束,我们能够识别的东西千千万万,能够识别很多很多不同的东西,把它放在一个应用场景中去就是无人驾驶,和前面吴总讲的无人驾驶很相关,和全球前五的车厂,我们共同打造无人驾驶方案,共同把无人驾驶往前推。为什么是无人驾驶,为什么要做这个事情。可能部分人对无人驾驶还抱有一定的怀疑。

  前段时间,百度因为无人驾驶上路,被处罚。我相信不远的未来,也许你开车上马路会被抓起来,因为违反交规被处罚。为什么?航空器,飞行员很讲求时间强度,对于老司机来讲,我们只需要在驾校学习两三个月时间,十几次真实训练的过程。对于人工智能来讲,它可以做的是把所有在马路上跑的数据汇聚在一起,把他们的经验和关联学习到,能够同时提升所有的无人驾驶车辆的性能。这样一个驾驶经验对于未来我们城市的交通,提升交通通行效率来讲是非常可观的一个提升。我相信,车自动驾驶超过人去驾驶的时间不会太长,当我们的数据量和我们的系统运行起来以后,它很快能够给大家带来更加的便利。

  让人工智能做这些事情它有很天然的优势,它可以做到非常高精度,一分之一,对人来讲,很难做到这样高精度级别。同时,它能够及时跟你互动,提升人机交互方式,给你带来新的操作方式,不管是和手机,还是和屏幕,它能够及时识别环境中的变化,带来整体效率的提升。把它放到大量没有人看的数据上,全天候24小时不停的处理这些数据,去理解挖掘数据中二次价值,帮助我们把海量数据变成真正能够用上的,对我们生活带来改善,对城市进行监测预测和优化的数据,这是机器天然优势。当我们把大量数据,大量经验,让机器去学习含有,它又是可复制的,不需要去驾校再去培养和学习的过程。可以快速把所有经验赋能到端,让每一个端,每一个节点,都具备最新最强的计算能力和识别能力。

  最后讲标准化,人的判断很难做量化统计标准,对于人脸识别来讲,我们做了这样一个事情,两张照片相似度进行映射,判断它是非常可量化,可以在标准上,根据需求去做调整的事情。这对未来场景的判断会带来更好的价值。

  结合这些优势,人工智能能够解放经验性的脑力劳动,让大家更关注在创新性的文化等等产业上。所以商汤科技我们做的事情是坚持原创,让AI引领人类越来越进步。谢谢大家!

举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

9

关注

15

粉丝

42462

主题
精彩推荐
热门资讯
网友晒图
图文推荐

维权声明:本站有大量内容由网友产生,如果有内容涉及您的版权或隐私,请点击右下角举报,我们会立即回应和处理。
版权声明:本站也有大量原创,本站欢迎转发原创,但转发前请与本站取得书面合作协议。

Powered by Discuz! X3.4 Copyright © 2003-2020, WinnipegChinese.COM
GMT-5, 2024-9-22 00:32 , Processed in 0.188343 second(s), 31 queries .