AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

探险发布 申博官网首选锐博网 876浏览
AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

伴着北京 2017 年的第一场雪,百度再次召集媒体开了一次 AR 复原北京老城门的活动,此前媒体曾被邀请去参观百度用 AR 复原朝阳门。

不同的是,这次百度复原了老北京九大城门中的另外八座城门,还新增了两个玩法,并邀请了百度首席科学家吴恩达参加,同时宣布成立百度 AR Lab,要打造一个 AR 平台。

AR 复原老北京九大城门

百度这次选择了北京西直门的 2 号线和 13 号线换乘大厅、地铁 2 号线的一辆百度 AR 专列上,展示老北京内城九大城门的 100 年前老照片。九大城门分别是正阳门、德胜门、崇文门、朝阳门、西直门、东直门、阜成门、宣武门、安定门。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

百度提供了三种 AR 玩法:

方法一:扫一扫

打开手机百度 App,点击拍照按钮,在通用模式下对準九大城门的老照片拍照,点击「发现 AR 动画」,然后继续对準手绘的城门触发图,便可看到已经消逝的北京老北京九大城门复现出来。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

方法二:搜一搜

打开手机百度 App,搜索九大城门关键词,点击搜索结果中讯息卡片(阿拉丁卡片),摄影镜头自动调起,对準任何纹理丰富的物体(如手心、键盘、杂誌、公交卡等等),即可看到九大城门的 AR 效果(见下图)。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

方法三:实景触发

正阳门的实景触发也已经实现,并採用 SLAM 技术(Simultaneous Localization And Mapping,即时定位与地图构建技术)。只需用手机或平板对準正阳门,就能触发 3D AR 内容(见下图)。不过这次只演示了 Demo ,用户还无法使用。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

SLAM 技术和 UDT 技术

百度此次展示的 AR 技术比复原朝阳门时更进一步,上一次用户只能用手机百度对準老城门的画作来触发 AR,这次是直接对準老照片,识别难度更高。同时还新增了搜一搜和实景触发两种玩法,背后分别对应的是 UDT 技术和 SLAM 技术。

SLAM 技术

本次在正阳门实景触发测试中,百度採用了自主研发的 SLAM 技术。SLAM 技术是 机器人 (计算机)在未知的环境下,利用感测器(camera, laser, IMU 等)来估计自身的姿态(包括位置和朝向),同时建立周围环境的地图。

SLAM 在无人车、无人机和 AR 上都有非常重要的应用。百度研发的 SLAM 技术可以做到低功耗、高即时性,支持多种数据源,比如单目、双目、RGBD 等。

SLAM 与 IMU 技术的区别:

手机端 IMU(Inertial Measurement Unit)惯性测量单元误差较大,只适合估计手机朝向(3 自由度),比如横屏/竖屏,倾斜等方向,不能用来估计位置计算。SLAM 不仅能估计手机三维朝向,还能估计手机的三维位置(6 自由度)。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

对于 AR 来讲,传统的虚实结合是在二维图像上叠加虚拟三维物体。视觉 SLAM 算法可以使得 AR 系统理解周围的三维环境,从而把虚拟的物体放到合适的位置。更进一步,虚拟物体可以与现实的三维环境发生互动,产生更有趣的互动方式。

SLAM 的核心有两个部分:

第一部分是估计计算机的姿态(计算机在三维空间中的位置和朝向讯息)。

第二部分是建立周围环境的三维地图(稀疏或者稠密的三维点云)。

对于 AR 广告,SLAM 可以让广告不再受限于预先制定好的海报、平麵包装等。例如,用户可以在家里打开手机百度,查看一款网上的沙发和客厅是否搭配,或者可口可乐公司做一款 AR 广告,让运动员围绕可乐罐跑步等。

百度 SLAM 技术基本情况与上线时间

百度 ARLab 负责人吴中勤向雷锋网介绍了百度 SLAM 技术的基本情况,并透露未来三个月这项技术将上线到手机百度,他说:

UDT 技术

传统基于图像跟蹤的 AR 技术需要预先确定一张图片,用户必须有一张完全相同的图像,才能展示 AR。通过 UDT(User Defined Target)用户自定义目标技术,这个限制被去掉,让用户随手找一张有纹理的图案即可展示 AR 效果(如公交卡,图书,手心、键盘等)。

UDT 利用多线程、GPU 等加速算法,可以即时估计图像中的複杂特徵讯息,从而计算出空间三维位置。

成立 AR Lab,打造 AR 平台

藉着展示复原老北京九大城门这个机会,百度今天宣布成立第四大实验室——扩增实境实验室(AR Lab),由吴中勤负责,属于由首席科学家吴恩达负责的百度研究院。百度研究院此前已经拥有了三大实验室:硅谷 人工智慧实验室、北京 深度学习实验室(原深度学习研究院)和北京大数据实验室。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

据吴中勤介绍,百度移动端的 AR 技术共分 图像识别、三维感知与跟蹤、人机互动、三维渲染与虚实融合 四大部分:

物体识别是 AR 的基础功能, 通过摄影镜头识别场景中的物体,触发相关 AR,并在云端找到相应的虚拟物体与讯息。

目前主要 AR 技术非常依赖图像识别技术,从图像识别来说,百度有整个互联网的大几百亿的图片数据,而且识别的速度非常快,如果大家使用过我们拍照识别的软体,可以知道它能够以非常快的速度(大概小几百毫秒)返回结果,在四五百亿的图片库里面进行快速的检索。

三维感知与跟蹤则 通过自主研发的相机追蹤算法为 AR 提供快速稳定的相机姿态估算结果,适应 AR 技术在移动设备上的运行要求。

我们在跟蹤速度上可以做到 10 毫秒级的快速跟蹤,完全可以做离线的计算,同时还有比较强的抗干扰能力,就是对画面的遮挡,对物体部分的遮挡可以快速的响应还有快速的重定位,当摄影镜头移开的时候可以计算到摄影镜头重新定位的方位。

人机互动技术可 利用语音和手势减少用户触屏操作,为用户带来更好的互动体验。 比如说语音识别,百度的语音识别拥有非常高的精确度,达到 97%。

跨平台的 可以将虚拟三维物体渲染到现实三维渲染引擎环境中,从而实现虚实融合效果。 我们的 3D 渲染目前可以做到跨平台,体量可以做到 1M 左右,这样互联网上大部分移动 APP 都可以集成这样一个 SDK 和 AR 服务。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

AR 平台

百度 AR 的产品主要是以平台的形式面向行业合作伙伴,推出了 DuMix 产品体系。这个体系主要包含 AR SDK 和 AR 编辑器。其中 AR SDK 支持 iOS 和 Android,包括渲染引擎和底层算法;AR 编辑器包括 AR 行业模板和 3D 快速建模工具。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

据吴中勤介绍,百度 AR SDK 可以支持实际物体的 AR,也可以支持整个以 AR 驱动的互动游戏,比如说没有触发物,基于手部、人脸会有特殊的一些互动效果。百度里面目前几个比较大体量的移动 APP 都已经支持这样的效果,大家陆续都会在各个场合看到百度系的软体具备这样的能力。

DuMix 可以支持各种各样的应用场景,百度在现场列举了 AR 游戏、AR 娱乐和 AR 旅游。并以品牌营销为例,介绍了一个 Dumix 的应用流程(见下图)。

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

吴恩达:AI 技术是 AR 的核心

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

吴恩达这次是专程从美国回来参加百度 AR 复原北京老城门活动的,他对雷锋网透露,自己 60%时间在硅谷,40%在中国。吴恩达对 AR 非常看好,并且他认为 AI 技术是 AR 的核心,而百度内部认为人工 智慧是新的电能。他说:

AI 技术是 AR 的核心!那中国互联网三巨头齐步发展 AR

在接受媒体採访时,吴恩达表示百度开始 AR 方面的工作大概是两年前,并认为相比眼镜,手机会是更方便 AR 应用平台。

在提到中美 AR 发展对比时,他认为 AR 技术在中国的发展会比美国快。

AR:BAT 的新战场

AR 正成为下一个大技术热点,目前,不仅是百度,BAT 三巨头都在积极布局 AR 技术。

  • 阿里这边,支付宝推 AR 实景红包,淘宝对 VR 购物进行了探索,阿里还投资了 AR 初创公司 Magic Leap。
  • 腾讯方面,QQ 除了也推 AR 实景红包,还玩过 AR 火炬等各种应用,有超过 1 亿用户参与,而根据雷锋网获得的消息,腾讯今年还将推出名为 QAR 的 AR 开放平台,将 AR 集成到旗下各大应用程式中去。

    百度的 AR 开放平台,加上腾讯 AR 开放平台 QAR,以及阿里在 AR 领域的众多探索,显示出,BAT 又在 AR 领域聚首了。

  • 与本文相关的文章