关键技术梳理,告诉你AR并没有那么神秘

巫盼 8年前 (2016-11-15)

巨头们都关注的AR关键技术有哪些?它们目前的发展状况又是如何呢?

关键技术梳理,告诉你AR并没有那么神秘

最近又有爆料称,苹果要在明年发布iPhone 8的时候推出支持AR技术的设备。虽然苹果对于AR的关注度一直很高,但是现在并没有明确的证据表明苹果正在研发AR硬件设备,很多消息都是科技圈内爆料大神们各种捕风捉影的猜测。

除了苹果之外,国内外很多巨头都非常关注AR的发展。此前易观智库发布的《中国AR行业应用专题研究报告》中显示,这些巨头正在基于自身的业务生态,以实验室或者收购的形式抢先布局AR的底层技术。那么AR关键技术有哪些?它们目前的发展状况又是如何呢?

关键技术梳理,告诉你AR并没有那么神秘

根据AR科研带头人Ronald Azuma提出的定义,增强现实应用系统开发的三大关键技术可总结为三维注册技术、虚实融合显示技术以及人机交互技术。

系统显示技术

AR的简单定义就是将计算机生成的虚拟数字信息叠加到现实的生活场景中。这个“叠加”是需要通过显示设备作为中介来实现。AR的显示技术包括三种类型:头戴式显示、手持显示以及投影显示技术。

目前最常见的就是手持显示技术,它的载体包括移智能手机、平板电脑等移动设备。此前火爆全球的AR游戏《Pokemon Go》就是借助手机的显示屏在现实生活中捉小精灵,这些移动设备的屏幕充当的就是一个窗口或者放大器的作用,用来显示那些模拟的数字信息。

头戴式显示是国内外众多AR硬件厂商研究关注的重点,按照工作原理可以分为光学透视式和视频透视式两种。光学透视技术是通过安装在设备眼前的光学透镜来呈现出真实和虚拟世界。首先计算机生成的虚拟信息经过光学系统放大后反射后进入视野,透过透镜又能直接看到现实场景,两部分的信息汇聚到人眼的视网膜上实现AR的效果。微软的Hololens就是属于光学透视式的头戴显示器。这种显示技术的优点就在于结构简单,真实感和安全性更高,但是易受光线外部光线的干扰。

关键技术梳理,告诉你AR并没有那么神秘

视频透视技术是借助安装在头显上的摄像头来捕捉获取外部真实环境,计算机将数字模拟信息叠加到摄像机的视频信号上,再将真实场景和虚拟场景进行融合。相比较光学透视技术,它的视角场更大,而且不受外界的强光干扰。不过一旦摄像机与用户的视点不能保持完全重合,会产生一些偏差。

关键技术梳理,告诉你AR并没有那么神秘

投影式显示是将生成的虚拟对象信息直接投影到需要融合的真实场景中。它可以不借助任何硬件设备,直接用肉眼看到被投射出在现实环境下的虚拟场景。但是投影设备体积庞大,比较容易受到光照变化影响,这块目前的实际应用比较少。

现在还有一种光场显示技术,以Magic Leap的光场技术为例,它不需要任何屏幕为载体,通过记录并复现光场就能完成虚拟物体的显示。通过呈现不同深度的图像,使用户在观察近景或远景时,可以实现主动的对焦。

关键技术梳理,告诉你AR并没有那么神秘

对比这三种显示技术,手持式显示技术的载体是最为常见的,所以在面向C端用户的AR电商、游戏上应用广泛。而头戴式显示在TOC端的工业应用上潜力巨大,比如宇航制造业,通过使用这种设备来提高生产工作的效率。

三维注册技术

在实际的AR体验中,因为人的观察视线会不断地变化,AR系统需要实时的根据用户的视场重新建立位置坐标系,进行追踪。而三维注册技术就是实时地跟踪用户头部的位置和视线方向,根据这些信息来确定虚拟物体在真实空间坐标中的位置,并将它实时地显示在显示器中的正确位置。它具体包含了跟踪技术、标定技术和匹配技术。

三维注册技术又可以分为基于硬件设备和计算机视觉两种。

基于硬件设备的追踪技术主要是通过硬件传感器跟踪技术来实现,主要包括惯性导航系统、全球定位系统(GPS)、电磁、光学或超声波位置跟踪器等。谷歌的Project Tango就是通过手机的传感器来进行运动追踪。虽然它无需通过计算机复杂的算法来获取位置信息,速度比较快,但是相应的注册精度不是很高,比如GPS定位很容易受到复杂地形位置的干扰,而惯性定位追踪的偏差度会随时间增长不断增大。

关键技术梳理,告诉你AR并没有那么神秘

基于计算机视觉的注册技术主要是指利用计算机视觉获取真实场景的信息后,经过图像处理方面的知识来识别和跟踪定位真实场景。细分可以划为基于传统标志的注册算法和基于自然特征点无标志注册算法。基于计算机视觉的注册技术的精度较高,但是对计算量非常大,而且算法复杂,对系统的要求非常高。

为了取长补短,得到更加精确的注册结果,现在有结合两种技术的混合注册方法。通常是先由跟踪传感器大概估计位置姿态,再通过视觉法进一步精确调整定位。一般采用的复合法有视觉与电磁跟踪结合、视觉与惯导跟踪结合、视觉与GPS跟踪结合等。

人机交互技术

因为AR是将虚拟的数字信息叠加在现实环境中,所以非常注重用户在真实环境中和虚拟物体的自然交互。这就需要有针对性的设计用来交互的“工具”,保证能够执行用户对虚拟物体发出的各种指令。

AR的交互方式现在有通过外界的硬件设备来实现,如鼠标键盘,数据手套等等。还有一种更自然的交互方式,就是通过基于计算机视觉的手势识别,以及语音识别等等。它们不需要借助其他硬件载体,就可以直接和虚拟物体进行交互,而这种人机交互依赖于以深度学习算法为基础的人工智能的发展。现在的AR硬件设备大多都可以实现简单的语音和手势动作的识别交互,但是涉及到一些复杂的指令的时候,可能会无法进行及时的命令反馈。

上面提到的三大块只是AR技术的主干支,在每一个主干下面都能衍生出其他分支技术。随着技术的不断深入发展,未来的AR会和真实世界完全融合。就像《黑镜》第三季的《游戏测试》故事那样,人们或许会逐渐无法分辨何为现实何为虚拟。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到