微软全息投影技术揭秘

微软全息投影技术揭秘

ID:21777268

大小:295.67 KB

页数:10页

时间:2018-10-24

微软全息投影技术揭秘_第1页
微软全息投影技术揭秘_第2页
微软全息投影技术揭秘_第3页
微软全息投影技术揭秘_第4页
微软全息投影技术揭秘_第5页
资源描述:

《微软全息投影技术揭秘》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、微软全息投影HoloLens技术解谜(上):还原三维场景2015-01-27  HoloLens是什么?  HoloLens是微软发布的可穿戴式增强现实计算设备,它拥有这么几个关键要素:  它是增强现实产品,即AugmentedReality(AR),AR技术将计算机生成的图像与真实的世界相叠加。类似的产品有图像投射到视网膜上的GoogleGlass,以及叠加在手机摄像头画面上的手机AR应用。它拥有是独立的计算单元,自带CPU+GPU+HPU,不需要外接计算机。它的CPU和GPU基于英特尔的14纳米工艺的CherryTrail芯片,HPU是微软发明

2、的缩写,全称是HolographicProcessingUnit,即全息处理单元。按照知乎匿名用户的回答,HPU是一块ASIC(Application-specificintegratedcircuit),是微软为HoloLens定制的集成电路,对此,我只能说“有钱任性”。  HoloLens不是什么?  看完微软栩栩如生的宣传视频后,如果你的反应是  卧槽,Matrix要来了。  那么你要好好看这一段,因为Matrix是VirtualReality/VR/虚拟现实,VR的特点是让参与者置身于计算机生成的三维图像世界中,淡化真实的世界。VR近期的代

3、表产品是OculusRift,戴上Rift后你是看不到真实世界的。在我看来VR最大的问题是:这个虚拟世界很真实很精彩,但是有什么用呢?也就是说VR只能做到更逼真的三维世界,它无法帮助人们更好地理解真实的世界。  HoloLens也不是GoogleGlass(以下简称GG),它比GG多了:  三维感知能力,可以对身边的三维场景进行建模。而GG只能看到RGB像素值。三维渲染能力。人机交互能力,可以用手势来进行控制。 HoloLens也不是市场上常见的的AR,常见的基于摄像头的AR应用基于摄像头有:  基于丑陋的黑白标记图片的AR  以及基于任意图片的A

4、R。  很炫是吗,但是它们只能检测到图片所在的那个平面。HoloLens比它们都牛,它能检测到各个角度的三维场景!  HoloLens的AR是如何得到三维场景深度信息的?  我们回到AR的定义,想要实现增强现实,必须先理解现实,那么对于HoloLens而言现实是什么呢?是传感器的数据。  传感器是啥?是摄像头。  同样是摄像头,为什么HoloLens就可以感知深度呢?微软的Kinect在这方面很成功,那么是不是HoloLens上放了一台嵌入式的Kinect呢?  答案在下面的原型图片中:HoloLens拥有有四台摄像头,左右两边各两台。通过对这四台

5、摄像头的实时画面进行分析,HoloLens可覆盖的水平视角和垂直视角都达到120度。  也就是说它采用的是立体视觉/StereoVision技术来获取类似下图的深度图(depthmap)。  立体视觉是计算机视觉学科的一个子学科,专注于从两个摄像头的图像数据中得到真实场景中的物体离摄像头的距离。示意图如下:  下面是基本的步骤,查阅OpenCV文档可以了解具体到函数用法:  摄像头校正,undistortion。由于摄像头的镜片出厂时都存在扭曲,为了得到精确的数据需要在使用前进行较正。常用的方法是基于棋盘的各个姿态拍几次,然后计算相机的矩阵参赛。下

6、图便是常见的标定界面。  图像对齐,rectification。因为两个摄像头的位置不同,因此它们各自看到的场景是有偏差的,左边的摄像头能看到最左的场景,右边的看到最右的场景。图像对齐的目的是得到相同的场景部分。左右图像匹配,correspondence。可以使用OpenCV,得到disparitymap。通过重映射函数,比如OpenCV中的cv::reprojectImageTo3D,得到一张深度图。  只有一张深度图是不够的,它只是某一时刻真实的场景在摄像头中的映射。要想得到完整的三维场景,我们需要分析一系列的深度图。  HoloLens如何从

7、多张深度图重建三维场景?  答案是SLAM,SimultaneousLocalizationAndMapping,即同步定位与建图系统。这个技术被用于机器人、无人汽车、无人飞行器的定位与寻路系统。解决的是非常哲学的问题:  我现在在哪里?我可以去哪里?  SLAM有很多实现的方式,有一个开源的方式,实现了很多深度图的处理和匹配算法,可以认为是三维版本的OpenCV。  而微软围绕着Kinect的深度图数据发明了KinectFushion算法,并发表了两篇论文:  KinectFusion:Real-time3DReconstructionandIn

8、teractionUsingaMovingDepthCamera;KinectFusion:Real-TimeDenseS

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。