全息技术迎来突破:深度学习可将二维图像转换为三维图像

感谢网友 Alejandro86 的线索投递!

10 月 22 日消息,全息图像可以提供物体的三维(3D)视觉效果,比二维(2D)图像更加真实和立体,在医学成像、制造业、虚拟现实等多个领域都有着巨大的价值。

注意到,传统的全息技术需要记录物体的三维数据和与光线的相互作用,这个过程需要很高的计算能力和专门的摄像机来拍摄三维图像,这种复杂性限制了全息图像的广泛应用。

近年来,也有许多基于深度学习的方法被提出,用来生成全息图像。它们可以直接从使用 RGB-D 摄像机拍摄的三维数据中创建全息图像,RGB-D 摄像机可以同时获取物体的颜色和深度信息。这种方法避免了传统方法中的许多计算挑战,是一种更简单的生成全息图像的方法。

现在,日本千叶大学工程研究院的下馬智之教授带领的研究团队提出了一种基于深度学习的新方法,进一步简化了全息图像的生成过程,可以直接从普通摄像机拍摄的二维彩色图像中生成三维场景或物体。这项研究最近发表在《光学与激光工程(Optics and Lasers in Engineering)》杂志上。千叶大学工程研究院的石井佳之和伊藤智之也参与了这项研究。

谈到这项研究背后的动机,下馬教授说:“实现全息显示有几个难题,包括三维数据的获取、全息图像的计算成本以及全息图像与全息显示设备特性之间的转换。我们进行这项研究是因为我们相信深度学习近年来发展迅速,有潜力解决这些问题。”

该方法使用三个深度神经网络(DNN)将普通二维彩色图像转换为可以用来显示三维场景或物体的全息图像。第一个 DNN 使用普通摄像机拍摄的彩色图像作为输入,然后预测相关的深度图,提供关于图像三维结构的信息。第一个 DNN 生成的原始 RGB 图像和深度图都被第二个 DNN 用来生成全息图像。最后,第三个 DNN 对第二个 DNN 生成的全息图像进行优化,使其适合在不同设备上显示。

研究人员发现,该方法处理数据和生成全息图像所花费的时间优于最先进的图形处理单元。“我们方法另一个好处是,最终全息图像重现出来的图片可以呈现出自然而真实的三维效果。而且,在生成全息图像时不需要使用深度信息,因此这种方法成本低廉,不需要使用 RGB-D 摄像机等三维成像设备。”下馬教授在进一步讨论结果时补充道。

在不久的将来,这种方法可以在头戴式显示器中找到潜在的应用,为生成高保真的三维显示提供帮助。同样,也可能革新车载全息显示器,以三维的方式展示行人、道路和标志等必要信息,该方法有望为推动全息技术的普及和发展铺平道路。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注