通往元宇宙的大门是什么?在中国工程院院士、上海理工大学光电学院院长庄松林看来,庞大的元宇宙世界中,单一交互方式只能实现部分沉浸,包括“五官”在内的多模态融合交互方式保障着全场景交互体验。而他毕生致力于的光学领域,其成像与交互式显示的关键技术正是多模态融合交互的核心之一。在27日在沪开幕的IEEE VR 2023元宇宙产业论坛上,庄松林院士解析下一代VR/AR(虚拟/增强现实)光学显示技术发展与挑战,看看元宇宙大门口究竟是什么样的光。
【轻量化小型化,乃大势所趋】
不论是人,还是人眼,都是物理的,如何与虚拟的元宇宙并行不悖?因此,我们还得戴眼镜,而这副“半透明”的眼镜,同时可见物理世界中的现实人物,以及虚拟世界中最最“高保真”的3D人物。这完全不同于电影院用平面银幕放映影像、利用左右眼视差形成3D感的原理,而是真正的全息三维显示。
“为了元宇宙的沉浸式体验,多模态交互的核心是将物理人100%投射到元宇宙中,形成虚拟化的感官交互,并增强交互体验,为元宇宙全场景落地提供技术基础。”庄松林认为,光学交互式显示将构建起多模态融合交互的底层与基础架构,也是融合其他交互手段的关键技术。
作为光学显示的载体,VR/AR眼镜正经历轻量化、小型化的发展趋势。解放日报·上观新闻记者了解到,这类眼镜早期采用非球面透镜,体积大、质量重,几乎与头盔相当;之后,设计fresnel螺纹透镜结构,视场角大,成本也较低,但为确保焦点的落点位置两相吻合,整个系统所占空间仍较大;再后来,新的pancake三明治结构,让光线在镜中多次折返,增加行进距离,但器件表面各种镀膜,制备工艺较为复杂。
【三维视场角目标:再大一倍】
“尽管这被认为是新一代主流结构,但目前并没有绝对完美的VR/AR显示方案。”上理工光电学院常务副院长张大伟坦言,公众熟知的消费级虚拟眼镜,比如“谷歌眼镜”,取得各项指标的高质均衡,不过也仅仅拥有15度的视场角,而厚度则大于10毫米。
目前公认,全息技术能够形成最为真实的三维立体显示,但要实现比10度更大的视场角并非易事。对此,庄松林院士百人团队,在最优路径上持续探索。他们通过使用高带宽积(4K)的空间光调制器件,已可显示22度左右的视场角,这一“视野”相当于比谷歌眼镜大50%。“在大视场方面,我们的全息显示技术可以说全球领先,目标是做到40-50度。”张大伟在接受专访时透露。
视场角超过20度的“近眼显示”,带有四方形微显示器“投影”入眼,最重要的贡献在于增加自由度,视角不再大受局限。而与电影院平面巨幕营造的“伪三维”相比,这种双目眼镜同时显现环境现实与虚拟物体,比较自然、比较舒适,不存在两眼视差带来的视觉疲劳感甚至眩晕感。可以说,当穿戴眼镜者围绕着三维显示中的人或物,可以见到包括其背面在内的360度形态。
【全感官,“元宇宙接吻”都来了】
元宇宙入口有了“光”,却还有很长的路。作为上海市多媒体行业协会副秘书长、XR专委会主任,端木海婴在元宇宙产学研主题峰会上披露了全国十多个相关行业组织联合发布的2022元宇宙产业化赋能白皮书研究成果。“元宇宙是既定大趋势,但创新技术在产业化进程中需要解决技术‘有地方用’、客户‘有想法用’、本身‘真的有用’、路径打穿的‘推动作用’等问题。” 她表示,最终用户对于元宇宙已经从尝鲜到实践,希望能获得工具化、标准化、易用型的可交付解决方案。
在元宇宙世界中,人-机-人的交互是最重要的,交互方式除了基于光学的视觉交互,还有语音交互、手势交互、嗅觉交互、触感交互、脑机交互等。“嗅觉甚至味觉,与视觉、听觉的融合是最难的。”庄松林院士注意到,卡内基梅隆大学开发出搭载在Meta Quest 2头显上的硬件模块,让用户在虚拟现实中体验喝水、刷牙和亲吻的触感。“‘元宇宙接吻’都来了,我们必须为元宇宙做好准备。”
值得注意的是,不论是元宇宙还是Web 3.0,都挂着区块链技术的外衣。“区块链技术、人工智能技术、大数据技术等都是我国的国家战略,但也是美国等国家的国家战略。美国已经将这些技术列为禁止向中国出口的核心技术。”庄松林表示,元宇宙的历史车轮滚滚而来,驾驭一个新技术、新浪潮的最好方式就是足够了解它,并能对其未来的发展趋势做出准确的预测。
图片来源:IEEE VR 2023组委会
来源:作者:徐瑞哲