(来源:上观新闻)
北京时间11月27日,复旦大学计算与智能创新学院26岁的二年级博士研究生马炜杰以独立一作身份在Nature发表研究成果。该成果横跨三维计算机视觉、计算机图形学、显示光学三个领域,聚焦裸眼3D技术,首次实现桌面级显示尺寸下超宽范围的全视差裸眼3D显示,打破该领域几十年来大尺寸与宽视角“鱼与熊掌不可兼得”的局面。
马炜杰本科就读于郑州大学电子信息类中的通信工程专业,大二时,他进入学校的服务机器人实验室参与项目研究,和同伴组队参加机器人世界杯大赛并多次斩获冠军。
本科毕业后,马炜杰赴香港中文大学(深圳)攻读计算机与信息工程专业研究型硕士。一个偶然机会,他到浙江大学计算机辅助设计与图形系统全国重点实验室(原浙江大学计算机辅助设计与图形学国家重点实验室)访问,走上了研究三维计算机视觉这条路。
如何解释他的研究成果呢?
人类想要看到理想的画面,希望尺寸大、视角宽、最好视差也是全的。在这次发表的成果中,马炜杰提出了一种主动式的动态最优利用有限信息预算的解决方案,把有限的光学信息精准地投放到最为关键的双眼周围区域。他解释,传统的裸眼3D技术是对有限信息预算的被动折中,以至于难以看到兼具大尺寸和宽视角的3D图像。
论文所提出的全新信息利用方案示意图,相比以前一众传统思路,能实现大尺寸下的无缝超宽范围视角支持“如果以建造泳池为例,三维显示的信息预算就相当于泳池的水量,想实现人在任何位置都能肆意游动,那么这个泳池要又长(尺寸大)又宽(视角广)。”但是,现有物理条件下可用的“水量”有限,因此,如何分配预算成为问题的关键。
当前的裸眼3D技术要么牺牲尺寸,将全部预算用于提供宽广连续的视角,但是显示屏会被极限压缩,不适合日常观看;要么牺牲视角,将预算分配到所有可能的观看方向,但只能保证一个固定、狭窄的观看区域有较好的效果,观看受限。
在这篇文章中,马炜杰提供了一个截然不同的思路,打破了“必须尽可能灌满整个泳池”的传统思维。“就像游泳者,需要的只是周身那一汪清水。”基于此,他提出了一种主动式的动态最优分配方案,其核心思想就像一个永远追随游泳者的“智能移动浪花”,实时将显示屏有限的信息资源精确地投射到双眼所在的微小区域。“眼睛到哪里,信息就跟到哪里。对观看者本人来说,他感受到的就是一片广阔、连续、完整的‘水域’,可以在其中自由移动。”
做到这一点,离不开物理精确的双目建模和人工智能的结合。通过精确建模双眼在真实世界中的视锥场,准确捕捉双眼在任意位置和角度上接收到的光强,同时辅以人工智能进行计算,即时优化最佳的光场输出,以确保双眼在移动时也能看到连续、自然的运动视差。
这种动态优化有限信息预算的利用思路,首次让大尺寸、宽视角、高分辨率和实时刷新率在现有的物理限制下达成了“和解”,为下一代裸眼3D显示器提供了一个实用且通用的科学范式。
对于项目未来,马炜杰希望以裸眼3D技术的研究为起点,打造一个沉浸式、可交互兼具的3D内容输出窗口,应用于数字娱乐和智慧教育、医疗等领域。
文章被接收后,马炜杰在自己的社交账号上发了一条博文,小小地“火”了一下。那篇博文最后,马炜杰引用了今年诺贝尔化学奖得主北川进的话激励自己,也是这篇文章背后的真实写照:“不是跟风做热门,而是像前辈一样去探索科学的源头。”
原标题:《复旦26岁博士生以独立一作身份在Nature发表研究成果》
栏目编辑:陆梓华 图片来源:复旦大学
来源:作者:新民晚报 张炯强