科技前沿|未来“视界”
创始人
2025-12-26 18:22:48
0

(来源:上观新闻)

在人类认知与文明进程中,图像始终扮演着重要角色。从史前洞穴壁画到现代数字影像,图像表达与生成方式的演进,深刻反映了人类认识世界与改造世界的深度与广度。在这场演进的长河中,人类在19世纪发明了摄影术,在100年前发明了电视(Television),二者都深刻影响着文明的传播。而今天,AI正重新定义图像——图像不仅是对现实的投射,也是对世界的思想衍射。图像即世界。这个世界里,像素颗粒是如何存在、如何流淌、如何构建成可见的图景的?让我们拉开“视界”的科技帷幕。

话题主持:新民晚报记者 易蓉

图像未来

图像的数字化,是这场演进长河中的“大事件”。

从最微观的视角来解构数字化图像,科学家发明了“像素”。在学术领域,与“摄取”像素相关的技术称之为“图像处理”,与“创制”像素相关的技术归为“计算机图形学”。也有两者交叉而成新的方向,比如“计算摄像学”。总结来说,计算摄像学是“主动调控硬件去拍,让后续处理更简单”;图像处理是“对已拍的图做加工,让图像更好看/更有用”;计算机图形学是“从无到有造图像,模拟真实或虚拟世界”。

人工智能技术作为通用型的基座技术,无论对“图像处理”还是“计算机图形学”以及“计算摄像学”,都产生了深刻的影响和技术革新甚至是颠覆。特别是2025年,图像AI生成技术(包括文生图、图生图、图生视频等)取得飞速进步,Nano Banana、GPT-Image、Sora、Kling、Wan等AI生图工具的陆续推出并迭代版本。AI进行图像创作,已经涌现非常多的爆火作品,甚至进入平台生产力工具池,帮助普通公众进行创意和创作。

AI生图的第一波热潮起始于2014年的生成式对抗网络(GAN),但存在训练不稳定,输出质量差等问题,并未转化为产品级可实际应用的工具。到2020年首次系统化提出的去噪扩散概率模型(DDPM,简称扩散模型),具有理论基础扎实、训练稳定性好、高质量数据生成等优点,成为当前热潮的底层关键技术驱动力。随着算法和工程持续优化,以及大语言模型(LLM)的加持,该技术已经日趋成熟,正全面走向商业落地应用。

而在规模法则(Scaling law)的驱动下,AI生图技术还在持续进步,正在从单帧图片到连续视频,再到可交互的三维空间,并保持风格、逻辑和物理规律的统一。图像模型正从纯文本的自由创意生成转向对象级甚至像素级的特定任务,即从“多样性”到“可控性”;生图工具不只看懂文字,更能通过多种模态输入、人机多轮对话等方式理解创作者的意图,即从“下命令”到“共创作”;多模态大模型正将“文字—图像—视频—3D”无缝串联,并致力于用统一架构同时处理多种模态的“理解—生成—剪辑—推理”任务,即从“单点强”到“全域优”。

目前AI领域的热词,如空间智能、物理智能、世界模型等都直接或间接地包含了图像(视频)生成这一关键“步骤”。因此,AI生图也是通往AGI(通用人工智能)的关键垫脚石。目前,上海交通大学图像通信与网络工程所正在开展生成式媒体通信、多模态大模型压缩、全真数智人及具身智联体等前沿技术攻关与创新,通过将AI与图像技术、通信技术的深度联姻,探索出具备“真像摄取+仿真计算”“真实场景+虚拟生成”“高效重建+实时驱动”特征的世界模型。

围绕“看见”,显示终端也在图像数字化浪潮中不断更新迭代,如今VR头盔、AR眼镜、MR等新型显示终端也日趋常见,将图像直接投影视网膜,甚至更进一步通过脑机接口在视觉皮层上“投射”图像的技术也已问世。完全可以期待在不远的未来,更多奇妙设备将来到大家眼前。

作为重要未来方向之一,扩展现实(XR)更将带来无限想象力和新鲜体验。它以任意形式混合叠加现实环境和虚拟环境,使来自物理世界“摄取”的具象表达与来自思想世界“创制”的想象表达,经由像素颗粒自然汇集,融合一体。XR内涵丰富,是不断拓展图像技术边界的“理想国”。自由视角观看体育比赛、博物馆和演艺场景中的真3D体验(包括点云、体视以及全息等多种形态)已经进入应用。而神经辐射场(NeRF)、高斯泼溅(GS)等新型XR表征技术,支持通过手机、消费类的AI眼镜等设备进行实时图像的采集以及日常训练素材的积累;在AI的加持下,3D转换技术正在快速落地,已经涌现出Polycam、Remy等手机App,能将日常照片转换为高质量的3D模型,特别适合捕捉精细物体和场景。

未来3—5年,随着内容的丰富和终端的普及,XR将带动空间智能相关的各种生活应用(如室内导航,景区导览,数字化身等)走进寻常百姓家。

作者:上海交通大学图像通信与网络工程所 副所长 宋利

原标题:《科技前沿|未来“视界”》

栏目编辑:陆梓华 图片来源:SUMG AI

来源:作者:宋利 易蓉

相关内容

中国高铁不断联通成网赋能发...
(来源:千龙网)新华社武汉12月26日电 题:中国高铁不断联通成网...
2025-12-27 01:07:54
本轮巴以冲突已致加沙地带7...
转自:财联社【本轮巴以冲突已致加沙地带70945人死亡】财联社12...
2025-12-27 01:07:50
20分钟 穿越天山南北!
转自:成都日报锦观20分钟穿越天山南北!世界最长高速公路隧道通车 ...
2025-12-27 01:07:46
“巨型吊牌防退货” 是一个...
(来源:衢州日报)转自:衢州日报  刘远举  近期,“巨型吊牌防退...
2025-12-27 01:07:39
年内新增54家私募证券基金...
  本报记者昌校宇  今年,我国私募基金行业继续保持活跃发展。私募...
2025-12-27 00:57:39
泰总理授权防长赴边境磋商
(来源:千龙网)当地时间12月26日,泰国看守总理阿努廷在总理府主...
2025-12-27 00:47:42
垃圾中转站变“美术馆” 体...
(来源:劳动午报)转自:劳动午报 近日,位于南京市溧水区的庆丰垃圾...
2025-12-27 00:47:34
萌宝超可爱!澳大利亚考拉家...
深圳商报·读创客户端驻穗记者 姚嘉莉 通讯员 邓泳怡 12月26日...
2025-12-27 00:38:12
“遇见考烈王——安徽淮南武...
(来源:千龙网)2025年12月26日,“遇见考烈王——安徽淮南武...
2025-12-27 00:37:44

热门资讯

中国高铁不断联通成网赋能发展全... (来源:千龙网)新华社武汉12月26日电 题:中国高铁不断联通成网赋能发展全局新华社记者吴植岁末年初...
本轮巴以冲突已致加沙地带709... 转自:财联社【本轮巴以冲突已致加沙地带70945人死亡】财联社12月27日电,加沙地带卫生部门当地时...
20分钟 穿越天山南北! 转自:成都日报锦观20分钟穿越天山南北!世界最长高速公路隧道通车 12月26日,车辆驶出新疆乌...
“巨型吊牌防退货” 是一个“上... (来源:衢州日报)转自:衢州日报  刘远举  近期,“巨型吊牌防退货”登上热搜,很多衣服的吊牌做成了...
年内新增54家私募证券基金管理...   本报记者昌校宇  今年,我国私募基金行业继续保持活跃发展。私募排排网最新统计数据显示,截至12月...
泰总理授权防长赴边境磋商 (来源:千龙网)当地时间12月26日,泰国看守总理阿努廷在总理府主持召开国家安全委员会会议,审议由泰...
垃圾中转站变“美术馆” 体现的... (来源:劳动午报)转自:劳动午报 近日,位于南京市溧水区的庆丰垃圾中转站摇身一变,成为传播垃圾分类理...
“遇见考烈王——安徽淮南武王墩... (来源:千龙网)2025年12月26日,“遇见考烈王——安徽淮南武王墩一号墓考古成果展”在中国国家博...
韩国政府计划解除对朝鲜《劳动新... (来源:千龙网)韩国国家情报院、统一部等相关部门12月26日举行“特殊资料监管部门协商机制会议”, ...
俄副外长:乌克兰问题解决如今取... 格隆汇12月26日|据俄罗斯卫星通讯社,俄罗斯副外长谢尔盖·里亚布科夫表示,各方已更接近乌克兰危机的...