Menu

Menu

成像专题 | TMT:大规模仿真数据训练模型助力现实世界的湍流图像恢复(IEEE TCI)

TMT:大规模仿真数据训练模型助力现实世界的湍流图像恢复

 

Imaging through the atmosphere using turbulence mitigation transformer
本期导读

 

远距离成像中的大气湍流会导致图像质量下降,主要表现为图像上时空随机的像素移动和模糊化。一方面,传统的图像恢复方式主要是模型驱动,速度慢且需要用多帧恢复一张静止照片,难以被广泛应用。另外一方面,数据驱动的方法缺乏真实的高质量-低质量图像对,进而深度学习算法的泛化性和稳定性还存在一定局限。
鉴于此,来自普渡大学的的研究人员提出了仅使用高质量仿真数据训练时空Transformer网络的方法来帮助解决现实世界的湍流图像恢复问题。该方法依赖一个将大气湍流建模为稳态随机场的高速仿真器生产覆盖多种湍流模态的大规模数据集。同时,该研究设计了一种高效的新型时空Transformer网络来从仿真数据中学习包含动态和静态场景的多帧湍流恢复,提升了现实世界中湍流恢复的应用范围。相关工作发表于计算成像领域权威期刊 IEEE Trans. on Computational Imaging 上。
相关代码,数据和效果示例可参见 https://xg416.github.io/TMT/(含大量视频和gif示例)。
技术路线

 

成像专题 | TMT:大规模仿真数据训练模型助力现实世界的湍流图像恢复(IEEE TCI)

 

图1. 技术架构示意:使用大规模仿真数据训练神经网络并在真实世界图片上泛化

  • 大规模、覆盖多种大气湍流模态的数据集:大气湍流造成的图像质量下降主要表现为时空上变化的随机像素位移和模糊。这种时空随机变化的损失可以建模为一个稳态随机场,可以使用快速傅里叶变换采样泽尼克系数来实现,因此每一帧的整体采样时间可以被大大缩短。对于每个像素,使用基于深度学习的phase-to-space (P2S)的方法完成从泽尼克系数到点扩散函数的变换。尽管每个像素都有不同的点扩散函数,可以采用低秩近似的方式来并行模糊化整张图像,从而使仿真速度可以接近实时,并保持生成图像的物理真实性。
  • 强大且高效的新型时空transormer网络TMT:所提出的Turbulence Mitigation Transformer (TMT) 是一个二阶段恢复的神经网络,每一个阶段都并行恢复同时输入的多帧图片。其中,第一阶段主要是去除随机的像素移动,一个基于三维卷积的轻型的Unet实现;第二阶段主要处理空间上非均匀的像素模糊,也采用了Unet架构,其基本组件是基于时域-通道联合自注意力的新型高效Transformer。该Transformer在空域上使用卷积,而将时域和通道联合处理,其复杂度对空域是线性的而对时域和通道是平方,可以节省内存需要。该研究进一步通过类似ShuffleNet的形式分批连接不同的时域和通道集合,缓和深层网络中由于通道数变多造成的内存紧张。

成像专题 | TMT:大规模仿真数据训练模型助力现实世界的湍流图像恢复(IEEE TCI)

图2. 上:成像仿真流程;下:图像恢复流程

简单小结:目前已有的大气湍流图像恢复方法难以泛化和部署,该研究提出一种数据生产方法和新型神经网络来利用深度学习来帮助弱化这个难题。所提出的数据集可以提高目前湍流图像恢复深度学习模型的泛化性,其网络在效率和性能方面均超过已有最优多帧图像恢复模型。需要注意地是,该研究的数据仿真保真度和模型设计完整度方面尚有可以提升的空间。

论文信息:
  • Zhang, Xingguang, Zhiyuan Mao, Nicholas Chimitt, and Stanley H. Chan. “Imaging through the atmosphere using turbulence mitigation transformer.” IEEE Transactions on Computational Imaging (2024).

     

技术详见:
https://doi.org/10.1109/TCI.2024.3354421
项目网站及开源代码:
https://xg416.github.io/TMT/
*该技术分享所涉及文字及图片源于发表论文和网络公开素材,不做任何商业用途。

免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间联系我们,我们将协调进行处理,最终解释权归旭为光电所有。