Menu

Menu

基于深度神经网络的透射式超表面天线设计

基于深度神经网络的透射式超表面天线设计

DOI:https://doi.org/10.1364/OME.421990

 

基于深度神经网络的透射式超表面天线设计

超表面是超材料的二维结构,一般指厚度小于电磁波波长的人工层状材料,其特性就在于人工设计以实现该微细结构对于电磁波偏振、振幅、相位的灵活调控以实现各类片上光学处理功能。逆向设计|超密集集成的多维光学系统

超表面天线作为一种新兴的设备,可以通过反射或传输来自馈电天线的输入波束,将电磁波重新辐射到所需方向、将波束定向聚焦或将单波束分成多波束。由此产生的反射式超表面天线(RMA)和透射式超表面天线(TMA)被广泛应用。基于超表面的优点,如超薄厚度、重量轻以及使用变容二极管或PIN二极管的简单可控反射、透射相位,RMA和TMA都引起了极大的关注。

传统的TMA由多层超表面组成,每层超表面是由晶胞阵列构成,如图1所示,从而实现基于复杂结构的相位调制。超表面阵列天线的基本单元——晶胞的常规设计,很大程度上依赖于人为直觉或时间开销极大的传统迭代,需要一个缓慢的过程来优化具有各种变量的晶胞。为了减少设计的时间和精力,Jaebum Noh等人在2021年发表的一篇《Design of a transmissive metasurface antenna using deep neural neTWorks》工作正式采用深度学习(DL)来有效地找到最优的晶胞结构,并建立系统的天线设计解决方案。

基于深度神经网络的透射式超表面天线设计

图1:超表面天线(右)及其晶胞示意图(左)


基于IN和FN对抗训练的天线单元辅助设计
2019年,在Lee等人的使用透射式超表面的薄型四波束圆极化天线工作中设计了由四层超表面组成的12种类型的晶胞,实现包括17*17晶胞阵列在内的透射式超表面天线,如图1所示。Jaebum Noh等人正是考虑到该工作中设计的有限性,存在透过率、性能不理想的天线单元,因此采用DL的方法来构建寻找最优解的方案。
DL(Deep learning)是一类使用深度神经网络的机器学习方法。DNN 由多个全连接层组成,每一层中的神经元与上一层的所有神经元相连,用于搜索输入和输出之间的相关性,适合处理具有固定输入维度的数据。神经元通过权重链接。基于ANSYS HFSS仿真所生成的数据集来DNN,以更新其权重最后实现天线单元的正向预测和逆向设计。
该工作提出了一种工作频率为5.8GHz的四分之一波长的超表面天线单元的设计方法。其设计目标超表面晶胞是基于逆向深度网络和基于随机搜索算法进行数据增强的正向网络来实现的。该工作创新性地使用两个互补网络进行优化和设计的方案,在某种程度上与GAN的思想相同,正向网络FN根据设计参数预测透射率,就像大多数仿真一样。逆向网络IN则完全相反,从透射率中得出结构变量。通过使用IN,可以扣除所需透射率的超表面设计,并使用FN来补偿IN。同时考虑到数据集的特异稀疏性,该工作也基于搜索算法和数据增强技术辅助网络训练。

网络训练目标及设定
晶胞尺寸( 𝑝)和超表面之间的间隙 (ℎ )均为 12.9 mm,约为频率为 5.8 GHz 时波长的四分之一。超表面(𝑡)的厚度为 3.175 mm。该工作提高相同尺寸的超表面天线单元的透射系数(𝑆21),控制了超结构 𝛼,𝑤,𝐿的几何参数,如图1 所示。该工作中训练网络所需要的数据集是直接基于有限元求解器ANSYS HFSS软件,其中数据集总量有4000个,训练集和验证集8:1划分。本工作为了对标单波束分解为4波束的工作[2],核心在于超表面天线需要有十二种类型的晶胞结构以满足离散连续相位分布的需求,即十二种晶胞的相位透射系数(∠𝑆21)必须满足30°范围内的值,-150°、-120°,…,180°。与此同时透射率( |𝑆21|)的大小必须接近1。因此在本工作后续验证IN预测效果的时候,主要关注这十二个相位透射系数(∠𝑆21)所对应的透射率( |𝑆21|)大小。
该工作中测试了由全连接层构建的IN和FN的超参数最佳组合,最终的超参数如下,其中FN的全连接层为10层,IN为6层,IN的学习率比FN 小了一个数量级。(文中虽然没有明确指出是如何测试的,但笔者估计也是基于研究人员直觉的迭代模拟,优化问题果真无处不在)

基于深度神经网络的透射式超表面天线设计

图2:FN和IN的最佳超参数集列表

IN的损失函数
IN 的损失函数用 𝑙𝑜𝑠𝑠𝐼𝑁表示。损失表示为 L1 范数,可以表示为:

 

但是该工作考虑到了IN会收到一组特定透射系数∠𝑆21和|𝑆21|并不对应于一组特定的超结构 𝛼,𝑤,𝐿的几何参数,也就是说二者并不具有函数的单一映射关系,因此会扰动到深度神经网络的特征提取,所以需要构建一个辅助的正向网络,这也是该工作创新地使用两个互补网络进行优化设计的由来。最终的DNN网络如图3所示。

基于深度神经网络的透射式超表面天线设计

图3:DNN训练示意图

损失函数的修正项如下所示,实现了IN在训练阶段的标签双重检查:

 

基于该工作的正向反向网络互补优化,构建了新的网络训练损失函数,即在IN的原始损失基础上增加新的损失修正项,解决了多种设计选择所导致了特征提取紊乱的问题。最终的损失函数:

 

参数𝜌作为修正因子可考虑设置为 1/3,以考虑 𝑙𝑜𝑠𝑠𝐼𝑁和 𝑙𝑜𝑠𝑠𝑛𝑒𝑤的幅度相同,并使总损失低于 1。


基于随机搜索算法的正向网络数据增强

同时该工作在验证过程中发现,网络预测在∠𝑆21= −150°时效果很差。通过检查数据集,发现只有 0.18% 的总数据被分配给特征∠𝑆21 = −150° 的训练,这可能会导致拟合不足。因此,需要为稀疏数据集提供更多数据来进一步训练网络。该工作通过给定随机的设计参数,从FN中生成数据集并提取接近于∠𝑆21= −150°的数据,将其扩充至训练集中重新进行一轮FN和IN的训练,即首先预训练FN,接着再训练IN和FN结构的组合网络,这就是该工作提出的一个基于随机搜索的数据增强周期。基于增强周期的迭代,可以使得FN从一开始不熟悉∠𝑆21= −150°的数据导致的Loss增加到逐步收敛,直到基本不存在欠拟合的现象,FNs的损失值的迭代变化如图4所示。

基于深度神经网络的透射式超表面天线设计

图4:FNs的损失值及训练过程的损失曲线
基于IN和FN的互补优化和随机搜索的数据增强,最终该工作训练完成后的IN输出优于参考[2]的结果,尤其是在 ∠𝑆21=−150°时透射率增加了 11.6%,够实现具有高透射效率的透射式超表面天线。最重要的是在后续超表面天线的应用过程中,可以直接省去繁琐的设计过程,而基于神经网络来“生成”。

基于深度神经网络的透射式超表面天线设计

 

图5:逆向和正向网络结果与参考结果的比较[12]
DL 本质上就是一个端到端的过程,可以通过直接找到输入和输出之间的相关性来忽略所有中间过程。该工作局限于对超表面天线单元的优化设计,而考虑到天线阵列时,相位误差不可忽略的同时也需要考虑其集成化和阵列布局的设计,因此进一步开发 DNN 以寻找超表面天线单元单元的最佳排列仍是未来的工作。对于同样基于人工神经网络大模型,其特殊涌现能力让我思考DL是如何做到高维特征提取的,昨天看到一句让我感触颇深的话在这里分享一下。
参数的巨量积聚,使参数之间的关联、耦合增加,形成特性上的“复利”,有点“触类旁通”的感觉
逆向设计、优化问题又何尝不是如此,算力资源的提升满足了优化自由度的抽象、激增而实现更高更优性能的需求,深度学习本质上就是基于人工神经网络从原始数据中提取更高层特征表示。

[1]Jaebum Noh, Yong-Hyun Nam, Sunae So, Chihun Lee, Sun-Gyu Lee, Yongjune Kim, Tae-Hyung Kim, Jeong-Hae Lee, and Junsuk Rho, “Design of a transmissive metasurface antenna using deep neural networks,” Opt. Mater. Express 11, 2310-2317 (2021)
[2]C.-H. Lee, S. W. Chi, S.-G. Lee, and J.-H. Lee, “Low profile quad-beam circularly polarised antenna using transmissive metasurface,” IET Microwaves, Antennas & Propagation 13(10), 1690–1698 (2019).

免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间联系我们,我们将协调进行处理,最终解释权归旭为光电所有。