基于机器学习的矢量涡旋光束分类
Original 任忠要 郭波 光学前沿评论 2022-10-03 09:00 Posted on 黑龙江
结构光因在经典光学和量子光学中的多种应用而备受关注。由于光学偏振和轨道角动量之间的非平凡相关性,矢量涡旋光束在这两种情况下都显示出独特的特性。在此,Taira Giordani等人展示了一种新的、灵活的涡旋矢量光束分类实验方法。首先,研究人员描述了一个产生任意复杂矢量涡旋光束的平台,该光束受到光子量子漫步的启发。然后,研究人员利用最近的机器学习方法,即卷积神经网络和主成分分析,来识别和分类特定的偏振模式。这种方法既不需要额外的干涉稳定,也不需要空间滤波,因此,它提供了一种强大的策略来解码存储在矢量涡旋光束中的信息,是管理高维量子系统的一条有前景的途径。该工作发表在Physical Review Letters上。
光被赋予轨道角动量,这是一个与结构化非平面波前相关的自由度并以角向相位依赖性为特征。当非传统相位依赖性与螺旋形横向偏振模式耦合时,称之为矢量涡旋光束。对这种状态的兴趣由经典和量子光学多个领域的应用引起:从粒子捕获到显微镜的计量应用以及自由空间和光纤中基于轨道角动量的通信方案。由于矢量涡旋光束的偏振和空间自由度之间的超纠缠,矢量涡旋光束也经常用于量子信息协议中。此外,研究人员还利用这种编码的量子传感和计量的光子平台。进而,研究人员基于轨道角动量的方案,用于研究量子因果结构、量子通信和密码学、量子行走、量子模拟和量子状态工程。
尽管矢量涡旋光束具有潜力,但许多关于轨道角动量和偏振信息解码的问题仍然没有答案。设想有效地实现轨道角动量解复用的各种技术需要附加仪器,例如,干涉测量或空间滤波。这些引入了有害影响损耗和噪声。此外,在这样一个高维框架中进行状态层析成像是量子信息处理的一项基本任务,这一挑战怎么估计也不为过。因此,非常需要设计和实现用于生成和分类矢量涡旋光束的可靠技术。事实上,寻找新平台的实质性努力一直是大量研究活动的主题,包括集成光子学和等离子体超表面产生。
最近,机器学习成为了一种多功能工具箱,用于处理实验平台中出现的各种任务。事实证明,它特别有助于简化量子协议和动力学的表征。在结构光的背景下,神经网络已被用于分类用于长距离自由空间通信的经典光的轨道角动量状态,即使在存在环境湍流的情况下。
研究发现,轨道角动量赋予的光状态可以用拉盖尔-高斯模式描述。这些是近轴近似下亥姆霍兹方程的解,由两个整数(m,p)表示,前者描述光束的角向相位结构,后者描述光束的径向强度分布。每一个拉盖尔-高斯模式都带有一定的角动量,在单光子状态下等于mℏ,矢量涡旋光束可通过将正交偏振叠加到拉盖尔-高斯模式来获得。更具体地说,矢量涡旋光束的电场分解为两个拉盖尔-高斯模式之和,具有相同的p和不同的角向数m1>m2,由正交偏振携带。在这项研究中,研究人员忽略径向数,设置p=0。对于任何给定的参数值(m1、m2、θ、ψ),矢量涡旋光束的偏振模式可以映射到广义庞加莱球上(图1)。特别地,使用高阶庞加莱表示,其中,极点表示总角动量的本征态,但符号相反。这些偏振模式通过斯托克斯参数Sj(j=1,2,3)重建,通过测量与给定选择的偏振基{bj}={b1=(H,V),b2=(D,a),b3=(L,R)}相关联的输出强度Ibj,1,Ibj,2作为Sbj=(Ibj,1-Ibj,2)/(Ibj,1+Ibj,2)而获得。对于矢量涡旋光束,Sj的值取决于横向传播平面中的坐标。为了可视化矢量涡旋光束的偏振模式,研究人员使用RGB颜色编码,其中,Sj的值被解释为相应颜色的强度。在图1(b)和1(c)中,研究人员给出了径向偏振矢量涡旋光束的这种颜色图的示例。产生矢量涡旋光束的一种自然方法是使用q板,q板是非均匀双折射板,根据入射光的偏振条件修改入射光的轨道角动量。在方案中,矢量涡旋光束通过一系列偏振控制波片产生,这些波片散布在5个级联q板之间,如图1(d)所示。该装置在角动量中实现了离散时间量子行走,其中,拉盖尔-高斯模式的阶数扮演了行走者的角色并根据体现硬币自由度的偏振状态而改变。这使得人们可以产生几类具有轨道角动量量子数的矢量涡旋光束,在区间中取奇数{-5,…,5}。然后,收集与不同矢量涡旋光束相关的图像并使用它们来训练和测试基于机器学习的分类方法。
图1 (a)|m1,2|=1的高阶庞加莱球表示。球面上的每个点对应于特定的偏振图案。(b)径向偏振矢量涡旋光束:在横向平面的给定点,偏振矢量具有不同的方向。斯托克斯参数在平面中相应地变化。(c)偏振图案的颜色编码。图例报告了颜色和各种偏振之间的对应关系。右侧:图(b)中矢量涡旋光束的颜色图案。灰色对应于非偏振光。(d)产生矢量涡旋光束的实验装置。连续波激光器发射808 nm的高斯光束TEM00。光通过一系列波片和q片进行5步量子行走。基于CCD相机的检测级获取关于斯托克斯参数和偏振图案的信息。基于在相机的每个像素处测量的强度,评估斯托克斯参数并将其转换为RGB彩色图片。
现在,研究人员展示了如何训练卷积神经网络,从实验测量的斯托克斯参数中表征给定矢量涡旋光束的参数(m1,m2)。卷积神经网络是一种平移不变的深度神经网络,非常适合于图像分类、识别偏心图像和分割的手写数字以及人脸识别任务。在最简单的形式中,卷积神经网络首先应用卷积层,该层由应用于输入图像的一系列非线性变换组成,然后是最大单元层,该最大单元层对前一层提取的信息进行下采样和过滤。最后,一个完全连接的层作为一个分类器,将在前几层中提取的信息分类为少量可能的输出类别之一。
图2 (a)通过卷积神经网络的矢量涡旋光束分类的示意图。(b)使用线性主成分分析的分类方案。在通过主成分分析降低数据集的维数后,使用线性支持向量装置对实验图像进行分类。
该网络首先被馈送由矢量涡旋光束的模拟图像组成的训练集,该矢量涡旋光束可通过五步量子行走实现。然后,任务是辨别与图3(a)中对(m1,m2)相对应的15个类。对于每一类,生成θ=π/2和ρ∈[0,2π]的状态。训练集的大小是每类400个图像。每节额外使用100个模拟图像来测试训练期间的性能。在这些条件下,网络达到100%的精度,精度在这里用于指正确分类的图像的分数。然后,收集每类100个实验图像,用作新的验证集,如图2(a)所示。图3(a)-3(b)显示了每类的平均精度与添加到训练集的实验图像的比例。研究发现,将一小部分实验图像添加到训练集提高了网络考虑实验状态与理想拉盖尔-高斯模式的偏差的能力,如图3(b)所示。平均准确度约为12.5%的训练集由实验图像组成时,获得了0.989。为了进一步突出网络的性能,研究人员还专门使用实验图像训练卷积神经网络,但在训练阶段使用少量图像。每类仅使用20张图像,获得了0.99的准确率来分类其余的实验图像(总共1668张)。
图3 (a)对应于表中给出的一些值(m1,m2)的矢量涡旋光束的模拟和实验图像。(b)当将状态分类为15个矢量涡旋光束类别之一时,相对于添加到训练集的实验图像的分数,平均精度的提升。最左边的点是指仅使用模拟图像来训练网络的情况。插图:真值表,报告网络如何对属于每个类别的图像进行分类。每一行(列)对应于可能的对(m1,m2)。矩阵元素在每类100个实验图像上取平均值。
研究人员使用类似的方法检索与固定(m1,m2)生成的状态对应的庞加莱球上的位置。特别是,测试卷积神经网络的性能,以检索对应于m2=-m1=1的矢量涡旋光束的值(θ,ψ)。因此,卷积神经网络被训练以区分偏振模式中的旋转(对应于ρ的变化)和色调中的变化(对应于θ的变化)。为了将其作为分类任务,研究人员将球体划分为26个不相交的扇区。在球坐标系中,将θ划分为3个区间[k(π/8),(k+2)(π/4)],其中,k=1、3、5和ϕ在8个区间[t(π/4),(t+1)(π/4)]中t∈{0,…,7}。这留下了两个类,围绕着两个极点,对应于θ∈[0,(π/8)]和θ∈[78π,π]。训练卷积神经网络,训练集中每类500个模拟图像,验证集中每类125个。达到的最大精度为0.90。该结果的次优性可能是将问题界定为分类任务的结果。事实上,分割使得接近两个扇区边界的矢量涡旋光束自然难以分类。因此,为相应的回归任务训练卷积神经网络将潜在地提高性能。
在这里,研究人员提出了一种从实验数据中分类矢量涡旋光束的替代方法,利用维数减少。这种算法通常用于获得大型数据集的有效表示。这有几个优点,从简化数据可视化到提高分类和回归算法的效率,这些算法可以用于数据的简化表示。特别是,采用线性主成分分析算法,该算法将每个数据点表示为某个高维空间中的向量并在该空间中找到捕获数据集最大信息量的方向。在这种情况下使用主成分分析的基本原理是,尽管实验图像存在于极高维空间(其尺寸与CCD摄像机中的像素数量级),但生成的矢量涡旋光束的基本尺寸通常要低得多。这意味着,尽管实验数据集在先验上看起来像是一个复杂的高维向量束,但底层数据实际上可以由少量参数表征。此外,映射的线性保持了矢量涡旋光束空间的凸性,从而保持了其几何结构。然后,研究人员期望用于在缩小空间中表达实验图像的新描述提供了用于捕获在测量中编码的矢量涡旋光束的特征的合成描述(三个偏振基{bj}中的强度)。这类似于一种无监督学习形式,因为获得了关于图像来源的有用信息,而不需要向算法提供任何底层过程的知识。
作为一个值得注意的例子,将这些观测应用于具有m2=-m1=1的矢量涡旋光束,可以在高阶庞加莱表示中的球体上表示。事实上,将主成分分析应用于图4(b)的实验数据集,揭示了三个方向足以捕获图像的大部分信息内容。沿着这三个主分量投影图像,发现数据以嵌入实验高维空间的三维球体的形式排列。这里,参考了图像三维表示半径分布的补充材料,它允许检索庞加莱球上的状态位置,克服了以前分类方法的边界问题。值得注意的是,仅从实验数据集来看,这一点并不明显,但使用降维很容易揭示。这一结果突出了降维的潜力,以揭示在现实实验条件下生成给定实验数据集的基础状态的特征。将这种简化的三维表示解释为Bloch球,可以使用主成分分析来检索生成给定实验图像的状态的完整描述。为了评估这种重建的准确性,研究人员计算了生成给定图像的状态与通过主成分分析从所述图像检索的状态之间的平均保真度,对许多实验图像进行平均。两个状态之间的保真度在这里以通常的方式定义。如图4(c)的直方图所示,发现这约为0.96,标准偏差约为0.01,因此,显示了重建的质量。
图4 (a)具有|m1,2|=1的矢量涡旋光束的高阶庞加莱球。品红色平行线(蓝色子午线)标记θ(ψ)连续值之间的间隔。沿着子午线,图案的颜色从最热到最冷变化。图案沿平行线旋转。(b)不同角度(θ,ψ)的实验和模拟矢量涡旋光束图像的比较。(c)通过将每个实验矢量涡旋光束与其主成分分析给出的简化三维表示进行比较,获得了保真度分布。(d)线性支持向量机分类器的平均预测精度,在对数据应用线性降维后,针对降维数nc进行训练和测试。对于划分实验数据集的15个类(图3a),在插图中显示了真值表。
现在,研究人员展示了主成分分析提供的简化表示如何作为训练分类器的起点,其精度与卷积神经网络相当,同时需要显著减少的计算资源。更准确地说,使用线性支持向量装置作为分类器。这些有监督学习算法通过找到超平面来分类数据,该超平面根据相应的标签最优地分离训练数据集。
与卷积神经网络一样,研究人员对矢量涡旋光束状态的实验数据集进行分类,表示为(m1,m2)。在通过主成分分析获得的缩减空间上训练支持向量装置,应用于图3(a)中报告的实验数据集。这显著提高了分类器的效率,该分类器只需对图像的压缩表示进行操作。该方法的平均精度为:当将数据集的维数降低到40时,支持向量装置在一半的实验数据上进行训练,另一半用于测试结果的准确性。在图4(d)的插图中报告了最终分类性能的分解,其中给出了每个类的分类器精度。最后,在图4(d)中强调平均总体精度如何取决于简化表示的维数。特别是,发现25个尺寸已经足以获得良好的平均精度。
总之,研究人员提出了一种利用机器学习技术对矢量涡旋光束进行分类的新方法,演示了如何使用基于卷积神经网络和主成分分析(通过支持向量机增强)的推理策略来有效提取高维光子矢量涡旋束系统的特性。特别地,降维用于获得对实验生成状态的基本几何特性的更深入理解,而不需要关于生成设备的物理的先验知识。通过将各种机器学习算法嵌入到实验流水线中,结构光特征化的任务在方法上变得更加广泛,从有监督学习到无监督学习,在应用、分类和回归任务中更加灵活。在为进一步的实验验证铺平道路的同时,认为在不依赖于光网络的实验环境中,将类似的机器学习思想引入其表征协议中,可以使许多与现代光子学相关的任务受益。这些技术可以被证明是一个有用的附加任务,从自动化方法的设计到实验平台和实验的表征,到在经典和量子通信的背景下提供轨道角动量解复用的解决方案,更一般地说,在量子技术中使用结构光。
Taira Giordani,意大利罗马大学物理系博士后,研究方向为量子信息及量子光学。
E-mail:taira.giordani@uniroma1.it
免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间联系我们,我们将协调进行处理,最终解释权归旭为光电所有。