非线性介质中的光脉冲传输与演化始终是光纤和激光领域的重要研究内容。超短脉冲经过非线性系统后往往演化为杂乱无章的复杂信号,这些信号中携带了传输系统的大量信息。通过对这些混乱信号进行信息提取和数据分析,不仅有助于非线性系统的研究,而且对获取传输介质的内在特性以及介质所处环境的参量传感具有重要意义。

然而目前使用的传统方法在此方面效率极低。尤其在参量提取逆问题的研究中传统方法常因这些复杂的、没有清晰规律的非线性问题而在实际运用中遇到极大的挑战。

基于脉冲序列探测光纤参量

我们借助机器学习中的回归思想,提出了一种基于机器学习算法的光纤多参量探测方法。该方法从看似杂乱无章的信号中提取传输系统的丰富信息,找到光脉冲信息与光纤参量的关系,实现对光纤参量的回归以达到同时探测多种参量的目的。借助机器学习方法,我们称这种使用包含相位信息的脉冲复数振幅A进行光纤参量探测的方法称为全信号探测法。

利用锁模激光器产生超短脉冲,经波形整型器调整,输入到光纤中。为了得到包含相位的脉冲信息,我们利用FROG接收超短脉冲经过未知光纤传输后的光信号,如图所示,之后利用训练好的机器学习模型计算未知光纤的光纤参量。

两种数据集的制作

数据集的质量对模型的有效性有重要作用,我们借助使用Python软件搭建的光纤传输系统获取建立模型所需的数据。我们选取峰值功率为1000W,中心波长在1550nm、采样点为8192个、脉宽为1ps的高斯脉冲作为输入信号,光纤长度在10~100m中等比例选取。

考虑到常用光纤损耗小,同时测量所需光纤长度较短,因此忽略损耗的影响,色散(D)在2~10(ps/nm/km)之间随机选取,忽略高阶色散,非线性系数在0.001~0.005(1/W/m)之间随机选取,拉曼响应因子设为0.18,在此基础上得到包含全部信息的输出脉冲。

视频图的绘制与处理

我们使用上节中得到的复数数据,将数据分割成长为256的片段,分别计算每个片段的频谱,使用汉明窗作为窗函数(window)应用于每个数据片段,每个片段的重叠长度为128,以短时傅里叶方法绘制时频图,以“png”格式保存,最终所得的时频图如图所示。

由于目前的时频图含有相同的坐标轴、刻度等要素,不便于直接输入机器学习系统进行学习,为了尽可能多的保留原有信息,我们对其以横纵比等于1445×1105的比例进行裁剪。以图中(b)为例,其裁剪后效果如图所示。需要注意的是,由于我们的时频图有严格的坐标对应关系,若使用翻转,旋转变化或者调整图像色调以及对比度等图像增强方法,会使图像失去原本的物理含义,因此这里不使用

视频图探测法的机器学习模型

我们使用卷积神经网络实现时频图参量探测法。针对彩色形式的时频图数据集,根据文献,使用小尺寸卷积核,增加网络深度可以有效提升模型效果。所以我们利用VGG-13网络的设计思想,即引入“模块化”设计思想,将不同的层进行简单组合构成网络模块,再用模块来组装完整网络,而不再以“层”为单元组装网络。神经网络结构如图所示。

首先是两层(3×3×64)卷积层加一层(2×2)最大池化层,第二个模块是两层(3×3×128)卷积层加一层(2×2)最大池化层,第三个模块是两层(3×3×256)卷积层加一层(2×2)最大池化层,第四个模块是两层(3×3×512)卷积加一层(2×2)最大池化层,第五个模块是两层(3×3×512)卷积层加一层(2×2)最大池化层,卷积神经网络全部使用ReLu激活函数。

最后加三层全连接层,神经元个数分别为4096、4096和1000,最后一层全连接层的激活函数使用Softmax。针对灰度化的视频图数据集,神经网络结构如图所示。

不含相位信息的功率谱探测法原理

上述方法需要光信号的完整表述,即需要信号的幅度和相位信息,然而,光信号相位的探测往往很复杂,比如使用FROG,其通过二维相位重构算法对光谱仪接收到的混合域信息:二维行迹图进行迭代重构、计算、分析从而得到脉冲的脉宽和相位的信息,这通常需要花费很多时间,而且对于那些不规则的脉冲,甚至无法重构相位信息,在设备和信号质量上要求很高,同时会造成大量的时间开销。

为了解决光脉冲相位的探测对设备与测量手段要求高甚至无法探测的问题,我们进一步提出了一种使用多个不同功率水平的不含相位信息的脉冲功率谱幅度信息,代替单一功率水平脉冲信号幅度和相位全部信息的方法来实现参量探测。同样利用机器学习方法,找到功率谱幅度信息与多个光纤参量的关系。

这样,仅需使用光谱仪即可实现多参量同时探测。我们将这种只包含部分信息的功率谱信息进行探测的方法称为功率谱探测法。功率谱探测法的系统结构如图所示。利用锁模激光器产生超短脉冲,经波形整型器调整,输入到光纤中。为了得到功率谱信息,我们利用光谱仪接收超短脉冲经过未知光纤传输后的光信号。

使用3个不同峰值功率脉冲实现功率谱探测法

针对我们提出的更为实用的只包含部分信息的功率谱参量探测方法,我们更改输入脉冲峰值功率为600W、800W与1000W,脉宽都为1ps的高斯脉冲,经与全信号探测法中相同的未知光纤传输后得到输出,我们先将三种峰值功率的输入与输出脉冲数据水平合并为(1×8192×2)格式的数组,为了减少数据量,加快机器学习模型的拟合速度。

4:1的比例对数据进行抽样,得到3个(1×4096)格式的功率谱数据,再将3个不同峰值功率得到的数据水平合并,得到(1×4096×3)格式的一维数组,我们将这个形式的数据作为数据集中的特征值,将对应的色散和非线性系数作为标签值,按图所示制作功率谱探测法的数据集。数据集大小共1300条,同样以留出法按8:2的比例划分训练集和测试集。对得到数据集,同样需要进行数据预处理,使用归一化的方式去掉数据集中的量纲,将数据映射到[0,1]的区间上。

由于决策树算法、随机森林算法与K近邻算法结构较简单,与全信号探测法一致,这里不再给出。对于功率谱探测法,我们使用了如图所示的FCNN结构来训练光纤参量探测的模型,该网络结构包括四层全连接形式的隐藏层,对应的神经元数量分别为12288,6144,3072和1536,最后输出层有两个神经元,以分别输出需要探测的色散和非线性系数。网络中的激活函数依然选用了ReLU和Sigmod,损失函数选择了加权均方误差函数。

机器学习的非线性演化预测原理

目前,已经有多种方式应用机器学习方法来优化和分析它们在光纤输出端的光谱或时间强度分布。例如,从反馈和控制的角度来看,进化算法(通常收敛较慢)已被用于优化单模光纤或多模光纤中超连续谱(SC)光源的特定特性的实验,以及锁模光纤激光器的实验控制

使用神经网络的机器学习也已应用于超短脉冲表征,特别是降低极端事件实时测量的复杂性,以及用于非线性调制不稳定性中不同定位机制的分类,在锁模和脉冲整形的控制中的应用也已经在论文中演示。

我们前面的研究已经证明了基于机器学习模型可以利用经过非线性演化的复杂信号提取信息,在已知输入和输出脉冲信息的基础上实现对光纤参量的探测。所以,我们依然使用回归的思想,对NLSE方程进行拟合,对输出脉冲波形以及脉冲在光纤中的非线性演化进行预测,以解决优化脉冲传播需要大量且计算要求高的数值模拟的困难。可以分成两种情况考虑。

如果预测光脉冲经过未知参量的光纤传输的输出脉冲信息,系统框图如图所示。用锁模激光器产生超短脉冲,经波形整型器调整,输入到光纤中,先经过前文的参量探测系统得到光纤参量,机器学习系统利用已知的光纤参量与输入脉冲信息预测脉冲在这根光纤中的演化。如果光纤参量已知,则可以直接使用机器学习系统利用输入脉冲信息与光纤参量进行预测

对非线性介质传输全过程的脉冲演化预测

使用机器学习系统预测脉冲在光纤中不同位置的演化,有利于研究超连续谱在光纤中的演化过程。研究这种演化过程,可以认为是研究脉冲在一跟光纤中不同位置的输出。

首先研究预测脉冲演化的可行性。选取峰值功率为1000W,中心波长在1550nm、采样点为8192个、脉宽为1ps的高斯脉冲作为输入信号,光纤长度选择10m,色散(D)选择10(ps/nm/km),非线性系数为0.005(1/W/m),拉曼响应因子设为0.18

使用Python仿真得到脉冲数据,以光纤长度作为特征值,以输出脉冲作为标签值,处理后得到数据集。我们使用随机森林算法进行研究,预测脉冲在光纤5~10m的传输演化过程,得到结果如图所示。

总结

提出一种新的基于机器学习的全信号光纤参量探测方法,该方法使用K近邻算法、决策树算法、随机森林算法、全连接网络、卷积神经网络、复数卷积神经网络等多种机器学习算法,从超短脉冲经过光纤等介质传输后在非线性和色散共同作用下演变出的混乱无规则的信号中提取传输介质信息,可以同时实现光纤色散和非线性的探测,也使用了时频图作为参量探测的数据。最终,采用随机森林算法时探测均方误差损失率仅为0.27%。

为解决相位测量不易实现的困难,使得测量方法更具实用性,在全信号探测法的基础上提出了:通过利用多个不同条件下的不含相位信息的功率谱信息代替含有相位信息的完整信号信息探测的新型测量方法。而且使用全连接网络实现功率谱探测法的探测误差控制到了0.18%以内,低于全信号探测法,证明了这种功率谱探测法的可行性。

为解决非线性系数较小的光纤的功率谱区分度变差,使得功率谱探测法效果受到影响,提出了一种改进方法,通过向测量系统人为引入已知参数的高非线性光纤,提高了功率谱区分度,提高了原有方案的测量范围和灵敏度,可以用于低非线性,乃至纯色散器件的测量。几种机器学习算法的探测均方误差都控制在了0.1%以内。

为解决优化脉冲传播需要大量且计算要求高的数值模拟的困难,借助了多种机器学习方法来自动建立传输模型,绕过了直接数值求解控制传播模型的需要。预测了光纤中复杂的非线性传播,实现了对经由非线性介质传输后输出脉冲的预测以及对非线性介质传输全过程的脉冲演化预测,预测误差分别控制到了0.07%和0.37%以下。