基于光的反射与折射定律的表述方法推导及应用

周旭环, 龚云辉, 吴绍华, 王元康, 黄娅芳, 叶洪伟, 王光伟, 王一成

周旭环, 龚云辉, 吴绍华, 王元康, 黄娅芳, 叶洪伟, 王光伟, 王一成. 基于光的反射与折射定律的表述方法推导及应用[J]. 应用光学, 2022, 43(3): 510-517. DOI: 10.5768/JAO202243.0305001
引用本文: 周旭环, 龚云辉, 吴绍华, 王元康, 黄娅芳, 叶洪伟, 王光伟, 王一成. 基于光的反射与折射定律的表述方法推导及应用[J]. 应用光学, 2022, 43(3): 510-517. DOI: 10.5768/JAO202243.0305001
ZHOU Xuhuan, GONG Yunhui, WU Shaohua, WANG Yuankang, HUANG Yafang, YE Hongwei, WANG Guangwei, WANG Yicheng. Derivation and application of expression methods based on law of reflection and refraction of light[J]. Journal of Applied Optics, 2022, 43(3): 510-517. DOI: 10.5768/JAO202243.0305001
Citation: ZHOU Xuhuan, GONG Yunhui, WU Shaohua, WANG Yuankang, HUANG Yafang, YE Hongwei, WANG Guangwei, WANG Yicheng. Derivation and application of expression methods based on law of reflection and refraction of light[J]. Journal of Applied Optics, 2022, 43(3): 510-517. DOI: 10.5768/JAO202243.0305001

基于光的反射与折射定律的表述方法推导及应用

基金项目: 中国兵器工业集团有限公司科技开发费项目
详细信息
    作者简介:

    周旭环(1985—),男,硕士,工程师,主要从事光学冷加工工艺方面的研究。E-mail:34522491@qq.com

    通讯作者:

    吴绍华(1976—),男,硕士,高级工程师,主要从事红外光学材料研发及工艺方面的研究。E-mail:13577018379@163.com

  • 中图分类号: TN209;TN206

Derivation and application of expression methods based on law of reflection and refraction of light

  • 摘要:

    光的反射和光的折射是几何光学应用中最基本的方法。在现代精密光学元件加工过程中,其不同的表述方法可以为光线追迹、棱镜误差分析以及棱镜装调提供不同的解决思路。介绍了光的反射定律和折射定律的传统形式表述方法,并推导了光的反射定律和折射定律的矢量、矩阵及四元数3种表述方法。通过Matlab辅助下的模拟计算,得到施密特棱镜检验光路中2个不同区域入射光线的反射在水平方向上对称分布于前表面反射像两侧,与实际应用相符,实现了矢量、矩阵和四元数表述方法在施密特棱镜检验光路中的应用。3种表述方法可以为光线追迹、棱镜误差分析以及棱镜装调提供科学、实用的解决方法。

    Abstract:

    The reflection and refraction of light are the most basic methods for the application of geometric optics. In the processing of modern precision optical elements, the different expression methods can provide different solutions for light tracing, prism error analysis as well as prism assembly and adjustment. The traditional form expression methods of the law of reflection and the law of refraction of light were introduced, and the expression methods of vector, matrix and quaternion were derived. Through the simulation calculation assisted by Matlab, the reflected rays of incident light in two different areas of the Schmidt prism inspection optical path was symmetrically distributed on both sides of the reflected rays on the front surface in the horizontal direction, which was consistent with the practical application. The application of expression methods of vector, matrix and quaternion in Schmidt prism inspection optical path was realized. The three expression methods can provide scientific and practical solutions for light tracing, prism error analysis as well as prism assembly and adjustment.

  • 激光熔覆技术是将高功率密度的激光束的能量,通过非接触方式使粉末材料加热并熔化,熔化后的粉末材料快速冷却与微观结构的形成,使得表面具有与基体材料本身不同的新性能[1-4]。在激光熔覆过程中,急冷急热的能量变化过程会对微观组织的形成产生极大的影响,而最终形成的微观组织与材料的性能有着紧密的联系[5-6]。在熔覆层凝固结晶时,最常见的是以树枝状生长的枝晶,且枝晶不同的形貌参数与其性能有着一定的对应关系[7]。因此,实现自动识别枝晶形貌,对研究熔覆层性能具有十分重要的价值。基于上述背景分析,本文提出了一种从复杂的金相图中识别并分割出枝晶形貌的深度学习算法。

    近些年,基于深度学习的计算机视觉检测在不同工况均展现了其优异的能力[8-10]。特别是用于像素级别分类的语义分割更是在工业、医学等领域得到了大量的应用[11-12]。Li等人利用收发声信号技术监测激光熔覆过程,并通过深度学习神经网络提取特征向量,从而分析熔覆状态以及是否存在产生裂纹的迹象[13],该研究表明可以利用深度学习技术分析熔覆层状态及微观形貌。张海军等人基于遗传算法、二维最大类间方差提出双阈值分割法[14],根据区域极大值初步确定阈值,并对金相图像进行分割,分割结果反馈调整阈值,实现了对不同金相组织的分割。为本文实现在复杂背景中分割出枝晶形貌提供了一种新思路。熔覆层金相图中树枝晶与不规则晶、胞状晶等混杂在一起[15],不利于对树枝晶形貌进行观察研究。将树枝晶形貌识别视为二分类问题,通过语义分割的方法把树枝晶从复杂的金相图中分割出来,便于后续研究枝晶形貌与熔覆层性能的具体联系。

    针对复杂背景的二分类问题,本文对原Unet网络加以改进,引入串行放置的通道注意力机制、空间注意力机制和批量标准化(Batch Normalization,BN)层,并部署在下采样和上采样过程,建立了BNC-Unet(BN+CBAM-Unet)(convolutional block attention module,CBAM)即枝晶形貌分割网络模型。本网络模型用于树枝晶形貌的识别分割,在观测树枝晶形貌时排除其他晶粒的干扰,有效地促进了树枝晶形貌对熔覆层性能影响的研究。

    语义分割是深度学习三大应用之一,其特点是效率和精度高[16-17]。搭建适于识别并分割样本特征的深度学习模型,建立训练集及测试集,用以训练、测试模型,并根据网络反馈优化参数,最终可以快速、准确得到分割结果,节省大量的时间。本研究以U-net网络模型为基础,U-net网络本身是为了解决医学影响的细胞分割而提出,便于辅助医护人员客观、准确地分析病理,为做出准确的医学诊断提供支撑数据[18]。由于其出色完成了在复杂背景下分割样本目标而得到了众多领域专家的青睐[19]。针对样本背景复杂问题,在原来的U-net网络基础上,部署串行注意力模型和BN层,并调整2种模型的部署位置,使得本次改进的BNC-Unet模型能更好地胜任树枝晶形貌分割任务,取得较为满意的分割结果。

    本次设计的树枝晶形貌识别网络主要分为2个部分,其结构如图1所示。一是用于提取特征的下采样部分,即编码区;二是得到更加准确特征信息的上采样部分,即解码区。树枝晶识别网络整体架构呈现字母U型,接下来依次介绍2个区域。

    图  1  BNC-Unet网络结构图
    Figure  1.  Structure diagram of BNC-Unet network

    第1部分是模型的编码部分,用于提取金相特征,该部分的各子过程大体包括了2个卷积层(其中卷积核为3×3)、防止模型过拟合的丢弃层、用于对每层数据标准化处理的BN层、elu激活函数层、最大池化层。在该部分的第一阶段引入CBAM,使得提取到的特征更加精准。将3通道128像素×128像素的原始图像输入编码区,经过卷积等操作生成4组通道数与大小不同的特征图,其通道数和大小如表1所示。这些特征图用于与解码区中相同通道数、相同大小的特征图进行跳跃融合。经编码区最后一次处理得到256通道8像素×8像素的特征图,并传递至解码区。

    表  1  特征图指标
    Table  1.  Feature map indexes
    组别通道数大小 /(像素×像素)
    116128×128
    23264×64
    36432×32
    412816×16
    下载: 导出CSV 
    | 显示表格

    第2部分是凝练特征信息的解码部分,该部分的每个阶段大体包括了用于扩大图像尺寸的ConvTranspose2d逆卷积层(卷积核为2×2、步长为2)、特征融合(解码区内的特征图与编码区内的特征图通道数、尺寸大小对应相等)、2个卷积层(其中卷积核为3×3)、丢弃层、BN层、elu激活函数层。在该部分的最后一个阶段引入CBAM,细化特征,调整权重。由编码区传递的256通道8像素×8像素的特征图经过上采样过程,最终生成单通道128像素×128像素的灰度图像。

    串行注意力机制,即将输入的特征图先经过通道注意力模块,然后将该模块的输出结果加权传递至空间注意模块,经过这2个模块的作用,最终将结果输出作为下一过程的输入。这种注意力机制模型在2018年由Woo[20]提出,并对比了单独使用这2个模块和空间注意模块加通道注意力模块的布局,结果表明先通道后空间得到的特征信息最为准确,其对目标特征的识别覆盖最广。串行注意力模型结构如图2所示,通道注意力模型与空间注意力模型串行放置,使得提取特征更为准确。

    图  2  串行注意力模型结构图
    Figure  2.  Structure diagram of serial attention model

    在通道注意力模型内,焦点在于通道维度,特征图的每个通道即为各通道包含的特征。提取通道的池化参数,再经过同一个多层感知机(Multilayer Perceptron, MLP),输出值相加后经过归一化处理得出最终权重,得到的权重与特征图的乘积即为通道注意力模型输出的加权特征图。

    在空间注意力模型内,焦点在于特征图中每个像素的权重。与通道注意力模型类似,在空间注意力模型中,提取不同通道的同一平面空间点的池化参数,经卷积和归一化处理得出最终权重,得到的权重与空间特征的乘积即为空间注意力模型输出的加权特征图。

    特征图经过串行注意力模型后,特征权重得到进一步调整处理,有利于提高网络对样本特征学习、提取的能力,从而提高网络的性能。

    网络参数的选择主要是Batch Size的确定、优化器的选取和损失函数的选取。

    Batch Size的大小对网络的训练速度和梯度具有一定的影响,其优点在于可以有效地防止内存爆炸,加速收敛,避免局部最优。梯度方差如(1)式所示:

    $$ Var(g) = Var\left({\frac{1}{m}\sum\nolimits_{i = 1}^m {g({x_i},{y_i})}}\right) $$ (1)

    式中:m为Batch Size。因为样本数量固定且随机,所以各样本方差相同,(1)式可简化为

    $$ Var(g) = \frac{1}{m}Var(g({x_i},{y_i})) $$ (2)

    由(2)式可以看出,梯度方差与批量大小成反比,一般Batch Size取值范围在2~32之间[21],本次实验取Batch Size大小为14,epoch设置为75。

    学习率对于神经网络训练起到非常重要的作用,本次选用Adam优化算法。该算法整合了AdaGrad和RMSProp两种算法的优势[22],与单独使用这2种算法相比,使用Adam算法收敛最快。该算法属于自适应学习率算法,其算法策略如下:

    $$ {{{m}}_t} = {\beta _1}{m_{t - 1}} + (1 - {\beta _1}){g_t},{\hat m_t} = \frac{{{m_t}}}{{1 - \beta _1^t}} $$ (3)

    式中:${{{m}}_t}$为一阶动量项;${\hat {{m}}_t}$为修正值;根据经验设定$\; {\beta _1} $为0.9。

    $$ {v_t} = {\beta _2}{v_{t - 1}} + (1 - {\beta _2})g_t^2,{\hat v_t} = \frac{{{v_t}}}{{1 - \beta _2^t}} $$ (4)

    式中:$ {v_t} $为二阶动量项;$ {\hat v_t} $为修正值;根据经验设定$\; {\beta _2}$为0.999。

    $$ {W_{t + 1}} = {W_t} - \frac{\eta }{{\sqrt {{{\hat v}_t}} + \varepsilon }}{\hat m_t} $$ (5)

    式中:$ {W_t} $为迭代模型参数;取$ \varepsilon $值为10−8。Adam优化器在收敛速度和准确率方面表现优秀,故本网络模型选择Adam优化器。

    本次分割任务属于二分类问题,故Loss损失函数选用二进制交叉熵。由于树枝晶特征与其背景中其余晶粒特征相差不大,故本次设计的网络模型的输出层激活函数选用Sigmoid函数,其函数原理如(6)式所示:

    $$ {{f}}(x) = \dfrac{1}{{1 + \exp ( - x)}} $$ (6)

    从(6)式可以看出,该函数可以把数值控制在0~1区间,故能良好地应用于二分类问题。

    二元交叉熵损失函数如(7)式所示:

    $$ L{\text{o}}ss = - \dfrac{1}{N}\sum\limits_{i = 1}^N {\{ {y_i}} \cdot \log [p({y_i})] + (1 - {y_i}) \cdot \log [1 - p({y_i})]\} $$ (7)

    式中:$ p({y_i}) $是标签$ {y_i} $(0或1)出现的概率;$ N $为样本数。故该文采用binary cross entropy作为损失函数,且搭配Sigmoid使用。

    为了检验本次设计的基于语义分割树枝晶形貌识别网络的分割能力,进行了激光熔覆实验,并采集了训练网络所需的样本。本次的训练集和测试集均是由课题组激光熔覆样块在光学显微镜下捕获所得,光学显微镜型号为DM2700M(leica microsystems,GmbH)。使用型号为LDP6000-60(laserline,GmbH)大功率光纤激光器进行熔覆实验,将熔覆样块进行线切割、镶块处理,经打磨抛光和王水腐蚀后在光学显微镜下捕获金相图像,至此激光熔覆实验结束,后续需要在计算机上进行下一阶段实验。利用Labelme软件为金相图制作标签后,建立金相数据集,其中包括420张训练图像和20张测试图像,原金相图和标签如图3所示。

    图  3  数据集
    Figure  3.  Data set

    本次研究使用的计算机操作系统为Windows10,CPU为Intel®Core™i5-10200H,RAM为8.00 GB,GPU为GTX1650Ti。网络搭建、运行、调试选用Tensorflow框架,选择基于网页版编译器Jupyter notebook和Python语言编译开发,该编译器可以直接在网页上调试代码,程序结果直接在网页中显示,便于直接观察。为了防止网络模型训练时出现过拟合现象,本设计引入用于提前终止训练的Early Stopping命令,并设置耐心值为20步,即训练过程中Loss值出现连续20步无下降现象,模型训练停止。

    实验结果的评价指标选用交并比(intersection over union,IoU),其表达了网络分割像素与标签像素总数上的比值。通常以混淆矩阵作为基础,再计算评价指标数值。混淆矩阵如图4所示,A为真实值,B为预测值。预测与标记相同为True;相反为False。预测值为树枝晶像素记Positive;反之为Negative。

    图  4  混淆矩阵示意图
    Figure  4.  Schematic diagram of confusion matrix

    IoU计算方式为

    $$ IoU = \frac{{TP}}{{TP + FP + FN}} $$ (8)

    本网络共训练了378张图片,验证了42张图片,并做了3组对比试验,其结果如表2所示。设定相同参数,对比了Unet、BN-Unet、CBAM-Unet、BNC-Unet输出结果如图5所示。从表2可以看出本次针对树枝晶特征设计的BNC-Unet模型结果最好,其IoU值为84.20%,比原Unet模型结果提高了8.97%。从图5中的分割结果看,BNC-Unet自动分割的树枝晶结果最为精确。

    表  2  不同改进方式的网络结果LossIoU对比
    Table  2.  Comparison of Loss and IoU network results of different improved methods
    网络架构LossIoU/%
    Unet 0.066 6 75.23
    BN-Unet 0.065 8 81.05
    CBAM-Unet 0.066 2 75.37
    BNC-Unet 0.059 1 84.20
    下载: 导出CSV 
    | 显示表格
    图  5  各网络输出对比图
    Figure  5.  Comparison graphics of each network output

    本实验基于U-net网络引入注意力模型和BN层,搭建了针对分割树枝晶的BNC-Unet网络,建立了用于训练网络和测试网络的数据集,将交并比IoU作为本次网络的评价指标,并对比了原Unet网络、BN-Unet网络、CBAM-Unet网络的分割结果。其对比结果表明BNC-Unet网络能够较为准确自动标记树枝晶形貌,BNC-Unet网络分割准确率为84.2%,比原Unet网络结果提高了8.97%。注意力机制在浅层和深层对称部署一次可以在实现较好的特征提取结果的基础上而不增加网络训练时间,实现自动标记树枝晶形貌,便于在进行激光熔覆试验后,为自动分析熔覆层性能提供参考。

  • 图  1   光的反射图

    Figure  1.   Reflection diagram of light

    图  2   光的折射图

    Figure  2.   Refraction diagram of light

    图  3   反射定律的矢量表述图

    Figure  3.   Vector expression diagram of law of reflection

    图  4   折射定律的矢量表述图

    Figure  4.   Vector expression diagram of law of refraction

    图  5   球面的折射图

    Figure  5.   Refraction diagram of spherical surface

    图  6   三维矢量旋转图

    Figure  6.   Rotation diagram of 3D vector

    图  7   折射光旋转图

    Figure  7.   Rotation diagram of refracted light

    图  8   施密特棱镜平行差检测光路图

    Figure  8.   Optical path diagram of parallel error detection by Schmidt prism

    图  9   矢量形式算法流程图

    Figure  9.   Flow chart of vector form algorithm

    图  10   矩阵形式算法流程图

    Figure  10.   Flow chart of matrix form algorithm

    图  11   四元数形式算法流程图

    Figure  11.   Flow chart of quaternion form algorithm

    图  12   施密特棱镜平行差 实际检测结果图

    Figure  12.   Diagram of actual detection results of parallel error of Schmidt prism

    图  13   单个平面微量转角图

    Figure  13.   Micro angle of single plane

    图  14   棱镜内部出射前的反射光线算法流程图

    Figure  14.   Flow chart of reflected light algorithm before prism exit

  • [1] 李晓彤. 几何光学和光学设计[M]. 杭州: 浙江大学出版社, 1997.

    LI Xiaotong. Geometrical optics and optical design[M]. Hangzhou: Zhejiang University Press, 1997.

    [2] 欧家鸣, 王瑞丽, 尚鹤岑, 等. 反射定律的三种表达形式[J]. 云南师范大学学报(自然科学版),2000,20(1):57-61.

    OU Jiaming, WANG Ruili, SHANG Hecen, et al. Three forms of expression about reflection law[J]. Journal of Yunnan Normal University (Natural Sciences Edition),2000,20(1):57-61.

    [3] 潘苏东, 茌寒文. 用矩阵方法解理想光具组问题[J]. 徐州师范大学学报(自然科学版),2000,18(3):47-51.

    PAN Sudong, CHI Hanwen. Solving problems of ideal optical system by matrix method[J]. Journal of Xuzhou Normal University (Natural Science Edition),2000,18(3):47-51.

    [4] 刘俊峰. 三维转动的四元数表述[J]. 大学物理,2004,23(4):39-43.

    LIU Junfeng. Three dimensional rotation represented by quaternion[J]. College Physics,2004,23(4):39-43.

    [5] 匡萃方, 冯其波, 刘欣. 用矢量方法分析角锥棱镜的反射特性[J]. 应用光学,2004,25(2):25-27.

    KUANG Cuifang, FENG Qibo, LIU Xin. Analysis of reflection property of cube-corner retroreflector with vector expression[J]. Journal of Applied Optics,2004,25(2):25-27.

    [6] 张铭. 矩阵光学的光路可逆性研究[J]. 扬州教育学院学报,2002,20(3):22-25.

    ZHANG Ming. Research into the reversibility of ray in matrix optics[J]. Journal of Yangzhou College of Education,2002,20(3):22-25.

    [7] 官斌, 洪源. 基于四元数的别汉棱镜光轴误差模型研究[J]. 光学与光电技术,2019,17(4):84-88.

    GUAN Bin, HONG Yuan. Research on optical axis error characteristics of Pechan prism based on quaternion[J]. Optics & Optoelectronic Technology,2019,17(4):84-88.

    [8] 刘汉臣, 唐远河. 矢量分析在反射和折射中的应用[J]. 应用光学,2003,24(2):46-49.

    LIU Hanchen, TANG Yuanhe. Application of vector analyses on reflection and refraction[J]. Journal of Applied Optics,2003,24(2):46-49.

    [9] 李开玮. 光的反射与折射定律的两种证明与联想[J]. 南方农机,2020,51(9):200-202.

    LI Kaiwei. Two proofs and associations of the law of light reflection and refraction[J]. China Southern Agricultural Machinery,2020,51(9):200-202.

    [10] 程国采. 四元数法及其应用[M]. 长沙: 国防科技大学出版社, 1991.

    CHENG Guocai. Quaternion theory and its application[M]. Changsha: National University of Defense Technology Press, 1991.

    [11] 肖尚彬. 四元数方法及其应用[J]. 力学进展,1993,23(2):249-260.

    XIAO Shangbin. The method of quaternion and its application[J]. Advances in Mechanics,1993,23(2):249-260.

    [12]

    LEO S D, DUCATI G C. Quaternionic groups in physics[J]. International Journal of Theoretical Physics,1999,38(8):2197-2220. doi: 10.1023/A:1026626424174

    [13]

    YEFREMOV A P. Quaternions: algebra, geometry and physical theories[J]. Hypercomplex Numbers in Geometry and Physics,2004,1(1):104-119.

    [14] 邢燕. 四元数及其在图形图像处理中的应用研究[D]. 合肥: 合肥工业大学, 2009.

    XING Yan. Research on quaternion and its applications in graphics and image processing[D]. Hefei: Hefei University of Technology, 2009.

    [15] 丁光涛. 偏振光学的四元数方法[J]. 光学学报,2013,33(7):277-282.

    DING Guangtao. Quaternion method in polarization optics[J]. Acta Optica Sinica,2013,33(7):277-282.

    [16] 尹剑, 高教波, 张琬琳, 等. 三轴光电侦查平台可周转指向光束姿态算法设计[J]. 应用光学,2015,36(3):351-355. doi: 10.5768/JAO201536.0301003

    YIN Jian, GAO Jiaobo, ZHANG Wanlin, et al. Attitude algorithm design for light beam circumrotated on three-axis electro-optical reconnaissance platform[J]. Journal of Applied Optics,2015,36(3):351-355. doi: 10.5768/JAO201536.0301003

    [17] 汤自义, 须耀辉, 王志坚. 反射棱镜[M]. 北京: 国防工业出版社, 1981.

    TANG Ziyi, XU Yaohui, WANG Zhijian. Reflecting prism[M]. Beijing: National Defense Industry Press, 1981.

  • 期刊类型引用(1)

    1. 武文权,任志红,闫静静. 基于遗传神经网络的光纤激光网络回波信号增强方法. 激光杂志. 2025(01): 185-190 . 百度学术

    其他类型引用(1)

图(14)
计量
  • 文章访问数:  590
  • HTML全文浏览量:  186
  • PDF下载量:  95
  • 被引次数: 2
出版历程
  • 收稿日期:  2021-09-16
  • 修回日期:  2022-02-21
  • 网络出版日期:  2022-04-10
  • 刊出日期:  2022-05-14

目录

/

返回文章
返回