隨著大數(shù)據(jù)、物聯(lián)網(wǎng)以及 5G 系統(tǒng)應(yīng)用的日益廣泛,數(shù)據(jù)傳輸?shù)乃俣群腿萘啃枨蠹眲≡黾?,硅基電子集成芯片的尺度和計算效率逐漸趨近物理極限。而光子集成芯片以光子為信息載體,具有體積小、速度快、集成度高的優(yōu)勢,在光通訊、量子計算、量子信息處理等領(lǐng)域得到了快速發(fā)展。
我們可以把光子比作火車,把光子器件比作火車軌道和火車站,光子在光子芯片中傳輸、處理,就像是火車在鐵軌上行走,并在火車站里實(shí)現(xiàn)人員的交換(信號的處理)。
波導(dǎo)是光子芯片器件中最基礎(chǔ)的單元之一,其主要功能是引導(dǎo)光沿著特定路徑傳輸。光子器件中的波導(dǎo)類似于我們常見的光纖,可以對光實(shí)現(xiàn)有效束縛。除此之外,利用波導(dǎo)還可以制備多種常見的光功能器件。比如,圖 1a 所示的是一種定向耦合器(Directional Coupler,DC),通常是由兩根波導(dǎo)構(gòu)成的光子器件,當(dāng)光在其中一根波導(dǎo)傳輸時,在某些特定的情況下,光并非完全局域在波導(dǎo)內(nèi),有一部分會貼在波導(dǎo)外表面(電磁波的倏逝場效應(yīng)),如果另一根波導(dǎo)和這根波導(dǎo)靠的很近,那么這些光就可以進(jìn)入另一根波導(dǎo)(也就是耦合效應(yīng))。通常,光信號在兩根波導(dǎo)之間的傳輸具有明確的方向性,因此這種結(jié)構(gòu)被稱作定向耦合器。通過對第二根波導(dǎo)光信號進(jìn)行分析、處理等,實(shí)現(xiàn)特定的功能。圖 1b 紅色虛線區(qū)域所示的光子器件叫做馬赫曾德爾干涉儀(Mach-Zehnder Interferometer, MZI),也是由兩根波導(dǎo)組成,只不過這兩個波導(dǎo)里的光都是從同一端輸入的,不同的是,在這種結(jié)構(gòu)中,通過對下面的波導(dǎo)進(jìn)行一定的調(diào)制(通常是加電),利用電光效應(yīng)(改變折射率)可以改變傳輸光的相位,讓上下兩束光產(chǎn)生相位差,進(jìn)而產(chǎn)生干涉來調(diào)節(jié)輸出端口光信號的強(qiáng)度,廣泛用于相位調(diào)制、光強(qiáng)度調(diào)制和光偏振調(diào)制等領(lǐng)域。
圖1:比較常見的幾種光子器件 a定向耦合器[1];b馬赫曾德爾干涉儀[2]
超表面(metasurface)則是另一類波導(dǎo)器件,其由排列在二維平面的納米結(jié)構(gòu)單元組成,每一個結(jié)構(gòu)單元像一個個微型“光學(xué)天線”一樣,能夠在納米尺度上精確調(diào)節(jié)光的相位、振幅和偏振狀態(tài)。通過對這些結(jié)構(gòu)的巧妙設(shè)計,科學(xué)家們可以讓光按照預(yù)設(shè)的方式折射、反射、聚焦,甚至改變顏色、亮度或者傳播方向,就像給光裝上了“指揮棒”。比如,2011 年美國科學(xué)家 Capasso 團(tuán)隊所提出了一種 V 形天線結(jié)構(gòu)的超表面(圖 2a),可以實(shí)現(xiàn)電磁波傳輸異常的偏折(圖2b,藍(lán)色線段表示正常反射和折射路徑,紅色線段表示異常反射和折射路徑)。
圖 2:基于 V 形天線結(jié)構(gòu)的超表面結(jié)構(gòu)[3]
在這些光子器件中,結(jié)構(gòu)的幾何參數(shù)和外部調(diào)控參數(shù),例如波導(dǎo)寬度、耦合區(qū)域長度、波導(dǎo)間間距、外加電信號強(qiáng)度等都會產(chǎn)生不同的功能。在設(shè)計此類光子器件時,需要根據(jù)實(shí)現(xiàn)的功能,找出特定的參數(shù)。因此,光子器件結(jié)構(gòu)設(shè)計顯得尤為重要。
像波導(dǎo)這樣的單個器件設(shè)計起來相對容易一些,通過調(diào)控某幾個參數(shù),比如波導(dǎo)的幾何尺寸、材料類型等,往往就可以實(shí)現(xiàn)想要的功能。不過當(dāng)這些光子器件集成在光芯片中時,比如超表面結(jié)構(gòu)就包含了多個基本器件單元,不同基本單元之間的相對角度、距離、尺寸等都會影響它們之間的耦合、相互作用,進(jìn)一步加劇了設(shè)計難度。
為了減少加工成本,不得不借助計算機(jī)技術(shù)在加工器件之前進(jìn)行模擬仿真,可以減少實(shí)驗(yàn)成本,也有利于設(shè)計出功能較為復(fù)雜的結(jié)構(gòu)。例如,常用的數(shù)值模擬方法有時域有限差分法(Finite-Difference Time-Domain,F(xiàn)DTD)、有限元法(Finite Element Method,F(xiàn)EM)等。
盡管這類數(shù)值模擬的方法在光子器件設(shè)計中獲得了廣泛的應(yīng)用,但仍存在一定的局限性。以 FDTD 為例,在模擬時先把要將模擬的區(qū)域劃分出極小的網(wǎng)格,同時將光的傳播過程劃分成無數(shù)個極短的瞬間。然后按照光的傳播規(guī)律(麥克斯韋方程),逐個計算每個網(wǎng)格在不同時刻的光場,最終將這些結(jié)果拼在一起,就可以得到光在器件里傳輸時的完整過程了。受限于 FDTD 數(shù)值方法的固有特性,在模擬光學(xué)器件時,單次計算區(qū)域的網(wǎng)格要小于波長。這種超高分辨率的要求使得傳統(tǒng)方法在模擬大尺寸光子器件時就顯得力不從心了。
此外,在設(shè)計實(shí)現(xiàn)某種特定功能的光子器件時,設(shè)計者通常只能對某些特定的參數(shù)進(jìn)行調(diào)整,例如耦合區(qū)域長度,波導(dǎo)寬度等。但實(shí)際影響器件性能的因素有很多,這種采用特定結(jié)構(gòu)參數(shù)調(diào)整的方法大大限制了設(shè)計的自由度。對于較為復(fù)雜的器件,往往要通過嘗試大量不同參數(shù)組合以尋找最優(yōu)解,計算成本和時間也隨參數(shù)的數(shù)量指數(shù)級增加,有時需要數(shù)天甚至數(shù)周才能完成一個滿足使用要求的光子器件。比如,想要模擬波導(dǎo)幾何尺寸對光傳輸?shù)挠绊懀鸵紤]波導(dǎo)的寬度、高度、長度三個參量,如果每個參量的變化是從 11 μm-20 μm,參量改變步長是 1 μm,每個維度的可能性就是 10 種,三個維度就是 1000 種,相當(dāng)于計算機(jī)要計算 1000 次才可以模擬完成。因此,上述方法一般可以設(shè)計的光子器件尺寸往往只能在百微米量級。
總之,傳統(tǒng)方法不僅會消耗大量的計算資源,也會在集成度上存在限制。
近年來,人工智能(Artificial Intelligence,AI)技術(shù)的迅速發(fā)展為科學(xué)研究提供了新的契機(jī)。2024 年諾貝爾物理學(xué)獎、化學(xué)獎均頒發(fā)給 AI 領(lǐng)域的科學(xué)家。機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí),已被廣泛應(yīng)用在微結(jié)構(gòu)的高效率設(shè)計和結(jié)構(gòu)優(yōu)化等方面,大大縮短了微結(jié)構(gòu)的設(shè)計時間,同時也為大面積結(jié)構(gòu)的設(shè)計提供了新的技術(shù)手段。
那么,AI 是如何做到的呢?
首先,AI通過收集大量的特定光學(xué)結(jié)構(gòu)的數(shù)據(jù)以及對應(yīng)的光學(xué)性能,利用這些數(shù)據(jù)對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練。這就好比我們先讓模型學(xué)習(xí)一本“字典”(稱為正向模型網(wǎng)絡(luò)),將結(jié)構(gòu)參數(shù)和光學(xué)性能對應(yīng)起來。訓(xùn)練完成后,模型就會就會變成一個經(jīng)驗(yàn)豐富的設(shè)計專家。然后,給模型輸入特定的功能要求,模型會在字典中查找類似的結(jié)構(gòu)。當(dāng)然這種結(jié)構(gòu)還不能滿足要求,還需要通過對初始設(shè)計進(jìn)行不斷優(yōu)化(稱為逆向設(shè)計模型網(wǎng)絡(luò))。
為了實(shí)現(xiàn)正向模型網(wǎng)絡(luò)對“結(jié)構(gòu)→性能”精準(zhǔn)映射和逆向設(shè)計模型網(wǎng)絡(luò)從“功能→結(jié)構(gòu)”反推優(yōu)化,科學(xué)家提出很多優(yōu)化方法。這些方法中,梯度下降算法因?yàn)楹唵?、高效,是目前?yīng)用最廣泛的一種。
這種方案就像我們在山頂尋找通往山谷的最短路徑。當(dāng)你站在山頂上時,這時還不知道最佳的路徑,只有一個粗略的方向。如果是你,你會怎么做呢?
下山時,你需要通過當(dāng)前的坡度來決定下坡的方向。通常的方案是,你沿著坡度下降的方向不斷前進(jìn),每次都朝著最陡的方向走,才會快速接近山谷(圖 3)。
圖 3:下山尋找最短路徑示意圖[4]
看到這里,大家可以想一下,沿著梯度最大的方向行走,就一定會達(dá)到山谷嗎?
實(shí)際上,如果走著走著遇到了一個小洼地,無論往哪個方向再邁一步,都是梯度增加的方向,模型以為這就是山谷了,而事實(shí)并非如此。
這種遇到“假山谷”的情況就使得 AI 陷入“局部最小值”,而無法達(dá)到“全局最小值”。為了避免這一問題,可以通過調(diào)節(jié)步伐大小、引入隨機(jī)擾動等方法,盡快讓 AI 跳出小洼地,找到“全局最小值”, 從而到達(dá)山谷。
在設(shè)計光子器件時,一般是根據(jù)已有的知識或經(jīng)驗(yàn)設(shè)計一些可能的器件結(jié)構(gòu)。此時,我們并不清楚哪些結(jié)構(gòu)參數(shù)是最優(yōu)的,光傳輸效率還比較低、損耗還比較大。當(dāng)前結(jié)構(gòu)的性能(如傳輸效率、光損耗、集成度等)相對于各個設(shè)計參數(shù)(如波導(dǎo)寬度、材料折射率等)的變化率為“梯度”,相當(dāng)于下山時的“坡度”。AI 通過計算不同參數(shù)對最終性能的影響,得出“梯度”。比如,從 A 點(diǎn)出發(fā),通過尋找附近最大的“梯度”,并沿著這一方向就可以走到 B 點(diǎn),從而降低目標(biāo)函數(shù)(如損失函數(shù))的值(圖 4)。這就像你在山中根據(jù)坡度來判斷下一步的方向。重復(fù)這個步驟,逐步調(diào)整模型參數(shù),使目標(biāo)函數(shù)達(dá)到最小值,最終就能到達(dá)最低點(diǎn) C 點(diǎn)。這個過程幫助 AI 知道應(yīng)該如何調(diào)整設(shè)計參數(shù),使得光子器件的性能逐步提升。
圖 4:梯度下降算法示意圖[4]
同樣,在 AI 設(shè)計光子器件時,學(xué)習(xí)率決定了每次調(diào)整設(shè)計參數(shù)的步伐。如果學(xué)習(xí)率太大,模型可能會因?yàn)檎{(diào)整過度而陷入不好的設(shè)計;如果學(xué)習(xí)率太小,模型則會慢慢收斂,效率低下或者陷入“局部最小值”。
總之,AI 在一個龐大的設(shè)計空間中不斷進(jìn)行優(yōu)化。經(jīng)過不斷的調(diào)整、優(yōu)化,最終找到了最佳的參數(shù)。這時,AI 就像是你成功地從山頂下到了山谷的最低點(diǎn),找到了最合適的光子器件結(jié)構(gòu),使得光子器件的性能達(dá)到了最優(yōu)。利用這種方法就可以根據(jù)我們的需求快速地設(shè)計相應(yīng)的結(jié)構(gòu),大大縮短了設(shè)計時間并提高了設(shè)計的準(zhǔn)確性,甚至可以設(shè)計出很多人類都無法想象的結(jié)構(gòu)。
我們以超表面結(jié)構(gòu)為例解釋 AI 是如何設(shè)計光子結(jié)構(gòu)的。圖 5 展示的是一種尺度小于波長、具有高品質(zhì)因子的共振超表面結(jié)構(gòu)[5]。類似于圖 2 的超表面結(jié)構(gòu),這種超表面結(jié)構(gòu)也是由許多基本單元結(jié)構(gòu)(圖 5 藍(lán)色結(jié)構(gòu))排列成的二維平面結(jié)構(gòu)。每個基本單元由兩個相同的硅納米棒組成。高品質(zhì)因子意味著光可以在這些結(jié)構(gòu)中被強(qiáng)烈地“困住”而不向外輻射,使得光子可以停留更長的時間,大大增強(qiáng)光與材料之間的相互作用效率。利用這種結(jié)構(gòu)的共振特性,可以用于光學(xué)傳感、非線性等領(lǐng)域。由于結(jié)構(gòu)的參數(shù)微小變化會劇烈的影響共振光譜的特性,因此要想實(shí)現(xiàn)預(yù)定的功能,傳統(tǒng)的設(shè)計方法通過連續(xù)調(diào)節(jié)結(jié)構(gòu)參數(shù)來模擬對應(yīng)的性能。不過,這種方法往往只能同時優(yōu)化一兩個參數(shù),并且參數(shù)優(yōu)化的范圍和精度有限。而實(shí)際上對性能的調(diào)控需要同時對材料的屬性、幾何特性等多個變量進(jìn)行同時優(yōu)化,因此傳統(tǒng)的方法對于共振光譜的線寬、寬度等調(diào)控能力有限,并且非常耗時。
圖 5:一種硅納米棒超表面結(jié)構(gòu)示意圖[5]
為了提高了結(jié)構(gòu)設(shè)計的效率,科學(xué)家們首先利用人工神經(jīng)網(wǎng)絡(luò)模型(神經(jīng)網(wǎng)絡(luò)是人工智能的核心技術(shù)模型,概念源自于人類大腦的神經(jīng)元網(wǎng)絡(luò))將一個正向模型網(wǎng)絡(luò)(Pretrained forward model network)和一個逆向設(shè)計模型網(wǎng)絡(luò)(Inverse-design model network)串聯(lián)起來(圖 6)。然后使用開源神經(jīng)網(wǎng)絡(luò)庫對正向模型網(wǎng)絡(luò)進(jìn)行訓(xùn)練,學(xué)習(xí)超表面結(jié)構(gòu)參數(shù)(圖 6 中右半部分的 y1,y2……)與透射光譜(圖 6 中右半部分的 x1,x2……)的映射關(guān)系(“字典”)。其次,逆向設(shè)計模型網(wǎng)絡(luò)的輸出(圖 6 中左半部分的 y1,y2……)接入已訓(xùn)練好的正向模型網(wǎng)絡(luò),通過學(xué)習(xí)這本“字典”,就可以知道如何根據(jù)目標(biāo)光學(xué)響應(yīng)(圖 6 中右半部分的 x1,x2……)找到合適的超表面結(jié)構(gòu)參數(shù)。也就是利用這本“字典”來輔助逆向設(shè)計模型網(wǎng)絡(luò)完成從光學(xué)響應(yīng)到結(jié)構(gòu)參數(shù)的預(yù)測。最后,逆向設(shè)計模型網(wǎng)絡(luò)根據(jù)光學(xué)目標(biāo)預(yù)測結(jié)構(gòu)參數(shù),并通過比較正向網(wǎng)絡(luò)的輸出與目標(biāo)響應(yīng)的誤差來更新自身參數(shù)使輸入結(jié)果與預(yù)測結(jié)果的差異達(dá)到最小(即梯度下降算法),從而預(yù)測出符合條件的超表面結(jié)構(gòu)參數(shù),實(shí)現(xiàn)高效、準(zhǔn)確的超表面設(shè)計。
圖 6:由一個逆向設(shè)計模型網(wǎng)絡(luò)和一個預(yù)訓(xùn)練的正向模型網(wǎng)絡(luò)連接而成的TN模型架構(gòu)[5],其中,X表示輸入和輸出,即透射光譜數(shù)據(jù),而Y表示中間層的輸出,對應(yīng)的是結(jié)構(gòu)參數(shù)。
通過輸入超表面結(jié)構(gòu)的透射光譜參數(shù):工作波段λ=1500 nm,線寬(共振峰的半高寬)△λ=5 nm,形狀因子(用于描述光譜的不對稱性)q=0.5(對應(yīng)的光譜如圖 7 黑色虛線所示),最終,在固定基本單元周期 D=900 nm,納米棒厚度 150 nm 的情況下,神經(jīng)網(wǎng)絡(luò)模型設(shè)計的納米棒長寬度 w=316 nm,長度 L=580 nm,每個基本單元中兩個納米棒的間距 2x0=378 nm,該結(jié)構(gòu)對應(yīng)的透射光譜如圖 7 紅色實(shí)線所示??梢钥闯?,模型預(yù)測結(jié)構(gòu)的光譜和輸入光譜(目標(biāo)結(jié)果)非常接近。
圖 7:輸入透射光譜(黑色虛線)和神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)構(gòu)的透射光譜(紅色實(shí)線)比較[5]
如果利用傳統(tǒng)的數(shù)值模擬方法,需要專業(yè)的計算機(jī),并且至少花費(fèi)秒量級的時間?;谶@種方法,利用普通的計算機(jī)(Intel(R) Core(TM) i7-4770 CPU @ 3.40 GHz, RAM: 16.0 GB)在 0.05s 的時間就完成了光學(xué)超表面結(jié)構(gòu)設(shè)計,設(shè)計效率得到了顯著提升。
人工智能除了科研輔助研究人員用于光子結(jié)構(gòu)設(shè)計,研究人員發(fā)現(xiàn)利用光子芯片還可以用于實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的光子結(jié)構(gòu)。相較于傳統(tǒng)的電子芯片,光子神經(jīng)網(wǎng)絡(luò)在計算速度與功耗上具有明顯優(yōu)勢。比如,2022 年 Firooz 等人實(shí)現(xiàn)了一個利用片上光子深度神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)對手寫字母識別的系統(tǒng)(圖 8)。研究團(tuán)隊將手寫字母圖像每個像素點(diǎn)的光強(qiáng)信息通過光柵耦合器輸入到系統(tǒng)中。通過對輸入信號進(jìn)行加權(quán)處理(Optical attenuator部分,光學(xué)衰減器),然后光進(jìn)入光電探測器(PD 部分)完成加法運(yùn)算,接著由微環(huán)諧振器(Optical modulator 部分)實(shí)現(xiàn)非線性變換(復(fù)雜特征提?。?,最終將光信號傳遞到下一層神經(jīng)網(wǎng)絡(luò)(Neuron optical output)。
圖 8:利用光子芯片識別手寫字母[6]
這些成果展示了人工智能在光子器件中的巨大應(yīng)用潛力,為開發(fā)新一代高效、功能豐富的光子器件打下了基礎(chǔ)。我們相信,隨著人工智能技術(shù)的迅速發(fā)展,微納光子器件設(shè)計與應(yīng)用領(lǐng)域?qū)⒂瓉硪粓鼍薮蟮募夹g(shù)變革。在不久的將來,現(xiàn)在所用的電子設(shè)備也許都會變成光子的世界。
我們可以大膽暢想一下,未來世界會是什么樣的呢?
或許那時,憑借光子在高速信息傳輸和處理方面的優(yōu)勢,光量子計算機(jī)會像今天的智能手機(jī)一樣走進(jìn)千家萬戶。
參考文獻(xiàn)
[1] WANG Q, HE Y, WANG H, et al. On-chip mode division (de)multiplexer for multi-band operation [J]. Opt. Express, 2022, 30(13): 22779-22787.
[2] DONG B, AGGARWAL S, ZHOU W, et al. Higher-dimensional processing using a photonic tensor core with continuous-time data [J]. Nat. Photon., 2023, 17(12): 1080-1088.
[3] YU N, GENEVET P, KATS M A, et al. Light Propagation with Phase Discontinuities: Generalized Laws of Reflection and Refraction [J]. Science, 2011, 334(6054): 333-337.
[4] 王東,馬少平. 圖解人工智能 [M]. 北京: 清華大學(xué)出版社, 2023.
[5] XU L, RAHMANI M, MA Y, et al. Enhanced light–matter interactions in dielectric nanostructures via machine-learning approach [J]. Advanced Photonics, 2020, 2(02): 026003.
[6] ASHTIANI F, GEERS A J, AFLATOUNI F. An on-chip photonic deep neural network for image classification [J]. Nature, 2022, 606(7914): 501-506.
轉(zhuǎn)載請注明出處。