電子發燒友網報道(文/周凱揚)随着摩爾定律逐漸放緩,芯片性能的提升已經越來越慢了,這一點大家從7nm到4nm的産品就可以看出,晶體管密度增加帶來的性能升級開始出現了瓶頸。廠商們為了繼續推陳出新,在近年來想出了不少新的方案,例如3D封裝、異構集成,甚至是繼續增大芯片面積等等。而如今光子集成芯片,尤其是光子集成計算芯片的興起又帶來了新的契機。
Lightmatter
目前鑽研光子集成電路的初創企業并不少,但他們的光子計算核心原理基本相同,打造一個用于通用矩陣乘法運算(GEMM)的光子矩陣,再集成DAC、ADC、跨阻放大器(TIA)和光電探測器(PD)等其他模拟和光電器件,來替代目前深度學習和科學計算任務中的其他ASIC硬件。
Envise芯片 / Lightmatter
Lightmatter在集成度上已經做到了很高的水平,甚至推出了8"x8"的晶圓級光子芯片。Lightmatter給出的性能指标也相當誇張,配有4個Envise光子芯片的服務器裡,同時運行BERT機器學習模型,Envise服務器能實現比英偉達DGX-A100高三倍的推理性能和7倍以上的能效比。
Lightmatter在技術博客中介紹了其原理。高速DAC負責将多位數字信号轉換成多電平模拟信号,再通過光調制器轉換為光矢量輸入。通過光子矩陣的計算後,輸出光矢量經過光電探測器、跨阻放大器和ADC,重新回歸數字信号。
Lightmatter強調高分辨率的DAC功率較大而且會占用較大的芯片面積,所以它們選擇了中分辨率的DAC來保證性能。而且為了滿足TIA在高動态範圍和大帶寬上的要求,反饋電阻不能特别大,TIA之後也要加一個額外的電壓放大器。
曦智科技
去年年底,與Lightmatter可以稱為“同門師兄弟”的曦智科技也發布了旗下首個産品,高性能光子計算處理器PACE。在PACE中,單個光子芯片集成了超了一萬個光子器件,時鐘速度達到1GHz。根據曦智科技的說法,PACE在運行特定循環神經網絡時,速度可以達到高端GPU的數百倍。
PACE光子計算處理器 / 曦智科技
PACE包含了一個64x64的光學矩陣,由集成矽光芯片和CMOS芯片3D堆疊而成,從Cadence發布的視頻來看,曦智科技的3D封裝應該是基于Cadence的Integrity 3D-IC和Innovus平台打造與設計的。
曦智科技強調,靠光子矩陣的光子計算和光子互聯,不僅可以實現更強大的并行能力和更低的延遲,能效上也與電子IC相當,工藝要求卻不高。所以對于數據中心等場景來說,是一個替代GPU的低成本高性能方案。
大規模光子集成芯片專項
從以上兩家公司的成果可以看出,對于光子集成電路來說,最重要的一個是計算,另一個是互聯,前者保證了性能,後者保證了擴展性和延遲。要攻克這些目标無疑需要更大的投入和研究,随着國外光子集成的研究已經起步,我國也早已認識到這一點,并在2016年啟動了“大規模光子集成”芯片這一中科院戰略性先導科技專項。
該專項分為三個目标,短期目标是在5年内,先解決目前集成電路面臨的訪存牆和I/O牆問題,互聯交換帶寬要達到3.2Tbps;中期目标則是利用大規模并行架構的光電混合計算芯片實現5萬億次矩陣乘加計算的處理能力,并以此開發深度學習計算機;長期目标則是面向未來的量子計算,推出超大規模的片上網絡,在特定算法上性能徹底超過電子計算。
很明顯,這樣一個專項任務是一個複雜的工程,所以也分配給了半導體所、上海微系統與信息技術所、西安光學精密機械所以及計算技術所來合作完成。而該專項現階段的結果已經達到了國際領先的集成規模,實現了單片集成15408個基礎元件的16x16光學交叉矩陣芯片。
結語
除了光子集成芯片在設計上的創新攻關外,要想實現大規模集成,制備加工其實同樣關鍵。目前雖然一些光通信和傳感設備上的光子集成芯片已經借着成熟的CMOS工藝量産,但如何能在磷化铟或矽光器件上更進一步,将大規模的光子集成芯片制造和量産的成本與難度降低,或許才是這些光子集成芯片公司在供應鍊上最該關注的問題。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!