ICC訊(編譯:Nina)(作者:Sameh Boujelbene)OFC是光通信和網絡領域最重要的全球盛會,吸引了來自世界各地的與會者,他們有興趣了解該行業的最新進展和創新。雖然OFC涵蓋了廣泛的光學行業和應用,但我的重點是數據中心市場,即數據中心內部和數據中心之間的應用。隨著OFC的臨近,我渴望在這個博客中討論一些將在會議上占據中心的關鍵話題。
光學在人工智能網絡中的作用越來越大
新興的大型人工智能應用的規模似乎呈指數級增長,這些應用必須處理的參數數量每2到3年增長1000倍。因此,就加速器數量而言,人工智能集群的平均規模每兩年翻兩番,從256個的典型規模發展到1000個,然后迅速發展到4000個,現在一些集群擁有32K和64K的加速器。
另一個關鍵方面是每個加速器的帶寬量,預計在不久的將來將從目前的200/400/800Gbps增長到1Tbps以上??偠灾?,人工智能網絡中的流量增長不僅受到集群規模增長的驅動,還受到每個加速器帶寬增加的推動。因此,人工智能集群中的網絡帶寬正以驚人的速度增長,某些云服務提供商網絡每兩年增長10倍。
在我們最近發布的 “AI Networks for AI workloads” 《人工智能工作負載的人工智能網絡》高級研究報告中,我們預測到2025年,人工智能網絡中的大多數端口將為800Gbps,到2027年,大多數端口將達到1600Gbps,這表明市場上的最高速度將很快被采用。這種遷移速度幾乎是我們通常在用于連接通用服務器的傳統前端網絡中看到的速度的兩倍。
遺憾的是,光速度的提高受到成本和功耗顯著增加的挑戰。對人工智能基礎設施的大量投資正在加速開發創新的光連接解決方案,以滿足人工智能集群的需求,同時解決一些成本和功耗挑戰。今年的OFC將探討應對這些挑戰的各種解決方案和策略。
1.6Tbps的光學現狀和3.2Tbps的潛在路徑
在OFC2023上,業界推出了許多基于200G/lambda的1.6Tbps光器件和收發器。我們預計業界將在今年的OFC上進一步展示此類1.6Tbps產品的技術。雖然我們預計到2025/2026年1.6Tbps才能實現批量出貨,但業界必須開始努力實現3.2Tbps,并探索各種途徑和選擇來實現這一里程碑。這種緊迫感源于多種因素,包括人工智能集群內帶寬需求的指數級增長,以及與更高速度相關的不斷升級的功率和成本問題。我們預計今年OFC將圍繞實現3.2Tbps的潛在路徑進行多次討論。
線性驅動可插拔光學、共封裝光學、相干光學
可插拔光學預計將在系統級功耗中占越來越大的比例,在51.2Tbps及以上的情況下,將超過交換機系統功耗的50%。隨著云服務提供商構建下一代人工智能網絡并繼續推動更高的速度,這一問題將進一步加劇。
在OFC2023上,業內引入了線性驅動可插拔光學(Linear Drive Pluggable Optics,LPO),引發了一系列測試活動。在OFC2024上,我們期待聽到關于LPO的最新消息,以及它們是否有超過112G SerDes通道。此外,與傳統的可插拔解決方案相比,業內將把相干光學作為降低功耗和成本的一部分努力進行探索。
與此同時,共封裝光學(Co-Packaged Optics,CPO)仍在發展中,業界猜測,CPO最終可能成為未來實現更高速度的唯一解決方案。
關于Sameh Boujelbene:Sameh Boujelbene于2011年加入Dell'Oro集團,目前負責以太網園區交換機、以太網數據中心交換機和用于人工智能工作負載的人工智能網絡領域的研究。在公司任職期間,Boujelbene女士擴大了她的研究項目,以解決數據中心互連、AI/ML工作負載和數字化轉型問題。她在各種行業和貿易出版物上發表文章并被引用,她經常在行業會議和活動上發表演講。