晶上生成式變結構計算可為我國打破算力芯片“制程工藝繭房”開辟新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。
今年以來,我國以DeepSeek為代表的大模型企業通過算法優化、有針對性的訓練和開源生態協作,在使用“縮水版”GPU芯片的情況下,將千億參數模型訓練成本壓縮至同類模型的1/10,走出了一條從粗放式算力堆砌向內生式效能提升的新路徑。
在全球驚嘆中國非對稱創新奇跡的同時,也要清醒看到,就人工智能(AI)技術和產業自主可持續發展而言,我國仍未擺脫對高端乃至“縮水版”智算芯片等物理器件的依賴。在可以預見的未來,外部環境可能更趨惡劣,封鎖遏制常態化、供應鏈不確定性等挑戰難以回避。我國亟需在智能算力層面實現“DeepSeek式突圍”,用超限創新解耦當前硬件算力提升與制程工藝進步強綁定的關系。
換言之,我國要在AI領域獲得與競爭對手可博弈的能力,不僅要在算法層面繼續革命、突破“算力繭房”,而且要在算法與物理層面深度融合上實現換道超車,破解“制程工藝繭房”。以生成式變結構計算、軟件定義晶上系統(Software defined System on Wafer,SDSoW)為主要內容的晶上生成式體系架構,為解決算法模型與算力載體失配難題、增強軟硬件協同算力可持續發展提供了新的技術路徑。
讓計算架構的“鞋”適應算法的“腳”
先進的芯片制程工藝能夠提供更高的晶體管密度,提升芯片單位面積計算能力,為大模型訓練和推理提供更強大的計算資源支持。然而,基于還原論的工程設計范式,芯片制程工藝艱辛迭代獲得的物理算力提升,很難被大規模分布式物理系統上運行的軟件算法有效利用。芯片峰值計算能力與算法系統性收益存在結構性錯位,加之分布式系統在技術體制上受“大規模、低時延、高帶寬”不可能三角問題制約,靠簡單堆砌千張、萬張乃至十萬張以上GPU卡的方式,難以滿足“規模定律-Scaling low”驅動的大模型訓練之非線性算力增長需求。
簡而言之,由于存算分離體制的馮·諾依曼計算架構,硬件系統設計(如芯片制程、內存帶寬、并發單元等)與算法模型的運算特征(如計算密度、數據流模式、精度需求等)之間存在系統性錯位。即便芯片制程工藝有所進步,帶來了性能增益,也會由于“逐級插損”的系統工程范式大打折扣。
突破“制程工藝繭房”,在更高維度上尋求問題的解空間,需要變革傳統剛性計算架構及技術物理實現范式。
近80年來,傳統計算架構一直沿用運算器、控制器、內存儲器、輸入輸出設備幾大件組成的馮·諾依曼計算架構。無論是復雜的AI算法,還是簡單的數據處理任務,都被“硬塞”進剛性的計算架構之中,奢望“一勞永逸”地處理千變萬化的應用。這就好比不管你腳多大,都必須穿37碼的鞋才能走路。然而,鞋不合腳就走不快:小腳穿大鞋會絆腳;大腳穿小鞋則會感到疼,結局往往是“削足適履”。
化解剛性架構算力與多樣化算法間結構性矛盾,需要借助物理學增維求解法則,導入自適應計算架構新機理。
2009年,受“自然界偽裝大師”擬態章魚啟發,中國科學家在世界上首次提出領域專用軟硬件協同變結構計算——擬態計算。如同擬態章魚,可“隨機應變”地隱匿在沙質海底或珊瑚礁等環境之中,擬態計算能讓“鞋子”更好地適配穿著它走路的“腳板”。
2018年,計算機體系結構大師、圖靈獎得主大衛·帕特森和約翰·軒尼詩預言,基于軟硬件協同計算語言的領域專用軟硬件協同計算架構,將成為今后十年計算機體系架構黃金發展期的主流發展方向之一。前不久,特斯拉Dojo超算公布了其計算范式變革的解決方案,提出硬件架構像變形金剛般隨任務變形,實現從“算法適應硬件”到“算法定義硬件”的范式轉換。
用二流零部件構建一流系統
生成式變結構計算的核心在于按算法需求動態重構計算架構,要求算力的硬件載體能夠實現以軟件驅動物理結構變化,大幅度提升特定計算結構對特定算法的執行效能。SDSoW就是要推動計算架構從“剛性流水線”向“軟件可塑形”躍遷,打通生成式變結構計算從理論到技術物理實現的閉環,使得基于二流器件或部件構建一流系統成為可能。
具體來說,SDSoW具備五大能力。
一是系統破局能力。SDSoW擺脫“核心器件決定論”思維,改變“芯粒、芯片、模組、機匣、機架、系統”的逐級堆砌、逐級插損式工程技術路線,通過晶圓級異構集成實現功能解構—晶上重組,達成功能等價、系統最優的目標,將制程工藝短板通過系統工程方法轉化為非主要矛盾。
二是整體增效能力。借助晶圓級高密度互連、超短距離、異質異構封裝,獲得高帶寬、低延遲、低功耗的系統增益,SDSoW系統的帶寬可提升一個數量級,時延可縮小一個數量級,功耗可降低一個數量級,系統效能可提升三個量級。
三是通專融合能力。基于晶圓級系統硬件可編程/重定義架構,可通過軟件實時配置或由AI大模型生成SDSoW功能和性能。在同一物理載體上,能根據不同應用需求或使用場景,實現“一平臺、多樣性”生成式變結構計算,既可滿足專用場景特殊算力需求,又能兼顧領域內相對靈活的通用算力要求。
四是開源協同能力。通過建立SDSoW開源社區,發布基礎互連協議、動態控制器及生成式變結構計算工具鏈等,SDSoW可構建“中國引領、全球參與”的生態環境,以開放破壟斷,形成相對Chiplet(小芯片)路線的比較優勢。
五是內生安全能力。SDSoW可從源頭上應對開放生態帶來的新域新質安全挑戰,通過引入內生安全架構實現開放可控,即便供應鏈欠安全,仍能保證開放條件下該系統具有“開箱即用、默認安全”的網絡彈性。
總之,晶上生成式變結構計算可為我國打破算力芯片“制程工藝繭房”開辟新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。通過應用與設計、算法與算力的垂直整合,解耦當前我國算力基礎設施產品對芯片先進制程工藝的強依賴關系,最大程度獲取體系結構與工藝進步的綜合增益。晶上生成式變結構計算也能為全球智算普惠提供中國方案。
基于晶圓級集成/封裝的生成式變結構計算,開辟了算法架構突破與物理載體革命、算法工程實現與計算范式創新深度耦合的新方向。目前,應盡快推動根理論突破,重點攻關晶上熱力學、異構集成理論、可重構架構數學描述等底層理論;持續加強根技術攻堅,突破晶圓級鍵合、3D互連、晶圓級操作系統、生成式結構計算語言/編譯器等關鍵技術,實現從架構設計、物理實現到技術應用自主生態;多維推進根產業培育,以智能駕駛、具身智能、工業數字孿生、AI一體機等新興市場需求為牽引,通過“場景開放+體系創新+生態聚合”三位一體模式,以超限創新、超常規舉措突破“小院高墻”“遏制封鎖”,蹚出一條中國特色技術平權和產業可持續發展之路。
晶上生成式變結構計算可為我國打破算力芯片“制程工藝繭房”開辟新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。
今年以來,我國以DeepSeek為代表的大模型企業通過算法優化、有針對性的訓練和開源生態協作,在使用“縮水版”GPU芯片的情況下,將千億參數模型訓練成本壓縮至同類模型的1/10,走出了一條從粗放式算力堆砌向內生式效能提升的新路徑。
在全球驚嘆中國非對稱創新奇跡的同時,也要清醒看到,就人工智能(AI)技術和產業自主可持續發展而言,我國仍未擺脫對高端乃至“縮水版”智算芯片等物理器件的依賴。在可以預見的未來,外部環境可能更趨惡劣,封鎖遏制常態化、供應鏈不確定性等挑戰難以回避。我國亟需在智能算力層面實現“DeepSeek式突圍”,用超限創新解耦當前硬件算力提升與制程工藝進步強綁定的關系。
換言之,我國要在AI領域獲得與競爭對手可博弈的能力,不僅要在算法層面繼續革命、突破“算力繭房”,而且要在算法與物理層面深度融合上實現換道超車,破解“制程工藝繭房”。以生成式變結構計算、軟件定義晶上系統(Software defined System on Wafer,SDSoW)為主要內容的晶上生成式體系架構,為解決算法模型與算力載體失配難題、增強軟硬件協同算力可持續發展提供了新的技術路徑。
讓計算架構的“鞋”適應算法的“腳”
先進的芯片制程工藝能夠提供更高的晶體管密度,提升芯片單位面積計算能力,為大模型訓練和推理提供更強大的計算資源支持。然而,基于還原論的工程設計范式,芯片制程工藝艱辛迭代獲得的物理算力提升,很難被大規模分布式物理系統上運行的軟件算法有效利用。芯片峰值計算能力與算法系統性收益存在結構性錯位,加之分布式系統在技術體制上受“大規模、低時延、高帶寬”不可能三角問題制約,靠簡單堆砌千張、萬張乃至十萬張以上GPU卡的方式,難以滿足“規模定律-Scaling low”驅動的大模型訓練之非線性算力增長需求。
簡而言之,由于存算分離體制的馮·諾依曼計算架構,硬件系統設計(如芯片制程、內存帶寬、并發單元等)與算法模型的運算特征(如計算密度、數據流模式、精度需求等)之間存在系統性錯位。即便芯片制程工藝有所進步,帶來了性能增益,也會由于“逐級插損”的系統工程范式大打折扣。
突破“制程工藝繭房”,在更高維度上尋求問題的解空間,需要變革傳統剛性計算架構及技術物理實現范式。
近80年來,傳統計算架構一直沿用運算器、控制器、內存儲器、輸入輸出設備幾大件組成的馮·諾依曼計算架構。無論是復雜的AI算法,還是簡單的數據處理任務,都被“硬塞”進剛性的計算架構之中,奢望“一勞永逸”地處理千變萬化的應用。這就好比不管你腳多大,都必須穿37碼的鞋才能走路。然而,鞋不合腳就走不快:小腳穿大鞋會絆腳;大腳穿小鞋則會感到疼,結局往往是“削足適履”。
化解剛性架構算力與多樣化算法間結構性矛盾,需要借助物理學增維求解法則,導入自適應計算架構新機理。
2009年,受“自然界偽裝大師”擬態章魚啟發,中國科學家在世界上首次提出領域專用軟硬件協同變結構計算——擬態計算。如同擬態章魚,可“隨機應變”地隱匿在沙質海底或珊瑚礁等環境之中,擬態計算能讓“鞋子”更好地適配穿著它走路的“腳板”。
2018年,計算機體系結構大師、圖靈獎得主大衛·帕特森和約翰·軒尼詩預言,基于軟硬件協同計算語言的領域專用軟硬件協同計算架構,將成為今后十年計算機體系架構黃金發展期的主流發展方向之一。前不久,特斯拉Dojo超算公布了其計算范式變革的解決方案,提出硬件架構像變形金剛般隨任務變形,實現從“算法適應硬件”到“算法定義硬件”的范式轉換。
用二流零部件構建一流系統
生成式變結構計算的核心在于按算法需求動態重構計算架構,要求算力的硬件載體能夠實現以軟件驅動物理結構變化,大幅度提升特定計算結構對特定算法的執行效能。SDSoW就是要推動計算架構從“剛性流水線”向“軟件可塑形”躍遷,打通生成式變結構計算從理論到技術物理實現的閉環,使得基于二流器件或部件構建一流系統成為可能。
具體來說,SDSoW具備五大能力。
一是系統破局能力。SDSoW擺脫“核心器件決定論”思維,改變“芯粒、芯片、模組、機匣、機架、系統”的逐級堆砌、逐級插損式工程技術路線,通過晶圓級異構集成實現功能解構—晶上重組,達成功能等價、系統最優的目標,將制程工藝短板通過系統工程方法轉化為非主要矛盾。
二是整體增效能力。借助晶圓級高密度互連、超短距離、異質異構封裝,獲得高帶寬、低延遲、低功耗的系統增益,SDSoW系統的帶寬可提升一個數量級,時延可縮小一個數量級,功耗可降低一個數量級,系統效能可提升三個量級。
三是通專融合能力。基于晶圓級系統硬件可編程/重定義架構,可通過軟件實時配置或由AI大模型生成SDSoW功能和性能。在同一物理載體上,能根據不同應用需求或使用場景,實現“一平臺、多樣性”生成式變結構計算,既可滿足專用場景特殊算力需求,又能兼顧領域內相對靈活的通用算力要求。
四是開源協同能力。通過建立SDSoW開源社區,發布基礎互連協議、動態控制器及生成式變結構計算工具鏈等,SDSoW可構建“中國引領、全球參與”的生態環境,以開放破壟斷,形成相對Chiplet(小芯片)路線的比較優勢。
五是內生安全能力。SDSoW可從源頭上應對開放生態帶來的新域新質安全挑戰,通過引入內生安全架構實現開放可控,即便供應鏈欠安全,仍能保證開放條件下該系統具有“開箱即用、默認安全”的網絡彈性。
總之,晶上生成式變結構計算可為我國打破算力芯片“制程工藝繭房”開辟新路徑,走出一條用“三流材料、二流工藝”達成“一流能力”的系統工程級創新路線。通過應用與設計、算法與算力的垂直整合,解耦當前我國算力基礎設施產品對芯片先進制程工藝的強依賴關系,最大程度獲取體系結構與工藝進步的綜合增益。晶上生成式變結構計算也能為全球智算普惠提供中國方案。
基于晶圓級集成/封裝的生成式變結構計算,開辟了算法架構突破與物理載體革命、算法工程實現與計算范式創新深度耦合的新方向。目前,應盡快推動根理論突破,重點攻關晶上熱力學、異構集成理論、可重構架構數學描述等底層理論;持續加強根技術攻堅,突破晶圓級鍵合、3D互連、晶圓級操作系統、生成式結構計算語言/編譯器等關鍵技術,實現從架構設計、物理實現到技術應用自主生態;多維推進根產業培育,以智能駕駛、具身智能、工業數字孿生、AI一體機等新興市場需求為牽引,通過“場景開放+體系創新+生態聚合”三位一體模式,以超限創新、超常規舉措突破“小院高墻”“遏制封鎖”,蹚出一條中國特色技術平權和產業可持續發展之路。
本文鏈接:http://m.020gz.com.cn/news-2-1526-0.html中國智算如何實現“DeepSeek式突圍”
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕