飛象網(wǎng)訊(源初/文)第二十一屆中國國際半導(dǎo)體博覽會(huì)(IC China 2024)在北京國家會(huì)議中心開幕。會(huì)上,當(dāng)嘉賓們談到半導(dǎo)體行業(yè)的發(fā)展時(shí),AI已經(jīng)成為了一個(gè)繞不開的話題,它因半導(dǎo)體而獲得了算力,算力的猛增又拉動(dòng)了新的需求。然而,面對(duì)復(fù)雜的行業(yè)外因素,如何尋找突破口也同樣是備受關(guān)注的話題。
AI與半導(dǎo)體互為推動(dòng)
AI正在引發(fā)新一輪科技革命,從語言模型、多模態(tài)模型的單體智能,到能夠使用思維鏈(CoT, Chain of Thinking)進(jìn)行推理的OpenAlo1,再到使用工具完成復(fù)雜任務(wù)的智能體(AIAgent),AI基礎(chǔ)能力正在快速演進(jìn)。AlI將成為智能時(shí)代的基礎(chǔ)設(shè)施,融入生產(chǎn)和生活的每個(gè)環(huán)節(jié),重塑千行百業(yè),引發(fā)新一輪科技和產(chǎn)業(yè)革命。
AI與半導(dǎo)體已經(jīng)形成了一種相互促進(jìn)的關(guān)系,共同推動(dòng)下一輪技術(shù)超級(jí)周期的到來。
首先,半導(dǎo)體技術(shù)為更多的應(yīng)用場(chǎng)景提供了支持,包括人工智能(AI)、物聯(lián)網(wǎng)(IoT)、5G通信和數(shù)據(jù)中心。這些應(yīng)用反過來又產(chǎn)生了海量數(shù)據(jù),為AI的深度學(xué)習(xí)模型提供了驅(qū)動(dòng)力。一項(xiàng)基于亞洲的數(shù)據(jù)顯示,自2019年以來,AI、物聯(lián)網(wǎng)和汽車等領(lǐng)域的數(shù)據(jù)量呈現(xiàn)出71%的年均復(fù)合增長(zhǎng)率,反映出技術(shù)快速演進(jìn)和廣泛的市場(chǎng)需求。
此外,大數(shù)據(jù)正被稱為“新的石油”,推動(dòng)了AI算法和半導(dǎo)體行業(yè)的發(fā)展,特別是在AI加速器、高帶寬內(nèi)存(HBM)、存儲(chǔ)和網(wǎng)絡(luò)等關(guān)鍵領(lǐng)域。隨著AI技術(shù)的進(jìn)步和大規(guī)模應(yīng)用,半導(dǎo)體將進(jìn)一步推動(dòng)這些技術(shù)落地,形成互為推動(dòng)的良性循環(huán)。
巴西半導(dǎo)體行業(yè)協(xié)會(huì)機(jī)構(gòu)主任羅薩娜·卡賽斯對(duì)于兩者的話題也表示稱,到2030年,僅AI一項(xiàng)預(yù)計(jì)將為全球經(jīng)濟(jì)貢獻(xiàn)超過15萬億美元。半導(dǎo)體行業(yè)持續(xù)突破創(chuàng)新邊界,研發(fā)更新、更強(qiáng)大的AI加速器。AI具備變革半導(dǎo)體設(shè)計(jì)和制造的能力。
與此同時(shí),新興技術(shù)的能耗問題引發(fā)關(guān)注。黃仁勛曾提到:“沒有任何物理定律可以阻止AI數(shù)據(jù)中心擴(kuò)展到一百萬芯片,但其能源供應(yīng)可能需要核電站!盇I與人腦比較而言,人類大腦的功耗不超過25W,而英偉達(dá)8卡DGXB200功耗達(dá)14.3kW?紤]冷卻系統(tǒng)耗電量,百萬卡智算中心能耗將高達(dá)3GW。會(huì)上,有位嘉賓還做了這樣的比較,在京滬高鐵線上的每位乘客耗電量約為30度電,而預(yù)計(jì)全球數(shù)據(jù)中心在2024年的總耗電量將達(dá)7000億度。
AIDC在支持AI技術(shù)高速發(fā)展的過程中,逐漸呈現(xiàn)出高頻寬、大容量、大能耗三大趨勢(shì)。首先,AI模型的發(fā)展需要處理海量數(shù)據(jù),這對(duì)數(shù)據(jù)中心的計(jì)算與傳輸能力提出了更高要求;其次,AI的快速進(jìn)步導(dǎo)致模型和數(shù)據(jù)規(guī)模顯著擴(kuò)張,推動(dòng)了存儲(chǔ)和處理能力的躍升。最后,隨著算力和存儲(chǔ)需求的快速增長(zhǎng),AIDC的能耗問題愈發(fā)突出,已成為行業(yè)的重要挑戰(zhàn)。
面對(duì)市場(chǎng)的機(jī)遇與挑戰(zhàn),尋找行業(yè)突破口自然也就成為大家關(guān)注的話題。
行業(yè)突破口在何方
對(duì)于國內(nèi)產(chǎn)業(yè)而言,會(huì)上有嘉賓表示,應(yīng)當(dāng)重視系統(tǒng)和芯片架構(gòu)創(chuàng)新,縮小技術(shù)差距。應(yīng)當(dāng)積極開展芯片架構(gòu)創(chuàng)新,如采用3D堆疊/Chiplet/存算一體等新架構(gòu),努力縮小大算力芯片的技術(shù)代差。積極開展異構(gòu)大算力集群系統(tǒng)的架構(gòu)和任務(wù)調(diào)配等方面的優(yōu)化工作,努力縮小大算力集群系統(tǒng)的性能差距。
同時(shí),還要重視端側(cè)AI技術(shù)創(chuàng)新,端側(cè)AI擁有清晰的商業(yè)模式,更易實(shí)現(xiàn)規(guī)模化落地。其芯片對(duì)算力(如TOPS數(shù)量)和制造工藝(如7nm及以上工藝)的要求相對(duì)較低,從而降低了研發(fā)和生產(chǎn)成本,為更多企業(yè)參與創(chuàng)造了機(jī)會(huì)。此外,端側(cè)AI應(yīng)用場(chǎng)景多樣化,包括智能設(shè)備、車載終端和工業(yè)物聯(lián)網(wǎng)等領(lǐng)域,這些需求驅(qū)動(dòng)了端側(cè)AI的快速發(fā)展。面向半導(dǎo)體行業(yè),需要探索多核異構(gòu)計(jì)算架構(gòu),提升端側(cè)設(shè)備的算力效率與適配能力。開發(fā)兼容多種終端應(yīng)用的AI軟件堆棧,以及高效的端側(cè)芯片。端側(cè)AI的未來將以低成本、高效能和廣泛應(yīng)用為目標(biāo),推動(dòng)人工智能在終端設(shè)備上的深度集成與創(chuàng)新,構(gòu)建更加智能化的生活與產(chǎn)業(yè)生態(tài)。
面對(duì)先進(jìn)制程所帶來的成本與制造上的壓力,Chiplet正在成為一種毋庸置疑的發(fā)展趨勢(shì)。原有情況下,系統(tǒng)級(jí)芯片SoC(Systemona Chip)將不同功能元器件整合在單個(gè)芯片上,開發(fā)時(shí)間長(zhǎng)、良率低,且各功能模塊的納米制程必須相同,都得用5oC上要求最高模塊的制程,成本較高。
系統(tǒng)級(jí)封裝SiP(System in a Package)將多芯片異構(gòu)集成,開發(fā)時(shí)間較短、良率較高,部分可重復(fù)使用。一個(gè)系統(tǒng)中,芯片往往只占系統(tǒng)中器件數(shù)目的10%左右。如果把其他所有器件都集成在單一芯片上,可能會(huì)導(dǎo)致性能不佳,成本增加。
Chiplet對(duì)需要實(shí)現(xiàn)的復(fù)雜功能進(jìn)行分解,然后開發(fā)出多種具有單一特定功能的裸芯片,這些來自不同功能、不同工藝節(jié)點(diǎn)的裸芯片可相互進(jìn)行模塊化組裝,最終形成一個(gè)完整的芯片。這種方法實(shí)現(xiàn)了異質(zhì)集成,為芯片設(shè)計(jì)帶來了更大的靈活性和可擴(kuò)展性,有效提升了產(chǎn)品的功能性。例如圖上左邊的SOC上所有模塊都需要用同一制程(例如按CPU、GPU要求用7nm),整體成本較高,而右邊的Chiplet上各模塊分別采用了7nm、14nm、22nm、28nm等多種制程,整體成本較低。
Chiplet具備良率、成本、異構(gòu)計(jì)算等優(yōu)勢(shì),適用于復(fù)雜功能的定制化需求。由于Chiplet由多顆芯粒組成,單顆芯粒的面積較小,其良率高。直接設(shè)計(jì)一整塊SoC的面積較大,可能導(dǎo)致較低的良率,從而帶來高昂的成本。此外,Chiplet技術(shù)支持封裝內(nèi)部的異構(gòu)集成,可以根據(jù)模塊功能選擇芯片制程,針對(duì)特定功能模塊設(shè)計(jì)專用的高性能芯片,對(duì)于其他通用芯片粒采用成熟制程,從而降低成本。
DSA架構(gòu)為發(fā)展智能計(jì)算算力提供新途徑。當(dāng)前智算的發(fā)展對(duì)計(jì)算架構(gòu)提出了新的要求和挑戰(zhàn),包括更高的性能、更低的功耗、更強(qiáng)的并行計(jì)算能力和更好的安全保障能力等等。這些年軟件定制化已經(jīng)普遍采用,但硬件定制化仍有待于解決,基于RISC-V的DSA可能在這兩方面提供了一條新途徑。
RISC-V在設(shè)計(jì)思想中就包含了DSA的概念。為此,RISC-V架構(gòu)包含了模塊化和自定義擴(kuò)展指令集功能,并為擴(kuò)展指令集預(yù)留了很大的擴(kuò)展空間。這樣,用戶可以為某個(gè)新應(yīng)用或某個(gè)新算子,自定義一套擴(kuò)展指令集及其支持硬件模塊,容易構(gòu)成一個(gè)高效的DSA系統(tǒng)。
DSA面向特定領(lǐng)域,通過定制的架構(gòu)以更好地適應(yīng)需求,例如用于機(jī)器學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)處理器,用于圖形學(xué)、VR等的GPU,可編程網(wǎng)關(guān)和接口。DSA需融合硬件和軟件技術(shù),包括:更有效的并行算法,更有效的存儲(chǔ)帶寬利用,削減不必要的計(jì)算精度,采用面向領(lǐng)域的編程語言DSL。DSA可與面向領(lǐng)域的語言DSL相結(jié)合,如OpenGL、TensorFlow。發(fā)展DSA需要新的技術(shù)隊(duì)伍,他們了解并掌握垂直集成的一系列技術(shù),包括特定領(lǐng)域的應(yīng)用,適合該領(lǐng)域的DSL和相關(guān)的編譯技術(shù),架構(gòu)原理,實(shí)現(xiàn)技術(shù)等等。
AI與半導(dǎo)體正共同推動(dòng)全球科技與產(chǎn)業(yè)變革。AI對(duì)算力需求的增長(zhǎng)反向驅(qū)動(dòng)半導(dǎo)體技術(shù)創(chuàng)新,如Chiplet和DSA架構(gòu)降低成本并提升性能,同時(shí)端側(cè)AI以低功耗、高效能的特性成為商業(yè)化重點(diǎn)方向。未來,行業(yè)需聚焦芯片架構(gòu)優(yōu)化、異構(gòu)計(jì)算能力提升,以及開放標(biāo)準(zhǔn)與軟硬件協(xié)同,加速低功耗技術(shù)研發(fā),解決能耗瓶頸。在這一良性循環(huán)中,AI與半導(dǎo)體將共同引領(lǐng)智能時(shí)代的技術(shù)革命與產(chǎn)業(yè)升級(jí)。