在航空領(lǐng)域,有個(gè)說(shuō)法叫“力大磚飛”,往往用來(lái)形容某種戰(zhàn)斗機(jī)氣動(dòng)外形設(shè)計(jì)一般,依靠強(qiáng)大的發(fā)動(dòng)機(jī)推力獲得較好的飛行性能。
近日,馬斯克旗下人工智能企業(yè)xAI推出Grok 3系列大模型,稱其在數(shù)學(xué)、科學(xué)和編碼等領(lǐng)域擊敗了Open AI的GPT-4o,以及深度探索公司的DeepSeek V3等“前輩”。馬斯克稱Grok 3為“地球上最聰明的AI”。Grok 3在訓(xùn)練中使用了20萬(wàn)張高性能GPU,遠(yuǎn)超GPT-4的2.5萬(wàn)張和DeepSeek的2048張。有報(bào)道稱,Grok 3使用的算力是GPT-4的20倍、DeepSeek的263倍。
難道說(shuō),AI的發(fā)展趨勢(shì)將要呈現(xiàn)為“算力大”而“模型飛”嗎?
毫無(wú)疑問(wèn),算力是推動(dòng)AI發(fā)展最關(guān)鍵的推動(dòng)力之一。DeepSeek通過(guò)創(chuàng)新算法大幅節(jié)約算力令人驚艷,但算力的重要性不應(yīng)因此被貶低。2月初,美國(guó)蘭德智庫(kù)在評(píng)論中寫道,如果DeepSeek可以使用更多的芯片,它就可以訓(xùn)練出更強(qiáng)大的AI模型,更早地做出某些發(fā)現(xiàn)。
Grok 3使用了更復(fù)雜的推理模型,訓(xùn)練時(shí)長(zhǎng)達(dá)到2億GPU小時(shí),但訓(xùn)練卻只用了8個(gè)月,主要?dú)w功于其前所未有的算力支撐。更強(qiáng)的算力既能夠滿足更復(fù)雜模型、更大量數(shù)據(jù)的訓(xùn)練需求,又可以加快計(jì)算速度、縮短訓(xùn)練時(shí)間,促進(jìn)AI模型的快速迭代和進(jìn)步。
但是,AI的發(fā)展也不應(yīng)完全依靠算力,單純走“力大磚飛”的技術(shù)路線。
對(duì)Grok 3的一些對(duì)比測(cè)試發(fā)現(xiàn),算力優(yōu)勢(shì)似乎沒(méi)有帶來(lái)碾壓式的性能優(yōu)勢(shì)。2月19日,號(hào)稱“印度最大的數(shù)據(jù)科學(xué)社區(qū)”的Analytics Vidhya發(fā)表文章稱,對(duì)比使用Grok 3和DeepSeek-R1處理Python代碼編程等五個(gè)特定問(wèn)題時(shí)發(fā)現(xiàn),DeepSeek-R1對(duì)四個(gè)問(wèn)題的回答優(yōu)于Grok 3。無(wú)獨(dú)有偶,專門研究ChatGPT等AI工具使用技巧、網(wǎng)名“Alex Prompter”的X用戶也使用Grok 3、DeepSeek-R1和ChatGPT o3-mini處理五個(gè)特定問(wèn)題,結(jié)果Grok 3僅在兩個(gè)問(wèn)題中獲勝。
更值得關(guān)注的是,算力在推動(dòng)AI進(jìn)步的同時(shí),支撐算力的芯片產(chǎn)能和維持算力的能源消耗也開始遇到壁壘。AI發(fā)展趨勢(shì)研究機(jī)構(gòu)EpochAI統(tǒng)計(jì)發(fā)現(xiàn),2019年至今,用于AI模型訓(xùn)練的算力約每6個(gè)月翻一番,每年增長(zhǎng)4—5倍,而同期英偉達(dá)出貨的GPU芯片計(jì)算能力10個(gè)月才能翻一番。今年1月,蘭德智庫(kù)預(yù)測(cè),到2028年,單個(gè)數(shù)據(jù)中心AI訓(xùn)練耗電量可能達(dá)到1吉瓦,需要一座核電站供電;到2030年,則需要8座核電站。芯片產(chǎn)能和電力需求正在成為制約算力提升的瓶頸問(wèn)題。
AI發(fā)展的歷史也表明,即使在算力蓬勃發(fā)展的近10年,算法的貢獻(xiàn)也功不可沒(méi)。EpochAI和MIT FutureTech的聯(lián)合研究認(rèn)為,從2014年到2023年,在對(duì)AI性能提升的貢獻(xiàn)中,算力約占65%、算法占35%,這還是DeepSeek發(fā)布前的結(jié)果。研究還發(fā)現(xiàn),算法的改進(jìn)通常具有不可預(yù)測(cè)性和間歇性,有可能長(zhǎng)期研究沒(méi)有結(jié)果,也有可能一個(gè)靈感帶來(lái)AI性能的大幅提升。
去年8月,EpochAI發(fā)表報(bào)告指出,在芯片、電力等制約下,到2030年,美國(guó)的AI模型算力仍有潛力提升10000倍,但需要數(shù)千億美元的投入。巧合的是,特朗普上臺(tái)伊始就宣布了“星際之門”計(jì)劃,投資5000億美元建設(shè)人工智能基礎(chǔ)設(shè)施。
因此,在一段時(shí)間內(nèi),算力堆砌不會(huì)停止,也很可能仍是AI發(fā)展的重要引擎,絕不能忽視。但是,DeepSeek的橫空出世也足以告訴人們,在AI算法領(lǐng)域,同樣需要加強(qiáng)投入,而且要堅(jiān)持不懈地摸索,哪怕經(jīng)歷漫長(zhǎng)的沉默。
在航空領(lǐng)域,有個(gè)說(shuō)法叫“力大磚飛”,往往用來(lái)形容某種戰(zhàn)斗機(jī)氣動(dòng)外形設(shè)計(jì)一般,依靠強(qiáng)大的發(fā)動(dòng)機(jī)推力獲得較好的飛行性能。
近日,馬斯克旗下人工智能企業(yè)xAI推出Grok 3系列大模型,稱其在數(shù)學(xué)、科學(xué)和編碼等領(lǐng)域擊敗了Open AI的GPT-4o,以及深度探索公司的DeepSeek V3等“前輩”。馬斯克稱Grok 3為“地球上最聰明的AI”。Grok 3在訓(xùn)練中使用了20萬(wàn)張高性能GPU,遠(yuǎn)超GPT-4的2.5萬(wàn)張和DeepSeek的2048張。有報(bào)道稱,Grok 3使用的算力是GPT-4的20倍、DeepSeek的263倍。
難道說(shuō),AI的發(fā)展趨勢(shì)將要呈現(xiàn)為“算力大”而“模型飛”嗎?
毫無(wú)疑問(wèn),算力是推動(dòng)AI發(fā)展最關(guān)鍵的推動(dòng)力之一。DeepSeek通過(guò)創(chuàng)新算法大幅節(jié)約算力令人驚艷,但算力的重要性不應(yīng)因此被貶低。2月初,美國(guó)蘭德智庫(kù)在評(píng)論中寫道,如果DeepSeek可以使用更多的芯片,它就可以訓(xùn)練出更強(qiáng)大的AI模型,更早地做出某些發(fā)現(xiàn)。
Grok 3使用了更復(fù)雜的推理模型,訓(xùn)練時(shí)長(zhǎng)達(dá)到2億GPU小時(shí),但訓(xùn)練卻只用了8個(gè)月,主要?dú)w功于其前所未有的算力支撐。更強(qiáng)的算力既能夠滿足更復(fù)雜模型、更大量數(shù)據(jù)的訓(xùn)練需求,又可以加快計(jì)算速度、縮短訓(xùn)練時(shí)間,促進(jìn)AI模型的快速迭代和進(jìn)步。
但是,AI的發(fā)展也不應(yīng)完全依靠算力,單純走“力大磚飛”的技術(shù)路線。
對(duì)Grok 3的一些對(duì)比測(cè)試發(fā)現(xiàn),算力優(yōu)勢(shì)似乎沒(méi)有帶來(lái)碾壓式的性能優(yōu)勢(shì)。2月19日,號(hào)稱“印度最大的數(shù)據(jù)科學(xué)社區(qū)”的Analytics Vidhya發(fā)表文章稱,對(duì)比使用Grok 3和DeepSeek-R1處理Python代碼編程等五個(gè)特定問(wèn)題時(shí)發(fā)現(xiàn),DeepSeek-R1對(duì)四個(gè)問(wèn)題的回答優(yōu)于Grok 3。無(wú)獨(dú)有偶,專門研究ChatGPT等AI工具使用技巧、網(wǎng)名“Alex Prompter”的X用戶也使用Grok 3、DeepSeek-R1和ChatGPT o3-mini處理五個(gè)特定問(wèn)題,結(jié)果Grok 3僅在兩個(gè)問(wèn)題中獲勝。
更值得關(guān)注的是,算力在推動(dòng)AI進(jìn)步的同時(shí),支撐算力的芯片產(chǎn)能和維持算力的能源消耗也開始遇到壁壘。AI發(fā)展趨勢(shì)研究機(jī)構(gòu)EpochAI統(tǒng)計(jì)發(fā)現(xiàn),2019年至今,用于AI模型訓(xùn)練的算力約每6個(gè)月翻一番,每年增長(zhǎng)4—5倍,而同期英偉達(dá)出貨的GPU芯片計(jì)算能力10個(gè)月才能翻一番。今年1月,蘭德智庫(kù)預(yù)測(cè),到2028年,單個(gè)數(shù)據(jù)中心AI訓(xùn)練耗電量可能達(dá)到1吉瓦,需要一座核電站供電;到2030年,則需要8座核電站。芯片產(chǎn)能和電力需求正在成為制約算力提升的瓶頸問(wèn)題。
AI發(fā)展的歷史也表明,即使在算力蓬勃發(fā)展的近10年,算法的貢獻(xiàn)也功不可沒(méi)。EpochAI和MIT FutureTech的聯(lián)合研究認(rèn)為,從2014年到2023年,在對(duì)AI性能提升的貢獻(xiàn)中,算力約占65%、算法占35%,這還是DeepSeek發(fā)布前的結(jié)果。研究還發(fā)現(xiàn),算法的改進(jìn)通常具有不可預(yù)測(cè)性和間歇性,有可能長(zhǎng)期研究沒(méi)有結(jié)果,也有可能一個(gè)靈感帶來(lái)AI性能的大幅提升。
去年8月,EpochAI發(fā)表報(bào)告指出,在芯片、電力等制約下,到2030年,美國(guó)的AI模型算力仍有潛力提升10000倍,但需要數(shù)千億美元的投入。巧合的是,特朗普上臺(tái)伊始就宣布了“星際之門”計(jì)劃,投資5000億美元建設(shè)人工智能基礎(chǔ)設(shè)施。
因此,在一段時(shí)間內(nèi),算力堆砌不會(huì)停止,也很可能仍是AI發(fā)展的重要引擎,絕不能忽視。但是,DeepSeek的橫空出世也足以告訴人們,在AI算法領(lǐng)域,同樣需要加強(qiáng)投入,而且要堅(jiān)持不懈地摸索,哪怕經(jīng)歷漫長(zhǎng)的沉默。
本文鏈接:http://m.020gz.com.cn/news-2-793-0.htmlAI發(fā)展不能只靠“力大磚飛”
聲明:本網(wǎng)頁(yè)內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
點(diǎn)擊右上角微信好友
朋友圈
點(diǎn)擊瀏覽器下方“”分享微信好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕
點(diǎn)擊右上角QQ
點(diǎn)擊瀏覽器下方“”分享QQ好友Safari瀏覽器請(qǐng)點(diǎn)擊“
”按鈕