“忙不過來了?!睆拇汗?jié)到元宵,AI芯片和算力廠商的工程師們沒有停過一刻忙碌。
奔忙的背后是為了一條名為DeepSeek的“鲇魚”,其低算力、高性能、開源等特性,使原本卡在算力“瓶頸”中的國產(chǎn)AI再一次拉滿想象力。
從大年初四到大年初十,十多家國產(chǎn)AI芯片和算力企業(yè)相繼加入DeepSeek“朋友圈”,彼時工程師們忙的是DeepSeek模型的適配和服務上架;而如今,要問這些企業(yè)在忙什么,得到的回復可能會很統(tǒng)一——部署。
據(jù)了解,目前行業(yè)正從DeepSeek的適配過渡向部署和應用,企業(yè)一方面迎來大量用戶咨詢,全力響應用戶需求,另一方面也正在打造DeepSeek版智算一體機,加速AI應用落地?!癉eepSeek真正能成為生產(chǎn)力工具、滿足應用落地需求的大模型,可以預期,2025年大模型的應用落地會爆發(fā)起來?!睒I(yè)內人士稱。
過去兩年多,ChatGPT帶飛了算力產(chǎn)業(yè),并將英偉達送上“國王寶座”。國產(chǎn)算力廠們苦尋出路。如今,DeepSeek鑿開了一個口子,天光已現(xiàn),但國產(chǎn)算力能否一飛沖天,還有待考驗。
有業(yè)內人士分析,DeepSeek帶來推理算力需求激增,行業(yè)可能迎來新一輪的洗牌,未來或是性價比之爭。
2月13日,DeepSeek概念股午后再度拉升走高,宏景科技20cm漲停,優(yōu)刻得(688158.SH)、弘信電子(300657.SZ)、并行科技(839493.BJ)漲超10%。
圖源:圖蟲創(chuàng)意
緊急“適配”
事實上,國產(chǎn)算力廠商的“適配潮”仍在繼續(xù)。
例如,早在2月4日,華為就宣布聯(lián)合硅基流動首發(fā)并上線基于華為云昇騰云服務的DeepSeekR1/V3推理服務。但直到2月12日,華為云才再次發(fā)文宣布,DeepSeek V3/R1滿血版上線。
截至目前,雖已有超15家芯片廠商適配了DeepSeek模型,但據(jù)時代財經(jīng)不完全統(tǒng)計,明確宣布適配DeepSeek R1及V3原版模型的不到一半。
圖源:時代財經(jīng)不完全統(tǒng)計梳理
多數(shù)企業(yè)宣稱能在“幾小時內”“一天內”可以快速完成適配的,但大部分僅是DeepSeek R1的系列蒸餾模型,而原版或稱“滿血版”的模型適配仍在進行中。
云天勵飛(688343.SH)副總裁、芯片業(yè)務線總經(jīng)理李愛軍告訴時代財經(jīng),在適配上線過程中,DeepSeek的模型可分為兩類,其一是基于DeepSeek R1蒸餾了一些參數(shù)小的模型,包含1.5B、7B、14B以及70B等大模型,這些蒸餾模型的原始模型是通義千問和LLAMA,那么原本能夠支持通義千問和LLAMA模型的平臺,基本上就能適配這些DeepSeek的蒸餾模型,這一塊的工作量相對較小,企業(yè)一般花費一周左右就能適配完成。
另一類則是DeepSeek V3和DeepSeek R1的原版模型,這是DeepSeek自研的原生態(tài)MOE大模型,其參數(shù)量達到了671B,里面囊括了MLA等新的算子,考驗著芯片適應超大規(guī)模MOE架構、支持新型算子、稀疏MoE模型的執(zhí)行效率等的能力。
而其中最大的難點在于模型本身的參數(shù)量大?!澳壳?,國產(chǎn)HBM(高帶寬存儲器)芯片的容量不大,在用于推理的人工智能計算場景中,16GB、32GB乃至64GB的HBM容量已經(jīng)被認為是較大的配置了。但即使是使用64GB的芯片來運行671B參數(shù)的大模型,要把參數(shù)加載到芯片中,也至少需要11張×64GB的芯片才能勉強放下這個模型。這也意味著單卡無法解決問題,牽涉到卡與卡之間的互聯(lián)能力和效率。”李愛軍談到,因此,適配的時長取決于各家的基礎?;A好、投入大的,一到兩周就能完成適配,技術次于此的,可能在兩三周左右能夠適配完,或者更長時間,有的甚至無法適配。
昆侖芯科技也表示,理論上,各類大模型的常規(guī)模型、常規(guī)組網(wǎng)能直接跑通,然而難免會出現(xiàn)特殊算子、特殊規(guī)模,需要投入人力進行針對性調試。跑通只是基礎,后期涉及后端硬件不同、算子實現(xiàn)不同、對應軟件版本不同等因素,精度對齊、性能對齊也都需要人力介入進行針對性適配。
不過,也有行業(yè)人士向時代財經(jīng)透露,由于DeepSeek本身開源,適配過程中并不需要授權,盡管目前眾多平臺都在適配該模型,但這種適配可能并非真正意義上的“接入”。“真正意義上的接入是DeepSeek利用某個智算中心提供云服務,但是目前真正和DeepSeek達成這種合作的廠商非常少,可能只有一兩家?!?span style="display:none">Mh9即熱新聞——關注每天科技社會生活新變化gihot.com
部署和落地
適配之外,更關鍵的是部署。
近期,并行科技(839493.BJ)、壁仞科技、摩爾線程和昆侖芯科技等多家企業(yè)均向時代財經(jīng)透露,他們正在忙于為客戶做DeepSeek模型的部署。
“部署是大模型轉化為生產(chǎn)力的必要步驟?!敝写嫠惆雽w董事長陳巍解釋,部署相當于在用戶的生產(chǎn)環(huán)境里進行模型的安裝設置和做與客戶成產(chǎn)環(huán)境的連接。
時代財經(jīng)在某國產(chǎn)算力運營商的產(chǎn)品交流群中觀察到,不少用戶在詢問如何導入和設置API、如何集成相關服務,還有人咨詢DeepSeek模型接入后為何運行速度較慢等。
“行業(yè)確實正處于模型應用落地的關鍵階段。”2月12日,摩爾線程相關技術負責人向時代財經(jīng)表示。
時代財經(jīng)了解到,在近期行業(yè)密集適配DeepSeek系列模型后,不少廠商開始尋求落地應用,智算一體機這種硬件部署形式于是浮出了水面。
摩爾線程表示,公司正與雪浪云聯(lián)合打造了“軟硬件緊耦合”大模型訓推一體機——雪浪MindCenter X100,就已成功部署DeepSeek-R1-Distill-Qwen(適配1.5B、7B、14B、32B)推理服務。
“一體機生意會是今年的大機會,離線需求太多了。”有業(yè)內人士感慨道。
“前段時間大家都在適配,適配了之后呢?我們希望能夠在一些領域能夠實現(xiàn)真正的應用。”壁仞科技相關負責人告訴時代財經(jīng),壁仞科技聯(lián)合中興通訊、浙江大學上海高等研究院和一驀科技推出了智海AI教育一體機。該產(chǎn)品實現(xiàn)了國產(chǎn)算力與DeepSeek的適配及知識課程、實訓課題、智能體等教學工具的設計開發(fā),并形成了包含AI通識課、專業(yè)課、實踐實訓在內的一體化解決方案。
2月11日,中國電信(601728.SH)和中國移動(600941.SH)兩大電信運營商也分別推出了天翼云和移動云智算一體機-DeepSeek版。
據(jù)移動云官方消息,智算一體機簡單來說就是基于移動云邊緣智能小站算力底座打造的小型專屬云,專門為企業(yè)量身定制。它復用了邊緣智能小站的產(chǎn)品技術,還有統(tǒng)一運維、快速交付這些服務,解決了企業(yè)在 AI 應用落地時對數(shù)據(jù)安全的擔憂,還能提高AI應用開發(fā)的效率。
圖源:移動云官方公眾號
此外,京東云、聯(lián)想(0992.HK)、科華數(shù)據(jù)(002335.SZ)、浪潮云、中國長城(000066.SZ)、天融信(002212.SZ)等企業(yè)均官宣發(fā)布了DeepSeek智算一體機。
行業(yè)或迎洗牌?
DeepSeek火了,順帶捧紅了國產(chǎn)算力,但也帶出了一系列疑問。DeepSeek時代需要怎樣的算力?DeepSeek又將如何改變如今算力市場的戰(zhàn)局?
此前,DeepSeek似乎已經(jīng)出現(xiàn)算力吃緊的現(xiàn)象。2月6日,DeepSeek暫停API(接口)充值服務,DeepSeek官方解釋為服務器資源緊張。2月9日,DeepSeek調整收費標準,每百萬輸入tokens的價格為0.5元(針對緩存命中情況)和2元(針對緩存未命中情況),而輸出tokens的價格則定為每百萬8元。在優(yōu)惠期內,DeepSeek-V3對于輸入tokens的收費是每百萬0.1元(緩存命中)和1元(緩存未命中),輸出tokens則是每百萬2元。
圖源:圖蟲創(chuàng)意
李愛軍認為,在DeepSeek模型的性能足夠強,而其未來很可能繼續(xù)延續(xù)開源的策略的情況下,企業(yè)能夠直接使用它進行應用落地,而非自己再重新訓練出一個基礎模型。由此,未來推理側的算力需求將大規(guī)模爆發(fā)。
他表示,在模型訓練環(huán)節(jié)追求的是極致的性能,哪怕GPU價格非常高,企業(yè)也不吝購買。一旦到了推理環(huán)節(jié),行業(yè)的關注點就會變成性價比,因為推理時時刻刻都要使用,GPU芯片在推理時代性價比不突出,專門針對推理場景設計的ASIC芯片會大有機會。
“訓練芯片和推理芯片在思路邏輯上有較大區(qū)別,訓練芯片多選擇兼容CUDA架構,走的是GPU架構,推理芯片如云天勵飛等,多走的是神經(jīng)網(wǎng)絡處理架構。從訓練芯片向推理芯片的轉換,市場對芯片的要求、商業(yè)模式會有較大的變化?!崩類圮娡茰y,未來芯片行業(yè)可能將面臨新一輪洗牌。
摩爾線程相關技術負責人則認為,從訓練側來看,Scaling Law規(guī)模定律仍然有效,模型迭代會加快,對于國產(chǎn)優(yōu)質訓練算力的需求不會降低。長期看,模型參數(shù)規(guī)模擴大(如GPT-5)和訓練方法革新(如MoE)仍會推動訓練算力需求增長;從推理側來看,隨著生成式AI應用落地,落地應用(如AIGC、智能體、垂直行業(yè)模型)將帶來海量碎片化推理需求,市場規(guī)模有可能超過訓練。
該技術負責人表示,短期內,國產(chǎn)GPU廠商應保持訓練芯片的持續(xù)迭代,比如最好支持FP8,確保技術不脫節(jié),同時通過推理芯片快速切入商業(yè)化場景。從長期上,瞄準“訓推一體”架構,通過統(tǒng)一計算平臺降低客戶切換成本,最終在自主生態(tài)中實現(xiàn)訓練與推理的協(xié)同增長。
至于DeepSeek的沖擊波能否影響到大洋彼岸的英偉達,陳巍表示,沒有看到deepseek對英偉達的直接利空,但如果DeepSeek引發(fā)更大范圍更嚴格的禁運,那么可能使得英偉達GPU銷量減少。
“事實上,每一代模型的進步,都意味著同等算力下模型精度更改。在以往模型的進步并未引起英偉達市值下跌。對于deepseek這類大模型,由于參數(shù)量巨大,需要更低的存力成本。降本增效是擺在各廠家面前的關鍵?!标愇≌f道。
本文鏈接:http://m.020gz.com.cn/news-2-524-0.htmlDeepSeek打響頭炮!國產(chǎn)芯片開打輔助:卷適配、卷落地、卷性價比
聲明:本網(wǎng)頁內容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕