DeepSeek持續開源推動產業變革
近日,DeepSeek在知乎上發表《DeepSeek-V3/R1推理系統概覽》文章,表明其理論上一天的成本利潤率可達545%。
業內人士表示,DeepSeek將新技術完全開源,源代碼在GitHub上公開,任何開發者都可自由使用和改進,打破了前沿技術被大型科技公司壟斷的局面,為整個行業注入新活力,也為行業建立了更健康的技術共享機制,促進知識自由流動和技術迭代,因此產業變革有望加速,代碼公布助力應用端加速落地。
事件驅動 DeepSeek公布模型推理成本利潤細節
DeepSeek于2025年3月1日通過知乎平臺首次披露其模型推理服務的成本結構,引發行業震動。根據公開數據,在采用H800GPU集群、動態資源調度(白天全節點推理、夜間釋放節點用于訓練)的機制下,其日均算力成本為87072美元。若按R1模型的定價標準計算,理論日收入可達562027美元,對應545%的成本利潤率,相當于每日凈賺約346萬元人民幣。這一數據刷新了行業對AI服務盈利能力的認知,MenloVentures投資人Deedy推算其理論年收入可達2億美元,估值應超百億美元。
在知乎的官方文章中,DeepSeek-V3/R1推理系統的優化目標是:更大的吞吐,更低的延遲。由于DeepSeek-V3/R1的專家數量眾多,并且每層256個專家中僅激活其中8個。模型的高度稀疏性決定了我們必須采用很大的overalbatchsize,才能給每個專家提供足夠的expertbatchsize,從而實現更大的吞吐、更低的延時。為了實現這兩個目標,DeepSeek通過使用大規模跨節點專家并行,即Prefil:路由專家EP32、MLA和共享專家DP32,一個部署單元是4節點,32個冗余路由專家,每張卡9個路由專家和1個共享專家。
作為對比,Nvdia官方有兩個可以參考的數據。1月30日,在官方blog中透露,在H200節點上可以實現3872t/s的峰值輸出吞吐;2月25日在x上公布FP4精度優化性能,H200節點峰值輸出吞吐優化到5899t/s,B200節點峰值輸出吞吐則高達21088t/s。DeepSeek用閹割版的H800實現了14.8kt/s的輸出吞吐(相較H200大約下降20%—25%的性能),是NvdiaH200FP8性能的整整3.8倍。
行業現狀 人工智能產業變革有望加速
DeepSeek在2月24日至28日進行了為期5天的開源周“技術轟炸”,開源了5大代碼庫,覆蓋訓練、推理、通信、負載均衡以及數據加速的全鏈路,驚喜連連。
開源周第一天發布FlashMLA,一款專為Hopper架構打造的高效MLA解碼器,可高效處理變長序列,優化內存管理,榨取GPU極致性能。開源周第二天發布DeepEP,聚焦通信資源利用,提升數據高效傳輸,是首個為MoE量身定制的靈活GPU資源控制通信庫。開源周的第三天,DeepSeek推出了支持稠密和MoE模型的FP8計算庫——DeepGEMM,核心邏輯僅約300行代碼直面AI計算中最頻繁的矩陣乘法,可為V3/R1的訓練和推理提供強大支持。開源周第四天,DeepSeek推出了一系列優化并行策略,包括DualPipe——一種用于V3/R1模型訓練中實現計算與通信重疊的雙向流水線并行算法;以及E-PLB——一個針對V3/R1模型的專家并行負載均衡工具,并深入分析了V3/R1模型中的計算與通信重疊機制。開源周的最后一天,DeepSeek發布了3FS并行文件系統,旨在應對人工智能訓練和推理工作負載帶來的挑戰。該系統利用現代固態硬盤(SSDs)和RDMA網絡,提供一個共享存儲層,從而簡化分布式應用程序的開發,并加速DeepSeek平臺上所有數據訪問操作。
DeepSeek開源周上接連不斷的技術發布,彰顯了團隊的極客精神和開源理念。將新技術完全開源,源代碼在GitHub上公開,任何開發者都可自由使用和改進,打破了前沿技術被大型科技公司壟斷的局面,為整個行業注入新活力,也為行業建立了更健康的技術共享機制,促進知識自由流動和技術迭代,因此產業變革有望加速。
投資機會 DeepSeek代碼公布助力應用端落地
今年以來,自從包括豆包、DeepSeek在內的國產大模型突破以來,全球AI產業的共振正在加速,產業趨勢不斷發酵。
中泰證券認為,DeepSeek的驚艷收益有望促進應用爆發,建議關注金山辦公、同花順、合合信息、螢石網絡等;應用爆發帶來的龐大推理需求,以及未來圖像+聲音+視頻的全面智能體會支撐起更多業務場景,大型云廠具備規模、infra優勢,能夠以更低的成本支持高并發的業務需求。海外高性能芯片供應受限,國產算力結合算法架構創新有望彎道超車。建議關注海光信息、中科曙光、神州數碼等;通過將結構化和非結構化數據集成在高性能、分布式的命名空間,實現實時分析能力,傳統數據庫有望升級為新型數據基礎設施,建議關注達夢數據、星環科技、海量數據等。
華創證券表示,DeepSeek代碼公布助力應用端加速落地,建議關注以下標的:辦公關注金山辦公、合合信息、福昕軟件;金融關注京北方、宇信科技、天陽科技、神州信息、同花順、恒生電子、新致軟件;大模型關注科大訊飛、三六零;工業關注中控技術、索辰科技、鼎捷數智;端側、穿戴、玩具關注螢石網絡、云天勵飛、中科創達、漢王科技;醫療關注潤達醫療、衛寧健康;法律關注金橋信息、華宇軟件、通達海;郵箱關注彩訊股份;教育關注佳發教育、鷗瑪軟件、新開普;電商關注焦點科技;安全關注深信服、永信至誠;部署關注卓易信息、優刻得、星環科技、網宿科技、漢得信息;算力關注海光信息、寒武紀、景嘉微等。 宗禾
- 免責聲明:本文內容與數據僅供參考,不構成投資建議。據此操作,風險自擔。
- 版權聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務熱線:025-86256144
