每日經濟新聞 2025-03-02 14:54:42
每經AI快訊,中國銀河03月02日發布研報,給予傳媒互聯網行業推薦評級。
事件:DeepSeek于 2025年2月24日正式啟動"開源周",計劃在 2月24 日~28 日連續5天每天開源一個項目。
Day1-FlashMLA:動態分配資源,優化算力使用 FlashMLA是專為英偉達 HopperGPU優化的高效MLA解碼內核,專為處理可變長度序列設計。在同時處理長文本和短文本時,它可以精準地為不同長度的文本分配恰當的算力。
Day2-DeepEP:MoE高效運轉,提高整體效率 DeepEP是首個用于MoE(混合專家模型)訓練和推理的開源 EP 通信庫,能夠讓 MoE 模型各部分間溝通更快、消耗更少,提升了整體運行效率。
Day3-DeepGEMM:通用矩陣乘法性能優化 DeepGEMM是一個矩陣乘法加速庫,能夠為 V3/R1 的訓練和推理提供支持。其在各種矩陣形狀上的性能與專家調優的庫相當,在某些情況下更優,且安裝時無需編譯。
Day4-DualPipe& EPLB:開源優化并行策略 DualPipe 是一種用于V3/R1 訓練中計算與通信重疊的雙向管道并行算法,將硬件資源利用率提升超 30%。EPLB 則是一種針對V3/R1的專家并行負載均衡器,基于 MoE 架構,優化 GPU間的負載分布,減少GPU閑置現象。
Day5-3FS:高速數據訪問,提高模型訓練效率 Fire-Flyer 文件系統是一個專門為了充分利用現代SSD和 RDMA網絡帶寬而設計的并行文件系統,能實現高速數據訪問,提升AI模型訓練和推理的效率。
開源模式重塑市場格局,有望促進產業生態繁榮。DeepSeek以領先的模型性能和積極的開源策略, 大幅縮小了以往開源模型和閉源模型間的性能差距,打破了技術壟斷的局面。我們認為,DeepSeek 的開源模式推動了大模型從"重資本軍備競賽"走向"合作共創平臺",改變了行業的商業模式。企業可以通過開源合作,利用全球開發者的智慧和力量進行創新,降低研發成本,提高創新效率。大模型從上游的硬件算力到下游的應用有望形成了一個完整的產業生態系統,進一步推動產業的生態繁榮。
投資建議:DeepSeek的開源策略引發了行業震動,帶動一眾AI企業紛紛加入開源行列。2025 年以來,字節豆包、阿里通義千問等均推出開源模型。眾多企業的參與壯大了開源陣營,促進了 AI 產業生態的繁榮。同時,各方的緊密協作有助于推動 AI 產業的整體發展,提高產業的競爭力。建議關注:AI賦能下具有價值重塑空間、積極擁抱 AI的頭部互聯網大廠:騰訊控股、阿里巴巴-W。
風險提示:政策及監管環境的風險、AI技術發展不及預期的風險、AI應用落地不及預期的風險等。
每經頭條(nbdtoutiao)——每經專訪央行原副行長胡曉煉:當前實施的適度寬松貨幣政策不以大規模刺激為主要特征,考察政策效果需看對創新、對民企等支持是否有力有效
(記者 王曉波)
免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP