多模態(tài)推理場景拉動算力網(wǎng)絡(luò)
近期,OpenAI與谷歌分別推出了AI視頻模型Sora和多模態(tài)大模型Gemini1.5,多項技術(shù)均實現(xiàn)創(chuàng)紀(jì)錄的突破。其中,OpenAI發(fā)布文生視頻模型Sora,開創(chuàng)AI視頻新時代;谷歌Gemini1.5震撼上線,首破100萬極限上下文紀(jì)錄。
業(yè)內(nèi)人士表示,隨著近期北美云商及部分AI產(chǎn)業(yè)鏈公司明確上調(diào)資本開支以及積極投資AI的態(tài)度,修復(fù)了國內(nèi)投資者對于AI及算力板塊的信心,光模塊作為算力基建重要環(huán)節(jié),對其2024年至2025年的需求持續(xù)保持樂觀,疊加行業(yè)馬太效應(yīng)增強,頭部光模塊廠商業(yè)績有望維持高增長。
事件驅(qū)動 海外AI巨頭接連推出新模型
2月16日,OpenAI推出了一款能根據(jù)文字指令即時生成短視頻的模型,命名為Sora。根據(jù)介紹,Sora使用擴散模型技術(shù),完美繼承了DALL·E3的畫質(zhì)和遵循指令能力,能夠從文本說明中生成長達(dá)60秒的視頻,并能夠提供具有多個角色,特定類型的動作和詳細(xì)背景細(xì)節(jié)的場景。借助GPT的能力,Sora實現(xiàn)對語言的深入理解,使其能夠準(zhǔn)確地解釋提示詞,并生成引人注目的字符來表達(dá)充滿活力的情感。
Sora還能在一個生成的視頻中創(chuàng)建多個鏡頭,體現(xiàn)人物和視覺風(fēng)格。OpenAI表示,通過讓模型一次生成多幀畫面,Sora解決了一個具有挑戰(zhàn)性的問題,即:即使生成的主體暫時離開視線內(nèi),也能確保主體不變。除文生視頻外,Sora還具有更多功能:根據(jù)圖像生成動畫;在時間上向前或向后擴展視頻;編輯輸入的視頻;在兩個輸入視頻之間逐漸進(jìn)行插值,從而在具有完全不同主題和場景構(gòu)成的視頻之間創(chuàng)建無縫過渡;根據(jù)文字生成圖像。
同日,谷歌發(fā)布“下一代AI模型”——Gemini1.5。Gemini1.5建立在谷歌基礎(chǔ)模型開發(fā)和基礎(chǔ)設(shè)施的研究與工程創(chuàng)新的基礎(chǔ)上,包括通過新的專家混合(MoE)架構(gòu)使Gemini1.5的訓(xùn)練和服務(wù)更加高效。MoE模型由眾多小型的“專家”神經(jīng)網(wǎng)絡(luò)組成,這些模型可以根據(jù)不同的輸入類型,學(xué)會僅激活最相關(guān)的專家網(wǎng)絡(luò)路徑。在此架構(gòu)下,Gemini1.5在許多方面都實現(xiàn)了突破,最令人眼前一亮的是超長的上下文窗口。Gemi-ni1.5版本中首個登場的多模態(tài)通用模型Gemini1.5Pro,把穩(wěn)定處理上下文的上限擴大至100萬tokens,并且支持處理文字、代碼,以及圖片、語音、視頻等多模態(tài)內(nèi)容。
通俗的來說,Gemini1.5Pro可以一次性處理超過70萬個單詞的文本、3萬行代碼、11個小時的音頻,或1個小時的視頻。根據(jù)谷歌的報告,Gemini1.5Pro對于100萬tokens的文本、音頻、視頻能夠?qū)崿F(xiàn)100%的檢索完整性,對于更長的上下文,也有著優(yōu)秀的檢索效果。與之對比鮮明的是,GPT-4Turbo的性能則飛速下降,無法處理超過12.8萬個token的文本。目前谷歌開放給開發(fā)者的測試版本中,Gemi-ni1.5Pro的token限制只有12.8萬個,后續(xù)會推出新的收費層級,供解鎖100萬tokens的版本。
事件影響 多模態(tài)推理產(chǎn)業(yè)節(jié)奏正在加快
據(jù)OpenAI的Sora文檔,Sora基于DiT(diffusiontransformer)等設(shè)計。DiT原作者SainingXie第二作者總結(jié),DiT模型的架構(gòu)即VAEencoder+ViT+DDPM+VAEde-coder,視頻的可擴展性是Sora的重要亮點。訓(xùn)練數(shù)據(jù)的來源、構(gòu)建、視頻生成的能力是Sora的重要產(chǎn)業(yè)增量,而非過去討論LLM的參數(shù)量。據(jù)DiT模型論文,較大模型的計算效率更高,較小模型即使拉長訓(xùn)練時間,最終計算效率也會下降;通過使transformer更深、更寬,訓(xùn)練效果會提升;通過增加DiT處理token數(shù)量,訓(xùn)練效果會顯著改善。
Sora的推出啟示我們,多模態(tài)推理的產(chǎn)業(yè)節(jié)奏正在加快。過去市場對算力網(wǎng)絡(luò)的需求測算,主要聚焦在模型訓(xùn)練階段,關(guān)注模型路徑、技術(shù)格局、參數(shù)量、芯片創(chuàng)新等。更長期的AGI應(yīng)用爆發(fā),推理需求指數(shù)增長,需求增長的持續(xù)性是下一步光通信等算力網(wǎng)絡(luò)定價的關(guān)鍵。
相比訓(xùn)練,推理階段更重視內(nèi)存+網(wǎng)絡(luò)平衡。大模型推理過程,模型參數(shù)和KVcache是主要的內(nèi)存使用者,盡管相比訓(xùn)練階段減少了梯度、優(yōu)化器等占用,但最大瓶頸在于顯存,且隨著模型增大需要減少并行或優(yōu)化并行通信。
以英偉達(dá)H200芯片為例,產(chǎn)業(yè)硬件側(cè)已經(jīng)開始重視長期推理需求。英偉達(dá)H200重要硬件變化是HBM3升級至HBM3e,容量帶寬顯著優(yōu)化;重要軟件變化是大幅強化了推理性能 (匹配TensorRT-LLM)和HPC性能;顯著降低能耗和整體成本。相比H100,H200幾乎提升了Llama270B推理性能1.9x,提升GPT3175B推理性能1.6x;從單位成本和模型復(fù)雜度角度考慮,對未來旗艦AI芯片在推理場景的應(yīng)用判斷應(yīng)當(dāng)更樂觀,相應(yīng)的光網(wǎng)絡(luò)需求亦同步。
投資思路 頭部光模塊廠商業(yè)績有望維持高增長
廣發(fā)證券認(rèn)為,前期導(dǎo)致AI算力板塊持續(xù)調(diào)整的主要原因是國內(nèi)外投資者對于AI應(yīng)用的前景有明顯預(yù)期差,A股投資者對于AI應(yīng)用偏向保守,擔(dān)心算力板塊的增長難以延續(xù)。隨著近期北美云商及部分AI產(chǎn)業(yè)鏈公司明確上調(diào)資本開支以及積極投資AI的態(tài)度,修復(fù)了國內(nèi)投資者對于AI及算力板塊的信心,光模塊作為算力基建重要環(huán)節(jié),對其2024年至2025年的需求持續(xù)保持樂觀,疊加行業(yè)馬太效應(yīng)增強,頭部光模塊廠商業(yè)績有望維持高增長。
此外,廣發(fā)證券判斷,2025年高速光模塊將主要受到三重共振的牽引:第一,2025年將是傳統(tǒng)以太網(wǎng)數(shù)據(jù)中心800G光模塊升級大年;第二,AWS、Meta、特斯拉等其他AI主要玩家也將會在2025年加速建設(shè);第三,AI使得GPU帶寬快速增長,帶動光模塊迭代加速,新一代1.6T光模塊也將會在2025年放量。伴隨光模塊迭代升級,光模塊產(chǎn)品定制化程度更高,光模塊公司和下游客戶綁定更強,馬太效應(yīng)更加強烈。建議持續(xù)關(guān)注信息、算力基建產(chǎn)業(yè)鏈的相關(guān)標(biāo)的。建議關(guān)注整體方案商環(huán)節(jié)中興通訊;算力網(wǎng)絡(luò)運營商中國移動、中國電信、中國聯(lián)通;光模塊、光器件環(huán)節(jié)的新易盛、天孚通信;高速數(shù)據(jù)通信電纜領(lǐng)域的兆龍互連;交換機環(huán)節(jié)的銳捷網(wǎng)絡(luò)、菲菱科思。
平安證券表示,當(dāng)前,全球范圍內(nèi)大模型領(lǐng)域的競爭依然白熱化,這將持續(xù)拔升大模型的整體能力水平。大模型需要大算力,大模型算法的迭代升級將為全球和中國AI算力市場的增長提供強勁動力。在美國對華半導(dǎo)體出口管制升級的背景下,我國國產(chǎn)AI芯片產(chǎn)業(yè)鏈將加快成熟,相關(guān)AI芯片和服務(wù)器廠商將深度受益。另外,在應(yīng)用端,我國國產(chǎn)大模型能力持續(xù)升級,AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊。算力方面,推薦浪潮信息、中科曙光、紫光股份、海光信息,建議關(guān)注工業(yè)富聯(lián)、寒武紀(jì)、景嘉微;算法方面,推薦科大訊飛;應(yīng)用場景方面,強烈推薦中科創(chuàng)達(dá)、恒生電子、盛視科技,推薦金山辦公,建議關(guān)注萬興科技、同花順、彩訊股份;網(wǎng)絡(luò)安全方面,強烈推薦啟明星辰。
申萬宏源證券提出,Sora為代表的多模態(tài)推理場景,會極大拉動高速算力網(wǎng)絡(luò)、尤其光通信的需求持續(xù)提升。疊加此前云服務(wù)廠商資本支出預(yù)增及芯片加速迭代體現(xiàn)海外算網(wǎng)高需求,國內(nèi)光通信廠商基于出海邏輯有望充分獲益;高速趨勢下,關(guān)注1.6T、硅光等落地情況。關(guān)注光通信產(chǎn)業(yè)鏈之中際旭創(chuàng)、新易盛、天孚通信、華工科技、源杰科技等;算力設(shè)備產(chǎn)業(yè)鏈之紫光股份、銳捷網(wǎng)絡(luò)、中興通訊、盛科通信等。
- 免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議。據(jù)此操作,風(fēng)險自擔(dān)。
- 版權(quán)聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務(wù)熱線:025-86256144
