多模態(tài)大模型應用前景廣闊 三條主線把握人工智能落地機會
近期,谷歌公司宣布推出其規(guī)模最大、功能最強的多模態(tài)大模型Gemini,其最強大的TPU(張 量 處 理 單 元 ) 系
統(tǒng)“CloudTPUv5p”,以及來自谷歌云的人工智能超級計算機。
業(yè)內(nèi)人士表示,谷歌發(fā)布多模態(tài)大模型Gemini,可以同時理解文本、圖像、音頻、視頻和代碼五種信息,成為首個MMLU測評上超過人類專家的模型,在性能上幾乎全方位超越GPT-4V,進一步升級了多模態(tài)大模型 的 能 力 。 隨 著 Gen-2、Pika1.0、Gemini等多模態(tài)模型的快速涌現(xiàn),全球大模型多模態(tài)化趨勢日益顯著,有望帶動AIGC應用加速落地。
事件驅(qū)動 谷歌發(fā)布多模態(tài)大模型Gemini
近期,美國科技巨頭谷歌宣布推出其認為規(guī)模最大、功能最強大的AI智能模型Gemini1.0。Gemini1.0將有三種不同 的 尺 寸 :GeminiNano、GeminiPro和GeminiUltra。其中,GeminiUltra適用于高度復雜的任務,目前還處于測試和完善階段,谷歌將向部分客戶、開發(fā)者、合作伙伴以及安全和責任專家提供使用,用以進行早期試驗并獲得反饋;GeminiPro適用于各種任務的最佳模型,用于Bard的升級;GeminiNano則是端側(cè)設備上最高效的模型,能夠用以支持錄音軟件的“總結(jié)”和Gboard的“智能回復”等功能。
據(jù)谷歌稱,Gemini為史上第一款原生支持多模態(tài)能力的AI模型。所謂原生多模態(tài),即從一開始就在不同模態(tài)上進行預訓練,而無需分別訓練不同模態(tài)對應的組件。在原生多模態(tài)的基礎上,Gemini還會利用額外的多模態(tài)數(shù)據(jù)對其進行微調(diào),以進一步提高其有效性。在此框架下,Gemini具有多樣化的功能。
Gemini1.0具有復雜的多模態(tài)推理能力,可幫助理解復雜的書面和視覺信息。這使得它具有獨特的技能,可以在海量的數(shù)據(jù)中發(fā)掘難以辨別的知識內(nèi)容,從而擁有強大的推理能力。此外,Gem-ini1.0經(jīng)過訓練,可以同時識別并理解文本、圖像、音頻等,因此它能更好地理解具有細微差別的信息,回答與復雜主題相關(guān)的問題。同時,Gemini可以理解、解釋和生成世界上最流行的編程語言 (如Python、Java、C++和Go)的高質(zhì)量代碼。它能夠跨語言工作并對復雜信息進行推理,這些能力使其成為世界領(lǐng)先的編碼基礎模型之一。
依托原生多模態(tài)框架,Gemini擁有強大的性能。谷歌一直在對Gemini模型進行嚴格的測試并評估其在各種任務中的性能,其在很多方面有著突出的表現(xiàn)。
行業(yè)前瞻 AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊
近期,AI視頻生成領(lǐng)域進展不斷,海外多家企業(yè)先后推出相關(guān)AI視頻生成工具或?qū)υ械漠a(chǎn)品進行及時更新。11月20日,Runway更新其視頻生成模型Gen-2,上線“運動畫筆”功能。11月22日,此前發(fā)布標志性文生圖模型StableD-iffusion的公司StabilityAI推出最新AI模型StableVideoDiffusion,實現(xiàn)圖片生成視頻。11月28日,美國AI初創(chuàng)公司Pika發(fā)布的AI生成視頻工具Pika1.0火熱出圈,其主要功能包括文本/圖片生成視頻、內(nèi)容編輯、風格轉(zhuǎn)化、尺寸調(diào)整等。
此外,近日谷歌發(fā)布多模態(tài)大模型Gemini,可以同時理解文本、圖像、音頻、視頻和代碼五種信息,成為首個MMLU測評上超過人類專家的模型,在性能上幾乎全方位超越GPT-4V,進一步升級了多模態(tài)大模型的能力。隨著Gen-2、Pika1.0、Gemini等多模態(tài)模型的快速涌現(xiàn),全球大模型多模態(tài)化趨勢日益顯著,有望帶動AIGC應用加速落地。
從大模型應用端來看,相較OpenAI,谷歌的商業(yè)版圖更為廣闊,Gemini系列規(guī)模和功能強大,預計將快速融入谷歌生態(tài),未來商業(yè)模式擁有極大的想象空間。內(nèi)部生態(tài)融合計劃來看,谷歌表示,從發(fā)布日起,Gemini可開始應用于Bard和Pixel8Pro智能手機,并將很快與谷歌服務中的其他產(chǎn)品集成,包括Chrome、搜索和廣告等。外部用戶開放情況來看,谷歌計劃通過谷歌云將Gemini授權(quán)給客戶,12月13日開始,開發(fā)者和企業(yè)客戶可以訪問GeminiPro,安卓開發(fā)人員可以使用GeminiNano完成構(gòu)建。
谷歌作為全球人工智能龍頭之一,無論在算力、算法還是商業(yè)化各個方面都積蓄了優(yōu)勢,Gemini系列大模型的如期推出,打破此前市場關(guān)于延期發(fā)布的傳聞,同時Gemini系列在傳統(tǒng)文本領(lǐng)域以及多模態(tài)領(lǐng)域能力均對標GPT-4,總體超出市場預期。我們可以看到人工智能巨頭在大模型領(lǐng)域的競爭依然白熱化,在此背景下繼續(xù)看好AI算力需求的增長,同時,當下對于多模態(tài)AI的激烈角逐也將持續(xù)拔升大模型的整體能力水平,有助于不斷拓展大模型的應用場景和邊界,想象空間廣闊。
當前,我國通用人工智能產(chǎn)業(yè)政策逐步完善,國產(chǎn)大模型能力持續(xù)升級,我國國產(chǎn)AI芯片產(chǎn)業(yè)鏈加快成熟。隨著國產(chǎn)大模型廠商和AI芯片廠商的持續(xù)發(fā)力,我國AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊。
投資思路 三條主線把握人工智能落地機會
太平洋證券表示,谷歌Gemini1.0發(fā)布標志著多模態(tài)領(lǐng)域取得里程碑式進展,產(chǎn)業(yè)趨勢確定性進一步明確。在商業(yè)化方面,過往由于AI應用主要集中于B端,商業(yè)化發(fā)展受到限制。隨著多模態(tài)新產(chǎn)品和新技術(shù)的持續(xù)迭代,Pika在多模態(tài)領(lǐng)域取得突破,AIGC有望在文娛行業(yè)拓展應用,進一步打開C端市場,提升商業(yè)化價值。今年是AI應用落地的元年,建議重視場景和用戶的價值。
對于具體投資標的,太平洋證券推薦關(guān)注三條主線。第一,大模型和AIAgents:昆侖萬維;第二,多模態(tài):文字IP:中文在線、掌閱科技;形象IP:上海電影、奧飛娛樂;多模態(tài)賦能視頻:華策影視,光線傳媒;第三,AI應用:AI社交產(chǎn)品:盛天網(wǎng)絡;AI教育:皖新傳媒、佳發(fā)教育;AI校對:果麥文化;AI游戲:愷英網(wǎng)絡、三七互娛、吉比特、巨人網(wǎng)絡、電魂網(wǎng)絡、掌趣科技。
中泰證券指出,人工智能新一輪十年級的技術(shù)和產(chǎn)業(yè)革命大幕已經(jīng)拉開。
對于具體投資標的,中泰證券表示,算力服務器建議關(guān)注浪潮信息、中科曙光、紫光股份等,芯片建議關(guān)注英偉達、寒武紀、海光信息、龍芯中科等;模型方面,國內(nèi)建議關(guān)注科大訊飛、三六零、格靈深瞳、云從科技、云天勵飛等;數(shù)據(jù)建議關(guān)注星環(huán)科技、海天瑞聲等,安全建議關(guān)注深信服、啟明星辰、安恒信息、天融信、綠盟科技、迪普科技、安博通、奇安信、永信至誠、美亞柏科等;生產(chǎn)力工具建議關(guān)注金山辦公、萬興科技、廣聯(lián)達、中望軟件、彩訊股份、福昕軟件等;ERP等辦公場景建議關(guān)注金蝶國際、明源云、鼎捷軟件、用友網(wǎng)絡、致遠互聯(lián)等;金融場景建議關(guān)注恒生電子、同花順、中科軟、宇信科技等;汽車場景建議關(guān)注中科創(chuàng)達、德賽西威、經(jīng)緯恒潤、萬集科技等;醫(yī)療場景建議關(guān)注衛(wèi)寧健康、創(chuàng)業(yè)慧康、嘉和美康、醫(yī)渡科技、鷹瞳科技等;其他建議關(guān)注焦點科技、中科星圖、航天宏圖、拓爾思、佳發(fā)教育、神思電子等。
- 免責聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議。據(jù)此操作,風險自擔。
- 版權(quán)聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務熱線:025-86256144
