多模態大模型應用前景廣闊 三條主線把握人工智能落地機會
近期,谷歌公司宣布推出其規模最大、功能最強的多模態大模型Gemini,其最強大的TPU(張 量 處 理 單 元 ) 系
統“CloudTPUv5p”,以及來自谷歌云的人工智能超級計算機。
業內人士表示,谷歌發布多模態大模型Gemini,可以同時理解文本、圖像、音頻、視頻和代碼五種信息,成為首個MMLU測評上超過人類專家的模型,在性能上幾乎全方位超越GPT-4V,進一步升級了多模態大模型 的 能 力 。 隨 著 Gen-2、Pika1.0、Gemini等多模態模型的快速涌現,全球大模型多模態化趨勢日益顯著,有望帶動AIGC應用加速落地。
事件驅動 谷歌發布多模態大模型Gemini
近期,美國科技巨頭谷歌宣布推出其認為規模最大、功能最強大的AI智能模型Gemini1.0。Gemini1.0將有三種不同 的 尺 寸 :GeminiNano、GeminiPro和GeminiUltra。其中,GeminiUltra適用于高度復雜的任務,目前還處于測試和完善階段,谷歌將向部分客戶、開發者、合作伙伴以及安全和責任專家提供使用,用以進行早期試驗并獲得反饋;GeminiPro適用于各種任務的最佳模型,用于Bard的升級;GeminiNano則是端側設備上最高效的模型,能夠用以支持錄音軟件的“總結”和Gboard的“智能回復”等功能。
據谷歌稱,Gemini為史上第一款原生支持多模態能力的AI模型。所謂原生多模態,即從一開始就在不同模態上進行預訓練,而無需分別訓練不同模態對應的組件。在原生多模態的基礎上,Gemini還會利用額外的多模態數據對其進行微調,以進一步提高其有效性。在此框架下,Gemini具有多樣化的功能。
Gemini1.0具有復雜的多模態推理能力,可幫助理解復雜的書面和視覺信息。這使得它具有獨特的技能,可以在海量的數據中發掘難以辨別的知識內容,從而擁有強大的推理能力。此外,Gem-ini1.0經過訓練,可以同時識別并理解文本、圖像、音頻等,因此它能更好地理解具有細微差別的信息,回答與復雜主題相關的問題。同時,Gemini可以理解、解釋和生成世界上最流行的編程語言 (如Python、Java、C++和Go)的高質量代碼。它能夠跨語言工作并對復雜信息進行推理,這些能力使其成為世界領先的編碼基礎模型之一。
依托原生多模態框架,Gemini擁有強大的性能。谷歌一直在對Gemini模型進行嚴格的測試并評估其在各種任務中的性能,其在很多方面有著突出的表現。
行業前瞻 AIGC產業未來發展前景廣闊
近期,AI視頻生成領域進展不斷,海外多家企業先后推出相關AI視頻生成工具或對原有的產品進行及時更新。11月20日,Runway更新其視頻生成模型Gen-2,上線“運動畫筆”功能。11月22日,此前發布標志性文生圖模型StableD-iffusion的公司StabilityAI推出最新AI模型StableVideoDiffusion,實現圖片生成視頻。11月28日,美國AI初創公司Pika發布的AI生成視頻工具Pika1.0火熱出圈,其主要功能包括文本/圖片生成視頻、內容編輯、風格轉化、尺寸調整等。
此外,近日谷歌發布多模態大模型Gemini,可以同時理解文本、圖像、音頻、視頻和代碼五種信息,成為首個MMLU測評上超過人類專家的模型,在性能上幾乎全方位超越GPT-4V,進一步升級了多模態大模型的能力。隨著Gen-2、Pika1.0、Gemini等多模態模型的快速涌現,全球大模型多模態化趨勢日益顯著,有望帶動AIGC應用加速落地。
從大模型應用端來看,相較OpenAI,谷歌的商業版圖更為廣闊,Gemini系列規模和功能強大,預計將快速融入谷歌生態,未來商業模式擁有極大的想象空間。內部生態融合計劃來看,谷歌表示,從發布日起,Gemini可開始應用于Bard和Pixel8Pro智能手機,并將很快與谷歌服務中的其他產品集成,包括Chrome、搜索和廣告等。外部用戶開放情況來看,谷歌計劃通過谷歌云將Gemini授權給客戶,12月13日開始,開發者和企業客戶可以訪問GeminiPro,安卓開發人員可以使用GeminiNano完成構建。
谷歌作為全球人工智能龍頭之一,無論在算力、算法還是商業化各個方面都積蓄了優勢,Gemini系列大模型的如期推出,打破此前市場關于延期發布的傳聞,同時Gemini系列在傳統文本領域以及多模態領域能力均對標GPT-4,總體超出市場預期。我們可以看到人工智能巨頭在大模型領域的競爭依然白熱化,在此背景下繼續看好AI算力需求的增長,同時,當下對于多模態AI的激烈角逐也將持續拔升大模型的整體能力水平,有助于不斷拓展大模型的應用場景和邊界,想象空間廣闊。
當前,我國通用人工智能產業政策逐步完善,國產大模型能力持續升級,我國國產AI芯片產業鏈加快成熟。隨著國產大模型廠商和AI芯片廠商的持續發力,我國AIGC產業未來發展前景廣闊。
投資思路 三條主線把握人工智能落地機會
太平洋證券表示,谷歌Gemini1.0發布標志著多模態領域取得里程碑式進展,產業趨勢確定性進一步明確。在商業化方面,過往由于AI應用主要集中于B端,商業化發展受到限制。隨著多模態新產品和新技術的持續迭代,Pika在多模態領域取得突破,AIGC有望在文娛行業拓展應用,進一步打開C端市場,提升商業化價值。今年是AI應用落地的元年,建議重視場景和用戶的價值。
對于具體投資標的,太平洋證券推薦關注三條主線。第一,大模型和AIAgents:昆侖萬維;第二,多模態:文字IP:中文在線、掌閱科技;形象IP:上海電影、奧飛娛樂;多模態賦能視頻:華策影視,光線傳媒;第三,AI應用:AI社交產品:盛天網絡;AI教育:皖新傳媒、佳發教育;AI校對:果麥文化;AI游戲:愷英網絡、三七互娛、吉比特、巨人網絡、電魂網絡、掌趣科技。
中泰證券指出,人工智能新一輪十年級的技術和產業革命大幕已經拉開。
對于具體投資標的,中泰證券表示,算力服務器建議關注浪潮信息、中科曙光、紫光股份等,芯片建議關注英偉達、寒武紀、海光信息、龍芯中科等;模型方面,國內建議關注科大訊飛、三六零、格靈深瞳、云從科技、云天勵飛等;數據建議關注星環科技、海天瑞聲等,安全建議關注深信服、啟明星辰、安恒信息、天融信、綠盟科技、迪普科技、安博通、奇安信、永信至誠、美亞柏科等;生產力工具建議關注金山辦公、萬興科技、廣聯達、中望軟件、彩訊股份、福昕軟件等;ERP等辦公場景建議關注金蝶國際、明源云、鼎捷軟件、用友網絡、致遠互聯等;金融場景建議關注恒生電子、同花順、中科軟、宇信科技等;汽車場景建議關注中科創達、德賽西威、經緯恒潤、萬集科技等;醫療場景建議關注衛寧健康、創業慧康、嘉和美康、醫渡科技、鷹瞳科技等;其他建議關注焦點科技、中科星圖、航天宏圖、拓爾思、佳發教育、神思電子等。
- 免責聲明:本文內容與數據僅供參考,不構成投資建議。據此操作,風險自擔。
- 版權聲明:凡文章來源為“大眾證券報”的稿件,均為大眾證券報獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為“大眾證券報”。
- 廣告/合作熱線:025-86256149
- 舉報/服務熱線:025-86256144
