每日經濟新聞 2023-02-20 20:43:31
每經記者 李沛沛 姚亞楠 每經編輯 彭水萍
2023年開年,ChatGPT迅速火遍全球,短短兩個月時間月活突破一億,成為被載入史冊的應用之一。
ChatGPT的大火引發了全球科技巨頭的一場“軍備競賽”,國內的“中國版ChatGPT”爭奪戰也是一觸即發。
在國內眾多大廠中,百度是最早做出明確表態的公司之一,2月初就正式宣布將在3月上線百度版ChatGPT“文心一言”,打響第一槍。
接下來,華為、騰訊、阿里、京東云也都公布了自身在相關領域的布局情況,還有消息傳出稱字節跳動的人工智能實驗室(AI Lab)有開展類似ChatGPT和AIGC的相關研發。
圖片來源:視覺中國-VCG41N1188747468
作為長期關注AI賽道、走在第一線的VC/PE,對于AI大模型和“中國版ChatGPT”也保持著高度關注。我國什么時候才能擁有自己的“超級大腦”AI大模型?需要在哪些方面實現突破?目前面臨的挑戰又有哪些?
針對這些行業高度關注的熱門話題,《每日經濟新聞》記者采訪了多位一級市場知名投資人。
“未來國內一定會有自己的AI大模型,并且也一定會誕生自己的ChatGPT。”在談到打造AI大模型和“中國版ChatGPT”是否現實時,多位投資人都對《每日經濟新聞》記者做出了這樣的判斷。
創世伙伴資本合伙人聶冬辰進一步解釋稱,中國擁有龐大的數據,較強的模型開發和算法優化能力,大量優秀的AI工程師,具備打造中國版ChatGPT的條件,“當然,這是一件長期的事,涉及數據的收集清洗、算法的設計優化等多個環節,我們看到已經有幾家公司在努力去做,但目前都處于比較早期的階段。”
對于中國能否做出自己的AI大模型,CMC資本董事總經理易然也表達了自己的樂觀:“這完全是一個資源和時間的問題,而且不會差太遠,我們之前和一些模型層的創業者、學者都有過交流,從技術的了解程度和人才儲備來說,我們其實并不差。此外,現在關于模型構建方面的學術交流也很開放和活躍,我們可以做一些參考。”
而在線性資本投資總監白則人看來,大模型這塊已經不是什么秘密,因為雖然OpenAI的代碼沒有開源,但是整個的構建思路已經通過論文的形式發出來了,大方向上已經明確,只是在模型構建和效果優化方面的探索需要花費大量時間,有大量工程化問題要解決,并且訓練成本也非常高。
“我覺得市場還需要多一些耐心。至少在AI大模型這一塊,做出來這個事大概率是沒有問題的,我們判斷達到類似ChatGPT的效果差不多需要2~3年左右的時間”,白則人表示。
啟明創投合伙人周志峰則表示,他非常喜歡北京智源人工智能研究院理事長張宏江所說的一個比喻:過去的AI更多的是“大煉模型“,也就是說每家科技公司都是各自獨立研發專用小模型;今天這一代的AI技術,叫做“煉大模型”,底座模型是由某些特定的機構研發出超大規模的通用模型,“這個模型不再是針對某一個專門應用開發的,它的訓練數據是互聯網上能夠看到的所有數據,數據也不需要做特別的標注,訓練也不需要監督,做出來的是通用人工智能能力,然后第三方基于底座模型,針對千萬個應用場景去開發軟件”。
他指出,從“大煉模型”到“煉大模型”的范式轉變,對AI未來十年、二十年的發展有重大意義。
國內巨頭已經紛紛入局,那么要做出ChatGPT這樣的現象級產品,目前還有哪些現實的挑戰擺在眼前呢?
易然坦言,國內的公司此前在這個領域已經有一些探索了,如果要達到類似ChatGPT的效果,還需要更多資源和時間的投入。“當然像芯片等方面可能會面臨一些阻礙,但是應該也會有一些其他的解決方法。”他表示,未來會繼續關注模型層的演變,尤其是開源對模型層帶來的影響,科技大廠在訓練上取得了一些初步優勢后可能通過開源的方式去降維打擊。創業公司如何更好地利用開源的模型,能否構建出屬于自己垂直領域、更精細化的小模型也值得期待。
在白則人看來,要做出國內自己的AI大模型,最關鍵的要素是要有足夠的算力和模型工程化的人才。
“算力這塊可能會面臨卡脖子的問題,而且除了硬件方面,可能還有一些比如說計算框架層面這些軟件層面的問題需要去解決。當然我們也看到,中國的GPU近年來也在快速發展中,所以我覺得國內的企業還是有實力可以去做的。”
聶冬辰也向《每日經濟新聞》記者分析稱,構建中國的AI大模型需要幾方面條件更加成熟:首先是底層技術能力,在模型構建和訓練方面要有持續大量投入,形成自己的中文語言大模型。其次,在數據方面,要有足夠體量的數據灌進來,對數據的收集、整理、清洗是一個非常龐大且耗時耗力的過程,需要有公司踏踏實實地能把這件事情做成。此外,整個市場,無論是科技大廠、創業公司還是投資人,都需要有足夠的耐心,不投機、不跟風。“如果我們真的能沉下心來,十年如一日地朝著自己的AI大模型方向去訓練演進,肯定能做出來”。
而在談到關于中國在生成式AI和底座大模型的挑戰時,周志峰指出,首先要面臨的就是算力問題。由于算力成本非常高,怎么用國產的AI芯片進行替代并降低成本,國產的AI芯片是不是能夠、什么時候能夠滿足大規模集群的算力、互聯帶寬、算法適配和協同的需求,都值得去觀察。
其次,過去一周很多人說國內的科技大廠和創業公司推出的大模型與ChatGPT是有代際差別的,我們落后了至少一代。在看Open AI的發展時會發現,ChatGPT也好、GPT-3也好,是需要很長時間研發積累的。
第三,更重要的是,目前圍繞著Open AI或者西方科技大廠的大模型已經構建出了一個初步的生態,國內科技大廠或者創業公司的大模型在技術和工程上,有很多的地方需要不斷追趕。“如果只是訓練出大模型,沒有人去用,缺少完整生態,也是沒有任何意義的。”
周志峰表示,“最后,我還是非常堅定地看好生成式AI和大模型,它的出現標志著一個巨大的AI開發范式的轉換,將會真正的被利用到更多應用場景。”
封面圖片來源:視覺中國-VCG41N1188747468
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP