“終于有了一個(gè)AI‘嘴替’,它叫‘鳥(niǎo)鳥(niǎo)分?zhù)B’。”4月4日,知名脫口秀演員鳥(niǎo)鳥(niǎo)展示了她的語(yǔ)音助手——搭載在天貓精靈上的類(lèi)GPT模型,不僅對答如流,還能模仿她的音色、語(yǔ)氣與文本風(fēng)格。4月7日,阿里云悄然開(kāi)放了大模型“通義千問(wèn)”的內測入口。4月11日,阿里巴巴集團董事會(huì )主席兼CEO張勇宣布“通義千問(wèn)”將接入阿里系所有產(chǎn)品。
繼百度文心一言之后,“阿里版GPT”終于來(lái)了。
隨著(zhù)ChatGPT升級為GPT-4,百度、阿里、騰訊、美團、京東、360等國內互聯(lián)網(wǎng)廠(chǎng)商也緊跟GPT浪潮,不少公司還把其當作“一把手”工程,甚至出現同一天三個(gè)官宣的盛況。畢竟,誰(shuí)都害怕成為“被GPT顛覆的失敗者”。
看似“神仙打架”的熱鬧背后,國產(chǎn)GPT實(shí)力究竟如何、短板還有哪些?受訪(fǎng)專(zhuān)家普遍表示,ChatGPT的成功驗證了NLP(自然語(yǔ)言處理)的發(fā)展前景,國內AI企業(yè)集中進(jìn)入GPT賽道有望迎來(lái)新機遇,但受限于各家大模型的特點(diǎn),國產(chǎn)GPT仍需與商業(yè)模式相適配,避免紅海競爭。
通義千問(wèn)將成阿里系標配
可以想象的是,通義大模型一旦接入電商數據,或將掀起又一場(chǎng)網(wǎng)購模式的變革
“面向AI時(shí)代,所有產(chǎn)品都值得用大模型重新升級。”張勇為“阿里版GPT”通義千問(wèn)站臺時(shí)說(shuō)。這也是他在阿里“一拆六”后首次以阿里云CEO的身份出現在公眾視野。
約一個(gè)月前,百度率先推出GPT類(lèi)產(chǎn)品文心一言,隨后開(kāi)放試用時(shí)曾遭受不少質(zhì)疑。不少人測試后覺(jué)得,通義千問(wèn)的AI對話(huà)能力初步達到了“可接受”的程度,但是離“令人滿(mǎn)意”仍相距甚遠。與GPT-4以及文心一言一樣,通義千問(wèn)在整合資料時(shí)也會(huì )鬧笑話(huà),比如將文心一言解釋為阿里巴巴達摩院的產(chǎn)品(實(shí)為百度的產(chǎn)品),還會(huì )坦然承認“文心一言在技術(shù)實(shí)力和應用場(chǎng)景方面可能更強一些”。
不過(guò),經(jīng)過(guò)對ChatGPT、文心一言等多個(gè)GPT類(lèi)產(chǎn)品的嘗鮮,業(yè)界對通義千問(wèn)的內測結果較為冷靜,反而更關(guān)注“阿里版GPT”的應用場(chǎng)景。
張勇并未現場(chǎng)展示通義千問(wèn)的能力,但他宣布阿里所有產(chǎn)品都將接入大模型進(jìn)行全面改造,這一計劃被人稱(chēng)為“GPT全家桶”。其中釘釘、天貓精靈率先接入測試,將在評估認證后正式發(fā)布新功能。資料顯示,在釘釘文檔中,通義千問(wèn)可以創(chuàng )作詩(shī)歌小說(shuō)、撰寫(xiě)郵件、生成營(yíng)銷(xiāo)策劃方案等;在釘釘會(huì )議中,通義千問(wèn)可以隨時(shí)生成會(huì )議記錄并自動(dòng)總結會(huì )議紀要、生成待辦事項,還能自動(dòng)總結未讀群聊信息中的要點(diǎn)。最驚艷的是,釘釘展示了拍照生成小程序場(chǎng)景,上傳一張功能草圖,不用寫(xiě)一行代碼,可立刻生成訂餐輕應用。
雖然通義千問(wèn)姍姍來(lái)遲,但阿里巴巴布局大模型并非一朝一夕。早在2019年,達摩院便已啟動(dòng)通義中文大模型研發(fā),目前已申請注冊“通義萬(wàn)象”“通義曉語(yǔ)”“通義博研”等商標,可以想象的是,通義大模型一旦接入電商數據,或將掀起又一場(chǎng)網(wǎng)購模式的變革。
隱形頭部玩家早已蟄伏
國內各家大模型存在一些差異化,隨著(zhù)技術(shù)演進(jìn),未來(lái)可能會(huì )有更多新的特點(diǎn)和區別出現
除了通義千問(wèn),國內各大GPT類(lèi)產(chǎn)品近期如雨后春筍般集中面世。短短一天內,同時(shí)有三家廠(chǎng)商宣布了GPT產(chǎn)品的最新消息。
4月10日,商湯科技發(fā)布“日日新SenseNova”大模型,推出自然語(yǔ)言處理、內容生成、自動(dòng)化數據標注、自定義模型訓練等多種大模型及能力,還推出自研中文語(yǔ)言大模型應用平臺“商量SenseChat”。
同一天,昆侖萬(wàn)維宣布與奇點(diǎn)智源合作自研的國產(chǎn)大語(yǔ)言模型“天工3.5”將于4月17日啟動(dòng)邀請測試。搜狗創(chuàng )始人王小川也宣布“百川智能”創(chuàng )業(yè)計劃,底座產(chǎn)品將在年底公布。
京東也在前幾日高調宣布將在今年發(fā)布“ChatJD”,定位為產(chǎn)業(yè)版本ChatGPT。目前京東的大模型主要聚焦于文本、語(yǔ)音、對話(huà)和數字人生成等4個(gè)方面開(kāi)展工作,比如給商品自動(dòng)生成長(cháng)度不等的文案,包括標題、賣(mài)點(diǎn)文案和直播文案等。
相較之下,騰訊和華為的大模型顯得低調不少,但他們仍是這個(gè)賽道的“隱形頭部玩家”。
去年,騰訊推出萬(wàn)億級別中文NLP預訓練模型HunYuan—NLP—1T(混元AI大模型),覆蓋了NLP、CV(計算機視覺(jué))、多模態(tài)等基礎模型和眾多行業(yè)模型,先后在中文語(yǔ)言理解權威評測集合CLUE與VCR等多個(gè)權威多模態(tài)數據集榜單中登頂。目前,騰訊正在研發(fā)類(lèi)GPT聊天機器人,將集成到QQ、微信上。
去年4月,華為云發(fā)布了30億參數的視覺(jué)預訓練模型,并與循環(huán)智能、鵬城實(shí)驗室聯(lián)合開(kāi)發(fā)千億參數、40TB訓練數據的中文語(yǔ)言預訓練模型,而華為云盤(pán)古大模型還曾獲2021世界人工智能大會(huì )“SAIL之星”獎。
大模型在學(xué)術(shù)界也成了“香餑餑”。早在今年2月,復旦大學(xué)邱錫鵬教授團隊發(fā)布國內首個(gè)類(lèi)ChatGPT模型MOSS。3月,中國人民大學(xué)盧志武團隊自主研發(fā)多模態(tài)對話(huà)大模型并落地了第一款應用“元乘象ChatImg”……
據國研新經(jīng)濟研究院創(chuàng )始院長(cháng)朱克力介紹,國內各家大模型存在一些差異化,例如文心一言在語(yǔ)言理解、文本生成、問(wèn)答能力等方面具有優(yōu)勢,通義千問(wèn)則在機器翻譯、圖像識別、自然語(yǔ)言生成等方面較為突出,盤(pán)古大模型在此基礎上更能適應中文語(yǔ)境下的應用場(chǎng)景,MOSS則側重文本分類(lèi)、情感分析、知識推理。
上海市人工智能行業(yè)協(xié)會(huì )秘書(shū)長(cháng)鐘俊浩表示:“國內各家大模型還在發(fā)展初期,尚未定型,隨著(zhù)大模型技術(shù)不斷演進(jìn),未來(lái)可能會(huì )有更多新的特點(diǎn)和區別出現。”
AIGC國內應用另辟蹊徑
國內AI企業(yè)在圖像視覺(jué)領(lǐng)域成就突出,上海不少公司在自然語(yǔ)言處理領(lǐng)域已位于前列
自ChatGPT“出圈”以來(lái),國內類(lèi)GPT產(chǎn)品在短短3個(gè)月內呈現爆發(fā)式增長(cháng)態(tài)勢,這也引起不少人質(zhì)疑:既然國內各大互聯(lián)網(wǎng)廠(chǎng)商在多年前已布局大模型和AIGC(人工智能生成內容),為什么起了大早卻趕了晚集?
“無(wú)需苛責中國沒(méi)有出現GPT這種現象級產(chǎn)品,因為GPT的能力涌現是超預期的,只有當基礎模型被喂養足夠多的數據,有足夠大的算力,才能出現如此驚奇的涌現能力。”鐘俊浩對此非常坦然,此前主流的自然語(yǔ)言訓練模型(如谷歌BERT)更偏向于雙向自編碼,而GPT作為單向自回歸的生成式模型,技術(shù)路線(xiàn)較為小眾,最初也不為業(yè)界看好。
更關(guān)鍵的是,GPT模型需要大量的數據和計算資源進(jìn)行訓練。有專(zhuān)家估算,ChatGPT的訓練門(mén)檻是一萬(wàn)張高性能GPU芯片,成本約10億元,模型訓練算力可達每秒一千萬(wàn)億次,需運行3640天。“技術(shù)方向的選擇、投入資源多少、研究時(shí)間的長(cháng)短都需要體系化考慮。”他認為,ChatGPT的出現證明了技術(shù)路線(xiàn)的可行性,國內加快追趕步伐也不算晚。
值得一提的是,上海不少公司在自然語(yǔ)言處理領(lǐng)域已位于前列。樂(lè )言科技的文本對話(huà)AI在電商領(lǐng)域積累了多年行業(yè)經(jīng)驗,構建垂直行業(yè)大模型,實(shí)現智能客服機器人的大規模應用。達觀(guān)數據、壹沓科技等專(zhuān)注于專(zhuān)門(mén)從事文檔自動(dòng)化審核、寫(xiě)作等系統的開(kāi)發(fā),達觀(guān)還推出國產(chǎn)GPT“曹植”系統,面向金融、制造、政務(wù)等垂直行業(yè)開(kāi)發(fā)專(zhuān)用的大語(yǔ)言模型和類(lèi)似微軟Copilot的“達觀(guān)助手”。
相比文本對話(huà),國內AI企業(yè)在圖像視覺(jué)領(lǐng)域的成就更為突出,如圖像識別、圖像分類(lèi)、圖像處理等方面都有不少成功的應用。“深度學(xué)習在圖像和影像領(lǐng)域最早被市場(chǎng)接受,如人臉識別應用于安防領(lǐng)域,圖像識別應用于電商和廣告領(lǐng)域,醫學(xué)影像分析應用于醫療領(lǐng)域等。”鐘俊浩認為,AI在圖像視覺(jué)方面的應用能夠帶來(lái)較大的商業(yè)價(jià)值和社會(huì )效益,因此在國內受到更多關(guān)注和投入。
ChatGPT誕生不久,剛在業(yè)界打響第一槍之時(shí),中國的AI作畫(huà)已闖出了一條商業(yè)之路。
去年8月,基于文心大模型,百度推出“AI作畫(huà)”文心一格,只需輸入創(chuàng )想文字,選擇期望的畫(huà)作風(fēng)格,即可一鍵生成AI畫(huà)作。幾個(gè)月后,由文心一格續畫(huà)的陸小曼未盡稿連同海派畫(huà)家樂(lè )震文補全的同名畫(huà)作《未完·待續》,以110萬(wàn)元落槌成交,成了全球首個(gè)AI山水畫(huà)作的成功拍賣(mài)。
早在2019年,商湯就首次發(fā)布10億參數的視覺(jué)大模型,2022年發(fā)布320億參數的視覺(jué)大模型,這也是目前世界上最大的視覺(jué)模型。在最新發(fā)布的“日日新SenseNova”大模型中,商湯科技集成了大量的圖像視覺(jué)元素,比如“秒畫(huà)”文生圖創(chuàng )作平臺,可支持6K高清圖生成,還可根據自身需求訓練生成模型;“如影”AI數字人視頻生成平臺僅需一段5分鐘的真人視頻素材,就可生成聲音和動(dòng)作自然、口型準確、多語(yǔ)種精通的數字人分身。
國內GPT在起步階段
還需克服三方面差距
“國內互聯(lián)網(wǎng)平臺在大模型方面的布局和投入雖然已經(jīng)開(kāi)始,但是還需要克服技術(shù)、人才、商業(yè)模式等方面的難題,才能夠實(shí)現ChatGPT這種現象級產(chǎn)品。”國研新經(jīng)濟研究院創(chuàng )始院長(cháng)朱克力告訴記者。
國內各家大模型與GPT-4主要存在訓練數據集、超參數調整和解析能力三方面的差距:GPT-4在訓練時(shí)使用海量的自然語(yǔ)言數據,需要各種語(yǔ)言和主題的文本庫,國內大模型在訓練時(shí)需要更多的本地化數據來(lái)進(jìn)行訓練,以更好地理解本地語(yǔ)言和文化。同時(shí),GPT-4有足量的數據進(jìn)行超參數微調,以獲得更好的性能,國內大模型則需要更多時(shí)間來(lái)進(jìn)行超參數調整,以?xún)?yōu)化模型的性能。出色的解析能力也是GPT-4在理解自然語(yǔ)言上的優(yōu)勢之一,國內大模型需要對自然語(yǔ)言有深入的理解,離不開(kāi)NLP相關(guān)專(zhuān)業(yè)人才和技術(shù)積累,這也是國內人才市場(chǎng)中較為緊缺的。
上海市人工智能行業(yè)協(xié)會(huì )秘書(shū)長(cháng)鐘俊浩也有類(lèi)似的看法,OpenAI起步早、積累久、投入大,國內GPT在核心能力和全面性方面都存在較大差距,特別是推理能力、問(wèn)題理解能力、文本生成能力、系統工程能力等方面,“OpenAI在對于大模型涌現能力的把握上擁有更豐富的經(jīng)驗,怎么去發(fā)現和利用這樣智能的涌現,這種核心能力的差距,我們還需要一段時(shí)間來(lái)追趕。”
雖然GPT產(chǎn)品目前仍處于發(fā)展早期階段,但是讓大家看到了NLP巨大的想象空間。對此,鐘俊浩也認同這一觀(guān)點(diǎn):從基礎大模型到個(gè)人端的應用,從垂直領(lǐng)域大模型到商業(yè)端的應用,GPT技術(shù)可以重新構建互聯(lián)網(wǎng)和軟件。“個(gè)人用戶(hù)從C端感受到了GPT類(lèi)產(chǎn)品友好的交互體驗,而對企業(yè)用戶(hù)而言,GPT不能僅停留在交流界面的優(yōu)化上,實(shí)現效能提升才是作為B端工具的關(guān)鍵要點(diǎn)。”
正如阿里巴巴集團董事會(huì )主席兼CEO張勇所說(shuō):“一家企業(yè)的想象力終歸是有限的,釋放AI潛力要靠無(wú)數人探索。”隨著(zhù)GPT模型層和應用層各自演進(jìn),上下游產(chǎn)業(yè)鏈也將連帶受益。業(yè)內人士普遍認為,百度、阿里等大公司的優(yōu)勢在于有足夠的資金和算力去訓練大模型,大力出奇跡,而小公司可以扎根垂直領(lǐng)域,通過(guò)AI賦能SaaS(軟件運營(yíng)服務(wù)),打造競爭壁壘。(本報記者:查睿 來(lái)源:解放日報)
