中國人工智能(AI)企業(yè)深度求索(DeepSeek)日前發(fā)布其最新開(kāi)源模型DeepSeek-R1,用較低的成本達到了接近于美國開(kāi)放人工智能研究中心(OpenAI)開(kāi)發(fā)的GPT-o1的性能。這一進(jìn)展破解了全球人工智能產(chǎn)業(yè)長(cháng)期以來(lái)“堆算力”的路徑依賴(lài),其影響波及資本市場(chǎng)。業(yè)界人士認為,DeepSeek模型有望激發(fā)一波創(chuàng )新浪潮,推動(dòng)全球AI繼續進(jìn)步。
據深度求索公司官網(wǎng)介紹,DeepSeek-R1在后訓練階段大規模使用了強化學(xué)習技術(shù),在僅有很少標注數據的情況下極大提升了模型的推理能力,在數學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,測評性能與GPT-o1模型正式版接近。
國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過(guò)顯著(zhù)提高數據質(zhì)量和改進(jìn)模型架構,展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說(shuō),DeepSeek的模型現在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個(gè)數量級。
高盛集團也認為,DeepSeek新模型的成本遠低于現有模型,這意味著(zhù)開(kāi)發(fā)利用大模型的門(mén)檻降低,互聯(lián)網(wǎng)巨頭將面臨初創(chuàng )公司的潛在競爭。
英國《金融時(shí)報》發(fā)表的一篇評論文章指出,DeepSeek挑戰了人工智能產(chǎn)業(yè)在過(guò)去一段時(shí)間的核心信念,即認為更強大的硬件才是推動(dòng)人工智能發(fā)展的關(guān)鍵。
摩根士丹利認為,DeepSeek的模型表明,前沿AI能力可能不需要大量計算資源就能實(shí)現。通過(guò)巧妙的工程設計和高效的訓練方法,高效利用資源可能比純粹的計算能力更重要。這可能會(huì )激發(fā)一波創(chuàng )新浪潮,各家企業(yè)會(huì )探索具有成本效益的AI開(kāi)發(fā)和部署方法。
DeepSeek的模型是開(kāi)源共享的。近日,全球知名開(kāi)源平臺抱抱臉公司等多個(gè)團隊已宣布復現了DeepSeek-R1的訓練過(guò)程。美國“元”公司首席AI科學(xué)家楊立昆在社交媒體上發(fā)文說(shuō),DeepSeek-R1的面世,意味著(zhù)開(kāi)源模型正在超越閉源模型。
英國《金融時(shí)報》的評論文章說(shuō),開(kāi)源模型DeepSeek-R1對全球用戶(hù)產(chǎn)生極大吸引力,有利于推動(dòng)人工智能技術(shù)的開(kāi)發(fā)和應用。文章說(shuō),對于大多數商業(yè)用戶(hù)來(lái)說(shuō),擁有一款足夠可靠并且好用的模型比擁有絕對領(lǐng)先的模型更重要。“并不是每個(gè)司機都需要一輛法拉利。像R1這樣模型的推理能力進(jìn)步,可能會(huì )為與客戶(hù)互動(dòng)或處理工作任務(wù)的‘智能體’帶來(lái)突破性變化。”如果能以更低的成本擁有這些模型,企業(yè)的盈利能力將提升。
瑞士瑞銀集團指出,如果AI訓練和推理成本顯著(zhù)降低,預計更多終端用戶(hù)將利用AI來(lái)改善他們的業(yè)務(wù)或開(kāi)發(fā)新的用途。(來(lái)源:經(jīng)濟參考報)

