春節前,中國人工智能企業DeepSeek發布了一個新的模型DeepSeek-R1,其基準測試性能可與OpenAI的o1相媲美,但其成本又大幅低于OpenAI,引發全球人工智能領域的轟動。
DeepSeek-R1并非是AI領域的顛覆性創新,而是通過架構創新與算法優化大幅提升了效率,它對世界的巨大沖擊主要源于其開源模式與低成本。OpenAI在發展出通用大模型后采取了閉源策略,企圖實現技術壟斷。
人工智能發展高度依賴英偉達先進芯片的算力支持,OpenAI以天量投資堆算力并且不斷迭代其專有模型,從而形成了類似于上世紀80年代的微軟與英特爾組建的“Wintel”聯盟。英特爾在一定程度上壟斷了先進算力,同時受到美國政府對其的銷售限制。特朗普政府就職后,立即宣布5000億美元投資AI的“星際之門”計劃——三家科技巨頭將在美國聯手打造人工智能(AI)基礎設施項目。
DeepSeek-R1則以開源的形式發布,任何人都可以下載使用并加以本地優化,這使得原先由巨量資本壟斷的AI突然實現了全球技術平權,絕大多數沒有能力實現主權AI(通過戰略性地使用人工智能來增強一個國家保護和促進其利益的能力)的國家,可以在DeepSeek開源模型基礎上參與和發展。DeepSeek也證明了擴大規模并不是AI升級的前提,人們不需要投資天量的算力就能以相對較低成本發展AI,降低了準入門檻。
目前,通過開源社區和全球下載渠道,DeepSeek的技術影響力已擴展至157個國家和地區,不僅在100多個國家和地區的蘋果App Store與安卓平臺下載排行榜首位,全球諸多機構、企業和政府也在本地部署DeepSeek-R1。中國許多金融機構、平臺企業、汽車公司、國有企業、高校等都相繼接入DeepSeek的系列模型,DeepSeek正在成為全球應用最廣泛的人工智能模型之一。
令硅谷驚嘆的DeepSeek之所以取得成功,其原因之一是它沒有完全按照大多數資本和企業的商業邏輯進行發展。中國還誕生了很多大模型,但許多投資者首要考慮的是其商業價值,即能夠有應用變現盈利的可能。這要求技術人員必須按照某種具有一定限制的路徑發展,同時技術跟隨的成本和風險也相對更低。DeepSeek的目標不在于跟隨硅谷的腳步并將相關技術加以商業應用,而是主要為了模型創新,研發時對應用落地與安全性等問題考慮較少。恰恰因此,DeepSeek實現了創新并成為最廣泛的應用之一。
當前,我們也要認識到,我國包括DeepSeek、通義千問、豆包、月之暗面等在內的大模型與美國相比仍然存在差距,既包括高制程人工智能芯片的差距,也包括在諸多高難度任務上算法與模型的差距。在此背景下,仍然需要DeepSeek這樣的團隊如之前一般專注于創新,而不是僅僅為了追求眼前的商業利益而轉向“應用開發”。毫無疑問,DeepSeek等AI企業應該繼續迭代其模型并不斷進步。我國在AI領域追趕世界先進水平需要更多堅持創新與長期主義的企業。同時,中國企業也還需要加快發展人工智能芯片,并在國產算力平臺上部署與訓練國產大模型,并不斷優化。
通過開源,DeepSeek將形成全球性的應用與創新生態系統,我國企業應抓住機遇走在前列。目前,OpenAI為了與DeepSeek競爭生態,隨即公布o3、Deep Research等技術進展,降低應用成本并開始與日本、印度等國家進行合作,從而尋求在全球市場鞏固其地位。然而,我國企業在推動DeepSeek生態系統時,絕不能將其作為資本炒作的工具,否則這將異化其價值,并導致我國構建AI生態體系的努力受到削弱。