21世紀經(jīng)濟報道記者孔海麗 北京報道
DeepSeek大幅拉低了大模型開發(fā)與應(yīng)用成本,將壓力傳導(dǎo)給了所有廠商。
2月13日凌晨3點,OpenAI火力全開,其首席執(zhí)行官塞姆·奧特曼(Sam Altman)宣布,將很快發(fā)布GPT-5,并且免費無限使用。
北京時間13日上午,文心一言官宣,將于4月1日0時起全面免費,并且,即日起上線深度搜索功能。
這背后,既是大模型成本的不斷降低,也可以理解為,DeepSeek一定程度上拉開了真正的AI競爭——用戶流量爭奪也像技術(shù)迭代一樣,激烈異常。
包括阿里、字節(jié)、百度等AI大廠知情人士告訴21世紀經(jīng)濟報道記者,DeepSeek突然爆火,讓這個春節(jié)假期變成了“緊急加班期”。
“我們原本預(yù)判,C端認知分水嶺不會這么快到來,市場非常大、未來足夠遠,但是DeepSeek虹吸了海量消費者,今年我們會花大力氣做to C的產(chǎn)品開發(fā)和推廣?!眹鴥?nèi)一家大廠AI從業(yè)者說。
另有一位不愿具名的科技大廠AI相關(guān)崗位人士告訴21世紀經(jīng)濟報道記者,新的一年,用戶認知是OKR里的重點工作。
同在13日,騰訊讓旗下AI大模型騰訊元寶接入滿血版DeepSeek R1 671B,同時可選深度思考和聯(lián)網(wǎng)搜索,劍指用戶流量。與DeepSeek本尊相比,明顯“不卡了”。
從技術(shù)軍備競賽到用戶入口爭奪,大模型廠商的戰(zhàn)略重心正發(fā)生根本性轉(zhuǎn)向。
當推理成本以每年90%的速度下降,免費開放核心能力成為頭部玩家的必然選擇——通過零門檻接入快速占領(lǐng)開發(fā)者生態(tài),在應(yīng)用層爆發(fā)前構(gòu)建用戶護城河。
而中小廠商或?qū)⒚媾R“用不起算力,留不住客戶”的雙重困境。
“免費即標配”
DeepSeek將單次推理成本降至可忽略水平,大模型從技術(shù)制高點轉(zhuǎn)變?yōu)榛A(chǔ)設(shè)施,免費策略成為吸引用戶、建立生態(tài)的必經(jīng)之路。
快思慢想研究院院長、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長田豐認為,當前DeepSeek具有很強的復(fù)雜任務(wù)推理能力,又具備聯(lián)網(wǎng)搜索能力,搜索深度能達到50個相關(guān)網(wǎng)頁,所以免費版DeepSeek不僅在搶其他to C大模型App的用戶,還在搶搜索引擎的用戶與廣告流量。
百度此次宣布全面免費,或許意在“找回”用戶。作為最早一批面向市場的AI大模型,沒有人能夠否認文心一言拿到了第一批國人的AI心智。但隨著Kimi、豆包、DeepSeek等后起之秀輪番上場,屬于文心一言的活躍用戶,也在重新流向市場。
OpenAI也難置身事外。DeepSeek讓奧特曼首次承認OpenAI的閉源策略站在了歷史的錯誤一邊,C端用戶對DeepSeek的追捧,讓這家AI巨頭也開始擔憂起“AI入口”的地位是否能保。
如今,奧特曼把“期貨”都拿出來了,提前宣布,未來即將發(fā)布的GPT-5允許免費用戶在標準智能設(shè)置下無限制使用。同時為了留住付費群體,Plus和Pro用戶可以調(diào)用“高智能水平”和“更高智能水平”的功能。
這些業(yè)務(wù)舉措,本質(zhì)上是對用戶入口的焦土式爭奪。
與此同時,中小廠商的生存顯得愈發(fā)艱難。
算力成本對長尾廠商而言,是非常沉重的負擔。雖然訓(xùn)練大模型的成本已經(jīng)有明顯下降,但免費策略將迫使企業(yè)每日承擔數(shù)百萬次推理的沉沒成本。
跟進免費,經(jīng)濟賬算不過來;不跟進免費,幾乎等同于斷了發(fā)展的路。
“C端用戶一向喜愛在免費的AI模型中選擇領(lǐng)先性最好的。”田豐說,當免費成為標配,留給to C通用大模型中小廠商的時間不多了。
大模型價格戰(zhàn)再升級
正是DeepSeek開啟了大模型價格戰(zhàn),并不斷推向高潮。
DeepSeek V2模型于2024年5月發(fā)布,API定價為每百萬tokens輸入1元、輸出2元(32K上下文),僅為OpenAI GPT-4 Turbo價格的約1%(輸入價格僅為GPT-4 Turbo的1/70至1/35)。
這種“價格屠夫”策略直接打破了行業(yè)原有的定價體系,掀起了巨浪。例如,GPT-4 Turbo的定價為輸入每百萬tokens約70元,而DeepSeek-V2僅需1元,性價比優(yōu)勢顯著。
當年5月,百度迅速跟進,旗下文心大模型兩款主力模型ERNIE Speed和ERNIE Lite全面免費,并立即生效。阿里云緊隨其后,將通義千問GPT-4級主力模型Qwen-Long的API輸入價格從0.02元/千tokens降至0.0005元/千tokens,降幅達97%,價格僅為GPT-4的1/400。字節(jié)跳動則推出豆包大模型,其pro-32k版本定價0.0008元/千tokens,號稱“比行業(yè)便宜99.3%”,相當于1元可處理284張720P的圖片。
2024年底2025年初,競爭繼續(xù)升級。阿里云于1月1日宣布通義千問視覺理解模型全線降價超80%,Qwen-VL-Plus輸入價格低至0.0015元/千tokens,稱其為全網(wǎng)最低。
1月20日,DeepSeek-R1的API服務(wù)定價為每百萬輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens 16元(2月9日前的優(yōu)惠期減半),這一價格遠低于OpenAI o1的438元每百萬輸出tokens。
國際廠商亦被迫應(yīng)戰(zhàn)。OpenAI免費開放推理模型o3 mini,2024年5月發(fā)布的GPT-4o不僅性能提升,還允許免費使用基礎(chǔ)功能,同時API調(diào)用價格較此前版本減半。在DeepSeek-V3和R1壓力下,2025年2月6日,OpenAI發(fā)布的o3-mini模型,價格較前代降低63%。
“DeepSeek和其他各家AI基礎(chǔ)模型企業(yè),都在通過基礎(chǔ)設(shè)施優(yōu)化、工程化能力持續(xù)降低成本。”田豐表示,2025年會是大模型的“成本年”。
一位AI資深觀察人士認為,免費即將成為大模型競爭常態(tài)的當下,廠商們需要探索新的盈利模式。比如增值服務(wù)、數(shù)據(jù)銷售、廣告投放等。通過為用戶提供更多的價值,在其他領(lǐng)域?qū)崿F(xiàn)商業(yè)價值的最大化。
端側(cè)應(yīng)用初具爆發(fā)態(tài)勢
價格戰(zhàn)的底層驅(qū)動力是推理成本的大幅下降。
以文心大模型為例,其日均調(diào)用量從2023年的不足5000萬次躍升至2024年的15億次,規(guī)模效應(yīng)顯著攤薄單位成本。阿里云則通過自研芯片和算力優(yōu)化,將通義千問長文本處理成本壓縮至行業(yè)最低。
技術(shù)迭代也加速了降價進程。文心一言的深度搜索功能集成了多模態(tài)輸入與專家級內(nèi)容生成能力,可調(diào)用外部工具處理復(fù)雜任務(wù),使其能夠以更低成本覆蓋更廣泛場景。字節(jié)跳動的豆包模型則憑借火山引擎的高效算力調(diào)度,實現(xiàn)TPM(每分鐘請求數(shù))限額達到行業(yè)標準的2.7-8倍,進一步降低邊際成本。
DeepSeek是這方面的極致代表,其兩款模型訓(xùn)練成本僅為560萬美元左右,約為OpenAI同類模型的十分之一,它通過優(yōu)化算法采用MoE架構(gòu)、多頭潛在注意力(MLA)等技術(shù),高效硬件利用,GPU集群使用效率遠超行業(yè)平均水平,顯著降低了算力需求。
短期看,成本下降催生了醫(yī)療、教育、創(chuàng)意等領(lǐng)域的應(yīng)用浪潮;長期看,免費模式與多模態(tài)能力將重塑行業(yè)生態(tài)。
由DeepSeek引發(fā)的端側(cè)AI應(yīng)用熱潮正席卷全球。
田豐表示,“DeepSeek時刻”帶來了各行各業(yè)使用AI的“成本拐點”,開源意味著用戶可以隨意修改模型權(quán)重和訓(xùn)練過程,同時二次開發(fā)商用時還不需要License費用,這是全球開發(fā)者的創(chuàng)新機會。
“極低的推理成本、運營成本,會直接激活一大波AI應(yīng)用創(chuàng)新浪潮?!碧镓S說,眾人拾柴火焰高,國產(chǎn)大模型“操作系統(tǒng)”上將會涌現(xiàn)出超級AI應(yīng)用,讓用戶規(guī)模、市場需求呈指數(shù)級上升。
與此同時,其他廠商也在擴大AI應(yīng)用的規(guī)?;涞?。數(shù)據(jù)顯示,文心大模型在醫(yī)療、教育等垂直領(lǐng)域的AI Agent應(yīng)用快速普及。阿里云和百度與教育、醫(yī)療機構(gòu)合作,大幅提升了產(chǎn)業(yè)效率。
AI觀察人士表示,一系列最新模型以低成本、高性能和跨場景兼容性,將推動AI技術(shù)從云端向終端設(shè)備滲透,重構(gòu)軟硬件生態(tài),開啟“端側(cè)AI元年”。
從芯片到應(yīng)用的生態(tài)重構(gòu)
DeepSeek以低成本高效率為特征的崛起,引發(fā)全球科技巨頭競相合作。
海外方面,英偉達、亞馬遜、微軟等已接入其API,英特爾已針對DeepSeek進行硬件優(yōu)化,使開發(fā)者能以更低成本部署復(fù)雜任務(wù);國內(nèi)華為云、騰訊云、阿里云等頭部云服務(wù)商,三大運營商,以及大批科技企業(yè)和上市公司,都已宣布加入生態(tài)。
DeepSeek的工程技術(shù)路線的創(chuàng)新和開源策略,帶動了產(chǎn)業(yè)鏈上下游的爆發(fā)。
在硬件層,端側(cè)AI芯片需求激增,國產(chǎn)芯片廠商迎來機遇。例如,華為昇騰系列芯片已適配DeepSeek模型,推動智能終端算力升級。
在軟件層,邊緣算力調(diào)度、模型輕量化工具等開發(fā)需求旺盛。IDC預(yù)測,預(yù)計中國的生成式AI軟件市場規(guī)模2025年將達35.4億美元。Omdia的報告稱,未來五年,中國的GenAI軟件收入將增長超過四倍。
在應(yīng)用層,DeepSeek在C端掀起了一場聲勢浩大的AI科普浪潮,“你用DeepSeek了嗎?”幾乎成為一句問候語。
據(jù)高盛最近發(fā)布的《生成式AI Part X:在開源模型性能的背景下審視行業(yè)格局》報告測算,DeepSeek通過端云協(xié)同架構(gòu)實現(xiàn)成本優(yōu)化,可使企業(yè)運營成本降低30%,企業(yè)計算資源消耗平均降低40%以上,同時效率提升30%。
DeepSeek本地化部署避免敏感數(shù)據(jù)上傳云端,符合醫(yī)療、金融等行業(yè)的合規(guī)要求。未來,AI Agent可望在智能制造、智慧醫(yī)療、金融風控等領(lǐng)域加速落地。在自動駕駛、工業(yè)質(zhì)檢等場景,端側(cè)推理延遲降至毫秒級,較云端方案提升5倍。
田豐向21世紀經(jīng)濟報道記者表示,DeepSeek通過領(lǐng)先性能、低成本、開源、快速迭代等特點,加速中國互聯(lián)網(wǎng)應(yīng)用、傳統(tǒng)軟件應(yīng)用、人機協(xié)同服務(wù)、具身智能等實現(xiàn)規(guī)?;涞?。全球開發(fā)者逐步向中國開源大模型技術(shù)社區(qū)聚集,并貢獻源代碼和創(chuàng)新產(chǎn)品服務(wù)。
隨著AI應(yīng)用在2025年進入爆發(fā)期,一場由終端重塑引發(fā)的生態(tài)重構(gòu)正在拉開帷幕。