21世紀(jì)經(jīng)濟(jì)報(bào)道記者孔海麗 北京報(bào)道
DeepSeek大幅拉低了大模型開(kāi)發(fā)與應(yīng)用成本,將壓力傳導(dǎo)給了所有廠商。
2月13日凌晨3點(diǎn),OpenAI火力全開(kāi),其首席執(zhí)行官塞姆·奧特曼(Sam Altman)宣布,將很快發(fā)布GPT-5,并且免費(fèi)無(wú)限使用。
北京時(shí)間13日上午,文心一言官宣,將于4月1日0時(shí)起全面免費(fèi),并且,即日起上線深度搜索功能。
這背后,既是大模型成本的不斷降低,也可以理解為,DeepSeek一定程度上拉開(kāi)了真正的AI競(jìng)爭(zhēng)——用戶(hù)流量爭(zhēng)奪也像技術(shù)迭代一樣,激烈異常。
包括阿里、字節(jié)、百度等AI大廠知情人士告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,DeepSeek突然爆火,讓這個(gè)春節(jié)假期變成了“緊急加班期”。
“我們?cè)绢A(yù)判,C端認(rèn)知分水嶺不會(huì)這么快到來(lái),市場(chǎng)非常大、未來(lái)足夠遠(yuǎn),但是DeepSeek虹吸了海量消費(fèi)者,今年我們會(huì)花大力氣做to C的產(chǎn)品開(kāi)發(fā)和推廣。”國(guó)內(nèi)一家大廠AI從業(yè)者說(shuō)。
另有一位不愿具名的科技大廠AI相關(guān)崗位人士告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,新的一年,用戶(hù)認(rèn)知是OKR里的重點(diǎn)工作。
同在13日,騰訊讓旗下AI大模型騰訊元寶接入滿(mǎn)血版DeepSeek R1 671B,同時(shí)可選深度思考和聯(lián)網(wǎng)搜索,劍指用戶(hù)流量。與DeepSeek本尊相比,明顯“不卡了”。
從技術(shù)軍備競(jìng)賽到用戶(hù)入口爭(zhēng)奪,大模型廠商的戰(zhàn)略重心正發(fā)生根本性轉(zhuǎn)向。
當(dāng)推理成本以每年90%的速度下降,免費(fèi)開(kāi)放核心能力成為頭部玩家的必然選擇——通過(guò)零門(mén)檻接入快速占領(lǐng)開(kāi)發(fā)者生態(tài),在應(yīng)用層爆發(fā)前構(gòu)建用戶(hù)護(hù)城河。
而中小廠商或?qū)⒚媾R“用不起算力,留不住客戶(hù)”的雙重困境。
“免費(fèi)即標(biāo)配”
DeepSeek將單次推理成本降至可忽略水平,大模型從技術(shù)制高點(diǎn)轉(zhuǎn)變?yōu)榛A(chǔ)設(shè)施,免費(fèi)策略成為吸引用戶(hù)、建立生態(tài)的必經(jīng)之路。
快思慢想研究院院長(zhǎng)、原商湯智能產(chǎn)業(yè)研究院創(chuàng)始院長(zhǎng)田豐認(rèn)為,當(dāng)前DeepSeek具有很強(qiáng)的復(fù)雜任務(wù)推理能力,又具備聯(lián)網(wǎng)搜索能力,搜索深度能達(dá)到50個(gè)相關(guān)網(wǎng)頁(yè),所以免費(fèi)版DeepSeek不僅在搶其他to C大模型App的用戶(hù),還在搶搜索引擎的用戶(hù)與廣告流量。
百度此次宣布全面免費(fèi),或許意在“找回”用戶(hù)。作為最早一批面向市場(chǎng)的AI大模型,沒(méi)有人能夠否認(rèn)文心一言拿到了第一批國(guó)人的AI心智。但隨著Kimi、豆包、DeepSeek等后起之秀輪番上場(chǎng),屬于文心一言的活躍用戶(hù),也在重新流向市場(chǎng)。
OpenAI也難置身事外。DeepSeek讓奧特曼首次承認(rèn)OpenAI的閉源策略站在了歷史的錯(cuò)誤一邊,C端用戶(hù)對(duì)DeepSeek的追捧,讓這家AI巨頭也開(kāi)始擔(dān)憂(yōu)起“AI入口”的地位是否能保。
如今,奧特曼把“期貨”都拿出來(lái)了,提前宣布,未來(lái)即將發(fā)布的GPT-5允許免費(fèi)用戶(hù)在標(biāo)準(zhǔn)智能設(shè)置下無(wú)限制使用。同時(shí)為了留住付費(fèi)群體,Plus和Pro用戶(hù)可以調(diào)用“高智能水平”和“更高智能水平”的功能。
這些業(yè)務(wù)舉措,本質(zhì)上是對(duì)用戶(hù)入口的焦土式爭(zhēng)奪。
與此同時(shí),中小廠商的生存顯得愈發(fā)艱難。
算力成本對(duì)長(zhǎng)尾廠商而言,是非常沉重的負(fù)擔(dān)。雖然訓(xùn)練大模型的成本已經(jīng)有明顯下降,但免費(fèi)策略將迫使企業(yè)每日承擔(dān)數(shù)百萬(wàn)次推理的沉沒(méi)成本。
跟進(jìn)免費(fèi),經(jīng)濟(jì)賬算不過(guò)來(lái);不跟進(jìn)免費(fèi),幾乎等同于斷了發(fā)展的路。
“C端用戶(hù)一向喜愛(ài)在免費(fèi)的AI模型中選擇領(lǐng)先性最好的。”田豐說(shuō),當(dāng)免費(fèi)成為標(biāo)配,留給to C通用大模型中小廠商的時(shí)間不多了。
大模型價(jià)格戰(zhàn)再升級(jí)
正是DeepSeek開(kāi)啟了大模型價(jià)格戰(zhàn),并不斷推向高潮。
DeepSeek V2模型于2024年5月發(fā)布,API定價(jià)為每百萬(wàn)tokens輸入1元、輸出2元(32K上下文),僅為OpenAI GPT-4 Turbo價(jià)格的約1%(輸入價(jià)格僅為GPT-4 Turbo的1/70至1/35)。
這種“價(jià)格屠夫”策略直接打破了行業(yè)原有的定價(jià)體系,掀起了巨浪。例如,GPT-4 Turbo的定價(jià)為輸入每百萬(wàn)tokens約70元,而DeepSeek-V2僅需1元,性?xún)r(jià)比優(yōu)勢(shì)顯著。
當(dāng)年5月,百度迅速跟進(jìn),旗下文心大模型兩款主力模型ERNIE Speed和ERNIE Lite全面免費(fèi),并立即生效。阿里云緊隨其后,將通義千問(wèn)GPT-4級(jí)主力模型Qwen-Long的API輸入價(jià)格從0.02元/千tokens降至0.0005元/千tokens,降幅達(dá)97%,價(jià)格僅為GPT-4的1/400。字節(jié)跳動(dòng)則推出豆包大模型,其pro-32k版本定價(jià)0.0008元/千tokens,號(hào)稱(chēng)“比行業(yè)便宜99.3%”,相當(dāng)于1元可處理284張720P的圖片。
2024年底2025年初,競(jìng)爭(zhēng)繼續(xù)升級(jí)。阿里云于1月1日宣布通義千問(wèn)視覺(jué)理解模型全線降價(jià)超80%,Qwen-VL-Plus輸入價(jià)格低至0.0015元/千tokens,稱(chēng)其為全網(wǎng)最低。
1月20日,DeepSeek-R1的API服務(wù)定價(jià)為每百萬(wàn)輸入tokens 1元(緩存命中)/4元(緩存未命中),每百萬(wàn)輸出tokens 16元(2月9日前的優(yōu)惠期減半),這一價(jià)格遠(yuǎn)低于OpenAI o1的438元每百萬(wàn)輸出tokens。
國(guó)際廠商亦被迫應(yīng)戰(zhàn)。OpenAI免費(fèi)開(kāi)放推理模型o3 mini,2024年5月發(fā)布的GPT-4o不僅性能提升,還允許免費(fèi)使用基礎(chǔ)功能,同時(shí)API調(diào)用價(jià)格較此前版本減半。在DeepSeek-V3和R1壓力下,2025年2月6日,OpenAI發(fā)布的o3-mini模型,價(jià)格較前代降低63%。
“DeepSeek和其他各家AI基礎(chǔ)模型企業(yè),都在通過(guò)基礎(chǔ)設(shè)施優(yōu)化、工程化能力持續(xù)降低成本。”田豐表示,2025年會(huì)是大模型的“成本年”。
一位AI資深觀察人士認(rèn)為,免費(fèi)即將成為大模型競(jìng)爭(zhēng)常態(tài)的當(dāng)下,廠商們需要探索新的盈利模式。比如增值服務(wù)、數(shù)據(jù)銷(xiāo)售、廣告投放等。通過(guò)為用戶(hù)提供更多的價(jià)值,在其他領(lǐng)域?qū)崿F(xiàn)商業(yè)價(jià)值的最大化。
端側(cè)應(yīng)用初具爆發(fā)態(tài)勢(shì)
價(jià)格戰(zhàn)的底層驅(qū)動(dòng)力是推理成本的大幅下降。
以文心大模型為例,其日均調(diào)用量從2023年的不足5000萬(wàn)次躍升至2024年的15億次,規(guī)模效應(yīng)顯著攤薄單位成本。阿里云則通過(guò)自研芯片和算力優(yōu)化,將通義千問(wèn)長(zhǎng)文本處理成本壓縮至行業(yè)最低。
技術(shù)迭代也加速了降價(jià)進(jìn)程。文心一言的深度搜索功能集成了多模態(tài)輸入與專(zhuān)家級(jí)內(nèi)容生成能力,可調(diào)用外部工具處理復(fù)雜任務(wù),使其能夠以更低成本覆蓋更廣泛場(chǎng)景。字節(jié)跳動(dòng)的豆包模型則憑借火山引擎的高效算力調(diào)度,實(shí)現(xiàn)TPM(每分鐘請(qǐng)求數(shù))限額達(dá)到行業(yè)標(biāo)準(zhǔn)的2.7-8倍,進(jìn)一步降低邊際成本。
DeepSeek是這方面的極致代表,其兩款模型訓(xùn)練成本僅為560萬(wàn)美元左右,約為OpenAI同類(lèi)模型的十分之一,它通過(guò)優(yōu)化算法采用MoE架構(gòu)、多頭潛在注意力(MLA)等技術(shù),高效硬件利用,GPU集群使用效率遠(yuǎn)超行業(yè)平均水平,顯著降低了算力需求。
短期看,成本下降催生了醫(yī)療、教育、創(chuàng)意等領(lǐng)域的應(yīng)用浪潮;長(zhǎng)期看,免費(fèi)模式與多模態(tài)能力將重塑行業(yè)生態(tài)。
由DeepSeek引發(fā)的端側(cè)AI應(yīng)用熱潮正席卷全球。
田豐表示,“DeepSeek時(shí)刻”帶來(lái)了各行各業(yè)使用AI的“成本拐點(diǎn)”,開(kāi)源意味著用戶(hù)可以隨意修改模型權(quán)重和訓(xùn)練過(guò)程,同時(shí)二次開(kāi)發(fā)商用時(shí)還不需要License費(fèi)用,這是全球開(kāi)發(fā)者的創(chuàng)新機(jī)會(huì)。
“極低的推理成本、運(yùn)營(yíng)成本,會(huì)直接激活一大波AI應(yīng)用創(chuàng)新浪潮。”田豐說(shuō),眾人拾柴火焰高,國(guó)產(chǎn)大模型“操作系統(tǒng)”上將會(huì)涌現(xiàn)出超級(jí)AI應(yīng)用,讓用戶(hù)規(guī)模、市場(chǎng)需求呈指數(shù)級(jí)上升。
與此同時(shí),其他廠商也在擴(kuò)大AI應(yīng)用的規(guī)模化落地。數(shù)據(jù)顯示,文心大模型在醫(yī)療、教育等垂直領(lǐng)域的AI Agent應(yīng)用快速普及。阿里云和百度與教育、醫(yī)療機(jī)構(gòu)合作,大幅提升了產(chǎn)業(yè)效率。
AI觀察人士表示,一系列最新模型以低成本、高性能和跨場(chǎng)景兼容性,將推動(dòng)AI技術(shù)從云端向終端設(shè)備滲透,重構(gòu)軟硬件生態(tài),開(kāi)啟“端側(cè)AI元年”。
從芯片到應(yīng)用的生態(tài)重構(gòu)
DeepSeek以低成本高效率為特征的崛起,引發(fā)全球科技巨頭競(jìng)相合作。
海外方面,英偉達(dá)、亞馬遜、微軟等已接入其API,英特爾已針對(duì)DeepSeek進(jìn)行硬件優(yōu)化,使開(kāi)發(fā)者能以更低成本部署復(fù)雜任務(wù);國(guó)內(nèi)華為云、騰訊云、阿里云等頭部云服務(wù)商,三大運(yùn)營(yíng)商,以及大批科技企業(yè)和上市公司,都已宣布加入生態(tài)。
DeepSeek的工程技術(shù)路線的創(chuàng)新和開(kāi)源策略,帶動(dòng)了產(chǎn)業(yè)鏈上下游的爆發(fā)。
在硬件層,端側(cè)AI芯片需求激增,國(guó)產(chǎn)芯片廠商迎來(lái)機(jī)遇。例如,華為昇騰系列芯片已適配DeepSeek模型,推動(dòng)智能終端算力升級(jí)。
在軟件層,邊緣算力調(diào)度、模型輕量化工具等開(kāi)發(fā)需求旺盛。IDC預(yù)測(cè),預(yù)計(jì)中國(guó)的生成式AI軟件市場(chǎng)規(guī)模2025年將達(dá)35.4億美元。Omdia的報(bào)告稱(chēng),未來(lái)五年,中國(guó)的GenAI軟件收入將增長(zhǎng)超過(guò)四倍。
在應(yīng)用層,DeepSeek在C端掀起了一場(chǎng)聲勢(shì)浩大的AI科普浪潮,“你用DeepSeek了嗎?”幾乎成為一句問(wèn)候語(yǔ)。
據(jù)高盛最近發(fā)布的《生成式AI Part X:在開(kāi)源模型性能的背景下審視行業(yè)格局》報(bào)告測(cè)算,DeepSeek通過(guò)端云協(xié)同架構(gòu)實(shí)現(xiàn)成本優(yōu)化,可使企業(yè)運(yùn)營(yíng)成本降低30%,企業(yè)計(jì)算資源消耗平均降低40%以上,同時(shí)效率提升30%。
DeepSeek本地化部署避免敏感數(shù)據(jù)上傳云端,符合醫(yī)療、金融等行業(yè)的合規(guī)要求。未來(lái),AI Agent可望在智能制造、智慧醫(yī)療、金融風(fēng)控等領(lǐng)域加速落地。在自動(dòng)駕駛、工業(yè)質(zhì)檢等場(chǎng)景,端側(cè)推理延遲降至毫秒級(jí),較云端方案提升5倍。
田豐向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示,DeepSeek通過(guò)領(lǐng)先性能、低成本、開(kāi)源、快速迭代等特點(diǎn),加速中國(guó)互聯(lián)網(wǎng)應(yīng)用、傳統(tǒng)軟件應(yīng)用、人機(jī)協(xié)同服務(wù)、具身智能等實(shí)現(xiàn)規(guī)模化落地。全球開(kāi)發(fā)者逐步向中國(guó)開(kāi)源大模型技術(shù)社區(qū)聚集,并貢獻(xiàn)源代碼和創(chuàng)新產(chǎn)品服務(wù)。
隨著AI應(yīng)用在2025年進(jìn)入爆發(fā)期,一場(chǎng)由終端重塑引發(fā)的生態(tài)重構(gòu)正在拉開(kāi)帷幕。