久久久久国产一级毛片高清版-久久久久国产一级毛片高清片-久久久久激情免费观看-久久久久久毛片免费播放-18女毛片-18女人毛片

深度丨 DeepSeek入局金融AI,一名“理科優(yōu)等生”的上崗路

2025年02月13日 19:58   21世紀(jì)經(jīng)濟(jì)報(bào)道 21財(cái)經(jīng)APP   李覽青

21世紀(jì)經(jīng)濟(jì)報(bào)道記者李覽青 上海報(bào)道

經(jīng)過(guò)兩年多的探索,金融行業(yè)已經(jīng)達(dá)成的共識(shí)是,大模型基于巨量數(shù)據(jù)語(yǔ)料學(xué)習(xí)實(shí)現(xiàn)快問(wèn)快答的“快思考”,仍不能滿足產(chǎn)業(yè)應(yīng)用側(cè)的實(shí)際業(yè)務(wù)需求,側(cè)重推理邏輯的“慢思考”必不可少。

去年9月,OpenAI-o1模型一經(jīng)推出就在全球AI市場(chǎng)掀起風(fēng)暴,正是因?yàn)槠渫ㄟ^(guò)強(qiáng)化學(xué)習(xí)和思維鏈拆解了復(fù)雜問(wèn)題,使大模型的推理能力得到大幅提高,特別是解決數(shù)理問(wèn)題和復(fù)雜任務(wù)的表現(xiàn)顯著優(yōu)于GPT系列的通用大模型。

然而,o1模型推理能力的提升是以響應(yīng)速度與算力消耗為代價(jià)的。與GPT系列通用大模型的“秒答”相比,o1的響應(yīng)速度大約需要10秒,且使用價(jià)格高昂。

在這個(gè)春節(jié)前,DeepSeek正式發(fā)布DeepSeek-R1推理大模型,并同步開(kāi)源模型權(quán)重,成為全球第一個(gè)成功復(fù)現(xiàn)o1能力的模型,在推理性能與o1持平的同時(shí),將相關(guān)算力消耗降到十分之一。通過(guò)官方API接入R1模型的輸入token(命中緩存)價(jià)格只有o1的五十分之一,未命中緩存以及輸出token的價(jià)格大約是二十七分之一。

談到R1帶來(lái)的這場(chǎng)技術(shù)熱潮,一家股份行數(shù)字化轉(zhuǎn)型部門高層難掩激動(dòng),向記者表示:“毫不夸張的說(shuō),DeepSeek研發(fā)出了目前國(guó)內(nèi)開(kāi)閉源模型中性價(jià)比最高的大模型。”他指出,這里的性價(jià)比既包括推理成本上的節(jié)約,也有業(yè)務(wù)場(chǎng)景應(yīng)用能力的大幅躍升。“過(guò)去很多上報(bào)申請(qǐng)資金的AI項(xiàng)目,或由于成本高昂,或是落地計(jì)劃不夠?qū)嶋H,最終沒(méi)能過(guò)批,但現(xiàn)在我相信未來(lái)會(huì)有大量創(chuàng)新項(xiàng)目涌現(xiàn)。”

多位受訪對(duì)象指出,R1模型通過(guò)開(kāi)源實(shí)現(xiàn)了“AI平權(quán)”,能釋放更多中小金融機(jī)構(gòu)的AI應(yīng)用想象力,形成更多確定性的應(yīng)用,但這樣的優(yōu)等生要真正“上崗”,依然離不開(kāi)傳統(tǒng)通用大模型在落地時(shí)的語(yǔ)料訓(xùn)練、算法調(diào)優(yōu)與算力加持。

另一個(gè)需要明確的是,多家金融機(jī)構(gòu)宣布接入了DeepSeek-V3和R1全尺寸模型,不意味著其他通用模型廠商的敗退。在下一個(gè)技術(shù)“奇點(diǎn)”出現(xiàn)前,通用大模型、深度推理大模型、多模態(tài)模型以及核心業(yè)務(wù)場(chǎng)景下的小模型仍將處于并存狀態(tài),根據(jù)不同場(chǎng)景實(shí)施應(yīng)用落地。

補(bǔ)齊短板:一個(gè)“全科211碩士”的誕生

“嗯,用戶的問(wèn)題是……”

這是DeepSeek在很多時(shí)候回復(fù)用戶的第一句話。當(dāng)你向DeepSeek提出一個(gè)問(wèn)題,它會(huì)通過(guò)十幾秒的深度思考后再給出回復(fù),并在回復(fù)中提到自己如何理解這一問(wèn)題、該問(wèn)題涉及哪些方面、用戶可能期待哪些方向的回復(fù),這就是深度推理大模型的“慢思考”過(guò)程。

R1模型的慢思考能力來(lái)自于DeepSeek的算法創(chuàng)新。相較于傳統(tǒng)大模型的“秒問(wèn)秒答”,R1不會(huì)提供直接響應(yīng),而是對(duì)指令內(nèi)容進(jìn)行多次推理,采用思維鏈、共識(shí)和檢索來(lái)生成最佳答案。由于模型每一次生成內(nèi)容都需要反復(fù)思考,因此也會(huì)創(chuàng)建出更多的輸出標(biāo)記,從而進(jìn)一步提高模型質(zhì)量。

在多位受訪對(duì)象看來(lái),R1帶來(lái)最大的變化是補(bǔ)齊了傳統(tǒng)通用大模型的推理短板

“整體來(lái)看,現(xiàn)在的大模型擁有全科211碩士的能力。”一位來(lái)自腰部券商的信息技術(shù)負(fù)責(zé)人向記者表示,一個(gè)具備完整能力的數(shù)字員工,需要兼具快思考和慢思考兩種能力,在R1的加持下,“慢思考”得以實(shí)現(xiàn)。

他坦言,在DeepSeek開(kāi)源R1之前,機(jī)構(gòu)要應(yīng)用深度推理模型只能選擇接入o1模型的API接口,但金融行業(yè)出于合規(guī)和數(shù)據(jù)安全考量,不可能在生產(chǎn)環(huán)節(jié)實(shí)際應(yīng)用,如今R1的出現(xiàn)可以分析復(fù)雜數(shù)據(jù)并通過(guò)思維鏈模擬人類的推理思維過(guò)程,性能與o1不相上下。

一家城商行大模型業(yè)務(wù)負(fù)責(zé)人也告訴記者:“之前我們接入的都是類似通義千問(wèn)、DeepSeek-V3這樣的通用大模型,始終沒(méi)有像o1這樣的深度推理大模型,R1模型發(fā)布后AI應(yīng)用才真正有了深度思考的能力。”

以智能營(yíng)銷場(chǎng)景為例,傳統(tǒng)通用大模型生成的營(yíng)銷話術(shù),或是基于規(guī)則系統(tǒng)對(duì)語(yǔ)料的組織整合,亦或是基于用戶給出的指令進(jìn)行快速反饋,但如果受到指令方的質(zhì)疑,可能無(wú)法通過(guò)多次交互達(dá)到營(yíng)銷效果,但基于推理大模型的深度理解,與用戶的交互將更加智能準(zhǔn)確。

算力、數(shù)據(jù):通用大模型走過(guò)的路一條也不能少

雖然R1模型是精于推理的“優(yōu)等生”,但要成為金融行業(yè)從業(yè)者,和傳統(tǒng)通用大模型在金融行業(yè)要經(jīng)受的考驗(yàn)是一樣的。

AI行業(yè)權(quán)威的Vectara HHEM人工智能幻覺(jué)測(cè)試顯示,DeepSeek-R1顯示出14.3%的幻覺(jué)率,遠(yuǎn)高于同為DeepSeek旗下V3模型3.9%的幻覺(jué)率,也超過(guò)了行業(yè)平均水平。

“學(xué)而不思則罔,思而不學(xué)則殆。”這句話在AI領(lǐng)域同樣適用。

R1模型的超強(qiáng)推理能力使得它在數(shù)理能力和邏輯推理方面表現(xiàn)優(yōu)秀,但在文科內(nèi)容輸出方面“過(guò)度發(fā)揮”從而產(chǎn)生幻覺(jué)。

一家金融機(jī)構(gòu)的首席信息官告訴記者,他在嘗試通過(guò)DeepSeek生成個(gè)人簡(jiǎn)歷時(shí)發(fā)現(xiàn),其表述出現(xiàn)“胡說(shuō)八道”的情況,但其他通用大模型基于公開(kāi)資料梳理較為準(zhǔn)確。

前述城商行人士向記者坦言,在邏輯推理能力方面,R1模型的表現(xiàn)是目前國(guó)內(nèi)大模型中最突出的,但在本地化部署輸入金融相關(guān)語(yǔ)料數(shù)據(jù)前,其專業(yè)知識(shí)理解依然存在偏差。

“灌進(jìn)去的知識(shí)也不是立刻就能用得上它的邏輯思維能力。”他表示,所有大模型在金融行業(yè)的落地,都需要解決算力和數(shù)據(jù)這兩大問(wèn)題。

一方面,AI戰(zhàn)略下語(yǔ)料需求帶來(lái)的數(shù)據(jù)治理仍是金融機(jī)構(gòu)的必答題,R1模型更大的幻覺(jué)問(wèn)題對(duì)高質(zhì)量數(shù)據(jù)集和知識(shí)庫(kù)提出更高的要求。

另一方面,在算力角度,記者了解到,金融機(jī)構(gòu)如果要本地部署大模型,其算力消耗包括兩個(gè)方面,一是本地部署激活所需的算力成本,二是推理過(guò)程中消耗的算力成本,前者是固定的成本支出,根據(jù)部署模型的不同尺寸會(huì)有所差異,后者則是關(guān)乎模型效果的成本支出。

不過(guò)與通用大模型相比,R1模型無(wú)論是在推理成本還是訓(xùn)練成本上都有顯著優(yōu)勢(shì),降低了算力端的落地應(yīng)用成本。

值得一提的是,雖然多家金融機(jī)構(gòu)都官宣接入DeepSeek-R1或V3相關(guān)模型,但各家金融機(jī)構(gòu)根據(jù)自身資源稟賦不同,或是成本支出、實(shí)際應(yīng)用等方面的考量,接入模型的尺寸是有差異的。

例如郵儲(chǔ)銀行、江蘇銀行接入的是輕量版DeepSeek-R1模型,另有一家大行金融科技部人士告訴記者,該行目前剛剛部署了14B的R1模型還在測(cè)試中。而前述腰部券商IT部門則是部署了R1的全尺寸模型。

前述城商行人士向記者表示,DeepSeek-R1模型有7B、14B、32B、671B等不同尺寸模型供用戶選擇,用戶基于個(gè)人或企業(yè)需求可自行部署,小尺寸模型是基于“滿血版”671B模型的蒸餾版,其性能和效果都會(huì)存在差異。但通義千問(wèn)旗下Qwen2.5開(kāi)源版本的最大尺寸是72B。

這意味著如果金融機(jī)構(gòu)想要通過(guò)本地化部署實(shí)現(xiàn)最佳效果,“滿血版”R1模型的本地化部署所需的顯存遠(yuǎn)高于Qwen2.5,這或許也是一些機(jī)構(gòu)從輕量模型開(kāi)始試水的一大原因。

變革已至:釋放創(chuàng)新應(yīng)用想象力

盡管不同金融機(jī)構(gòu)接入DeepSeek的深度有所差異,但對(duì)于金融行業(yè)來(lái)說(shuō),R1強(qiáng)大的推理能力仍將釋放創(chuàng)新應(yīng)用的想象力,帶來(lái)一場(chǎng)AI應(yīng)用的深度變革。

其實(shí)金融行業(yè)對(duì)DeepSeek也不陌生。記者了解到,早在一年多以前金融機(jī)構(gòu)嘗試AI大模型部署應(yīng)用時(shí),就接入了DeepSeek-Coder-V2開(kāi)源代碼語(yǔ)言模型。在接受21世紀(jì)經(jīng)濟(jì)報(bào)道記者采訪的7家金融機(jī)構(gòu)IT部門人士中,有5家機(jī)構(gòu)的智能代碼助手模型是基于Coder-V2提供服務(wù)的。

“我們嘗試過(guò)市面上大部分代碼語(yǔ)言模型,可能因?yàn)榛梅搅炕旧碓诹炕幊谭矫娴哪芰秃軓?qiáng),Coder-V2在代碼生成方面的能力會(huì)更好。”有受訪對(duì)象表示。

“DeepSeek通過(guò)開(kāi)源R1模型實(shí)現(xiàn)了‘AI平權(quán)’。”前述券商人士表示,原本這類推理模型需要超強(qiáng)的技術(shù)背景,如深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)推理、元學(xué)習(xí)等,但DeepSeek開(kāi)放的技術(shù)報(bào)告,讓所有機(jī)構(gòu)得以在自己的大模型上復(fù)現(xiàn)用于構(gòu)建R1模型的強(qiáng)化學(xué)習(xí)工作流,以知識(shí)蒸餾方式實(shí)現(xiàn)從DeepSeek到金融垂域大模型的能力轉(zhuǎn)移,從而實(shí)現(xiàn)AI應(yīng)用在復(fù)雜金融場(chǎng)景中的實(shí)戰(zhàn)效能。

他表示,在證券領(lǐng)域,將為行業(yè)探索"AI+經(jīng)紀(jì)"、"AI+投研"、“AI+投顧”、"AI+合規(guī)"、"AI+文檔"等創(chuàng)新模式開(kāi)辟新路徑、新場(chǎng)景。同時(shí),他所在公司計(jì)劃基于深度推理大模型進(jìn)一步增強(qiáng)AI診股、AI漲停分析、行研報(bào)告生成等AI功能。

值得關(guān)注的是,推理大模型的出現(xiàn)并不意味著通用大模型的撤退。如今,通用大模型、推理大模型、多模態(tài)模型和小模型正在不同金融業(yè)務(wù)場(chǎng)景發(fā)揮著各自的作用。

“對(duì)于我們這樣將AI作為核心戰(zhàn)略的銀行來(lái)說(shuō),DeepSeek將加速創(chuàng)新應(yīng)用的出現(xiàn),而對(duì)部分此前出于成本考量而沒(méi)有大規(guī)模實(shí)施AI戰(zhàn)略的中小金融機(jī)構(gòu)來(lái)說(shuō),或許會(huì)重構(gòu)其科技規(guī)劃。”一位銀行數(shù)字化轉(zhuǎn)型部門高層向記者表示,雖然AI在金融核心業(yè)務(wù)場(chǎng)景的落地實(shí)施還存在痛點(diǎn),但人工智能的目標(biāo)并不是代替業(yè)務(wù)人員做到100%的準(zhǔn)確,而是通過(guò)人工智能來(lái)提供金融服務(wù)的更多可能,在業(yè)務(wù)上產(chǎn)生更大的創(chuàng)新應(yīng)用價(jià)值。

“如果一家銀行的CIO對(duì)AI抱有這種不切實(shí)際的期望,或許是不理解智能時(shí)代AI的真正價(jià)值。”他表示。

關(guān)注我們

主站蜘蛛池模板: 色xx综合 | xx视频在线永久免费观看 | 国产精品天干天干 | 人人干人| 亚洲人成网站在线观看90影院 | 999精品国产 | 免费一级毛片正在播放 | 国内精品免费 | 中文字幕欧美视频 | 高清波多野结衣一区二区三区 | 六月丁香激情 | 亚洲精品国精品久久99热 | 00超粉嫩福利网站导航 | 国产一区二区三区在线看 | 日本人免费xxx在线视频 | 亚洲第一视频在线 | 国产精品免费观在线 | 成年人免费观看的视频 | 国产在线视频欧美亚综合 | 在线播放你懂的 | 国产一在线精品一区在线观看 | 国产成人啪午夜精品网站 | 日韩成人在线网站 | 中国大陆高清aⅴ毛片 | 成人免费手机在线看网站 | 国产高清不卡一区二区三区 | 男人女人的免费视频网站 | 国产高清一区二区三区四区 | 91成人免费在线视频 | 日韩高清性爽一级毛片免费 | 欧美成人免费全网站大片 | 黄色片黄色片黄色片黄色片黄色片 | 日韩理论在线观看 | 亚洲人成网址 | 激情午夜影院 | 在线观看一区二区精品视频 | 麻豆国产精品一二三在线观看 | 成年人网站在线观看免费 | 国产成人一区二区 | 天天搞天天操 | 最黄毛片 |