- 螞蟻百靈參戰(zhàn)大模型
- 2023年11月07日 來源:北京商報
提要:談及業(yè)務(wù)場景,螞蟻集團副總裁、百靈大模型負(fù)責(zé)人徐鵬透露,備案通過后,“百靈”將全線應(yīng)用到螞蟻的各個業(yè)務(wù)場景,并在各垂直領(lǐng)域創(chuàng)新研發(fā)產(chǎn)品,更多應(yīng)用產(chǎn)品即將面向社會開放。
巨頭再現(xiàn)新進展,大模型在各行各業(yè)落子不斷。11月6日,北京商報記者了解到,螞蟻百靈大模型已完成備案,基于百靈大模型的多款產(chǎn)品已陸續(xù)完成內(nèi)測。而引發(fā)關(guān)注的金融行業(yè)大模型層面,螞蟻集團也在不久前發(fā)布了金融大模型及兩款應(yīng)用產(chǎn)品。事實上,不僅是螞蟻,包括度小滿、樂信等綜合金融科技平臺,以及馬上消費、招聯(lián)消費金融等消費金融機構(gòu),都在布局金融行業(yè)大模型,多方爭雄,大模型激戰(zhàn)升級。
入場倒計時
11月6日,北京商報記者從螞蟻集團獲悉,根據(jù)國家七部委聯(lián)合公布的《生成式人工智能服務(wù)管理暫行辦法》指導(dǎo)要求,螞蟻百靈大模型已完成備案,基于百靈大模型的多款產(chǎn)品已陸續(xù)完成內(nèi)測,將向公眾開放。
本次通過備案的是螞蟻百靈語言大模型,該大模型采用TransFormer架構(gòu),基于萬億級Token語料訓(xùn)練而成,支持窗口長度達(dá)32K。
據(jù)了解,螞蟻大模型堅持自主研發(fā)、全棧布局,目前已形成包括大模型底層基礎(chǔ)設(shè)施、基礎(chǔ)大模型、行業(yè)大模型、應(yīng)用產(chǎn)品在內(nèi)的完整技術(shù)鏈條。
算力上,螞蟻建設(shè)了萬卡異構(gòu)集群,其中硬件算力效率(HFU)超過60%,集群有效訓(xùn)練時長占比90%以上,RLHF訓(xùn)練在同等模型效果下訓(xùn)練吞吐性能相較于業(yè)界方案提升3.59倍,推理性能相較于業(yè)界方案提升約2倍。
安全力方面,螞蟻研發(fā)了大模型安全一體化解決方案——蟻天鑒。“蟻鑒”平臺作為業(yè)內(nèi)首個大模型安全評測工具,支持50萬/天飽和式攻擊,全面覆蓋生成內(nèi)容數(shù)百類風(fēng)險;“天鑒”平臺可在大模型運行時,覆蓋八大類風(fēng)險,采用大模型對抗大模型的方式,使得風(fēng)險召回率大于99%,其Guardrails前置護欄功能,能精確召回20多類提問風(fēng)險意圖。
知識力上,螞蟻通過統(tǒng)一語料體系、數(shù)據(jù)預(yù)處理標(biāo)準(zhǔn)化、數(shù)據(jù)標(biāo)注強化、評測立體化,形成了完備的知識處理能力。其中,集評測數(shù)據(jù)集與評測框架一體化的大模型評測平臺——EVE,能支持語言大模型和多模態(tài)大模型一站式自動化評測。
據(jù)悉,在基礎(chǔ)大模型層面,除了本次通過備案的百靈語言大模型,螞蟻集團也在研發(fā)百靈多模態(tài)大模型,并已內(nèi)測。
易觀分析金融行業(yè)高級咨詢顧問蘇筱芮評價,本次通過備案的是螞蟻百靈語言大模型,大語言模型(LLM)是指建立在大量數(shù)據(jù)集上預(yù)訓(xùn)練的巨大模型,包括多項關(guān)鍵要素,其中就需要海量算力與數(shù)據(jù)支撐的大參數(shù);擁有智能能力,可解決它從未或極少見過的問題的能力;此外可加入預(yù)訓(xùn)練,僅需要少量數(shù)據(jù)的微調(diào)甚至無需微調(diào),就能夠解決多種通用型任務(wù)。
談及落地業(yè)務(wù)方向,在蘇筱芮看來,從上述特征來看,通用的大語言模型既可與螞蟻擅長的金融業(yè)務(wù)結(jié)合,向企業(yè)經(jīng)營關(guān)鍵環(huán)節(jié)進行滲透,促進業(yè)務(wù)能效及可持續(xù)發(fā)展能力大幅提升,同時也可以向整個阿里生態(tài)內(nèi)的其他本地生活、消費類等業(yè)務(wù)進行賦能,通過靈活的AI能力助力業(yè)務(wù)經(jīng)營。
談及業(yè)務(wù)場景,螞蟻集團副總裁、百靈大模型負(fù)責(zé)人徐鵬透露,備案通過后,“百靈”將全線應(yīng)用到螞蟻的各個業(yè)務(wù)場景,并在各垂直領(lǐng)域創(chuàng)新研發(fā)產(chǎn)品,更多應(yīng)用產(chǎn)品即將面向社會開放。
激戰(zhàn)升級
除了通用大模型,目前在行業(yè)大模型層面,螞蟻集團也布局了包括金融、醫(yī)療、安全等領(lǐng)域。例如今年9月,螞蟻對外發(fā)布金融大模型及兩款應(yīng)用產(chǎn)品:面向消費者的金融智能助理“支小寶2.0”和面向行業(yè)專家的金融業(yè)務(wù)助理“支小助”。
據(jù)介紹,支小寶2.0可為用戶提供高質(zhì)量的行情分析、持倉診斷、資產(chǎn)配置和投教陪伴等服務(wù),在知識力上,支小寶2.0的金融知識數(shù)據(jù)存儲量已達(dá)到百億級,能同時服務(wù)億級用戶。
浙江大學(xué)國際聯(lián)合商學(xué)院數(shù)字經(jīng)濟與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林評價,通過大模型來引導(dǎo)用戶進行投資決策,是非常好的輔助工具,也能賦能金融行業(yè),能解決一些金融消費級產(chǎn)品和用戶匹配的問題,螞蟻大模型應(yīng)該圍繞消費者的偏好來開發(fā)應(yīng)用,增加玩法。
在大模型的浪潮里,積極布局的并非螞蟻一家,尤其是今年以來,大模型產(chǎn)業(yè)進入“百模大戰(zhàn)”模式,賽道熱度不斷高漲。
例如消費金融領(lǐng)域, 11月3日,招聯(lián)消費金融發(fā)布消費金融行業(yè)首個130億參數(shù)開源大模型“招聯(lián)智鹿”。該模型落地消費金融實際業(yè)務(wù)場景,以客服場景為例,該模型可結(jié)合具體會話狀態(tài)與服務(wù)場景,實時精準(zhǔn)地定制回復(fù)話術(shù),助力客服工作提質(zhì)增效,節(jié)約時間成本近80%。據(jù)了解,該模型未來還將應(yīng)用于更多細(xì)分場景,如風(fēng)控管理、代碼生成、運營提升等,并在“智能體”技術(shù)、仿真模型、科技向善等方面持續(xù)探索。
無獨有偶,今年8月,馬上消費金融也發(fā)布了首個零售金融大模型“天鏡”,已在自動化營銷、風(fēng)控等實際業(yè)務(wù)場景應(yīng)用近6個月。馬上消費金融CTO蔣寧介紹,“目前,馬上消費每天能基于用戶1000萬個行為作出個性化的營銷和風(fēng)險判斷,每天做上億次模型計算,每秒可以處理150萬特征的計算”。
另外,今年一季度樂信自研大模型LexinGPT也正式對外亮相,樂信方面稱,已全面加速自研大模型在業(yè)務(wù)流程中的落地應(yīng)用,例如,通過深度學(xué)習(xí)算法,大模型可以更高效進行數(shù)據(jù)清洗、分類和計算,形成了不同場景下,用于預(yù)測用戶行為偏好的眾多精準(zhǔn)模型,包括借錢意愿度模型、營銷偏好模型、offer滿意度模型、還款意愿度模型、客戶流失預(yù)警模型等;另一方面,LexinGPT還在電銷、業(yè)務(wù)機器人等多個業(yè)務(wù)流程中深入落地使用。二季度,樂信加速金融垂直大語言模型應(yīng)用落地,在數(shù)據(jù)分析、數(shù)倉設(shè)計、風(fēng)控數(shù)倉升級優(yōu)化等領(lǐng)域落地,大大降低了數(shù)據(jù)分析的參與門檻、提高數(shù)據(jù)分析效率。
蘇筱芮認(rèn)為,垂直領(lǐng)域的金融大模型,對于金融行業(yè)來說有兩方面意義,一方面是前端對客的核心價值與場景,主要作用是能夠提升服務(wù)體驗,包括智能營銷、智能客服等方面,同時也可在中后臺運營管理方面,例如信貸審批、核保理賠等流程性任務(wù)層面提升工作效率;另一方面則是在智能投研、投顧等財富管理場景,以及量化交易等金融特定任務(wù)方面,需根據(jù)金融大模型開展訓(xùn)練與微調(diào),具備進一步探索創(chuàng)新的價值。
難點待解
不過,現(xiàn)階段,如何在金融領(lǐng)域發(fā)揮大模型的能力,業(yè)內(nèi)認(rèn)為還有多個挑戰(zhàn)需要解決。
正如中國工程院院士鄔賀銓不久前表示,金融大模型的發(fā)展目前仍面臨著三方面挑戰(zhàn)。首先是金融行業(yè)對數(shù)據(jù)安全性、隱私合規(guī)性都有著嚴(yán)格的要求。尤其是在風(fēng)控方面,對時效性與精準(zhǔn)性要求嚴(yán)格,而一般的基礎(chǔ)大模型透明性、可信性、專業(yè)性不足,很難直接遷移為金融大模型。同時是金融大數(shù)據(jù)在成本與質(zhì)量上的平衡問題。由于金融行業(yè)內(nèi)的數(shù)據(jù)難以共享,因此金融大模型的數(shù)據(jù)規(guī)模遠(yuǎn)遠(yuǎn)不及通用語料,導(dǎo)致金融大模型難以產(chǎn)生“智能涌現(xiàn)”的效果。此外則是本地私有部署需要自建算力設(shè)施,對軟硬件產(chǎn)品有嚴(yán)格的信創(chuàng)要求,而且參數(shù)規(guī)模大則算力成本高。
“技術(shù)局限尚需突破。”蘇筱芮同樣指出,目前大語言模型仍然為靜態(tài)數(shù)據(jù)驅(qū)動的學(xué)習(xí)范式,無法實現(xiàn)新知識的快速學(xué)習(xí)與迭代。尤其是涉及到時效數(shù)據(jù)與專有數(shù)據(jù)的場景下存在障礙。另外,巨大的模型訓(xùn)練與推理算力等成本拉低效益比,企業(yè)前期面臨大量的人力、物力投入,此外,大模型在參數(shù)體量巨大的情況下,仍然存在較高的推理成本。在她看來,安全合規(guī)可信應(yīng)用底線尚需剛性保障。另外,無論是大模型的訓(xùn)練推理,還是對話應(yīng)用的過程中,都存在過多的隱私暴露與數(shù)據(jù)安全風(fēng)險,這還有賴于技術(shù)突破和監(jiān)管合規(guī)的進一步建立。





