?
如今,恒豐商業(yè)銀行信息化的銀行營(yíng)銷(xiāo)應用迅速發(fā)展,產(chǎn)生了大量的基于據的精準業(yè)務(wù)數據、中間數據和非結構化數據,大數大數據隨之興起。模型(′?_?`)要從這些海量數據中提取出有價(jià)值的??恒豐信息,為商業(yè)銀行的銀行營(yíng)銷(xiāo)應用各類(lèi)決策提供參考和服務(wù)(wu),需要結合大數據和人工智能技術(shù)?;趽木珳蕠獾拇螬?′д`)┌數匯豐、花旗和瑞士銀行是模型數據挖掘技術(shù)應用的先行者。在國內的恒豐商業(yè)銀行中,大數據的銀行營(yíng)銷(xiāo)應用思想和技術(shù)逐步開(kāi)始在業(yè)務(wù)中獲得實(shí)踐(╬ ò﹏ó)和嘗試。
面對日趨激烈的基于據的精??準行業(yè)內部競爭及互聯(lián)網(wǎng)金融帶來(lái)的沖擊,傳統的大數上門(mén)營(yíng)銷(xiāo)、電話(huà)營(yíng)銷(xiāo),模型甚至是掃街營(yíng)銷(xiāo)等方式跟不上時(shí)代的節奏。利用精準營(yíng)銷(xiāo)可節約大量的(de)人力物力、提高營(yíng)銷(xiāo)精準程度,并減少業(yè)務(wù)環(huán)節,無(wú)形中為商業(yè)銀行節約了大量的營(yíng)銷(xiāo)成本。
雖然恒豐銀行內部擁有客戶(hù)的基本信息(?_?;)和交易等ヽ(′?`)ノ大量數據,但是傳統的營(yíng)銷(xiāo)系統并沒(méi)有挖掘出行內大量數據的價(jià)值,??仍然停留在傳統的規則模型。當下大數據精準營(yíng)銷(xiāo)案例ˉ\_(ツ)_/ˉ大數據精準營(yíng)銷(xiāo)案例,恒豐銀行接入了大量的外部數據,有著(zhù)更多的維度,如果將內部數據與外部數據進(jìn)行交叉,則能產(chǎn)生更大的價(jià)值??蛻?hù)信息收集越全面、完整,( ?° ?? ?°)數據分析得到的結論就越趨向于合理和客觀(guān)。利用人工智能技術(shù),建立精準營(yíng)銷(xiāo)系統變得可能且必要。
恒豐銀行基于大數據的精準營(yíng)銷(xiāo)方案是利用大數據平臺上的機器學(xué)習模型深入洞察客戶(hù)行為、客戶(hù)需求,客戶(hù)偏好,挖掘潛出在客戶(hù),實(shí)現可持續的營(yíng)銷(xiāo)計劃。
周期/節奏
2016.4-2016.5 完成需求梳理和業(yè)務(wù)調研,并在此基礎??上進(jìn)行總體方案設計。
2016.???5-2016.8 整理銀行內、外部數據,根據營(yíng)銷(xiāo)需求制定客戶(hù)標簽和(he)設計文檔,實(shí)施用戶(hù)畫(huà)像。
2016.8-2016.10 在用戶(hù)畫(huà)像的基礎上,構建理財產(chǎn)品個(gè)性化推薦系統。其中包括個(gè)性化推薦算法調研,模型對比等一系列工ヾ(′?`)?作。
2016ヽ(′ー`)ノ.10-2017.1 客戶(hù)需求預測并對客戶(hù)價(jià)值進(jìn)行建模,并完善整??合精準營(yíng)銷(xiāo)應用模型。
201(′?`)7.1-2017.3 用戶(hù)畫(huà)像、個(gè)性化推薦、客戶(hù)價(jià)值預測等精準營(yíng)銷(xiāo)模型上線(xiàn)。
客戶(hù)名稱(chēng)/所屬分類(lèi)
恒豐銀行/客戶(hù)管理
任務(wù)/目標
根據零售業(yè)務(wù)營(yíng)銷(xiāo)要求,運用多??種數據源分析客戶(hù)行為洞察客戶(hù)需求,實(shí)??現精準營(yíng)銷(xiāo)與服務(wù),提高銀行客戶(hù)滿(mǎn)意度和忠誠度。
針對不同的客戶(hù)特征、產(chǎn)品特征和渠道特征,制定不同市場(chǎng)推廣策略。為了完成以上任務(wù),主要從以下幾個(gè)方面構建精準營(yíng)銷(xiāo)系統:
1.用戶(hù)畫(huà)像:結合用戶(hù)的歷史行為和基本屬性給用戶(hù)打標簽。
2.精準推薦系統:給用戶(hù)推薦個(gè)??性化理財產(chǎn)品, 例如在微信銀行中給每個(gè)客戶(hù)推薦他喜歡的產(chǎn)品,幫客戶(hù)找到其最適合的產(chǎn)品,增加產(chǎn)品的購買(mǎi)率。
3.需求預測和客??戶(hù)價(jià)值:新產(chǎn)品發(fā)售的時(shí)候,找到最有可能購買(mǎi)該產(chǎn)品的客戶(hù),進(jìn)行短信營(yíng)銷(xiāo),進(jìn)而提高產(chǎn)品響應率??蛻?hù)價(jià)值精準定位,根據客戶(hù)價(jià)值水平制定不同的推薦策略。銀行通過(guò)計(ji)算客戶(hù)使用其產(chǎn)品與服務(wù)后所形成??的實(shí)際業(yè)務(wù)收益,充分了解每一個(gè)客戶(hù)的貢獻度,為管理層提供決策支撐。
項目實(shí)施過(guò)程由??用戶(hù)畫(huà)??像,精準推薦系統,需求預測和客戶(hù)價(jià)值建模三部分組成,采用TDH機器學(xué)習平臺Discover所提供的算法(?_?;)和模型庫進(jìn)行開(kāi)發(fā)和驗證。
(一)用戶(hù)??畫(huà)像的建立
(二)精準推薦系統的建立
由于系統復雜,且篇幅有限,僅對其中最重要的理財推薦系統做詳細闡述。精準推薦系統架構圖如下。
2.1業(yè)務(wù)問(wèn)??題轉化為機器學(xué)習問(wèn)題
業(yè)務(wù)問(wèn)題
銀行理財產(chǎn)品個(gè)性化推薦給客戶(hù)。 例如在微信銀行中給每個(gè)客戶(hù)推薦此客戶(hù)喜歡的產(chǎn)品,幫客戶(hù)找到其最適合的產(chǎn)品,增加產(chǎn)品的購買(mǎi)率。
將業(yè)務(wù)問(wèn)題轉化為機器學(xué)習問(wèn)題
理財產(chǎn)品種類(lèi)繁多,產(chǎn)品迭代速度很快,客戶(hù)在繁多的產(chǎn)品中不能快速找到適合自己的產(chǎn)品,因此有必要建立一個(gè)自動(dòng)化推薦模型,建立客(′Д` )戶(hù)理財偏好??,給客戶(hù)推薦最適合的產(chǎn)品。
將銀行理財產(chǎn)品推薦業(yè)務(wù)問(wèn)題轉化為機器學(xué)習問(wèn)題,進(jìn)而利用人工智能技術(shù)提高推薦產(chǎn)品的點(diǎn)擊率和購買(mǎi)率。例如在恰當的時(shí)間,通過(guò)用戶(hù)偏好的渠道給用戶(hù)推薦產(chǎn)品,推薦的結果為用戶(hù)購買(mǎi)或者未購買(mǎi)。這個(gè)問(wèn)題可以看作一個(gè)典型機器學(xué)習二分類(lèi)問(wèn)題:基于歷史營(yíng)銷(xiāo)數據來(lái)訓練模型,讓模型自動(dòng)學(xué)到客戶(hù)購買(mǎi)的產(chǎn)品偏好,并預測客戶(hù)下次購買(mǎi)理(li)財產(chǎn)品的概率。對模ヽ(′ー`)ノ型預測出所有客戶(hù)對所有產(chǎn)品的響應概率進(jìn)行排序,可選擇客戶(hù)購買(mǎi)概率最高的topN個(gè)產(chǎn)品推薦給(′▽?zhuān)?)客戶(hù)。
下面將敘述如何構建該推薦預測模型。
2.2數據源準備
在建立的一個(gè)理財推薦模型之前,可以預見(jiàn)到相似的客戶(hù)可能會(huì )喜好相似的產(chǎn)品(需要表(???)征客戶(hù)和產(chǎn)品的?數據),同一個(gè)人的喜好可能具有連續性(購買(mǎi)歷史??交易數據,包括基金國債等),他的存款、貸款資金可能決定了他能購買(mǎi)什么檔次的理財等等。因ヽ(′▽?zhuān)?ノ此,我們需要準備以下數據。
客戶(hù)基本屬性:客戶(hù)性別,年齡,開(kāi)戶(hù)時(shí)間,評估的風(fēng)險等(deng)級等等。
客戶(hù)購買(mǎi)理財產(chǎn)品的歷史:在什么時(shí)候購買(mǎi)什么產(chǎn)品以及購買(mǎi)的金額。
客戶(hù)的存款歷史: 客戶(hù)歷史存款日均余額等。
客戶(hù)的貸款歷史: 客戶(hù)歷史貸款信息等。??
客戶(hù)工資:客戶(hù)工資的多少也決定了客戶(hù)購買(mǎi)理財的額度和偏好。
用戶(hù)畫(huà)??像提取的特征:用戶(hù)的AUM等級,貢獻度,??之前購買(mǎi)基金,國債的金額等。
2.3特征轉換和抽取
有了這么多數據,但是有一部分特征是算法不能直接處理的,??還有(′▽?zhuān)?一部分數據是算法不能直接利用的。
把不能處理的特征做一些轉換,處理成(cheng)算法容易處理的干凈特(′▽?zhuān)?)征。舉例如下:
產(chǎn)品特征。從理財產(chǎn)品信息表里面可以得到風(fēng)險等級,起點(diǎn)金額等。但是并沒(méi)有標志這款產(chǎn)品是否是新手專(zhuān)屬,是否是忠誠客戶(hù)專(zhuān)屬。這就需要我們從產(chǎn)品名(ming)字抽取這款產(chǎn)品的上述特征。
客戶(hù)交易的時(shí)間信息。(′?ω?`)同客戶(hù)的開(kāi)戶(hù)日期,孤立時(shí)間點(diǎn)的交(⊙_⊙)易信息不具有任何意義,??我們可以把交(jiao)易時(shí)間轉變?yōu)榫嚯x上次購買(mǎi)的時(shí)間間隔。
特征抽取
還有一部分數據算法不能直接利用,例如客??戶(hù)存款信息,客戶(hù)交易信息。我???們需用從理財交易和存款表中抽取可能有用的信息。
用戶(hù)存款信息:根??據我們的經(jīng)驗,客戶(hù)購買(mǎi)理財之前的存款變動(dòng)信息更能表明??客戶(hù)購買(mǎi)理財的真實(shí)想法,因此我們需要從??客戶(hù)歷史存款數據抽取客戶(hù)近三個(gè)月,近一個(gè)月,近一周的日均余額,以體(ti)現客戶(hù)存款變化ヾ(′▽?zhuān)??。
客戶(hù)交易信息:客戶(hù)最近一次購買(mǎi)的產(chǎn)品、購買(mǎi)的金額、及??其相關(guān)屬性,最近一個(gè)月購買(mǎi)的產(chǎn)品、購買(mǎi)的金額及其相關(guān)屬性等等。
以上例舉的只是部分特征。
2.4構造、劃分訓練和測試集
構造
其中客戶(hù)是否購買(mǎi)產(chǎn)品?是我們在有監督訓練的標簽,也就是我們建立的是一個(gè)預測客戶(hù)是否會(huì )購買(mǎi)產(chǎn)的??模型。
考慮到最終模型會(huì )預測將來(lái)的某時(shí)間客戶(hù)購買(mǎi)某種產(chǎn)品的概率,為了更真實(shí)的測試模型效果,以時(shí)間來(lái)切分訓練集和測試集。具體做法如下。假設我們有2016-09-01 ~ 2017-03-20 的理財購買(mǎi)相關(guān)數據。以2016-09-01 ~ 2017-03-19的理(li)財交易數據作為訓練,2??017-0??3-20這一天的客戶(hù)對每個(gè)產(chǎn)品是否購買(mǎi)的數據作為(wei)測試。以2016-09-01 ~ 2017-03-18的理財交易數據作為訓練,2017-03-19這一天的客戶(hù)對每個(gè)產(chǎn)品是否購買(mǎi)的數據作為測試,以此類(lèi)推。
2.5模型訓練
根據提取的??特征,組成樣本寬表,輸入到分類(lèi)模型,這里選擇了TDH平臺機器學(xué)習組件Discover所提供的近百個(gè)分布式算法進(jìn)行建模和訓練,同時(shí)我們還使用了特征的高階交叉特性進(jìn)??行推薦的預測和分析。
2.6模型評估
1.ROC曲線(xiàn)下面積(AUC)
2.logloss
3.推薦產(chǎn)品第一次命中rank的倒數(MRR)
4.TopN
針對銀行的理財推薦實(shí)際業(yè)務(wù),客戶(hù)當天絕┐(′д`)┌大多數是只購(°ロ°) !買(mǎi)了某一款理財,MRR(Mean Average Precision 的特殊情況)能反應這種情況下推薦的好壞。另一種直觀(guān)的評價(jià)指標是TopN,假定我們只推薦N個(gè)(ge)模型認為客戶(hù)最有可能購買(mǎi)的產(chǎn)品,并和真實(shí)情況比較,就能得到當天推薦的結果的混淆矩陣,TN,TP,FN,FP,recall,precision(′?`*)等。
我們在生產(chǎn)上驗證了最近十天的推薦效果,即測試了2017-03-ヽ(′?`)ノ20, 2017-03-19,…… , 2017-03-11等十天的推薦效果,以下是這些結果的評價(jià)。
AUC
Logloss
M┐(′д`)┌RR
0.8(╯°□°)╯︵ ┻━┻9
0.45
0.78
也可以把新客戶(hù)(??之前沒(méi)有購ヽ(′ー`)ノ買(mǎi)理財)和老客戶(hù)(至少購買(mǎi)過(guò)一次)分開(kāi)評估效果。 新客戶(hù)的購買(mǎi)占了整個(gè)理財購買(mǎi)的1/3 以上。
測試新客戶(hù)的預測效果,可以(yi)看出模型對冷啟動(dòng)問(wèn)題解決的好壞。
對新客戶(hù)的預測效果
AUC
Logloss
MRR
0.80
0.73
0.32
AUC
Logloss
MRR
0.38
2.7模型優(yōu)化
1.上線(xiàn)之前的優(yōu)化:特征提取,樣本抽??樣,參數調參
2.上線(xiàn)之后的迭代,根據實(shí)際的A/B testing和業(yè)務(wù)人員的建議改進(jìn)模型
(三)需求預測和客戶(hù)價(jià)值
經(jīng)典的客戶(hù)終身價(jià)值建模的模型基于客戶(hù)RFM模型。模型簡(jiǎn)單的把客戶(hù)劃分為幾個(gè)狀態(tài),有一定意義但不一定準確,??畢竟RFM模型用到的特征不全面,不能很好的表征客戶(hù)的價(jià)值以及客戶(hù)銀行關(guān)系管理。
為了方便的對客戶(hù)終身價(jià)值建模,有幾個(gè)假定條件。其一把客戶(hù)的購買(mǎi)價(jià)值近似為客戶(hù)為企業(yè)帶來(lái)的總收益,其二把未來(lái)時(shí)間定義在未來(lái)一個(gè)季度、半年或者一年。也就是我們通過(guò)預測客戶(hù)在下一個(gè)時(shí)間段內的購買(mǎi)價(jià)值來(lái)定義客戶(hù)的終身價(jià)值。因此,我們將預測的問(wèn)題分為兩個(gè)步驟:第一步ヽ(′ー`)ノ預測這個(gè)客戶(hù)在下一個(gè)階段是否會(huì )發(fā)生購買(mǎi)(需求預測)。第二步對預測有??購買(mǎi)行為的客戶(hù)繼續建模預測會(huì )購買(mǎi)多大產(chǎn)品價(jià)值。
3.1需求預測
提取客戶(hù)定活期(′?ω?`)存??款、pos機刷卡、渠道端查詢(xún)歷史等特┐(′д`)┌征,以這些特征作為輸入預測用戶(hù)在當前時(shí)間節點(diǎn)是否有購買(mǎi)需求,訓練和測試樣本構造如下:
1(′_`).歷史用戶(hù)購買(mǎi)記錄作為正樣本。
2.ヽ(′ー`)ノ抽樣一部分從未購買(mǎi)的理財產(chǎn)品的用戶(hù)作為負樣本集合Un,對于每一個(gè)正樣本Un中隨機選取一個(gè)用戶(hù)構造負樣本。
3.選取2016.04-201610 的購買(mǎi)數據作為訓練樣本,201??6.11的數據(???)作為測試樣??本。??
使用機器學(xué)習算法進(jìn)行分類(lèi)訓練和預測,重復(fu)上述實(shí)驗ヾ(′▽?zhuān)??,得??到下列結果:
AUC: 0.930451274
precision: 0.8993963783
recall: 0.8357507082
fmeasure: 0.86640627??29
進(jìn)一步對客戶(hù)分群之??后,可以更好的對新客戶(hù)進(jìn)行建模,對于老客戶(hù)我們可以進(jìn)一步提取他們的歷史??購買(mǎi)特征,預測他們(′?_?`)在下一段時(shí)(?⊿?)間內購買(mǎi)的產(chǎn)品價(jià)值(數量,金額等),對于新客戶(hù),可以進(jìn)根據他的存款量預測其第一次購買(mǎi)ヽ(′▽?zhuān)?ノ的產(chǎn)品價(jià)值,把存款客戶(hù)變成理財客戶(hù)。通(′?`)過(guò)分析客戶(hù)存款變動(dòng)于客戶(hù)購ヽ(′ー`)ノ買(mǎi)理財的關(guān)系,我們發(fā)現客戶(hù)購買(mǎi)理財的前一段時(shí)間內定活期的增加的有不(bu)同的模式,如下圖。
根據需求??預測模型,我們給出新客戶(hù)最有可能購買(mǎi)的top N 列表,然后由業(yè)??務(wù)人┐(′д`)┌員進(jìn)行市場(chǎng)推廣。
3.2客戶(hù)價(jià)值預測
進(jìn)一步預測有購買(mǎi)??需求的客戶(hù)的購買(mǎi)價(jià)值高低。這是個(gè)回ヽ(′ー`)ノ歸問(wèn)題,但是預測變量從二分類(lèi)變量變?yōu)轭A測連續的金額值。訓練的時(shí)候預測值取訓練周期內(一個(gè)月或者季度)客戶(hù)所購買(mǎi)的總金(′?`*)額。
算出客戶(hù)的當前價(jià)值(即當前階段購買(mǎi)的產(chǎn)品價(jià)值)和未來(lái)價(jià)值(預測的下一個(gè)階段的客戶(hù)價(jià)值)可以幫助我們鑒定客戶(hù)處于流失階段,或者上升階段,或者是??穩定階段。當前價(jià)值取的是當前時(shí)間前三個(gè)月的交易量。對流失階段高價(jià)值客戶(hù)可以適當給予營(yíng)銷(xiāo)優(yōu)惠,對于有購買(mǎi)意(???)向的客戶(hù)適當引導。如下圖所示。
結果/效果
一是提高銀行營(yíng)銷(xiāo)準確性。隨著(zhù)客戶(hù)不斷增加,理財產(chǎn)品也在不斷推陳出新,在實(shí)時(shí)精準營(yíng)銷(xiāo)平臺的幫助下,銀行從以前盲目撒網(wǎng)式的營(yíng)銷(xiāo)方式轉變到對(╯‵□′)╯不同客戶(hù)精準觸達,提高了理財產(chǎn)品的營(yíng)銷(xiāo)成功率,降低銷(xiāo)售和運作成本。理財產(chǎn)品推薦的上線(xiàn)以來(lái),產(chǎn)品推薦成功率比專(zhuān)家經(jīng)驗排序模型最高提升10倍。
二是增加銀行獲客數量。精準營(yíng)銷(xiāo)??系統洞察客戶(hù)潛在(╥_╥)需求和偏好,提高了銀行獲取目標客戶(hù)群的準確率。從數百萬(wàn)客戶(hù)中,通過(guò)機器學(xué)習模型,找到最有可能購買(mǎi)產(chǎn)品的客戶(hù)群,??通過(guò)渠道營(yíng)銷(xiāo),實(shí)現響應率提升。相比傳統盲發(fā)模式,發(fā)送原38%的短信即可覆蓋80%的客戶(hù)。
通過(guò)構建基于大數據的精準營(yíng)銷(xiāo)方案,恒豐銀行深入洞察客戶(hù)行為、需求、偏好(hao),幫助銀行深入了解客戶(hù),并打造個(gè)性化推薦系??統和建立客戶(hù)價(jià)值預測模型,實(shí)現可持續的營(yíng)銷(xiāo)計劃。