秋霞电影网午夜鲁丝片无码,真人h视频免费观看视频,囯产av无码片毛片一级,免费夜色私人影院在线观看,亚洲美女综合香蕉片,亚洲aⅴ天堂av在线电影猫咪,日韩三级片网址入口

數(shù)據(jù)挖掘應用實例銀行客戶數(shù)據(jù)分析課件

上傳人:陳** 文檔編號:253149457 上傳時間:2024-11-29 格式:PPT 頁數(shù):24 大?。?25KB
收藏 版權申訴 舉報 下載
數(shù)據(jù)挖掘應用實例銀行客戶數(shù)據(jù)分析課件_第1頁
第1頁 / 共24頁
數(shù)據(jù)挖掘應用實例銀行客戶數(shù)據(jù)分析課件_第2頁
第2頁 / 共24頁
數(shù)據(jù)挖掘應用實例銀行客戶數(shù)據(jù)分析課件_第3頁
第3頁 / 共24頁

下載文檔到電腦,查找使用更方便

15 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《數(shù)據(jù)挖掘應用實例銀行客戶數(shù)據(jù)分析課件》由會員分享,可在線閱讀,更多相關《數(shù)據(jù)挖掘應用實例銀行客戶數(shù)據(jù)分析課件(24頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、 ,*,*,銀行客戶數(shù)據(jù)分析,2007-09-01,1,背景,數(shù)據(jù),客戶群,服務,盈利,商業(yè)銀行擁有大量的個人客戶交易數(shù)據(jù)、個人客戶服務數(shù)據(jù)和個人客戶基本資料數(shù)據(jù)。在這些海量數(shù)據(jù)中,隱藏著大量的有價值的客戶信息。運用數(shù)據(jù)挖掘中的聚類分析技術可以從這些數(shù)據(jù)集中提取客戶的分類知識。聚類分析技術可以將性質、特征近似的數(shù)據(jù)對象歸屬在相同的群集中。商業(yè)銀行可以利用此技術分辨出能有效為之服務的最有價值的客戶,為他們提供更為個性化的服務,從而影響相關的客戶行為并最終達到提高盈利的目的。,2,數(shù)據(jù)集,客戶數(shù)據(jù)集包含,10,000,條客戶數(shù)據(jù),包含有,31,個特征,(,屬性,),分別為,:,Bank No(,銀

2、行代碼,其值有:,004,024,077,等,),Account num(,賬戶代碼,),Short Name(,客戶名字,),First Contact Date(,第一次接觸日期,),account open date(,賬戶開戶日期,),account balance(,賬戶當前余額,),account low balance(,賬戶曾經(jīng)最低余額,),account high balance(,賬戶曾經(jīng)最高余額,),balance category(,余額類型,),Statement Low Balance(,最低交易賬目,有正有負,),3,數(shù)據(jù)集,(屬性,),Statement Hig

3、h Balance(,最高交易賬目,),Statement Aggregate Debit Balance(,聚集透支賬目,),Statement Aggregate Debit Day(,透支賬目的天數(shù),),Statement Aggregate Credit Balance(,聚集存款賬目,),Statement Aggregate Credit Day(,存款賬目的開數(shù),),Return Check Count(,退回支票的次數(shù),),Status(,客戶狀態(tài),),Audit Granding(,授權級別,越高則風險越低,),Salary Before Last Month(,上一個月之前

4、自動付款的賬目,),Salary last Month(,上一個月自動付款的賬目,),Salary this Month(,這一個月自動付款的賬目,),Count of Credit this Month(,這個月存款的次數(shù),),4,數(shù)據(jù)集,(屬性,),Count of Debit this Month(,這個月取款的次數(shù),),Count of OD(,透支的次數(shù),),Amount of Deposit this Month(,本月存款的賬目,),Amount of Withdraw this Month(,本月取款的賬目,),Last Transaction Date(,上一次交易的日期,)

5、,Country Code(,客戶所屬的國家,),Birthday(,生日,),Sex(,性別,),5,數(shù)據(jù)預處理,我們選用,Weka,數(shù)據(jù)挖掘工具來對客戶的賬戶數(shù)據(jù)進行分析,因此所有的原始數(shù)據(jù)都必須轉換成能被,Weka,處理的數(shù)據(jù)集格式。,原始數(shù)據(jù)集的特征主要有四種類型的,分別是:數(shù)值型,(numeric),、標稱型,(nominal),、日期型,(date),和字符串型,(string),。,對于缺失的屬性值,因為,Weka,中的算法能自動處理屬性值缺失的情況,所以按,Weka,數(shù)據(jù)集的格式要求用“,?”,表示。,6,數(shù)據(jù)預處理,(,規(guī)格化,),數(shù)值型特征,:,采用如下公式規(guī)格化到,0,1

6、,區(qū)間,標稱型特征、日期型特征和字符串型特征保持不變,7,聚類分析,目標,我們的目的是對客戶進行分群,從而使銀行可以對不同群體的客戶提供不同的服務。因此聚類分析是對客戶進行自動分群的有效方法。,方法,k-means,算法,選取的特征,從,31,個原始屬性值中選取,23,個屬性用作聚類(都是數(shù)值型或標稱型的),聚類參數(shù),在經(jīng)過規(guī)格化處理后的數(shù)據(jù)集中,用,k-means,算法在選定的,23,個屬性上進行聚類,設定聚類數(shù)為,10.,8,各聚類大小,各聚類所包含的客戶數(shù)量如下表,聚類,客戶數(shù)量,聚類,1,145,聚類,2,69,聚類,3,133,聚類,4,6183,聚類,5,1985,聚類,6,213

7、,聚類,7,46,聚類,8,446,聚類,9,413,聚類,10,368,表,1,9,對聚類大小的分析,由表,1,可知,各聚類有大有小,且大小懸殊,但也合乎客戶關系處理的目的??蛻絷P系管理的往往是找出一小部分的特殊客戶(占,20%,左右)來進行特別地對待。在上表所示的,10,個聚類中,除去最大的聚類,4,后其余,9,個聚類的客戶數(shù)達,3818,人,占總客戶量的,38.18%,;除去最大的兩個聚類(聚類,4,和聚類,5,)后其余,8,個聚類的客戶數(shù)達,1833,人,占總客戶量的,18.33%.,大聚類可以再繼續(xù)細分,(,作為一個數(shù)據(jù)集再繼續(xù)進行聚類操作,或直接提高聚類個數(shù),),10,對各聚類結果

8、的處理,聚類后的各聚類結果的數(shù)據(jù)是規(guī)格化處理后的數(shù)據(jù)的結果,我們要直觀地分析各聚類的特點,必須把規(guī)格化的數(shù)據(jù)還原為原始數(shù)據(jù)。例如,最小值為,-10,000,,最大值為,1,000,000,的當前賬戶余額規(guī)格化為,0,1,后就難以理解各賬戶間存在的巨大差距,只有把它還原為原始的,-10000,1000000,才能使人直觀地理解其存在的差距。,把各聚類的數(shù)據(jù)集還原為原始數(shù)據(jù)后,再計算各特征的均值和標準差(數(shù)值型的特征);或者各標稱量的數(shù)量(標稱型的特征)。,11,聚類結果,分析,(,賬戶當前余額,),下表所示為,10,個聚類中各聚類的賬戶當前余額的正負及賬戶當前余額的均值和標準差,聚類,當前余額正

9、負,當前余額值,+,均值,標準差,聚類,1,145,0,24445.50,73408.73,聚類,2,69,0,29164.41,78077.97,聚類,3,133,0,152882.48,604633.58,聚類,4,6182,1,5571.17,23957.76,聚類,5,1985,0,22102.61,64825.42,聚類,6,119,94,8432.82,18680.66,聚類,7,46,0,2093.91,5798.48,聚類,8,380,66,7729.67,33233.11,聚類,9,0,413,-24728.68,61844.23,聚類,10,368,0,36264.24,9

10、3389.14,12,聚類結果,分析,(,賬戶當前余額,),最明顯的特殊客戶群有兩個,:,一個是,聚類,3,的客戶群,該聚類的當前余額均值達,十五萬,左右,比其他聚類的當前余額均值高出一個數(shù)量級。所以可以初步判斷該聚類的客戶是存款額高或者說是,高收入的客戶群,。另外,該聚類當前余額的標準差也很大,這說明在富有的客戶群中各客戶的收入差距也是很大的,有的達百萬、千萬、甚至上億,.,另一個明顯的特殊客戶群是,聚類,9,所示的客戶群。該客戶群中的,413,個客戶當前賬戶余額,都為負值,,且其均值達負兩萬多元。因此可以認定該客戶群是,高透支的客戶群,。后面還會分析的透支額、透支次數(shù)、透支時間等屬性的分析

11、同樣可以印證我們這個結論,.,13,聚類結果,分析,(,賬戶當前余額,),分析其他的八個聚類,聚類,4,是占,61.81%,的最大的,普通客戶群,,該客戶群中幾乎所有的客戶的當前余額都為正值,其均值為五千多,標準差為兩萬多不會太小,說明該龐大的客戶群還是可以再繼續(xù)細分的。,聚類,5,是占,19.85%,的第二大的客戶群,該客戶群比最大的客戶群聚類,4,來說它的當前余額均值高很多,達兩萬多元。因此可以說聚類,5,是,大量普通客戶中的中等存款額度的賬戶,(不包括低存款額度的賬戶)。,聚類,7,是賬戶當前余額為正值但存款額度較低的客戶群。,聚類,1,,,2,,,6,,,8,,,10,這五個聚類在當前

12、賬戶余額這一屬性上不能發(fā)現(xiàn)其明顯的特征,我們將在后續(xù)的其他屬性上的分析發(fā)現(xiàn)其聚類特征。,14,聚類結果,分析,(,最低及最高交易賬目,),下表所示為各聚類的最低交易賬目和最高交易賬目的均值與標準差,聚類,最低交易賬目,最高交易賬目,均值,標準差,均值,標準差,聚類,1,21710.57,67398.29,30649.77,87211.66,聚類,2,25422.80,71501.18,43955.38,100110.53,聚類,3,137112.35,560335.78,180985.33,617496.38,聚類,4,4664.66,21531.07,8869.53,31149.29,聚類,

13、5,15040.53,49724.59,43980.40,109262.32,聚類,6,-,9205.019,15566.66,15999.42,28870.03,聚類,7,1703.67,5667.138,5432.09,12143.86,聚類,8,-,9331.17,32766.50,26126.10,143537.61,聚類,9,-,27823.94,64684.33,-,12265.06,33615.10,聚類,10,16948.34,54751.53,74335.21,148054.73,15,聚類結果,分析,(,最低及最高交易賬目,),明顯聚類特征,:,聚類,3,的最低交易賬目和最

14、高交易賬目的均值都最高,這說明該類賬戶一般是有,大數(shù)額的資金流入,。,聚類,9,的最低交易賬目和最高交易賬目的均值都最小,屬于,透支最多的一類,,這說明該類賬戶是屬于,透支型的賬戶,,透支額維持在一個比較高的水平,且其最高交易額平均也達負一萬兩千多,說明這類型賬戶平均,很少正向資金存入,。,16,聚類結果,分析,(,最低及最高交易賬目,),聚類,4,這個最大的客戶群的最低和最高交易賬目的平均值保持在一個,中等,的水平,最低四千多,最高八千多;,第二大客戶,群聚類,5,的最低和最高交易賬目的均值都較聚類,4,高很多,這也同樣能夠說明聚類,5,是大量的,中等偏高的存儲客戶,。,聚類,7,的最低和最

15、高交易賬目都較低(正值),屬于,小額儲蓄客戶,。,聚類,6,和聚類,8,的最低交易賬目平均為負值(屬于透支),最高交易賬目平均為正值(屬于儲蓄),因此該類型客戶屬于,有儲蓄有透支的信用消費型客戶,。,聚類,1,,,2,,,10,在這一屬性上還不能分析出很明顯的聚類特征,17,聚類結果,分析,(,透支賬目,/,存款賬目,),下表所示為聚集透支賬目及透支賬目天數(shù)、聚集存款賬目及存款賬目天數(shù)的均值和標準差。,聚類,聚集透支賬目,透支賬目天數(shù),聚集存款賬目,存款賬目天數(shù),均值,標準差,均值,標準差,均值,標準差,均值,標準差,聚類,1,0,0,0,0,621553.94,1893055.17,26,0

16、,聚類,2,0,0,0,0,862332.67,2188134.51,26,0,聚類,3,0,0,0,0,3987771.63,15631280.74,26,0,聚類,4,0,0,0.00,0.03,145729.02,582818.60,26.00,0.03,聚類,5,0,0,0,0,599440.68,1531141.41,26,0,聚類,6,99402.83,202963.80,15.64,4.39,66568.08,130475.92,10.36,4.39,聚類,7,0,0,0,0,75543.65,239671.98,26,0,聚類,8,17345.04,51581.64,3.63,2.61,170027.62,856644.63,22.37,2.61,聚類,9,596935.00,1384363.12,25.39,1.31,2744.67,15650.27,0.61,1.31,聚類,10,0,0,0,0,907077.21,2107278.80,26,0,18,聚類結果,分析,(,透支賬目,/,存款賬目,),聚類,3,的聚集存款賬目很高,均值達三百多萬,該類型客戶幾乎不透支

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  sobing.com 裝配圖網(wǎng)版權所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!