《行業(yè)數(shù)據(jù)挖掘應(yīng)用》由會員分享,可在線閱讀,更多相關(guān)《行業(yè)數(shù)據(jù)挖掘應(yīng)用(49頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、按一下以編輯母片標題樣式,按一下以編輯母片,第二層,第三層,第四層,第五層,*,Unleashing the Power of Data,Unleashing the Power of Data,按一下以編輯母片標題樣式,按一下以編輯母片,第二層,第三層,第四層,第五層,*,*,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,Unleashing the Power of Data,*,單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,Unleashing the Power of Data,數(shù)據(jù)挖掘,行業(yè)應(yīng)用,議程,數(shù)據(jù)挖
2、掘現(xiàn)狀,銀行行業(yè)應(yīng)用,電訊行業(yè)應(yīng)用,政府行業(yè)應(yīng)用,司法行業(yè)應(yīng)用,數(shù)據(jù)挖掘定義,通俗地講,數(shù)據(jù)挖掘就是對海量數(shù)據(jù)進行精加工;嚴格地說,數(shù)據(jù)挖掘是一種技術(shù),從大量的數(shù)據(jù)中抽取出潛在的、不為人知的有價值信息、模式和趨勢,然后以易于理解的可視化形式表達出來,其目的是為了提高市場決策能力、檢測異常模式、控制可預(yù)見風險、在經(jīng)驗?zāi)P突A(chǔ)上預(yù)言未來趨勢等。,數(shù)據(jù)挖掘方法,CRISP-DM,(,Cross-Industry Standard Process for Data Mining,)就是公認的、較有影響的方法論之一。,商業(yè)理解(,Business Understanding,),數(shù)據(jù)理解,(Data U
3、nderstanding),數(shù)據(jù)準備,(Data Preparation),建模,(Modeling),評估,(Evaluation),發(fā)布,(Deployment),。,數(shù)據(jù)挖掘過程,數(shù)據(jù)挖掘的過程就是一個不斷探索數(shù)據(jù)特征、建立和檢驗?zāi)P?,發(fā)現(xiàn)客戶消費行為特征的過程。,行業(yè)應(yīng)用過程,Characteristic Analysis,Multivariate model build,Reject Inference,Statistical Analysis,Customised Scorecard,Product Identification,File Data Availability,Sam
4、pling,Data Extraction/Cost,Data Integrity,Set cut-off Score,Implementation,Validation,Generic Scorecard,External Data Source,Scorecard Vendor,Outsourcing,Scorecard Monitoring,行業(yè)應(yīng)用分布,行業(yè)應(yīng)用方法,數(shù)據(jù)挖掘存在一個較長的應(yīng)用周期。,數(shù)據(jù)挖掘應(yīng)用的有效方法是:從一個較小的、關(guān)鍵的問題出發(fā),建立起相對有效的模型,并通過應(yīng)用實踐不斷檢驗和完善模型,逐步替使用者解決問題。,銀行行業(yè)應(yīng)用,1,、客戶細分,2,、存貸款業(yè)務(wù)交叉銷
5、售,3,、預(yù)防客戶流失,4,、信用卡風險控制,5,、防范信貸風險及欺詐,6,、其他挖掘主題,客戶流失分析,業(yè)務(wù)目標:得出最可能流失的客戶名單,交由客戶服務(wù)部門采取挽留措施;,建模數(shù)據(jù):客戶個人資料、消費情況、歷史流失情況;,挖掘模型:神經(jīng)網(wǎng)絡(luò)、C5.0決策樹、線性回歸,部署數(shù)據(jù):新的客戶資料、消費情況,挖掘結(jié)果:預(yù)測出每個新客戶的流失概率,并從中取概率最大的一部分。,客戶流失分析,盡可能減少客戶流失,增加交叉銷售,吸引有價值的新客戶,在與客戶發(fā)生關(guān)系的整個過程中增加盈利能力。,客戶信用評分,業(yè)務(wù)目標:給每個客戶進行信用評分,以便確定客戶的貸款授信、信用卡透支額度等;,建模數(shù)據(jù):客戶個人資料、歷
6、史信用情況;,挖掘模型:神經(jīng)網(wǎng)絡(luò)、,C5.0,決策樹、線性回歸,部署數(shù)據(jù):新的客戶個人資料,挖掘結(jié)果:為新客戶給出信用評分(,0-1,),Credit,Decision,洗錢行為監(jiān)測,業(yè)務(wù)目標:分析客戶交易行為,從中找出少部分異常的交易,重點檢查是否為洗錢;,建模數(shù)據(jù):帳號及相應(yīng)的交易行為信息;,挖掘模型:,K-means,聚類、,TwoStep,聚類,部署數(shù)據(jù):同建模數(shù)據(jù);,挖掘結(jié)果:篩選出與大多數(shù)交易行為不同的交易記錄。,Risk,Grading,Debit$1344.12,Debit$234.01,Debit$987.56,Debit$6543.22,Debit$32423.11,Tot
7、al$2556.00,Debit$1344.12,Debit$234.01,Debit$987.56,Debit$6543.22,Debit$32423.11,Total$2556.00,Debit$1344.12,Debit$234.01,Debit$987.56,Debit$6543.22,Debit$32423.11,Total$2556.00,客戶風險控制,風險控制,客戶行為分析,客戶行為及資料聚類,low,high,high,E Profit,E Volume,E Losses,客戶評價分析,Low cutoffs,High,cutoffs,客戶欺詐分析,欺詐數(shù)據(jù)挖掘及評分,客戶財務(wù)
8、數(shù)據(jù)挖掘,1),公司之間的相似程度,它們的距離,合并。,2),公司有金融比率值高或很高,其他則低或很低。,3),金融分析家和有經(jīng)驗的投資者可以通過改變金融比率的選擇,開始新的聚類分析。他們可以從多次、多層聚類分析的結(jié)果中獲得更多有用的信息。,銀行其他應(yīng)用,(1),構(gòu)建信用評級模型來評估貸款申請人或信用卡申請人的信用風險,(2),構(gòu)建探測欺詐模型來對可能的欺詐交易及早發(fā)出警告,(3),更好地理解消費者和客戶(例如通過購物籃分析),(4),將用戶分類(例如通過聚類)。所獲結(jié)果可以用來制定郵寄類別、有針對性的廣告和促銷活動等。,(5),構(gòu)建模型來預(yù)測購買特定產(chǎn)品或服務(wù)的概率,從而推動交叉銷售和向上銷
9、售。,銀行行業(yè)案例,金融行業(yè),中國建設(shè)銀行,-,基于,SPSS,統(tǒng)計分析產(chǎn)品的風險預(yù)警管理系統(tǒng)光大銀行,-,采用,Clementine,產(chǎn)品,進行企業(yè)信貸風險數(shù)據(jù)數(shù)據(jù)分析中國銀行,-,建立信用風險評級管理系統(tǒng),有效組建內(nèi)部評級分析體系,First Union(,美國第六大銀行企業(yè),)-,現(xiàn)在我們確切明白了需要做些什么來滿足客戶的需求和期望,我們的交付系統(tǒng)也發(fā)生了重大變化。,Barclays Bank(,英國領(lǐng)先的金融服務(wù)集團,)-Barclays,的市場研究小組可以進行不斷增加的有效的調(diào)查,從而在研究客戶需 求時可以從數(shù)據(jù)中獲取更多的價值美國匯豐銀行,-,預(yù)測分析幫助我們在合適的時間、用合適的
10、產(chǎn)品和服務(wù)來接觸合適的人。而,SPSS,為我們提供了進行這些分析的有力武器。,SPSS,銀行業(yè)用戶,The World Bank Group,電訊行業(yè)應(yīng)用,電信運營商擁有許多成熟的數(shù)據(jù)庫應(yīng)用系統(tǒng),如網(wǎng)管系統(tǒng)、財務(wù)系統(tǒng)、計費賬務(wù)系統(tǒng)、,112,障礙管理系統(tǒng)、繳費銷賬系統(tǒng)等,并產(chǎn)生了大量的業(yè)務(wù)處理數(shù)據(jù)。,如果針對客戶關(guān)系管理相關(guān)決策分析的需求,對這些數(shù)據(jù)進行重組整合,就能充分利用這些寶貴的數(shù)據(jù),體現(xiàn)信息的真正價值。,電訊行業(yè)應(yīng)用,快速占領(lǐng)市場,擴大市場份額,牢牢掌握大客戶,防止流失,了解競爭對手,強化競爭優(yōu)勢,分析收入組成,制定戰(zhàn)略決策,發(fā)現(xiàn)欺詐規(guī)律,減少欺詐行為,電訊客戶流失,電信客戶流失涉及以
11、下的一些問題:,1.,哪些現(xiàn)有客戶即將流失,?2.,現(xiàn)有客戶的流失概率如何,?3.,哪些因素造成了客戶的流失,?4.,客戶流失對客戶自身會造成什么影響,?5.,客戶流失對電信公司的影響如何,?6.,不同類別客戶的流失情況有什么差別,?7.,如果某個客戶將要流失,他會在多長時間內(nèi)流失,?,銷售提升解決方案,制定或推薦什么樣的產(chǎn)品或者服務(wù)組合,然后我們就可以成功地對這些客戶設(shè)定有效的銷售戰(zhàn)略。發(fā)現(xiàn)現(xiàn)有和潛在的客戶需求,基于對客戶的行為描述來制定提供有針對性的策略來獲得最佳的新客戶。,25,電訊行業(yè)應(yīng)用,電訊行業(yè)應(yīng)用,欺詐防范解決方案,利用數(shù)據(jù)挖掘和統(tǒng)計分析技術(shù),對欠費行為進行事前預(yù)測,在惡意欠費發(fā)
12、生前就采取防范措施,就可以大幅減少欠費行為給運營商帶來的巨額損失。,利用數(shù)據(jù)描述技術(shù),可以對已知的欺詐性客戶和非欺詐性客戶進行有關(guān)的數(shù)據(jù)分析,發(fā)現(xiàn)可能影響客戶欠費的因素,然后,我們可以根據(jù)對以上因素的分析和統(tǒng)計,構(gòu)建預(yù)測模型,并應(yīng)用到當前客戶數(shù)據(jù)庫中,利用上述預(yù)測結(jié)果,我們可以適時地對大客戶進行重點跟蹤,并在必要時采取措施,以減少損失。,電訊行業(yè)案例,郵電通信,江蘇移動經(jīng)營分析系統(tǒng)項目,-,建立了大客戶異動分析、潛在大客戶預(yù)測、分類業(yè)務(wù)套餐測算和消費模型分析等四個專題模型內(nèi)蒙古移動市場細分項目,-,優(yōu)化配置營銷費用,提高營銷活動的市場回應(yīng)率曲靖聯(lián)通客戶流失分析項目,-,通過對用戶通話行為數(shù)據(jù)、
13、用戶資料數(shù)據(jù)和用戶使用曲靖聯(lián)通服務(wù)的情況等數(shù)據(jù)的深入分析,對影響流失各個因素進行了探索性分析并建立了預(yù)測客戶流失的,Logistic,回歸模型。英國電信,-,建立探索模型,更好地客戶的行為特征,CallCounter-CallCounter,用,SPSS,快速、方便地對呼叫數(shù)據(jù)進行分析,發(fā)現(xiàn)收入損失的地方,并提出解決建議。為其客戶節(jié)約了時間和費用。西南貝爾,-Gallagher,和他的同事們都在使用,SPSS,來進行高水平的、足以影響公司決策的數(shù)據(jù)分析。,美國,Verizon,公司,(,美國最大的無線通訊運營,)-,建立客戶流失分析模型并采取適當?shù)氖袌霾呗赃M行挽留,Vodafone,(埃及)公
14、司,-,對客戶的資料數(shù)據(jù)、客戶詳單(,CDR,)數(shù)據(jù)進行了聚類分析,并將結(jié)果用于新產(chǎn)品推出、交叉銷售和服務(wù)改進,國內(nèi)電信業(yè)用戶,江蘇移動,內(nèi)蒙移動,中國電信,遼寧移動,吉林移動,廣東電信研究院,江蘇電信,四川移動,海南移動,福建移動,深圳聯(lián)通,SPSS 電信業(yè)用戶,稅務(wù)行業(yè)應(yīng)用,地方稅務(wù)局要進行下一年度的稅收收入預(yù)測,以制訂新年度的工作計劃。,構(gòu)建稽查選案系統(tǒng)是稅務(wù)信息化建設(shè),司法行業(yè)應(yīng)用,司法應(yīng)用主題,網(wǎng)絡(luò)信息挖掘(聚類、決策樹、關(guān)聯(lián)規(guī)則),情報分析挖掘(聚類、決策樹、關(guān)聯(lián)規(guī)則),案件分析挖掘(聚類、主成分、神經(jīng)元網(wǎng)絡(luò)),嫌疑人分析(聚類、決策樹),串并案分析(關(guān)聯(lián)規(guī)則),情報分析挖掘,定量
15、分析,就是把已經(jīng)獲得的情報進行數(shù)理邏輯化的處理,就這些情報的真?zhèn)?、多寡、輕重、遠近等進行分析。作為一種解析模式,這個模式相對恒定,可以處理相關(guān)、相類的情報材料。,情報分析挖掘,六個分析區(qū)間,:,第一 區(qū) 間,:,情報來源分析(聚類、關(guān)聯(lián)),第二 區(qū) 間,:,情報真?zhèn)畏治觯ň垲悺Q策樹),第三 區(qū) 間,:,情報的歸類分析(決策樹),第 四區(qū) 間,:,情報指向分析(決策樹),第五 區(qū) 間,:,情報轉(zhuǎn)化分析(關(guān)聯(lián)規(guī)則),第六 區(qū) 間,:,情報矯正分析(聚類、主成分,/,因子、神經(jīng)元網(wǎng)絡(luò)),案件分析挖掘,利用計算機數(shù)據(jù)倉庫,可以在擬定的算法下對大量的行為記錄進行分析,從而發(fā)現(xiàn)案件的規(guī)律、趨勢,了解不同
16、案件行為之間的關(guān)聯(lián),譬如何種狀態(tài)會誘發(fā)何種行為,相信這是國安領(lǐng)域數(shù)據(jù)挖掘的新方向。,政府行業(yè)案例,政府機構(gòu),南京市地稅局,-,建立科學的稽查管理方案北京市地稅局,-,成功實現(xiàn)了科學評估納稅指標,科學預(yù)測稅收情況澳大利亞昆士蘭州消防和援救管理局,-,提取和分析累計超過,40,萬條重大事故報告的數(shù)據(jù),蘇格蘭東艾爾郡州議會,-,該州議會服務(wù)民眾的能力得到了提高魁北克健康和社會服務(wù)地方委員會,-,通過數(shù)據(jù)清理技術(shù)提高了數(shù)據(jù)的可利用性,美國弗吉尼亞青少年審判局,-SPSS,提高了我們的統(tǒng)計能力,并向我們提供了制定更好決策所需的信息,美國夏洛特,-,卡羅萊納警察局,-,對居民對社區(qū)警務(wù)的滿意度進行評估,英國農(nóng)漁食品部,(MAFF)-,使用,SPSS Clementine,的神經(jīng)網(wǎng)絡(luò)和規(guī)則歸納算法來發(fā)現(xiàn)數(shù)據(jù)中隱藏的模式,法國地方研究機構(gòu),IAURIF-,采用,SPSS Clementine,的規(guī)則歸納算法得到了意想不到的結(jié)果 英國西米德蘭警察局,-,確定關(guān)鍵案件的模式和趨勢,SPSS,能源,學術(shù),&,政府用戶,制造行業(yè)應(yīng)用,六大主題:,銷售與生產(chǎn)能力的關(guān)系分析,財務(wù)的數(shù)據(jù)挖掘,技術(shù)質(zhì)量與品種的優(yōu)化分