秋霞电影网午夜鲁丝片无码,真人h视频免费观看视频,囯产av无码片毛片一级,免费夜色私人影院在线观看,亚洲美女综合香蕉片,亚洲aⅴ天堂av在线电影猫咪,日韩三级片网址入口

數(shù)據(jù)挖掘概念和技術(shù)Cha

上傳人:wuxin****2020 文檔編號:253013370 上傳時間:2024-11-27 格式:PPT 頁數(shù):36 大小:482.50KB
收藏 版權(quán)申訴 舉報 下載
數(shù)據(jù)挖掘概念和技術(shù)Cha_第1頁
第1頁 / 共36頁
數(shù)據(jù)挖掘概念和技術(shù)Cha_第2頁
第2頁 / 共36頁
數(shù)據(jù)挖掘概念和技術(shù)Cha_第3頁
第3頁 / 共36頁

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《數(shù)據(jù)挖掘概念和技術(shù)Cha》由會員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)挖掘概念和技術(shù)Cha(36頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,2001-11-6,數(shù)據(jù)挖掘:概念和技術(shù),*,數(shù)據(jù)挖掘:概念和技術(shù),Chapter 6,張曉輝,復(fù)旦大學(xué)(國際)數(shù)據(jù)庫研究中心,2001-11-6,1,數(shù)據(jù)挖掘:概念和技術(shù),第6章:從大數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則挖掘,從交易數(shù)據(jù)庫中挖掘一維的布爾形關(guān)聯(lián)規(guī)則,從交易數(shù)據(jù)庫中挖掘多層次關(guān)聯(lián)規(guī)則,在交易數(shù)據(jù)庫和數(shù)據(jù)倉庫中挖掘多維關(guān)聯(lián)規(guī)則,從關(guān)聯(lián)挖掘到相關(guān)性分析,基于

2、約束的關(guān)聯(lián)挖掘,小結(jié),2001-11-6,2,數(shù)據(jù)挖掘:概念和技術(shù),什么是關(guān)聯(lián)挖掘?,關(guān)聯(lián)規(guī)則挖掘:,在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性、或因果結(jié)構(gòu)。,應(yīng)用:,購物籃分析,、,交叉銷售、產(chǎn)品目錄設(shè)計,、loss-leader analysis、,聚集、分類等。,舉例:,規(guī)則形式:“,Body,H,ead support,confidence”.,buys(x,“diapers”),buys(x,“beers”)0.5%,60%,major(x,“CS”)takes(x,“DB”),grade(x,“A”)1%,75%,2001-11-

3、6,3,數(shù)據(jù)挖掘:概念和技術(shù),關(guān)聯(lián)規(guī)則:基本概念,給定:(1)交易數(shù)據(jù)庫,(2),每筆交易是,:,一個項目列表(消費者一次購買活動中購買的商品),查找:,所有,描述一個項目集合與其他項目集合相關(guān)性的規(guī)則,E.g.,98%of people who purchase tires and auto accessories also get automotive services done,應(yīng)用,*,護(hù)理用品,(商店應(yīng)該怎樣提高護(hù)理用品的銷售?,),家用電器,*,(其他商品的庫存有什么影響,?),在產(chǎn)品直銷中使用,附加郵寄,Detecting,“ping-pong”ing of patients,f

4、aulty“collisions”,2001-11-6,4,數(shù)據(jù)挖掘:概念和技術(shù),規(guī)則度量:支持度與可信度,查找所有的規(guī)則,X&Y,Z,具有最小支持度和可信度,支持度,s,一次交易中包含,X、Y、Z,的,可能性,可信度,c,包含,X、Y,的交易中也包含,Z,的,條件概率,設(shè)最小支持度為,50%,最小可信度為,50%,則可得到,A,C,(50%,66.6%),C,A,(50%,100%),買尿布的客戶,二者都買的客戶,買啤酒的客戶,2001-11-6,5,數(shù)據(jù)挖掘:概念和技術(shù),關(guān)聯(lián)規(guī)則挖掘:路線圖,布爾,vs.,定量,關(guān)聯(lián),(基于,處理數(shù)據(jù)的類型),buys(x,“SQLServer”)buys

5、(x,“DMBook”),buys(x,“DBMiner”)0.2%,60%,age(x,“30.39”)income(x,“42.48K”),buys(x,“PC”)1%,75%,單維,vs.,多維,關(guān)聯(lián),(例子同上),單層,vs.,多層,分析,那個品種牌子的啤酒與那個牌子的尿布有關(guān)系,?,各種擴(kuò)展,相關(guān)性、因果分析,關(guān)聯(lián)并不一定意味著相關(guān)或因果,最大模式和閉合相集,添加約束,如,哪些“小東西”的銷售促發(fā)了“大家伙”的買賣?,2001-11-6,6,數(shù)據(jù)挖掘:概念和技術(shù),第6章:從大數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則挖掘,從交易數(shù)據(jù)庫中挖掘一維的布爾形關(guān)聯(lián)規(guī)則,從交易數(shù)據(jù)庫中挖掘多層次關(guān)聯(lián)規(guī)則,

6、在交易數(shù)據(jù)庫和數(shù)據(jù)倉庫中挖掘多維關(guān)聯(lián)規(guī)則,從關(guān)聯(lián)挖掘到相關(guān)性分析,基于約束的關(guān)聯(lián)挖掘,小結(jié),2001-11-6,7,數(shù)據(jù)挖掘:概念和技術(shù),關(guān)聯(lián)規(guī)則挖掘一個例子,對于,A,C:,support=support(,A,、,C,)=50%,confidence=support(,A,、,C,)/support(,A,)=66.6%,Apriori,的基本思想:,頻繁項集的任何子集也一定是頻繁的,最小值尺度 50%,最小可信度 50%,2001-11-6,8,數(shù)據(jù)挖掘:概念和技術(shù),關(guān)鍵步驟:挖掘頻繁集,頻繁集,:是指滿足最小支持度的項目集合,頻繁集的子集也一定是頻繁的,如,如果,AB,是頻繁集,則,A

7、,B,也一定是頻繁集,從1到,k(k-,頻繁集)遞歸查找頻繁集,用得到的頻繁集生成關(guān)聯(lián)規(guī)則,2001-11-6,9,數(shù)據(jù)挖掘:概念和技術(shù),Apriori,算法,連接,:,用,L,k-1,自連接得到,C,k,修剪,:,一個,k-,項集,如果他的一個,k-1,項集(他的子集)不是頻繁的,那他本身也不可能是頻繁的。,偽代碼,:,C,k,:Candidate itemset of size k,L,k,:frequent itemset of size k,L,1,=frequent items;,for,(,k,=1;,L,k,!=,;,k,+),do begin,C,k+1,=candidates

8、 generated from,L,k,;,for each,transaction,t,in database do,increment the count of all candidates in,C,k+1,that are contained in,t,L,k+1,=candidates in,C,k+1,with min_support,end,return,k,L,k,;,2001-11-6,10,數(shù)據(jù)挖掘:概念和技術(shù),Apriori,算法 例子,數(shù)據(jù)庫,D,掃描,D,C,1,L,1,L,2,C,2,C,2,掃描,D,C,3,L,3,掃描,D,2001-11-6,11,數(shù)據(jù)挖掘:概念和技術(shù),如何生成候選集,假定,L,k-1,中的項按順序排列,第一步:自連接,L,k-1,insert into,C,k,select,p.item,1,p.item,2,p.item,k-1,q.item,k-1,from,L,k-1,p,L,k-1,q,where,p.item,1,=q.item,1,p.item,k-2,=q.item,k-2,p.item,k-1,=10,用,Apriori,提高,執(zhí)行,冰山查詢的效率,先計算低維,只有當(dāng),所有的,低維都滿足預(yù)制時才計算高維,2001-11-6,36,數(shù)據(jù)挖掘:概念和技術(shù),

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  sobing.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!