《數(shù)據(jù)挖掘——第二章認(rèn)識數(shù)據(jù)》由會員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)挖掘——第二章認(rèn)識數(shù)據(jù)(112頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
1、單擊此處編輯母版標(biāo)題樣式,,單擊此處編輯母版文本樣式,,第二級,,第三級,,第四級,,第五級,,*,,*,,第2章認(rèn)識數(shù)據(jù),,,,一·數(shù)據(jù)對象,,數(shù)據(jù)集由數(shù)據(jù)對象構(gòu)成,,個數(shù)據(jù)對象代表一個實(shí)體,,例子,,銷售數(shù)據(jù)庫 sales database:客戶/顧客,商店物品, sales,,醫(yī)學(xué)數(shù)據(jù)庫:,,s,treatments,,大學(xué)數(shù)據(jù)庫: students,, professors,, courses,,又稱為樣本,事例,實(shí)例,數(shù)據(jù)點(diǎn),對象,元組 tuples.,,數(shù)據(jù)對象由屬性來描述,,Database rows ->data objects; columns -attributes.,,,
2、,屬性「,,屬性 Attribute(or維度,特征,變量):一個數(shù)據(jù)字段,表示,,個數(shù)據(jù)對象的某個特征,,E. g, customer-ID, name, address,,類型:,,名詞性 Nominal,,元的,,數(shù)字的 Numeric:數(shù)量的,,Interval-scaled,,· Ratio-scaled,,,,屬性類型,,,名詞性 Nomina:類別,狀態(tài),r“名目,,whie olor=auburn, black, blond, brown, grey, red.,,Hai,,婚姻狀態(tài),職業(yè) occupation, ID numbers, zip codes,,只有2個狀態(tài)的名詞
3、性屬性(0and1),,對稱二元 Symmetric binary同樣重要的兩相,,e.g., gender,,非對稱 Asymmetric binary:非同等重要,,eg,醫(yī)療檢查( positive vs negative),,慣例 Convention: assign1 to most important,,outcome(e.g, HIV positive),,·順序的 Ordinal,,值有一個有意義的順序排序)但連續(xù)值之間的大小未知,,size={smal, medium,arge,等級,軍隊(duì)排名,,,,數(shù)值屬性的類型,,數(shù)量 Quantity( integer or real-
4、valued),,區(qū)間mera,,在某個同等大小的一個尺度單位上 Measured on a,,scale of equal-sized units,,值有序,,E.g., temperature in C or F, calendar dates,,沒有真正的零點(diǎn),,Ratio,,有真正的零點(diǎn),,可以講值是被測量單位一個數(shù)量級(0Kwe,,s high a,,eg,溫度在開爾又長度計(jì)數(shù)貨幣的數(shù)量,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,