《數(shù)據(jù)挖掘實驗指南part》由會員分享,可在線閱讀,更多相關《數(shù)據(jù)挖掘實驗指南part(17頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、,單擊此處編輯母版標題樣式,,*,,*,單擊此處編輯母版文本樣式,,第二級,,單擊此處編輯母版標題樣式,,單擊此處編輯母版文本樣式,,第二級,,*,,*,數(shù)據(jù)挖掘實驗指南,,本,ppt,主要為,08,屆信科,胡旭靈,根據(jù)實驗課內容制作,,10,屆統(tǒng)計曠英蘭參與部分修改,特表感謝!,2024/11/28,1,數(shù)據(jù)挖掘實驗指南,本ppt使用說明,,標為,紅色,字體為課程涉及的主要操作,,此,ppt,主要為方便大家熟悉,weka,的基本使用,如果要深入學習,可參考其他書籍,歡迎和大家一起共同學習進步。,,軟件中提到的軟件,自帶數(shù)據(jù),,是指在軟件安裝文件夾中有個,data,的文件夾里面的數(shù)據(jù)。,202
2、4/11/28,2,數(shù)據(jù)挖掘實驗指南,總體框架,,2024/11/28,3,數(shù)據(jù)挖掘實驗指南,Weka軟件,,Weka,軟件是著名的免費數(shù)據(jù)挖掘軟件,各位同學可到官方網(wǎng)站下載,,共有兩種類型,一種以,jre,結尾,表示軟件自帶,java,虛擬機,另一種不帶(適合,pc,上已安裝,java,虛擬機)。,2024/11/28,4,數(shù)據(jù)挖掘實驗指南,安裝運行weka,,下載安裝包后,解壓安裝。,,注:安裝后若發(fā)現(xiàn)運行軟件出現(xiàn)一閃而過,則說明,java,環(huán)境變量沒設置好(鑒于大家都學過,java,,設環(huán)境變量的步驟是大家應該會的)。,,2024/11/28,5,數(shù)據(jù)挖掘實驗指南,設置java環(huán)境變量后
3、運行,,,2024/11/28,6,數(shù)據(jù)挖掘實驗指南,Weka功能簡介,,Weka,介紹,,菜單欄里,program,里有個重要的,logwindow,—,日志窗口選項卡,用來顯示包括出錯信息等。,,Visualization,是進行,,數(shù)據(jù)可視化操作,,Tools,是與查看文件,,有關的功能,,2024/11/28,7,數(shù)據(jù)挖掘實驗指南,四大主要應用程序,,Explorer,是探索數(shù)據(jù)的環(huán)境,在本課程中將,主要介紹,。,,Experimenter,是用來運行算法試驗,算法檢驗等的環(huán)境。,,Knowledgefolw,這個環(huán)境與,explorer,相似,但支持拖放。,,simpleCLI,是,
4、命令行,界面,可以直接執(zhí)行,weka,命令,其實在,cmd,命令窗里也可直接運行,weka,的命令,前提是設好環(huán)境變量等。,,,2024/11/28,8,數(shù)據(jù)挖掘實驗指南,讀取數(shù)據(jù),,舉例:,Explorer》openfile,(,選擇本機,安裝文件夾,里自帶的數(shù)據(jù),)》,選擇,weather.arff,,2024/11/28,9,數(shù)據(jù)挖掘實驗指南,(注:,.arff,文件是,weka,識別的主要類型,,weka,還識別,spss,的,.cvs,類型,的數(shù)據(jù),故數(shù)據(jù)轉換,,為,普通數(shù)據(jù),->spss.csv->.arff,,,也可以用寫字板和記事本打開,arff,文件以觀察數(shù)據(jù)),2024/1
5、1/28,10,數(shù)據(jù)挖掘實驗指南,Explorer的process界面簡介,,,,,,點擊,edit,可,修改數(shù)據(jù),,選擇屬性后點擊,remove,可刪除屬性,可進行數(shù)據(jù)的變換,如離散化的數(shù)據(jù)預處理,數(shù)據(jù)預處理,的主要選項,2024/11/28,11,數(shù)據(jù)挖掘實驗指南,數(shù)據(jù)預處理,,數(shù)據(jù)預處理,作為數(shù)據(jù)挖掘的前奏,起著奠基石的作用,希望引起各位同學的重視。,2024/11/28,數(shù)據(jù)挖掘實驗指南,12,數(shù)據(jù)預處理舉例:離散化,,打開,C:\Program Files\Weka-3-6\data\weather.arff,后點擊,choose,點擊,2024/11/28,13,數(shù)據(jù)挖掘實驗指南,
6、選擇,choose,后選擇,過濾規(guī)則,:,離散化,Choose->filters->unsupervised->attribute->discretize,discretize,2024/11/28,14,數(shù)據(jù)挖掘實驗指南,選擇規(guī)則后,應用規(guī)則進行離散化,1,、雙擊所選規(guī)則可進行規(guī)則的參數(shù)設置,見右框,2,、此框可調整參數(shù),4,、點擊,apply,則應用規(guī)則,3,、進行選擇要離散化的屬性,2024/11/28,15,數(shù)據(jù)挖掘實驗指南,離散化后的結果,,2,、應用規(guī)則后,離散化分為,10,類,如下圖所示,1,、應用規(guī)則后再點擊該屬性,可視化,2024/11/28,16,數(shù)據(jù)挖掘實驗指南,數(shù)據(jù)預處理總結,,數(shù)據(jù)預處理的方式非常多,但基本流程跟離散化差不多,請各位同學自行嘗試,多實踐。,2024/11/28,17,數(shù)據(jù)挖掘實驗指南,