秋霞电影网午夜鲁丝片无码,真人h视频免费观看视频,囯产av无码片毛片一级,免费夜色私人影院在线观看,亚洲美女综合香蕉片,亚洲aⅴ天堂av在线电影猫咪,日韩三级片网址入口

第23章數(shù)據(jù)挖掘項目實施

上傳人:muj****520 文檔編號:253011484 上傳時間:2024-11-27 格式:PPTX 頁數(shù):41 大?。?.13MB
收藏 版權(quán)申訴 舉報 下載
第23章數(shù)據(jù)挖掘項目實施_第1頁
第1頁 / 共41頁
第23章數(shù)據(jù)挖掘項目實施_第2頁
第2頁 / 共41頁
第23章數(shù)據(jù)挖掘項目實施_第3頁
第3頁 / 共41頁

下載文檔到電腦,查找使用更方便

15 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《第23章數(shù)據(jù)挖掘項目實施》由會員分享,可在線閱讀,更多相關(guān)《第23章數(shù)據(jù)挖掘項目實施(41頁珍藏版)》請在裝配圖網(wǎng)上搜索。

1、,,,,,,,按一下以編輯母片,第二層,第三層,第四層,第五層,2012/1/5,,按一下以編輯母片標(biāo)題樣式,,,,,,,第,23,章 數(shù)據(jù)挖掘項目實施,2022/10/31,,,數(shù),據(jù),據(jù),挖,挖,掘,掘,原,原,理,理,與,與,SPSSClementine,應(yīng),用,用,寶,寶,典,典,,,元,昌,昌,安,安,主,主,編,編,鄧,松,松,李,李,文,文,敬,敬,劉,劉,海,海,濤,濤,編,編,著,著,,電,子,子,工,工,業(yè),業(yè),出,出,版,版,社,社,2022/10/31,,2,,,,,,,,,2022/10/31,,3,本,章,章,包,包,括,括,:,:,,,,,,,,,數(shù),據(jù),據(jù),挖

2、,挖,掘,掘,項,項,目,目,實,實,施,施,步,步,驟,驟,1,2,3,數(shù),據(jù),據(jù),挖,挖,掘,掘,項,項,目,目,周,周,期,期,單,擊,擊,此,此,處,處,添,添,加,加,段,段,落,落,文,文,字,字,內(nèi),內(nèi),容,容,單,擊,擊,此,此,處,處,添,添,加,加,段,段,落,落,文,文,字,字,內(nèi),內(nèi),容,容,單,擊,擊,此,此,處,處,添,添,加,加,段,段,落,落,文,文,字,字,內(nèi),內(nèi),容,容,單,擊,擊,此,此,處,處,添,添,加,加,段,段,落,落,文,文,字,字,內(nèi),內(nèi),容,容,單,擊,擊,此,此,處,處,添,添,加,加,段,段,落,落,文,文,字,字,內(nèi),內(nèi),容,容,單,擊

3、,擊,此,此,處,處,添,添,加,加,段,段,落,落,文,文,字,字,內(nèi),內(nèi),容,容,,,,,,,建,立,立,項,項,目,目,和,和,報,報,告,告,處,理,理,缺,缺,失,失,值,值,導(dǎo)入和導(dǎo)出,PMML,模型,3,4,5,2022/10/31,,23.1,數(shù)據(jù)挖掘項,目,目實施步驟,23,.1.1,一般實施步,驟,驟,一般而言,,數(shù),數(shù)據(jù)挖掘項,目,目要經(jīng)歷的,過,過程包括:,問,問題理解和,提,提出、?數(shù),據(jù),據(jù)準(zhǔn)備、數(shù),據(jù),據(jù)整理?、,建,建立模型、,評,評價和解釋,等,等一系列任,務(wù),務(wù),,其流程如,圖,圖,23,-,1,所示,。,,2022/10/31,,23.1.2,企業(yè)解決方,

4、案,案,23.1.2.1 SEMMA,模式,2022/10/31,,23.1.2.2SPSS,-,5A,模型,2022/10/31,,7,,23.1.3,標(biāo)準(zhǔn)過程模,型,型,,商業(yè)理解,數(shù)據(jù)理解,數(shù)據(jù)準(zhǔn)備,建立模型,模型評估,模型發(fā)布,2022/10/31,,23.2,數(shù)據(jù)挖掘項,目,目周期,2022/10/31,,23.3,建立項目和,報,報告,23.3.1,項目概述,表面上,,Clementine,項目只是一,種,種組織輸出,的,的簡單方式,,,,但實際上,它,它能做更多,的,的工作,主,要,要包括以下,工,工作:,(,1,),注釋項目文,件,件中的每個,對,對象。,(,2,),使用,CR

5、ISP-DM,方法指導(dǎo)數(shù),據(jù),據(jù)挖掘工作,。,。項目還包,含,含,CRISP-DM,幫助系統(tǒng),,該,該系統(tǒng)針對,使,使用,CRISP-DM,進(jìn)行的數(shù)據(jù),挖,挖掘提供詳,細(xì),細(xì)信息以及,現(xiàn),現(xiàn)實示例。,(,3,),將非,Clementine,項目,添,添加,到,到,Clementine,項目,,,,如,用,用于,展,展現(xiàn),數(shù),數(shù)據(jù),挖,挖掘,目,目標(biāo),的,的,PowerPoint,幻燈,片,片或,與,與計,劃,劃使,用,用的,算,算法,相,相關(guān),的,的文,檔,檔等,。,。,(,4,),根據(jù),注,注解,生,生成,全,全面,更,更新,報,報告,和,和簡,單,單更,新,新報,告,告。,為,為了,便,便

6、于,在,在局,域,域網(wǎng),上,上發(fā),布,布,,可,可以,用,用,HTML,的形,式,式生,成,成這,些,些報,告,告。,,2022/10/31,,23.3.1.1CRISP-DM,視圖,2022/10/31,,23.3.1.2,類視,圖,圖,2022/10/31,,23.3.2,建立,項,項目,23.3.2.1,新建,項,項目,在,Clementine,窗口,中,中新,建,建項,目,目非,常,常簡,單,單。,可,可以,從,從構(gòu),建,建新,項,項目,開,開始,(,(如,果,果沒,有,有項,目,目打,開,開),,,,也,可,可以,關(guān),關(guān)閉,現(xiàn),現(xiàn)有,項,項目,并,并重,新,新開,始,始。,從流,工,

7、工作,區(qū),區(qū)菜,單,單中,,,,選,擇,擇“,文,文件,”,”→,“,“工,程,程”,→,→,“,“新,建,建工,程,程,...”,命令,。,。,2022/10/31,,23.3.2.2,添加,到,到項,目,目,創(chuàng)建,或,或打,開,開項,目,目后,,,,便,可,可以,使,使用,多,多種,方,方法,來,來添,加,加對,象,象,,如,如數(shù),據(jù),據(jù)流,、,、節(jié),點,點和,報,報告,等,等。,(,1,)用,管,管理,器,器添,加,加對,象,象,使用,Clementine,窗口,右,右上,角,角的,管,管理,器,器,,可,可以,添,添加,流,流或,輸,輸出,。,。,從其,中,中一,個,個管,理,理器,選

8、,選項,卡,卡中,選,選擇,一,一個,對,對象,(,(如,表,表或,流,流),。,。,右鍵,單,單擊,,,,然,后,后選,擇,擇“,添,添加,到,到工,程,程”,命,命令,。,。,如果,以,以前,保,保存,過,過該,對,對象,,,,則,會,會自,動,動將,它,它添,加,加到,適,適當(dāng),的,的對,象,象文,件,件夾,(,(在,類,類視,圖,圖中,),)或,默,默認(rèn),的,的階,段,段文,件,件夾,(,(在,CRISP-DM,視圖,中,中),。,。,或者,,,,可,以,以將,對,對象,從,從管,理,理器,拖,拖放,到,到項,目,目工,作,作區(qū),中,中。,將項,目,目添,加,加到,項,項目,工,工程,

9、中,中,,如,如圖,23,-,7,從項,目,目管,理,理器,中,中加,入,入項,目,目項,到,到工,程,程中,所,所示,。,。,2022/10/31,,,(,2,)從,工,工作,區(qū),區(qū)添,加,加節(jié),點,點,可以,使,使用,“,“保,存,存”,對,對話,框,框從,流,流工,作,作區(qū),添,添加,單,單個,節(jié),節(jié)點,。,。,在工,作,作區(qū),中,中選,擇,擇一,個,個節(jié),點,點。,單擊,右,右鍵,,,,然,后,后選,擇,擇“,保,保存,節(jié),節(jié)點,”,”命,令,令;,或,或者,,,,從,菜,菜單,中,中選,擇,擇“,編,編輯,”,”→,“,“節(jié),點,點”,→,→“,保,保存,節(jié),節(jié)點,...”,命令,。

10、,。,在“,保,保存,”,”對,話,話框,中,中,,選,選中,“,“將,文,文件,添,添加,到,到工,程,程”,命,命令,。,。,為節(jié),點,點創(chuàng),建,建名,稱,稱,,然,然后,單,單擊,“,“保,存,存”,命,命令,。,。,從流,工,工作,區(qū),區(qū)中,加,加入,節(jié),節(jié)點,的,的主,要,要操,作,作對,話,話框,如,如圖,23,-,8,從流,工,工作,區(qū),區(qū)中,加,加入,節(jié),節(jié)點,所,所示,,,,這,樣,樣會,保,保存,文,文件,并,并將,其,其添,加,加到,項,項目,中,中,,同,同時,節(jié),節(jié)點,會,會被,添,添加,到,到類,視,視圖,中,中的,Nodes,文件,夾,夾以,及,及,CRISP-D

11、M,視圖,中,中的,默,默認(rèn),階,階段,文,文件,夾,夾。,2022/10/31,,,(,3,),添,添,加,加,外,外,部,部,文,文,件,件,將,外,外,部,部,文,文,件,件,添,添,加,加,到,到,項,項,目,目,的,的,一,一,般,般,步,步,驟,驟,如,如,下,下,:,:,Step1.,將,文,文,件,件,從,從,桌,桌,面,面,上,上,直,直,接,接,拖,拖,到,到,項,項,目,目,中,中,;,;,或,或,右,右,鍵,鍵,單,單,擊,擊,CRISP-DM,視,圖,圖,或,或,類,類,視,視,圖,圖,中,中,的,的,目,目,標(biāo),標(biāo),文,文,件,件,夾,夾,。,。,Step2.,從,

12、菜,菜,單,單,中,中,,,,,選,選,擇,擇,“,“,添,添,加,加,到,到,文,文,件,件,夾,夾,”,”,命,命,令,令,。,。,Step3.,在,對,對,話,話,框,框,中,中,選,選,擇,擇,一,一,個,個,文,文,件,件,,,,,然,然,后,后,單,單,擊,擊,“,“,打,打,開,開,”,”,命,命,令,令,。,。,這,將,將,會,會,在,在,Clementine,項,目,目,內(nèi),內(nèi),添,添,加,加,對,對,所,所,選,選,對,對,象,象,的,的,引,引,用,用,。,。,,2022/10/31,,23.3.2.3,設(shè),置,置,項,項,目,目,屬,屬,性,性,,可,以,以,使,使,用

13、,用,項,項,目,目,屬,屬,性,性,對,對,話,話,框,框,來,來,自,自,定,定,義,義,項,項,目,目,的,的,內(nèi),內(nèi),容,容,和,和,文,文,檔,檔,。,。,要,要,訪,訪,問,問,項,項,目,目,屬,屬,性,性,,,,,一,一,般,般,執(zhí),執(zhí),行,行,以,以,下,下,操,操,作,作,:,:,Step1.,右,鍵,鍵,單,單,擊,擊,項,項,目,目,工,工,具,具,中,中,的,的,根,根,文,文,件,件,夾,夾,,,,,然,然,后,后,選,選,擇,擇,“,“,工,工,程,程,屬,屬,性,性,”,”,命,命,令,令,;,;,或,或,者,者,右,右,鍵,鍵,單,單,擊,擊,項,項,目,目,

14、工,工,具,具,中,中,的,的,非,非,根,根,文,文,件,件,夾,夾,,,,,然,然,后,后,選,選,擇,擇,“,“,工,工,程,程,”,”,→,→,“,“,工,工,程,程,屬,屬,性,性,”,”,命,命,令,令,。,。,工,工,程,程,選,選,項,項,卡,卡,對,對,話,話,框,框,如,如,圖,圖,23,-,9,工,程,程,選,選,項,項,卡,卡,對,對,話,話,框,框,所,所,示,示,。,。,Step2.,單,擊,擊,“,“,工,工,程,程,”,”,選,選,項,項,卡,卡,以,以,指,指,定,定,項,項,目,目,的,的,相,相,關(guān),關(guān),信,信,息,息,。,。,2022/10/31,,,在

15、,工,工,程,程,選,選,項,項,卡,卡,中,中,包,包,含,含,下,下,列,列,信,信,息,息,,,,,如,如,圖,圖,23,-,9,工,程,程,選,選,項,項,卡,卡,對,對,話,話,框,框,所,所,示,示,。,。,創(chuàng),建,建,時,時,間,間,:,:,顯,示,示,項,項,目,目,的,的,創(chuàng),創(chuàng),建,建,時,時,間,間,(,(,此,此,項,項,內(nèi),內(nèi),容,容,不,不,可,可,編,編,輯,輯,),),。,。,摘,要,要,:,可,以,以,輸,輸,入,入,將,將,在,在,項,項,目,目,報,報,告,告,中,中,顯,顯,示,示,的,的,數(shù),數(shù),據(jù),據(jù),挖,挖,掘,掘,項,項,目,目,的,的,摘,摘,

16、要,要,。,。,內(nèi),容,容,:,:,列,出,出,項,項,目,目,文,文,件,件,引,引,用,用,的,的,組,組,成,成,文,文,件,件,的,的,類,類,型,型,和,和,數(shù),數(shù),量,量,(,(,此,此,項,項,內(nèi),內(nèi),容,容,不,不,可,可,編,編,輯,輯,),),。,。,將,未,未,保,保,存,存,的,的,對,對,象,象,保,保,另,存,為,為,單,單,選,選,項,項,:,:,指,定,定,是,是,應(yīng),應(yīng),將,將,未,未,保,保,存,存,的,的,對,對,象,象,保,保,存,存,到,到,本,本,地,地,文,文,件,件,系,系,統(tǒng),統(tǒng),還,還,是,是,存,存,儲,儲,在,在,Predictive E

17、nterpriseRepository,中。,載入項,目,目時更,新,新對象,引,引用復(fù),選,選框:,選中此,選,選項可,更,更新項,目,目對其,組,組成文,件,件的引,用,用。,2022/10/31,,23.3.2.4,注解項,目,目,項目工,具,具提供,了,了多種,方,方式來,注,注解數(shù),據(jù),據(jù)挖掘,工,工作。,項,項目級,注,注解常,用,用于跟,蹤,蹤宏觀,目,目標(biāo)和,決,決策,,而,而文件,夾,夾或節(jié),點,點注解,提,提供其,他,他詳細(xì),信,信息。,“,注解,”,選項卡,提,提供了,足,足夠空,間,間記錄,項,項目級,詳,詳細(xì)信,息,息,比,如,如具有,不,不可恢,復(fù),復(fù)丟失,數(shù),數(shù)據(jù)

18、的,數(shù),數(shù)據(jù)排,除,除、數(shù),據(jù),據(jù)探索,過,過程中,形,形成的,可,可能假,設(shè),設(shè)等。,2022/10/31,,23.3.2.5,對象屬,性,性,,可以查,看,看對象,屬,屬性并,選,選擇是,否,否在項,目,目報告,中,中納入,單,單個對,象,象。要,訪,訪問對,象,象屬性,,,,需要,執(zhí),執(zhí)行以,下,下操作,:,:,Step1.,右鍵單,擊,擊項目,窗,窗口中,的,的對象,。,。,Step2.,從菜單,中,中,選,擇,擇“對,象,象屬性,”,”命令,。,。,對象屬,性,性的設(shè),置,置,如,圖,圖,23-12,對象屬,性,性對話,框,框所示,。,。,2022/10/31,,20,23.3.2.

19、6,關(guān)閉項目,,關(guān)閉項目,文,文件的操,作,作步驟一,般,般如下:,Step1.,從“文件,”,”菜單中,,,,選擇關(guān),閉,閉項目。,Step2.,如果系統(tǒng),詢,詢問是關(guān),閉,閉所有與,項,項目關(guān)聯(lián),的,的文件還,是,是讓其保,持,持打開,,請,請單擊“,保,保持打開,”,”命令,,將,將關(guān)閉工,程,程文件(,.cpj,)本身而,讓,讓所有關(guān),聯(lián),聯(lián)文件(,如,如流、節(jié),點,點或圖形,等,等)保持,打,打開。,,2022/10/31,,23.3.3,建立報告,項目最有,用,用的一項,功,功能是能,夠,夠根據(jù)項,目,目項和注,解,解生成報,告,告。可以,直,直接生成,若,若干種文,件,件類型的,

20、報,報告,也,可,可以直接,輸,輸出到屏,幕,幕窗口以,便,便立即查,看,看。從輸,出,出窗口中,,,,可以打,印,印、保存,或,或查看,Web,瀏覽器中,的,的報告。,還,還可以將,保,保存的報,告,告分發(fā)給,組,組織中的,其,其他人。,2022/10/31,,23.3.3.1,設(shè)置報告,選,選項,,2022/10/31,,23.3.3.2,生成報告,2022/10/31,,23.3.3.2,保存和輸,出,出報告,在屏幕上,生,生成的報,告,告顯示在,新,新輸出窗,口,口中,此,報,報告中包,括,括的所有,圖,圖形都會,顯,顯示為內(nèi),嵌,嵌圖像。,保存報告,的,的一般步,驟,驟如下:,Ste

21、p1.,從“文件,”,”菜單中,,,,選擇“,保,保存”命,令,令。,Step2.,指定文件,名,名。,導(dǎo)出報告,的,的一般步,驟,驟如下:,Step1.,從“文件,”,”菜單中,,,,選擇導(dǎo),出,出以及要,導(dǎo),導(dǎo)出為的,文,文件類型,。,。,Step2.,指定文件,名,名。,可以將報,告,告導(dǎo)出為,如,如下類型,的,的文件:,HTML,文本,Microsoft Word,Microsoft Excel,Microsoft PowerPoint,2022/10/31,,23.4,處理缺失,值,值,23.4.1,指定缺失,值,值,用戶可以,用,用類型節(jié),點,點或者來,源,源節(jié)點的,類,類型選項,

22、卡,卡來指定,某,某個特定,的,的值為缺,失,失值,也,可,可以決定,是,是否把系,統(tǒng),統(tǒng)的缺失,值,值或空白,看,看作空格,。,。在“缺,失,失”欄上,,,,從下拉,菜,菜單中選,擇,擇“指定,…”,來打開一,個,個對話框,,,,然后確,定,定缺失值,選,選項。如,圖,圖,23-16,確定連續(xù),變,變量的缺,失,失值所示,。,。,2022/10/31,,圖,23-16,確定連續(xù),變,變量的缺,失,失值,2022/10/31,,23.4.2,處理缺失,值,值,用戶應(yīng)根,據(jù),據(jù)所從事,的,的專業(yè)領(lǐng),域,域知識來,確,確定如何,處,處理缺失,值,值。為了,減,減少訓(xùn)練,時,時間以及,提,提高精度,

23、,,,可能需,要,要除去數(shù),據(jù),據(jù)集中的,空,空值。此,外,外,空值,的,的出現(xiàn)還,可,可能會帶,來,來新的業(yè),務(wù),務(wù)機(jī)會或,其,其他靈感,。,。,在,Clementine,中有許多,技,技巧來處,理,理缺失值,,,,可以根,據(jù),據(jù)數(shù)據(jù)的,以,以下特征,來,來選擇最,佳,佳方法:,數(shù)據(jù)集的,大,大小,包含空值,的,的字段數(shù),缺失信息,量,量,一旦分析,了,了上述因,素,素,就可,以,以選擇下,述,述兩種方,法,法來處理,:,:,忽略帶有,缺,缺失值的,字,字段或記,錄,錄,可以使用,各,各種方法,歸,歸因、替,換,換或強(qiáng)制,賦,賦值缺失,值,值,2022/10/31,,23.4.2.1,處理帶

24、缺,失,失值的記,錄,錄,如果大部,分,分缺失值,都,都集中在,少,少量記錄,中,中,只需,排,排除這些,記,記錄即可,。,。例如,,銀,銀行通常,會,會保存詳,細(xì),細(xì)而完整,的,的貸款客,戶,戶的記錄,。,。但是,,如,如果銀行,在,在審批內(nèi),部,部職員的,貸,貸款時管,制,制不嚴(yán),,則,則所收集,的,的員工貸,款,款數(shù)據(jù)可,能,能會存在,空,空白字段,。,。此種情,況,況下,有,兩種方法,可以處理,缺,缺失值:,可以使用,選,選擇節(jié)點,刪,刪除員工,記,記錄。,如果數(shù)據(jù),集,集很大,,使,使用者可,以,以在一個,選,選擇節(jié)點,上,上,使用,@BLANK,和,@NULL,函數(shù)來剔,除,除帶有

25、空,格,格的所有,記,記錄。,,2022/10/31,,23.4.2.2,處理帶缺,失,失值的字,段,段,如大部分,缺,缺失值都,集,集中在少,量,量字段中,,,,可通過,字,字段而不,是,是記錄查,找,找這些缺,失,失值。,確定要采,用,用的方法,時,時,還應(yīng),考,考慮帶有,缺,缺失值的,字,字段類型,。,。,,,數(shù)值字段,對于數(shù)值,字,字段類型,(,(如范圍,),),應(yīng)在,構(gòu),構(gòu)建模型,前,前清除所,有,有非數(shù)字,值,值,因為,如,如果數(shù)值,字,字段中包,含,含空值,,很,很多模型,將,將無效。,分類字段,對于分類,字,字段(如,集,集合和標(biāo),志,志),雖,然,然不必更,改,改缺失值,,,

26、,但更改,后,后可以提,高,高模型的,精,精度。,2022/10/31,,,要篩選或,刪,刪除帶有,大,大量缺失,值,值的字段,,,,可以采,用,用以下幾,種,種方法:,使用數(shù)據(jù),審,審核節(jié)點,根,根據(jù)質(zhì)量,過,過濾字段,。,。,可以使用,特,特征選擇,節(jié),節(jié)點來篩,選,選缺失值,超,超過指定,百,百分比的,字,字段,并,根,根據(jù)相對,于,于特定目,標(biāo),標(biāo)的重要,性,性來對字,段,段進(jìn)行排,序,序。,除刪除字,段,段以外,,還,還可以使,用,用類型節(jié),點,點將字段,方,方向設(shè)置,為,為無。此,操,操作可將,字,字段保留,在,在數(shù)據(jù)集,中,中,但不,會,會對其進(jìn),行,行建模操,作,作。,,202

27、2/10/31,,23.4.2.3,歸因或填,充,充缺失值,在僅有少,量,量缺失值,的,的情況下,,,,可以用,插,插入值來,替,替換空值,。,。下列方,法,法可用于,輸,輸入缺失,值,值:,替換為固,定,定值(可,以,以選用字,段,段平均值,、,、范圍中,間,間值或者,指,指定的常,數(shù),數(shù))。,替換為基,于,于正態(tài)分,布,布或均勻,分,分布產(chǎn)生,的,的隨機(jī)值,。,。,用于指定,定,定制表達(dá),式,式。例如,,,,可以使,用,用設(shè)置全,局,局量節(jié)點,創(chuàng),創(chuàng)建的全,局,局變量進(jìn),行,行替換。,基于,C&RT,算法替換,為,為模型預(yù),測,測的值。,對,對于使用,此,此方法輸,入,入的每個,字,字段,

28、都,會,會有一個,單,單獨的,C&RT,模型,還,有,有一個填,充,充節(jié)點會,使,使用該模,型,型預(yù)測的,值,值替換空,白,白值和,Null,值。然后,使,使用過濾,節(jié),節(jié)點刪除,該,該模型生,成,成的預(yù)測,字,字段。,如果還要,為,為特定字,段,段強(qiáng)制賦,值,值,則可,以,以使用類,型,型節(jié)點來,確,確保字段,類,類型僅包,含,含合法值,,,,然后將,需,需要替換,空,空值字段,的,的檢查列,設(shè),設(shè)置為強(qiáng),制,制。,2022/10/31,,23.4.3,用,CLEM,函數(shù)處理缺,失,失值,表達(dá)式操作,語,語言,CLEM,全名為,ClementineLanguagefor Expression

29、Manipulation,,是在,Clementine,中執(zhí)行函數(shù),運(yùn),運(yùn)算時的專,用,用語法,用,于,于分析和操,縱,縱在,Clementine,流中流動的,數(shù),數(shù)據(jù),是一,個,個功能強(qiáng)大,的,的語言。,2022/10/31,,,有多個,CLEM,函數(shù)可用于,處,處理缺失值,。,。選擇節(jié)點,和,和填充節(jié)點,中,中經(jīng)常會用,以,以下函數(shù)來,刪,刪除或填充,缺,缺失值:,count_nulls,(,LIST,),@BLANK,(,FIELD,),@NULL,(,FIELD,),undef,@,函數(shù)可以與,@FIELD,函數(shù)一起使,用,用,來識別,一,一個或多個,字,字段中是否,存,存在空值或,非

30、,非,Null,值。當(dāng)出現(xiàn),空,空值或非,Null,值時,一般,會,會對此類字,段,段進(jìn)行標(biāo)記,,,,也可以用,替,替換值填充,或,或者在各種,其,其他操作中,使,使用此類字,段,段。,如下所示,,可,可以計算字,段,段列表中的,非,非,Null,值的數(shù)量:,count_nulls,(,[‘cardtenure’‘card2tenure,’,’‘card3tenure'],),如果要使用,接,接受輸入類,型,型的字段列,表,表的函數(shù),,則,則可以使用,特,特定的,@FIELDS_BETWEEN,和,@FIELDS_MATCHING,函數(shù),如下,所,所示:,count_nulls,(,@FIEL

31、DS_MATCHING,(‘,card*',)),在選擇字段,中,中用填充節(jié),點,點把缺失值,替,替換成,0,,如圖,23,-,1,8,用填充節(jié)點,將,將選定字段,中,中的非,Null,值替換為,0,所示。,2022/10/31,,23.5,導(dǎo)入和導(dǎo)出,PMML,模型,PMML,(,predictivemodel markup language,,稱為預(yù)測,模,模型標(biāo)記語,言,言)是一個,XML,基礎(chǔ)的標(biāo)準(zhǔn),,,,以,XML,文件類型定,義,義,DTD,形式,用于,描,描述數(shù)據(jù)挖,掘,掘和統(tǒng)計模,型,型,包括模,型,型的輸入、,用,用于為數(shù)據(jù),挖,挖掘準(zhǔn)備數(shù),據(jù),據(jù)的變換、,以,以及定義模,型

32、,型自身的參,數(shù),數(shù)。,Clementine,可導(dǎo)入和導(dǎo),出,出,PMML,模型,使其,能,能夠與其他,支,支持此格式,的,的應(yīng)用程序,(,(例如,,SPSS,、,SPSSCategorize,)共享模型,。,2022/10/31,,23.5.1,支持,PMML,的模型類型,23.5.1.1 PMML 3.1,導(dǎo)入,Clementine,可以導(dǎo)入并,評,評分由,SPSS,所有產(chǎn)品生,成,成的,PMML3.1,模型,包括,從,從,Clementine,導(dǎo)出的模型,和,和由,SPSS15.0,生成的模型,或,或變換,PMML,模型。,實質(zhì)上,這,包,包括了,SPSSSmartscore,組件可以評

33、,分,分的所有,PMML,模型,但以,下,下幾種情況,例,例外:,(,1,)無法導(dǎo)入,Apriori,、,CARMA,及異常檢測,模,模型。,(,2,)將,PMML,模型導(dǎo)入到,Clementine,后,雖然可,以,以對其進(jìn)行,評,評分,但不,能,能進(jìn)行瀏覽,。,。,(,3,)不能導(dǎo)入,無,無法評分的,模,模型。,(,4,)以,PMML,格式導(dǎo)出的,IBM IntelligentMiner,模型,無法,重,重新導(dǎo)入到,Clementine,中。,2022/10/31,,23.5.1.2,導(dǎo)入,PMML,的較早版本,對于從,Clementine,較早版本(,11.0,之前版本),中,中導(dǎo)出的遺,

34、存,存模型,只,有,有某些模型,類,類型(而不,是,是所有類型,),)支持,PMML,導(dǎo)入,模型,支,支持,PMML,導(dǎo)入關(guān)系如,表,表,23,-,1,所示:,模型類型,PMML,導(dǎo)入(,2.1,或,3.0,),神經(jīng)網(wǎng)絡(luò),不可用,C&R,樹,是,CHAID,樹,是,QUEST,樹,是,C5.0,樹,不可用,規(guī)則集,不可用,Kohonen,網(wǎng)絡(luò),不可用,K-Means,不可用,兩步,是,線性回歸,是,Logistic,回歸,是,因子,/,主成分分析,不可用,序列,不可用,CARMA,不可用,Apriori,不可用,文本提取,不可用,特征選擇,不可用,異常檢測,不可用,非精練(,GRI,,,CEM

35、I,),不可用,2022/10/31,,23.5.1.3Clementine,模型,PMML,導(dǎo)出,Clementine,中的,所,所有,模,模型,,,,除,了,了,CHAID,、,Anomaly,、,GRI,、,Factor/PCA,、特,征,征選,擇,擇等,少,少數(shù),幾,幾個,模,模型,以,以外,,,,都,可,可以,用,用,PMML,編碼,的,的,XML,文件,的,的方,式,式輸,出,出。,對,對于,PMML,模型,輸,輸出,,,,應(yīng),該,該選,擇,擇一,個,個,XML,文件,名,名。,Clementine,中的,模,模型,是,是否,支,支持,PMML,輸出,類,類型,,,,模,型,型支,

36、持,持,PMML,輸出,關(guān),關(guān)系,如,如表,23,-,2,所示,.,模型類型,支持,PMML,輸出類型,神經(jīng)網(wǎng)絡(luò),是,建立,C5.0,是,Kohonen,是,線性回歸,是,GRI,否,Apriori,是,K-Means,是,邏輯回歸,是,兩步,是,分類和回歸(,C&R,)樹,是,序列探測,是,QUEST,是,CHAID,否,Anomaly,否,Carma,是,特征選擇,否,因子分析,/,主成分分析,否,文本提取,否,2022/10/31,,23.5.1.4,數(shù)據(jù),庫,庫本,地,地模,型,型,PMML,導(dǎo)出,對于,使,使用,數(shù),數(shù)據(jù),庫,庫本,地,地算,法,法生,成,成的,模,模型,,,,僅,在

37、,在,IBMIntelligentMiner,模型,中,中可,使,使用,PMML,導(dǎo)出,,,,無,法,法導(dǎo),出,出使,用,用,Microsoft,的,AnalysisServices,或,OracleDataMiner,創(chuàng)建,的,的模,型,型。,此,此外,,,,以,PMML,格式,導(dǎo),導(dǎo)出,的,的,IBM,模型,無,無法,重,重新,導(dǎo),導(dǎo)入,到,到,Clementine,中,2022/10/31,,23.5.2,導(dǎo)入,PMML,模型,2022/10/31,,23.5.3,導(dǎo)出,PMML,模型,在,Clementine,中生,成,成模,型,型后,,,,可,按,按以,下,下的,步,步驟,用,用,P

38、MML,代碼,輸,輸出,:,:,Step1.,在管,理,理窗,口,口中,的,的“,模,模型,”,”選,項,項卡,,,,用,右,右鍵,點,點單,擊,擊一,個,個模,型,型。,Step2.,從內(nèi),容,容菜,單,單中,,,,選,擇,擇“,導(dǎo),導(dǎo)出,PMML,…,…”,命令,。,。,Step3.,給模,型,型命,名,名,,然,然后,點,點擊,“,“保,存,存”,命,命令,即,即可,。,。,2022/10/31,,23.6,小結(jié),根據(jù),本,本章,講,講述,的,的數(shù),據(jù),據(jù)挖,掘,掘項,目,目實,施,施的,方,方法,論,論和,生,生命,周,周期,、,、,SPSSClementine,的項,目,目管,理,理

39、、,數(shù),數(shù)據(jù),挖,挖掘,項,項目,的,的建,立,立和,報,報告,的,的生,成,成、,缺,缺失,值,值的,處,處理,和,和,PMML,模型,的,的導(dǎo),入,入導(dǎo),出,出等,內(nèi),內(nèi)容,,,,將,數(shù),數(shù)據(jù),挖,挖掘,項,項目,實,實施,的,的理,論,論與,SPSSClementine,數(shù)據(jù),挖,挖掘,軟,軟件,結(jié),結(jié)合,,,,能,夠,夠完,成,成數(shù),據(jù),據(jù)挖,掘,掘項,目,目的,一,一般,實,實施,過,過程,。,。而,更,更為,詳,詳細(xì),的,的數(shù),據(jù),據(jù)挖,掘,掘項,目,目實,施,施的,內(nèi),內(nèi)容,,,,可,以,以參,考,考下,一,一章,的,的,SPSSClementine,典,型,型,案,案,例,例,分,分,析,析,,,,,通,通,過,過,更,更,多,多,具,具,體,體,的,的,數(shù),數(shù),據(jù),據(jù),挖,挖,掘,掘,的,的,實,實,踐,踐,才,才,能,能,更,更,好,好,地,地,把,把,握,握,數(shù),數(shù),據(jù),據(jù),挖,挖,掘,掘,項,項,目,目,的,的,實,實,施,施,。,。,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  sobing.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!