秋霞电影网午夜鲁丝片无码,真人h视频免费观看视频,囯产av无码片毛片一级,免费夜色私人影院在线观看,亚洲美女综合香蕉片,亚洲aⅴ天堂av在线电影猫咪,日韩三级片网址入口

深入淺出統(tǒng)計(jì)學(xué)的讀后感10篇

上傳人:艷*** 文檔編號:24438322 上傳時間:2021-06-30 格式:DOC 頁數(shù):16 大?。?8KB
收藏 版權(quán)申訴 舉報 下載
深入淺出統(tǒng)計(jì)學(xué)的讀后感10篇_第1頁
第1頁 / 共16頁
深入淺出統(tǒng)計(jì)學(xué)的讀后感10篇_第2頁
第2頁 / 共16頁
深入淺出統(tǒng)計(jì)學(xué)的讀后感10篇_第3頁
第3頁 / 共16頁

下載文檔到電腦,查找使用更方便

8 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《深入淺出統(tǒng)計(jì)學(xué)的讀后感10篇》由會員分享,可在線閱讀,更多相關(guān)《深入淺出統(tǒng)計(jì)學(xué)的讀后感10篇(16頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。

1、編號: 時間:2021年x月x日 書山有路勤為徑,學(xué)海無涯苦作舟 頁碼:第16頁 共16頁 深入淺出統(tǒng)計(jì)學(xué)的讀后感10篇 導(dǎo)讀: 《深入淺出統(tǒng)計(jì)學(xué)》是一本由Dawn Griffiths著作,電子工業(yè)出版社出版的平裝圖書,本書定價:89.00元,頁數(shù):677,特精心從網(wǎng)絡(luò)上整理的一些讀者的讀后感,希望對大家能有幫助。 《深入淺出統(tǒng)計(jì)學(xué)》讀后感(一):通俗易懂,適合非統(tǒng)計(jì)學(xué)人士 優(yōu)點(diǎn): (1)此書   《深入淺出統(tǒng)計(jì)學(xué)》是一本由Dawn Griffiths著作,電子工業(yè)出版社出版的平裝圖書,本書定價:8

2、9.00元,頁數(shù):677,特精心從網(wǎng)絡(luò)上整理的一些讀者的讀后感,希望對大家能有幫助。   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(一):通俗易懂,適合非統(tǒng)計(jì)學(xué)人士   優(yōu)點(diǎn):  ?。?)此書比較通俗易懂,適合非專業(yè)人士的統(tǒng)計(jì)學(xué)入門;  ?。?)書中的很多案例和習(xí)題比較好,能從簡單的角度闡述復(fù)雜的概率統(tǒng)計(jì)的理論知識;  ?。?)本書比較內(nèi)容相對連貫,讀下去一氣呵成   缺點(diǎn):  ?。?)有少許印刷錯誤   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(二):期望,均值,方差~好吧我撕開了讀的   吞不太認(rèn)同這種毀書的閱讀方式,可這個厚度真不合適地鐵,撕開后還是很有成果的,新問題是如何裝訂回去?  

3、 正題:均值是發(fā)生了的期望的話,方差計(jì)算的一致性就可以解釋了,現(xiàn)在再開始幾何分布的期望速算方式就好理解點(diǎn)兒了,這次是要feel幾何分布的方式不是推理   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(三):蘇格拉底助產(chǎn)術(shù)之統(tǒng)計(jì)入門   這是一本非常適合入門的統(tǒng)計(jì)書:   1.內(nèi)容輕重得當(dāng),可高效窺見統(tǒng)計(jì)學(xué)全貌:   可視化;   度量集中與分散(均值、距、差);   概率計(jì)算、描述(四類分布)與預(yù)測(期望、方差);   用樣本(抽取樣本)預(yù)估總體(抽樣分布、點(diǎn)估計(jì)量、置信區(qū)間)、以及進(jìn)行假設(shè)檢驗(yàn)(拒絕域);   多變量之間的獨(dú)立性(x分布)、相關(guān)性、線性回歸、非線性回歸。   2.敘事方式采用蘇

4、格拉底助產(chǎn)術(shù),引導(dǎo)讀者思考得出結(jié)論,學(xué)習(xí)效果好。   TW,head first 系列的敘事風(fēng)格非常值得學(xué)習(xí),尤其在這輪內(nèi)容消費(fèi)的浪潮下。   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(四):有趣且清晰的入門書目   本科時上過統(tǒng)計(jì)和測量的課,還有spss,stata這些課程,考研時專業(yè)課里也有教育統(tǒng)計(jì),但我覺得到看這本書之前都沒有學(xué)明白統(tǒng)計(jì)的一些基本概念。之前的學(xué)習(xí)方式都是從干巴巴的概念入手,加以枯燥的題目訓(xùn)練,本科的時候不知道學(xué)這些有什么用,后來也是想起來頭就痛。   這本書非常適合像我這樣文科背景數(shù)學(xué)小白的學(xué)生來作為入門的自學(xué)教材,相見恨晚啊。書看起來很厚,專心讀的話很快就可以讀完。我重點(diǎn)看的

5、是后半部分,跟國內(nèi)的統(tǒng)計(jì)教材一個很大的不同是排版比較愉快友好,雖然人像的插圖有點(diǎn)突兀== 另外很重要是基本都是以情景例子引入,然后提問,這才符合人類的學(xué)習(xí)規(guī)律好嘛,要是大學(xué)老師也這樣教我早該學(xué)會了啊== 然后還會有問題的系統(tǒng)的思路和解法,最后還會有小結(jié)。不過覺得還是自備筆記本邊看邊總結(jié)好。   不足的地方覺得主要是內(nèi)容還是比較淺的,不過對于基礎(chǔ)又重要的概念理解和入門應(yīng)當(dāng)是足夠了的。要去繼續(xù)發(fā)現(xiàn)好教材啦~   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(五):深入淺出統(tǒng)計(jì)學(xué)   樣章試讀請到下面的鏈接下載:   目錄 http://goo.gl/tlCLf   序言 http://goo.gl/6

6、5x6e   第一章 http://goo.gl/WTnC9   第二章 http://goo.gl/5WUhT   若下載遇到問題,請郵件聯(lián)系:[emailprotected]。謝謝!   《深入淺出統(tǒng)計(jì)學(xué)》具有深入淺出系列的一貫特色,提供最符合直覺的理解方式,讓統(tǒng)計(jì)理論的學(xué)習(xí)既有趣又自然。從應(yīng)對考試到解決實(shí)際問題,無論你是學(xué)生還是數(shù)據(jù)分析師,都能從中受益。本書涵蓋的知識點(diǎn)包括:信息可視化、概率計(jì)算、幾何分布、二項(xiàng)分布及泊松分布、正態(tài)分布、統(tǒng)計(jì)抽樣、置信區(qū) 間的構(gòu)建、假設(shè)檢驗(yàn)、卡方分布、相關(guān)與回歸等等,完整涵蓋AP 考試范圍。本書運(yùn)用充滿互動性的真實(shí)世界情節(jié),教給你有關(guān)這門學(xué)

7、科的所有基礎(chǔ),為這個枯燥的領(lǐng)域帶來鮮活的樂趣,不僅讓你充分掌握統(tǒng)計(jì)學(xué)的要義,更會告訴你如何將統(tǒng)計(jì)理論應(yīng)用到日常生活中。   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(六):非常適合入門   前面有一位豆友說這本書非常不適合入門,從我個人感覺,還是一本比較漂亮的入門書。在數(shù)據(jù)分析那本書的書評里面,我提到兩點(diǎn),一個是簡單易懂,一個是系統(tǒng)全面。至少第一點(diǎn)是比較符合的,第二點(diǎn)也差強(qiáng)人意吧。   這本書的前半部分,一直到第7章吧,對于學(xué)過概率的人來說,基本上意義不大。不過對于一些概念,有了重新和深入的理解,比如均值和平均數(shù)的差異,貝葉斯方法用條件概率樹來解釋確實(shí)一目了然,容易理解。   真正收獲比較大的是第

8、二部分,雖然里面提到的各種分布:幾何、二項(xiàng)、泊松、正態(tài),以及抽樣統(tǒng)計(jì)、置信區(qū)間,假設(shè)檢驗(yàn)等各個概念前幾天看別的統(tǒng)計(jì)學(xué)書的時候也看過,也大概知道怎么算(雖然基本都用SPSS算的),但是個人通過這本書里面的動動腦、動動筆里面的內(nèi)容一路根著做下來,對于統(tǒng)計(jì)這個事情本身有一個比較全面系統(tǒng)的理解。   書的主要內(nèi)容,目錄體現(xiàn)得很明顯了。我個人理解的統(tǒng)計(jì)這個事情主要有以下幾點(diǎn):   1 我們對于世界和事物是難以看到本質(zhì)的。(透過現(xiàn)象看到本質(zhì)只是一種美好的愿望)   2 在信息無法全面掌握的情況下,我們可以根據(jù)獲得的部分?jǐn)?shù)據(jù)來猜測事情背后的原因。   3 一般來說,對于大量的總體數(shù)據(jù),可能遵

9、守二項(xiàng)、泊松、正態(tài)等分布,在遵守這些分布的情況下,我們可以計(jì)算一些概率或者事情的可能。   4 那么對于猜測的規(guī)律是不是靠譜,或者我們作出的結(jié)論是否可行,可以采用假設(shè)檢驗(yàn)來一定程度上進(jìn)行檢驗(yàn)。   5 除了單變量的以外,我們還可以關(guān)注多個數(shù)據(jù)間的關(guān)系(線性回歸)。   6 非線性關(guān)系以及更多(附錄)。   這本書最不如深入淺出數(shù)據(jù)分析的地方在于,那本書把故事寫了懸疑故事,這本書把故事講成了數(shù)字游戲。沒有劇烈的劇情沖突,沒有一波三折的故事情節(jié),用什么來吸引觀眾呢?(好像這里不是討論寫小說:)   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(七):錢,我來啦!   這老話說的好啊,“女怕嫁錯郎

10、,男怕入錯行”。還有“一如侯門深似海,從此君王不早朝”。說的是什么意思呢?就是說,現(xiàn)在流的汗,都是當(dāng)初做決定時腦子里進(jìn)的水。因此,在我們做決定的時候,千萬別喝水。   以上純屬瞎扯下面說些正經(jīng)的。   但開篇說的這些其實(shí)是感慨工作以及學(xué)習(xí)。大學(xué)畢業(yè)工作時恰好所在的軟件項(xiàng)目是與數(shù)據(jù)統(tǒng)計(jì)挖掘相關(guān)的,相關(guān)性還很強(qiáng)。以致于后來在一個項(xiàng)目的實(shí)施過程中,直接全面的涉及到了一個標(biāo)準(zhǔn)數(shù)據(jù)挖掘咨詢工作的所有環(huán)節(jié)。從此對數(shù)據(jù)挖掘著迷了。不僅是因?yàn)榈谝淮斡H身體會到海量數(shù)據(jù)背后蘊(yùn)含的巨大商業(yè)價值,更是因?yàn)檫@四兩撥千斤的知識竟然能賺如此多的錢!兩個人花了半個月時間就卷走了客戶幾十萬的合同,媽媽咪呀。有幸的是,我

11、全程參與了這一件工作。當(dāng)然,只是工作,跟錢沒關(guān)系……從此這個項(xiàng)目就在我的腦子里面一遍一遍的循環(huán)播放。這個項(xiàng)目向我揭示了一種可能。那就是如此高端的咨詢工作并不是如想象中的高深艱難。相反,它實(shí)用,有針對性,在使用當(dāng)中存在較高的普遍性和重復(fù)性。因此,我也能做。從此以后我便投入了更多的注意力在這一領(lǐng)域。經(jīng)營分析、數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)等等等等,盡管它們有很多標(biāo)簽,但我知道,它們的目的是一樣的,發(fā)現(xiàn)數(shù)據(jù)背后的秘密。于是我決定,朝著這個目標(biāo),開始進(jìn)發(fā)。同時,錢是這個寶藏的伴生礦。哈哈。   但是,我需要從零開始。因?yàn)樗械倪@一切都是以統(tǒng)計(jì)學(xué)為基礎(chǔ)的,而我那點(diǎn)點(diǎn)可憐的統(tǒng)計(jì)學(xué)知識早就還給了大學(xué)老師了。而本書,《

12、深入淺出統(tǒng)計(jì)學(xué)》,給了我從零開始的可能性。當(dāng)我拿到這本足足有600多頁的大部頭時,我還是有些擔(dān)心的。擔(dān)心自己沒有堅(jiān)持的毅力。因?yàn)橄惹熬陀羞^一次敗在一部名叫《數(shù)據(jù)挖掘?qū)д摗返拇蟛款^面前。不過幸運(yùn)的是,本書不是一本讀起來很艱澀的書。它起步低,我想有初中的數(shù)據(jù)知識就可以開始了;趣味足,將要講的知識恰當(dāng)?shù)胤湃胍恍┖唵螌?shí)際的實(shí)例中;展開緩,讓你在進(jìn)取的過程中并不會意識到臺階的存在;條理強(qiáng),在講述的過程中邏輯清晰,目標(biāo)明確;手段多,怪招用盡就是想讓你記住一些基本的概念和公式;有成就,你總是能基于剛剛學(xué)到的東西馬上解決掉一個之前不久提出的問題;編排好,全書在用一種循環(huán)滾動的方式將問題與知識交叉提出展現(xiàn),就像

13、用松子和堅(jiān)果來引誘讀者繼續(xù)下去。所以,這是我最開心的一次學(xué)習(xí)經(jīng)歷。盡管如此,我還是用了四五個月的時間才認(rèn)真讀完……感覺離金山好遠(yuǎn)啊。   認(rèn)真研究你會發(fā)現(xiàn),這本書涵蓋了數(shù)據(jù)挖掘的一些領(lǐng)域,比如描述、預(yù)測。這很重要,因?yàn)樵诖蠖鄶?shù)情況下,數(shù)據(jù)分析工作是以描述開始,預(yù)測結(jié)尾的。而統(tǒng)計(jì)學(xué)可以應(yīng)用的領(lǐng)域甚至比計(jì)算機(jī)還要高。因此,即時我們不需要考慮將工作投入到這個方向,我們也會在當(dāng)前所處的工作生活環(huán)境中,因?yàn)橹滥敲匆稽c(diǎn)點(diǎn)統(tǒng)計(jì)學(xué)知識而顯得聰明那么一點(diǎn)點(diǎn)。我想說的是,統(tǒng)計(jì)學(xué)是一門實(shí)用的學(xué)科,值得任何人去學(xué)習(xí)。在此強(qiáng)烈推薦,從本書開始。   《深入淺出統(tǒng)計(jì)學(xué)》讀后感(八):深入淺出統(tǒng)計(jì)學(xué)-書評 前言 

14、 道德經(jīng)云:”道生一,一生二,二生三,三生萬物“。 學(xué)習(xí)知識亦是如此,一個概念衍生出兩個概念,兩個概念演化出更小的子概念,接著衍生出整個知識體系。   筆者結(jié)合自己對統(tǒng)計(jì)學(xué)和概率論知識的理解寫了這篇文章,有以下幾個目標(biāo)   目標(biāo)一:構(gòu)建出可以讓人理解的知識架構(gòu),讓讀者對這個知識體系一覽無余   目標(biāo)二:盡l量闡述每個知識在數(shù)據(jù)分析工作中的使用場景及邊界條件   目標(biāo)三:為讀者搭建從“理論”到“實(shí)踐”的橋梁   注意: 本文不涉及對概念及方法公式的推導(dǎo),讀者有興趣可以自行查閱《概率與統(tǒng)計(jì)》 概述 你的“對象” 是誰?  此對象非彼“對象”,我們學(xué)習(xí)“概率和統(tǒng)計(jì)學(xué)”目的在于應(yīng)用到對于“

15、對象”的研究中,筆者將我們要研究的“對象”按照維度分為了兩大類。   一維:就是當(dāng)前擺在我們面前的“一組”,“一批”,哪怕是“一坨”數(shù)據(jù)。這里我們會用到統(tǒng)計(jì)學(xué)的知識去研究這類對象。   二維:就是研究某個“事件”,筆者認(rèn)為事件是依托于“時間軸”存在的,過去是否發(fā)生,現(xiàn)在是可能會出現(xiàn)幾種情況,每種情況未來發(fā)生的可能性有多大?這類問題是屬于概率論的范疇。   因此,我們在做數(shù)據(jù)分析的研究前,先弄清我們研究的對象屬于哪類范疇,然后在按著這個分支檢索自己該用到的知識或方法來解決問題。 分析就像在給 “愛人” 畫肖像  從外觀的角度描述一個姑娘,一般是面容怎么樣?身段怎么樣?兩個維度去描述。就像

16、畫一幅肖像畫,我們的研究“對象”在描述性分析中也是通過兩個維度去來描述即,“集中趨勢---代表值”,“分散和程度”。   看到這幾個概念是不是就很熟悉了?筆者認(rèn)為一個描述性的分析就是從這兩個維度來說清楚你要研究的對象是什么樣子?至于從哪些特征開始說呢?就是常用的概念“均值”,“方差”之類的。下面我們進(jìn)入正題,筆者將詳細(xì)闡述整個知識架構(gòu)。   ----------------------------------------------------------------------------------------------------------------------------

17、第一部分: 對“數(shù)據(jù)”的描述性分析  數(shù)據(jù)分析中最常規(guī)的情況,比如你手上有一組,一批或者一坨數(shù)據(jù),數(shù)據(jù)分析的過程就是通過“描述”從這些數(shù)據(jù)中獲取的信息,通??梢詮膬蓚€維度去描述: 一、集中趨勢量度---為這批數(shù)據(jù)找到它們的“代表”  均值(μ)   公式:   均值的局限性   均值是最常用的平均數(shù)之一,但是它的局限性在于“若用均值描述的數(shù)據(jù)中存在異常值的情況,會產(chǎn)生偏差” ; 例如下面一組數(shù)據(jù)就不太適合用均值來代表   這5個人的年齡均值是:31.2歲   很顯然,在這組數(shù)據(jù)中,大部分人的年齡是10幾歲的青少年,但是E的年齡是100歲為異常值,用均值來描述他們的年齡是31.2歲,

18、很顯然用均值作為描述這組數(shù)據(jù)是不合適的,那么我們該如何準(zhǔn)確的表征這組數(shù)據(jù)呢???   中位數(shù)   中位數(shù),又稱中點(diǎn)數(shù),中值。是按順序排列的一組數(shù)據(jù)中居于中間位置的數(shù)。   中位數(shù)的局限   回到上一個例子,若用中位數(shù)來表征這組數(shù)據(jù)的平均年齡,就變得更加合理,中位數(shù)15。   那么我們在看一下下面一組數(shù)據(jù),中位數(shù)的表現(xiàn)又如何?   中位數(shù):45   這組數(shù)據(jù)的中位數(shù)為:45,但是中位數(shù)45并不能代表這組數(shù)據(jù)。   因?yàn)檫@組數(shù)據(jù)分為兩批,兩批的差異很大。那么如何處理這類數(shù)據(jù)呢?接下來介紹第三位平均數(shù)。   眾數(shù)   眾數(shù)是樣本觀測值在頻數(shù)分布表中頻數(shù)最多的那一組的組中值。  

19、 平均數(shù)可以表征一批數(shù)據(jù)的典型值,但是僅憑平均數(shù)還不能給我們提供足夠的信息,平均數(shù)無法表征一組數(shù)據(jù)的分散程度。 二、 分散性與變異性的量度 ?。ㄈ?,迷你距,四分位數(shù),標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)分)   全距=max-min   全距也叫“極差”極差。 它是一組數(shù)據(jù)中最大值與最小值之差??梢杂糜诙攘繑?shù)據(jù)的分散程度。   全距的局限性   全距雖然求解方便快捷,但是它的局限性在于“若數(shù)據(jù)中存在異常值的情況,會產(chǎn)生偏差。為了擺脫異常值帶來的干擾,比如我們看一下下面的兩組數(shù)據(jù)。只是增加了一個異常值,兩組數(shù)據(jù)的全距產(chǎn)生了巨大的差異。   四分位數(shù)   所有觀測值從小到大排序后四等分,處于三個分割點(diǎn)位

20、置的數(shù)值就是四分位數(shù):Q1,Q2和Q3。   Q1:第一四分位數(shù) (Q1),又稱“較小四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字。   Q2:第二四分位數(shù) (Q2),又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字。   Q3:第三四分位數(shù) (Q3),又稱“較大四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。   迷你距 也叫“四分位距”   迷你距。 它是一組數(shù)據(jù)中較小四分位數(shù)與較大四分位數(shù)之差。   即: 迷你距= 上四分位數(shù) - 下四分位數(shù)   迷你距可以反映中間50%的數(shù)據(jù),如果出現(xiàn)了極大或極小的異常值,將會被排除在中心數(shù)據(jù)

21、50%以外。因此使用迷你距可以剔除數(shù)據(jù)中異常值。   全距,四分位距,箱形圖可以表征一組數(shù)據(jù)極大和極小值之間的差值跨度,一定程度上反應(yīng)了數(shù)據(jù)的分散程度,但是卻無法精準(zhǔn)的告訴我們,這些數(shù)值具體出現(xiàn)的頻率,那么我們該如何表征呢?   我們度量每批數(shù)據(jù)中數(shù)值的“變異”程度時,可以通過觀察每個數(shù)據(jù)與均值的距離來確定,各個數(shù)值與均值距離越小,變異性越小數(shù)據(jù)越集中,距離越大數(shù)據(jù)約分散,變異性越大。方差和標(biāo)準(zhǔn)差就是這么一對兒用于表征數(shù)據(jù)變異程度的概念。   方差   方差是度量數(shù)據(jù)分散性的一種方法,是數(shù)值與均值的距離的平方數(shù)的平均值。   標(biāo)準(zhǔn)差   標(biāo)準(zhǔn)差為方差的開方。   通過方差和標(biāo)準(zhǔn)差

22、我們現(xiàn)在可以表征一組數(shù)據(jù)的數(shù)值的變異程度。那么對于擁有不同均值和不同標(biāo)準(zhǔn)差的多個數(shù)據(jù)集我們?nèi)绾伪容^呢?   標(biāo)準(zhǔn)分---表征了距離均值的標(biāo)準(zhǔn)差的個數(shù)   標(biāo)準(zhǔn)分為我們提供了解決方法,當(dāng)比較均值和標(biāo)準(zhǔn)差各不相同的數(shù)據(jù)集時,我們可以把這些數(shù)值視為來自同一個標(biāo)準(zhǔn)的數(shù)據(jù)集,然后進(jìn)行比較。標(biāo)準(zhǔn)分將把每一個數(shù)據(jù)集轉(zhuǎn)化為通用的分布形態(tài),進(jìn)行比較。   標(biāo)準(zhǔn)分還有個重要的作用,它可以把正態(tài)分布變?yōu)闃?biāo)準(zhǔn)正態(tài)分布,后文會有介紹。 第一部分小節(jié)  1. 描述一批數(shù)據(jù),通過集中趨勢分析,找出其“代表值” ; 通過分散和變異性的描述,查看這批數(shù)據(jù)的分散程度。   2. 集中趨勢參數(shù): 均值,中位數(shù),眾數(shù)  

23、 3. 分散性和變異性參數(shù) : 全距,四分位距,方差,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)分   ----------------------------------------------------------------------------------------------------------------------------------- 第二部分: 關(guān)于“事件”的研究分析 ---概率論一、一個事件的情況  為了讓讀者更好理解,筆者概率論中最核心的概念以及概念之間彼此的關(guān)系繪制成了下圖,那么接下來筆者開始“講故事”了。   事件 --- 有概率可言的一件事情,一個事情可能會發(fā)生很多結(jié)果,結(jié)果

24、和結(jié)果之間要完全窮盡,相互獨(dú)立。   概率 --- 每一種結(jié)果發(fā)生的可能性。 所有結(jié)果的可能性相加等于1,也就是必然?。?!   概率分布 --- 我們把事件和事件所對應(yīng)的概率組織起來,就是這個事件的概率分布。   概率分布可以是圖象,也可以是表格。如下圖1和表2都可以算是概率分布   期望 --- 表征了綜合考慮事情的各種結(jié)果和結(jié)果對應(yīng)的概率后這個事情的綜合影響值。(一個事件的期望,就是代表這個事件的“代表值”,類似于統(tǒng)計(jì)里面的均值)   公式:   方差--- 表征了事件不同結(jié)果之間的差異或分散程度。   公式: 二、細(xì)說分布  理想很豐滿,現(xiàn)實(shí)很骨感。真實(shí)的生活中別說去

25、算一個事件的期望,即使把這個事件的概率分布能夠表述完整,每個事件對應(yīng)的概率值得出來就已經(jīng)是一件了不起的事情了。   因此,為了能更快更準(zhǔn)確的求解出事件的概率分布,當(dāng)某些事件,滿足某些特定的條件,那么我們可以直接根據(jù)這些條件,來套用一些固定的公式,來求解這些事件的分布,期望以及方差。 “離散型”數(shù)據(jù)和“連續(xù)性”數(shù)據(jù)差異  在我們展開分布的知識之前,先補(bǔ)充一個預(yù)備知識,什么是離散數(shù)據(jù),什么是連續(xù)數(shù)據(jù),它們二者之間有什么差異?   離散數(shù)據(jù): 一個粒兒,一個粒兒的數(shù)據(jù)就是離散型數(shù)據(jù)。   連續(xù)數(shù)據(jù): 一個串兒,一個串兒的數(shù)據(jù)就是連續(xù)型數(shù)據(jù)。   好啦,開個玩笑?。。e打我,下面分享干貨!!

26、!   其實(shí)上述描述并沒有錯誤,離散型和連續(xù)型數(shù)據(jù)是一對相對概念,同樣的數(shù)據(jù)既可能是離散型數(shù)據(jù),又可能是連續(xù)型數(shù)據(jù)。 判別一個數(shù)據(jù)是連續(xù)還是離散最本質(zhì)的因素在于,一個數(shù)據(jù)組中數(shù)據(jù)總體的量級和數(shù)據(jù)粒度之間的差異。差異越大越趨近于連續(xù)型數(shù)據(jù),差異越小越趨近于離散型數(shù)據(jù)。   舉個例子   人這個單位,對于一個家庭來說,就離散型數(shù)據(jù),一個家庭可能有 3個人,4個人,5個人....等等。   對于一個國家來說,就是連續(xù)型數(shù)據(jù),我們的國家有14億人口,那么以個人為單位在這個量級的數(shù)據(jù)群體里就是連續(xù)型數(shù)據(jù)。   清楚了離散型和連續(xù)型數(shù)據(jù)的差異,我們接下來一塊科普這幾種常用的特殊分布。 離散型分

27、布  離散數(shù)據(jù)的概率分布,就是離散分布。這三類離散型的分布,在“0-1事件”中可以采用,就是一個事只有成功和失敗兩種狀態(tài)。 連續(xù)型分布  連續(xù)型分布本質(zhì)上就是求連續(xù)的一個數(shù)據(jù)段概率分布。 正態(tài)分布  代表式:   f(x)----是該關(guān)于事件X的概率密度函數(shù)   μ --- 均值   σ ---方差   σ ---標(biāo)準(zhǔn)差   綠色區(qū)域的面積 ---該區(qū)間段的概率 正態(tài)分布概率的求法  tep1 --- 確定分布和范圍 ,求出均值和方差   tep2 --- 利用標(biāo)準(zhǔn)分將正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布 (還記得 第一部分的標(biāo)準(zhǔn)分嗎?)   tep3 ---查表找概率 離散

28、型分布 → 正態(tài)分布 (離散分布轉(zhuǎn)化為正態(tài)分布)   精彩的地方在這里,筆者已經(jīng)闡述了連續(xù)型數(shù)據(jù)和離散型數(shù)據(jù)是一對相對的概念,那么這就意味著在某種“邊界”條件下,離散型分布和連續(xù)型分布之間是可以相互轉(zhuǎn)化的。進(jìn)而簡化概率分布的計(jì)算。這里筆者不在偷懶直接上皂片了(編公式快吐了!?。。。? 三、多個事件的情況 --- “概率樹”和“貝葉斯定理”  多個事件就要探討事件和事件之間的關(guān)系   對立事件---如果一個事件,A’包含所有A不包含的可能性,那么我們稱A’和A是互為對立事件   窮盡事件---如何A和B為窮盡事件,那么A和B的并集為1   互斥事件---如何A和B為互斥事件,那么A和B沒

29、有任何交集   獨(dú)立事件---如果A件事的結(jié)果不會影響B(tài)事件結(jié)果的概率分布那么A和B互為獨(dú)立事件。   例子: 10個球,我隨機(jī)抽一個,放回去還是10個球,第二次隨機(jī)抽,還是10選1,那么第一次和第二次抽球的事件就是獨(dú)立的。   相關(guān)事件---如果A件事的結(jié)果會影響B(tài)事件結(jié)果的概率分布那么A和B互為獨(dú)立事件。   例子: 10個球,我隨機(jī)抽一個,不放回去還是10個球,第二次隨機(jī)抽是9選1,那么第一次和第二次抽球的事件就是相關(guān)的。   條件概率(條件概率,概率樹,貝葉斯公式)   條件概率代表:已知B事件發(fā)生的條件下,A事件發(fā)生的概率 概率樹 --- 一種描述條件概率的圖形工具

30、。  假設(shè)有個甜品店,顧客買甜甜圈的概率是3/4 ; 不買甜甜圈直接買咖啡的概率是1/3 ;同時買咖啡和甜甜圈概率是9/20。   從圖中我們可以發(fā)現(xiàn)以下兩個信息   1. 顧客買不買甜甜圈可以影響喝不喝咖啡的概率,所以事件甜甜圈與事件咖啡是一組相關(guān)事件   2. 概率樹每個層級分支的概率和都是1 貝葉斯公式 ----提供了一種計(jì)算逆條件概率的方法   貝葉斯公式用于以下場景,當(dāng)我們知道A發(fā)生的前提下B發(fā)生的概率,我們可以用貝葉斯公式來推算出B發(fā)生條件下A發(fā)生的概率。 第二部分小節(jié)  1. 事件,概率,概率分布之間的關(guān)系   2. 期望,方差的意義   3. 連續(xù)型數(shù)據(jù)和離

31、散型數(shù)據(jù)之間的區(qū)別和聯(lián)系   4. 幾何分布,二項(xiàng)分布,泊松分布,正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布   5. 離散分布和正態(tài)分布可以轉(zhuǎn)化   6. 多個事件之間的關(guān)系,相關(guān)事件和獨(dú)立事件,條件概率和貝葉斯公式   ----------------------------------------------------------------------------------------------------------------------------------- 第三部分: 關(guān)于“小樣本”預(yù)測“大總體”  現(xiàn)實(shí)生活中,總體的數(shù)量如果過于龐大我們無法獲取總體中每個數(shù)據(jù)的數(shù)值,進(jìn)行

32、對總體的特征提取進(jìn)而完成分析工作。那么接下來就用到了本章節(jié)的知識。 一、抽取樣本  總體:你研究的所有事件的集合   樣本:總體中選取相對較小的集合,用于做出關(guān)于總體本身的結(jié)論   偏倚:樣本不能代表目標(biāo)總體,說明該樣本存在偏倚   簡單隨機(jī)抽樣: 隨機(jī)抽取單位形成樣本。   分成抽樣: 總體分成幾組或者幾層,對每一層執(zhí)行簡單隨機(jī)抽樣   系統(tǒng)抽樣: 選取一個參數(shù)K,每到第K個抽樣單位,抽樣一次。 二、預(yù)測總體(點(diǎn)估計(jì)預(yù)測,區(qū)間估計(jì)預(yù)測)點(diǎn)估計(jì)量--- 一個總參數(shù)的點(diǎn)估計(jì)量就是可用于估計(jì)總體參數(shù)數(shù)值的某個函數(shù)或算式。   場景1: 樣本無偏的情況下,已知樣本,預(yù)測總體的均值,方

33、差。   (1) 樣本的均值 = 總體的估算均值(總體均值的點(diǎn)估計(jì)量) ≈ 總體實(shí)際均值(誤差是否可接受)  ?。?)總體方差 估計(jì)總體方差   場景2: 已知總體,研究抽取樣本的概率分布   比例抽樣分布:考慮從同一個總體中取得所有大小為n的可能樣本,由這些樣本的比例形成一個分布,這就是“比例抽樣分布”。樣本的比例就是隨機(jī)變量。   舉個栗子: 已知所有的糖球(總體)中紅色糖球比例為0.25。從總體中隨機(jī)抽n個糖球,我們可以求用比例抽樣分布求出這n個糖球中對應(yīng)紅球各種可能比例的概率。   樣本均值分布:考慮同一個總體中所有大小為n的可能樣本,然后用這個樣本的均值形成分布,該分

34、布就是“樣本均值分布” ,樣本的均值就是隨機(jī)變量。   中心極限定理:如果從一個非正態(tài)總體X中抽出一個樣本,且樣本極大(至少大于30),則的分布近似正態(tài)分布。 區(qū)間估計(jì)量--- 點(diǎn)估計(jì)量是利用一個樣本對總體進(jìn)行估計(jì),區(qū)間估計(jì)是利用樣本組成的一段區(qū)間對樣本進(jìn)行估計(jì)?! ∨e個栗子: 今天下午3點(diǎn)下雨;今天下午3點(diǎn)到4點(diǎn)下雨。如果我們的目的是為了盡可能預(yù)測正確,你會使用那句話術(shù)? 如何求置信區(qū)間?(這里筆者講一下思路,不畫圖碼公式了,讀者有興趣可以查閱一下教材)求置信區(qū)間簡便公式(直接上皂片)  關(guān)于C值參數(shù): 置信水平 90% C=1.64 , 95% C=1.96 , 99% C=2.58

35、 待補(bǔ)充知識一(t分布)  我們之前的區(qū)間預(yù)測有個前提,就是利用了中心極限定理,當(dāng)樣本量足夠大的時候(通常大于30),均值抽樣分布近似于正態(tài)分布。 若樣本量不夠大呢? 這是同樣的思路,只是樣本均值分布將近似于另一種分布處理更加準(zhǔn)確,那就是t分布。這里筆者直接放張圖,不做拓展了。 待補(bǔ)充知識二(卡方分布)----注意待補(bǔ)充不代表不重要,是筆者水平有限,目前還不能用簡單的語言概述其中的精髓?! 】ǚ椒植嫉亩x   若n個相互獨(dú)立的隨機(jī)變量ξ、ξ、……、ξn ,均服從標(biāo)準(zhǔn)正態(tài)分布,則這n個服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量的平方和構(gòu)成一新的隨機(jī)變量,其分布規(guī)律稱為卡方分布。   卡方分布的應(yīng)用場景

36、   用途1:用于檢驗(yàn)擬合優(yōu)度。也就是檢驗(yàn)一組給定的數(shù)據(jù)與指定分布的吻合程度;   用途2:檢驗(yàn)兩個變量的獨(dú)立性。通過卡方分布可以檢查變量之間是否存在某種關(guān)聯(lián): 三、驗(yàn)證結(jié)果(假設(shè)檢驗(yàn))  假設(shè)檢驗(yàn)是一種方法用于驗(yàn)證結(jié)果是否真實(shí)可靠。具體操作分為六個步驟。 兩類錯誤---即使我們進(jìn)行了“假設(shè)檢驗(yàn)”依然無法保證決策是百分百正確的,會出現(xiàn)兩類錯誤  第一類錯誤: 拒絕了一個正確的假設(shè),錯殺了一個好人   第二類錯誤: 接收了一個錯誤的假設(shè),放過了一個壞人 第三部分小節(jié)  1. 無偏抽樣   2. 點(diǎn)估計(jì)量預(yù)測(已知樣本預(yù)測總體,已知總體預(yù)測樣本)   3. 區(qū)間估計(jì)量預(yù)測(求置信

37、區(qū)間)   4. 假設(shè)檢驗(yàn)   ----------------------------------------------------------------------------------------------------------------------------------- 第四部分: 相關(guān)與回歸(y=ax+b)  這里介紹的相關(guān)和回歸是關(guān)于二維雙變量的最簡單最實(shí)用的線性回歸,非線性回歸這里不暫不做拓展。   散點(diǎn)圖:顯示出二變量數(shù)據(jù)的模式   相關(guān)性:變量之間的數(shù)學(xué)關(guān)系。   線性相關(guān)性:兩個變量之間呈現(xiàn)的直線相關(guān)關(guān)系。   最佳擬合直線:與數(shù)據(jù)點(diǎn)擬合程

38、度最高的線。(即每個因變量的值與實(shí)際值的誤差平方和最?。?   誤差平方和SSE:   線性回歸法:求最佳擬合直線的方法(y=ax+b),就是求參數(shù)a和b   斜率a公式:   公式:   相關(guān)系數(shù)r:表征描述的數(shù)據(jù)與最佳擬合線偏離的距離。(r=-1完全負(fù)相關(guān),r=1完全正相關(guān),r=0不相關(guān))   r公式:   ----------------------------------------------------------------------------------------------------------------------------------- 結(jié)束語

39、  筆者這里梳理了統(tǒng)計(jì)與概率學(xué)最基礎(chǔ)的概念知識,盡量闡述清楚這些概念知識之間關(guān)聯(lián)的關(guān)系,以及應(yīng)用的場景。底層概念是上層應(yīng)用的基礎(chǔ),當(dāng)今浮躁的“機(jī)器學(xué)習(xí)”,“神經(jīng)網(wǎng)絡(luò)”,“AI自適應(yīng)”這些高大上的關(guān)鍵字滿天飛。 筆者認(rèn)為踏踏實(shí)實(shí)的把“基礎(chǔ)”打扎實(shí),才是向上發(fā)展的唯一途徑。   筆者水平有限,概念理解有偏差的地方歡迎批評指正。   ----------------------------------------------------------------------------------------------------------------------------------- 參考書  《深入淺出---統(tǒng)計(jì)學(xué)》 作者:Dawn Griffiths 第 16 頁 共 16 頁

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關(guān)資源

更多
正為您匹配相似的精品文檔
關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!