應(yīng)用統(tǒng)計學(xué)第七章_第1頁
已閱讀1頁,還剩123頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計學(xué),制作:安徽大學(xué)管理學(xué)院 洪文,2,應(yīng)用統(tǒng)計學(xué),版權(quán)所有,未經(jīng)準(zhǔn)許,不得翻制,3,第七章 假設(shè)檢驗,第一節(jié) 假設(shè)檢驗的一般問題題 第二節(jié) 總體均值的假設(shè)檢驗 第三節(jié) 總體比例的假設(shè)檢驗 附錄7 用SPSS進(jìn)行假設(shè)檢驗,4,第一節(jié) 假設(shè)檢驗的一般問題,一、假設(shè)檢驗的基本原理 假設(shè)檢驗是推斷統(tǒng)計的重要內(nèi)容,所謂假設(shè)檢驗(Hypothesis Test)就是事先

2、作出一個關(guān)于總體參數(shù)的假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定應(yīng)接受或否定原假設(shè)的推斷統(tǒng)計方法。假設(shè)檢驗也稱為顯著性檢驗。,,5,第一節(jié) 假設(shè)檢驗的一般問題,假設(shè)檢驗不同于參數(shù)估計,參數(shù)估計是直接利用樣本的數(shù)據(jù)對未知的總體參數(shù)形成認(rèn)識,而假設(shè)檢驗則是首先提出對總體參數(shù)的假設(shè),然后根據(jù)樣本數(shù)據(jù)所反映的信息對原假設(shè)進(jìn)行分析和判斷。 下面舉例說明假設(shè)檢驗的基本原理。

3、,,6,第一節(jié) 假設(shè)檢驗的一般問題,[例7.1] 某保險公司部門經(jīng)理估計某險種的投保人的平均年齡是40歲,研究人員從實際投保該險種的人員中隨機(jī)抽取38人,調(diào)查得到他們投保時的年齡數(shù)據(jù)如下: 24 50 31 35 43 48 36 51 35 37 44 46 29 39 38 23 34 28 42 3

4、9 33 44 36 46 42 17 38 29 47 26 32 48 39 27 34 42 34 40,,7,第一節(jié) 假設(shè)檢驗的一般問題,試依據(jù)調(diào)查結(jié)果判斷部門經(jīng)理的估計是否可靠? 這是關(guān)于總體投保人的平均年齡是否等于40歲的假設(shè)檢驗問題。題中隨機(jī)抽取38人構(gòu)成樣本,由樣本數(shù)據(jù)計算得:

5、=37歲,這是否說明總體投保人的平均年齡不等于40歲呢?,,8,第一節(jié) 假設(shè)檢驗的一般問題,大家知道,由于抽樣的隨機(jī)性,樣本均值與總體均值之間總是存在一定的抽樣誤差,即使總體投保人的平均年齡如同那位經(jīng)理所估計的40歲(即?=40歲),樣本的平均年齡仍有可能大于或小于40歲。,,9,第一節(jié) 假設(shè)檢驗的一般問題,上一章介紹了抽樣誤差范圍與置信度的關(guān)系,即在95%的置信水平下,樣本均值與總體均值的誤差范圍不超過1.96倍的抽樣平均誤差

6、,即,,也可以說|-?|≥1.96?/n0.5的概率只有5%,通常認(rèn)為這是一個很小的概率,據(jù)此可以將 “|-?|≥1.96?/n0.5”視為小概率事件,這種事件在100次抽樣中只發(fā)生5次,相對于一次抽樣而言,可以認(rèn)為小概率事件幾乎是不可能發(fā)生的。,10,第一節(jié) 假設(shè)檢驗的一般問題,在本例中,已知n=38,假設(shè)?=40,經(jīng)計算得=37,s=8.07,計算統(tǒng)計量:,,結(jié)果表明,在一次抽樣中小概率事件發(fā)生了,這似乎不近

7、合理,所以可以認(rèn)為經(jīng)理估計的平均年齡為40歲的情況不可靠。,11,第一節(jié) 假設(shè)檢驗的一般問題,綜上可見,假設(shè)檢驗是根據(jù)“小概率事件在一次抽樣試驗中幾乎是不可能發(fā)生的”這一原理,先對總體參數(shù)做出某種假設(shè),然后依樣本統(tǒng)計量的估計值判斷假設(shè)是否合理,從而做出是否接受原假設(shè)的抉擇。,,12,第一節(jié) 假設(shè)檢驗的一般問題,二、假設(shè)檢驗的步驟 假設(shè)檢驗通常包括以下幾個步驟: (一)提出假設(shè)和備擇假

8、設(shè) 對每個假設(shè)檢驗問題,一般可同時提出兩個相反的假設(shè),即原假設(shè)和備擇假設(shè)。 原假設(shè)(Null Hypothesis)又稱零假設(shè),是待檢驗的假設(shè),記為H0;備擇假設(shè)(Alternative Hypothesis)是拒絕原假設(shè)后可供選擇的假設(shè),記為 H1。,,13,第一節(jié) 假設(shè)檢驗的一般問題,原假設(shè)和備擇假設(shè)是對立的,檢驗結(jié)果二者必取其一?;蛘呓邮蹾0而拒絕H1;或者拒

9、絕H0而接受H1。 原假設(shè)和備擇假設(shè)不是隨意提出的,應(yīng)根據(jù)所檢驗問題的具體背景而定。常常是采取“不輕易拒絕原假設(shè)”的原則,即把沒有充分理由不能輕易否定的命題作為原假設(shè),而相應(yīng)地把沒有足夠把握就不能輕易肯定的命題作為備擇假設(shè)。,,14,第一節(jié) 假設(shè)檢驗的一般問題,一般的,假設(shè)有三種形式: 1、H0:?= ?0;H1:?≠ ?0 或H0:p= ?;H1:p

10、≠?。 當(dāng)我們關(guān)心的問題是樣本估計值與假設(shè)的總體參數(shù)有沒有顯著性的差異,而不問其差異的方向時,應(yīng)當(dāng)采用這種形式的假設(shè)。把這種假設(shè)形式的檢驗稱為雙側(cè)檢驗(Two-Tailed Test)。例如例7.1中可提出假設(shè):H0:?= 40;H1:?≠40。,,15,第一節(jié) 假設(shè)檢驗的一般問題,2、H0:? ≥ ?0;H1:? <?0 H0:?≥?0;H1:? <?0。

11、 當(dāng)我們關(guān)心的問題是樣本估計值是否顯著的低于假設(shè)的總體參數(shù)時,應(yīng)當(dāng)采用這種形式的假設(shè)。把這種假設(shè)形式的檢驗稱為左單側(cè)檢驗。例如對某種電池使用壽命提出假設(shè): H0:? ≥ 1000小時;H1:? <1000小時,,16,第一節(jié) 假設(shè)檢驗的一般問題,3、H0:? ≤ ?0;H1:? > ?0 或H0:? ≤?0;H1:? >

12、;?0。 當(dāng)我們關(guān)心的問題是樣本估計值是否顯著地高于假設(shè)的總體參數(shù)時,應(yīng)當(dāng)采用這種形式的假設(shè)。把這種假設(shè)形式的檢驗稱為右單側(cè)檢驗。例如對某種產(chǎn)品不合格率提出假設(shè): H0:? ≤ 3%;H1:? > 3%,,17,第一節(jié) 假設(shè)檢驗的一般問題,左側(cè)檢驗和右側(cè)檢驗統(tǒng)稱為單側(cè)檢驗(One- Tailed Test)。采用哪種假設(shè)形式,要根據(jù)所研究的實際問題而定。如果對研究問題

13、只需判斷有無顯著差異的情況,則采用雙側(cè)檢驗。如果所關(guān)心的是總體參數(shù)是否比某個值偏大(或偏小),則宜采用單側(cè)檢驗。另外,在假設(shè)檢驗中,原假設(shè)總是與等號相聯(lián)系的(原假設(shè)最終還是取等號)。,,18,第一節(jié) 假設(shè)檢驗的一般問題,(二)選擇適當(dāng)?shù)慕y(tǒng)計量,并確定其分布形式 不同的假設(shè)檢驗問題需要選擇不同的統(tǒng)計量作為檢驗統(tǒng)計量。 在例7.1中,由于n=38 > 30是大樣本,所以樣本均值近似服

14、從正態(tài)分布,以樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,所用的統(tǒng)計量是:,,19,第一節(jié) 假設(shè)檢驗的一般問題,在H0為真時,z ~ N(0,1)。 (三)選擇顯著性水平?,確定原假設(shè)H0的接受區(qū)域和拒絕區(qū)域 顯著性水平(Level of Significance)即表示原假設(shè)H0為真時拒絕H1的概率,即拒絕原假設(shè)所冒的風(fēng)險,用?表示。假設(shè)檢驗應(yīng)用小概率事件實際不可能發(fā)生的原理,這里的小概率就是指?。但是要小到什么

15、程度才算小概率?對此并沒有統(tǒng)一的標(biāo)準(zhǔn)。通常取?=0.1、0.05或0.01等。,,20,第一節(jié) 假設(shè)檢驗的一般問題,在實際應(yīng)用中,一般是先給定了顯著性水平?,這樣就可以由有關(guān)的概率分布表查得臨界值(Critical Value)z?,從而確定H0的接受區(qū)域和拒絕區(qū)域。臨界值z?就是接受區(qū)域和拒絕區(qū)域的分界點。 對于不同形式的假設(shè),H0的接受區(qū)域和拒絕區(qū)域也有所不同。,,21,第一節(jié) 假設(shè)檢驗的一般問題,雙

16、側(cè)檢驗的拒絕區(qū)域位于統(tǒng)計量分布曲線的兩側(cè),如圖7.1(a)所示;左單側(cè)檢驗的拒絕區(qū)域位于統(tǒng)計量分布曲線的左側(cè),如圖7.1(b)所示;右單側(cè)檢驗的拒絕區(qū)域位于統(tǒng)計量分布曲線的右側(cè),如圖7.1(c)所示。 在例7.1中,若取?=0.05,由于是雙側(cè)檢驗,所以z?/2 = ?1.96。接受區(qū)域:- 1.96≤z≤1.96;拒絕區(qū)域:z > 1.96或z < - 1.96。,,22,第一節(jié) 假設(shè)檢驗的一般

17、問題,圖7.1 假設(shè)檢驗的接收域和拒絕域示意圖,,23,第一節(jié) 假設(shè)檢驗的一般問題,(四)做出結(jié)論 根據(jù)樣本資料計算出檢驗統(tǒng)計量z的具體值,如果檢驗統(tǒng)計量的值落在拒絕區(qū)域內(nèi),說明樣本所描述的情況與原假設(shè)有顯著性差異,應(yīng)拒絕原假設(shè);反之,則接受原假設(shè)。 對于例7.1,由于z = - 2.29落在拒絕區(qū)域內(nèi),所以拒絕原假設(shè)H0??梢缘贸鼋Y(jié)論:在?=0.05的顯著性水平下,抽樣結(jié)果的平均年齡顯著低于經(jīng)

18、理的估計值,有理由認(rèn)為經(jīng)理的估計不可靠。,,24,第一節(jié) 假設(shè)檢驗的一般問題,三、假設(shè)檢驗中的兩類錯誤 在做出接受或拒絕原假設(shè)H0的結(jié)論時,是基于樣本信息來判斷的。由于樣圖7.1假設(shè)檢驗的接受域與拒絕域示意圖本的隨機(jī)性,使假設(shè)檢驗有可能出現(xiàn)兩類錯誤,具體情況如下。 (一)第一類錯誤 當(dāng)原假設(shè)H0為真,但由于樣本的隨機(jī)性使樣本統(tǒng)計量落人了拒絕區(qū)域,這時所做的判斷是

19、拒絕原假設(shè)。,,25,第一節(jié) 假設(shè)檢驗的一般問題,這類錯誤稱為第一類錯誤,亦稱拒真錯誤。假設(shè)檢驗通常認(rèn)為“一次抽樣中小概率事件發(fā)生了”是不合理的,從而根據(jù)抽樣結(jié)果做出了拒絕原假設(shè)的結(jié)論。但事實上,小概率事件只是發(fā)生概率很小而已,并非絕對不發(fā)生。假如例7.1中真實情況是總體平均年齡的確為40歲,但是抽查到的樣本平均年齡是37歲,屬于小概率事件發(fā)生了,按照檢驗的規(guī)則應(yīng)當(dāng)拒絕原假設(shè)廳H0:?=40,從而認(rèn)為經(jīng)理的估計不可靠,這就犯了第一類

20、錯誤。,,26,第一節(jié) 假設(shè)檢驗的一般問題,犯第一類錯誤的概率,亦稱拒真概率,它實質(zhì)上就是前面提到的顯著性水平?, 即P(拒絕H0|[H0為真]= ?。 (二)第二類錯誤 當(dāng)原假設(shè)H0為不真,但由于樣本的隨機(jī)性使樣本統(tǒng)計量落人接受區(qū)域,這時的判斷是接受原假設(shè)。這類錯誤稱為第二類錯誤,亦稱取偽錯誤。,,27,第一節(jié) 假設(shè)檢驗的一般問題,假如例7.1中真實情況

21、是總體平均年齡為42歲,但是所抽查樣本的平均年齡是38歲,卻正好落在(40?2.57)歲的范圍內(nèi),這時按檢驗規(guī)則應(yīng)當(dāng)接受原假設(shè)玎H0:?=40,這就犯了第二類錯誤。犯第二類錯誤的概率亦稱取偽概率,用?表示,即P(接受H0|[H0不真]= ?。 由上述分析可見,接受原假設(shè)時,只是因為沒有發(fā)生小概率事件,還沒有充足的理由拒絕它(即還沒有足夠的把握拒絕它)。,,28,第一節(jié) 假設(shè)檢驗的一般問題,因此,所謂“接受原假

22、設(shè)”,并非肯定原假設(shè)就是正確的。 假設(shè)檢驗中,原假設(shè)H0可能為真也可能不真,我們的判斷(決策)有接受和拒絕兩種。因此,檢驗的結(jié)果共有四種可能情況,可概括為 表7.1。,,29,第一節(jié) 假設(shè)檢驗的一般問題,表7.1 假設(shè)檢驗的四種可能情況,,30,第一節(jié) 假設(shè)檢驗的一般問題,四、假設(shè)檢驗中的各種決策規(guī)則 上面介紹了假設(shè)檢驗的一般程序,給出了一般的檢驗決策規(guī)則,但在實際工作中還有其他較為

23、實用的檢驗決策規(guī)則,概括來講包括z值(或t值)檢驗法、置信區(qū)間檢驗法和p值檢驗法三種方法,下面以總體均值的假設(shè)檢驗為例說明各種檢驗情況下的決策規(guī)則。,,31,第一節(jié) 假設(shè)檢驗的一般問題,(一)z值(或t值)檢驗法 利用服從正態(tài)分布的統(tǒng)計量z進(jìn)行的假設(shè)檢驗稱為z值檢驗法。 按照z值檢驗法檢驗的程序是:根據(jù)總體標(biāo)準(zhǔn)差、樣本容量n和樣本均值計算出檢驗統(tǒng)計量z的值,即,,32,第一節(jié) 假

24、設(shè)檢驗的一般問題,對于給定的檢驗水平?,查正態(tài)分布表可得臨界值z?/2,將所計算的z值與臨界值比較,便可得出檢驗結(jié)論。具體應(yīng)用有以下三種情況: 1、若采用雙側(cè)檢驗,H0:? = ?0; H1:?≠ ?0,則臨界值為 - z?/2和z?/2。 決策規(guī)則:- z?/2≤z≤z?/2時,接受原假設(shè);反之,則拒絕原假設(shè)。 對于例7.1,由于z = -2

25、.29< -1.96,所以拒絕原假設(shè)H0。,,33,第一節(jié) 假設(shè)檢驗的一般問題,2、若采用左側(cè)檢驗,H0:? ≥ ?0; H1:? ?0,則臨界值為z?。 決策規(guī)則:當(dāng)z > z?時,拒絕原假設(shè);反之,則接受原假設(shè)。,,34,第一節(jié) 假設(shè)檢驗的一般問題,若利用服從t分布的統(tǒng)計量去檢驗總體均值的方法稱為t檢驗法,其檢驗的決策規(guī)則與z值檢驗法類似,具體的應(yīng)用將在下一節(jié)中介

26、紹。 (二)置信區(qū)間檢驗法 利用總體參數(shù)的置信區(qū)間進(jìn)行假設(shè)檢驗的方法稱為置信區(qū)間檢驗法。,,35,第一節(jié) 假設(shè)檢驗的一般問題,按照置信區(qū)間檢驗法檢驗的程序是:在原假設(shè)為真時,根據(jù)給定的檢驗水平?確定樣本均值落在總體均值?0兩側(cè)(或一側(cè))最大的允許范圍,再根據(jù)抽樣的結(jié)果觀察樣本均值是否落在這一允許范圍內(nèi),做出檢驗結(jié)論。具體應(yīng)用情況有: 1、若采用雙側(cè)檢驗,則置

27、信區(qū)間為:,,36,第一節(jié) 假設(shè)檢驗的一般問題,決策規(guī)則:當(dāng)樣本均值落在區(qū)間內(nèi),則接受原假設(shè);反之,拒絕原假設(shè)。 對于例7.1,由于,,即置信區(qū)間為(37.43,42.57),而=37,落在拒絕域,可以認(rèn)為樣本均值與假設(shè)的總體均值存在顯著差異,所以拒絕原假設(shè)H0。,37,第一節(jié) 假設(shè)檢驗的一般問題,2、若采用左側(cè)檢驗,則置信區(qū)間為:,,決策規(guī)則:當(dāng)樣本均值落在區(qū)間內(nèi),則接受原假設(shè);反之,拒絕原假設(shè)。

28、 3、若采用右側(cè)檢驗,則置信區(qū)間為,38,第一節(jié) 假設(shè)檢驗的一般問題,決策規(guī)則:當(dāng)樣本均值落在區(qū)間內(nèi),則接受原假設(shè);反之,拒絕原假設(shè)。 (三)P值檢驗法 p值(p-value)是指在原假設(shè)為真時,樣本統(tǒng)計量落在觀察值以外(抽樣分布尾部區(qū)域)的概率,也稱為觀察到的顯著性水平。,,39,第一節(jié) 假設(shè)檢驗的一般問題,按照p值檢驗法檢驗的程序是:根據(jù)總體標(biāo)準(zhǔn)差、樣

29、本容量n和樣本平均數(shù),計算出檢驗統(tǒng)計量z的值。查正態(tài)分布表確定樣本均值落在z以外(抽樣分布尾部區(qū)域)的概率p值,將所計算的p值與?比較,便可得出檢驗結(jié)論。 P值的計算同樣分以下三種情況: (1)若采用雙側(cè)檢驗,,,40,第一節(jié) 假設(shè)檢驗的一般問題,(2)若采用左側(cè)檢驗,,,(3)若采用右側(cè)檢驗,,41,第一節(jié) 假設(shè)檢驗的一般問題,p值檢驗法決策規(guī)則:

30、若p值 ?,則接受原假設(shè)H0。 顯然,p值是假設(shè)檢驗中可以導(dǎo)致拒絕原假設(shè)的概率值。p值越小,就越容易拒絕原假設(shè);p值越大,就越不容易拒絕原假設(shè)。對于例7.1有:,,42,第一節(jié) 假設(shè)檢驗的一般問題,由于p值=0.022 < ?=0.05,所以應(yīng)該拒絕原假設(shè)H0,可以認(rèn)為部門經(jīng)理的估計不可靠。 通過上述檢驗規(guī)則的介紹,可以看到三種檢驗方法存在著密切的關(guān)系,表現(xiàn)在:雙側(cè)檢驗時,若z值

31、(或t值)檢驗法的檢驗結(jié)果是在顯著性水平?下接受授H0,則意味著在置信水平1-?下置信區(qū)間必包括,這同樣意味著p值一定大于?值;,,43,第一節(jié) 假設(shè)檢驗的一般問題,相反,若z值(或t值)檢驗法的檢驗結(jié)果是在顯著性水平?下拒絕H0,則意味著在置信水平1-?下的置信區(qū)間不包括,同樣意味著p值一定小于?值。無論采用哪種檢驗方法,其檢驗的結(jié)論是一致的。單側(cè)檢驗時,其各種檢驗方法檢驗的結(jié)果也存在同樣的關(guān)系。 為了

32、便于理解,我們運用例7.1,將假設(shè)檢驗中的各種決策規(guī)則表示為圖7.2。,,44,第一節(jié) 假設(shè)檢驗的一般問題,圖7.2 例7.1中各種檢驗方法決策規(guī)劃示意圖,,45,第二節(jié) 總體均值的假設(shè)檢驗,本節(jié)主要通過實例介紹對總體均值進(jìn)行假設(shè)檢驗的方法。在實際檢驗時,與進(jìn)行區(qū)間估計一樣,通常要依據(jù)研究問題的不同或資料條件的不同而采用不同的處理方法,包括大樣本情況下對單一總體均值的假設(shè)檢驗、小樣本情況下對單一總體均值的假設(shè)檢驗以及獨立樣本情

33、況下對兩個總體均值之差的假設(shè)檢驗、配對樣本情況下對兩個總體均值之差的假設(shè)檢驗等幾種情況,下面分別予以介紹。,,46,第二節(jié) 總體均值的假設(shè)檢驗,一、單一總體均值的假設(shè)檢驗(大樣本) 由第五章介紹的抽樣分布定理可知:當(dāng)正態(tài)總體方差已知時,無論樣本容量大小,樣本均值都服從正態(tài)分布;若是非正態(tài)總體方差已知,只要是大樣本抽樣,樣本均值仍然近似服從正態(tài)分布,即樣本均值服從N (?,?2/n)。

34、 構(gòu)造檢驗統(tǒng)計量為:,,47,第二節(jié) 總體均值的假設(shè)檢驗,當(dāng)?=?0時,統(tǒng)計量服從N(0,1)。 如果非正態(tài)總體方差未知,大樣本時,實際應(yīng)用中是將樣本標(biāo)準(zhǔn)差s代替總體標(biāo)準(zhǔn)差?,構(gòu)造檢驗統(tǒng)計量為:,,48,第二節(jié) 總體均值的假設(shè)檢驗,在對實際問題的假設(shè)檢驗中,z檢驗法較為常用,但近年來,隨著計算機(jī)技術(shù)的普及應(yīng)用,像SPSS等,許多計算機(jī)軟件的統(tǒng)計功能中都可以報告P值,因此p值檢驗法不失為一種簡便易行的檢驗方

35、法。下面介紹各種檢驗方法的應(yīng)用。,,,49,第二節(jié) 總體均值的假設(shè)檢驗,[例7.2] 某橡膠廠生產(chǎn)汽車輪胎,根據(jù)歷史資料統(tǒng)計結(jié)果,平均里程為25 000公里,標(biāo)準(zhǔn)差為 1 900公里。現(xiàn)在從近期生產(chǎn)的輪胎中隨機(jī)抽取 400個做試驗,測得樣本平均里程=25 300公里。試按5%的顯著性水平判斷新的輪胎平均耐用里程與以往輪胎的耐用里程有沒有顯著的差異。 解:由于問題是判斷新、舊輪胎平均耐用里程有沒有顯

36、著的差異,并沒有問及差異的方向,因此,此題屬于雙側(cè)檢驗。檢驗過程如下:,,50,第二節(jié) 總體均值的假設(shè)檢驗,z檢驗法: (1)提出假設(shè):H0:?=25 000;H1:? ?25 000。 (2)由于是大樣本抽樣,且總體標(biāo)準(zhǔn)差?已知,所以使用式(7.1)的檢驗統(tǒng)計量。 (3)顯著性水平?取0.05,由于是雙側(cè)檢驗,由1-?=0.95查正態(tài)分布概率表得z?=

37、7;1.96,決策規(guī)則為: 若z > 1.96或z< - 1.96,則拒絕H0; 若-1.96≤z≤1.96,則接受H0。,,51,第二節(jié) 總體均值的假設(shè)檢驗,(4)根據(jù)抽樣結(jié)果,計算統(tǒng)計量z的實際值:,,(5)檢驗判斷:由于實際z=3.16>1.96,落在拒絕域,所以拒絕H0。 結(jié)論:以5%的顯著性水平可以認(rèn)為新的輪胎平均耐用里程比以往有顯著

38、的差異,即有明顯的提高。,52,第二節(jié) 總體均值的假設(shè)檢驗,置信區(qū)間檢驗法: (1)提出假設(shè):H0:?=25 000;H1:? ?25 000。 (2)由于是大樣本抽樣,且總體標(biāo)準(zhǔn)差?已知,所以使用式(7.1)的檢驗統(tǒng)計量。 (3)顯著性水平?取0.05,由于是雙側(cè)檢驗,則置信區(qū)間為:,,53,第二節(jié) 總體均值的假設(shè)檢驗,即(24 813.8,25 186.

39、2)。決策規(guī)則為: 若24 813.8≤≤25 186.2,則接受H0; 若25 186.2,則拒絕H0。 (4)根據(jù)抽樣結(jié)果: 樣本均值=25 300>25186.2,所以拒絕H0。 結(jié)論:以5%的顯著性水平可以認(rèn)為新的輪胎平均耐用里程有明顯的提高。,,54,第二節(jié) 總體均值的假設(shè)檢驗,p值檢驗法:

40、 (1)提出假設(shè):H0:?=25 000;H1:? ?25 000。 (2)由于是大樣本抽樣,且總體標(biāo)準(zhǔn)差?已知,所以使用式(7.1)的檢驗統(tǒng)計量。 (3)顯著性水平?取0.05,由于是雙側(cè)檢驗,則有:,,55,第二節(jié) 總體均值的假設(shè)檢驗,(4)由于P值近似為0,為極小概率,所以拒絕H0。 結(jié)論:有把握認(rèn)為新的輪胎平均耐用里程有明顯的提高。

41、 通過此題的解題過程說明,利用三種檢驗方法,得到的統(tǒng)計結(jié)論是一致的。,,56,第二節(jié) 總體均值的假設(shè)檢驗,[例7.3] 根據(jù)過去大量資料,某工廠生產(chǎn)的產(chǎn)品的使用壽命服從正態(tài)分布,其平均壽命為1 020小時,標(biāo)準(zhǔn)差為100小時。現(xiàn)從最近生產(chǎn)的一批產(chǎn)品中隨機(jī)抽取16件,測得樣本平均壽命為1 080小時。試在0.05的顯著性水平下判斷這批產(chǎn)品的使用壽命是否有顯著提高,并報告p值。 解:問題

42、是判斷新產(chǎn)品壽命有沒有顯著的提高,問及到差異的方向,本著把不能輕易肯定的命題作為備擇假設(shè)的原則,此題屬于右單側(cè)檢驗。,,57,第二節(jié) 總體均值的假設(shè)檢驗,根據(jù)題意,提出假設(shè):H0:?≤1020; H1: ?>1020。 由于是正態(tài)總體,且標(biāo)準(zhǔn)差已知,因此使用式(7.1)的檢驗統(tǒng)計量。依?=0.05查表得臨界值 z?=z0.05=1.645。 計算檢驗

43、統(tǒng)計量:,,58,第二節(jié) 總體均值的假設(shè)檢驗,由于z =2.4 > z?=1.645,所以應(yīng)該拒絕H0。而接受H1。即有把握認(rèn)為這批產(chǎn)品的使用壽命確有提高。 由于是右單側(cè)檢驗,所以:,,因為p值=0.0082<?=0.05,所以拒絕原假設(shè)。結(jié)論與上述z檢驗法相同。,59,第二節(jié) 總體均值的假設(shè)檢驗,[例7.4] 某電池廠生產(chǎn)的某種電池,歷史資料表明平均發(fā)光時間為1 000小時,在最近生產(chǎn)的產(chǎn)

44、品中抽取100個電池,測得平均發(fā)光時間為990小時,標(biāo)準(zhǔn)差為80小時,給定顯著性水平為0.05,問新生產(chǎn)的電池發(fā)光時間是否有明顯的降低。 解:由于問題是判斷新電池發(fā)光時間有沒有顯著的降低,問及差異的方向,因此,此題屬于左單側(cè)檢驗。,,60,第二節(jié) 總體均值的假設(shè)檢驗,依題意提出假設(shè):H0:?≥1000;H1:? -z?= -1.645, 所以不應(yīng)拒絕H0,即有理由認(rèn)為現(xiàn)在生產(chǎn)的

45、電池發(fā)光時間與原有的相比沒有顯著降低。,,61,第二節(jié) 總體均值的假設(shè)檢驗,若采用P值檢驗法,過程如下:,,因為p值=0.106>?=0.05,所以不能拒絕原假設(shè)。結(jié)論與上述z檢驗法一致。,62,第二節(jié) 總體均值的假設(shè)檢驗,二、單一總體均值的假設(shè)檢驗(小樣本) 設(shè)總體服從正態(tài)分布X=N(?,?2),但總體標(biāo)準(zhǔn)差?未知,此時對總體均值的檢驗不能用上述z檢驗法,因為此時的檢驗統(tǒng)計量z中包含了未知參數(shù)? 。

46、 為了得到一個不含未知參數(shù)的檢驗統(tǒng)計量,很自然會用樣本標(biāo)準(zhǔn)差s來代替?,于是得到t統(tǒng)計量。由第五章第二節(jié)內(nèi)容可知,在小樣本抽樣情況下,若?=?0成立時,檢驗統(tǒng)計量及其分布為:,,63,第二節(jié) 總體均值的假設(shè)檢驗,利用服從t分布的統(tǒng)計量去檢驗總體均值的方法稱為t檢驗法。其具體做法是:根據(jù)題意提出假設(shè)(與z檢驗法中的假設(shè)形式相同);構(gòu)造檢驗統(tǒng)計量t并根據(jù)樣本信息計算其具體值;對于給定的檢驗水平?,由t分布表查得臨

47、界值;將所計算的t值與臨界值比較,做出檢驗結(jié)論。決策規(guī)則如下:,,64,第二節(jié) 總體均值的假設(shè)檢驗,1、若采用雙側(cè)檢驗,H0:?= ?0; H1:?≠ ?0,則臨界值為 - t?/2和t?/2。 決策規(guī)則:- t?/2≤t≤t?/2時,接受原假設(shè);反之,則拒絕原假設(shè)。 2、若采用左側(cè)檢驗,H0:? ≥ ?0; H1:? < ?0,

48、則臨界值為 - t?。 決策規(guī)則:當(dāng)t < -t?時,拒絕原假設(shè);反之,則接受原假設(shè)。,,65,第二節(jié) 總體均值的假設(shè)檢驗,3、若采用右側(cè)檢驗,H0:? ≤ ?0; H1:? > ?0,則臨界值為t?。 決策規(guī)則:當(dāng)t > t?時,拒絕原假設(shè);反之,則接受原假設(shè)。,,66,第二節(jié) 總體均值的假設(shè)檢驗,[例7.5] 某工廠采用自動包裝

49、機(jī)分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標(biāo)準(zhǔn)重量為800克。某日隨機(jī)抽查10包,測得每包凈重數(shù)據(jù)(單位:克)如下:789、780、794、762、802、 813、770、785、810、806。試在0.05的顯著性水平下,檢驗當(dāng)天包裝機(jī)工作是否正常,并報告p值。 解:根據(jù)題意,檢驗?zāi)康氖怯^察產(chǎn)品的平均每包重量是否與標(biāo)準(zhǔn)重量一致,屬于雙側(cè)檢驗問題。因此,可建立如下假設(shè):,,67,第二節(jié) 總體均值的假

50、設(shè)檢驗,H0:?= 800;H1:? ≠ 800, 由于是正態(tài)總體且標(biāo)準(zhǔn)差未知,小樣本抽樣,可使用式(7.3)的t檢驗統(tǒng)計量,依?=0.05查表得臨界值t(?,n-1)=t(0.05,9)=2.262。 根據(jù)樣本數(shù)據(jù)計算得:=791.1,s=17.136,n=10。檢驗統(tǒng)計量:,,68,第二節(jié) 總體均值的假設(shè)檢驗,由于|t|=1.64<t(?,n-1)=t(0.05,9)=2.

51、262,所以可以接受H0,即可認(rèn)為這天自動包裝機(jī)工作正常。,,顯然p值=0.10>?=0.05,所以接受原假設(shè)。結(jié)論與上述t檢驗法一致。,69,第二節(jié) 總體均值的假設(shè)檢驗,t檢驗法適用于小樣本情況下總體方差未知時對正態(tài)總體均值的假設(shè)檢驗。隨著樣本容量n的增大,t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。所以大樣本情況下(n>30),總體方差未知時對正態(tài)總體均值的假設(shè)檢驗仍可用z檢驗法。,,70,第二節(jié) 總體均值的假設(shè)檢驗,三、兩個總體

52、均值差異的假設(shè)檢驗 在實際推斷統(tǒng)計中,有時涉及對兩個總體均值之差的檢驗,如比較兩種產(chǎn)品的平均使用壽命、兩種方法的平均結(jié)果,這就需要利用相應(yīng)兩個樣本的觀察值,對兩個總體均值的差異作出檢驗和判斷,其檢驗方法與步驟與上面我們所介紹的單一總體均值的假設(shè)檢驗方法與步驟完全類似。,,71,第二節(jié) 總體均值的假設(shè)檢驗,首先提出假設(shè),假設(shè)的基本形式為: 雙側(cè)檢驗:H0:?1 - ?2=0;H1:?1 -

53、 ?2≠0 右單側(cè)檢驗:H0:?1 - ?2≦0;H1:?1 - ?2> 0 左單側(cè)檢驗:H0:?1 - ?2≧0;H1:?1 - ?2<0 利用不同方式獲取的樣本,在檢驗時的情況又有所不同,檢驗通常分為獨立樣本和配對樣本兩種情形,下面分別予以說明。,,72,第二節(jié) 總體均值的假設(shè)檢驗,(一)兩個總體均值差異的假設(shè)檢驗(獨立樣本) 若比較兩

54、個總體均值之間的差異,可直接根據(jù)來自兩個不同總體獨立抽取的樣本信息,做出檢驗和判斷。由于樣本容量不同、對總體標(biāo)準(zhǔn)差掌握的情況不同,因此檢驗的過程有所不同,具體分述如下。,,73,第二節(jié) 總體均值的假設(shè)檢驗,1、兩正態(tài)總體標(biāo)準(zhǔn)差已知或大樣本 由第六章第二節(jié)介紹的內(nèi)容可知,如果兩個總體都服從正態(tài)分布、標(biāo)準(zhǔn)差都已知,或兩個總體均不服從正態(tài)分布、標(biāo)準(zhǔn)差都未知,但兩個獨立樣本的容量n1和n2都足夠大時,樣本均值之差1-2的抽樣

55、分布服從或近似服從正態(tài)分布,可采用的檢驗統(tǒng)計量:,,74,第二節(jié) 總體均值的假設(shè)檢驗,[例7.6] 某汽車公司經(jīng)理要比較A種與B種兩種汽油的性能。選用同類型汽車,分兩組各30輛,試開一周,甲隊使用A種汽油,乙隊使用B種汽油,記錄下海輛汽車每加侖汽油行駛的平均里程,數(shù)據(jù)如下(公里/加侖)。試按顯著性水平 ?=0.05,判斷兩種汽油的公里/加侖指標(biāo)有無明顯差別。,,75,第二節(jié) 總體均值的假設(shè)檢驗,A汽油

56、16 18 16 21 19 15 18 21 27 2615 20 20 22 23 19 14 13 28 21 19 17 19 23 20 25 20 14 26 23 B汽油 18 16 19 20

57、21 20 13 21 12 20 14 17 18 16 17 14 18 20 19 25 17 16 19 23 24 20 25 24 16 13,,76,第二節(jié) 總體均值的假設(shè)檢驗,解:依題意,若判斷兩種汽油的公里/加侖指標(biāo)有無明顯差別,應(yīng)用雙側(cè)檢驗。

58、 提出原假設(shè)和備擇假設(shè):(設(shè)?1 , ?2分別代表A型汽油、B型汽油的平均里程) H0:?1 - ?2 = 0;H1:?1 - ?2≠0 此題中兩個樣本均為大樣本,且兩個總體的標(biāo)準(zhǔn)差未知,按式(7.5)計算統(tǒng)計量:,,77,第二節(jié) 總體均值的假設(shè)檢驗,由?=0.05,得z?/2=±1.96。 根據(jù)樣本數(shù)據(jù)及計算得:

59、 A型:1=19.93,s12=16; B型:2=18.57,、s22 =12;n1=n2=30,,由于z=0.58< |z?/2|=1.96,所以接受原假設(shè),可以認(rèn)為兩種汽油的公里/加侖指標(biāo)沒有明顯差別。,78,第二節(jié) 總體均值的假設(shè)檢驗,2、兩正態(tài)總體方差未知但相等且小樣本 若總體都服從正態(tài)分布,當(dāng)兩個總體方差未知時,需要用樣本的方差來估計,但小樣本估計的方法與大樣本情

60、況不同,此時由于?1=?2,可通過兩個樣本方差合并求得總體方差的合并估計值,采用的檢驗統(tǒng)計量為:,,79,第二節(jié) 總體均值的假設(shè)檢驗,統(tǒng)計量t分布的自由度為n1+n2-2。其中:,,80,第二節(jié) 總體均值的假設(shè)檢驗,[例7.7] 某生產(chǎn)車間為了比較改進(jìn)生產(chǎn)工藝前后,工人組裝產(chǎn)品的平均用時是否縮短,在改進(jìn)生產(chǎn)工藝前后各抽取12名工人,調(diào)查得到他們某次組裝產(chǎn)品的時間數(shù)據(jù)(單位:秒)如下: 改前x1: 3

61、00 344 372 288 376 301 280 385 360 321 290 283 改后x2: 276 310 200 317 320 334 222 338 302 260 312 265 263,,81,第二節(jié) 總體均值的假設(shè)檢驗,假設(shè)改進(jìn)生產(chǎn)工藝前后工人組裝產(chǎn)品的時間均服從正態(tài)分布,且方差相等,試在0.05的顯著性水平下檢驗

62、改進(jìn)生產(chǎn)工藝后工人的平均組裝產(chǎn)品的時間是否比以前顯著縮短。 解:依題意,巖判斷工入的平均組裝時問是否比以前顯著縮短,應(yīng)用左單側(cè)檢驗。 提出原假設(shè)和備擇假設(shè):(設(shè)?1 , ?2分別代表改進(jìn)前、后的平均組裝時間),,82,第二節(jié) 總體均值的假設(shè)檢驗,H0:?1 - ?2≧0 (沒有縮短時間),H1:?1 - ?2< 0 (縮短時間) 此題為小樣本,且兩個總體均

63、服從正態(tài)分布、方差未知但相等,按式(7.6)計算統(tǒng)計量。 根據(jù)樣本數(shù)據(jù)計算得: 改前:1=325,s12=1 600; 改后:2=288,s22=1 936;nl=n2=12,,83,第二節(jié) 總體均值的假設(shè)檢驗,由?=0.05,查t分布表得t(0.10,12+12-2)= - 1.717 接受域為:t > - 1.717;拒絕域為:y < - 1.71

64、7。 由于t = -2.155 < t?= -1.717,所以拒絕原假設(shè),可以認(rèn)為改進(jìn)生產(chǎn)工藝后工人的平均組裝產(chǎn)品的時間比以前顯著縮短了。,,84,第二節(jié) 總體均值的假設(shè)檢驗,(二)兩個總體均值差異的假設(shè)檢驗(配對樣本) 在比較兩個總體均值之間的差異時,有時需要對比兩種不同處理效果有無顯著差別,如對比患者服用某種藥物前后的療效、工人經(jīng)過技術(shù)培訓(xùn)前后的工作效率等,這就需要在相同條件

65、下,調(diào)查取得一組成對的觀察值,進(jìn)行對比,作出檢驗和判斷,也就是根據(jù)配對樣本對兩個總體均值差異的檢驗。,,85,第二節(jié) 總體均值的假設(shè)檢驗,對于例7.6,樣本是在改進(jìn)工藝前后的工人總體中分別抽取的,據(jù)此計算的抽樣誤差可能會包含來自工人個體技能方面的差異,為了減少這種差異對檢驗判斷的影響,我們可以抽樣觀察同一工人在兩種工藝下的組裝時間,從而判斷改進(jìn)工藝前后的工人組裝時間差。這就是根據(jù)配對樣本對兩個總體均值差異的檢驗。,,86,第二節(jié)

66、 總體均值的假設(shè)檢驗,檢驗的方法是:首先求出每對觀察值的差值 di以及差值的均值d和標(biāo)準(zhǔn)差sd,其中:,,假定兩個總體均服從正態(tài)分布,則差值di也服從正態(tài)分布,當(dāng)總體標(biāo)準(zhǔn)差未知且小樣本時,可以用自由度為(n-1)的t分布來檢驗總體均值差異?d的原假設(shè)。 檢驗的統(tǒng)計量為:,87,第二節(jié) 總體均值的假設(shè)檢驗,下面舉例說明根據(jù)配對樣本對兩個總體均值差異檢驗方法的應(yīng)用。 [例7.8] 某生產(chǎn)

67、車間為了比較改進(jìn)生產(chǎn)工藝前后,工人組裝產(chǎn)品的平均用時是否縮短,隨機(jī)抽取6名工人,調(diào)查得到他們在改進(jìn)生產(chǎn)工藝前后組裝產(chǎn)品的時間數(shù)據(jù)(單位:分鐘)如下:,,88,第二節(jié) 總體均值的假設(shè)檢驗,,89,第二節(jié) 總體均值的假設(shè)檢驗,假設(shè)改進(jìn)生產(chǎn)工藝前后工人的組裝產(chǎn)品時間均服從正態(tài)分布,試在0.05的顯著性水平下檢驗改進(jìn)生產(chǎn)工藝后工人的平均組裝產(chǎn)品的時間是否比以前顯著縮短。 解:雖然觀察樣本數(shù)據(jù)的差值多數(shù)為負(fù)數(shù),但

68、不能簡單認(rèn)為總體上改進(jìn)后的組裝時間比以前顯著縮短了,所以提出以下假設(shè):,,90,第二節(jié) 總體均值的假設(shè)檢驗,H0:?d≥0(沒有縮短時間),H1:?d <0(縮短時間) 依題意:由于得到的是配對樣本的數(shù)據(jù),差值d服從正態(tài)分布,?未知且小樣本,所以按式(7.7)計算統(tǒng)計量。 根據(jù)樣本數(shù)據(jù)計算得:,,91,第二節(jié) 總體均值的假設(shè)檢驗,由?=0.05,查雙尾合計概率為0.10的t分布表得

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論