非參數(shù)檢驗(yàn)

跳轉(zhuǎn)到: 導(dǎo)航, 搜索

非參數(shù)檢驗(yàn)(Nonparametric tests)檢驗(yàn)假設(shè)或估計(jì)參數(shù)的統(tǒng)計(jì)過程,其中不需要關(guān)于總體分布的性質(zhì)或形狀的假設(shè);也稱作無分布檢驗(yàn)?! ?/p>

目錄

相關(guān)知識(shí)

一、非參數(shù)檢驗(yàn)的來由

非參數(shù)檢驗(yàn)是統(tǒng)計(jì)分析方法的重要組成部分,它與參數(shù)檢驗(yàn)共同構(gòu)成統(tǒng)計(jì)推斷的基本內(nèi)容。參數(shù)檢驗(yàn)是在總體分布形式已知的情況下,對(duì)總體分布的參數(shù)如均值、方差等進(jìn)行推斷的方法。但是,在數(shù)據(jù)分析過程中,由于種種原因,人們往往無法對(duì)總體分布形態(tài)作簡單假定,但又希望能從樣本數(shù)據(jù)中獲得盡可能的信息,此時(shí)參數(shù)檢驗(yàn)的方法就不再適用了。非參數(shù)檢驗(yàn)正是一類基于這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數(shù)據(jù)對(duì)總體分布形態(tài)等進(jìn)行推斷的方法。由于非參數(shù)檢驗(yàn)方法在推斷過程中不涉及有關(guān)總體分布的參數(shù),因而得名為“非參數(shù)”檢驗(yàn)。  

二、單樣本非參數(shù)檢驗(yàn)

SPSS單樣本非參數(shù)檢驗(yàn)是對(duì)單個(gè)總體的分布形態(tài)等進(jìn)行推斷的方法,其中包括卡方檢驗(yàn)、二項(xiàng)分布檢驗(yàn)、K-S檢驗(yàn)以及變量值隨機(jī)性檢驗(yàn)等方法?! ?/p>

1、總體分布的卡方檢驗(yàn)

例如,醫(yī)學(xué)家在研究心臟病猝死人數(shù)與日期的關(guān)系時(shí)發(fā)現(xiàn):一周之中,星期一心臟病人猝死者較多,其他日子則基本相當(dāng)。當(dāng)天的比例近似為2.8:1:1:1:1:1:1。現(xiàn)收集到心臟病人死亡日期的樣本數(shù)據(jù),推斷其總體分布是否與上述理論分布相吻合。

卡方檢驗(yàn)方法可以根據(jù)樣本數(shù)據(jù),推斷總體分布與期望分布或某一理論分布是否存在顯著差異,是一種吻合性檢驗(yàn),通常適于對(duì)有多項(xiàng)分類值的總體分布的分析。它的原假設(shè)是:樣本來自得總體分布與期望分布或某一理論分布無差異。  

2、二項(xiàng)分布檢驗(yàn)

在生活中有很多數(shù)據(jù)的取值是二值的,例如,人群可以分成男性和女性,產(chǎn)品可以分成合格和不合格,學(xué)生可以分成三好學(xué)生和非三好學(xué)生,投擲硬幣實(shí)驗(yàn)的結(jié)果可以分成出現(xiàn)正面和出現(xiàn)反面等。通常將這樣的二值分別用1或0表示。如果進(jìn)行n次相同的實(shí)驗(yàn),則出現(xiàn)兩類(1或0)的次數(shù)可以用離散型隨機(jī)變量X來描述。如果隨機(jī)變量X為1的概率設(shè)為P,則隨機(jī)變量X值為0的概率Q便等于1-P,形成二項(xiàng)分布。

SPSS的二項(xiàng)分布檢驗(yàn)正是要通過樣本數(shù)據(jù)檢驗(yàn)樣本來自的總體是否服從指定的概率為P的二項(xiàng)分布,其原假設(shè)是:樣本來自的總體與指定的二項(xiàng)分布無顯著差異。

從某產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測并得到檢測結(jié)果。用1表示一級(jí)品,用0表示非一級(jí)品。根據(jù)抽樣結(jié)果驗(yàn)證該批產(chǎn)品的一級(jí)品率是否為90%。  

3、單樣本K-S檢驗(yàn)

K-S檢驗(yàn)方法能夠利用樣本數(shù)據(jù)推斷樣本來自的總體是否服從某一理論分布,是一種擬合優(yōu)度的檢驗(yàn)方法,適用于探索連續(xù)型隨機(jī)變量的分布。

例如,收集一批周歲兒童身高的數(shù)據(jù),需利用樣本數(shù)據(jù)推斷周歲兒童總體的身高是否服從正態(tài)分布。再例如,利用收集的住房狀況調(diào)查的樣本數(shù)據(jù),分析家庭人均住房面積是否服從正態(tài)分布。

單樣本K-S檢驗(yàn)的原假設(shè)是:樣本來自得總體與指定的理論分布無顯著差異,SPSS的理論分布主要包括正態(tài)分布、均勻分布、指數(shù)分布和泊松分布等?! ?/p>

4、變量值隨機(jī)性檢驗(yàn)

變量值隨機(jī)性檢驗(yàn)通過對(duì)樣本變量值的分析,實(shí)現(xiàn)對(duì)總體的變量值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn)。

例如,在投硬幣時(shí),如果以1表示出現(xiàn)的是正面,以0表示出現(xiàn)的是反面,在進(jìn)行了若干次投幣后,將會(huì)得到一個(gè)以1,0組成的變量值序列。這時(shí)可能會(huì)分析“硬幣出現(xiàn)正反面是否是隨機(jī)的”這樣的問題。

變量值隨機(jī)性檢驗(yàn)正是解決這類問題的一個(gè)有效方法。它的原假設(shè)是:總體變量值出現(xiàn)是隨機(jī)的。

變量隨機(jī)性檢驗(yàn)的重要依據(jù)是游程。所謂游程是樣本序列中連續(xù)出現(xiàn)相同的變量值的次數(shù)。可以直接理解,如果硬幣的正反面出現(xiàn)是隨機(jī)的,那么在數(shù)據(jù)序列中,許多個(gè)1或許多個(gè)0連續(xù)出現(xiàn)的可能性將不太大,同時(shí),1和0頻繁交叉出現(xiàn)的可能性也會(huì)較小。因此,游程數(shù)太大或太小都將表明變量值存在不隨機(jī)的現(xiàn)象。

例:為檢驗(yàn)?zāi)衬蛪涸O(shè)備在某段時(shí)間內(nèi)工作是否持續(xù)正常,測試并記錄下該時(shí)間段內(nèi)各個(gè)時(shí)間點(diǎn)上的設(shè)備耐壓的數(shù)據(jù)?,F(xiàn)采用游程檢驗(yàn)方法對(duì)這批數(shù)據(jù)進(jìn)行分析。如果耐壓數(shù)據(jù)的變動(dòng)是隨機(jī)的,可認(rèn)為該設(shè)備工作一直正常,否則認(rèn)為該設(shè)備有不能正常工作的現(xiàn)象?! ?/p>

二、兩獨(dú)立樣本的非參數(shù)檢驗(yàn)

兩獨(dú)立樣本的非參數(shù)檢驗(yàn)是在對(duì)總體分布不甚了解的情況下,通過對(duì)兩組獨(dú)立樣本的分析來推斷樣本來自得兩個(gè)總體的分布等是否存在顯著差異的方法。獨(dú)立樣本是指在一個(gè)總體中隨機(jī)抽樣對(duì)在另一個(gè)總體中隨機(jī)抽樣沒有影響的情況下所獲得的樣本。

SPSS中提供了多種兩獨(dú)立樣本的非參數(shù)檢驗(yàn)方法,其中包括曼-惠特尼U檢驗(yàn)、K-S檢驗(yàn)、W-W游程檢驗(yàn)、極端反應(yīng)檢驗(yàn)等。

某工廠用甲乙兩種不同的工藝生產(chǎn)同一種產(chǎn)品。如果希望檢驗(yàn)兩種工藝下產(chǎn)品的使用是否存在顯著差異,可從兩種工藝生產(chǎn)出的產(chǎn)品中隨機(jī)抽樣,得到各自的使用壽命數(shù)據(jù)。

甲工藝:675 682 692 679 669 661 693

乙工藝:662 649 672 663 650 651 646 652  

1、曼-惠特尼U檢驗(yàn)

兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)可用于對(duì)兩總體分布的比例判斷。其原假設(shè):兩組獨(dú)立樣本來自的兩總體分布無顯著差異。曼-惠特尼U檢驗(yàn)通過對(duì)兩組樣本平均秩的研究來實(shí)現(xiàn)判斷。秩簡單說就是變量值排序的名次,可以將數(shù)據(jù)按升序排列,每個(gè)變量值都會(huì)有一個(gè)在整個(gè)變量值序列中的位置或名次,這個(gè)位置或名次就是變量值的秩?! ?/p>

2、K-S檢驗(yàn)

K-S檢驗(yàn)不僅能夠檢驗(yàn)單個(gè)總體是否服從某一理論分布,還能夠檢驗(yàn)兩總體分布是否存在顯著差異。其原假設(shè)是:兩組獨(dú)立樣本來自的兩總體的分布無顯著差異。

這里是以變量值的秩作為分析對(duì)象,而非變量值本身?! ?/p>

3、游程檢驗(yàn)

單樣本游程檢驗(yàn)是用來檢驗(yàn)變量值的出現(xiàn)是否隨機(jī),而兩獨(dú)立變量的游程檢驗(yàn)則是用來檢驗(yàn)兩獨(dú)立樣本來自的兩總體的分布是否存在顯著差異。其原假設(shè)是:兩組獨(dú)立樣本來自的兩總體的分布無顯著差異。

兩獨(dú)立樣本的游程檢驗(yàn)與單樣本游程檢驗(yàn)的思想基本相同,不同的是計(jì)算游程數(shù)的方法。兩獨(dú)立樣本的游程檢驗(yàn)中,游程數(shù)依賴于變量的秩?! ?/p>

4、極端反應(yīng)檢驗(yàn)

極端反應(yīng)檢驗(yàn)從另一個(gè)角度檢驗(yàn)兩獨(dú)立樣本所自得兩總體分布是否存在顯著差異。其原假設(shè)是:兩獨(dú)立樣本來自的兩總體的分布無顯著差異。

基本思想是:將一組樣本作為控制樣本,另一組樣本作為實(shí)驗(yàn)樣本。以控制樣本作為對(duì)照,檢驗(yàn)實(shí)驗(yàn)樣本相對(duì)于控制樣本是否出現(xiàn)了極端反應(yīng)。如果實(shí)驗(yàn)樣本沒有出現(xiàn)極端反應(yīng),則認(rèn)為兩總體分布無顯著差異,相反則認(rèn)為存在顯著差異?! ?/p>

三、多獨(dú)立樣本的非參數(shù)檢驗(yàn)

多獨(dú)立樣本的非參數(shù)檢驗(yàn)是通過分析多組獨(dú)立樣本數(shù)據(jù),推斷樣本來自的多個(gè)總體的中位數(shù)或分布是否存在顯著差異。多組獨(dú)立樣本是指按獨(dú)立抽樣方式獲得的多組樣本。

SPSS提供的多獨(dú)立樣本非參數(shù)檢驗(yàn)的方法主要包括中位數(shù)檢驗(yàn)、Kruskal-Wallis檢驗(yàn)、Jonckheere-Terpstra檢驗(yàn)。

例:希望對(duì)北京、上海、成都、廣州四個(gè)城市的周歲兒童的身高進(jìn)行比較分析。采用獨(dú)立抽樣方式獲得四組獨(dú)立樣本?! ?/p>

1、中位數(shù)檢驗(yàn)

中位數(shù)檢驗(yàn)通過對(duì)多組獨(dú)立樣本的分析,檢驗(yàn)它們來自的總體的中位數(shù)是否存在顯著差異。其原假設(shè)是:多個(gè)獨(dú)立樣本來自的多個(gè)總體的中位數(shù)無顯著差異。

基本思想是:如果多個(gè)總體的中位數(shù)無顯著差異,或者說多個(gè)總體有共同的中位數(shù),那么這個(gè)共同的中位數(shù)應(yīng)在各樣本組中均處在中間位置上。于是,每組樣本中大于該中位數(shù)或小于該中位數(shù)的樣本數(shù)目應(yīng)大致相同。  

2、 Kruskal-Wallis檢驗(yàn)

Kruskal-Wallis檢驗(yàn)實(shí)質(zhì)是兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)在多個(gè)樣本下的推廣,也用于檢驗(yàn)多個(gè)總體的分布是否存在顯著差異。其原假設(shè)是:多個(gè)獨(dú)立樣本來自的多個(gè)總體的分布無顯著差異。

基本思想是:首先,將多組樣本數(shù)據(jù)混合并按升序排序,求出各變量值的秩;然后,考察各組秩的均值是否存在顯著差異。容易理解:如果各組秩的均值不存在顯著差異,則是多組數(shù)據(jù)充分混合,數(shù)值相差不大的結(jié)果,可以認(rèn)為多個(gè)總體的分布無顯著差異;反之,如果各組秩的均值存在顯著差異,則是多組數(shù)據(jù)無法混合,某些組的數(shù)值普遍偏大,另一些組的數(shù)值普遍偏小的結(jié)果,可以認(rèn)為多個(gè)總體的分布有顯著差異?! ?/p>

3、 Jonckheere-Terpstra檢驗(yàn)

Jonckheere-Terpstra檢驗(yàn)也是用于檢驗(yàn)多個(gè)獨(dú)立樣本來自的多個(gè)總體的分布是否存在顯著差異的非參數(shù)檢驗(yàn)方法,其原假設(shè)是:多個(gè)獨(dú)立樣本來自的多個(gè)總體的分布無顯著差異。

基本思想與兩獨(dú)立樣本的曼-惠特尼U檢驗(yàn)類似,也是計(jì)算一組樣本的觀察值小于其他組樣本的觀察值的個(gè)數(shù)?! ?/p>

四、兩配對(duì)樣本的非參數(shù)檢驗(yàn)

兩配對(duì)樣本的非參數(shù)檢驗(yàn)是對(duì)總體分布不甚了解的情況下,通過對(duì)兩組配對(duì)樣本的分析,推斷樣本來自的兩個(gè)總體的分布是否存在顯著差異的方法。

SPSS提供的兩配對(duì)樣本非參數(shù)檢驗(yàn)的方法主要包括McNemar檢驗(yàn)、符號(hào)檢驗(yàn)、Wilcoxon符號(hào)秩檢驗(yàn)等。

例:要檢驗(yàn)一種新的訓(xùn)練方法是否對(duì)提高跳遠(yuǎn)運(yùn)動(dòng)員的成績有顯著效果,可以收集一批跳遠(yuǎn)運(yùn)動(dòng)員在使用新訓(xùn)練方法前后的跳遠(yuǎn)最好成績,這樣的兩組樣本便是配對(duì)的。再例如,分析不同廣告形式是否對(duì)商品的銷售產(chǎn)生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數(shù)據(jù)(其他條件保持基本穩(wěn)定)。這里不同廣告形式下的若干組商品銷售額樣本便是配對(duì)樣本??梢?,配對(duì)樣本的樣本數(shù)是相同的,且各樣本值的先后次序是不能隨意更改的。  

1、 McNemar檢驗(yàn)

是一種變化顯著性檢驗(yàn),它將研究對(duì)象自身作為對(duì)照者檢驗(yàn)其“前后”的變化是否顯著。其原假設(shè)是:兩配對(duì)樣本來自的兩總體的分布無顯著差異。

分析學(xué)生在學(xué)習(xí)“統(tǒng)計(jì)學(xué)”課程前后對(duì)統(tǒng)計(jì)學(xué)重要性的認(rèn)知程度是否發(fā)生了顯著改變,可以隨機(jī)收集一批學(xué)生在學(xué)習(xí)“統(tǒng)計(jì)學(xué)”之前以及學(xué)完以后認(rèn)為統(tǒng)計(jì)學(xué)是否重要的樣本數(shù)據(jù)(0表示“不重要”,1表示“重要”)。

應(yīng)該看到:兩配對(duì)樣本的McNemar檢驗(yàn)分析的變量是二值變量。因此,在實(shí)際應(yīng)用中,如果變量不是二值變量,應(yīng)首先進(jìn)行數(shù)據(jù)轉(zhuǎn)換后方可采用該方法,因而它在應(yīng)用范圍方面有一定的局限性?! ?/p>

2、符號(hào)檢驗(yàn)

符號(hào)檢驗(yàn)也是用來檢驗(yàn)兩配對(duì)樣本所來自的總體的分布是否存在顯著差異的非參數(shù)方法。其原假設(shè)是:兩配對(duì)樣本來自的兩總體的分布無顯著差異。

首先,分別用第二組樣本的各個(gè)觀察值減去第一組對(duì)應(yīng)樣本的觀察值。差值為正則記為正號(hào),差值為負(fù)則記為負(fù)號(hào)。然后,將正號(hào)的個(gè)數(shù)與負(fù)號(hào)的個(gè)數(shù)進(jìn)行比較,容易理解:如果正號(hào)個(gè)數(shù)和負(fù)號(hào)個(gè)數(shù)大致相當(dāng),則可以認(rèn)為第二組樣本大于第一組樣本變量值的個(gè)數(shù),與第二組樣本小于第一組樣本的變量值個(gè)數(shù)是大致相當(dāng)?shù)?,從總體上講,這兩個(gè)組配對(duì)樣本的數(shù)據(jù)分布差距較??;相反,如果正號(hào)個(gè)數(shù)和負(fù)號(hào)個(gè)數(shù)相差較多,則可以認(rèn)為兩個(gè)配對(duì)樣本的數(shù)據(jù)分布差距較大。

應(yīng)該看到:配對(duì)樣本的符號(hào)檢驗(yàn)注重對(duì)變化方向的分析,只考慮數(shù)據(jù)變化的性質(zhì),即是變大了還是變小了,但沒有考慮變化幅度,即大了多少,小了多少,因而對(duì)數(shù)據(jù)利用是不充分的?! ?/p>

3、 Wilcoxon符號(hào)秩檢驗(yàn)

Wilcoxon符號(hào)秩檢驗(yàn)也是通過分析兩配對(duì)樣本,對(duì)樣本來自的兩總體的分布是否存在差異進(jìn)行判斷。其原假設(shè)是:兩配對(duì)樣本來自的兩總體的分布無顯著差異。

基本思想是:首先,按照符號(hào)檢驗(yàn)的方法,分布用第二組樣本的各個(gè)觀察值減去第一組對(duì)應(yīng)樣本的觀察值。差值為正則記為正號(hào),為負(fù)則記為負(fù)號(hào),并同時(shí)保存差值數(shù)據(jù);然后,將差值變量按升序排序,并求出差值變量的秩;最后,分布計(jì)算正號(hào)秩總和W+和負(fù)號(hào)秩和W-?! ?/p>

五、多配對(duì)樣本的非參數(shù)檢驗(yàn)

多配對(duì)樣本的非參數(shù)檢驗(yàn)是通過分析多組配對(duì)樣本數(shù)據(jù),推斷樣本來自的多個(gè)總體的中位數(shù)或分布是否存在顯著差異。

例如,收集乘客對(duì)多家航空公司是否滿意的數(shù)據(jù),分析航空公司的服務(wù)水平是否存在顯著差異;再例如,收集不同促銷形式下若干種商品的銷售額數(shù)據(jù),分析比較不同促銷形式的效果,再如,收集多名評(píng)委對(duì)同一批歌手比賽打分的數(shù)據(jù),分析評(píng)委的打分標(biāo)準(zhǔn)是否一致,等等。

這些問題都可以通過多配對(duì)樣本非參數(shù)檢驗(yàn)方法進(jìn)行分析。SPSS中的多配對(duì)樣本的非參數(shù)檢驗(yàn)方法主要包括Friedman檢驗(yàn)、Cochran Q檢驗(yàn)、Kendall協(xié)同系數(shù)檢驗(yàn)等?! ?/p>

1、 Friedman檢驗(yàn)

Friedman檢驗(yàn)是利用秩實(shí)現(xiàn)對(duì)多個(gè)總體分布是否存在顯著差異的非參數(shù)檢驗(yàn)方法,其原假設(shè)是:多個(gè)配對(duì)樣本來自的多個(gè)總體分布無顯著差異。

SPSS將自動(dòng)計(jì)算Friedman統(tǒng)計(jì)量和對(duì)應(yīng)的概率P值。如果概率P值小于給定的顯著性水平0.05,則拒絕原假設(shè),認(rèn)為各組樣本的秩存在顯著差異,多個(gè)配對(duì)樣本來自的多個(gè)總體的分布有顯著差異;反之,則不能拒絕原假設(shè),可以認(rèn)為各組樣本的秩不存在顯著性差異。

基于上述基本思路,多配對(duì)樣本的Friedman檢驗(yàn)時(shí),首先以行為單位將數(shù)據(jù)按升序排序,并求得各變量值在各自行中的秩;然后,分別計(jì)算各組樣本下的秩總和與平均秩。多配對(duì)樣本的Friedman檢驗(yàn)適于對(duì)定距型數(shù)據(jù)的分析?! ?/p>

2、 Cochran Q檢驗(yàn)

通過對(duì)多個(gè)配對(duì)樣本的分析,推斷樣本來自的多個(gè)總體的分布是否存在顯著差異。其原假設(shè)是:多個(gè)配對(duì)樣本來自的多個(gè)總體的分布無顯著差異。

Cochran Q檢驗(yàn)適合對(duì)二值品質(zhì)型數(shù)據(jù)的分析。如二分的評(píng)價(jià):1代表滿意,0代表不滿意?! ?/p>

3、Kendall協(xié)同系數(shù)檢驗(yàn)

它也是一種對(duì)多配對(duì)樣本進(jìn)行檢驗(yàn)的非參數(shù)檢驗(yàn)方法,與第一種檢驗(yàn)方法向結(jié)合,可方便地實(shí)現(xiàn)對(duì)評(píng)判者的評(píng)判標(biāo)準(zhǔn)是否一致的分析。其原假設(shè)是:評(píng)判者的評(píng)判標(biāo)準(zhǔn)不一致。

有6名歌手參加比賽,4名評(píng)委進(jìn)行評(píng)判打分,現(xiàn)在需要根據(jù)數(shù)據(jù)推斷這4個(gè)評(píng)委的評(píng)判標(biāo)準(zhǔn)是否一致。(見下頁具體分析)

如果將每個(gè)被評(píng)判者對(duì)象的分?jǐn)?shù)看做來自多個(gè)總體的配對(duì)樣本,那么該問題就能夠轉(zhuǎn)化為多配對(duì)樣本的非參數(shù)檢驗(yàn)問題,仍可采用Friedman檢驗(yàn),于是相應(yīng)的原假設(shè)便轉(zhuǎn)化為:多個(gè)配對(duì)樣本來自的多個(gè)總體的分布無顯著差異。但對(duì)該問題的分析是需要繼續(xù)延伸的,并非站在對(duì)6名歌手的演唱水平是否存在顯著差異的角度進(jìn)行分析,而是在認(rèn)定他們存在差異的前提下繼續(xù)判斷4個(gè)評(píng)委的打分標(biāo)準(zhǔn)是否一致。

如果利用Friedman檢驗(yàn)出各總體的分布不存在顯著差異,即各個(gè)歌手的秩不存在顯著差異,則意味著評(píng)委的打分存在隨意性,評(píng)分標(biāo)準(zhǔn)不一致。原因在于:如果各個(gè)評(píng)委的評(píng)判標(biāo)準(zhǔn)是一致的,那么對(duì)于某個(gè)歌手來說將獲得一致的分?jǐn)?shù),也就是說,評(píng)委給出的若干個(gè)評(píng)分的秩應(yīng)完全相同,這就必然會(huì)導(dǎo)致各歌手評(píng)分的秩有較大的差異

關(guān)于“非參數(shù)檢驗(yàn)”的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫(yī)學(xué)百科條目

個(gè)人工具
名字空間
動(dòng)作
導(dǎo)航
推薦工具
功能菜單
工具箱