多元分析
A+醫(yī)學(xué)百科 >> 多元分析 |
研究多個(gè)自變量與因變量相互關(guān)系的一組統(tǒng)計(jì)理論和方法。又稱多變量分析。多元分析是單變量統(tǒng)計(jì)方法的發(fā)展和推廣。人的心理和行為具有復(fù)雜的內(nèi)在結(jié)構(gòu),受到多種因素的制約。僅采用單變量分析難以揭示其內(nèi)在結(jié)構(gòu)以及各種影響因素的主次作用和交互影響。
首先涉足多元分析方法是F.高爾頓,他于1889年把雙變量的正態(tài)分布方法運(yùn)用于傳統(tǒng)的統(tǒng)計(jì)學(xué),創(chuàng)立了相關(guān)系數(shù)和線性回歸。其后的幾十年中,C.E.斯皮爾曼提出因素分析法(見因素分析),R.A.費(fèi)希爾提出方差分析和判別分析,S.S.威爾克斯發(fā)展了多元方差分析,H.霍特林確定了主成分分析和典型相關(guān)。到20世紀(jì)前半葉,多元分析理論大多已經(jīng)確立。60年代以后,隨著計(jì)算機(jī)科學(xué)的發(fā)展,多元分析方法在心理學(xué)以及其他許多學(xué)科的研究中得到了越來越廣泛的應(yīng)用。
常用的多元分析方法包括3類:①多元方差分析、多元回歸分析和協(xié)方差分析,稱為線性模型方法,用以研究確定的自變量與因變量之間的關(guān)系;②判別函數(shù)分析和聚類分析,用以研究對(duì)事物的分類;③主成分分析、典型相關(guān)和因素分析,研究如何用較少的綜合因素代替為數(shù)較多的原始變量。
多元方差分析 是把總變異按照其來源(或實(shí)驗(yàn)設(shè)計(jì))分為多個(gè)部分,從而檢驗(yàn)各個(gè)因素對(duì)因變量的影響以及各因素間交互作用的統(tǒng)計(jì)方法。例如,在分析2×2析因設(shè)計(jì)資料時(shí),總變異可分為分屬兩個(gè)因素的兩個(gè)組間變異、兩因素間的交互作用及誤差(即組內(nèi)變異)等四部分,然后對(duì)組間變異和交互作用的顯著性進(jìn)行F檢驗(yàn)。
多元方差分析的優(yōu)點(diǎn)是可以在一次研究中同時(shí)檢驗(yàn)具有多個(gè)水平的多個(gè)因素各自對(duì)因變量的影響以及各因素間的交互作用。其應(yīng)用的限制條件是,各個(gè)因素每一水平的樣本必須是獨(dú)立的隨機(jī)樣本,其重復(fù)觀測(cè)的數(shù)據(jù)服從正態(tài)分布,且各總體方差相等。
多元回歸分析 用以評(píng)估和分析一個(gè)因變量與多個(gè)自變量之間線性函數(shù)關(guān)系的統(tǒng)計(jì)方法。一個(gè)因變量y與自變量x1、x2、…xm有線性回歸關(guān)系是指:
其中α、β1…βm是待估參數(shù),ε是表示誤差的隨機(jī)變量。通過實(shí)驗(yàn)可獲得x1、x2…xm的若干組數(shù)據(jù)以及對(duì)應(yīng)的y值,利用這些數(shù)據(jù)和最小二乘法就能對(duì)方程中的參數(shù)作出估計(jì),記為╋、勮…叧,它們稱為偏回歸系數(shù)。
多元回歸分析的優(yōu)點(diǎn)是可以定量地描述某一現(xiàn)象和某些因素間的線性函數(shù)關(guān)系。將各變量的已知值代入回歸方程便可求得因變量的估計(jì)值(預(yù)測(cè)值),從而可以有效地預(yù)測(cè)某種現(xiàn)象的發(fā)生和發(fā)展。它既可以用于連續(xù)變量,也可用于二分變量(0,1回歸)。多元回歸的應(yīng)用有嚴(yán)格的限制。首先要用方差分析法檢驗(yàn)自變量y與m個(gè)自變量之間的線性回歸關(guān)系有無顯著性,其次,如果y與m個(gè)自變量總的來說有線性關(guān)系,也并不意味著所有自變量都與因變量有線性關(guān)系,還需對(duì)每個(gè)自變量的偏回歸系數(shù)進(jìn)行t檢驗(yàn),以剔除在方程中不起作用的自變量。也可以用逐步回歸的方法建立回歸方程,逐步選取自變量,從而保證引入方程的自變量都是重要的。
協(xié)方差分析 把線性回歸與方差分析結(jié)合起來檢驗(yàn)多個(gè)修正均數(shù)間有無差別的統(tǒng)計(jì)方法。例如,一個(gè)實(shí)驗(yàn)包含兩個(gè)多元自變量,一個(gè)是離散變量(具有多個(gè)水平),一個(gè)是連續(xù)變量,實(shí)驗(yàn)?zāi)康氖欠治鲭x散變量的各個(gè)水平的優(yōu)劣,此變量是方差變量;而連續(xù)變量是由于無法加以控制而進(jìn)入實(shí)驗(yàn)的,稱為協(xié)變量。在運(yùn)用協(xié)方差分析時(shí),可先求出該連續(xù)變量與因變量的線性回歸函數(shù),然后根據(jù)這個(gè)函數(shù)扣除該變量的影響,即求出該連續(xù)變量取等值情況時(shí)因變量的修正均數(shù),最后用方差分析檢驗(yàn)各修正均數(shù)間的差異顯著性,即檢驗(yàn)離散變量對(duì)因變量的影響。
協(xié)方差分析兼具方差分析和回歸分析的優(yōu)點(diǎn),可以在考慮連續(xù)變量影響的條件下檢驗(yàn)離散變量對(duì)因變量的影響,有助于排除非實(shí)驗(yàn)因素的干擾作用。其限制條件是,理論上要求各組資料(樣本)都來自方差相同的正態(tài)總體,各組的總體直線回歸系數(shù)相等且都不為0。因此應(yīng)用協(xié)方差分析前應(yīng)先進(jìn)行方差齊性檢驗(yàn)和回歸系數(shù)的假設(shè)檢驗(yàn),若符合或經(jīng)變換后符合上述條件,方可作協(xié)方差分析。
判別函數(shù)分析 判定個(gè)體所屬類別的統(tǒng)計(jì)方法。其基本原理是:根據(jù)兩個(gè)或多個(gè)已知類別的樣本觀測(cè)資料確定一個(gè)或幾個(gè)線性判別函數(shù)和判別指標(biāo),然后用該判別函數(shù)依據(jù)判別指標(biāo)來判定另一個(gè)個(gè)體屬于哪一類。
判別分析不僅用于連續(xù)變量,而且借助于數(shù)量化理論亦可用于定性資料。它有助于客觀地確定歸類標(biāo)準(zhǔn)。然而,判別分析僅可用于類別已確定的情況。當(dāng)類別本身未定時(shí),預(yù)用聚類分析先分出類別,然后再進(jìn)行判別分析。
聚類分析 解決分類問題的一種統(tǒng)計(jì)方法。若給定n個(gè)觀測(cè)對(duì)象,每個(gè)觀察對(duì)象有p個(gè)特征(變量),如何將它們聚成若干可定義的類?若對(duì)觀測(cè)對(duì)象進(jìn)行聚類,稱為Q型分析;若對(duì)變量進(jìn)行聚類,稱為R型分析。聚類的基本原則是,使同類的內(nèi)部差別較小,而類別間的差別較大。最常用的聚類方案有兩種。一種是系統(tǒng)聚類方法。例如,要將n個(gè)對(duì)象分為k類,先將n個(gè)對(duì)象各自分成一類,共n類。然后計(jì)算兩兩之間的某種“距離”,找出距離最近的兩個(gè)類、合并為一個(gè)類。然后逐步重復(fù)這一過程,直到并為k類為止。另一種為逐步聚類或稱動(dòng)態(tài)聚類方法。當(dāng)樣本數(shù)很大時(shí),先將n個(gè)樣本大致分為k類,然后按照某種最優(yōu)原則逐步修改,直到分類比較合理為止。
聚類分析是依據(jù)個(gè)體或變量的數(shù)量關(guān)系來分類,客觀性較強(qiáng),但各種聚類方法都只能在某種條件下達(dá)到局部最優(yōu),聚類的最終結(jié)果是否成立,尚需專家的鑒定。必要時(shí)可以比較幾種不同的方法,選擇一種比較符合專業(yè)要求的分類結(jié)果。
主成分分析 把原來多個(gè)指標(biāo)化為少數(shù)幾個(gè)互不相關(guān)的綜合指標(biāo)的一種統(tǒng)計(jì)方法。例如,用p個(gè)指標(biāo)觀測(cè)樣本,如何從這p個(gè)指標(biāo)的數(shù)據(jù)出發(fā)分析樣本或總體的主要性質(zhì)呢?如果p個(gè)指標(biāo)互不相關(guān),則可把問題化為p個(gè)單指標(biāo)來處理。但大多時(shí)候p個(gè)指標(biāo)之間存在著相關(guān)。此時(shí)可運(yùn)用主成分分析尋求這些指標(biāo)的互不相關(guān)的線性函數(shù),使原有的多個(gè)指標(biāo)的變化能由這些線性函數(shù)的變化來解釋。這些線性函數(shù)稱為原有指標(biāo)的主成分,或稱主分量。
主成分分析有助于分辨出影響因變量的主要因素,也可應(yīng)用于其他多元分析方法,例如在分辨出主成分之后再對(duì)這些主成分進(jìn)行回歸分析、判別分析和典型相關(guān)分析。主成分分析還可以作為因素分析的第一步,向前推進(jìn)就是因素分析。其缺點(diǎn)是只涉及一組變量之間的相互依賴關(guān)系,若要討論兩組變量之間的相互關(guān)系則須運(yùn)用典型相關(guān)。
典型相關(guān)分析 先將較多變量轉(zhuǎn)化為少數(shù)幾個(gè)典型變量,再通過其間的典型相關(guān)系數(shù)來綜合描述兩組多元隨機(jī)變量之間關(guān)系的統(tǒng)計(jì)方法。設(shè)x是p元隨機(jī)變量,y是q元隨機(jī)變量,如何描述它們之間的相關(guān)程度?當(dāng)然可逐一計(jì)算x的p個(gè)分量和y的q個(gè)分量之間的相關(guān)系數(shù)(p×q個(gè)), 但這樣既繁瑣又不能反映事物的本質(zhì)。如果運(yùn)用典型相關(guān)分析,其基本程序是,從兩組變量各自的線性函數(shù)中各抽取一個(gè)組成一對(duì),它們應(yīng)是相關(guān)系數(shù)達(dá)到最大值的一對(duì),稱為第1對(duì)典型變量,類似地還可以求出第2對(duì)、第3對(duì)、……,這些成對(duì)變量之間互不相關(guān),各對(duì)典型變量的相關(guān)系數(shù)稱為典型相關(guān)系數(shù)。所得到的典型相關(guān)系數(shù)的數(shù)目不超過原兩組變量中任何一組變量的數(shù)目。
典型相關(guān)分析有助于綜合地描述兩組變量之間的典型的相關(guān)關(guān)系。其條件是,兩組變量都是連續(xù)變量,其資料都必須服從多元正態(tài)分布。
以上幾種多元分析方法各有優(yōu)點(diǎn)和局限性。每一種方法都有它特定的假設(shè)、條件和數(shù)據(jù)要求,例如正態(tài)性、線性和同方差等。因此在應(yīng)用多元分析方法時(shí),應(yīng)在研究計(jì)劃階段確定理論框架,以決定收集何種數(shù)據(jù)、怎樣收集和如何分析數(shù)據(jù)資料。
參考書目
張堯庭、方開泰著:《多元統(tǒng)計(jì)分析引論》,科學(xué)出版社,北京,1982。
丁士晟編著:《多元分析方法及其應(yīng)用》,吉林人民出版社,長(zhǎng)春,1981。
關(guān)于“多元分析”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |