首頁 現代心理與教育統計學

三、概率分布類型

概率分布(probability distribution)是指對隨機變量取值的概率分布情況用數學方法(函數)進行描述。隻有了解隨機變量的概率分布,才能使統計分析與推論有可能,為統計分析提供依據,因此它在對數據進行統計處理時具有十分重要的意義。

概率分布有多種,除過去已知的一些概率分布外,一些新的概率分布還在繼續被發現。概率分布依不同的標準可以分為不同的類型。

(一)離散分布與連續分布

這是依隨機變量是否具有連續性來劃分的概率分布類型。當隨機變量隻取孤立的數值時,這種隨機變量稱作離散隨機變量,即第一章所講的計數數據。離散隨機變量的概率分布又稱作離散分布,可用分布函數加以數量化描述。在心理與教育統計中最常用的離散分布為二項分布,除此之外還有泊鬆分布(Poisson distribution)和超幾何分布(hypergeometric distribution)等。

連續分布是指連續隨機變量的概率分布,即測量數據的概率分布,它用連續隨機變量的分布函數描述它的分布規律。統計中最常用的連續隨機變量的分布為正態分布,其他連續分布如負指數分布、威布爾分布等。

(二)經驗分布與理論分布

這是依分布函數的來源而劃分的分布類型。所謂經驗性分布(empirical distribution)是指根據觀察或實驗所獲得的數據而編製的次數分布或相對頻率分布。經驗分布往往是總體的一個樣本,它可對所研究的對象給以初步描述,並作為推論總體的依據。理論性分布(theoretical distribution)有兩個含義,一是隨機變量概率分布的函數——數學模型,二是按某種數學模型計算出的總體的次數分布。

隨機變量概率分布的性質,由它的特征數來表達。這些特征數主要有期望值,即理論平均數,和方差,即理論的標準差的平方。因此,在統計推論部分通常隻用平均數和標準差,而不采用其他集中量數與差異量數。