t分布(t-distribution)是統計分析中應用較多的一種隨機變量函數的分布,是統計學者高賽特1908年在以筆名“Student”發表的一篇論文中推導的一種分布。因此,這種分布有時也叫學生氏分布(Student's distribution),這種分布是一種左右對稱、峰態比較高狹,分布形狀隨樣本容量n-1的變化而變化的一族分布。
t分布與σ無關而與n-1(自由度)有關,t分布的自由度用符號ν(小寫希臘字母,讀作nu)或df表示,一般為n-1,即樣本容量減1。自由度(degrees of freedom)是指任何變量中可以自由變化的數目,是t分布密度函數中的參數ν,它代表t分布中獨立隨機變量的數目,故曰自由度。
(一)t分布的特點
1.平均值為0。
2.以平均值0左右對稱的分布,左側t為負值,右側t為正值。
3.變量取值在-∞~+∞之間。
4.當樣本容量趨於∞時,t分布為正態分布,方差為1;當n-1>30以上時,t分布接近正態分布,方差大於1,隨n-1的增大而方差漸趨於1;當n-1<30時,t分布與正態分布相差較大,隨n-1減少,離散程度(方差)越大,分布圖的中間變低但尾部變高,如圖6-10:
圖6-10 t分布密度曲線圖
(二)t分布表的使用
圖6-11 df=20時t分布的雙側概率
t分布表不同於正態分布表。附表2是常用的t分布表。t分布表由三方麵的數值構成,即t值、自由度和顯著性水平。表的左列為自由度,表的最上一行是不同自由度下t分布兩尾端的概率,即p值。它是指某一t值時,t分布兩尾部概率之和,即雙側界限。表的最下一行是單側界限,即從t值以下t分布一側尾部的概率值。雙側概率通常寫作tα/2,單側概率寫作tα。表內的數值是與不同的p值和df值相對應的t值,是根據t分布函數計算得到的,它隨df及概率不同而變化。例如df=20,雙側概率為0.05時,t值為2.086,記為t0.05/2=2.086,意思是在t值小於-2.086以下的概率與t值大於2.086以上的概率之和為0.05,即兩尾端的麵積和與總麵積之比率為0.05,見圖6-11。上例的單側概率就記為t0.025=2.086。同樣的自由度若概率為0.01時,雙側概率為t0.01/2=2.845,單側概率就記為t0.01=2.528。若自由度為30時,t0.01/2=2.750,雖然與自由度為20時相差很小,但說明t值是隨自由度的變化而變化的。