Giá trị trung bình mẫu

Trong phần này, ta dùng phần mềm R [một ngôn ngữ lập trình trong thống kê] để mô phỏng phân phối mẫu của trung bình và phân phối mẫu của phương sai, phân phối mẫu cho tỷ lệ sẽ được trình bày bên dưới sau ví dụ mô phỏng cho phân phối mẫu của trung bình và phương sai.

Giả sử 

 là một mẫu ngẫu nhiên được lấy từ tổng thể có phân phối chuẩn với trung bình 
 và phương sai 
.Khi đó 
  và 

Ví dụ minh họa cho  

 bằng hình ảnh

Lưu ý 

 là biến ngẫu nhiên trung bình của mẫu
 và 
 là mẫu ngẫu nhiên bao gồm các giá trị trung bình kích thước n

Ý tưởng: Lấy mẫu kích thước 100 từ phân phối chuẩn N[8,4] và tính giá trị trung bình mẫu. Lặp lại quá trình trên 1000 lần để được mẫu 

. Khi đó nếu 
 thì đồ thị histogram của mẫu 
 sẽ có hình dáng giống với đồ thị của hàm mật độ phân phối chuẩn N[0,1]

Bước 1: Lấy mẫu kích thước 100 từ phân phối chuẩn với trung bình 8 và độ lệch chuẩn là 2 sau đó tính trung bình ta được giá trị của biến ngẫu nhiên 

> X=function[]{
+ mean[rnorm[100,8,2]]}
> X[]
[1] 8.127551

Bước 2: Lặp lại việc lấy mẫu như vậy 1000 lần ta được giá trị mẫu của 

> MauX=replicate[1000,X[]]

> MauX

[1] 8.177542 7.630873 7.779065 7.893846 7.882159 7.598194 7.872815 8.453036
[9] 7.792972 8.046070 8.030402 8.194805 7.939913 7.771466 8.127705 7.689597
[17] 7.802307 8.314282 7.947374 7.839685 7.924071 8.453053 8.206735 8.179007
[25] 7.668324 8.141854 8.010416 7.995762 8.135584 8.197215 8.144798 8.330804
[33] 8.004587 7.946060 8.052466 7.730231 8.220357 8.168854 7.816897 8.346156

...

[985] 7.988645 8.317452 8.319720 8.212151 7.522727 7.949834 7.378931 8.225489
[993] 8.396495 7.912937 7.727440 8.070288 7.930439 7.776631 8.079226 8.054889

Bước 3: Thành lập mẫu của ngẫu nhiên 

 

> Y=[MauX-8]/[2/sqrt[100]]
> Y

[1] 0.8877120446 -1.8456356074 -1.1046754953 -0.5307695036 -0.5892067736
[6] -2.0090287850 -0.6359257223 2.2651783493 -1.0351396302 0.2303494583
[11] 0.1520120493 0.9740270121 -0.3004349565 -1.1426707667 0.6385251941

...

[991] -3.1053435368 1.1274429115 1.9824741682 -0.4353136362 -1.3627991670
[996] 0.3514386149 -0.3478056503 -1.1168473937 0.3961305389 0.2744453988

Bước 4: Vẽ đồ thị histogram tần suất mẫu của mẫu trên với số khoảng chia là 40 và so sánh với phân phối chuẩn N[0,1]

> hist[Y,breaks=40,freq=FALSE]
> curve[dnorm[x],add=TRUE,col="BLUE"]

Ví dụ minh họa cho 

 bằng hình ảnh

Ý tưởng: Lấy mẫu kích thước 100 từ phân phối chuẩn N[8,4] và tính giá trị phương sai mẫu. Lặp lại quá trình trên 1000 lần để được mẫu 

. Khi đó nếu 
 thì đồ thị histogram của mẫu 
 sẽ có hình dáng giống với đồ thị của hàm mật độ phân phối Chi-bình phương với bậc tự do [100-1].

Bước 1: Lấy mẫu kích thước 100 từ phân phối chuẩn với trung bình 8 và độ lệch chuẩn là 2 sau đó tính phương sai ta được giá trị của biến ngẫu nhiên 

> X=function[]{
+ var[rnorm[100,8,2]]
+ }
> X[]
[1] 3.181167

Bước 2: Lặp lại quá trình trên 10000 lần để có mẫu 


> MauX=replicate[10000,X[]]
> MauX
[1] 3.083733 3.931638 4.354841 2.926393 3.688206 4.631140 2.730177 4.428081
[9] 3.583060 3.519667 5.556578 4.034123 4.194960 4.559011 3.734663 3.863493

...

[9985] 4.477767 4.093669 3.949555 3.213602 4.653847 4.197430 4.356281 4.178395
[9993] 3.762838 3.627636 4.140599 4.323487 3.218310 4.046636 3.567655 3.601010

Bước 3: Thành lập mẫu cho biến ngẫu nhiên 

> Y=[99*MauX]/4
> Y
[1] 76.32239 97.30804 107.78231 72.42822 91.28310 114.62071 67.57187
[8] 109.59501 88.68073 87.11177 137.52531 99.84454 103.82527 112.83551

...

[9990] 103.88639 107.81795 103.41528 93.13024 89.78399 102.47983 107.00629
[9997] 79.65318 100.15424 88.29947 89.12500

Bước 4: Vẽ đồ thị Histogram tần suất của mẫu trên với số khoảng 60 và so sánh với hàm mật độ của phân phối Chi-bình phương với 99 bậc tự do

> hist[Y,breaks=60,freq=FALSE]

> curve[dchisq[df=99,x],col="BLUE",add=TRUE]

Phân phối mẫu cho tỷ lệ

Giả sử ta cần khảo sát đặc trưng A của tổng thể, khảo sát trên n phần tử và đặt

ta thu được mẫu ngẫu nhiên 

 với 
, với p là tỉ lệ phần tử thỏa đặc trưng A.

Đặt 

  là số phần tử thỏa đặc trưng A trong mẫu khảo sát, thì 
. Tỉ lệ mẫu 
 được xác định bởi 
 và 
. Theo định lý giới hạn trung tâm ta có 
 sẽ hội tụ theo phân phối về phân phối chuẩn hóa 

Bước 1: Lấy n mẫu từ phân phối Bernoulli với xác suất là 0.3

> p=0.3

> X=function[n]rbinom[n,1,p]

Bước 2: Ứng với mễu trên, ta có 

 . Bây giờ ta tính 
 

> p_hat= function[n]{[mean[X[n]]-0.3]/sqrt[p[1-p]/n]}

Bây giờ ta tính thử 1 giá trị 

 khi ta lấy mẫu n=10000.

> p_hat[1000]

[1] -0.621059

Bước 3: Bây giờ ta tạo mẫu kích thước m cho 

> sample_p=function[m,n]replicate[m,p_hat[n]]

Bước 4: Bây giờ kiểm chứng  

 sẽ hội tụ theo phân phối về phân phối chuẩn hóa 

Cho n=1000, m=1000 :

> hist[sample_p[1000,1000],freq=FALSE,breaks=40]

> curve[dnorm[x],col="BLUE",add=TRUE]

Cho n=1000, m=10000:

> hist[sample_p[1000,10000],freq=FALSE,breaks=40]

> curve[dnorm[x],col="BLUE",add=TRUE]

Cho n=100000, m=100000:

> hist[sample_p[100000,100000],freq=FALSE,breaks=40]

> curve[dnorm[x],col="BLUE",add=TRUE]

Chủ Đề