หน้า 24 ของ วิโรจน์ อรุณมานะกุล
T-test เป็นสถิติพื้นฐานตัวหนึ่งที่ใช้กันแพร่หลาย
สามารถใช้เปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างกับค่าเฉลี่ยขงอประชากรเพื่อตัดสินว่า
กลุ่มตัวอย่างนี้มาจากประชากรนี้หรือไม่
หรือเปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างสองกลุ่มว่ามาจากประชากรเดียวกันหรือไม่
t-test เป็นที่นิยมใช้ในกรณีที่กลุ่มตัวอย่างมีจำนวนไม่มาก
เช่น น้อยกว่า 30 ทำให้การคำนวณโดยใช้ z-test ไม่สามารถใช้ได้
โปรแกรม R มีฟังก์ชันพื้นฐานสำหรับคำนวณสถิติ t.test
---
ทดสอบสมมติฐานค่าเฉลี่ยของหนึ่งประชากร
กำหนดให้ H0 มีค่ามิว=30 และ H1มีค่ามิวไม่เท่ากับ 30
One Sample t-test
ตามตัวอย่างของ ในเอกสารของ ผศ.วราฤทธิ์ พานิชกิจโกศลกุล
หน้า 24
x <- c(26,32,24,37,28,29,33,31,34,36)
t.test(x,mu = 30)
---
data: x
t = 0.7454, df = 9, p-value = 0.4751
alternative hypothesis: true mean is not equal to 30
95 percent confidence interval: 27.965 34.035
sample estimates: mean of x = 31
ซึ่ง p-value = 0.4751 > α = 0.05 จึงยอมรับ
---
> x <- c(26,32,24,37,28,29,33,31,34,26)
> t.test(x,mu = 30)
One Sample t-test
data: x
t = 0, df = 9, p-value = 1
alternative hypothesis: true mean is not equal to 30
95 percent confidence interval:
27.06016 32.93984
sample estimates: mean of x = 30
ซึ่ง p-value = 1 > α = 0.05 จึงยอมรับ
---
x <- c(20,21,22,25,23); t.test(x,mu = 30)
One Sample t-test
data: x
t = -9.0673, df = 4, p-value = 0.00082
alternative hypothesis: true mean is not equal to 30
95 percent confidence interval:
19.81161 24.58839
sample estimates: mean of x = 22.2
ซึ่ง p-value = 0.00082 < α = 0.05 จึงไม่ยอมรับ
-------------
ทดสอบค่าเฉลี่ยของสองประชากร หน้า 25
ที่เป็นอิสระต่อกัน
และทราบความแปรปรวนของทั้งสองกลุ่มไม่แตกต่างกัน
gardenA <- c(3,4,4,3,2,3,1,3,5,2)
gardenB <- c(5,5,6,7,4,4,3,5,6,5)
t.test(grardenA,gardenB)
Welch Two Sample t-test
d
t = -3.873, df = 18, p-value = 0.001115
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.0849115 -0.9150885
sample estimates:
mean of x mean of y
3 5
เพราะ p-test น้อยกว่า 0.00115 จึงปฏิเสธ H0
ดังนั้นปฏิเสธสมมติฐานหลัก
จึงสรุปว่าค่าเฉลี่ยของประชากรทั้งสองกลุ่มแตกต่างกัน
-------------
ทดสอบค่าเฉลี่ยของสองประชากร หน้า 26
ที่ไม่เป็นอิสระต่อกัน
และทราบความแปรปรวนของทั้งสองกลุ่มไม่แตกต่างกัน
down<-c(20,15,10,5,20,15,10,5,20,15,10,5,20,15,10,5)
up<-c(23,16,10,4,22,15,12,7,21,16,11,5,22,14,10,6)
t.test(down,up,paired = T)
Paired t-test
data: down and up
t = -3.0502, df = 15, p-value = 0.0081
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.4864388 -0.2635612
sample estimates:
mean of the differences
-0.875
เพราะ p-test น้อยกว่า 0.0081 จึงปฏิเสธ H0
ดังนั้นปฏิเสธสมมติฐานหลัก
จึงสรุปว่า ค่าเฉลี่ยของข้อมูลมีความแตกต่างกัน และมีช่วงความเชื่อมั่น 95% ของผลต่างระหว่างค่าเฉลี่ยของประชากรคือ (-1.4864, -0.2636)
---
ที่ไม่เป็นอิสระต่อกัน
และทราบความแปรปรวนของทั้งสองกลุ่มไม่แตกต่างกัน
ต.ย. การเปรียบเทียบค่าเฉลี่ยของประชากร 2 กลุ่มที่ไม่เป็นอิสระต่อกัน
เช่น การเปรียบเทียบค่าเฉลี่ยคะแนนความรู้ของผู้ป่วย x ที่อาศัยอยู่ใน
ชุมชน ก่อนและหลังดำเนินโครงการอบรม
before<-c(1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2)
after<-c(1,1,1,1,1,1,1,1,1,1,2,2,1,2,2,2)
t.test(before,after,paired = T)
เพราะ p-test มากกว่า 0.5805 จึงยอมรับ H0
ดังนั้นยอมรับสมมติฐานหลัก
จึงสรุปว่า ค่าเฉลี่ยของข้อมูลหรือความรู้ไม่แตกต่างกัน คือ ไม่ได้รู้มากขึ้นเลย รู้เท่า ๆ เดิม
และมีช่วงความเชื่อมั่น 95% ของผลต่างระหว่างค่าเฉลี่ยของประชากรคือ ( -0.2983079 0.1733079)