Một mẫu thử nghiệm t Python

Tôi có bằng Thạc sĩ Thống kê và một năm trước, tôi đã bước chân vào lĩnh vực khoa học dữ liệu. Viết blog đã nằm trong danh sách việc cần làm của tôi trong nhiều ngày và ở đây tôi đang cố gắng chia sẻ kiến ​​thức của mình

Trọng tâm chính của bài viết này là giới thiệu kiểm tra giả thuyết và minh họa bằng một vài ví dụ trong Python. Dù là khái niệm nào, việc thực thi nó có thể được thực hiện dễ dàng với các ngôn ngữ lập trình như Python. Tuy nhiên, phần quan trọng nhất là rút ra suy luận từ đầu ra và bạn nên biết toán học đằng sau mã được thực thi

Kiểm tra giả thuyết rất quan trọng trong thống kê vì nó đưa ra bằng chứng thống kê để cho thấy tính hợp lệ của nghiên cứu. Giả thuyết khống nói rằng không có ý nghĩa thống kê nào tồn tại giữa các bộ dữ liệu ngụ ý rằng tham số tổng thể sẽ bằng một giá trị giả định. Thông thường, chúng tôi nêu giả thuyết thay thế mà chúng tôi muốn chứng minh. Đối với giả thuyết không H0 và giả thuyết thay thế bổ sung của nó H1, có 3 trường hợp khi giá trị tham số dưới H0 ≠ H1 hoặc H0 < H1 hoặc H0 > H1

Hãy xem xét một tình huống mà tôi đã nêu giả thuyết, thống kê kiểm tra có liên quan và mã Python để bạn hiểu. Tôi cũng đã mã hóa phần kết luận. Ở đây, tôi đã chia sẻ với bạn một vài trường hợp thay vì bao gồm tất cả. Trong blog này, tôi muốn đưa ra các ví dụ về kiểm tra t một mẫu, kiểm tra t hai mẫu và kiểm tra t ghép cặp bằng Python

Một mẫu t-test

Dữ liệu

Huyết áp tâm thu của 14 bệnh nhân được đưa ra dưới đây

183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158, 172, 138

Kiểm tra xem trung bình tổng thể có nhỏ hơn 165 không

H0. Không có sự khác biệt đáng kể về huyết áp tâm thu. tôi. e. , μ = 165

H1. Trung bình dân số nhỏ hơn 165. tôi. e. , m < 165

Thử nghiệm thống kê

 

Một mẫu thử nghiệm t Python

Ở đâu,

x̄ là trung bình mẫu

μ là trung bình dân số

s là độ lệch chuẩn mẫu

n là số quan sát;

Mã số

Mã Python

Vì vậy, chúng tôi kết luận rằng có một sự khác biệt đáng kể về huyết áp tâm thu

i. e. , μ < 165 tại %. Mức ý nghĩa 2f”'%alpha)

Một mẫu thử nghiệm t Python

Hai mẫu t-test

Dữ liệu

So sánh hiệu quả của amoni clorua và urê, trên năng suất hạt lúa, một thí nghiệm đã được tiến hành. Các kết quả được đưa ra dưới đây

amoni

clorua (X1)

13. 410. 911. 211. 81415. 314. 212. 61716. 216. 515. 7Urê (X2)1211. 710. 711. 214. 814. 413. 913. 716. 91615. 616

H0. Ảnh hưởng của amoni clorua và urê đến năng suất hạt của lúa là như nhau. e. , μ1 = μ2

H1. Ảnh hưởng của amoni clorua và urê đến năng suất hạt lúa không đồng đều. e. , μ1 ≠ μ2

Thử nghiệm thống kê

Một mẫu thử nghiệm t Python

Ở đâu,

x̄1 và x̄2 lần lượt là phương tiện mẫu cho x1 và x2

n1 và n2 lần lượt là số quan sát trong x1 và x2

s1 và s2 lần lượt là độ lệch chuẩn mẫu cho x1 và x2

Mã số

Ammonium_chloride=[13.4,10.9,11.2,11.8,14,15.3,14.2,12.6,17,16.2,16.5,15.7]
Urea=[12,11.7,10.7,11.2,14.8,14.4,13.9,13.7,16.9,16,15.6,16]
from scipy import stats

t_value,p_value=stats.ttest_ind(Ammonium_chloride,Urea)

print('Test statistic is %f'%float("{:.6f}".format(t_value)))

print('p-value for two tailed test is %f'%p_value)

alpha = 0.05

if p_value<=alpha:

    print('Conclusion','n','Since p-value(=%f)'%p_value,'<','alpha(=%.2f)'%alpha,'''We reject the null hypothesis H0. So we conclude that the 

effect of ammonium chloride and urea on grain yield of paddy are not equal i.e., μ1 = μ2 at %.2f level of significance.'''%alpha)

else:

    print('Conclusion','n','Since p-value(=%f)'%p_value,'>','alpha(=%.2f)'%alpha,'''We do not reject the null hypothesis H0.

Vì vậy, chúng tôi kết luận rằng ảnh hưởng của amoni clorua và urê đến năng suất hạt của lúa là như nhau

i. e. , μ1 ≠ μ2 tại %. mức ý nghĩa 2f. ”’%alpha)

Một mẫu thử nghiệm t Python

Kiểm tra

Dữ liệu

Mười một nam sinh được thi môn Thống kê. Họ được cấp một tháng học phí và một bài kiểm tra thứ hai được tổ chức vào cuối tháng. Điểm có đưa ra bằng chứng rằng học sinh đã được hưởng lợi từ việc luyện thi không?

Điểm trong bài kiểm tra 1. 23 20 19 21 18 20 18 17 23 16 19

Điểm trong bài kiểm tra thứ 2. 24 19 22 18 20 22 20 20 23 20 18

H0. Các sinh viên đã không được hưởng lợi từ các lớp học phí. tôi. e. , d = 0

H1. Các học viên được hưởng lợi từ lớp học. tôi. e. , d < 0

Trong đó, d = x-y;

một ví dụ về một là gì

Thử nghiệm giá trị trung bình một mẫu so sánh giá trị trung bình của một mẫu với giá trị được chỉ định trước và kiểm tra độ lệch so với giá trị đó. Ví dụ: chúng tôi có thể biết rằng cân nặng khi sinh trung bình của trẻ sơ sinh da trắng ở Hoa Kỳ là 3.410 gram và muốn so sánh cân nặng khi sinh trung bình của mẫu trẻ sơ sinh da đen với giá trị này.

Chức năng nào được sử dụng cho t

Chúng tôi có thể tính t-test trên các mẫu này bằng hàm SciPy tích hợp sẵn ttest_ind() . Điều này sẽ cung cấp cho chúng tôi giá trị thống kê t và giá trị p để so sánh nhằm đảm bảo rằng chúng tôi đã triển khai thử nghiệm chính xác.

p là gì

Giá trị T và giá trị P . Giá trị p là từ 0% đến 100% và thường được viết dưới dạng số thập phân (ví dụ: giá trị p là 5% là 0. 05). the probability that the results from your sample data occurred by chance. P-values are from 0% to 100% and are usually written as a decimal (for example, a p value of 5% is 0.05).

3 loại bài kiểm tra t là gì?

Có ba bài kiểm tra t để so sánh các phương tiện. kiểm tra t một mẫu, kiểm tra t hai mẫu và kiểm tra t cặp đôi .