Trong thống kê, một ước lượng là một giá trị được tính toán từ một mẫu thử (échantillon) và người ta hy vọng đó là giá trị tiêu biểu cho giá trị cần xác định trong tổng thể (population). Người ta luôn tìm một ước lượng sao cho đó là ước lượng "không chệch" (unbiased), hội tụ (converge), hiệu quả (efficient) và vững (robust). Show
Ví dụ về ước lượng[sửa | sửa mã nguồn]Muốn xác định độ cao trung bình của trẻ ở độ tuổi 10, ta thực hiện một điều tra trên một mẫu được lấy trên tập thể các trẻ em ở độ tuổi 10 (ví dụ mẫu điều tra là các em học sinh được lấy ngẫu nhiên từ nhiều trường ở nhiều vùng khác nhau). Chiều cao trung bình tính được từ mẫu điều tra này, thường là trung bình tích lũy, sẽ là một ước lượng cho chiều cao trung bình của trẻ em ở độ tuổi 10. Nếu ta muốn xác định tỷ lệ bầu cử cho ứng cử viên A, ta có thể thực hiện một điều tra trên một mẫu dân số tiêu biểu. Tỷ lệ bầu cho A trong mẫu điều tra là một ước lượng của tỷ lệ bầu cho A của toàn thể dân số. Giả sử ta muốn xác định tổng số cá có trong hồ, ta bắt đầu bằng cách bắt lên n con cá (ví dụ n=50), đánh dấu chúng, sau đó lại thả xuống hồ cho chúng lẫn với những con khác. Sau đó lấy một mẫu cá bất kỳ trong hồ, tính tỷ lệ p cá bị đánh dấu trong mẫu đó (ví dụ mẫu có 20 con trong đó có hai con có dấu, p=1/10). Khi đó giá trị n/p (=500) là một ước lượng cho tổng số cá có trong hồ. Nếu trong mẫu không có con cá nào bị đánh dấu, ta thực hiện lại trên một mẫu khác. Thông thường ta tìm ước lượng cho một trung bình, cho tổng dân số, cho một tỷ lệ hoặc cho một phương sai. Đánh giá ước lượng[sửa | sửa mã nguồn]Một ước lượng là một giá trị x (x nhỏ) được tính toán trên một mẫu được lấy một cách ngẫu nhiên, do đó giá trị của x là một biến ngẫu nhiên với kì vọng E(x) và phương sai V(x). Nghĩa là giá trị x có thể dao động tùy theo mẫu thử, nó có ít cơ hội để có thể bằng đúng chính xác giá trị X (X lớn) mà nó đang ước lượng. Mục đích ở đây là ta muốn có thể kiểm soát sự sai lệch giá trị x và giá trị X.
(xác suất để sai lệch với giá trị thực cần ước lượng lớn hơn tiến về 0 khi kích cỡ của mẫu thử càng lớn)
Ước lượng của trung bình và phương sai[sửa | sửa mã nguồn]Ta chọn ngẫu nhiên n cá thể trong một dân số gồm N cá thể. Ta quan tâm đến đặc trưng định lượng Y của dân số với trung bình và phương sai V(Y). Trong mẫu đó, đặc trưng Y có trung bình và phương sai đo được lần lượt là và . Lưu ý là các giá trị và thay đổi tùy theo mẫu thử, do đó chúng là các biến ngẫu nhiên với trung bình và phương sai riêng khác nhau. Ước lượng trung bình của Y[sửa | sửa mã nguồn]Thông thường trung bình của Y, tức là được ước lượng bởi: . còn được gọi là trung bình tích lũy (hay trung bình cộng). Ta chứng minh được đây là ước lượng đúng(unbiased), nghĩa là Ước lượng phương sai của Y[sửa | sửa mã nguồn]là một ước lượng của V(Y), nhưng là ước lượng không đúng, ta chứng minh được kì vọng của luôn nhỏ hơn V(Y), tức ước lượng là thiếu. Các ước lượng đúng của V(Y) là:
Trong trường hợp mẫu lớn, phép tính có hoàn lại và phép tính không hoàn lại là như nhau, vì xấp xỉ bằng 1. Vì vậy trong trường hợp tổng quát ước lượng đúng của V(Y) là: được gọi là phương sai tích lũy của Y. Xem thêm chứng minh trong bài Phương sai Tính hiệu quả và tính hội tụ[sửa | sửa mã nguồn]Mức độ dao động của quanh kì vọng của nó phụ thuộc vào phương sai của nó, ký hiệu bởi . Phương sai này được tính theo V(Y).
Ta nhận thấy với N rất lớn hai giá trị trên gần như bằng nhau. Phần sau đây ta chỉ xét trường hợp lấy mẫu có hoàn lại, với giả thuyết N là rất lớn. Rõ ràng n càng lớn, càng nhỏ. Do đó, mẫu càng lớn, ước lượng càng hiệu quả. Bất đẳng thức Bienaymé-Tchebychev chỉ ra rằng, với mọi số thực dương ,
nên
Vì hội tụ về 0 khi n tiến về vô cực, nên ta cũng có điều tương tự với . Ước lượng là hội tụ. Các ảnh hưởng của điều tra đến ước lượng[sửa | sửa mã nguồn]Phân chia dân số thành các lớp đồng nhất để làm mẫu điều tra có thể làm giảm đáng kể giá trị phương sai của ước lượng, do đó ước lượng sẽ càng hiệu quả. Lấy mẫu một cách ngẫu nhiên với xác suất không đồng đều, dẫn đến điều tra nhiều lần hoặc co cụm, sẽ làm thay đổi các công thức được tính trên. Cuối cùng, việc dùng thêm các thông tin phụ hợp lý cho phép chỉnh sửa các ước lượng để có được các kết quả gần với giá trị thật cần ước lượng hơn. Ước lượng phân phối xác suất[sửa | sửa mã nguồn]Khả năng ước lượng kì vọng và phương sai cho phép ước lượng các tham số của một phân phối xác suất (phân phối bình thường, phân phối Poisson vv...). |