Số liệu thống kê mẫu cho bootstrapping là gì?

Trước đây chúng ta đã thảo luận về tầm quan trọng của việc ước tính độ không đảm bảo trong các phép đo của mình và kết hợp nó vào phân tích dữ liệu. Để biết mức độ mà chúng ta có thể khái quát hóa các quan sát của mình, chúng ta cần biết ước tính của chúng ta thay đổi như thế nào giữa các mẫu và liệu nó có bị sai lệch hay không (đánh giá quá cao hoặc đánh giá thấp giá trị thực một cách có hệ thống). Thật không may, có thể khó đánh giá độ chính xác và độ chính xác của các ước tính vì dữ liệu thực nghiệm hầu như luôn bị ảnh hưởng bởi nhiễu và lỗi lấy mẫu, đồng thời các phương pháp phân tích dữ liệu có thể phức tạp. Chúng tôi có thể giải quyết những câu hỏi này bằng cách thu thập thêm mẫu, nhưng điều này không phải lúc nào cũng thực tế. Thay vào đó, chúng ta có thể sử dụng bootstrap, một phương pháp tính toán mô phỏng các mẫu mới, để giúp xác định cách phân bổ các ước tính từ các thử nghiệm lặp lại và trả lời các câu hỏi về độ chính xác và sai lệch.

Nội dung chính Show

Người giới thiệu
thông tin tác giả
Tác giả và Chi nhánh
tuyên bố đạo đức
Lợi ích cạnh tranh
Quyền và quyền
Về bài viết này
Trích dẫn bài viết này
Số liệu thống kê mẫu nào có thể được khởi động?
Thống kê bootstrap là gì?
Bạn sẽ sử dụng cỡ mẫu nào cho mỗi mẫu bootstrap?
Số liệu thống kê bootstrap được tính như thế nào?

Số lượng quan tâm có thể được ước tính theo nhiều cách từ một mẫu—các hàm hoặc thuật toán thực hiện điều này được gọi là công cụ ước tính (). Trong một số trường hợp, chúng ta có thể tính toán một cách phân tích phân phối lấy mẫu cho một công cụ ước tính. Ví dụ: giá trị trung bình của phân phối chuẩn, μ, có thể được ước tính bằng cách sử dụng giá trị trung bình mẫu. Nếu chúng ta thu thập nhiều mẫu, mỗi mẫu có kích thước n, thì theo lý thuyết, chúng ta biết rằng giá trị trung bình của chúng sẽ tạo thành một phân phối lấy mẫu cũng chuẩn với giá trị trung bình μ và s. d. σ/√n (s là dân số s. d. ). các s. d. của phân phối lấy mẫu của một thống kê được gọi là sai số chuẩn (s. e. ) và có thể được sử dụng để định lượng độ biến thiên của công cụ ước tính ()

Hình 1. Phân phối lấy mẫu của các công cụ ước tính có thể được sử dụng để dự đoán độ chính xác và độ chính xác của các ước tính về đặc điểm dân số

(a) Hình dạng của phân phối ước tính có thể được sử dụng để đánh giá hiệu suất của công cụ ước tính. Phân bố dân số được hiển thị là chuẩn (μ = 0, σ = 1). Phân phối lấy mẫu của công cụ ước tính trung bình mẫu được hiển thị bằng màu đỏ (công cụ ước tính cụ thể này được biết là chuẩn với σ = 1/√n đối với cỡ mẫu n). (b) Độ chính xác có thể được đo bằng s. d. của phân bố lấy mẫu (được định nghĩa là sai số chuẩn, s. e. ). Các công cụ ước tính có phân phối không tập trung vào giá trị thực bị sai lệch. Độ lệch có thể được đánh giá nếu có giá trị thực (điểm đỏ). Thanh lỗi hiển thị s. d

Hình ảnh kích thước đầy đủ

Phân phối lấy mẫu cho chúng ta biết về độ lặp lại và độ chính xác của công cụ ước tính (). các s. e. của một công cụ ước tính là thước đo độ chính xác. nó cho chúng tôi biết chúng tôi có thể mong đợi các ước tính khác nhau bao nhiêu giữa các thử nghiệm. Tuy nhiên, s. e. không phải là khoảng tin cậy. Nó không cho chúng tôi biết ước tính của chúng tôi gần với giá trị thực như thế nào hoặc liệu công cụ ước tính có bị sai lệch hay không. Để đánh giá độ chính xác, chúng ta cần đo lường độ chệch—chênh lệch dự kiến giữa giá trị ước tính và giá trị thực

Nếu chúng ta quan tâm đến việc ước tính một đại lượng là một chức năng phức tạp của dữ liệu được quan sát (ví dụ: số lượng protein được chuẩn hóa hoặc đầu ra của thuật toán học máy), thì một khung lý thuyết để dự đoán phân phối lấy mẫu có thể khó phát triển. Hơn nữa, chúng ta có thể thiếu kinh nghiệm hoặc kiến thức về hệ thống để biện minh cho bất kỳ giả định nào giúp đơn giản hóa các phép tính. Trong những trường hợp như vậy, chúng ta có thể áp dụng bootstrap thay vì thu thập một khối lượng lớn dữ liệu để xây dựng phân phối lấy mẫu theo kinh nghiệm

Bootstrap xấp xỉ hình dạng của phân phối lấy mẫu bằng cách mô phỏng các thử nghiệm lặp lại trên cơ sở dữ liệu chúng tôi đã quan sát được. Thông qua mô phỏng, chúng ta có thể thu được s. e. các giá trị, dự đoán độ lệch và thậm chí so sánh nhiều cách ước tính cùng một số lượng. Yêu cầu duy nhất là dữ liệu được lấy mẫu độc lập từ một nguồn phân phối duy nhất

Chúng tôi sẽ minh họa quá trình khởi động bằng thí nghiệm Luria-Delbrück năm 1943, khám phá cơ chế đằng sau các đột biến tạo ra tính kháng virus ở vi khuẩn. Trong thí nghiệm này, các nhà nghiên cứu đã đặt câu hỏi liệu những đột biến này được tạo ra do tiếp xúc với vi-rút hay do tự phát (xảy ra ngẫu nhiên bất cứ lúc nào) (). Các tác giả lập luận rằng những giả thuyết này có thể được phân biệt bằng cách nuôi cấy vi khuẩn, cấy nó vào môi trường có chứa vi-rút và sau đó xác định sự thay đổi về số lượng vi khuẩn (đột biến) sống sót (). Nếu các đột biến được gây ra bởi virus sau khi mạ, số lượng vi khuẩn sẽ được phân phối Poisson. Ngoài ra, nếu các đột biến xảy ra một cách tự phát trong quá trình nuôi cấy, thì phương sai sẽ cao hơn giá trị trung bình và mô hình Poisson—có giá trị trung bình và phương sai bằng nhau—sẽ không phù hợp. Sự gia tăng phương sai này là do các đột biến tự phát lan truyền qua các thế hệ khi các tế bào nhân lên. Chúng tôi đã mô phỏng 10.000 nền văn hóa để chứng minh sự phân bố này;

Hình 2. Thí nghiệm Luria-Delbrück đã nghiên cứu cơ chế mà vi khuẩn thu được các đột biến tạo ra khả năng kháng vi-rút

(a) Vi khuẩn được nuôi cấy qua t thế hệ mà không có virut, và các tế bào N được cấy vào môi trường chứa virut. Những người có đột biến kháng thuốc tồn tại. (b) Mối quan hệ giữa giá trị trung bình và sự thay đổi số lượng tế bào trong mỗi môi trường nuôi cấy phụ thuộc vào cơ chế đột biến. ( c ) Phân phối mô phỏng số lượng tế bào cho cả hai quy trình được hiển thị trong 10.000 nền văn hóa sử dụng và tỷ lệ đột biến (0. 49 cảm ứng, 0. 20 tự phát) mang lại số lượng bằng nhau có nghĩa là. Đột biến cảm ứng xảy ra trong môi trường (tại t = 4). Đột biến tự phát có thể xảy ra ở mỗi thế hệ t = 4. Điểm và thanh lỗi là trung bình và s. d. của các bản phân phối mô phỏng (3. 92 ± 2. 07 tự phát, 3. 92 ± 1. 42 cảm ứng). Đối với một số lượng nhỏ các thế hệ, phân phối mô hình cảm ứng là nhị thức và tiếp cận Poisson khi t lớn và tốc độ nhỏ

Hình ảnh kích thước đầy đủ

Để định lượng sự khác biệt giữa các phân phối theo hai cơ chế đột biến, Luria và Delbrück đã sử dụng tỷ lệ phương sai trên trung bình (VMR), tỷ lệ này ổn định hợp lý giữa các mẫu và không có sai lệch. Từ lý do trên, nếu các đột biến được tạo ra, số lượng được phân phối dưới dạng Poisson và chúng tôi mong đợi VMR = 1;

Thật không may, việc đo lường độ không đảm bảo trong VMR rất khó vì khó có thể xác định được phân bố lấy mẫu của nó đối với các cỡ mẫu nhỏ. Luria và Delbrück cấy 5–100 mẫu cấy cho mỗi thí nghiệm để đo lường sự thay đổi này trước khi có thể loại trừ cơ chế cảm ứng. Hãy xem cách bootstrap có thể được sử dụng để ước tính độ không đảm bảo và độ lệch của VMR bằng cách sử dụng các cỡ mẫu khiêm tốn;

Giả sử rằng chúng tôi thực hiện một thí nghiệm tương tự với 25 nền văn hóa và sử dụng số lượng tế bào trong mỗi nền văn hóa làm mẫu của chúng tôi (). Chúng ta có thể sử dụng giá trị trung bình của mẫu (5. 48) và phương sai (55. 3) để tính VMR = 10. 1, nhưng vì chúng tôi không có quyền truy cập vào phân phối lấy mẫu nên chúng tôi không biết độ không đảm bảo. Thay vì mạ nhiều nền văn hóa hơn, hãy mô phỏng nhiều mẫu hơn bằng bootstrap. Để chứng minh sự khác biệt trong bootstrap, chúng tôi sẽ xem xét hai mẫu nguồn, một mẫu được lấy từ nhị thức âm và một từ phân phối số lượng tế bào theo hai phương thức (). Mỗi phân phối được tham số hóa để có cùng VMR = 10 (μ = 5, σ2 = 50). Phân phối nhị thức âm là một dạng tổng quát của phân phối Poisson và mô hình dữ liệu rời rạc với giá trị trung bình và phương sai được chỉ định độc lập, được yêu cầu để cho phép các giá trị khác nhau của VMR. Đối với phân phối lưỡng kim, chúng tôi sử dụng kết hợp hai phân phối Poisson. Các mẫu nguồn được tạo ra từ các bản phân phối này đã được chọn để có cùng VMR = 10. 1, rất gần với VMR của quần thể chúng = 10

Hình 3. Phân phối lấy mẫu của các đại lượng phức tạp như tỷ lệ phương sai trên trung bình (VMR) có thể được tạo từ dữ liệu được quan sát bằng cách sử dụng bootstrap

(a) Một mẫu nguồn (n = 25, nghĩa là = 5. 48, phương sai = 55. 3, VMR = 10. 1), được tạo từ phân phối nhị thức âm (μ = 5, σ2 = 50, VMR = 10), được sử dụng để mô phỏng bốn mẫu (vòng tròn rỗng) với bootstrap tham số (màu xanh) và không tham số (màu đỏ). ( b ) Các phân phối lấy mẫu VMR được tạo từ bootstrap tham số (màu xanh) và không tham số (màu đỏ) của 10.000 mẫu (n = 25) được mô phỏng từ các mẫu nguồn được lấy từ hai bản phân phối khác nhau. nhị thức âm và lưỡng cực, cả với μ = 5 và σ2 = 50, được hiển thị dưới dạng biểu đồ màu đen với các mẫu nguồn được hiển thị bên dưới. Điểm và thanh lỗi hiển thị giá trị trung bình và s. d. của các phân phối lấy mẫu tương ứng của VMR. Các giá trị bên cạnh các thanh lỗi hiển thị s. d

Hình ảnh kích thước đầy đủ

Chúng ta sẽ thảo luận về hai loại bootstrap. tham số và phi tham số. Trong bootstrap tham số, chúng tôi sử dụng mẫu của mình để ước tính các tham số của mô hình mà từ đó các mẫu tiếp theo được mô phỏng. hiển thị một mẫu nguồn được rút ra từ phân phối nhị thức âm cùng với bốn mẫu được mô phỏng bằng cách sử dụng bootstrap tham số giả định mô hình nhị thức âm. Bởi vì bootstrap tham số tạo ra các mẫu từ một mô hình, nên nó có thể tạo ra các giá trị không có trong mẫu của chúng tôi, bao gồm các giá trị nằm ngoài phạm vi dữ liệu được quan sát, để tạo ra sự phân phối mượt mà hơn. Ví dụ: giá trị tối đa trong mẫu nguồn của chúng tôi là 29, trong khi một trong các mẫu mô phỏng bao gồm 30. Việc lựa chọn mô hình phải dựa trên kiến thức của chúng tôi về hệ thống thử nghiệm đã tạo ra mẫu ban đầu

Phân phối lấy mẫu bootstrap VMR tham số của 10.000 mẫu mô phỏng được hiển thị trong. các s. d. của các bản phân phối này là thước đo độ chính xác của VMR. Khi mô hình giả định của chúng tôi khớp với nguồn dữ liệu (nhị thức âm), phân phối VMR được mô phỏng bởi bootstrap tham số rất gần với phân phối VMR mà người ta sẽ có được nếu chúng tôi lấy tất cả các mẫu từ phân phối nguồn (). Phân phối lấy mẫu bootstrap s. d. phù hợp với phân phối lấy mẫu thực (4. 58)

Trong thực tế, chúng tôi không thể chắc chắn rằng mô hình bootstrap tham số của chúng tôi đại diện cho phân phối của mẫu nguồn. Ví dụ: nếu mẫu nguồn của chúng tôi được rút ra từ phân phối lưỡng thức thay vì nhị thức âm, thì bootstrap tham số tạo ra phân phối lấy mẫu không chính xác vì nó bị giới hạn bởi giả định sai lầm của chúng tôi (). Vì các mẫu nguồn có giá trị trung bình và phương sai tương tự nhau nên đầu ra của bootstrap tham số về cơ bản giống như trước đây. Bootstrap tham số không chỉ tạo ra hình dạng sai mà còn tạo ra độ không đảm bảo không chính xác trong VMR. Trong khi phân phối lấy mẫu thực từ phân phối hai chế độ có s. d. = 1. 59, bootstrap (sử dụng mô hình nhị thức âm) đánh giá quá cao nó là 4. 35

Trong bootstrap không đối xứng, chúng tôi bỏ qua mô hình và ước tính dân số bằng cách lấy mẫu ngẫu nhiên (có thay thế) từ dữ liệu được quan sát để thu được các mẫu mới có cùng kích thước. Như trước đây, chúng tôi tính toán VMR cho từng mẫu bootstrap để tạo các bản phân phối lấy mẫu bootstrap. Do bootstrap không tham số không bị giới hạn bởi giả định mô hình, nên nó tái cấu trúc hợp lý các phân phối lấy mẫu VMR cho cả hai phân phối nguồn. Nói chung sẽ an toàn hơn khi sử dụng bootstrap không tham số khi chúng tôi không chắc chắn về phân phối nguồn. Tuy nhiên, do bootstrap không tham số chỉ tính đến dữ liệu được quan sát và do đó không thể tạo ra các mẫu cực đoan, nên nó có thể đánh giá thấp phân phối lấy mẫu s. d. , đặc biệt khi cỡ mẫu nhỏ. Chúng tôi thấy một số bằng chứng về điều này trong mô phỏng của chúng tôi. Trong khi các phân phối lấy mẫu thực sự có s. d. giá trị của 4. 58 và 1. 59 đối với nhị thức âm và nhị thức tương ứng, bootstrap mang lại 2. 61 và 1. 33 (thấp hơn 43% và 16%) ()

Phân phối lấy mẫu bootstrap cũng có thể cung cấp ước tính sai lệch, sự khác biệt có hệ thống giữa ước tính của chúng tôi về VMR và giá trị thực. Nhớ lại rằng bootstrap xấp xỉ toàn bộ dân số bằng dữ liệu chúng tôi đã quan sát được trong mẫu ban đầu của mình. Do đó, nếu chúng tôi coi VMR thu được từ mẫu được sử dụng để khởi động là giá trị thực và thấy rằng ước tính bootstrap của chúng tôi nhỏ hơn hoặc lớn hơn một cách có hệ thống so với giá trị này, thì chúng tôi có thể dự đoán rằng ước tính ban đầu của chúng tôi cũng bị sai lệch. Trong các mô phỏng của chúng tôi, chúng tôi không thấy bất kỳ dấu hiệu sai lệch đáng kể nào—phương tiện phân phối bootstrap gần với VMR mẫu

Tính đơn giản và tổng quát của bootstrapping cho phép phân tích tính ổn định của hầu hết mọi quy trình ước tính, chẳng hạn như tạo cây phát sinh gen hoặc thuật toán học máy

Người giới thiệu

Krzywinski, M. & Altman, N. tự nhiên. Phương thức 10, 809–810 (2013)
Bài báo CAS PubMed Google Scholar
Luria, S. E. & Delbrück, M. Di truyền học 28, 491–511 (1943)
CAS PubMed PubMed Central Google Scholar

Tải tài liệu tham khảo

thông tin tác giả

Tác giả và Chi nhánh

Anthony Kulesa là sinh viên tốt nghiệp Khoa Kỹ thuật Sinh học tại MIT. ,
Anthony Kulesa
Martin Krzywinski là một nhà khoa học nhân viên tại Trung tâm Khoa học Bộ gen Michael Smith của Canada. ,
Martin Krzywinski
Paul Blainey là Trợ lý Giáo sư Kỹ thuật Sinh học tại MIT và là Thành viên cốt lõi của Viện Broad. ,
Paul Blainey
Naomi Altman là Giáo sư Thống kê tại Đại học Bang Pennsylvania. ,
Naomi Altman

tác giả

Anthony Kulesa
Xem các ấn phẩm của tác giả
Bạn cũng có thể tìm kiếm tác giả này trong PubMed Google Scholar
Martin Krzywinski
Xem các ấn phẩm của tác giả
Bạn cũng có thể tìm kiếm tác giả này trong PubMed Google Scholar
Paul Blainey
Xem các ấn phẩm của tác giả
Bạn cũng có thể tìm kiếm tác giả này trong PubMed Google Scholar
Naomi Altman
Xem các ấn phẩm của tác giả
Bạn cũng có thể tìm kiếm tác giả này trong PubMed Google Scholar

tuyên bố đạo đức

Lợi ích cạnh tranh

Các tác giả tuyên bố không có lợi ích tài chính cạnh tranh

Quyền và quyền

In lại và Quyền

Về bài viết này

Verify currency and authenticity via CrossMark

Trích dẫn bài viết này

Kulesa, A. , Krzywinski, M. , Blainey, P. et al. Phân phối lấy mẫu và bootstrap. Phương pháp Nat 12, 477–478 (2015). https. //doi. tổ chức/10. 1038/nmeth. 3414

Số liệu thống kê mẫu nào có thể được khởi động?

Kỹ thuật bootstrap hoạt động khá tốt với các mẫu có ít hơn 40 phần tử . Lý do cho điều này là bootstrapping liên quan đến việc lấy mẫu lại. Những loại kỹ thuật này không giả định gì về việc phân phối dữ liệu của chúng tôi.

Thống kê bootstrap là gì?

“Bootstrapping là một quy trình thống kê lấy mẫu lại một tập dữ liệu để tạo nhiều mẫu mô phỏng . Quá trình này cho phép tính toán sai số chuẩn, khoảng tin cậy và kiểm tra giả thuyết” (Forst).

Bạn sẽ sử dụng cỡ mẫu nào cho mỗi mẫu bootstrap?

Tối thiểu có thể là 20 hoặc 30 lần lặp lại . Các giá trị nhỏ hơn có thể được sử dụng sẽ thêm phương sai vào số liệu thống kê được tính trên mẫu của các giá trị ước tính. Lý tưởng nhất là mẫu ước tính sẽ càng lớn càng tốt với nguồn thời gian, với hàng trăm hoặc hàng nghìn lần lặp lại.

Số liệu thống kê bootstrap được tính như thế nào?

Phương pháp bootstrap sử dụng một cách tiếp cận rất khác để ước tính phân phối lấy mẫu. Phương pháp này lấy dữ liệu mẫu mà một nghiên cứu thu được, sau đó lấy mẫu lại nhiều lần để tạo ra nhiều mẫu mô phỏng . Mỗi mẫu mô phỏng này có các thuộc tính riêng, chẳng hạn như giá trị trung bình.