Phân phối xác suất Google Trang tính

Trong hướng dẫn này, bạn sẽ tìm hiểu cách tạo biểu đồ trong Google Trang tính với đường cong phân phối chuẩn được phủ lên, như thể hiện trong hình trên, bằng cách sử dụng Google Trang tính

Đó là một kỹ thuật trực quan thực sự hữu ích để xác định xem dữ liệu của bạn có được phân phối bình thường, sai lệch hay chỉ ở mọi nơi

Biểu đồ là gì?

Biểu đồ là một biểu diễn đồ họa về phân phối của tập dữ liệu

Trong ví dụ này, tôi có 1.000 điểm bài kiểm tra từ 0 đến 100 và tôi muốn xem phân phối của những điểm đó là gì. Điểm trung bình là gì?

Đường cong phân phối chuẩn là gì?

Đường cong phân phối chuẩn là một biểu diễn đồ họa của định lý phân phối chuẩn nói rằng “…giá trị trung bình của các biến ngẫu nhiên được rút ra độc lập từ các phân phối độc lập hội tụ trong phân phối chuẩn, nghĩa là trở thành phân phối chuẩn khi số lượng biến ngẫu nhiên đủ lớn”

Nói hơi ngoa, nhưng về bản chất, dữ liệu hội tụ xung quanh giá trị trung bình (trung bình) mà không lệch trái hay phải. Nó có nghĩa là chúng ta biết xác suất có bao nhiêu giá trị xảy ra gần với giá trị trung bình

Chúng tôi mong đợi 68% giá trị nằm trong một độ lệch chuẩn của giá trị trung bình và 95% nằm trong hai độ lệch chuẩn. Các giá trị nằm ngoài hai độ lệch chuẩn được coi là giá trị ngoại lệ

Chúng tôi hy vọng điểm bài kiểm tra của chúng tôi sẽ khá gần với phân phối bình thường, nhưng hãy xác nhận điều đó bằng biểu đồ (rất khó để nhìn thấy từ dữ liệu một mình. )

Hãy xem cách tạo Biểu đồ trong Google Trang tính và cách phủ Đường cong phân phối chuẩn, như thể hiện trong hình ảnh đầu tiên ở trên

Tìm hiểu thêm
Tìm hiểu thêm về biểu đồ trong khóa học Phân tích dữ liệu trong Google Trang tính

Cách tạo Biểu đồ trong Google Trang tính

Bước 1. Dữ liệu thô

Sao chép điểm dữ liệu thô từ đây vào Trang tính Google trống của riêng bạn. Đó là danh sách 1.000 điểm bài kiểm tra từ 0 đến 100 và chúng ta sẽ xem xét sự phân bố của các điểm đó

Bước 2. Đặt tên cho phạm vi đó

Tạo một phạm vi được đặt tên từ các điểm dữ liệu thô này, được gọi là scores, để làm cho cuộc sống của chúng ta dễ dàng hơn. Đánh dấu tất cả các dữ liệu trong cột A, i. e. ô A1. A1000, sau đó nhấp vào menu Dữ liệu > Phạm vi được đặt tên… và gọi phạm vi là scores

Bước 3. Thống kê tóm tắt

Thiết lập một bảng tóm tắt nhỏ với giá trị trung bình, trung vị, chế độ và độ lệch chuẩn của dân số của chúng tôi. Các công thức là

Bần tiện

=AVERAGE(scores)

Trung bình

=MEDIAN(scores)

Cách thức

=MODE(scores)

Độ lệch chuẩn

=STDEVP(scores)

Bước 4. Tạo các ngăn tần số

Thiết lập các ngăn tần số, từ 0 đến 100 với khoảng thời gian là 5. Đặt 0 vào ô F2 và sau đó bạn có thể sử dụng công thức này để nhanh chóng điền vào các ô còn lại

=F4 + 5

(nó thêm 5 vào ô bên trên). Đặt tên cho phạm vi này là bins

Bước 5. tính toán phân phối bình thường

Hãy thiết lập các giá trị đường cong phân phối chuẩn

Google Trang tính có công thức NORMDIST tính toán giá trị của hàm phân phối chuẩn cho một giá trị, giá trị trung bình và độ lệch chuẩn nhất định. Chúng tôi đã tính giá trị trung bình và độ lệch chuẩn ở bước 3 và chúng tôi sẽ sử dụng các giá trị bin từ bước 4 trong công thức

Trong G2, đặt công thức

________số 8

Kéo nó xuống tận G22 để điền vào toàn bộ cột công thức Normdist

Bước 6. Đường cong phân phối bình thường

Hãy xem đường cong phân phối chuẩn trông như thế nào với dữ liệu này

Chọn cột thùng và cột Normdist, sau đó Chèn > Biểu đồ và chọn biểu đồ đường và làm cho nó mượt mà

Bạn sẽ có một đầu ra như thế này

Đường cong phân phối chuẩn trong Google Trang tính

Đó là một đường cong phân phối bình thường, xung quanh giá trị trung bình của chúng tôi là 56. 9. công việc tuyệt vời

Bây giờ chúng tôi cần tính toán phân phối của 1.000 điểm bài kiểm tra cho biểu đồ biểu đồ của chúng tôi

Vì chúng ta sẽ tạo một biểu đồ hoàn toàn mới với biểu đồ tần suất và đường cong bình thường được phủ lên (dễ dàng hơn là sửa đổi biểu đồ này), bây giờ bạn có thể đặt biểu đồ phân phối bình thường này sang một bên hoặc xóa nó

Bước 7. công thức tần số

Bây giờ hãy để trống cột H (chúng tôi sẽ điền ngay)

Trong cột I, hãy sử dụng công thức TẦN SUẤT để gán 1000 điểm của chúng ta cho các ngăn tần suất. Nhập công thức sau vào ô I2 và nhấn Ctrl + Shift + Enter (trên PC) hoặc Cmd + Shift + Enter (trên Mac) để tạo Công thức mảng. Nó sẽ điền vào toàn bộ cột và chỉ định tất cả các điểm vào đúng thùng

=ArrayFormula(FREQUENCY(scores,bins))

Nếu bạn chưa quen với Công thức mảng, hãy xem bài đăng này. Công thức mảng hoạt động như thế nào trong Google Trang tính?

Bước 8. Sao chép giá trị

Sao chép cột giá trị tần suất này vào cột J liền kề (chúng tôi cần cột này cho biểu đồ của mình)

mẹo chuyên nghiệp. bạn chỉ có thể sao chép I1. I2 vào J1. J2, nó sẽ điền vào toàn bộ cột với các giá trị

Bước 9. Quy mô đường cong phân phối bình thường

Chúng ta cần chia tỷ lệ đường cong phân phối chuẩn của mình để nó hiển thị trên cùng tỷ lệ với biểu đồ. Vì chúng tôi có 1.000 giá trị trong các thùng 5, nên hệ số tỷ lệ của chúng tôi là 5.000. Có nghĩa là khi tôi nhân các giá trị phân phối chuẩn với 5.000, chúng sẽ tương đương với các giá trị biểu đồ trên cùng một trục. Ngoài ra, chúng sẽ có tổng bằng 1.000 khớp với số lượng giá trị trong dân số của chúng tôi

Vì vậy, tại cột H trống, hãy thêm công thức sau và kéo xuống H22

scores0

Bảng dữ liệu đã hoàn thành của chúng tôi bây giờ trông giống như

Bước 10. Tạo biểu đồ

Đây là nơi cuối cùng chúng ta thấy cách tạo biểu đồ trong Google Trang tính

Ghi chú. ảnh chụp màn hình được chia sẻ bên dưới hiển thị trình chỉnh sửa biểu đồ cũ. Trình chỉnh sửa biểu đồ mới sẽ mở ra trong một ngăn bên, nhưng các bước và tùy chọn về cơ bản giống nhau

Giữ phím Ctrl (PC) hoặc Cmd (Mac) để tô sáng cột dữ liệu thùng, cột Phân phối chuẩn và hai cột biểu đồ, nhưng bỏ qua cột công thức Normdist, như sau

Sau đó Chèn > Biểu đồ và chọn Biểu đồ kết hợp

Chọn tùy chọn để sử dụng cột F làm nhãn

Trong tab Tùy chỉnh, hãy xóa tiêu đề và chú giải. Chọn tùy chọn Smooth

Chọn trục tung. Xóa tên trục. Đặt để có phạm vi từ 0 đến 150 và đặt các đường lưới chính thành 4

Trong phần chuỗi của menu tùy chỉnh, hãy chọn chuỗi Phân phối Chuẩn và thay đổi từ cột thành dòng, để biểu đồ của bạn trông như thế này

Tiếp theo, chọn chuỗi Biểu đồ và thay đổi loại từ dòng thành cột

Chọn chuỗi Histogram 2 và thay đổi loại từ dòng sang khu vực bước

Sau đó, thay đổi màu thành màu đỏ, độ dày của đường thành 1px và độ mờ thành 70%, để làm cho biểu đồ của chúng ta trông giống như một biểu đồ (đây là lý do tại sao chúng ta cần hai bản sao của cột tần suất)

Dọn dẹp lần cuối. đặt kích thước phông chữ nhãn trục thành 10, sau đó nhấp vào vùng biểu đồ để di chuyển và thay đổi kích thước bằng cách kéo các cạnh ra ngoài, để nó lấp đầy toàn bộ khung vẽ biểu đồ của chúng ta

thì đấy. Bây giờ, bạn đã học cách tạo biểu đồ trong Google Trang tính, được phủ bằng một đường cong phân phối bình thường

Muốn có bản sao biểu đồ tần suất này của riêng bạn?
Nhấp vào đây để truy cập bản sao của mẫu này >>

Sự kết luận

Để kết luận, chúng ta có thể thấy dữ liệu điểm thi của chúng ta rất gần với phân phối chuẩn. hoan hô

Nếu chúng ta nhìn kỹ, nó lệch rất, rất nhẹ về bên trái, tôi. e. nó có cái đuôi bên trái dài hơn, xòe hơn bên trái. Xem cách có khoảng cách giữa các thanh màu đỏ và đường màu xanh lam ở phía bên trái, nhưng các thanh màu đỏ chồng lên đường cong màu xanh lam ở phía bên phải. Nó tinh tế mặc dù

Tìm hiểu thêm
Tìm hiểu thêm về cách tạo biểu đồ trong Google Trang tính với khóa học Phân tích dữ liệu trong Google Trang tính

Công thức phân phối xác suất là gì?

Hàm phân phối xác suất . Hơn nữa, nếu có một khoảng nửa đóng được cho bởi (a, b] thì hàm phân phối xác suất được cho bởi công thức P(a < X ≤ b) = F(b) - F(a). Hàm phân phối xác suất của biến ngẫu nhiên luôn nằm trong khoảng từ 0 đến 1. F(x) = P (X ≤ x). Furthermore, if there is a semi-closed interval given by (a, b] then the probability distribution function is given by the formula P(a < X ≤ b) = F(b) - F(a). The probability distribution function of a random variable always lies between 0 and 1.

Bạn có thể sử dụng Google Trang tính để thống kê không?

Gói công cụ để thực hiện phân tích thống kê trên Google Trang tính . Tiện ích bổ sung Công cụ phân tích thống kê, như tên mô tả, là một gói chứa một tập hợp các chức năng nhằm tự động hóa việc tạo một số kỹ thuật phân tích thống kê nổi tiếng.

Tdist trong Google Trang tính là gì?

Tính xác suất cho phân phối t của Student với đầu vào đã cho (x) .

Chủ đề