Trong hướng dẫn này, bạn sẽ tìm hiểu cách tạo biểu đồ trong Google Trang tính với đường cong phân phối chuẩn được phủ lên, như thể hiện trong hình trên, bằng cách sử dụng Google Trang tính
Đó là một kỹ thuật trực quan thực sự hữu ích để xác định xem dữ liệu của bạn có được phân phối bình thường, sai lệch hay chỉ ở mọi nơi
Biểu đồ là gì?
Biểu đồ là một biểu diễn đồ họa về phân phối của tập dữ liệu
Trong ví dụ này, tôi có 1.000 điểm bài kiểm tra từ 0 đến 100 và tôi muốn xem phân phối của những điểm đó là gì. Điểm trung bình là gì?
Đường cong phân phối chuẩn là gì?
Đường cong phân phối chuẩn là một biểu diễn đồ họa của định lý phân phối chuẩn nói rằng “…giá trị trung bình của các biến ngẫu nhiên được rút ra độc lập từ các phân phối độc lập hội tụ trong phân phối chuẩn, nghĩa là trở thành phân phối chuẩn khi số lượng biến ngẫu nhiên đủ lớn”
Nói hơi ngoa, nhưng về bản chất, dữ liệu hội tụ xung quanh giá trị trung bình (trung bình) mà không lệch trái hay phải. Nó có nghĩa là chúng ta biết xác suất có bao nhiêu giá trị xảy ra gần với giá trị trung bình
Chúng tôi mong đợi 68% giá trị nằm trong một độ lệch chuẩn của giá trị trung bình và 95% nằm trong hai độ lệch chuẩn. Các giá trị nằm ngoài hai độ lệch chuẩn được coi là giá trị ngoại lệ
Chúng tôi hy vọng điểm bài kiểm tra của chúng tôi sẽ khá gần với phân phối bình thường, nhưng hãy xác nhận điều đó bằng biểu đồ (rất khó để nhìn thấy từ dữ liệu một mình. )
Hãy xem cách tạo Biểu đồ trong Google Trang tính và cách phủ Đường cong phân phối chuẩn, như thể hiện trong hình ảnh đầu tiên ở trên
Tìm hiểu thêm về biểu đồ trong khóa học Phân tích dữ liệu trong Google Trang tính
Cách tạo Biểu đồ trong Google Trang tính
Bước 1. Dữ liệu thô
Sao chép điểm dữ liệu thô từ đây vào Trang tính Google trống của riêng bạn. Đó là danh sách 1.000 điểm bài kiểm tra từ 0 đến 100 và chúng ta sẽ xem xét sự phân bố của các điểm đó
Bước 2. Đặt tên cho phạm vi đó
Tạo một phạm vi được đặt tên từ các điểm dữ liệu thô này, được gọi là scores, để làm cho cuộc sống của chúng ta dễ dàng hơn. Đánh dấu tất cả các dữ liệu trong cột A, i. e. ô A1. A1000, sau đó nhấp vào menu Dữ liệu > Phạm vi được đặt tên… và gọi phạm vi là scores
Bước 3. Thống kê tóm tắt
Thiết lập một bảng tóm tắt nhỏ với giá trị trung bình, trung vị, chế độ và độ lệch chuẩn của dân số của chúng tôi. Các công thức là
Bần tiện
=AVERAGE(scores)
Trung bình
=MEDIAN(scores)
Cách thức
=MODE(scores)
Độ lệch chuẩn
=STDEVP(scores)
Bước 4. Tạo các ngăn tần số
Thiết lập các ngăn tần số, từ 0 đến 100 với khoảng thời gian là 5. Đặt 0 vào ô F2 và sau đó bạn có thể sử dụng công thức này để nhanh chóng điền vào các ô còn lại
=F4 + 5
(nó thêm 5 vào ô bên trên). Đặt tên cho phạm vi này là bins
Bước 5. tính toán phân phối bình thường
Hãy thiết lập các giá trị đường cong phân phối chuẩn
Google Trang tính có công thức NORMDIST tính toán giá trị của hàm phân phối chuẩn cho một giá trị, giá trị trung bình và độ lệch chuẩn nhất định. Chúng tôi đã tính giá trị trung bình và độ lệch chuẩn ở bước 3 và chúng tôi sẽ sử dụng các giá trị bin từ bước 4 trong công thức
Trong G2, đặt công thức
________số 8
Kéo nó xuống tận G22 để điền vào toàn bộ cột công thức Normdist
Bước 6. Đường cong phân phối bình thường
Hãy xem đường cong phân phối chuẩn trông như thế nào với dữ liệu này
Chọn cột thùng và cột Normdist, sau đó Chèn > Biểu đồ và chọn biểu đồ đường và làm cho nó mượt mà
Bạn sẽ có một đầu ra như thế này
Đó là một đường cong phân phối bình thường, xung quanh giá trị trung bình của chúng tôi là 56. 9. công việc tuyệt vời
Bây giờ chúng tôi cần tính toán phân phối của 1.000 điểm bài kiểm tra cho biểu đồ biểu đồ của chúng tôi
Vì chúng ta sẽ tạo một biểu đồ hoàn toàn mới với biểu đồ tần suất và đường cong bình thường được phủ lên (dễ dàng hơn là sửa đổi biểu đồ này), bây giờ bạn có thể đặt biểu đồ phân phối bình thường này sang một bên hoặc xóa nó
Bước 7. công thức tần số
Bây giờ hãy để trống cột H (chúng tôi sẽ điền ngay)
Trong cột I, hãy sử dụng công thức TẦN SUẤT để gán 1000 điểm của chúng ta cho các ngăn tần suất. Nhập công thức sau vào ô I2 và nhấn Ctrl + Shift + Enter (trên PC) hoặc Cmd + Shift + Enter (trên Mac) để tạo Công thức mảng. Nó sẽ điền vào toàn bộ cột và chỉ định tất cả các điểm vào đúng thùng
=ArrayFormula(FREQUENCY(scores,bins))
Nếu bạn chưa quen với Công thức mảng, hãy xem bài đăng này. Công thức mảng hoạt động như thế nào trong Google Trang tính?
Bước 8. Sao chép giá trị
Sao chép cột giá trị tần suất này vào cột J liền kề (chúng tôi cần cột này cho biểu đồ của mình)
mẹo chuyên nghiệp. bạn chỉ có thể sao chép I1. I2 vào J1. J2, nó sẽ điền vào toàn bộ cột với các giá trị
Bước 9. Quy mô đường cong phân phối bình thường
Chúng ta cần chia tỷ lệ đường cong phân phối chuẩn của mình để nó hiển thị trên cùng tỷ lệ với biểu đồ. Vì chúng tôi có 1.000 giá trị trong các thùng 5, nên hệ số tỷ lệ của chúng tôi là 5.000. Có nghĩa là khi tôi nhân các giá trị phân phối chuẩn với 5.000, chúng sẽ tương đương với các giá trị biểu đồ trên cùng một trục. Ngoài ra, chúng sẽ có tổng bằng 1.000 khớp với số lượng giá trị trong dân số của chúng tôi
Vì vậy, tại cột H trống, hãy thêm công thức sau và kéo xuống H22
scores0
Bảng dữ liệu đã hoàn thành của chúng tôi bây giờ trông giống như
Bước 10. Tạo biểu đồ
Đây là nơi cuối cùng chúng ta thấy cách tạo biểu đồ trong Google Trang tính
Ghi chú. ảnh chụp màn hình được chia sẻ bên dưới hiển thị trình chỉnh sửa biểu đồ cũ. Trình chỉnh sửa biểu đồ mới sẽ mở ra trong một ngăn bên, nhưng các bước và tùy chọn về cơ bản giống nhau
Giữ phím Ctrl (PC) hoặc Cmd (Mac) để tô sáng cột dữ liệu thùng, cột Phân phối chuẩn và hai cột biểu đồ, nhưng bỏ qua cột công thức Normdist, như sau
Sau đó Chèn > Biểu đồ và chọn Biểu đồ kết hợp
Chọn tùy chọn để sử dụng cột F làm nhãn
Trong tab Tùy chỉnh, hãy xóa tiêu đề và chú giải. Chọn tùy chọn Smooth
Chọn trục tung. Xóa tên trục. Đặt để có phạm vi từ 0 đến 150 và đặt các đường lưới chính thành 4
Trong phần chuỗi của menu tùy chỉnh, hãy chọn chuỗi Phân phối Chuẩn và thay đổi từ cột thành dòng, để biểu đồ của bạn trông như thế này
Tiếp theo, chọn chuỗi Biểu đồ và thay đổi loại từ dòng thành cột
Chọn chuỗi Histogram 2 và thay đổi loại từ dòng sang khu vực bước
Sau đó, thay đổi màu thành màu đỏ, độ dày của đường thành 1px và độ mờ thành 70%, để làm cho biểu đồ của chúng ta trông giống như một biểu đồ (đây là lý do tại sao chúng ta cần hai bản sao của cột tần suất)
Dọn dẹp lần cuối. đặt kích thước phông chữ nhãn trục thành 10, sau đó nhấp vào vùng biểu đồ để di chuyển và thay đổi kích thước bằng cách kéo các cạnh ra ngoài, để nó lấp đầy toàn bộ khung vẽ biểu đồ của chúng ta
thì đấy. Bây giờ, bạn đã học cách tạo biểu đồ trong Google Trang tính, được phủ bằng một đường cong phân phối bình thường
Muốn có bản sao biểu đồ tần suất này của riêng bạn?
Nhấp vào đây để truy cập bản sao của mẫu này >>
Sự kết luận
Để kết luận, chúng ta có thể thấy dữ liệu điểm thi của chúng ta rất gần với phân phối chuẩn. hoan hô
Nếu chúng ta nhìn kỹ, nó lệch rất, rất nhẹ về bên trái, tôi. e. nó có cái đuôi bên trái dài hơn, xòe hơn bên trái. Xem cách có khoảng cách giữa các thanh màu đỏ và đường màu xanh lam ở phía bên trái, nhưng các thanh màu đỏ chồng lên đường cong màu xanh lam ở phía bên phải. Nó tinh tế mặc dù
Tìm hiểu thêm về cách tạo biểu đồ trong Google Trang tính với khóa học Phân tích dữ liệu trong Google Trang tính