Độ lệch trung bình và độ lệch chuẩn là hai số liệu thiết yếu trong thống kê. Chúng ta có thể sử dụng mô -đun thống kê để tìm ra độ lệch trung bình và độ lệch chuẩn trong Python. Độ lệch chuẩn cũng được viết tắt là SD. Giá trị trung bình là tổng của tất cả các mục được chia cho số lượng mục. Ví dụ: nếu chúng ta có danh sách 5 số [1,2,3,4,5], thì giá trị trung bình sẽ là (1+2+3+4+5)/5 = 3. is the sum of all the entries divided by the number of entries. For example, if we have a list
of 5 numbers [1,2,3,4,5], then the mean will be (1+2+3+4+5)/5 = 3. Độ lệch chuẩn là thước đo lượng biến thể hoặc phân tán của một tập hợp các giá trị. Trước tiên chúng ta cần tính toán giá trị trung bình của các giá trị, sau đó tính toán phương sai và cuối cùng là độ lệch chuẩn. is a measure of the amount of variation or dispersion of a set of values. We first need to calculate the mean of the values, then calculate the variance, and finally the standard deviation. Hãy nói rằng chúng tôi có dữ liệu dân số trên mỗi km vuông cho các tiểu bang khác nhau ở Hoa Kỳ. Chúng ta có thể tính toán độ lệch chuẩn để tìm hiểu làm thế nào dân số được phân phối đồng đều. Một giá trị nhỏ hơn có nghĩa là phân phối thậm chí là trong khi giá trị lớn hơn có nghĩa là có rất ít người sống ở một số nơi trong khi một số khu vực được đông dân cư. Hãy cùng xem xét các bước cần thiết trong việc tính toán độ lệch trung bình và tiêu chuẩn. Hãy để viết mã để tính toán độ lệch trung bình và độ lệch chuẩn trong Python. Chúng tôi sẽ sử dụng mô -đun thống kê và sau đó cố gắng viết triển khai của riêng chúng tôi. Mô -đun này cung cấp cho bạn tùy chọn tính toán trực tiếp tính trung bình và độ lệch chuẩn. Hãy bắt đầu bằng cách nhập mô -đun. Hãy cùng khai báo một danh sách với dữ liệu mẫu. Bây giờ để tính giá trị trung bình của dữ liệu mẫu, sử dụng chức năng sau:Có nghĩa là gì?
Độ lệch chuẩn là gì?
Việc sử dụng độ lệch chuẩn
Các bước để tính toán trung bình
Các bước để tính toán độ lệch chuẩn
1. Sử dụng mô -đun thống kê
Tuyên bố này sẽ trả về giá trị trung bình của dữ liệu. Chúng ta có thể in giá trị trung bình trong đầu ra bằng cách sử dụng:
print("Mean of the sample is % s " %(statistics.mean(data)))
Chúng tôi nhận được đầu ra như:
Mean of the sample is 13.666666666666666
Nếu bạn đang sử dụng IDE để mã hóa, bạn có thể di chuột qua câu lệnh và nhận thêm thông tin về chức năng thống kê.mean ().
Ngoài ra, bạn có thể đọc tài liệu ở đây.here.
Để tính độ lệch chuẩn của việc sử dụng dữ liệu mẫu:
print("Standard Deviation of the sample is % s "%(statistics.stdev(data)))
Chúng tôi nhận được đầu ra như:
Standard Deviation of the sample is 15.61623087261029
Nếu bạn đang sử dụng IDE để mã hóa, bạn có thể di chuột qua câu lệnh và nhận thêm thông tin về chức năng thống kê.mean ().
Ngoài ra, bạn có thể đọc tài liệu ở đây.
Để tính độ lệch chuẩn của việc sử dụng dữ liệu mẫu:
import statistics data = [7,5,4,9,12,45] print("Standard Deviation of the sample is % s "% (statistics.stdev(data))) print("Mean of the sample is % s " % (statistics.mean(data)))
Dưới đây, một tài liệu ngắn gọn về chức năng thống kê.stdev ().
Mã hoàn chỉnh để tìm độ lệch chuẩn và trung bình trong Python
def mean(data): n = len(data) mean = sum(data) / n return mean
Mã hoàn chỉnh cho các đoạn trên như sau:
2. Viết chức năng tùy chỉnh để tính toán độ lệch chuẩn
Hãy cùng viết chức năng của chúng tôi để tính toán độ lệch trung bình và độ lệch chuẩn trong Python.
Hàm này sẽ tính giá trị trung bình.square root of variance. So we can write two functions:
- Bây giờ, hãy để viết một chức năng để tính độ lệch chuẩn.
- Điều này có thể là một chút khó khăn, vì vậy hãy để Lôi đi về từng bước.
Độ lệch chuẩn là căn bậc hai của phương sai. Vì vậy, chúng tôi có thể viết hai chức năng:
def variance(data): n = len(data) mean = sum(data) / n deviations = [(x - mean) ** 2 for x in data] variance = sum(deviations) / n return variance
Hàm đầu tiên sẽ tính toán phương sai
Hàm thứ hai sẽ tính toán căn bậc hai của phương sai và trả về độ lệch chuẩn.
def stdev(data): import math var = variance(data) std_dev = math.sqrt(var) return std_dev
Hàm để tính phương sai như sau:
Bạn có thể tham khảo các bước được đưa ra ở đầu hướng dẫn để hiểu mã.
import numpy as np #for declaring an array or simply use list def mean(data): n = len(data) mean = sum(data) / n return mean def variance(data): n = len(data) mean = sum(data) / n deviations = [(x - mean) ** 2 for x in data] variance = sum(deviations) / n return variance def stdev(data): import math var = variance(data) std_dev = math.sqrt(var) return std_dev data = np.array([7,5,4,9,12,45]) print("Standard Deviation of the sample is % s "% (stdev(data))) print("Mean of the sample is % s " % (mean(data)))
Bây giờ chúng ta có thể viết một hàm tính toán căn bậc hai của phương sai.
Hoàn thành mã
Mã hoàn chỉnh như sau:
- Sự kết luận
- Độ lệch trung bình và độ lệch chuẩn là các giá trị toán học được sử dụng trong phân tích thống kê. Mô -đun thống kê Python cung cấp các chức năng hữu ích để tính toán các giá trị này một cách dễ dàng.
- Cái gì tiếp theo?
- Mô -đun toán học Python
Mô -đun Numpy
- Mảng Python
- Danh sách trong Python