Hướng dẫn python mean and standard deviation - trung bình của python và độ lệch chuẩn

Độ lệch trung bình và độ lệch chuẩn là hai số liệu thiết yếu trong thống kê. Chúng ta có thể sử dụng mô -đun thống kê để tìm ra độ lệch trung bình và độ lệch chuẩn trong Python. Độ lệch chuẩn cũng được viết tắt là SD.

Có nghĩa là gì?

Giá trị trung bình là tổng của tất cả các mục được chia cho số lượng mục. Ví dụ: nếu chúng ta có danh sách 5 số [1,2,3,4,5], thì giá trị trung bình sẽ là (1+2+3+4+5)/5 = 3. is the sum of all the entries divided by the number of entries. For example, if we have a list of 5 numbers [1,2,3,4,5], then the mean will be (1+2+3+4+5)/5 = 3.

Độ lệch chuẩn là gì?

Độ lệch chuẩn là thước đo lượng biến thể hoặc phân tán của một tập hợp các giá trị. Trước tiên chúng ta cần tính toán giá trị trung bình của các giá trị, sau đó tính toán phương sai và cuối cùng là độ lệch chuẩn. is a measure of the amount of variation or dispersion of a set of values. We first need to calculate the mean of the values, then calculate the variance, and finally the standard deviation.

Việc sử dụng độ lệch chuẩn

Hãy nói rằng chúng tôi có dữ liệu dân số trên mỗi km vuông cho các tiểu bang khác nhau ở Hoa Kỳ. Chúng ta có thể tính toán độ lệch chuẩn để tìm hiểu làm thế nào dân số được phân phối đồng đều. Một giá trị nhỏ hơn có nghĩa là phân phối thậm chí là trong khi giá trị lớn hơn có nghĩa là có rất ít người sống ở một số nơi trong khi một số khu vực được đông dân cư.

Hãy cùng xem xét các bước cần thiết trong việc tính toán độ lệch trung bình và tiêu chuẩn.

Các bước để tính toán trung bình

Lấy tổng của tất cả các mục.sum of all the entries.
Chia tổng cho số lượng mục.by the number of entries.

Các bước để tính toán độ lệch chuẩn

Tính trung bình như đã thảo luận ở trên. Giá trị trung bình của [1, 2, 3, 4, 5] là 3. as discussed above. The mean of [1, 2, 3, 4, 5] is 3.
Tính phương sai cho mỗi mục bằng cách trừ trung bình từ giá trị của mục nhập. Vì vậy, phương sai sẽ là [-2, -1, 0, 1, 2]. for each entry by subtracting the mean from the value of the entry. So variance will be [-2, -1, 0, 1, 2].
Sau đó vuông mỗi giá trị kết quả và tổng kết các kết quả. Đối với ví dụ trên, nó sẽ trở thành 4+1+0+1+4 = 10.
Sau đó chia kết quả cho số điểm dữ liệu trừ đi một điểm. Điều này sẽ cung cấp phương sai. Vì vậy, phương sai sẽ là 10/(5-1) = 2,5 variance. So variance will be 10/(5-1) = 2.5
Căn bậc hai của phương sai (tính toán ở trên) là độ lệch chuẩn. Vì vậy, độ lệch chuẩn sẽ là SQRT (2.5) = 1.5811388300841898.square root of the variance (calculated above) is the standard deviation. So standard deviation will be sqrt(2.5) = 1.5811388300841898.

Hãy để viết mã để tính toán độ lệch trung bình và độ lệch chuẩn trong Python. Chúng tôi sẽ sử dụng mô -đun thống kê và sau đó cố gắng viết triển khai của riêng chúng tôi.

1. Sử dụng mô -đun thống kê

Mô -đun này cung cấp cho bạn tùy chọn tính toán trực tiếp tính trung bình và độ lệch chuẩn.

Hãy bắt đầu bằng cách nhập mô -đun.

Hãy cùng khai báo một danh sách với dữ liệu mẫu.

Bây giờ để tính giá trị trung bình của dữ liệu mẫu, sử dụng chức năng sau:

Tuyên bố này sẽ trả về giá trị trung bình của dữ liệu. Chúng ta có thể in giá trị trung bình trong đầu ra bằng cách sử dụng:

print("Mean of the sample is % s " %(statistics.mean(data)))

Chúng tôi nhận được đầu ra như:

Mean of the sample is 13.666666666666666

Nếu bạn đang sử dụng IDE để mã hóa, bạn có thể di chuột qua câu lệnh và nhận thêm thông tin về chức năng thống kê.mean ().

Ngoài ra, bạn có thể đọc tài liệu ở đây.here.

Để tính độ lệch chuẩn của việc sử dụng dữ liệu mẫu:

print("Standard Deviation of the sample is % s "%(statistics.stdev(data)))

Chúng tôi nhận được đầu ra như:

Standard Deviation of the sample is 15.61623087261029

Nếu bạn đang sử dụng IDE để mã hóa, bạn có thể di chuột qua câu lệnh và nhận thêm thông tin về chức năng thống kê.mean ().

Ngoài ra, bạn có thể đọc tài liệu ở đây.

Để tính độ lệch chuẩn của việc sử dụng dữ liệu mẫu:

import statistics data = [7,5,4,9,12,45] print("Standard Deviation of the sample is % s "% (statistics.stdev(data))) print("Mean of the sample is % s " % (statistics.mean(data)))

Dưới đây, một tài liệu ngắn gọn về chức năng thống kê.stdev ().

Mã hoàn chỉnh để tìm độ lệch chuẩn và trung bình trong Python

def mean(data): n = len(data) mean = sum(data) / n return mean

Mã hoàn chỉnh cho các đoạn trên như sau:

2. Viết chức năng tùy chỉnh để tính toán độ lệch chuẩn

Hãy cùng viết chức năng của chúng tôi để tính toán độ lệch trung bình và độ lệch chuẩn trong Python.

Hàm này sẽ tính giá trị trung bình.square root of variance. So we can write two functions:

Bây giờ, hãy để viết một chức năng để tính độ lệch chuẩn.
Điều này có thể là một chút khó khăn, vì vậy hãy để Lôi đi về từng bước.

Độ lệch chuẩn là căn bậc hai của phương sai. Vì vậy, chúng tôi có thể viết hai chức năng:

def variance(data): n = len(data) mean = sum(data) / n deviations = [(x - mean) ** 2 for x in data] variance = sum(deviations) / n return variance

Hàm đầu tiên sẽ tính toán phương sai

Hàm thứ hai sẽ tính toán căn bậc hai của phương sai và trả về độ lệch chuẩn.

def stdev(data): import math var = variance(data) std_dev = math.sqrt(var) return std_dev

Hàm để tính phương sai như sau:

Bạn có thể tham khảo các bước được đưa ra ở đầu hướng dẫn để hiểu mã.

import numpy as np #for declaring an array or simply use list def mean(data): n = len(data) mean = sum(data) / n return mean def variance(data): n = len(data) mean = sum(data) / n deviations = [(x - mean) ** 2 for x in data] variance = sum(deviations) / n return variance def stdev(data): import math var = variance(data) std_dev = math.sqrt(var) return std_dev data = np.array([7,5,4,9,12,45]) print("Standard Deviation of the sample is % s "% (stdev(data))) print("Mean of the sample is % s " % (mean(data)))

Bây giờ chúng ta có thể viết một hàm tính toán căn bậc hai của phương sai.

Hoàn thành mã

Mã hoàn chỉnh như sau:

Sự kết luận
Độ lệch trung bình và độ lệch chuẩn là các giá trị toán học được sử dụng trong phân tích thống kê. Mô -đun thống kê Python cung cấp các chức năng hữu ích để tính toán các giá trị này một cách dễ dàng.
Cái gì tiếp theo?
Mô -đun toán học Python

Mô -đun Numpy

Mảng Python
Danh sách trong Python

Làm thế nào để bạn tìm thấy độ lệch trung bình và độ lệch chuẩn trong Python?

Độ lệch chuẩn là căn bậc hai của trung bình của độ lệch bình phương so với giá trị trung bình, tức là, std = sqrt (trung bình (x)), trong đó x = abs (a - a.mean ()) ** 2. Độ lệch bình phương trung bình thường được tính là x.sum () / n, trong đó n = len (x).std = sqrt(mean(x)) , where x = abs(a - a.mean())**2 . The average squared deviation is typically calculated as x.sum() / N , where N = len(x) .

Std () trong python là gì?

std (), được sử dụng để tính độ lệch chuẩn dọc theo trục được chỉ định.Hàm này trả về độ lệch chuẩn của các phần tử mảng.Căn bậc hai của độ lệch vuông trung bình (được tính từ giá trị trung bình), được gọi là độ lệch chuẩn.used to compute the standard deviation along the specified axis. This function returns the standard deviation of the array elements. The square root of the average square deviation (computed from the mean), is known as the standard deviation.

Làm thế nào để bạn mã hóa độ lệch chuẩn trong Python?

Mã hóa hàm stdev () trong python sqrt () để lấy căn bậc hai của phương sai.Với triển khai mới này, chúng ta có thể sử dụng DDOF = 0 để tính độ lệch chuẩn của dân số hoặc chúng ta có thể sử dụng DDOF = 1 để ước tính độ lệch chuẩn của dân số bằng cách sử dụng mẫu dữ liệu.use ddof=0 to calculate the standard deviation of a population, or we can use ddof=1 to estimate the standard deviation of a population using a sample of data.

Làm thế nào để bạn tìm thấy sự sai lệch trung bình trong Python?

Phương pháp số 1: Sử dụng loop + mean () + abs () Trong này, chúng tôi thực hiện lặp lại của từng phần tử và tính toán độ lệch từ trung bình bằng cách sử dụng abs (), tính toán trung bình được thực hiện bằng cách sử dụng trung bình ().Using loop + mean() + abs() In this, we perform iteration of each element and compute deviation from mean using abs(), the computation of mean is done using mean().