Hướng dẫn dùng statistics methods python - sử dụng các phương pháp thống kê python



Module statistics trong Python cung cấp các hàm để thống kê toán học của dữ liệu số. Có một số hàm thống kê phổ biến được định nghĩa trong Module này. cung cấp các hàm để thống kê toán học của dữ liệu số. Có một số hàm thống kê phổ biến được định nghĩa trong Module này.

Nội dung chính ShowShow

  • Hàm statistics.mean()
  • Hàm statistics.median()
  • Hàm statistics.mode()
  • Hàm statistics.stdev()
  • Hàm statistics.median_low()
  • Hàm statistics.median_high()
  • Tính Trung bình
  • Tính Trung vị
  • Đo Độ lệch của Dữ liệu
  • Phần Tóm tắt

Nội dung chính

  • Hàm statistics.mean()
  • Hàm statistics.median()
  • Hàm statistics.mode()
  • Hàm statistics.stdev()
  • Hàm statistics.median_low()
  • Hàm statistics.median_high()

Hàm statistics.mean()

Hàm statistics.median()

import statistics    
# danh sách số nguyên dương
datasets = [1, 2, 7, 4, 2, 6, 8, 10]     
x = statistics.mean(datasets)     
# In giá trị trung bình của danh sách  
print("Giá trị trung bình của datasets là:", x) 

Hàm statistics.mode()

Giá trị trung bình của datasets là: 5

Hàm statistics.median()

Hàm statistics.mode()

import statistics     
datasets = [4, -5, 6]      
print("Giá trị median của datasets là : % s " % (statistics.median(datasets)))

Hàm statistics.mode()

Hàm statistics.stdev()

Hàm statistics.mode()

Hàm statistics.stdev()

import statistics
dataset =[2, 4, 7, 7, 2, 2, 3, 6, 6, 8]
print("Phần tử xuất hiện nhiều nhất là: % s" % (statistics.mode(dataset)))

Hàm statistics.mode()

Phần tử xuất hiện nhiều nhất là 2

Hàm statistics.stdev()

Hàm statistics.median_low()

import statistics  
sample = [7, 8, 9, 10, 11]
print("Độ lệch chuẩn là: % s " % (statistics.stdev(sample)))

Hàm statistics.mode()

Độ lệch chuẩn là: 1.5811388300841898 

Hàm statistics.median_low()

Hàm statistics.median_high()

import statistics     
set1 = [4, 6, 2, 5, 7, 7]     
print("Giá trị trung bình thấp của data-set là: % s " 
      % (statistics.median_low(set1)))

Hàm statistics.mode()

Giá trị trung bình thấp của data-set là: 5 

Hàm statistics.median_high()

Tính Trung bình

Giá trị trung bình của datasets là: 5
0

Hàm statistics.mode()

Giá trị trung bình của datasets là: 5
1

Hàm statistics.stdev() Dai Phong (you can also view the original English article)

Hàm statistics.median_low()

Hàm statistics.median_high()

Tính Trung bình

Tính Trung vị

Tính Trung bình

Tính Trung vị

Giá trị trung bình của datasets là: 5
2

Đo Độ lệch của Dữ liệu

Giá trị trung bình của datasets là: 5
3

Phần Tóm tắt

Nội dung chính

Hàm mean() được sử dụng để tính giá trị trung bình số học của các số trong danh sách.

Giá trị trung bình của datasets là: 5
4

Kết quả:

Tính Trung vị

Đo Độ lệch của Dữ liệu

Phần Tóm tắt

Giá trị trung bình của datasets là: 5
5

Trong trường hợp cuối cùng, trung vị thấp và cao là 50 và 52. Điều này có nghĩa là không có data point có giá trị 51 trong tập dữ liệu của chúng ta, nhưng hàm

import statistics     
datasets = [4, -5, 6]      
print("Giá trị median của datasets là : % s " % (statistics.median(datasets)))
5 vẫn tính trung vị là 51,0.

Đo Độ lệch của Dữ liệu

Xác định có bao nhiêu data point lệch khỏi giá trị điển hình hoặc trung bình của bộ dữ liệu cũng quan trọng không kém tính giá trị trung tâm hoặc trung bình. Mô-đun statistics có bốn hàm khác nhau để giúp chúng ta tính toán độ lệch này của dữ liệu.

Bạn có thể sử dụng hàm

Giá trị median của datasets là : 4 
0 để tính phương sai của một bộ dữ liệu nhất định.

Đối số thứ hai trong trường hợp này là không bắt buộc. Giá trị của mu, khi được cung cấp, phải bằng với trung bình của dữ liệu nhất định. Trung bình được tính tự động nếu giá trị bị thiếu. Hàm này rất hữu ích khi bạn muốn tính phương sai của toàn bộ tập hợp. Nếu dữ liệu của bạn chỉ là một mẫu của tập hợp, bạn có thể sử dụng hàm

Giá trị median của datasets là : 4 
1 để tính toán phương sai của mẫu dữ liệu. Ở đây, xBar là trung bình của mẫu dữ liệu cho trước và được tính tự động nếu không được cung cấp.

Để tính toán độ rõ tiêu chuẩn của tập hợp và độ lệch tiêu chuẩn của mẫu dữ liệu, bạn có thể sử dụng các hàm

Giá trị median của datasets là : 4 
2 và
Giá trị median của datasets là : 4 
3 tương ứng.

Giá trị trung bình của datasets là: 5
6

Như minh chứng từ ví dụ trên, phương sai nhỏ hơn hàm ý rằng nhiều data point có giá trị gần hơn với giá trị trung bình. Bạn cũng có thể tính độ lệch chuẩn của các số thập phân và phân số.

Phần Tóm tắt

Trong hướng dẫn cuối cùng của loạt bài này, chúng ta đã tìm hiểu về các hàm khác nhau có sẵn trong mô-đun statistics. Bạn có thể đã quan sát thấy rằng dữ liệu đưa ra cho các hàm đã được sắp xếp trong hầu hết các trường hợp, nhưng không bắt buộc phải làm như vậy. Tôi đã sử dụng các danh sách được sắp xếp trong hướng dẫn này vì chúng giúp dễ dàng hơn để hiểu cách giá trị trả về bởi các hàm khác nhau có liên quan đến dữ liệu đầu vào.