Hướng dẫn how do you find the mean in python? - làm thế nào để bạn tìm thấy ý nghĩa trong python?

Question

Giới thiệu

Khi chúng tôi đang cố gắng mô tả và tóm tắt một mẫu dữ liệu, có lẽ chúng tôi bắt đầu bằng cách tìm giá trị trung bình (hoặc trung bình), trung bình và chế độ của dữ liệu. Đây là các biện pháp xu hướng trung tâm và thường là cái nhìn đầu tiên của chúng tôi về một bộ dữ liệu.central tendency measures and are often our first look at a dataset.

Nội dung chính Show

Giới thiệu
Tính toán giá trị trung bình của một mẫu
Tìm kiếm trung bình của một mẫu
Tìm chế độ của một mẫu
Sự kết luận
Làm thế nào để bạn tìm thấy ý nghĩa trong dữ liệu Python?
Làm thế nào để bạn tìm thấy tìm kiếm ý nghĩa?
Làm thế nào để bạn sử dụng trung bình trong Python?
Có nghĩa là gì bởi số trong Python?

Trong hướng dẫn này, chúng ta sẽ học cách tìm hoặc tính toán giá trị trung bình, trung bình và chế độ trong Python. Trước tiên chúng tôi sẽ mã hóa hàm Python cho mỗi biện pháp theo sau bằng cách sử dụng mô -đun ____ của Python để hoàn thành cùng một nhiệm vụ.

Với kiến thức này, chúng tôi sẽ có thể xem nhanh các bộ dữ liệu của chúng tôi và có ý tưởng về xu hướng chung của dữ liệu.

Tính toán giá trị trung bình của một mẫu

Nếu chúng ta có một mẫu các giá trị số, thì giá trị trung bình của nó hoặc trung bình là tổng số của các giá trị (hoặc quan sát) chia cho số lượng giá trị.

Giả sử chúng tôi có mẫu [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Chúng ta có thể tính toán giá trị trung bình của nó bằng cách thực hiện thao tác:

(4 + 8 + 6 + 5 + 3 + 2 + 8 + 9 + 2 + 5) / 10 = 5.2

Giá trị trung bình (trung bình số học) là một mô tả chung về dữ liệu của chúng tôi. Giả sử bạn mua 10 pound cà chua. Khi bạn đếm cà chua ở nhà, bạn sẽ nhận được 25 cà chua. Trong trường hợp này, bạn có thể nói rằng trọng lượng trung bình của cà chua là 0,4 pound. Đó sẽ là một mô tả tốt về cà chua của bạn.

Giá trị trung bình cũng có thể là một mô tả kém về một mẫu dữ liệu. Giả sử bạn đang phân tích một nhóm chó. Nếu bạn lấy trọng lượng tích lũy của tất cả các con chó và chia nó cho số lượng chó, thì đó có lẽ là một mô tả kém về trọng lượng của một con chó cá nhân vì các giống chó khác nhau có thể có kích thước và trọng lượng rất khác nhau.

Mức trung bình tốt như thế nào hoặc mức độ xấu mô tả một mẫu phụ thuộc vào mức độ lan truyền dữ liệu. Trong trường hợp của cà chua, mỗi trọng lượng gần giống nhau và giá trị trung bình là một mô tả tốt về chúng. Trong trường hợp của chó, không có con chó tại chỗ. Họ có thể từ một Chihuahua nhỏ đến một con chó săn Đức khổng lồ. Vì vậy, ý nghĩa của chính nó không phải là một mô tả tốt trong trường hợp này.

Bây giờ là lúc để hành động và tìm hiểu làm thế nào chúng ta có thể tính toán trung bình bằng cách sử dụng Python.

Tính trung bình với Python

Để tính giá trị trung bình của một mẫu dữ liệu số, chúng tôi sẽ sử dụng hai hàm tích hợp của Python. Một để tính tổng tổng của các giá trị và một để tính chiều dài của mẫu.

Hàm đầu tiên là sum(). Hàm tích hợp này có một giá trị số có thể lặp lại và trả về tổng số của chúng.

Hàm thứ hai là ____10. Hàm tích hợp này trả về độ dài của một đối tượng.

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

0 có thể thực hiện các chuỗi (chuỗi, byte, tuple, danh sách hoặc phạm vi) hoặc bộ sưu tập (từ điển, bộ hoặc bộ đông lạnh) làm đối số.

Đây là cách chúng ta có thể tính toán trung bình:

>>> def my_mean(sample):
...     return sum(sample) / len(sample)
...

>>> my_mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

Trước tiên chúng tôi tổng hợp các giá trị trong

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

2 bằng cách sử dụng sum(). Sau đó, chúng tôi chia tổng số đó cho độ dài của

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

2, đó là giá trị kết quả là

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

5.

Sử dụng trung bình của Python ()

Vì tính toán giá trị trung bình là một hoạt động chung, Python bao gồm chức năng này trong mô -đun statistics. Nó cung cấp một số chức năng để tính toán số liệu thống kê cơ bản trên các bộ dữ liệu. Hàm

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

7 lấy một mẫu dữ liệu số (bất kỳ điều khác được) và trả về giá trị trung bình của nó.

Đây là cách

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

8 của Python hoạt động:

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

Chúng tôi chỉ cần nhập mô -đun statistics và sau đó gọi

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

8 với mẫu của chúng tôi làm đối số. Điều đó sẽ trả về giá trị trung bình của mẫu. Đây là một cách nhanh chóng để tìm kiếm ý nghĩa sử dụng Python.

Tìm kiếm trung bình của một mẫu

Trung bình của một mẫu dữ liệu số là giá trị nằm ở giữa khi chúng ta sắp xếp dữ liệu. Dữ liệu có thể được sắp xếp theo thứ tự tăng dần hoặc giảm dần, trung bình vẫn giữ nguyên.

Để tìm trung vị, chúng ta cần:

Sắp xếp mẫu
Xác định vị trí giá trị ở giữa mẫu được sắp xếp

Khi định vị số ở giữa một mẫu được sắp xếp, chúng ta có thể đối mặt với hai loại tình huống:

Nếu mẫu có số lượng quan sát lẻ, thì giá trị trung bình trong mẫu được sắp xếp là trung bìnhodd number of observations, then the middle value in the sorted sample is the median
Nếu mẫu có số lượng quan sát chẵn, thì chúng ta sẽ cần tính giá trị trung bình của hai giá trị giữa trong mẫu được sắp xếpeven number of observations, then we'll need to calculate the mean of the two middle values in the sorted sample

Nếu chúng ta có mẫu

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

1 và muốn tìm trung bình của nó, thì trước tiên chúng ta sắp xếp mẫu thành

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

2. Trung bình sẽ là

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

3 vì đó là giá trị ở giữa.

Mặt khác, nếu chúng ta có mẫu

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

4, thì trung bình của nó sẽ là

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

5.

Chúng ta hãy xem làm thế nào chúng ta có thể sử dụng Python để tính toán trung bình.

Tìm trung vị với Python

Để tìm trung vị, trước tiên chúng ta cần sắp xếp các giá trị trong mẫu của chúng tôi. Chúng ta có thể đạt được điều đó bằng cách sử dụng hàm

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

6 tích hợp.

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

6 lấy một số lượng khác và trả về một

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8 được sắp xếp chứa cùng các giá trị của bản gốc có thể điều chỉnh được.

Bước thứ hai là định vị giá trị nằm ở giữa mẫu được sắp xếp. Để xác định giá trị đó trong một mẫu có số lượng quan sát lẻ, chúng ta có thể chia số lượng quan sát cho 2. Kết quả sẽ là chỉ số của giá trị ở giữa mẫu được sắp xếp.

Vì một toán tử phân chia (

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

9) trả về số float, chúng ta sẽ cần sử dụng toán tử phân chia sàn, (

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

0) để có được số nguyên. Vì vậy, chúng ta có thể sử dụng nó làm chỉ mục trong hoạt động lập chỉ mục (

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

1).

Nếu mẫu có số lượng quan sát chẵn, thì chúng ta cần xác định vị trí hai giá trị giữa. Giả sử chúng tôi có mẫu

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

4. Nếu chúng ta chia chiều dài của nó (

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

3) cho

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

4 bằng cách sử dụng một bộ phận sàn, thì chúng ta sẽ nhận được

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

3. Đó là chỉ số của giá trị trung lưu trên của chúng tôi (

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

6). Để tìm chỉ số giá trị trung lưu thấp hơn của chúng tôi (

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

3), chúng tôi có thể giảm chỉ số của giá trị trung lưu trên bằng

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

8.

Kiểm tra hướng dẫn thực hành của chúng tôi, thực tế để học Git, với các thực hành tốt nhất, các tiêu chuẩn được công nghiệp chấp nhận và bao gồm bảng gian lận. Ngừng các lệnh git googling và thực sự tìm hiểu nó!

Hãy đặt tất cả những thứ này lại với nhau trong chức năng tính toán trung bình của một mẫu. Đây là một triển khai có thể:

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

Hàm này lấy một mẫu các giá trị số và trả về trung bình của nó. Trước tiên chúng tôi tìm thấy độ dài của mẫu,

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

9. Sau đó, chúng tôi tính toán chỉ số của giá trị giữa (hoặc giá trị trung lưu trên) bằng cách chia

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

9 cho

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

4.

Tuyên bố

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

2 kiểm tra xem mẫu trong tay có số lượng quan sát lẻ. Nếu vậy, thì trung bình là giá trị tại

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

3.

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

4 cuối cùng chạy nếu mẫu có số lượng quan sát chẵn. Trong trường hợp đó, chúng tôi tìm thấy trung bình bằng cách tính giá trị trung bình của hai giá trị trung bình.

Lưu ý rằng hoạt động cắt

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

5 có hai giá trị. Giá trị tại

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

6 và giá trị tại

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

3 vì các hoạt động cắt loại trừ giá trị tại chỉ số cuối cùng (

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

8).

Sử dụng trung bình của Python ()

Python's

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

9 lấy một mẫu dữ liệu và trả về trung bình của nó. Đây là cách phương thức hoạt động:

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

Lưu ý rằng

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

0 tự động xử lý tính toán trung bình cho các mẫu có số lẻ hoặc số lượng quan sát chẵn.

Tìm chế độ của một mẫu

Chế độ là quan sát (hoặc quan sát) thường xuyên nhất trong một mẫu. Nếu chúng ta có mẫu

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

1, thì chế độ của nó là

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

4 vì

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

4 xuất hiện hai lần trong mẫu trong khi các phần tử khác chỉ xuất hiện một lần.

Chế độ không cần phải là duy nhất. Một số mẫu có nhiều hơn một chế độ. Giả sử chúng tôi có mẫu

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

4. Mẫu này có hai chế độ -

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

4 và

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

6 vì chúng là các giá trị xuất hiện thường xuyên hơn và cả hai xuất hiện cùng một số lần.

Chế độ thường được sử dụng cho dữ liệu phân loại. Các loại dữ liệu phân loại phổ biến là:

Boolean - chỉ có thể lấy hai giá trị như trong
>>> import statistics >>> statistics.mode([4, 1, 2, 2, 3, 5]) 2 >>> statistics.mode([4, 1, 2, 2, 3, 5, 4]) 4 >>> st.mode(["few", "few", "many", "some", "many"]) 'few'
7 hoặc
>>> import statistics >>> statistics.mode([4, 1, 2, 2, 3, 5]) 2 >>> statistics.mode([4, 1, 2, 2, 3, 5, 4]) 4 >>> st.mode(["few", "few", "many", "some", "many"]) 'few'
8,
>>> import statistics >>> statistics.mode([4, 1, 2, 2, 3, 5]) 2 >>> statistics.mode([4, 1, 2, 2, 3, 5, 4]) 4 >>> st.mode(["few", "few", "many", "some", "many"]) 'few'
9 hoặc
>>> import statistics >>> statistics.multimode([4, 1, 2, 2, 3, 5, 4]) [4, 2] >>> statistics.multimode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> st.multimode([4, 1, 2, 2, 3, 5]) [2]
0 - Can take only two values like in

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

7 or

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

8,

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

9 or

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

0

danh nghĩa - có thể mất nhiều hơn hai giá trị như trong
>>> import statistics >>> statistics.multimode([4, 1, 2, 2, 3, 5, 4]) [4, 2] >>> statistics.multimode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> st.multimode([4, 1, 2, 2, 3, 5]) [2]
1 - Can take more than two values like in

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

1

Ordinal - có thể mất nhiều hơn hai giá trị nhưng các giá trị có thứ tự hợp lý như trong
>>> import statistics >>> statistics.multimode([4, 1, 2, 2, 3, 5, 4]) [4, 2] >>> statistics.multimode(["few", "few", "many", "some", "many"]) ['few', 'many'] >>> st.multimode([4, 1, 2, 2, 3, 5]) [2]
2 - Can take more than two values but the values have a logical order like in

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

2

Khi chúng tôi phân tích dữ liệu dữ liệu phân loại, chúng tôi có thể sử dụng chế độ để biết danh mục nào là phổ biến nhất trong dữ liệu của chúng tôi.

Chúng ta có thể tìm thấy các mẫu không có chế độ. Nếu tất cả các quan sát là duy nhất (không có quan sát lặp đi lặp lại), thì mẫu của bạn sẽ không có chế độ.

Bây giờ chúng ta đã biết những điều cơ bản về chế độ, chúng ta hãy xem làm thế nào chúng ta có thể tìm thấy nó bằng Python.

Tìm chế độ với Python

Để tìm chế độ có Python, chúng tôi sẽ bắt đầu bằng cách đếm số lần xuất hiện của từng giá trị trong mẫu trong tay. Sau đó, chúng tôi sẽ nhận được (các) giá trị với số lần xuất hiện cao hơn.

Vì việc đếm các đối tượng là một hoạt động phổ biến, Python cung cấp lớp

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

3. Lớp này được thiết kế đặc biệt để đếm các đối tượng.

Lớp

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

4 cung cấp một phương thức được xác định là

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

5. Phương pháp này trả về một

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8 của các bộ hai mục với các yếu tố phổ biến

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

9 và số lượng tương ứng của chúng. Nếu

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

9 bị bỏ qua hoặc

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

9, thì statistics0 trả về tất cả các yếu tố.

Chúng ta hãy sử dụng

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

4 và statistics0 để mã hóa một hàm lấy mẫu dữ liệu và trả về chế độ của nó.

Đây là một triển khai có thể:

>>> from collections import Counter

>>> def my_mode(sample):
...     c = Counter(sample)
...     return [k for k, v in c.items() if v == c.most_common(1)[0][1]]
...

>>> my_mode(["male", "male", "female", "male"])
['male']

>>> my_mode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> my_mode([4, 1, 2, 2, 3, 5])
[2]

>>> my_mode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

Trước tiên, chúng tôi đếm các quan sát trong

>>> import statistics

>>> statistics.mean([4, 8, 6, 5, 3, 2, 8, 9, 2, 5])
5.2

2 bằng cách sử dụng đối tượng

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

4 (statistics5). Sau đó, chúng tôi sử dụng khả năng hiểu danh sách để tạo

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8 chứa các quan sát xuất hiện cùng một số lần trong mẫu.

Vì statistics7 trả về

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8 với một statistics9 của mẫu [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]0, chúng ta cần có được quan sát tại Index [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]1 trong

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8 và sau đó là mục tại Index

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

8 trong statistics9 lồng nhau. Điều này có thể được thực hiện với biểu thức [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]5. Giá trị đó là chế độ đầu tiên của mẫu của chúng tôi.

Lưu ý rằng điều kiện của sự hiểu biết so sánh số lượng của mỗi quan sát ([4, 8, 6, 5, 3, 2, 8, 9, 2, 5]6) với số lượng quan sát phổ biến nhất ([4, 8, 6, 5, 3, 2, 8, 9, 2, 5]5). Điều này sẽ cho phép chúng tôi có được nhiều quan sát ([4, 8, 6, 5, 3, 2, 8, 9, 2, 5]8) với cùng một số lượng trong trường hợp mẫu đa chế độ.

Sử dụng chế độ Python ()

Python's [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]9 mất một số sum()0 và trả về chế độ (đầu tiên) của nó. Hãy xem cách chúng ta có thể sử dụng nó:

>>> import statistics

>>> statistics.mode([4, 1, 2, 2, 3, 5])
2

>>> statistics.mode([4, 1, 2, 2, 3, 5, 4])
4

>>> st.mode(["few", "few", "many", "some", "many"])
'few'

Với một mẫu một chế độ, sum()1 của Python trả về giá trị phổ biến nhất,

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

4. Tuy nhiên, trong quá trình tiến hành hai ví dụ, nó đã trả lại

>>> import statistics

>>> statistics.median([3, 5, 1, 4, 2])
3

>>> statistics.median([3, 5, 1, 4, 2, 6])
3.5

6 và sum()4. Các mẫu này có các yếu tố khác xảy ra cùng một số lần, nhưng chúng không được bao gồm.

Vì Python 3.8, chúng tôi cũng có thể sử dụng sum()5, chấp nhận một điều đáng tin cậy và trả về

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8 của các chế độ.

Đây là một ví dụ về cách sử dụng sum()7:

>>> import statistics

>>> statistics.multimode([4, 1, 2, 2, 3, 5, 4])
[4, 2]

>>> statistics.multimode(["few", "few", "many", "some", "many"])
['few', 'many']

>>> st.multimode([4, 1, 2, 2, 3, 5])
[2]

Lưu ý: Hàm luôn trả về

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8, ngay cả khi bạn vượt qua mẫu một chế độ. The function always returns a

>>> def my_median(sample):
...     n = len(sample)
...     index = n // 2
...     # Sample with an odd number of observations
...     if n % 2:
...         return sorted(sample)[index]
...     # Sample with an even number of observations
...     return sum(sorted(sample)[index - 1:index + 1]) / 2
...

>>> my_median([3, 5, 1, 4, 2])
3

>>> my_median([3, 5, 1, 4, 2, 6])
3.5

8, even if you pass a single-mode sample.

Sự kết luận

Giá trị trung bình (hoặc trung bình), trung bình và chế độ thường là cái nhìn đầu tiên của chúng tôi về một mẫu dữ liệu khi chúng tôi cố gắng hiểu xu hướng trung tâm của dữ liệu.

Trong hướng dẫn này, chúng tôi đã học cách tìm hoặc tính toán giá trị trung bình, trung bình và chế độ sử dụng Python. Trước tiên chúng tôi đề cập đến từng bước, cách tạo các chức năng của riêng mình để tính toán chúng và sau đó là cách sử dụng mô-đun statistics của Python như một cách nhanh chóng để tìm các biện pháp này.

Làm thế nào để bạn tìm thấy ý nghĩa trong dữ liệu Python?

Phương thức trung bình () tính toán giá trị trung bình (trung bình) của tập dữ liệu đã cho.Mẹo: mean = Thêm tất cả các giá trị đã cho, sau đó chia cho bao nhiêu giá trị. calculates the mean (average) of the given data set. Tip: Mean = add up all the given values, then divide by how many values there are.

Làm thế nào để bạn tìm thấy tìm kiếm ý nghĩa?

Bạn có thể tìm thấy giá trị trung bình hoặc trung bình của một tập dữ liệu trong hai bước đơn giản: Tìm tổng của các giá trị bằng cách thêm tất cả chúng lên. Dưới tổng số bằng số lượng giá trị trong tập dữ liệu.Find the sum of the values by adding them all up. Divide the sum by the number of values in the data set.

Làm thế nào để bạn sử dụng trung bình trong Python?

Trong Python, chúng ta có thể tìm thấy trung bình của một danh sách bằng cách sử dụng hàm sum () và len ().SUM (): Sử dụng hàm SUM () Chúng ta có thể nhận được tổng của danh sách.hàm Len (): Len () được sử dụng để có độ dài hoặc số lượng phần tử trong danh sách.

Có nghĩa là gì bởi số trong Python?

Các loại dữ liệu số lưu trữ giá trị số.Chúng là các loại dữ liệu bất biến, có nghĩa là thay đổi giá trị của một loại dữ liệu số dẫn đến một đối tượng mới được phân bổ.Các đối tượng số được tạo khi bạn gán một giá trị cho chúng.Ví dụ - var1 = 1 var2 = 10.. They are immutable data types, means that changing the value of a number data type results in a newly allocated object. Number objects are created when you assign a value to them. For example − var1 = 1 var2 = 10.