Trung bình, phương sai, độ lệch, độ nhọn Python

động lượng

Một gói nhỏ tầm thường để tính toán giá trị trung bình đơn biến đang chạy, phương sai, độ nhọn và độ lệch

  • Không phụ thuộc. thậm chí không gọn gàng
  • không có lớp học. trừ khi bạn muốn chúng
  • Nhà nước là một lệnh, cho tuần tự hóa tầm thường
  • Đã thử nghiệm với scipy, creme, thống kê

Để cập nhật hiệp phương sai đa biến, có thể xem chính xác

Cài đặt

pip install momentum

Cách sử dụng. trung bình chạy, var

from momentum import var_init, var_update
from pprint import pprint

m = var_init()
for x in [5,3,2.4,1.0,5.0]:
    m = var_update(m,x)
pprint(m)

Cách sử dụng. trung bình chạy, var, kurtosis và skew

from momentum import kurtosis_init, kurtosis_update

m = kurtosis_init()
for x in [5,3,2.4,1.0,5.0]:
    m = kurtosis_update(m,x)
pprint(m)

Gửi một vấn đề nếu bạn cần thêm trợ giúp bằng cách này

Cách sử dụng. đang chạy trung bình có trọng số gần đây, var

from momentum import rvar_init, rvar_update
from pprint import pprint

m = rvar_init(rho=0.01,n=15)
for x in [5,3,2.4,1.0,5.0]:
    m = rvar_update(m,x)
pprint(m)

Điều này sẽ chuyển từ phương sai đang chạy sang phương sai có trọng số sau 15 điểm dữ liệu

Xác định cách xử lý khi đầu vào chứa nan. Có các tùy chọn sau (mặc định là 'lan truyền')

  • 'tuyên truyền'. trở về nan

  • 'nuôi'. ném một lỗi

  • 'bỏ sót'. thực hiện các tính toán bỏ qua các giá trị nan

Returnsnobs int hoặc ndarray của int

Số lượng quan sát (độ dài của dữ liệu dọc theo trục). Khi 'bỏ qua' được chọn là nan_policy, độ dài dọc theo mỗi lát cắt trục được tính riêng

nhỏ nhất lớn nhất. bộ ndarrays hoặc float

Giá trị nhỏ nhất và lớn nhất của a dọc theo trục đã cho

có nghĩa là ndarray hoặc float

Trung bình cộng của a dọc theo trục đã cho

phương sai ndarray hoặc float

Phương sai không chệch của a dọc theo trục đã cho;

độ lệch ndarray hoặc float

Độ lệch của a dọc theo trục đã cho, dựa trên tính toán mômen với mẫu số bằng số lượng quan sát, i. e. không có bậc tự do

độ nhọn ndarray hoặc float

Kurtosis (Fisher) của một dọc theo trục đã cho. Độ nhọn được chuẩn hóa sao cho nó bằng 0 đối với phân phối chuẩn. Không sử dụng bậc tự do

Thống kê mô tả — được sử dụng để hiểu dữ liệu của bạn bằng cách tính toán các giá trị thống kê khác nhau cho các biến số đã cho. Đối với bất kỳ dữ liệu cụ thể nào, cách tiếp cận của chúng tôi là hiểu dữ liệu đó và tính toán các giá trị thống kê khác nhau. Điều này sẽ giúp chúng tôi xác định các thử nghiệm thống kê khác nhau có thể được thực hiện trên dữ liệu được cung cấp. Hãy hiểu chi tiết hơn

Theo thống kê mô tả, chúng tôi có thể tính toán các giá trị sau

1. Xu hướng trung tâm - trung bình, trung bình, chế độ

2. Độ phân tán — phương sai, độ lệch chuẩn, phạm vi, phạm vi liên vùng (IQR)

3. Độ lệch - tính đối xứng của dữ liệu cùng với giá trị trung bình

4. Kurtosis - đỉnh của dữ liệu ở giá trị trung bình

Lưu ý- Tôi chưa đưa ra công thức toán học cho tất cả các giá trị này

Chúng tôi có các hàm do hệ thống xác định để nhận các giá trị này cho bất kỳ bộ dữ liệu cụ thể nào. Hãy hiểu những giá trị này và cách sử dụng kinh doanh của chúng

nhập gấu trúc dưới dạng pd

nhập numpy dưới dạng np

np. ngẫu nhiên. hạt giống(10)

dữ liệu = pd. Khung dữ liệu (np. ngẫu nhiên. randn(10,4),columns=list('ABCD'))

in (dữ liệu)

1. Tính toán xu hướng trung tâm

dữ liệu ['A']. bần tiện()

dữ liệu ['A']. Trung bình()

dữ liệu ['A']. cách thức()

#mean — là giá trị trung bình của các giá trị số đã cho

#median — là giá trị trung bình nhất của các giá trị đã cho

#mode — là giá trị xuất hiện thường xuyên nhất của các biến số đã cho

Tại sao chúng ta cần tính giá trị trung bình, trung bình và chế độ?

Những giá trị này sẽ giúp chúng tôi xác định khách hàng tiềm năng hoặc đối tượng mục tiêu của mình. Nếu một khách hàng/khách hàng mới đến có độ tuổi gần với độ tuổi trung bình của khách hàng phù hợp của bạn, thì bạn có thể nỗ lực hơn nữa để khiến họ hợp tác kinh doanh với bạn

Ví dụ — Nếu bạn xem TV, bạn có thể quan sát bất kỳ sản phẩm quảng cáo TV và diễn viên nào trong Quảng cáo, họ ở cùng nhóm tuổi. Vui lòng xem quảng cáo truyền hình bên dưới


2. phân tán

Độ phân tán được sử dụng để xác định biến thể có trong biến đã cho. Sự thay đổi có nghĩa là các giá trị gần hoặc xa giá trị trung bình như thế nào

Phương sai - nó cho độ lệch trung bình so với giá trị trung bình

Độ lệch chuẩn - đó là căn bậc hai của phương sai

Phạm vi - nó mang lại sự khác biệt giữa giá trị tối đa và tối thiểu

Phạm vi liên phần tư (IQR) — nó đưa ra sự khác biệt giữa Q3 và Q1, trong đó Q3 là giá trị Phần tư thứ 3 và Q1 là giá trị Phần tư thứ nhất

dữ liệu ['A']. biến ()

dữ liệu ['A']. tiêu chuẩn()

dữ liệu ['A']. max()-data[‘A’]. phút()

dữ liệu ['A']. lượng tử([. 25,. 5,. 75])

Tại sao chúng ta cần tính toán độ phân tán của biến đã cho?

Phương sai của biến đã cho sẽ giúp bạn có được phạm vi yêu cầu của khách hàng. h điều này có nghĩa là bạn biết khách hàng của tôi cần gì ở mức cao nhất và thấp nhất. Điều này sẽ giúp bạn hiểu được sự thay đổi trong yêu cầu của khách hàng và bạn duy trì khoảng không quảng cáo của mình cho phù hợp

3. độ lệch

Độ lệch được sử dụng để đo tính đối xứng của dữ liệu cùng với giá trị trung bình. Tính đối xứng có nghĩa là phân phối quan sát bằng nhau trên hoặc dưới giá trị trung bình

độ lệch = 0. nếu dữ liệu đối xứng cùng với giá trị trung bình

độ lệch = Tiêu cực. nếu dữ liệu không đối xứng và đuôi bên phải dài hơn đuôi bên trái của biểu đồ mật độ

độ lệch = Tích cực. nếu dữ liệu không đối xứng và đuôi bên trái dài hơn đuôi bên phải trong biểu đồ mật độ

Chúng ta có thể tìm thấy độ lệch của biến đã cho theo công thức đã cho bên dưới

dữ liệu ['A']. nghiêng()

4. gai nhọn

Độ nhọn được sử dụng để xác định độ nhọn (hoặc độ phẳng) của biểu đồ mật độ (biểu đồ phân bố chuẩn). Nhưng bạn nghiên cứu thêm về định nghĩa Kurtosis bạn sẽ Dr. Westfall và Tiến sĩ. Tên Donald Wheeler và định nghĩa của họ. Theo tiến sĩ. Wheeler định nghĩa độ nhọn được định nghĩa là. “Tham số kurtosis là phép đo trọng lượng kết hợp của đuôi so với phần còn lại của phân phối. ” Điều này có nghĩa là chúng tôi đo lường mức độ nặng nề của phân phối nhất định

nhọn = 0. nếu đỉnh của đồ thị bằng phân phối bình thường

nhọn = Tiêu cực. nếu đỉnh của đồ thị nhỏ hơn phân phối bình thường (ô phẳng)

nhọn = Tích cực. nếu đỉnh của đồ thị lớn hơn phân phối bình thường (biểu đồ có đỉnh cao hơn)

Chúng ta có thể tìm thấy độ nhọn của biến đã cho theo công thức đã cho dưới đây

dữ liệu ['A']. kurt()

Hãy xem biểu diễn đồ thị của biến đã cho và giải thích độ lệch và đỉnh của phân phối từ nó

nhập seaborn dưới dạng sns

sns. distplot(data[‘A’],hist=True,kde=True)

Trung bình, phương sai, độ lệch, độ nhọn Python
Biểu đồ mật độ của biến 'A'

Trong biểu đồ trên, chúng ta có thể thấy rõ rằng chúng ta ở phía dưới bên trái của đuôi nhiều hơn, vì vậy nó bị lệch trái (hoặc nó có độ lệch âm). Biểu đồ ở phía trên dòng có nghĩa là dữ liệu có biểu đồ phẳng. Điều này có nghĩa là độ nhọn của phân phối này là âm. trong trường hợp biểu đồ đường nằm trên biểu đồ thì độ nhọn được coi là dương

Cách chúng tôi đưa ra quyết định bằng cách xem các biểu đồ này

Độ lệch âm - điều này có nghĩa là chúng tôi có nhiều quan sát hơn dưới mức trung bình. Dữ liệu kết luận này có nhiều người thích sản phẩm có sản phẩm có giá trị trung bình thấp hơn. vì vậy bạn nên giữ thêm hàng dự trữ của sản phẩm có giá dưới trung bình

Độ nhọn dương - điều này có nghĩa là chúng tôi có nhiều dữ liệu đỉnh hơn so với bình thường. Điều này có nghĩa là sản phẩm của bạn thuộc danh mục cao cấp và bạn chỉ có phạm vi khách hàng hạn chế. Bạn có thể bán sản phẩm của mình mà không cần giảm giá. Nhưng trong trường hợp bạn phải giảm giá cho sản phẩm hoặc dịch vụ của mình để bán nó

Độ lệch phương sai và độ nhọn có nghĩa là gì?

Trong khuôn khổ trung bình-phương sai-độ lệch-độ nhọn, nghiên cứu này giải quyết nhiều mục tiêu danh mục đầu tư mâu thuẫn và cạnh tranh như tối đa hóa lợi nhuận kỳ vọng và độ lệch cũng như giảm thiểu rủi ro và độ nhọn, by construction of a polynomial goal programming (PGP) model into which investor preferences over ...

Python tính STD như thế nào?

Độ lệch chuẩn là căn bậc hai của giá trị trung bình của các bình phương độ lệch so với giá trị trung bình, i. e. , std = sqrt(mean(x)) , trong đó x = abs(a - a. nghĩa là())**2 . Độ lệch bình phương trung bình thường được tính là x. sum() / N , trong đó N = len(x).

Độ nhọn có giống như phương sai không?

Điều tôi muốn nhấn mạnh là phương sai không phải là độ nhọn . Phương sai thực sự trải rộng một phân phối, nhưng độ nhọn đo lường một cái gì đó khác biệt và thực hiện phép đo này với tham chiếu đến một đường cong bình thường với phương sai giống hệt nhau.

Python tính toán độ lệch như thế nào?

skew(array, axis=0, bias=True) tính toán độ lệch của tập dữ liệu. độ lệch = 0. phân phối chuẩn. độ lệch > 0. trọng lượng hơn ở đuôi bên trái của phân phối. độ lệch < 0. trọng lượng hơn ở đuôi bên phải của phân phối.