Khoảng tin cậy biểu đồ phân tán Python

Sổ ghi chép tính toán khoảng tin cậy với bootstrapping và hồi quy lượng tử cho một vấn đề đơn giản

from jyquickhelper import add_notebook_menu
add_notebook_menu()

  • Một số dữ liệu

  • Khoảng tin cậy với hồi quy tuyến tính

  • Khoảng tin cậy cao hơn

  • Với cây quyết định

  • lượng tử hồi quy

  • với sinh vật biển

  • GaussianProcessRegressor

%matplotlib inline

import warnings
warnings.simplefilter("ignore")

Một số dữ liệu#

Dữ liệu theo công thức.

Khoảng tin cậy biểu đồ phân tán Python
. Tiếng ồn tuân theo luật
Khoảng tin cậy biểu đồ phân tán Python
,
Khoảng tin cậy biểu đồ phân tán Python
,
Khoảng tin cậy biểu đồ phân tán Python
. Phần thứ hai của tiếng ồn thêm một số tiếng ồn lớn hơn nhưng không phải lúc nào cũng vậy.

from numpy.random import randn, binomial, rand
N = 200
X = rand(N, 1) * 2
eps = randn(N, 1) * 0.2
eps2 = randn(N, 1) + 1
bin = binomial(2, 0.05, size=(N, 1))
y = (0.5 * X + eps + 2 + eps2 * bin).ravel()

import matplotlib.pyplot as plt
fig, ax = plt.subplots(1, 1, figsize=(4, 4))
ax.plot(X, y, '.');

Khoảng tin cậy biểu đồ phân tán Python

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y)

Khoảng tin cậy với hồi quy tuyến tính#

Đối tượng phù hợp nhiều lần với cùng một người học, mọi quá trình đào tạo được thực hiện dựa trên việc lấy mẫu lại tập dữ liệu đào tạo

from mlinsights.mlmodel import IntervalRegressor
from sklearn.linear_model import LinearRegression

lin = IntervalRegressor(LinearRegression())
lin.fit(X_train, y_train)

IntervalRegressor(estimator=LinearRegression())

________số 8

fig, ax = plt.subplots(1, 1, figsize=(4, 4))
ax.plot(X_test, y_test, '.', label="raw")
ax.plot(sorted_X, pred, label="prediction")
ax.plot(sorted_X, min_pred, '--', label="min")
ax.plot(sorted_X, max_pred, '--', label="max")
ax.legend();

Khoảng tin cậy biểu đồ phân tán Python

Khoảng tin cậy cao hơn #

Có thể sử dụng mẫu lại nhỏ hơn của tập dữ liệu huấn luyện hoặc chúng ta có thể tăng số lượng mẫu lại

%matplotlib inline
0

%matplotlib inline
1

%matplotlib inline
2

%matplotlib inline
3

%matplotlib inline
4

%matplotlib inline
5

%matplotlib inline
6

Khoảng tin cậy biểu đồ phân tán Python

Với cây quyết định#

%matplotlib inline
7

%matplotlib inline
8

%matplotlib inline
9

import warnings
warnings.simplefilter("ignore")
0

Khoảng tin cậy biểu đồ phân tán Python

Trong trường hợp đó, dự đoán rất giống với dự đoán mà một khu rừng ngẫu nhiên sẽ tạo ra vì đây là dự đoán trung bình của 10 cây

Phân vị hồi quy #

Cách cuối cùng cố gắng khớp hai hồi quy cho lượng tử 0. 05 và 0. 95

import warnings
warnings.simplefilter("ignore")
1

import warnings
warnings.simplefilter("ignore")
2

Khoảng tin cậy biểu đồ phân tán Python

Với một mô hình phi tuyến tính… nhưng mô hình QuantileMLPRegressor chỉ thực hiện hồi quy với lượng tử 0. 5

Với sinh biển #

Nó sử dụng một cách lý thuyết để tính khoảng tin cậy bằng cách tính khoảng tin cậy trên các tham số trước

import warnings
warnings.simplefilter("ignore")
3

Khoảng tin cậy biểu đồ phân tán Python

GaussianProcessRegressor#

Tùy chọn cuối cùng với ví dụ hồi quy Quy trình Gaussian này. ví dụ giới thiệu cơ bản tính toán độ lệch chuẩn cho mọi dự đoán. Sau đó, nó có thể được sử dụng để hiển thị một khoảng tin cậy

Hàm Python nào sẽ cho khoảng tin cậy 95%?

hàm ppf . Các lập luận cho t. ppf() là q = phần trăm, df = bậc tự do, scale = std dev, loc = mean. Vì phân phối t đối xứng với khoảng tin cậy 95% nên q sẽ bằng 0. 975.

Khoảng tin cậy trong biểu đồ đường là gì?

Khoảng tin cậy cho chúng tôi biết điều đó có ý nghĩa gì đối với điểm dữ liệu của chúng tôi , e. g. , "giữa 4. 50 và 5. 10". ) Để đảm bảo người đọc có được hình ảnh chân thực của dữ liệu, sẽ rất có ý nghĩa khi hình dung mức độ không chắc chắn của dữ liệu.

Seaborn tính toán khoảng tin cậy như thế nào?

Đó là về Matplotlib; . Về bản chất, đó là một phương pháp lấy mẫu lại nhiều lần từ một mẫu dân số , đưa ra ước tính chính xác về giá trị trung bình thực và độ tin cậy 95%.

Khoảng tin cậy trong Regplot là gì?

Tương tự như lineplot(), hàm regplot() sử dụng khoảng tin cậy 95% theo mặc định nhưng có thể chỉ định mức tin cậy sẽ sử dụng .