Sổ ghi chép tính toán khoảng tin cậy với bootstrapping và hồi quy lượng tử cho một vấn đề đơn giản Show
from jyquickhelper import add_notebook_menu add_notebook_menu()
%matplotlib inline import warnings warnings.simplefilter("ignore") Một số dữ liệu#Dữ liệu theo công thức. . Tiếng ồn tuân theo luật , , . Phần thứ hai của tiếng ồn thêm một số tiếng ồn lớn hơn nhưng không phải lúc nào cũng vậy.from numpy.random import randn, binomial, rand N = 200 X = rand(N, 1) * 2 eps = randn(N, 1) * 0.2 eps2 = randn(N, 1) + 1 bin = binomial(2, 0.05, size=(N, 1)) y = (0.5 * X + eps + 2 + eps2 * bin).ravel() import matplotlib.pyplot as plt fig, ax = plt.subplots(1, 1, figsize=(4, 4)) ax.plot(X, y, '.'); from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y) Khoảng tin cậy với hồi quy tuyến tính#Đối tượng phù hợp nhiều lần với cùng một người học, mọi quá trình đào tạo được thực hiện dựa trên việc lấy mẫu lại tập dữ liệu đào tạo from mlinsights.mlmodel import IntervalRegressor from sklearn.linear_model import LinearRegression lin = IntervalRegressor(LinearRegression()) lin.fit(X_train, y_train) IntervalRegressor(estimator=LinearRegression()) ________số 8 fig, ax = plt.subplots(1, 1, figsize=(4, 4)) ax.plot(X_test, y_test, '.', label="raw") ax.plot(sorted_X, pred, label="prediction") ax.plot(sorted_X, min_pred, '--', label="min") ax.plot(sorted_X, max_pred, '--', label="max") ax.legend(); Khoảng tin cậy cao hơn #Có thể sử dụng mẫu lại nhỏ hơn của tập dữ liệu huấn luyện hoặc chúng ta có thể tăng số lượng mẫu lại %matplotlib inline0 %matplotlib inline1 %matplotlib inline2 %matplotlib inline3 %matplotlib inline4 %matplotlib inline5 %matplotlib inline6 Với cây quyết định#%matplotlib inline7 %matplotlib inline8 %matplotlib inline9 import warnings warnings.simplefilter("ignore")0 Trong trường hợp đó, dự đoán rất giống với dự đoán mà một khu rừng ngẫu nhiên sẽ tạo ra vì đây là dự đoán trung bình của 10 cây Phân vị hồi quy #Cách cuối cùng cố gắng khớp hai hồi quy cho lượng tử 0. 05 và 0. 95 import warnings warnings.simplefilter("ignore")1 import warnings warnings.simplefilter("ignore")2 Với một mô hình phi tuyến tính… nhưng mô hình QuantileMLPRegressor chỉ thực hiện hồi quy với lượng tử 0. 5 Với sinh biển #Nó sử dụng một cách lý thuyết để tính khoảng tin cậy bằng cách tính khoảng tin cậy trên các tham số trước import warnings warnings.simplefilter("ignore")3 GaussianProcessRegressor#Tùy chọn cuối cùng với ví dụ hồi quy Quy trình Gaussian này. ví dụ giới thiệu cơ bản tính toán độ lệch chuẩn cho mọi dự đoán. Sau đó, nó có thể được sử dụng để hiển thị một khoảng tin cậy Hàm Python nào sẽ cho khoảng tin cậy 95%?hàm ppf . Các lập luận cho t. ppf() là q = phần trăm, df = bậc tự do, scale = std dev, loc = mean. Vì phân phối t đối xứng với khoảng tin cậy 95% nên q sẽ bằng 0. 975.
Khoảng tin cậy trong biểu đồ đường là gì?Khoảng tin cậy cho chúng tôi biết điều đó có ý nghĩa gì đối với điểm dữ liệu của chúng tôi , e. g. , "giữa 4. 50 và 5. 10". ) Để đảm bảo người đọc có được hình ảnh chân thực của dữ liệu, sẽ rất có ý nghĩa khi hình dung mức độ không chắc chắn của dữ liệu.
Seaborn tính toán khoảng tin cậy như thế nào?Đó là về Matplotlib; . Về bản chất, đó là một phương pháp lấy mẫu lại nhiều lần từ một mẫu dân số , đưa ra ước tính chính xác về giá trị trung bình thực và độ tin cậy 95%.
Khoảng tin cậy trong Regplot là gì?Tương tự như lineplot(), hàm regplot() sử dụng khoảng tin cậy 95% theo mặc định nhưng có thể chỉ định mức tin cậy sẽ sử dụng . |