Phân tích hồi quy tuyến tính là một kỹ thuật thống kê để dự đoán giá trị của một biến (biến phụ thuộc) dựa trên giá trị của biến khác (biến độc lập). Biến phụ thuộc là biến mà chúng ta muốn dự đoán hoặc dự báo. Trong hồi quy tuyến tính đơn giản, có một biến độc lập được sử dụng để dự đoán một biến phụ thuộc duy nhất. Trong trường hợp hồi quy đa tuyến, có nhiều hơn một biến độc lập. Biến độc lập là biến bạn đang sử dụng để dự báo giá trị của biến khác. Các mô hình nhà nước. hồi quy. linear_model. Phương pháp OLS được sử dụng để thực hiện hồi quy tuyến tính. Phương trình tuyến tính có dạng
Cài đặtpip install numpy pip install pandas pip install statsmodels Từng bước thực hiệnBước 1. gói nhập khẩu Nhập các gói cần thiết là bước đầu tiên của mô hình hóa. Các gói mô hình gấu trúc, NumPy và thống kê được nhập import numpy as np import pandas as pd import statsmodels.api as sm Bước 2. Đang tải dữ liệu Để truy cập tệp CSV, hãy nhấp vào đây. Tệp CSV được đọc bằng pandas. phương thức read_csv(). Phần đầu hoặc năm hàng đầu tiên của tập dữ liệu được trả về bằng cách sử dụng phương thức head(). Kích thước đầu và trọng lượng não là các cột Python3
Phần đầu của khung dữ liệu trông như thế này
Trực quan hóa dữ liệu Bằng cách sử dụng các gói matplotlib và seaborn, chúng tôi trực quan hóa dữ liệu. vân vân. Hàm regplot() giúp chúng ta tạo biểu đồ hồi quy Python3
pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels1 pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels3 pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels5
import numpy as np import pandas as pd import statsmodels.api as sm1 import numpy as np import pandas as pd import statsmodels.api as sm2 import numpy as np import pandas as pd import statsmodels.api as sm3_______2_______4 import numpy as np import pandas as pd import statsmodels.api as sm5 = 2_______7
import numpy as np import pandas as pd import statsmodels.api as sm8 đầu ra
Bước 3. Đặt giả thuyết
Bước 4. lắp mô hình mô hình nhà nước. hồi quy. linear_model. Phương thức OLS() được sử dụng để lấy bình phương nhỏ nhất thông thường và phương thức fit() được sử dụng để khớp dữ liệu trong đó. Phương thức ols lấy dữ liệu và thực hiện hồi quy tuyến tính. chúng tôi cung cấp các cột phụ thuộc và độc lập ở định dạng này
Python3import numpy as np import pandas as pd import statsmodels.api as sm9 = df 1df 2import numpy as np import pandas as pd import statsmodels.api as sm3 df 4df 5
import numpy as np import pandas as pd import statsmodels.api as sm5 = 27_______3Bước 5. Tóm tắt mô hình Tất cả các thống kê tóm tắt của mô hình hồi quy tuyến tính được trả về bởi mô hình. phương pháp tóm tắt (). Giá trị p và nhiều giá trị/thống kê khác được biết bằng phương pháp này. Dự đoán về dữ liệu được tìm thấy bởi mô hình. phương pháp tóm tắt () Python3
Triển khai mãPython3
pip install numpy pip install pandas pip install statsmodels0 = 8pip install numpy pip install pandas pip install statsmodels0 pip install numpy pip install pandas pip install statsmodels1 pip install numpy pip install pandas pip install statsmodels0 pd.read_csv( 2
import numpy as np import pandas as pd import statsmodels.api as sm9 = df 1df 2import numpy as np import pandas as pd import statsmodels.api as sm3 df 4df 5
import numpy as np import pandas as pd import statsmodels.api as sm5 = 27_______3
đầu ra
Mô tả một số thuật ngữ trong bảng
dự đoán của chúng tôiNếu chúng ta lấy mức ý nghĩa (alpha) là 0. 05, chúng tôi bác bỏ giả thuyết khống và chấp nhận giả thuyết thay thế là p |