Mô hình trạng thái python có tốt không?

Phân tích hồi quy tuyến tính là một kỹ thuật thống kê để dự đoán giá trị của một biến (biến phụ thuộc) dựa trên giá trị của biến khác (biến độc lập). Biến phụ thuộc là biến mà chúng ta muốn dự đoán hoặc dự báo. Trong hồi quy tuyến tính đơn giản, có một biến độc lập được sử dụng để dự đoán một biến phụ thuộc duy nhất. Trong trường hợp hồi quy đa tuyến, có nhiều hơn một biến độc lập. Biến độc lập là biến bạn đang sử dụng để dự báo giá trị của biến khác. Các mô hình nhà nước. hồi quy. linear_model. Phương pháp OLS được sử dụng để thực hiện hồi quy tuyến tính. Phương trình tuyến tính có dạng

Mô hình trạng thái python có tốt không?

cú pháp. mô hình nhà nước. hồi quy. linear_model. OLS(even, exog=None, missing=’none’, hasconst=None, **kwargs)

Thông số.  

  • thậm chí. mảng giống như đối tượng.  
  • ngoại lệ. mảng giống như đối tượng.  
  • còn thiếu. str. Không, giảm và tăng là các lựa chọn thay thế có sẵn. Nếu giá trị là 'không', thì không có thử nghiệm nan nào được thực hiện. Mọi quan sát có nans đều bị hủy nếu chọn 'thả'. Sẽ xảy ra lỗi nếu sử dụng 'raise'. 'không' là mặc định
  • hasconst. Không hoặc Bool. Cho biết liệu hằng số do người dùng cung cấp có được bao gồm trong RHS hay không. Nếu Đúng, hằng số k được đặt thành 1 và tất cả thống kê kết quả được tính như thể có hằng số. Nếu Sai, hằng số k được đặt thành 0 và không có hằng số nào được xác minh
  • **kwargs. Khi sử dụng giao diện công thức, các đối số bổ sung được sử dụng để đặt các đặc điểm của mô hình

Trở lại. Bình phương nhỏ nhất thông thường được trả về

Cài đặt

pip install numpy
pip install pandas
pip install statsmodels

Từng bước thực hiện

Bước 1. gói nhập khẩu

Nhập các gói cần thiết là bước đầu tiên của mô hình hóa. Các gói mô hình gấu trúc, NumPy và thống kê được nhập

import numpy as np
import pandas as pd
import statsmodels.api as sm

Bước 2. Đang tải dữ liệu

Để truy cập tệp CSV, hãy nhấp vào đây. Tệp CSV được đọc bằng pandas. phương thức read_csv(). Phần đầu hoặc năm hàng đầu tiên của tập dữ liệu được trả về bằng cách sử dụng phương thức head(). Kích thước đầu và trọng lượng não là các cột

Python3




df= pd.read_csv('headbrain1.csv')

df.head()

Phần đầu của khung dữ liệu trông như thế này

Mô hình trạng thái python có tốt không?

 

Trực quan hóa dữ liệu

Bằng cách sử dụng các gói matplotlib và seaborn, chúng tôi trực quan hóa dữ liệu. vân vân. Hàm regplot() giúp chúng ta tạo biểu đồ hồi quy

Python3




# import packages

pip install numpy
pip install pandas
pip install statsmodels
0
pip install numpy
pip install pandas
pip install statsmodels
1

pip install numpy
pip install pandas
pip install statsmodels
0
pip install numpy
pip install pandas
pip install statsmodels
3

pip install numpy
pip install pandas
pip install statsmodels
0
pip install numpy
pip install pandas
pip install statsmodels
5

 

df= pd.read_csv('headbrain1.csv')

import numpy as np
import pandas as pd
import statsmodels.api as sm
1
import numpy as np
import pandas as pd
import statsmodels.api as sm
2
import numpy as np
import pandas as pd
import statsmodels.api as sm
3_______2_______4
import numpy as np
import pandas as pd
import statsmodels.api as sm
5=2_______7

 

import numpy as np
import pandas as pd
import statsmodels.api as sm
8

đầu ra

Mô hình trạng thái python có tốt không?

 

Bước 3. Đặt giả thuyết

  • Giả thuyết không (H0). Không có mối quan hệ giữa kích thước đầu và trọng lượng não
  • Giả thuyết thay thế (Ha). Có mối quan hệ giữa kích thước đầu và trọng lượng não

Bước 4. lắp mô hình

mô hình nhà nước. hồi quy. linear_model. Phương thức OLS() được sử dụng để lấy bình phương nhỏ nhất thông thường và phương thức fit() được sử dụng để khớp dữ liệu trong đó. Phương thức ols lấy dữ liệu và thực hiện hồi quy tuyến tính. chúng tôi cung cấp các cột phụ thuộc và độc lập ở định dạng này

cột độc lập ~ cột phụ thuộc.  

bên trái của toán tử ~ chứa các biến độc lập và bên phải của toán tử chứa tên của biến phụ thuộc hoặc cột dự đoán

Python3




import numpy as np
import pandas as pd
import statsmodels.api as sm
9= df1df2
import numpy as np
import pandas as pd
import statsmodels.api as sm
3df4df5

df6= df8=27_______0

import numpy as np
import pandas as pd
import statsmodels.api as sm
5=27_______3

Bước 5. Tóm tắt mô hình

Tất cả các thống kê tóm tắt của mô hình hồi quy tuyến tính được trả về bởi mô hình. phương pháp tóm tắt (). Giá trị p và nhiều giá trị/thống kê khác được biết bằng phương pháp này. Dự đoán về dữ liệu được tìm thấy bởi mô hình. phương pháp tóm tắt ()

Python3




=4=5

Triển khai mã

Python3




# import packages

pip install numpy
pip install pandas
pip install statsmodels
0 =8

pip install numpy
pip install pandas
pip install statsmodels
0
pip install numpy
pip install pandas
pip install statsmodels
1

pip install numpy
pip install pandas
pip install statsmodels
0 pd.read_csv(2

 

pd.read_csv(3

df= pd.read_csv('headbrain1.csv')

=4'headbrain1.csv'0

 

'headbrain1.csv'1

import numpy as np
import pandas as pd
import statsmodels.api as sm
9= df1df2
import numpy as np
import pandas as pd
import statsmodels.api as sm
3df4df5

df6= df8=27_______0

import numpy as np
import pandas as pd
import statsmodels.api as sm
5=27_______3

 

)7

=4=5

đầu ra

Mô hình trạng thái python có tốt không?

 

Mô tả một số thuật ngữ trong bảng

  • Giá trị bình phương R. Giá trị bình phương R nằm trong khoảng từ 0 đến 1. R-squared là 100 phần trăm chỉ ra rằng tất cả những thay đổi trong biến phụ thuộc hoàn toàn được giải thích bởi những thay đổi trong (các) biến độc lập. nếu chúng tôi nhận được 1 dưới dạng giá trị r bình phương, điều đó có nghĩa là có một sự phù hợp hoàn hảo. Trong ví dụ của chúng ta, giá trị r-squared là 0. 638.  
  • thống kê F. Thống kê F chỉ đơn giản là so sánh tác động kết hợp của tất cả các biến. Nói một cách đơn giản nhất, hãy bác bỏ giả thuyết không nếu mức alpha của bạn lớn hơn giá trị p của bạn.  
  • coeff. các hệ số của các biến độc lập trong phương trình hồi quy

dự đoán của chúng tôi

Nếu chúng ta lấy mức ý nghĩa (alpha) là 0. 05, chúng tôi bác bỏ giả thuyết khống và chấp nhận giả thuyết thay thế là p