Hướng dẫn correlation score python - điểm tương quan python


Tương quan là một dấu hiệu về những thay đổi giữa hai biến. Trong các chương trước của chúng tôi, chúng tôi đã thảo luận về các hệ số tương quan Pearson, và tầm quan trọng của mối tương quan. Chúng ta có thể vẽ ma trận tương quan để hiển thị biến nào có mối tương quan cao hoặc thấp đối với biến khác.

Show

Nội dung chính ShowShow

  • Ma trận tương quan
  • Ma trận tương quan trong Python
  • Sử dụng một bản đồ nhiệt
  • Sử dụng Seaborn để tạo bản đồ nhiệt
  • Sử dụng một bản đồ nhiệt
  • Sử dụng Seaborn để tạo bản đồ nhiệt
  • Ma trận tương quan trong học máy là gì?
  • Làm thế nào để bạn thực hiện một ma trận tương quan trong Python?
  • Làm thế nào để bạn tìm thấy hệ số tương quan của một ma trận trong Python?

Tại sao chúng ta cần ma trận tương quan trong học máy?

Thí dụ

from matplotlib import pyplot
from pandas import read_csv
import numpy
Path = r"C:\pima-indians-diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(Path, names = names)
correlations = data.corr()
fig = pyplot.figure()
ax = fig.add_subplot(111)
cax = ax.matshow(correlations, vmin=-1, vmax=1)
fig.colorbar(cax)
ticks = numpy.arange(0,9,1)
ax.set_xticks(ticks)
ax.set_yticks(ticks)
ax.set_xticklabels(names)
ax.set_yticklabels(names)
pyplot.show()

Trong ví dụ sau, tập lệnh Python sẽ tạo ra và âm mưu ma trận tương quan cho bộ dữ liệu tiểu đường Ấn Độ PIMA. Nó có thể được tạo ra với chức năng trợ giúp của Corr () trên Pandas DataFrame và được vẽ với sự trợ giúp của pyplot.

Đầu ra

Machine_Learning_With_Python_Undermed_Data_With_Visualization.htm


Ma trận tương quan

Ma trận tương quan trong Python

Sử dụng một bản đồ nhiệt

Sử dụng Seaborn để tạo bản đồ nhiệt

Ma trận tương quan trong học máy là gì?

Observations:

  • Làm thế nào để bạn thực hiện một ma trận tương quan trong Python?
  • Làm thế nào để bạn tìm thấy hệ số tương quan của một ma trận trong Python?
  • Tại sao chúng ta cần ma trận tương quan trong học máy?

Ma trận tương quan trong Python

Sử dụng một bản đồ nhiệt

Tại sao chúng ta cần ma trận tương quan trong học máy?

Thí dụ
print(Corr_Matrix)

Trong ví dụ sau, tập lệnh Python sẽ tạo ra và âm mưu ma trận tương quan cho bộ dữ liệu tiểu đường Ấn Độ PIMA. Nó có thể được tạo ra với chức năng trợ giúp của Corr () trên Pandas DataFrame và được vẽ với sự trợ giúp của pyplot.

Output:



Sử dụng một bản đồ nhiệt

Sử dụng Seaborn để tạo bản đồ nhiệt

Ma trận tương quan trong học máy là gì?

Làm thế nào để bạn thực hiện một ma trận tương quan trong Python?


Sử dụng Seaborn để tạo bản đồ nhiệt

Ma trận tương quan trong học máy là gì?

Tại sao chúng ta cần ma trận tương quan trong học máy?

Thí dụ
import seaborn as sns

Trong ví dụ sau, tập lệnh Python sẽ tạo ra và âm mưu ma trận tương quan cho bộ dữ liệu tiểu đường Ấn Độ PIMA. Nó có thể được tạo ra với chức năng trợ giúp của Corr () trên Pandas DataFrame và được vẽ với sự trợ giúp của pyplot.

Đầu ra
correlation_full_health,
vmin=-1, vmax=1, center=0,
cmap=sns.diverging_palette(50, 500, n=500),
square=True
)

plt.show()

Trong ví dụ sau, tập lệnh Python sẽ tạo ra và âm mưu ma trận tương quan cho bộ dữ liệu tiểu đường Ấn Độ PIMA. Nó có thể được tạo ra với chức năng trợ giúp của Corr () trên Pandas DataFrame và được vẽ với sự trợ giúp của pyplot.

Sử dụng một bản đồ nhiệt

  • Sử dụng Seaborn để tạo bản đồ nhiệt
  • Ma trận tương quan trong học máy là gì?
  • Làm thế nào để bạn thực hiện một ma trận tương quan trong Python?
  • Sử dụng Seaborn để tạo bản đồ nhiệt
  • Ma trận tương quan trong học máy là gì?
  • Làm thế nào để bạn thực hiện một ma trận tương quan trong Python?

Làm thế nào để bạn tìm thấy hệ số tương quan của một ma trận trong Python?

  • Tại sao chúng ta cần ma trận tương quan trong học máy? larger the magnitude, stronger the correlation.
  • Thí dụ if positive, there is a regular correlation. If negative, there is an inverse correlation.

Trong ví dụ sau, tập lệnh Python sẽ tạo ra và âm mưu ma trận tương quan cho bộ dữ liệu tiểu đường Ấn Độ PIMA. Nó có thể được tạo ra với chức năng trợ giúp của Corr () trên Pandas DataFrame và được vẽ với sự trợ giúp của pyplot.

  1. Làm thế nào để bạn thực hiện một ma trận tương quan trong Python?
  2. Làm thế nào để bạn tìm thấy hệ số tương quan của một ma trận trong Python?

Làm thế nào để bạn tìm thấy hệ số tương quan của một ma trận trong Python?

Tại sao chúng ta cần ma trận tương quan trong học máy?

Thí dụSuppose an ice cream shop keeps track of total sales of ice creams versus the temperature on that day.

Python3

[[1.         0.95750662]
 [0.95750662 1.        ]]
01
[[1.         0.95750662]
 [0.95750662 1.        ]]
02

[[1.         0.95750662]
 [0.95750662 1.        ]]
03

[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
2
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
4
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
6
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
8
[[1.         0.95750662]
 [0.95750662 1.        ]]
3__

Các

[[1.         0.95750662]
 [0.95750662 1.        ]]
17
[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
40
[[1.         0.95750662]
 [0.95750662 1.        ]]
3____422
[[1.         0.95750662]
 [0.95750662 1.        ]]
66
[[1.         0.95750662]
 [0.95750662 1.        ]]
93
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
95
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
97
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
99
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
001
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
003
[[1.         0.95750662]
 [0.95750662 1.        ]]
004

[[1.         0.95750662]
 [0.95750662 1.        ]]
005

[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
007

[[1.         0.95750662]
 [0.95750662 1.        ]]
008
[[1.         0.95750662]
 [0.95750662 1.        ]]
009

Đầu ra

[[1.         0.95750662]
 [0.95750662 1.        ]]

Từ ma trận trên, nếu chúng ta thấy ô (0,1) và (1,0) đều có cùng giá trị bằng 0,95750662 khiến chúng ta kết luận rằng bất cứ khi nào nhiệt độ cao, chúng ta có doanh số cao hơn.

Ví dụ 2: Giả sử chúng ta được cho mức glucose ở cậu bé tương ứng với tuổi. Tìm mối tương quan giữa tuổi (x) và mức glucose trong cơ thể (y).Suppose we are given glucose level in boy respective to age. Find correlation between age(x) and glucose level in body(y).Suppose we are given glucose level in boy respective to age. Find correlation between age(x) and glucose level in body(y).

Python3

[[1.         0.95750662]
 [0.95750662 1.        ]]
01
[[1.         0.95750662]
 [0.95750662 1.        ]]
02

[[1.         0.95750662]
 [0.95750662 1.        ]]
03

[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
2
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
4
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
6
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
8
[[1.         0.95750662]
 [0.95750662 1.        ]]
3__

Các

[[1.         0.95750662]
 [0.95750662 1.        ]]
005

[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
007

[[1.         0.95750662]
 [0.95750662 1.        ]]
008
[[1.         0.95750662]
 [0.95750662 1.        ]]
009

Đầu ra

[[1.         0.95750662]
 [0.95750662 1.        ]]
6

Từ ma trận trên, nếu chúng ta thấy ô (0,1) và (1,0) đều có cùng giá trị bằng 0,95750662 khiến chúng ta kết luận rằng bất cứ khi nào nhiệt độ cao, chúng ta có doanh số cao hơn.

Ví dụ 2: Giả sử chúng ta được cho mức glucose ở cậu bé tương ứng với tuổi. Tìm mối tương quan giữa tuổi (x) và mức glucose trong cơ thể (y).Suppose we are given glucose level in boy respective to age. Find correlation between age(x) and glucose level in body(y).

[[1.         0.95750662]
 [0.95750662 1.        ]]
03

[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
2
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
4
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
6
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
8
[[1.         0.95750662]
 [0.95750662 1.        ]]
3__

Ví dụ 2: Giả sử chúng ta được cho mức glucose ở cậu bé tương ứng với tuổi. Tìm mối tương quan giữa tuổi (x) và mức glucose trong cơ thể (y).7
[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
030
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
032 ____13____94
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
036
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
038____13
[[1.         0.95750662]
 [0.95750662 1.        ]]
00
[[1.         0.95750662]
 [0.95750662 1.        ]]
004

Python3

[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
015
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
0177____13
[[1.         0.95750662]
 [0.95750662 1.        ]]
019
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
021
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
023______13____855

[[1.         0.95750662]
 [0.95750662 1.        ]]
17
[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
030
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
032 ____13____94
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
036
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
038____13
[[1.         0.95750662]
 [0.95750662 1.        ]]
00
[[1.         0.95750662]
 [0.95750662 1.        ]]
004

Từ ma trận tương quan ở trên, 0,5298089 hoặc 52,98% có nghĩa là biến có mối tương quan tích cực vừa phải.

Phương pháp 2: Tạo ma trận tương quan bằng Thư viện Pandas & NBSP;

[[1.         0.95750662]
 [0.95750662 1.        ]]
12
[[1.         0.95750662]
 [0.95750662 1.        ]]
39
[[1.         0.95750662]
 [0.95750662 1.        ]]
14
[[1.         0.95750662]
 [0.95750662 1.        ]]
41
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
43
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
45
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
017
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
49
[[1.         0.95750662]
 [0.95750662 1.        ]]
004
[[1.         0.95750662]
 [0.95750662 1.        ]]
51

[[1.         0.95750662]
 [0.95750662 1.        ]]
12
[[1.         0.95750662]
 [0.95750662 1.        ]]
13
[[1.         0.95750662]
 [0.95750662 1.        ]]
14
[[1.         0.95750662]
 [0.95750662 1.        ]]
15
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
17
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
021
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
21
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
23
[[1.         0.95750662]
 [0.95750662 1.        ]]
16

[[1.         0.95750662]
 [0.95750662 1.        ]]
008

[[1.         0.95750662]
 [0.95750662 1.        ]]
64
[[1.         0.95750662]
 [0.95750662 1.        ]]
65
[[1.         0.95750662]
 [0.95750662 1.        ]]
66

[[1.         0.95750662]
 [0.95750662 1.        ]]
008

[[1.         0.95750662]
 [0.95750662 1.        ]]
68

[[1.         0.95750662]
 [0.95750662 1.        ]]
01

[[1.         0.95750662]
 [0.95750662 1.        ]]
08

[[1.         0.95750662]
 [0.95750662 1.        ]]
008

[[1.         0.95750662]
 [0.95750662 1.        ]]
64
[[1.         0.95750662]
 [0.95750662 1.        ]]
74
[[1.         0.95750662]
 [0.95750662 1.        ]]
66

Để tạo một ma trận tương quan cho một bộ dữ liệu nhất định, chúng tôi sử dụng phương thức Corr () trên DataFrames.

 Output:Output:Output:

[[1.         0.95750662]
 [0.95750662 1.        ]]
1

Ví dụ 1:09____10
[[1.         0.95750662]
 [0.95750662 1.        ]]
11

[[1.         0.95750662]
 [0.95750662 1.        ]]
112
[[1.         0.95750662]
 [0.95750662 1.        ]]
26
[[1.         0.95750662]
 [0.95750662 1.        ]]
14
[[1.         0.95750662]
 [0.95750662 1.        ]]
28
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
30
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
32
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
34__12
[[1.         0.95750662]
 [0.95750662 1.        ]]
26
[[1.         0.95750662]
 [0.95750662 1.        ]]
14
[[1.         0.95750662]
 [0.95750662 1.        ]]
28
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
30
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
32
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
34__

Python3

[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
015
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
0177____13
[[1.         0.95750662]
 [0.95750662 1.        ]]
019
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
021
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
023______13____855

[[1.         0.95750662]
 [0.95750662 1.        ]]
17
[[1.         0.95750662]
 [0.95750662 1.        ]]
0
[[1.         0.95750662]
 [0.95750662 1.        ]]
1
[[1.         0.95750662]
 [0.95750662 1.        ]]
030
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
032 ____13____94
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
036
[[1.         0.95750662]
 [0.95750662 1.        ]]
3
[[1.         0.95750662]
 [0.95750662 1.        ]]
038____13
[[1.         0.95750662]
 [0.95750662 1.        ]]
00
[[1.         0.95750662]
 [0.95750662 1.        ]]
004

[[1.         0.95750662]
 [0.95750662 1.        ]]
008

[[1.         0.95750662]
 [0.95750662 1.        ]]
68

[[1.         0.95750662]
 [0.95750662 1.        ]]
01

[[1.         0.95750662]
 [0.95750662 1.        ]]
08

[[1.         0.95750662]
 [0.95750662 1.        ]]
008

[[1.         0.95750662]
 [0.95750662 1.        ]]
64
[[1.         0.95750662]
 [0.95750662 1.        ]]
92
[[1.         0.95750662]
 [0.95750662 1.        ]]
66

[[1.         0.95750662]
 [0.95750662 1.        ]]
008
[[1.         0.95750662]
 [0.95750662 1.        ]]
009

Output:

Từ ma trận tương quan ở trên, 0,5298089 hoặc 52,98% có nghĩa là biến có mối tương quan tích cực vừa phải.

Ma trận tương quan trong học máy là gì?

Phương pháp 2: Tạo ma trận tương quan bằng Thư viện Pandas & NBSP;a table showing the correlation coefficients between variables. Here, the variables are represented in the first row, and in the first column: The table above has used data from the full health data set.

[[1. 0.95750662] [0.95750662 1. ]]12 [[1. 0.95750662] [0.95750662 1. ]]13[[1. 0.95750662] [0.95750662 1. ]]14[[1. 0.95750662] [0.95750662 1. ]]15[[1. 0.95750662] [0.95750662 1. ]]3[[1. 0.95750662] [0.95750662 1. ]]17[[1. 0.95750662] [0.95750662 1. ]]3[[1. 0.95750662] [0.95750662 1. ]]021[[1. 0.95750662] [0.95750662 1. ]]3[[1. 0.95750662] [0.95750662 1. ]]21[[1. 0.95750662] [0.95750662 1. ]]3[[1. 0.95750662] [0.95750662 1. ]]23[[1. 0.95750662] [0.95750662 1. ]]16

Để tạo một ma trận tương quan cho một bộ dữ liệu nhất định, chúng tôi sử dụng phương thức Corr () trên DataFrames..

Ví dụ 1:

[[1.         0.95750662]
 [0.95750662 1.        ]]
008
[[1.         0.95750662]
 [0.95750662 1.        ]]
009

[[1.         0.95750662]
 [0.95750662 1.        ]]
109____10
[[1.         0.95750662]
 [0.95750662 1.        ]]
11

[[1.         0.95750662]
 [0.95750662 1.        ]]
4Ma trận tương quan trong học máy là gì?

Một ma trận là một mảng các số được sắp xếp theo hàng và cột. Một ma trận tương quan chỉ đơn giản là một bảng hiển thị các hệ số tương quan giữa các biến. Ở đây, các biến được biểu diễn trong hàng đầu tiên và trong cột đầu tiên: Bảng trên đã sử dụng dữ liệu từ tập dữ liệu sức khỏe đầy đủ.a table showing the correlation coefficients between variables. Here, the variables are represented in the first row, and in the first column: The table above has used data from the full health data set.

Làm thế nào để bạn thực hiện một ma trận tương quan trong Python?using corrcoef() method from Numpy. The input for this function is typically a matrix, say of size mxn , where: Each column represents the values of a random variable. Each row represents a single sample of n random variables.

Các bước để tạo một ma trận tương quan bằng gấu trúc..

Bước 1: Thu thập dữ liệu. ....to summarize data, as an input into a more advanced analysis, and as a diagnostic for advanced analyses.