Bản đồ sơ đồ python

Nhân dịp những ngày cuối năm Kỷ Hợi mình xin cảm ơn mọi người đã đọc bài viblo của mình trong một năm vừa qua. Và mình xin kính chúc tất cả mọi người một năm mới " Vạn Sự Như Ý, An Khang Thịnh Vượng"

Tiếp tục với bài viết thôi nào =)). Ở bài viết lần này mình sẽ chia sẻ về việc Visualization trong data như thế nào. Tuy nhiên ở bài viết này mình sẽ sử dụng plotly thay vì matplotlib hay seaborn. Thứ nhất bởi vì mình cảm thấy nó khá là thú vị. v những cái gì mà càng trực quan thì càng làm cho chúng ta thích thú hơn mà =)). Tiếp theo là lợi ích của nó

  • nhanh
  • Use use
  • sự kết hợp tốt với pandas

Được rồi bây giờ chúng ta cùng bắt đầu nhé. Ở đây mình sử dụng tập dataset Titanic ở đây nha mn. Mình sẽ so sánh giữa seaborn với plotly nha. Còn ở phần thực hành mình sẽ thực thi code để so sánh Plotly với Matplotlib và Seaborn

Seaborn và Âm mưu

sinh ra biển

Seaborn là thư viện thú vị và có nhiều mẫu biểu đồ hơn, cú pháp câu lệnh cũng dễ sử dụng. Seaborn được rất nhiều người sử dụng và yêu thích.

Bản đồ sơ đồ python

Phạm Thị Hồng Anh @Honganh

Theo dõi

3. 0K 155 40

Đã đăng vào ngày 16 tháng 1 năm 2020 2. 21 SA 7 phút đọc

1. 3k

0

1

Giới thiệu Visualization data with plotly with Titanic dataset

  • Report
  • Add to series of me

Bài đăng này đã không được cập nhật trong 2 năm

Nhân dịp những ngày cuối năm Kỷ Hợi mình xin cảm ơn mọi người đã đọc bài viblo của mình trong một năm vừa qua. Và mình xin kính chúc tất cả mọi người một năm mới " Vạn Sự Như Ý, An Khang Thịnh Vượng"

Tiếp tục với bài viết thôi nào =)). Ở bài viết lần này mình sẽ chia sẻ về việc Visualization trong data như thế nào. Tuy nhiên ở bài viết này mình sẽ sử dụng plotly thay vì matplotlib hay seaborn. Thứ nhất bởi vì mình cảm thấy nó khá là thú vị. v những cái gì mà càng trực quan thì càng làm cho chúng ta thích thú hơn mà =)). Tiếp theo là lợi ích của nó

  • nhanh
  • Use use
  • sự kết hợp tốt với pandas

Được rồi bây giờ chúng ta cùng bắt đầu nhé. Ở đây mình sử dụng tập dataset Titanic ở đây nha mn. Mình sẽ so sánh giữa seaborn với plotly nha. Còn ở phần thực hành mình sẽ thực thi code để so sánh Plotly với Matplotlib và Seaborn

Seaborn và Âm mưu

sinh ra biển

Seaborn là thư viện thú vị và có nhiều mẫu biểu đồ hơn, cú pháp câu lệnh cũng dễ sử dụng. Seaborn được rất nhiều người sử dụng và yêu thích.

Hình 1. Ví dụ biểu đồ. phân phối cho Giá vé (Bộ dữ liệu Titanic) ở Seaborn

Thư viện seaborn cũng cung cấp nhiều biểu đồ đa dạng

Hình 2. Các biểu đồ bạn có thể sử dụng với thư viện seaborn

Tuy nhiên, vẫn có một vài hạn chế đó là tất cả đồ thị, biểu đồ của seaborn đều là tĩnh (tĩnh). Nó chỉ ra cho chúng ta thấy những gì được hiển thị trên màn hình và không thể xem chi tiết từng ô trong biểu đồ hoặc giá trị tại 1 khoảng thời gian nào đó. Hơn nữa, bạn cũng không thể di chuyển chuột hoặc nhấp chuột để hiển thị thông tin chi tiết

Plotly could could answer the mode of seaborn. Chúng ta cùng nhau tìm hiểu xem cốt truyện hữu ích như thế nào nhé

âm mưu

Plotly có khả năng thực hiện các chức năng "Interactive Visualization". "Trực quan hóa tương tác" có thể giúp tăng thêm cảm giác thu hút =)) cũng như việc bạn có thể trình bày dữ liệu một cách trực quan hơn nữa đối với người nghe. Hình 3 dưới đây cũng là phân phối cho Giá vé trong tập dữ liệu Titanic cùng xem và so sánh nhé

Hình 3. Phân phối ò Giá vé ( nguồn. ở đây)

Thật là vi diệu phải không nào =)). Chúng ta có thể lựa chọn các tùy chọn để hiển thị biểu đồ hoặc phóng to từng tùy chọn giá trị

Thư viện Plotly

Như đã nói ở trên Plotly là thư viện Python hỗ trợ người dùng trực tiếp hóa dữ liệu tương tác. Nó cho phép chúng ta vẽ đồ thị tương tác không những trực quan hơn mà còn thuyết phục người nghe hơn so với matplotlib hay là seaborn

Những kiểu đồ thị mà chúng ta có thể vẽ với Plotly là gì?

  • Tất cả những gì chúng ta có thể thực hiện được với Matplotlib và Seaborn
  • Statistics chart
  • Biểu đồ khoa học
  • Biểu đồ Tài chính
  • Bản đồ địa chất Hình 4. ví dụ về các đồ thị, biểu đồ có thể sử dụng trong Plotly

Cài đặt và nhập Plotly

Sử dụng pip để cài đặt Plotly

pip install plotly
pip install cufflinks

Ở đây mình sẽ sử dụng Jupyter Notebook nha cả nhà. Chúng ta sẽ phải nhập thư viện này để sử dụng

from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode(connected=True)
import pandas as pd

Thực hiện cách hoạt động của Plotly, Plotly lưu đồ thị của bạn vào một tệp html và mở ở một cửa sổ mới. Sẽ xảy ra lỗi khi bạn chạy mã trong bảng điều khiển/thiết bị đầu cuối. Làm như vậy ở đây chúng ta sẽ sử dụng cốt truyện. ngoại tuyến, iplot và init_notebook để giúp chúng tôi vẽ biểu đồ ngay trên Jupyter Notebook

Thực tiễn

First read data has any

df = pd.read_csv("dataset_titanic/train.csv")
df.head()

Hình 5. Data file train titanic dataset

Biểu đồ tròn

Mình sẽ vẽ cột Survived bằng Plotly và matplotlib nhé

âm mưu

#labels
lab = df["Survived"].value_counts().keys().tolist()
#values
val = df["Survived"].value_counts().values.tolist()
trace = go.Pie(labels=lab, 
                values=val, 
                marker=dict(colors=['red']), 
                # Seting values to 
                hoverinfo="value"
              )
data = [trace]

cách trình bày. bạn có thể vẽ tiêu đề, tiêu đề trục x và y hoặc hiển thị chú thích

#set title 
layout = go.Layout(title="Survived Distribution")

nhân vật. khi bạn muốn hiển thị trên đồ thị, nó lấy thông số dữ liệu và bố cục đã được định nghĩa

fig = go.Figure(data = data,layout = layout)

Tiếp theo là sử dụng iplot để hiển thị thôi

iplot(fig)

Hình 6. Pie chart draw by plotly

Với matplotlib

from matplotlib import pyplot as plt
title = "pie chart"
plt.pie(val, labels=lab)
plt.axis('equal')
plt.title(title)
plt.tight_layout()
plt.show()

Hình 7. vẽ biểu đồ hình tròn bằng matplotlib

biểu đồ

âm mưu

________số 8

Hình 8. biểu đồ cốt truyện của Plotly

matplotlib

plt.hist(df["Age"], bins=40)
plt.title("distribute of age")

Hình 9. vẽ biểu đồ bằng matplotlib

Tiêu tan

âm mưu

from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode(connected=True)
import pandas as pd
0

Hình 10. Phân tán theo Plotly

Ở đây đã được bổ sung thêm các tính năng để chúng ta có thể thao tác trực tiếp với hình vẽ như khi di chuột vài điểm sẽ hiển thị giá trị của "Giá vé" và "Tuổi" để mọi người có thể thấy chi tiết hơn. Dựa vào biểu đồ này, chúng ta cũng thấy xu hướng giá tăng dưới 300 và những người già thường có xu hướng mua vé giá rẻ. Mọi người có thể vẽ thêm các biểu đồ để làm rõ hơn ví dụ như tuổi trung bình và giá cho Pclass

sinh ra biển

from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode(connected=True)
import pandas as pd
1

Hình 11. Phân tán bởi Seaborn

Biểu đồ cột

âm mưu. Mỗi Pclass chúng ta sẽ hiển thị độ tuổi và giá vé trung bình bằng Bar Chart

from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode(connected=True)
import pandas as pd
2____13

Hình 12. Biểu đồ thanh của Plotly

Thêm 2 thông số. color and colorscale để lựa chọn màu sắc hiển thị tùy chọn Seaborn

from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode(connected=True)
import pandas as pd
4

Hình 13. Biểu đồ thanh của Seaborn

Lô đất phân phối

Lưu ý với đồ thị phân phối các giá trị của dữ liệu phải khác "NAN" nếu không thì phải giải quyết bằng cách fillna() nhé. âm mưu

from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode(connected=True)
import pandas as pd
5

Hình 14. Phân phối bởi Plotly

Matplotlib

from plotly.offline import init_notebook_mode,iplot
import plotly.graph_objects as go
import cufflinks as cf
init_notebook_mode(connected=True)
import pandas as pd
6

Hình 15. Phân phối bởi Matplotlib

Kết luận

Trực quan hóa dữ liệu bằng Plotly look "cool" hơn đúng không ạ? . Quan trọng nhất vẫn là bạn sẽ thu được gì sau khi trực tiếp hóa dữ liệu thôi không đúng. Tuy nhiên mình cảm thấy Plotly khá là hữu ích bởi những tính năng của nó cũng như công việc sẽ thu hút người nghe hơn. Nhìn vào những hình ảnh động cảm giác vẫn hấp dẫn hơn là hình ảnh tĩnh phải không =))). Cảm ơn mn đã dành thời gian để đọc bài của mình. Mong được sự góp ý của mn dành cho bài viết của mình ạ

Tài liệu tham khảo

https. // hướng tới khoa học dữ liệu. com/python-for-data-science-a-guide-to-data-visualization-with-plotly-969a59997d0c