Cột df trong python

PANDAS DATAFRAME là một bảng dữ liệu dạng cấu trúc có kích thước hai chiều, có khả năng không đồng nhất với các trục được dán nhãn (hàng và cột). Các hoạt động học số căn chỉnh trên cả nhãn hàng và cột. Nó có thể coi là một container giống như dict cho các chuỗi đối tượng. Đây là cấu trúc dữ liệu chính của gấu trúc. Khung dữ liệu. cột Khung dữ liệu. cột

Thuộc tính PandasDataFrame.columns Trả về các cột nhãn của DataFrame đã chọn. Không có Không có

cú pháp. Khung dữ liệu. Tên cột Tên cột

Tham số. Không có Sử dụng thuộc tính DataFrame.columns để trả về nhãn cột của Dataframe đã cho. Sử dụng thuộc tính DataFrame.columns để trả về các nhãn cột của Khung dữ liệu đã cho

Trả về. Name column

Ví dụ #1. Sử dụng thuộc tính DataFrame.columns để trả về các cột nhãn của DataFrame đã chọn

DataFrame.columns9

data = pandas.read_csv('cost_revenue_clean.csv')
00
data = pandas.read_csv('cost_revenue_clean.csv')
1
data = pandas.read_csv('cost_revenue_clean.csv')
02DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
04DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
06DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
08DataFrame.columns0DataFrame.columns40DataFrame.columns8

DataFrame.columns9DataFrame.columns43

data = pandas.read_csv('cost_revenue_clean.csv')
1DataFrame.columns45DataFrame.columns0DataFrame.columns47DataFrame.columns0DataFrame.columns49DataFrame.columns0DataFrame.columns51DataFrame.columns0DataFrame.columns53DataFrame.columns54

data = pandas.read_csv('cost_revenue_clean.csv')
0 DataFrame.columns4

Các

DataFrame.columns11DataFrame.columns12

Các

Cột df trong python

DataFrame.columns38DataFrame.columns3 DataFrame.columns10

đầu ra

DataFrame.columns11DataFrame.columns18

Bây giờ chúng tôi sẽ sử dụng thuộc tính DataFrame.columns để trả về các cột đánh dấu của DataFrame đã chọn


Như chúng ta có thể thấy ở đầu ra, thuộc tính DataFrame.columns đã trả về thành công tất cả các nhãn cột của khung dữ liệu đã cho

Ví dụ #2. Sử dụng thuộc tính DataFrame.columns để trả về các nhãn cột của Khung dữ liệu đã cho. Ví dụ #2. Sử dụng thuộc tính DataFrame.columns để trả về các nhãn cột của Khung dữ liệu đã cho

Trả về. Name column

Ví dụ #1. Sử dụng thuộc tính DataFrame.columns để trả về các cột nhãn của DataFrame đã chọn

DataFrame.columns9

data = pandas.read_csv('cost_revenue_clean.csv')
19_______11
data = pandas.read_csv('cost_revenue_clean.csv')
051DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
053DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
055DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
057DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
14
data = pandas.read_csv('cost_revenue_clean.csv')
17

DataFrame.columns9DataFrame.columns02

data = pandas.read_csv('cost_revenue_clean.csv')
1DataFrame.columns04DataFrame.columns0DataFrame.columns06DataFrame.columns0DataFrame.columns08DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
057DataFrame.columns0DataFrame.columns51
data = pandas.read_csv('cost_revenue_clean.csv')
17

data = pandas.read_csv('cost_revenue_clean.csv')
0 DataFrame.columns4

data = pandas.read_csv('cost_revenue_clean.csv')
0 DataFrame.columns4

Các

DataFrame.columns11DataFrame.columns12

Các

DataFrame.columns38DataFrame.columns3 DataFrame.columns10

đầu ra

DataFrame.columns11DataFrame.columns18

Bây giờ chúng tôi sẽ sử dụng thuộc tính DataFrame.columns để trả về các cột đánh dấu của DataFrame đã chọn


Như chúng ta có thể thấy ở đầu ra, thuộc tính DataFrame.columns đã trả về thành công tất cả các nhãn cột của khung dữ liệu đã cho.

Như chúng ta có thể thấy ở đầu ra, DataFrame. thuộc tính cột đã trả về thành công tất cả các nhãn cột của khung dữ liệu đã cho.

 Ví dụ #2. Sử dụng thuộc tính DataFrame.columns để trả về các nhãn cột của Khung dữ liệu đã cho. .

DataFrame.columns9DataFrame.columns15

data = pandas.read_csv('cost_revenue_clean.csv')
1DataFrame.columns45DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
057DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
14DataFrame.columns0
data = pandas.read_csv('cost_revenue_clean.csv')
053DataFrame.columns0DataFrame.columns25DataFrame.columns26

Trong bài trước, chúng ta đã thu thập và làm sạch dữ liệu, nhưng với những con số như thật thì khó để nhận ra những quy luật hoặc có ý tưởng để thực hiện những bước tiếp theo. Đây là lúc chúng ta cần đọc dữ liệu đã thu thập được và thực hiện phân tách những dữ liệu cần thiết như cũng như trực tiếp hóa chúng thông qua các biểu đồ

Tìm việc làm với mức lương cao cho công ty python

Cột df trong python
Cột df trong python

Xử lý tệp csv với Python

Tệp cost_revenue_clean. csv là tệp đã được làm sạch những thông tin nhiễu, không chính xác và cả định dạng lại để máy tính có thể hiểu được. Chúng ta cần đưa dữ liệu này vào máy tính để có thể sử dụng cho các mô hình dự kiến, chẳng hạn như dữ liệu này có thể biểu thị bằng các biểu đồ, nó chứa nhiều thông tin hơn một bảng dữ liệu duy nhất

Trước khi bắt đầu, bạn nên làm quen với Jupyter một công cụ không thể thiếu khi thiết lập ngôn ngữ Python. Jupyter cho phép bạn thực hiện đoạn mã Python trực tuyến hoặc bạn có thể cài đặt trên máy tính cá nhân. Ở phần tiếp theo này, giả sử bạn đã cài đặt hoặc biết cách sử dụng Jupyter trực tuyến tại Jupyter. tổ chức

Đầu tiên, chúng ta tải lên các tệp dữ liệu cost_revenue_clean. csv với nút Tải lên trong trang Jupyter. Sau đó, chúng ta sẽ sử dụng pandas mô-đun để có thể đọc tệp dữ liệu này

import pandas

Pandas là một thư viện mã nguồn Python mở với nhiệm vụ cấu trúc và phân tích dữ liệu. To read data from file csv we used method read_csv()

data = pandas.read_csv('cost_revenue_clean.csv')

Trong Jupyter khi code hoàn tất, để thực thi bạn nhấn tổ hợp phím Shift + Enter hoặc nhấn vào nút Run trong thanh menu nhanh

Cột df trong python
Cột df trong python

Dữ liệu của chúng tôi có khoảng hơn 5000 bản ghi, làm như vậy để có thể có dữ liệu này dưới góc nhìn khoa học, chúng tôi sử dụng câu lệnh

data.describe()

Cột df trong python
Cột df trong python

Chúng ta có các bảng thống kê thông tin như sau

  • đếm. tổng số các bản ghi trong dữ liệu
  • nhỏ nhất lớn nhất. the best value in the data strip
  • bần tiện. giá trị trung bình

Chú ý, khi làm việc với các dạng số liệu khoa học, các con số sẽ có định dạng khoa học theo kiểu hàm mũ, thay thế một số phần đó với e +n. Ví dụ

12345678901 sẽ được hiển thị là 1. 23e +10

Khung dữ liệu

DataFrame là cấu trúc dữ liệu có hai chiều giống kiểu định dạng bảng dữ liệu, nó cho phép áp dụng các thuật toán trên các dòng và cột. DataFrame sử dụng cho rất nhiều loại dữ liệu đầu vào như

  • danh sách
  • Thư viện
  • Loạt

Để sử dụng DataFrame, chúng ta cần nhập nó dưới dạng một thành phần của pandas

from pandas import DataFrame

Chú ý, Jupyter hỗ trợ tự động hoàn thành (autocomplete) các từ khóa, do đó chỉ cần nhập vài ký tự trong từ khóa sau đó nhấn Tab là nó tự động nhập từ khóa đầy đủ giúp chúng ta nhập mã nhanh hơn

Chúng ta thực hiện lấy ra các cột dữ liệu thông qua DataFrame được gọi là bóc tách hoặc phân tách dữ liệu từ dữ liệu gốc

X = DataFrame(data, columns = ['product_budget_usd'])
y = DataFrame(data, columns = ['worldwide_gross_usd'])

Bài hướng dẫn dừng lại tại đây, trong bài tiếp theo chúng ta sẽ vẽ biểu đồ dữ liệu có được khi phân tách