Nhập dữ liệu từ excel sang Python

Những người đồng sáng lập DataCamp, Jonathan Cornelissen và Martijn Theuwissen phân tích các xu hướng dữ liệu hàng đầu mà họ đang thấy trong không gian dữ liệu ngày nay, cũng như dự đoán của họ về tương lai của ngành dữ liệu

Deepanshu thành lập ListenData với một mục tiêu đơn giản - Làm cho các phân tích trở nên dễ hiểu và dễ theo dõi. Ông có hơn 10 năm kinh nghiệm trong lĩnh vực khoa học dữ liệu. Trong nhiệm kỳ của mình, ông đã làm việc với các khách hàng toàn cầu trong nhiều lĩnh vực khác nhau như Ngân hàng, Bảo hiểm, Cổ phần tư nhân, Viễn thông và Nhân sự

Không phải lúc nào cũng có thể lấy tập dữ liệu ở định dạng CSV. Vì vậy, Pandas cung cấp cho chúng ta các chức năng để chuyển đổi bộ dữ liệu ở các định dạng khác sang Data frame. Một tệp excel có một ‘. định dạng xlsx.  

Trước khi bắt đầu,  chúng ta cần cài đặt một số thư viện.  

pip install pandas
pip install xlrd

Để nhập tệp Excel vào Python bằng Pandas, chúng tôi phải sử dụng gấu trúc. hàm read_excel()

cú pháp. gấu trúc. read_excel(io, ​​sheet_name=0, header=0, names=None,…. )

Trở lại. DataFrame hoặc dict của DataFrames

Giả sử tệp Excel trông như thế này

Bây giờ, chúng ta có thể đi sâu vào mã.  

ví dụ 1. Đọc một tệp Excel

Python3




import pandas as pd

 

df= pd.read_excel("sample.xlsx")

printimport0

đầu ra

ví dụ 2. Để chọn một cột cụ thể, chúng ta có thể truyền tham số “index_col“.  

Python3




import pandas as pd

 

import4

df= pd.read_excel("sample.xlsx"import9

pandas as pd0_______10_______1= pandas as pd3pandas as pd4

 

printimport0

đầu ra

Nhập dữ liệu từ excel sang Python

ví dụ 3. Trong trường hợp bạn không thích tiêu đề ban đầu của các cột, bạn có thể thay đổi nó thành chỉ mục bằng cách sử dụng tham số “tiêu đề”

Python3




import pandas as pd

 

df= pd.read_excel( 4import9

pandas as pd0_______11_______7=  9)

printimport0

đầu ra

Ví dụ 4. Nếu bạn muốn thay đổi kiểu dữ liệu của một cột cụ thể, bạn có thể thực hiện bằng cách sử dụng tham số “dtype“

Python3




import pandas as pd

 

df= pd.read_excel( 4=0

pandas as pd0_______13_______2= =4_______13_______5=6=7import9

=9_______14_______0=6pd.read_excel(2pd.read_excel(3

printimport0

đầu ra

Ví dụ 5. Trong trường hợp bạn có các giá trị không xác định, thì bạn có thể xử lý nó bằng tham số “na_values“. Nó sẽ chuyển đổi các giá trị chưa biết đã đề cập thành “NaN”

Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel

import pandas as pd

df = pd.read_excel(r'Path where the Excel file is stored\File name.xlsx')
print(df)

Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls'

Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)

Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python

Dữ liệu được nhập vào Python

Giả sử rằng bạn có bảng sau được lưu trữ trong Excel (trong đó tên tệp Excel là 'sản phẩm')

product_namepricecomputer700tablet250printer120laptop1200keyboard100

Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python

Các bước để nhập tệp Excel vào Python bằng Pandas

Bước 1. Chụp đường dẫn tập tin

Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn

Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau

C. \Users\Ron\Desktop\ sản phẩm. xlsx

Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn

Đừng quên bao gồm tên tệp (trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam). Bạn cũng cần bao gồm phần mở rộng tệp Excel (trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục).

Bước 2. Áp dụng mã Python

Đây là mã Python cho ví dụ của chúng tôi

import pandas as pd

df = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx')
print(df)

Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’

Bước 3. Chạy mã Python để nhập tệp Excel

Chạy mã Python (được điều chỉnh theo đường dẫn của bạn) và bạn sẽ nhận được tập dữ liệu sau

  product_name  price
0     computer    700
1       tablet    250
2      printer    120
3       laptop   1200
4     keyboard    100

Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel

Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã

Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'

Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx

pip install openpyxl

Bước tùy chọn. Chọn tập hợp con của các cột

Bây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao?

Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao?

import pandas as pd

data = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') 
df = pd.DataFrame(data, columns=['product_name'])
print(df)

Chạy mã (sau khi điều chỉnh đường dẫn tệp) và bạn sẽ chỉ nhận được cột product_name

  product_name
0     computer
1       tablet
2      printer
3       laptop
4     keyboard

Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này

________số 8_______

Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN

Phần kết luận

Bạn vừa xem cách nhập tệp Excel vào Python bằng Pandas

Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas

Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel

Python có thể lấy dữ liệu từ Excel không?

Người ta có thể truy xuất thông tin từ bảng tính . Việc đọc, viết hoặc sửa đổi dữ liệu có thể được thực hiện bằng Python có thể được thực hiện bằng các phương pháp khác nhau.

Làm cách nào để gửi dữ liệu từ Excel sang Python?

Chuyển đổi CSV sang Excel bằng Python (bao gồm ví dụ) .
Bước 1. Cài đặt gói Pandas. Nếu bạn chưa làm như vậy, hãy cài đặt gói Pandas. .
Bước 2. Chụp đường dẫn lưu trữ tệp CSV. .
Bước 3. Chỉ định đường dẫn nơi tệp Excel mới sẽ được lưu trữ. .
Bước 4. Chuyển đổi CSV sang Excel bằng Python