Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel
import pandas as pd df = pd.read_excel(r'Path where the Excel file is stored\File name.xlsx') print(df)Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls'
Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng
import pandas as pd df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name') print(df)Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python
Dữ liệu được nhập vào Python
Giả sử rằng bạn có bảng sau được lưu trữ trong Excel (trong đó tên tệp Excel là 'sản phẩm')
product_namepricecomputer700tablet250printer120laptop1200keyboard100Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python
Các bước để nhập tệp Excel vào Python bằng Pandas
Bước 1. Chụp đường dẫn tập tin
Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn
Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau
C. \Users\Ron\Desktop\ sản phẩm. xlsx
Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn
Đừng quên bao gồm tên tệp (trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam). Bạn cũng cần bao gồm phần mở rộng tệp Excel (trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục).
Bước 2. Áp dụng mã Python
Đây là mã Python cho ví dụ của chúng tôi
import pandas as pd df = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') print(df)Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’
Bước 3. Chạy mã Python để nhập tệp Excel
Chạy mã Python (được điều chỉnh theo đường dẫn của bạn) và bạn sẽ nhận được tập dữ liệu sau
product_name price 0 computer 700 1 tablet 250 2 printer 120 3 laptop 1200 4 keyboard 100Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel
Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã
Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'
Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx
pip install openpyxlBước tùy chọn. Chọn tập hợp con của các cột
Bây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao?
Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao?
import pandas as pd data = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') df = pd.DataFrame(data, columns=['product_name']) print(df)Chạy mã (sau khi điều chỉnh đường dẫn tệp) và bạn sẽ chỉ nhận được cột product_name
product_name 0 computer 1 tablet 2 printer 3 laptop 4 keyboardBạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này
import pandas as pd data = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') df = pd.DataFrame(data, columns=['product_name', 'price']) print(df)Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN
Phần kết luận
Bạn vừa xem cách nhập tệp Excel vào Python bằng Pandas
Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas
Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel
Tương tự, chúng ta có thể tải các tệp Microsoft Excel một cách dễ dàng. Ví dụ: tệp Excel cho cùng bộ dữ liệu Titanic có sẵn tại vandebilt. edu (liên kết đầy đủ trong tập lệnh sau). Chúng tôi có kịch bản sau
________số 8Ví dụ, cũng có một bộ tham số tùy chọn mở rộng để đọc các tệp Excel
- Chọn trang tính trong tệp excel để đọc
- Bỏ qua hàng
- Chỉ định việc xử lý các giá trị NA
Luồng kết quả trong Jupyter như sau. Tập dữ liệu trông rất giống với tệp CSV trước đó được đọc trong