Đọc khung dữ liệu python xlsx

Bạn có thể dễ dàng nhập tệp Excel vào Python bằng Pandas. Để hoàn thành mục tiêu này, bạn sẽ cần sử dụng read_excel

import pandas as pd

df = pd.read_excel(r'Path where the Excel file is stored\File name.xlsx')
print(df)

Lưu ý rằng đối với phiên bản Excel cũ hơn, bạn có thể cần sử dụng phần mở rộng tệp là 'xls'

Và nếu bạn có một trang tính Excel cụ thể mà bạn muốn nhập, thì bạn có thể áp dụng

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)

Bây giờ hãy xem lại một ví dụ bao gồm dữ liệu được nhập vào Python

Dữ liệu được nhập vào Python

Giả sử rằng bạn có bảng sau được lưu trữ trong Excel (trong đó tên tệp Excel là 'sản phẩm')

product_namepricecomputer700tablet250printer120laptop1200keyboard100

Sau đó, bạn có thể làm theo các bước bên dưới để nhập tệp Excel vào Python

Các bước để nhập tệp Excel vào Python bằng Pandas

Bước 1. Chụp đường dẫn tập tin

Trước tiên, hãy chụp lại đường dẫn đầy đủ nơi tệp Excel được lưu trữ trên máy tính của bạn

Ví dụ: giả sử tệp Excel được lưu trữ theo đường dẫn sau

C. \Users\Ron\Desktop\ sản phẩm. xlsx

Trong mã Python bên dưới, bạn sẽ cần sửa đổi tên đường dẫn để phản ánh vị trí lưu trữ tệp Excel trên máy tính của bạn

Đừng quên bao gồm tên tệp (trong ví dụ của chúng tôi, đó là ‘ products ‘ được đánh dấu bằng màu xanh lam). Bạn cũng cần bao gồm phần mở rộng tệp Excel (trong trường hợp của chúng tôi, đó là ‘ . xlsx ‘ như được đánh dấu bằng màu xanh lục).

Bước 2. Áp dụng mã Python

Đây là mã Python cho ví dụ của chúng tôi

import pandas as pd

df = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx')
print(df)

Lưu ý rằng bạn nên đặt “r” trước chuỗi đường dẫn để giải quyết các ký tự đặc biệt, chẳng hạn như ‘\’. Ngoài ra, đừng quên đặt tên tệp ở cuối đường dẫn + ‘. xlsx’

Bước 3. Chạy mã Python để nhập tệp Excel

Chạy mã Python (được điều chỉnh theo đường dẫn của bạn) và bạn sẽ nhận được tập dữ liệu sau

  product_name  price
0     computer    700
1       tablet    250
2      printer    120
3       laptop   1200
4     keyboard    100

Lưu ý rằng bạn đã nhận được kết quả giống như kết quả được lưu trữ trong tệp Excel

Ghi chú. bạn sẽ phải cài đặt gói bổ sung nếu gặp lỗi sau khi chạy mã

Nhập Lỗi. Thiếu phụ thuộc tùy chọn 'xlrd'

Sau đó, bạn có thể sử dụng phương pháp cài đặt PIP để cài đặt openpyxl cho. tập tin xlsx

pip install openpyxl

Bước tùy chọn. Chọn tập hợp con của các cột

Bây giờ nếu bạn muốn chọn một cột hoặc nhiều cột cụ thể từ tệp Excel thì sao?

Ví dụ: nếu bạn chỉ muốn chọn cột product_name thì sao?

import pandas as pd

data = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') 
df = pd.DataFrame(data, columns=['product_name'])
print(df)

Chạy mã (sau khi điều chỉnh đường dẫn tệp) và bạn sẽ chỉ nhận được cột product_name

  product_name
0     computer
1       tablet
2      printer
3       laptop
4     keyboard

Bạn có thể chỉ định các cột bổ sung bằng cách tách tên của chúng bằng dấu phẩy, vì vậy nếu bạn muốn bao gồm cả cột product_name và price, bạn có thể sử dụng cú pháp này

import pandas as pd

data = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx') 
df = pd.DataFrame(data, columns=['product_name', 'price'])
print(df)

Bạn sẽ cần đảm bảo rằng tên cột được chỉ định trong mã khớp chính xác với tên cột trong tệp Excel. Nếu không, bạn sẽ nhận được các giá trị NaN

Sự kết luận

Bạn vừa xem cách nhập tệp Excel vào Python bằng Pandas

Đôi khi, bạn có thể cần nhập tệp CSV vào Python. Nếu đúng như vậy, bạn có thể xem hướng dẫn sau giải thích cách nhập tệp CSV vào Python bằng Pandas

Bạn cũng có thể xem Tài liệu về Pandas để tìm hiểu thêm về các tùy chọn khác nhau mà bạn có thể áp dụng đối với read_excel

Nếu bạn mở cùng một tệp trong hai phiên bản Excel, thì bạn cần đủ điều kiện cho tệp đó và bao gồm phiên bản ứng dụng. Bạn sẽ tìm thấy khóa phiên bản ứng dụng của mình (PID) qua

>>> xw.apps[10559].books['FileName.xlsx']
3

________số 8

Khởi tạo một đối tượng trang tính

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
0

Đọc/ghi giá trị vào/từ phạm vi dễ dàng như

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
1

Có rất nhiều tính năng tiện lợi có sẵn, đ. g. Mở rộng phạm vi

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
2

Bộ chuyển đổi mạnh mẽ xử lý hầu hết các loại dữ liệu quan tâm, bao gồm mảng Numpy và Khung dữ liệu Pandas theo cả hai hướng

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
3

Số liệu Matplotlib có thể được hiển thị dưới dạng hình ảnh trong Excel

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
4

3. macro. Gọi Python từ Excel#

Bạn có thể gọi các hàm Python bằng cách nhấp vào nút

>>> xw.apps[10559].books['FileName.xlsx']
4 (mới trong v0. 16) trong phần bổ trợ hoặc từ VBA bằng hàm
>>> xw.apps[10559].books['FileName.xlsx']
5

Nút

>>> xw.apps[10559].books['FileName.xlsx']
4 mong đợi một hàm có tên là
>>> xw.apps[10559].books['FileName.xlsx']
7 trong mô-đun Python có cùng tên với sổ làm việc của bạn. Điều tuyệt vời về cách tiếp cận đó là bạn không cần bật macro sổ làm việc của mình, bạn có thể lưu nó dưới dạng
>>> xw.apps[10559].books['FileName.xlsx']
8

Nếu bạn muốn gọi bất kỳ hàm Python nào, bất kể nó nằm trong mô-đun nào hoặc tên của nó là gì, hãy sử dụng

>>> xw.apps[10559].books['FileName.xlsx']
5

import pandas as pd

df = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx')
print(df)
1

Ghi chú

Theo mặc định,

>>> xw.apps[10559].books['FileName.xlsx']
5 mong đợi
import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
01 trong cùng thư mục với tệp Excel có cùng tên, nhưng bạn có thể thay đổi cả hai điều này. nếu tệp Python của bạn là một thư mục khác, hãy thêm thư mục đó vào
import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
02 trong cấu hình. Nếu tệp có tên khác, hãy thay đổi lệnh
>>> xw.apps[10559].books['FileName.xlsx']
5 cho phù hợp

Tham khảo sổ gọi Excel bằng cách sử dụng

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
04

import pandas as pd

df = pd.read_excel(r'C:\Users\Ron\Desktop\products.xlsx')
print(df)
7

Để thực hiện điều này, bạn cần cài đặt phần bổ trợ xlwings hoặc thiết lập sổ làm việc ở chế độ độc lập. Cách dễ nhất để thiết lập mọi thứ là sử dụng ứng dụng khách dòng lệnh xlwings từ dấu nhắc lệnh trên Windows hoặc thiết bị đầu cuối trên máy Mac.

import pandas as pd

df = pd.read_excel(r'Path of Excel file\File name.xlsx', sheet_name='your Excel sheet name')
print(df)
05