Tên trang tính Pd read_csv

Các hàm read_* được sử dụng để đọc dữ liệu cho gấu trúc, các phương thức to_* được sử dụng để lưu trữ dữ liệu. Phương thức to_excel() lưu trữ dữ liệu dưới dạng tệp excel. Trong ví dụ ở đây, sheet_name được đặt tên là hành khách thay vì Sheet1 mặc định. Bằng cách đặt chỉ mục=Sai, nhãn chỉ mục hàng không được lưu trong bảng tính

Trước khi đọc một file excel trong pandas, chúng ta cần cài đặt thư viện openpyxl. Đây là thư viện phụ thuộc cần thiết để đọc và ghi tệp excel trong gấu trúc

Trong Terminal trên Mac hoặc Dòng lệnh trong windows, trước tiên hãy chạy lệnh sau

pip install openpyxl

Và trong bài đăng này, chúng tôi sẽ làm việc với tệp mẫu này mà bạn có thể tải xuống từ đây – liên kết tải xuống dữ liệu

Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

Ở đây, chúng tôi có một số dữ liệu bán hàng trong nhiều trang tính và chúng tôi muốn đọc những dữ liệu này bằng pandas. hãy xem làm thế nào để làm điều đó

Đầu tiên để lấy tên của tất cả các sheet trong file excel ta có thể sử dụng lệnh pd. Tệp Excel()

sheets_names = pd.ExcelFile('reading_excel_file.xlsx').sheet_names
sheets_names
Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

giả sử chúng ta muốn đọc dữ liệu Đơn đặt hàng 1. Để làm điều đó, chúng ta cần chuyển tên trang tính cho tham số sheet_name trong pandas.

df = pd.read_excel('reading_excel_file.xlsx', sheet_name='Purchase Orders 1')
Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

2. Cách bỏ qua hàng khi đọc tệp excel trong pandas

Nếu bạn muốn bỏ qua số n hàng từ trên xuống, bạn cần sử dụng tham số bỏ qua

Giả sử chúng ta muốn bỏ qua 2 hàng đầu tiên khi đọc tệp

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  skiprows=2)
Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

Chúng ta có thể thấy rằng hai hàng trên cùng đã bị bỏ qua khỏi kết quả.

Và nếu bạn muốn bỏ qua n hàng từ cuối, bạn có thể sử dụng tham số skipfooter

Giả sử chúng ta muốn bỏ qua 3 hàng từ cuối

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  skipfooter=3)
Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

3. Cách bỏ qua các cột khi đọc tệp excel trong gấu trúc.

Để bỏ cột khi đọc file excel, bạn có thể sử dụng tham số usecols của read_excel

Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

giả sử tôi chỉ quan tâm đến việc đọc các cột từ ID sản phẩm đến Số lượng đặt hàng

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  usecols='C:F')
Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

Bây giờ, giả sử bạn muốn chọn hai cột đầu tiên và hai cột cuối cùng. Để làm điều đó, bạn sẽ viết

df = pd.read_excel('reading_excel_file.xlsx', 
                   sheet_name='Purchase Orders 1',
                  usecols='A:B, H:I')
Tên trang tính Pd read_csv
Tên trang tính Pd read_csv

4. Cách đọc tệp excel trong gấu trúc có tiêu đề

Đôi khi có thể xảy ra trường hợp dữ liệu mà bạn muốn làm việc không bắt đầu từ hàng đầu tiên. Hãy sao chép dữ liệu bán hàng sang một tệp excel mới và thêm một số dòng trống trước dữ liệu để chứng minh rằng

Bây giờ, nếu bạn nhìn vào hình bên dưới, bạn có thể thấy rằng dữ liệu không bắt đầu từ hàng đầu tiên. Có rất nhiều hàng trống mà gấu trúc điền vào NaN (Không phải là số) và tên cột cũng được đặt tên là Chưa đặt tên

Tên trong PD read_csv là gì?

tham số tên trong hàm read_csv được dùng để xác định tên cột . Nếu bạn chuyển tên phụ vào danh sách này, nó sẽ thêm một cột mới khác có tên đó với các giá trị NaN. tiêu đề=Không có tên nào được sử dụng để cắt tên cột đã tồn tại trong tệp CSV.

Làm cách nào để đọc csv sheet 2 trong gấu trúc?

Đọc tệp CSV .
Tải CSV vào DataFrame. nhập gấu trúc dưới dạng pd. df = pd. read_csv('dữ liệu. csv').
In DataFrame mà không cần phương thức to_string(). nhập gấu trúc dưới dạng pd. .
Kiểm tra số lượng hàng được trả lại tối đa. nhập gấu trúc dưới dạng pd. .
Tăng số hàng tối đa để hiển thị toàn bộ DataFrame. nhập gấu trúc dưới dạng pd

tiêu đề cho csv đã đọc là gì?

Đọc csv có tiêu đề . Dữ liệu được đọc từ dòng được chỉ định bởi tiêu đề và các dòng trên được bỏ qua. header= 0, and if the first line is header, the result is the same result. Data is read from the line specified by header, and the above lines are ignored.

Cái nào đọc csv hoặc read_csv nhanh hơn?

csv() thực sự nhanh hơn read_csv() trong khi fread nhanh hơn nhiều so với cả hai, mặc dù những khoản tiết kiệm này có thể không quan trọng đối với các tập dữ liệu nhỏ như vậy. Đối với các tệp vượt quá 100 MB có kích thước fread() và read_csv() có thể nhanh hơn khoảng 5 lần so với read.