Hướng dẫn how to skip empty rows in excel in python - cách bỏ qua các hàng trống trong excel trong python

Tôi có một bảng excel chứa dữ liệu như được hiển thị bên dưới, nó chứa cột dữ liệu khôn ngoan.

Rahul e34 Pradeep e44 Azhar t54 Venkat r45 Akash e14 Vipul r15 Fairo e45 Akshay e44 Pavan e24 Asad t14

Khi tôi chạy mã dưới đây

import pandas as pd import numpy as np df = pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Data\\Output1.xlsx') df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2))) df.to_excel("Output2.xlsx")

Tôi nhận được đầu ra là

0 1 0 Rahul e34 1 Pradeep e44 2 Azhar t54 3 4 Venkat r45 5 Akash e14 6 Vipul r15 7 Fairo e45 8 Akshay e44 9 10 11 12 Pavan e24 13 Asad t14 14 15

Tôi cần đầu ra như hình dưới đây

Rahul e34 Pradeep e44 Azhar t54 Venkat r45 Akash e14 Vipul r15 Fairo e45 Akshay e44 Pavan e24 Asad t14

Hàng 1 (0,1) và cột 1 (0,1,2,3,4 ..... 15) không nên xuất hiện cùng với cách loại bỏ các khoảng trống. Bất cứ ai có thể vui lòng hướng dẫn tôi. Đánh giá cao sự giúp đỡ của bạn.

Tế bào trống

Các ô trống có khả năng cho bạn một kết quả sai khi bạn phân tích dữ liệu.

Xóa hàng

Một cách để đối phó với các ô trống là loại bỏ các hàng có chứa các ô trống.

Điều này thường ổn, vì các bộ dữ liệu có thể rất lớn và việc loại bỏ một vài hàng sẽ không có tác động lớn đến kết quả.

Thí dụ

Trả về một khung dữ liệu mới mà không có ô trống:

nhập khẩu gấu trúc dưới dạng PD

df = pd.read_csv ('data.csv')

new_df = df.dropna ()

print(new_df.to_string())

Hãy tự mình thử »

Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc. By default, the dropna() method returns a new DataFrame, and will not change the original.

Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True:

Thí dụ

Trả về một khung dữ liệu mới mà không có ô trống:

nhập khẩu gấu trúc dưới dạng PD

df = pd.read_csv ('data.csv')

new_df = df.dropna ()

Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.

Hãy tự mình thử »

Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True: Now, the import pandas as pd import numpy as np df = pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Data\\Output1.xlsx') df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2))) df.to_excel("Output2.xlsx") 0 will NOT return a new DataFrame, but it will remove all rows containing NULL values from the original DataFrame.

Xóa tất cả các hàng bằng các giá trị null:

df.dropna (tại chỗ = true)

in (df.to_string ()))

Lưu ý: Bây giờ, import pandas as pd import numpy as np df = pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Data\\Output1.xlsx') df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2))) df.to_excel("Output2.xlsx") 0 sẽ không trả về một DataFrame mới, nhưng nó sẽ loại bỏ tất cả các hàng chứa các giá trị null khỏi DataFrame gốc.

Thí dụ

Trả về một khung dữ liệu mới mà không có ô trống:

nhập khẩu gấu trúc dưới dạng PD

df = pd.read_csv ('data.csv')

new_df = df.dropna ()

Hãy tự mình thử »

Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.

Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True:

Xóa tất cả các hàng bằng các giá trị null:

Thí dụ

Trả về một khung dữ liệu mới mà không có ô trống:

nhập khẩu gấu trúc dưới dạng PD

df = pd.read_csv ('data.csv')

new_df = df.dropna ()

Hãy tự mình thử »

Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.

Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True:

Xóa tất cả các hàng bằng các giá trị null:

Thí dụ

Trả về một khung dữ liệu mới mà không có ô trống:

nhập khẩu gấu trúc dưới dạng PD

df = pd.read_csv ('data.csv')

new_df = df.dropna ()

Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.

Hãy tự mình thử »

Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True: = the average value (the sum of all values divided by number of values).

Thí dụ

Trả về một khung dữ liệu mới mà không có ô trống:

nhập khẩu gấu trúc dưới dạng PD

df = pd.read_csv ('data.csv')

new_df = df.dropna ()

Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.

Hãy tự mình thử »

Nếu bạn muốn thay đổi DataFrame gốc, hãy sử dụng đối số inplace = True: = the value in the middle, after you have sorted all values ascending.

Thí dụ

Trả về một khung dữ liệu mới mà không có ô trống:

nhập khẩu gấu trúc dưới dạng PD

df = pd.read_csv ('data.csv')

new_df = df.dropna ()

Lưu ý: Theo mặc định, phương thức dropna() trả về một DataFrame mới và sẽ không thay đổi bản gốc.

Hãy tự mình thử »

Chế độ = giá trị xuất hiện thường xuyên nhất. = the value that appears most frequently.


Tôi có một bảng excel chứa dữ liệu như được hiển thị bên dưới, nó chứa cột dữ liệu khôn ngoan.

Rahul e34 Pradeep e44 Azhar t54 Venkat r45 Akash e14 Vipul r15 Fairo e45 Akshay e44 Pavan e24 Asad t14

Khi tôi chạy mã dưới đây

import pandas as pd import numpy as np df = pd.read_excel (r'C:\\Users\\Kiran\\Desktop\\Data\\Output1.xlsx') df=pd.DataFrame(np.reshape(df.to_numpy(),(-1,2))) df.to_excel("Output2.xlsx")

Tôi nhận được đầu ra là

0 1 0 Rahul e34 1 Pradeep e44 2 Azhar t54 3 4 Venkat r45 5 Akash e14 6 Vipul r15 7 Fairo e45 8 Akshay e44 9 10 11 12 Pavan e24 13 Asad t14 14 15

Tôi cần đầu ra như hình dưới đây

Rahul e34 Pradeep e44 Azhar t54 Venkat r45 Akash e14 Vipul r15 Fairo e45 Akshay e44 Pavan e24 Asad t14

Hàng 1 (0,1) và cột 1 (0,1,2,3,4 ..... 15) không nên xuất hiện cùng với cách loại bỏ các khoảng trống. Bất cứ ai có thể vui lòng hướng dẫn tôi. Đánh giá cao sự giúp đỡ của bạn.

Chủ đề