Pandas lấy hàng excel

Nếu vậy, bạn sẽ thấy các bước đầy đủ để chọn các hàng từ Pandas DataFrame dựa trên các điều kiện đã chỉ định

Các bước để chọn hàng từ Pandas DataFrame

Bước 1. Thu thập dữ liệu của bạn

Trước tiên, bạn sẽ cần thu thập dữ liệu của mình. Dưới đây là một ví dụ về dữ liệu được thu thập về các hộp

ColorShapePriceGreenRectangle10GreenRectangle15GreenSquare5BlueRectangle5BlueSquare10RedSquare15RedSquare15RedRectangle5

Bước 2. Tạo một khung dữ liệu

Khi bạn đã sẵn sàng dữ liệu của mình, bạn sẽ cần tạo DataFrame để thu thập dữ liệu đó trong Python

Ví dụ của chúng tôi, bạn có thể sử dụng mã bên dưới để tạo DataFrame

import pandas as pd

boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'],
         'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'],
         'Price': [10,15,5,5,10,15,15,5]
        }

df = pd.DataFrame(boxes, columns= ['Color','Shape','Price'])
print (df)

Chạy mã bằng Python và bạn sẽ thấy DataFrame này

   Color      Shape  Price
0  Green  Rectangle     10
1  Green  Rectangle     15
2  Green     Square      5
3   Blue  Rectangle      5
4   Blue     Square     10
5    Red     Square     15
6    Red     Square     15
7    Red  Rectangle      5

Bước 3. Chọn hàng từ Pandas DataFrame

Bạn có thể sử dụng logic sau để chọn các hàng từ Pandas DataFrame dựa trên các điều kiện đã chỉ định

df. loc[ df[‘tên cột’] điều kiện ]

Ví dụ: nếu bạn muốn lấy các hàng có màu xanh lá cây, thì bạn sẽ cần áp dụng

df. loc[ df[‘Color’] == ‘Green’ ]

Ở đâu

  • Màu là tên cột
  • Màu xanh lá cây là điều kiện

Và đây là mã Python đầy đủ cho ví dụ của chúng tôi

import pandas as pd

boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'],
         'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'],
         'Price': [10,15,5,5,10,15,15,5]
        }

df = pd.DataFrame(boxes, columns= ['Color','Shape','Price'])

select_color = df.loc[df['Color'] == 'Green']
print (select_color)

Khi bạn chạy mã, bạn sẽ nhận được các hàng có màu xanh lục

   Color      Shape  Price
0  Green  Rectangle     10
1  Green  Rectangle     15
2  Green     Square      5

Các ví dụ bổ sung về việc chọn hàng từ Pandas DataFrame

Bây giờ chúng ta hãy xem xét các ví dụ bổ sung để hiểu rõ hơn về việc chọn các hàng từ Pandas DataFrame

ví dụ 1. Chọn những hàng có giá bằng hoặc lớn hơn 10

Để có được tất cả các hàng có giá bằng hoặc lớn hơn 10, bạn cần áp dụng điều kiện này

df. loc[df[‘Giá’] >= 10]

Và đây là mã Python hoàn chỉnh

import pandas as pd

boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'],
         'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'],
         'Price': [10,15,5,5,10,15,15,5]
        }

df = pd.DataFrame(boxes, columns= ['Color','Shape','Price'])

select_price = df.loc[df['Price'] >= 10]
print (select_price)

Chạy mã và bạn sẽ nhận được tất cả các hàng có giá bằng hoặc lớn hơn 10

   Color      Shape  Price
0  Green  Rectangle     10
1  Green  Rectangle     15
4   Blue     Square     10
5    Red     Square     15
6    Red     Square     15

ví dụ 2. Chọn các hàng có màu xanh lục VÀ hình chữ nhật

Bây giờ, mục tiêu là chọn các hàng dựa trên hai điều kiện

  • Màu xanh lá cây;
  • Hình dạng là hình chữ nhật

Sau đó, bạn có thể sử dụng biểu tượng & để áp dụng nhiều điều kiện. Trong ví dụ của chúng tôi, mã sẽ trông như thế này.

df. loc[(df['Color'] == 'Green') & (df['Shape'] == 'Rectangle')]

Đặt mọi thứ lại với nhau

import pandas as pd

boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'],
         'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'],
         'Price': [10,15,5,5,10,15,15,5]
        }

df = pd.DataFrame(boxes, columns= ['Color','Shape','Price'])

color_and_shape = df.loc[(df['Color'] == 'Green') & (df['Shape'] == 'Rectangle')]
print (color_and_shape)

Chạy mã và bạn sẽ nhận được các hàng có màu xanh lục và hình chữ nhật

   Color      Shape  Price
0  Green  Rectangle     10
1  Green  Rectangle     15

ví dụ 3. Chọn các hàng có màu xanh lá cây HOẶC hình chữ nhật

Bạn cũng có thể chọn các hàng dựa trên điều kiện này hay điều kiện khác. Chẳng hạn, bạn có thể chọn các hàng nếu có màu xanh lá cây hoặc hình dạng là hình chữ nhật

Pandas là một công cụ đặc biệt cho phép chúng tôi thực hiện các thao tác dữ liệu phức tạp một cách hiệu quả và hiệu quả. Bên trong gấu trúc, chúng tôi chủ yếu xử lý tập dữ liệu ở dạng DataFrame. DataFrames là cấu trúc dữ liệu 2 chiều trong gấu trúc. DataFrames bao gồm các hàng, cột và dữ liệu

Đọc tệp excel ở dạng pandas DataFrame bắt đầu từ hàng 5 và bao gồm cả tiêu đề

Pandas DataFrames có thể được tạo với sự trợ giúp của từ điển hoặc mảng nhưng trong phân tích trong thế giới thực, trước tiên, tệp csv hoặc tệp xlsx được nhập và sau đó nội dung của tệp csv hoặc excel được chuyển đổi thành DataFrame

Tệp xlsx là tệp bảng tính có thể được tạo bằng một số phần mềm nhất định, đặc biệt là với MS Excel nổi tiếng. Để nhập tệp Excel, chúng tôi sử dụng đoạn mã sau

________số 8_______

Ở đây, chúng tôi sẽ sử dụng cùng một phương thức như đã đề cập ở trên nhưng chúng tôi sẽ chuyển một tham số có tên là bỏ qua mà chúng tôi sẽ chỉ định một danh sách các hàng bị loại trừ

Làm cách nào để trích xuất các hàng cụ thể từ excel trong Python?

Nếu bạn có một tệp và bạn muốn phân tích cú pháp dữ liệu trong đó, bạn cần thực hiện các thao tác sau theo thứ tự này. .
nhập mô-đun gấu trúc
mở tệp bảng tính (hoặc sổ làm việc)
chọn một tờ
trích xuất các giá trị của các ô dữ liệu cụ thể

Cách lấy giá trị hàng trong gấu trúc?

Trong Khung dữ liệu Pandas, chúng tôi có thể tìm thấy giá trị hàng được chỉ định bằng sử dụng hàm iloc() . Trong hàm này, chúng tôi chuyển số hàng làm tham số.

Làm cách nào tôi có thể nhận được các hàng và cột cụ thể trong gấu trúc?

Bạn có thể sử dụng các hàm loc và iloc để truy cập các cột trong Khung dữ liệu Pandas . Hãy xem làm thế nào. Nếu chúng tôi muốn truy cập một cột nhất định trong Khung dữ liệu của mình, chẳng hạn như cột Điểm, chúng tôi chỉ cần sử dụng hàm loc và chỉ định tên của cột để truy xuất nó.