Nếu vậy, bạn sẽ thấy các bước đầy đủ để chọn các hàng từ Pandas DataFrame dựa trên các điều kiện đã chỉ định Show
Các bước để chọn hàng từ Pandas DataFrameBước 1. Thu thập dữ liệu của bạnTrước tiên, bạn sẽ cần thu thập dữ liệu của mình. Dưới đây là một ví dụ về dữ liệu được thu thập về các hộp ColorShapePriceGreenRectangle10GreenRectangle15GreenSquare5BlueRectangle5BlueSquare10RedSquare15RedSquare15RedRectangle5Bước 2. Tạo một khung dữ liệuKhi bạn đã sẵn sàng dữ liệu của mình, bạn sẽ cần tạo DataFrame để thu thập dữ liệu đó trong Python Ví dụ của chúng tôi, bạn có thể sử dụng mã bên dưới để tạo DataFrame import pandas as pd boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'], 'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'], 'Price': [10,15,5,5,10,15,15,5] } df = pd.DataFrame(boxes, columns= ['Color','Shape','Price']) print (df) Chạy mã bằng Python và bạn sẽ thấy DataFrame này
Bước 3. Chọn hàng từ Pandas DataFrameBạn có thể sử dụng logic sau để chọn các hàng từ Pandas DataFrame dựa trên các điều kiện đã chỉ định df. loc[ df[‘tên cột’] điều kiện ] Ví dụ: nếu bạn muốn lấy các hàng có màu xanh lá cây, thì bạn sẽ cần áp dụng df. loc[ df[‘Color’] == ‘Green’ ] Ở đâu
Và đây là mã Python đầy đủ cho ví dụ của chúng tôi import pandas as pd boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'], 'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'], 'Price': [10,15,5,5,10,15,15,5] } df = pd.DataFrame(boxes, columns= ['Color','Shape','Price']) select_color = df.loc[df['Color'] == 'Green'] print (select_color) Khi bạn chạy mã, bạn sẽ nhận được các hàng có màu xanh lục
Các ví dụ bổ sung về việc chọn hàng từ Pandas DataFrameBây giờ chúng ta hãy xem xét các ví dụ bổ sung để hiểu rõ hơn về việc chọn các hàng từ Pandas DataFrame ví dụ 1. Chọn những hàng có giá bằng hoặc lớn hơn 10Để có được tất cả các hàng có giá bằng hoặc lớn hơn 10, bạn cần áp dụng điều kiện này df. loc[df[‘Giá’] >= 10] Và đây là mã Python hoàn chỉnh import pandas as pd boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'], 'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'], 'Price': [10,15,5,5,10,15,15,5] } df = pd.DataFrame(boxes, columns= ['Color','Shape','Price']) select_price = df.loc[df['Price'] >= 10] print (select_price) Chạy mã và bạn sẽ nhận được tất cả các hàng có giá bằng hoặc lớn hơn 10
ví dụ 2. Chọn các hàng có màu xanh lục VÀ hình chữ nhậtBây giờ, mục tiêu là chọn các hàng dựa trên hai điều kiện
Sau đó, bạn có thể sử dụng biểu tượng & để áp dụng nhiều điều kiện. Trong ví dụ của chúng tôi, mã sẽ trông như thế này. df. loc[(df['Color'] == 'Green') & (df['Shape'] == 'Rectangle')] Đặt mọi thứ lại với nhau import pandas as pd boxes = {'Color': ['Green','Green','Green','Blue','Blue','Red','Red','Red'], 'Shape': ['Rectangle','Rectangle','Square','Rectangle','Square','Square','Square','Rectangle'], 'Price': [10,15,5,5,10,15,15,5] } df = pd.DataFrame(boxes, columns= ['Color','Shape','Price']) color_and_shape = df.loc[(df['Color'] == 'Green') & (df['Shape'] == 'Rectangle')] print (color_and_shape) Chạy mã và bạn sẽ nhận được các hàng có màu xanh lục và hình chữ nhật
ví dụ 3. Chọn các hàng có màu xanh lá cây HOẶC hình chữ nhậtBạn cũng có thể chọn các hàng dựa trên điều kiện này hay điều kiện khác. Chẳng hạn, bạn có thể chọn các hàng nếu có màu xanh lá cây hoặc hình dạng là hình chữ nhật Pandas là một công cụ đặc biệt cho phép chúng tôi thực hiện các thao tác dữ liệu phức tạp một cách hiệu quả và hiệu quả. Bên trong gấu trúc, chúng tôi chủ yếu xử lý tập dữ liệu ở dạng DataFrame. DataFrames là cấu trúc dữ liệu 2 chiều trong gấu trúc. DataFrames bao gồm các hàng, cột và dữ liệu Đọc tệp excel ở dạng pandas DataFrame bắt đầu từ hàng 5 và bao gồm cả tiêu đềPandas DataFrames có thể được tạo với sự trợ giúp của từ điển hoặc mảng nhưng trong phân tích trong thế giới thực, trước tiên, tệp csv hoặc tệp xlsx được nhập và sau đó nội dung của tệp csv hoặc excel được chuyển đổi thành DataFrame Tệp xlsx là tệp bảng tính có thể được tạo bằng một số phần mềm nhất định, đặc biệt là với MS Excel nổi tiếng. Để nhập tệp Excel, chúng tôi sử dụng đoạn mã sau ________số 8_______Ở đây, chúng tôi sẽ sử dụng cùng một phương thức như đã đề cập ở trên nhưng chúng tôi sẽ chuyển một tham số có tên là bỏ qua mà chúng tôi sẽ chỉ định một danh sách các hàng bị loại trừ Làm cách nào để trích xuất các hàng cụ thể từ excel trong Python?Nếu bạn có một tệp và bạn muốn phân tích cú pháp dữ liệu trong đó, bạn cần thực hiện các thao tác sau theo thứ tự này. . nhập mô-đun gấu trúc mở tệp bảng tính (hoặc sổ làm việc) chọn một tờ trích xuất các giá trị của các ô dữ liệu cụ thể Cách lấy giá trị hàng trong gấu trúc?Trong Khung dữ liệu Pandas, chúng tôi có thể tìm thấy giá trị hàng được chỉ định bằng sử dụng hàm iloc() . Trong hàm này, chúng tôi chuyển số hàng làm tham số.
Làm cách nào tôi có thể nhận được các hàng và cột cụ thể trong gấu trúc?Bạn có thể sử dụng các hàm loc và iloc để truy cập các cột trong Khung dữ liệu Pandas . Hãy xem làm thế nào. Nếu chúng tôi muốn truy cập một cột nhất định trong Khung dữ liệu của mình, chẳng hạn như cột Điểm, chúng tôi chỉ cần sử dụng hàm loc và chỉ định tên của cột để truy xuất nó. |