Thư viện Pandas trong Python chủ yếu được sử dụng để thao tác và phân tích dữ liệu, nhưng bạn có biết rằng Pandas cũng cho phép định dạng có điều kiện của DataFrames không? Show Định dạng có điều kiện là một tính năng cho phép bạn áp dụng định dạng cụ thể cho các ô đáp ứng các điều kiện nhất định. Nó phổ biến trong các ứng dụng bảng tính như Microsoft Excel và nó giúp thu hút sự chú ý của người xem vào các điểm và giá trị dữ liệu quan trọng. Nó cũng cho phép bạn phân tích trực quan một tập dữ liệu dựa trên màu sắc, giúp làm việc với các tập dữ liệu lớn dễ dàng hơn Trong bài viết này, tôi sẽ cung cấp một hướng dẫn đơn giản về cách bạn có thể áp dụng định dạng có điều kiện trên Pandas DataFrames. Các mã được trình bày trong bài viết này có thể được tìm thấy dưới dạng sổ ghi chép tại repo GitHub này tập dữ liệuTrong bài viết này, chúng tôi sẽ sử dụng bộ dữ liệu Iris tích hợp từ gói Trước khi chúng tôi tìm hiểu sâu hơn, trước tiên cần giới thiệu khái niệm về Pandas DataFrame Styler. Pandas có thuộc tính Quan sát rằng việc gọi Về cơ bản, đối tượng Để biết thêm chi tiết về thuộc tính
Một cách để định dạng có điều kiện Khung dữ liệu Pandas của bạn là đánh dấu các ô đáp ứng các điều kiện nhất định. Để làm như vậy, chúng ta có thể viết một hàm đơn giản và truyền hàm đó vào đối tượng
Bây giờ chúng ta hãy khám phá một vài kịch bản 1. Làm nổi bật bất kỳ ô nào đáp ứng một điều kiệnGiả sử chúng ta muốn đánh dấu tất cả các ô có giá trị là 5. 1 trong DataFrame của chúng tôi 2. Đánh dấu bất kỳ ô nào không đáp ứng điều kiệnLưu ý từ đoạn mã màu trước đó rằng Chúng ta có thể tiến thêm một bước và khái quát hóa chức năng kiểu. Làm như vậy có nghĩa là chúng ta có thể chuyển vào dưới dạng đối số cho hàm, màu sắc để đánh dấu các ô nếu điều kiện là đúng và nếu điều kiện là sai. Đoạn mã dưới đây sẽ hiển thị cùng một đầu ra như trên 3. Đánh dấu các ô chỉ đáp ứng một điều kiện trong các cột đã chọnĐiều gì xảy ra nếu chúng ta chỉ muốn áp dụng tô sáng có điều kiện trên một số cột nhất định, thay vì toàn bộ Khung dữ liệu? Trong mã bên dưới, chúng tôi chỉ áp dụng định dạng có điều kiện trên các cột “sepal_length” và "petal_length” Hình ảnh của tác giả4. Làm nổi bật các hàng dựa trên các giá trị phân loạiChúng tôi cũng có thể đánh dấu các hàng của DataFrame dựa trên các giá trị trong cột phân loại. Điều này sẽ cho phép chúng tôi phân đoạn tập dữ liệu một cách trực quan, điều này đặc biệt hữu ích khi làm việc với các tập dữ liệu lớn. Ở đây nếu chúng ta muốn làm nổi bật các hàng tùy thuộc vào loài hoa, chúng ta có thể làm điều này Hình ảnh của tác giảLưu ý rằng có một vài điểm khác biệt chính trong đoạn mã trên
5. Đánh dấu các cột dựa trên tên cộtChúng tôi cũng có thể đánh dấu các ô dựa trên tên cột. Thay vào đó, chúng ta có thể xác định hàm kiểu để lấy từng cột làm đối số, sau đó áp dụng hàm đó theo cột thông minh bằng cách chỉ định Giả sử chúng ta muốn đánh dấu cột “loài” bằng một màu khác với các cột khác, chúng ta có thể làm điều này Hình ảnh của Tác giả Định dạng văn bản có điều kiệnMột cách khác mà chúng tôi có thể muốn định dạng DataFrame của bạn là tùy chỉnh văn bản trong mỗi ô. Các tình huống được đề cập trong phần trước cũng có thể được áp dụng cho định dạng văn bản Nếu bạn đã nhận ra mẫu, cặp thuộc tính-giá trị CSS để tô sáng ô mà chúng tôi đã định cấu hình sẽ có định dạng sau.
Chúng ta thậm chí có thể chỉ định nhiều loại thuộc tính trong một hàm kiểu duy nhất bằng cách xâu chuỗi chúng bằng dấu chấm phẩy, như thế này. Bây giờ, sau khi thực hiện tất cả các định dạng có điều kiện đó trong Pandas, điều tiếp theo chúng ta có thể muốn làm là xuất DataFrame dưới dạng tệp Excel. Tất nhiên, chúng tôi muốn giữ lại tất cả các định dạng trong tệp Excel đã xuất. Chúng ta có thể làm điều này bằng cách sử dụng phương thức Rất nhiều đã được bảo hiểm cho đến nay. Hãy đặt những ý tưởng này vào ngữ cảnh thông qua một ví dụ cụ thể. Giả sử chúng tôi muốn định dạng DataFrame
Hãy làm việc qua ví dụ này từng bước Bước 1. Đánh dấu các hàng dựa trên loài hoa Chúng tôi đã làm điều này trước đây, với chức năng kiểu Bước 2. Đặt màu và độ đậm của phông chữ khi chiều dài hoặc chiều rộng của vùng kín nằm trong khoảng từ 3. 5mm và 5. 5mm Vì chúng ta quan tâm đến các giá trị của chiều dài và chiều rộng của vách ngăn, nên chúng ta có thể xác định một hàm kiểu nhận giá trị ô làm đối số, sau đó sử dụng Ở đây, chúng tôi đang định dạng màu phông chữ và độ đậm của phông chữ, vì vậy chuỗi CSS mà hàm kiểu sẽ trả về cần phải ở định dạng Bước 3. Đặt kích thước và loại phông chữ khi chiều dài hoặc chiều rộng của cánh hoa nằm trong khoảng 1. 5mm và 3. 5mm Tương tự, chúng tôi xác định một hàm kiểu khác để trả về một chuỗi CSS ở định dạng Bước 4. Xuất dưới dạng tệp Excel Được rồi, Khung dữ liệu của chúng tôi bắt đầu trông kỳ lạ, vì vậy chúng tôi sẽ ngừng định dạng nó. Tôi chắc chắn rằng bạn có được sự trôi dạt. Hãy làm một điều cuối cùng - xuất nó dưới dạng tệp Excel Hình ảnh của tác giảDường như có một số vấn đề khi giữ lại định dạng loại phông chữ, nhưng phần còn lại của định dạng có vẻ ổn Các nguồn lực khácVì
Xin chúc mừng. Bạn đã học những kiến thức cơ bản về định dạng có điều kiện trong Pandas. Tóm tắt nhanh — Bạn đã hiểu vai trò của đối tượng Pandas DataFrame Styler trong việc tùy chỉnh cách hiển thị DataFrame. Bạn đã học cách sử dụng CSS ở định dạng Bạn cũng đã xem cách xuất đối tượng
|