Cách so sánh dữ liệu trong python

Chúng tôi cung cấp nhiều lựa chọn các khóa học từ các trường đại học và tổ chức văn hóa hàng đầu từ khắp nơi trên thế giới. Chúng được cung cấp từng bước một và có thể truy cập được trên thiết bị di động, máy tính bảng và máy tính để bàn, vì vậy bạn có thể phù hợp với việc học xung quanh cuộc sống của mình

Chúng tôi tin rằng việc học phải là một trải nghiệm xã hội, thú vị, vì vậy các khóa học của chúng tôi mang đến cơ hội thảo luận những gì bạn đang học với những người khác trong quá trình học, giúp bạn có những khám phá mới mẻ và hình thành những ý tưởng mới
Bạn có thể mở khóa những cơ hội mới với quyền truy cập không giới hạn vào hàng trăm khóa học ngắn hạn trực tuyến trong một năm bằng cách đăng ký gói Không giới hạn của chúng tôi. Xây dựng kiến ​​thức của bạn với các trường đại học và tổ chức hàng đầu

Tìm hiểu thêm về cách FutureLearn đang thay đổi cách tiếp cận giáo dục

Python là một ngôn ngữ tuyệt vời để thực hiện phân tích dữ liệu, chủ yếu là do hệ sinh thái tuyệt vời của các gói Python tập trung vào dữ liệu. Pandas là một trong những gói đó và giúp việc nhập và phân tích dữ liệu dễ dàng hơn nhiều

Điều quan trọng nhất trong Phân tích dữ liệu là so sánh các giá trị và chọn dữ liệu phù hợp. Toán tử “==” cũng hoạt động cho nhiều giá trị trong khung Dữ liệu Pandas. Hai ví dụ sau sẽ chỉ ra cách so sánh và chọn dữ liệu từ khung Dữ liệu Pandas

Trong Python, có nhiều phương pháp có sẵn để so sánh này. Trong bài viết này, chúng ta sẽ tìm hiểu cách So sánh hai tệp khác nhau theo từng dòng. Python hỗ trợ nhiều mô-đun để làm như vậy và ở đây chúng ta sẽ thảo luận về các phương pháp sử dụng các mô-đun khác nhau của nó

Bài viết này sử dụng hai tệp mẫu để thực hiện

Tập tin đang sử dụng

  • tập tin. txt

Cách so sánh dữ liệu trong python

  • tập tin1. txt

Cách so sánh dữ liệu trong python

Phương pháp 1. Sử dụng unity_diff()

Python có một Mô-đun được sử dụng đặc biệt để so sánh sự khác biệt giữa các tệp. Để có sự khác biệt khi sử dụng thư viện difflib, chúng ta phải gọi hàm unity_diff() để so sánh này.  

cú pháp

unity_diff(file1, file2, fromfile, tofile, lineterm)

Tham số

  • tập tin1. Danh sách Chuỗi chẳng hạn như file_1_text
  • tập tin2. Danh sách Chuỗi chẳng hạn như file_2_text
  • từ tập tin. tên tệp đầu tiên với phần mở rộng
  • nộp. tên tệp thứ hai với phần mở rộng
  • tuyến hạn. đối số thành “” để đầu ra sẽ tự động không có dòng mới thống nhất

Tiếp cận

  • Nhập mô-đun
  • Mở tập tin
  • So sánh việc sử dụng unity_diff() với các thuộc tính phù hợp

Thí dụ

Python3




# Importing difflib

import difflib

 

withopen('file1.txt') as file_1:

    file_1_textimport0 import1

 

withopen(import5import6

    import8import0 difflib0

 

difflib1

difflib2 difflib3_______2_______4 difflib5

difflib6difflib7import0'file1.txt'with0

difflib6with2import0_______1_______5with5import0with7

    with9_______4_______0

đầu ra

— tệp1. txt

+++ tập tin2. txt

@@ -1,5 +1,5 @@

Học tập

con trăn

-quá

-đơn giản

+vậy

+dễ dàng

Phương pháp 2. sử dụng khác nhau

Có sẵn một Lớp để so sánh sự khác biệt giữa các tệp có tên là Khác nhau bên trong thư viện difflib. Lớp này được sử dụng để so sánh trình tự các dòng văn bản và tạo ra sự khác biệt hoặc vùng đồng bằng mà con người có thể đọc được

MãÝ nghĩa

‘-‘

dòng duy nhất cho chuỗi 1

'+'

dòng duy nhất cho chuỗi 2

‘ ‘

đường chung cho cả hai dãy

‘?’

dòng không có trong một trong hai chuỗi đầu vào

Tiếp cận

  • Nhập mô-đun
  • Mở tập tin
  • Đọc nội dung dòng bt
  • Gọi hàm so sánh với việc sử dụng đối tượng lớp khác nhau

Thí dụ

Python3




open1 difflibimport open4

 

withopen('file1.txt'open9_______4_______(import5import6

    (5_______1_______0 (7

 

    difflib2 difflib3_______2_______4 'file1.txt'2

difflib6with9open0

đầu ra

Học tập

con trăn

- quá

- đơn giản

+ vậy

+ dễ dàng

Phương pháp 3. Sử dụng vòng lặp while và Phương thức giao nhau

Tiếp cận

  • Mở cả hai tệp ở chế độ đọc
  • Lưu trữ danh sách các chuỗi
  • Bắt đầu so sánh cả hai tệp với sự trợ giúp của phương thức giao nhau () cho các chuỗi phổ biến
  • So sánh cả hai tệp để biết sự khác biệt bằng cách sử dụng vòng lặp while
  • Đóng cả hai tệp

Thí dụ

Python3




'file1.txt'6

'file1.txt'7import0 open('file1.txt'with0) as file_1:3_______7_______4

) as file_1:5import0 open(import5with0) as file_1:3_______7_______4

 

with9(    5with0    7     8 'file1.txt'with0file_1_text1     8 import5file_1_text4import0file_1_text6) as file_1:4