Chúng tôi cung cấp nhiều lựa chọn các khóa học từ các trường đại học và tổ chức văn hóa hàng đầu từ khắp nơi trên thế giới. Chúng được cung cấp từng bước một và có thể truy cập được trên thiết bị di động, máy tính bảng và máy tính để bàn, vì vậy bạn có thể phù hợp với việc học xung quanh cuộc sống của mình
Chúng tôi tin rằng việc học phải là một trải nghiệm xã hội, thú vị, vì vậy các khóa học của chúng tôi mang đến cơ hội thảo luận những gì bạn đang học với những người khác trong quá trình học, giúp bạn có những khám phá mới mẻ và hình thành những ý tưởng mới
Bạn có thể mở khóa những cơ hội mới với quyền truy cập không giới hạn vào hàng trăm khóa học ngắn hạn trực tuyến trong một năm bằng cách đăng ký gói Không giới hạn của chúng tôi. Xây dựng kiến thức của bạn với các trường đại học và tổ chức hàng đầu
Tìm hiểu thêm về cách FutureLearn đang thay đổi cách tiếp cận giáo dục
Python là một ngôn ngữ tuyệt vời để thực hiện phân tích dữ liệu, chủ yếu là do hệ sinh thái tuyệt vời của các gói Python tập trung vào dữ liệu. Pandas là một trong những gói đó và giúp việc nhập và phân tích dữ liệu dễ dàng hơn nhiều
Điều quan trọng nhất trong Phân tích dữ liệu là so sánh các giá trị và chọn dữ liệu phù hợp. Toán tử “==” cũng hoạt động cho nhiều giá trị trong khung Dữ liệu Pandas. Hai ví dụ sau sẽ chỉ ra cách so sánh và chọn dữ liệu từ khung Dữ liệu Pandas
Trong Python, có nhiều phương pháp có sẵn để so sánh này. Trong bài viết này, chúng ta sẽ tìm hiểu cách So sánh hai tệp khác nhau theo từng dòng. Python hỗ trợ nhiều mô-đun để làm như vậy và ở đây chúng ta sẽ thảo luận về các phương pháp sử dụng các mô-đun khác nhau của nó
Bài viết này sử dụng hai tệp mẫu để thực hiện
Tập tin đang sử dụng
- tập tin. txt
- tập tin1. txt
Phương pháp 1. Sử dụng unity_diff()
Python có một Mô-đun được sử dụng đặc biệt để so sánh sự khác biệt giữa các tệp. Để có sự khác biệt khi sử dụng thư viện difflib, chúng ta phải gọi hàm unity_diff() để so sánh này.
cú pháp
unity_diff(file1, file2, fromfile, tofile, lineterm)
Tham số
- tập tin1. Danh sách Chuỗi chẳng hạn như file_1_text
- tập tin2. Danh sách Chuỗi chẳng hạn như file_2_text
- từ tập tin. tên tệp đầu tiên với phần mở rộng
- nộp. tên tệp thứ hai với phần mở rộng
- tuyến hạn. đối số thành “” để đầu ra sẽ tự động không có dòng mới thống nhất
Tiếp cận
- Nhập mô-đun
- Mở tập tin
- So sánh việc sử dụng unity_diff() với các thuộc tính phù hợp
Thí dụ
Python3
# Importing difflib
import difflib
withopen('file1.txt') as file_1:
file_1_textimport0 import1
withopen(import5import6
import8import0 difflib0
difflib1
difflib2 difflib3_______2_______4 difflib5
difflib6difflib7import0'file1.txt'with0
difflib6with2import0_______1_______5with5import0with7
with9_______4_______0
đầu ra
— tệp1. txt
+++ tập tin2. txt
@@ -1,5 +1,5 @@
Học tập
con trăn
Là
-quá
-đơn giản
+vậy
+dễ dàng
Phương pháp 2. sử dụng khác nhau
Có sẵn một Lớp để so sánh sự khác biệt giữa các tệp có tên là Khác nhau bên trong thư viện difflib. Lớp này được sử dụng để so sánh trình tự các dòng văn bản và tạo ra sự khác biệt hoặc vùng đồng bằng mà con người có thể đọc được
MãÝ nghĩa‘-‘
dòng duy nhất cho chuỗi 1'+'
dòng duy nhất cho chuỗi 2‘ ‘
đường chung cho cả hai dãy‘?’
dòng không có trong một trong hai chuỗi đầu vàoTiếp cận
- Nhập mô-đun
- Mở tập tin
- Đọc nội dung dòng bt
- Gọi hàm so sánh với việc sử dụng đối tượng lớp khác nhau
Thí dụ
Python3
open1 difflibimport open4
withopen('file1.txt'open9_______4_______(import5import6
(5_______1_______0 (7
difflib2 difflib3_______2_______4 'file1.txt'2
difflib6with9open0
đầu ra
Học tập
con trăn
Là
- quá
- đơn giản
+ vậy
+ dễ dàng
Phương pháp 3. Sử dụng vòng lặp while và Phương thức giao nhau
Tiếp cận
- Mở cả hai tệp ở chế độ đọc
- Lưu trữ danh sách các chuỗi
- Bắt đầu so sánh cả hai tệp với sự trợ giúp của phương thức giao nhau () cho các chuỗi phổ biến
- So sánh cả hai tệp để biết sự khác biệt bằng cách sử dụng vòng lặp while
- Đóng cả hai tệp
Thí dụ
Python3
'file1.txt'6
'file1.txt'7import0 open('file1.txt'with0) as file_1:3_______7_______4
) as file_1:5import0 open(import5with0) as file_1:3_______7_______4
with9( 5with0 7 8 'file1.txt'with0file_1_text1 8 import5file_1_text4import0file_1_text6) as file_1:4