Đọc nhiều dữ liệu từ tệp nhị phân trong Python
Ghi chú. Các tệp nhị phân luôn được ghi ở dạng cấu trúc và sau đó nó được chuyển đổi thành luồng byte trước khi lưu trữ thành tệp nhị phân. Theo cấu trúc từ tôi muốn nói ở các định dạng như danh sách, bộ dữ liệu, bộ, từ điển, v.v.
Rất quan trọng. Nếu chúng tôi đang đọc hồ sơ của một học sinh (số thứ tự, tên, lớp, phần, v.v. ) trong tệp nhị phân, thì tất cả chúng ta đều biết rằng chúng ta sẽ nhận được một danh sách, bộ dữ liệu, từ điển, v.v. lưu trữ các chi tiết của một sinh viên.
Để lưu trữ hồ sơ của nhiều sinh viên, chúng tôi đã sử dụng khái niệm danh sách lồng nhau trong chủ đề trước của chúng tôi. Do đó, nếu chúng ta đọc hồ sơ của tất cả sinh viên thì chúng ta sẽ nhận được đầu ra dưới dạng danh sách lồng nhau, tức là
tệp. “Abc. dữ liệu”
Chúng tôi đang lưu trữ hồ sơ của hai học sinh (số thứ tự, tên, lớp, phần, v.v. ) trong Tệp nhị phân của chúng tôi. Đây không phải là cách hoàn hảo để có được kết quả. Chúng tôi sẽ cố gắng để có được kết quả ở định dạng hoàn hảo có thể đọc được
Phương pháp giải quyết vấn đề. Chúng tôi đang lấy vòng lặp lồng nhau làm đầu ra khi chúng tôi đã lưu trữ nhiều bản ghi trong tệp nhị phân của mình. Vì vậy, ở đây, cách tiếp cận của chúng tôi là lấy từng bản ghi của học sinh để hiển thị trong mỗi dòng để dễ đọc. Chúng ta có vòng lặp lồng nhau, vì vậy ở đây chúng ta có thể sử dụng vòng lặp for cùng với phương thức load() để hiển thị từng bản ghi.
ví dụ 1
đầu ra
Giải thích. Tôi đã chỉ cho bạn cả hai đoạn mã để đọc dữ liệu từ tệp nhị phân. Chúng ta đã định nghĩa hai hàm đầu tiên là read() và hàm thứ hai là read2(). Để đọc hoặc ghi tệp nhị phân, trước tiên, bạn cần hiểu các chế độ tệp khác nhau cho Tệp nhị phân trong Python −
ModeDescriptionrbMở một tệp chỉ để đọc ở định dạng nhị phân. Con trỏ tệp được đặt ở đầu tệp. Đây là chế độ mặc định. rb+Mở tệp cho cả đọc và ghi ở định dạng nhị phân. Con trỏ tệp đặt ở đầu tệp. wbMở một tệp chỉ để ghi ở định dạng nhị phân. Ghi đè tệp nếu tệp tồn tại. Nếu tệp không tồn tại, hãy tạo một tệp mới để ghi. wb+Mở tệp cho cả ghi và đọc ở định dạng nhị phân. Ghi đè lên tệp hiện có nếu tệp tồn tại. Nếu tệp không tồn tại, hãy tạo một tệp mới để đọc và ghi. abMở tệp để nối thêm ở định dạng nhị phân. Con trỏ tệp ở cuối tệp nếu tệp tồn tại. Tức là tệp đang ở chế độ chắp thêm. Nếu tệp không tồn tại, nó sẽ tạo một tệp mới để ghi. ab+Mở tệp cho cả việc nối thêm và đọc ở định dạng nhị phân. Con trỏ tệp ở cuối tệp nếu tệp tồn tại. Tệp mở ở chế độ chắp thêm. Nếu tệp không tồn tại, nó sẽ tạo một tệp mới để đọc và ghiĐọc một tập tin nhị phân
Giả sử chúng ta có một tệp nhị phân. Chúng ta có thể đọc nó bằng phương thức read(). Đầu tiên, chúng ta sẽ mở Tệp nhị phân bằng chế độ rb của phương thức open(). Chúng tôi có tệp nguồn sau trong D. ổ đĩa -
Thí dụ
Hãy xem mã hoàn chỉnh
đầu ra
Tệp nhị phân không thể đọc được và nội dung không thể nhận dạng được. Sản lượng thực tế lớn hơn. Chúng tôi chỉ hiển thị một số phần bên dưới
Trong Python, mô-đun cung cấp các phương thức của ba loại hoạt động IO; . Cách chính tắc để tạo một đối tượng tệp là sử dụng hàm
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
2Mọi thao tác với tệp có thể được thực hiện theo ba bước sau
- Mở tệp để lấy đối tượng tệp bằng hàm open() tích hợp. Có các chế độ truy cập khác nhau mà bạn có thể chỉ định trong khi mở tệp bằng hàm open()
- Thực hiện các thao tác đọc, ghi, chắp thêm bằng cách sử dụng đối tượng tệp được lấy từ hàm
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
2 - Đóng và xử lý đối tượng tệp
Đọc tập tin
Đối tượng tệp bao gồm các phương thức sau để đọc dữ liệu từ tệp
- đọc (ký tự). đọc số lượng ký tự được chỉ định bắt đầu từ vị trí hiện tại
- dòng đọc (). đọc các ký tự bắt đầu từ vị trí đọc hiện tại cho đến một ký tự xuống dòng
- đường đọc (). đọc tất cả các dòng cho đến khi kết thúc tệp và trả về một đối tượng danh sách
Tệp
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
4 sau đây sẽ được sử dụng trong tất cả các ví dụ về đọc và ghi tệpC. \tập tin của tôi. txt
Sao chépThis is the first line.
This is the second line.
This is the third line.
Ví dụ sau thực hiện thao tác đọc bằng phương thức
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
5Thí dụ. Đọc một tập tin
Sao chép>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
Ở trên,
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
6 mở >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
7 ở chế độ đọc mặc định từ thư mục hiện tại và trả về một. Hàm >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
8 đọc tất cả nội dung cho đến khi EOF dưới dạng chuỗi. Nếu bạn chỉ định đối số kích thước ký tự trong phương thức >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
5, thì nó sẽ chỉ đọc nhiều ký tự đó. >>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
0 sẽ xóa và đóng luồngđọc một dòng
Ví dụ sau minh họa việc đọc một dòng từ tệp
Thí dụ. đọc dòng
Sao chép>>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
Như bạn có thể thấy, chúng tôi phải mở tệp ở chế độ
>>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
1. Phương thức >>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
2 sẽ trả về dòng đầu tiên và sau đó sẽ trỏ đến dòng thứ hai trong tệpĐọc tất cả các dòng
Phần sau đây đọc tất cả các dòng bằng hàm
>>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
3Thí dụ. Đọc một tập tin
Sao chép>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.readlines() # reading all lines
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
Đối tượng tệp có một trình vòng lặp sẵn có. Chương trình sau đây đọc từng dòng tệp đã cho cho đến khi
>>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
4 được nâng lên, tôi. e. , EOF đạt đượcThí dụ. Trình lặp tệp
Sao chépf=open('C:\myfile.txt')
while True:
try:
line=next(f)
print(line)
except StopIteration:
break
f.close()
Sử dụng vòng lặp for để đọc tệp dễ dàng
Thí dụ. Đọc tệp bằng vòng lặp For
Sao chépf=open('C:\myfile.txt')
for line in f:
print(line)
f.close()
đầu ra
This is the first line.
This is the second line.
This is the third line.
Đọc tệp nhị phân
Sử dụng chế độ 'rb' trong hàm
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
2 để đọc tệp nhị phân, như hình bên dướiThí dụ. Đọc một tập tin
Sao chép>>> f = open('C:\myimg.png', 'rb') # opening a binary file
>>> content = f.read() # reading all lines
>>> content
b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x00\x08\x00\x00\x00\x08\x08\x06
\x00\x00\x00\xc4\x0f\xbe\x8b\x00\x00\x00\x19tEXtSoftware\x00Adobe ImageReadyq
\xc9e\x00\x00\x00\x8dIDATx\xdab\xfc\xff\xff?\x03\x0c0/zP\n\xa4b\x818\xeco\x9c
\xc2\r\x90\x18\x13\x03*8\t\xc4b\xbc\x01\xa8X\x07$\xc0\xc8\xb4\xf0>\\\x11P\xd7?
\xa0\x84\r\x90\xb9\t\x88?\x00q H\xc1C\x16\xc9\x94_\xcc\x025\xfd2\x88\xb1\x04
\x88\x85\x90\x14\xfc\x05\xe2( \x16\x00\xe2\xc3\x8c\xc8\x8e\x84:\xb4\x04H5\x03
\xf1\\ .bD\xf3E\x01\x90\xea\x07\xe2\xd9\xaeB`\x82'
>>> f.close() # closing file object
Viết vào một tập tin
Đối tượng tệp cung cấp các phương thức sau để ghi vào tệp
- viết (s). Viết chuỗi s vào luồng và trả về số ký tự đã viết
- dòng viết (dòng). Viết danh sách các dòng vào luồng. Mỗi dòng phải có dấu phân cách ở cuối dòng
Tạo một tệp mới và ghi
Sau đây tạo một tệp mới nếu nó không tồn tại hoặc ghi đè lên một tệp hiện có
Thí dụ. Tạo hoặc ghi đè lên tệp hiện có
Sao chép>>> f = open('C:\myfile.txt','w')
>>> f.write("Hello") # writing to file
5
>>> f.close()
# reading file
>>> f = open('C:\myfile.txt','r')
>>> f.read()
'Hello'
>>> f.close()
Trong ví dụ trên, câu lệnh
>>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
6 mở >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
7 ở chế độ ghi, phương thức >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
2 trả về đối tượng tệp và gán nó cho một biến >>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
9. >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.readlines() # reading all lines
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
0 chỉ định rằng tệp có thể ghi được. Tiếp theo, >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.readlines() # reading all lines
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
1 ghi đè nội dung hiện có của tệp >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
7. Nó trả về số ký tự được ghi vào một tệp, là 5 trong ví dụ trên. Cuối cùng, >>> f = open('C:\myfile.txt') # opening a file
>>> line1 = f.readline() # reading a line
>>> line1
'This is the first line. \n'
>>> line2 = f.readline() # reading a line
>>> line2
'This is the second line.\n'
>>> line3 = f.readline() # reading a line
>>> line3
'This is the third line.'
>>> line4 = f.readline() # reading a line
>>> line4
''
>>> f.close() # closing file object
0 đóng đối tượng tệpNối vào một tệp hiện có
Phần sau nối thêm nội dung vào cuối tệp hiện có bằng cách chuyển chế độ
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.readlines() # reading all lines
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
4 hoặc >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.readlines() # reading all lines
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
5 trong phương thức >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
2Thí dụ. Nối vào tệp hiện có
Sao chép>>> f = open('C:\myfile.txt','a')
>>> f.write(" World!")
7
>>> f.close()
# reading file
>>> f = open('C:\myfile.txt','r')
>>> f.read()
'Hello World!'
>>> f.close()
Viết nhiều dòng
Python cung cấp phương thức
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.readlines() # reading all lines
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
7 để lưu nội dung của đối tượng danh sách vào tệp. Vì ký tự dòng mới không được ghi tự động vào tệp nên nó phải được cung cấp như một phần của chuỗiThí dụ. Viết dòng vào tập tin
Sao chép>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
0Việc mở tệp bằng chế độ "w" hoặc chế độ "a" chỉ có thể được ghi vào và không thể đọc được từ. Tương tự, chế độ "r" chỉ cho phép đọc và không ghi. Để thực hiện các thao tác đọc/chắp thêm đồng thời, hãy sử dụng chế độ "a+"
Ghi vào tệp nhị phân
Hàm
>>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.read() # reading a file
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
2 mở tệp ở định dạng văn bản theo mặc định. Để mở tệp ở định dạng nhị phân, hãy thêm >>> f = open('C:\myfile.txt') # opening a file
>>> lines = f.readlines() # reading all lines
>>> lines
'This is the first line. \nThis is the second line.\nThis is the third line.'
>>> f.close() # closing file object
9 vào thông số chế độ. Do đó, chế độ f=open('C:\myfile.txt')
while True:
try:
line=next(f)
print(line)
except StopIteration:
break
f.close()
0 mở tệp ở định dạng nhị phân để đọc, trong khi chế độ f=open('C:\myfile.txt')
while True:
try:
line=next(f)
print(line)
except StopIteration:
break
f.close()
1 mở tệp ở định dạng nhị phân để ghi. Không giống như tệp văn bản, tệp nhị phân không thể đọc được bằng con người. Khi mở bằng bất kỳ trình soạn thảo văn bản nào, dữ liệu không thể nhận dạng đượcĐoạn mã sau lưu trữ danh sách các số trong tệp nhị phân. Danh sách đầu tiên được chuyển đổi trong một mảng byte trước khi viết. Hàm tích hợp bytearray() trả về một biểu diễn byte của đối tượng
Chúng ta có thể đọc tệp nhị phân bằng Python không?
Làm cách nào để đọc chuỗi nhị phân trong Python?
Phương pháp #1. Dữ liệu nhị phân được chia thành các bộ 7 bit vì bộ nhị phân này làm đầu vào, trả về giá trị thập phân tương ứng là mã ASCII của ký tự của một chuỗi. Mã ASCII này sau đó được chuyển đổi thành chuỗi bằng hàm chr() .