Hướng dẫn what are binary files in python? - tệp nhị phân trong python là gì?

Tệp nhị phân là gì?

Một tệp nhị phân là một tệp có nội dung ở định dạng nhị phân bao gồm một loạt các byte tuần tự, mỗi loại có chiều dài tám bit. Nội dung phải được giải thích bởi một chương trình hoặc bộ xử lý phần cứng hiểu trước chính xác cách nội dung đó được định dạng và cách đọc dữ liệu. Các tệp nhị phân bao gồm một loạt các loại tệp, bao gồm các tệp thực thi, thư viện, đồ họa, cơ sở dữ liệu, tài liệu lưu trữ và nhiều loại khác.

Các tệp điện tử thường được phân loại thành tệp nhị phân hoặc tệp văn bản. Có thể lập luận rằng các tệp văn bản cũng là một loại tệp nhị phân bởi vì, giống như bất kỳ tệp điện tử nào, chúng được tạo thành từ các chuỗi byte. Tuy nhiên, cả hai thường được coi là các loại khác nhau. Các tệp văn bản ở định dạng có thể đọc được của con người và thường tuân thủ các bộ ký tự cụ thể, chẳng hạn như Unicode.

Một tệp nhị phân được sử dụng như thế nào?

Các tệp nhị phân không thể đọc được của con người và yêu cầu một chương trình đặc biệt hoặc bộ xử lý phần cứng biết cách đọc dữ liệu bên trong tệp. Chỉ sau đó các hướng dẫn được mã hóa trong nội dung nhị phân mới được hiểu và xử lý đúng cách.

Ảnh chụp màn hình sau đây hiển thị một phần nội dung từ tệp trên máy tính Mac. Nội dung chỉ có thể được hiểu bởi các kiến ​​trúc hệ thống cụ thể như Mac. Tệp trong hình này là một tệp nhị phân thực thi UNIX. Như điển hình với các tệp nhị phân, nội dung của tệp là một loạt các byte tuần tự, được xếp hàng lần lượt. Mặc dù chúng ta có thể xem các byte tạo ra dữ liệu nhị phân, tệp chỉ có thể được giải thích đúng bởi nền tảng đích.

Hướng dẫn what are binary files in python? - tệp nhị phân trong python là gì?
Ví dụ về một tệp nhị phân, bao gồm một loạt các byte tuần tự được xếp hàng lần lượt và chỉ có thể được giải thích đúng bởi nền tảng đích - trong trường hợp này là UNIX.

Một tệp nhị phân thường bao gồm một số loại tiêu đề cho biết loại tệp. Tiêu đề có thể bao gồm một vài ký tự có thể đọc được của con người, nhưng toàn bộ tệp nhị phân đòi hỏi phần mềm hoặc phần cứng cụ thể để đọc tệp và hành động. Mặt khác, người dùng có thể mở một tệp văn bản trong một loạt các trình soạn thảo và hiểu được nội dung mà không cần bất kỳ loại phiên dịch đặc biệt nào.

Các tệp nhị phân thường được sử dụng khi xây dựng các ứng dụng và các loại phần mềm khác. Tuy nhiên, các nhà phát triển không làm việc trực tiếp với các tệp nhị phân. Thay vào đó, họ xây dựng các ứng dụng của mình bằng ngôn ngữ lập trình cấp cao như C ++ hoặc Java. Các ngôn ngữ sử dụng các tệp văn bản có thể đọc được của con người để xác định logic ứng dụng.

Tại một số khoảng thời gian nhất định trong quá trình phát triển, các tệp văn bản được gửi đến trình biên dịch dịch mã nguồn thành mã máy, mã byte hoặc ngôn ngữ lập trình khác. Nếu trình biên dịch tạo mã byte, mã byte cuối cùng sẽ được chuyển đổi thành mã máy.

Mã máy được gửi đến bộ xử lý của máy tính dưới dạng tệp nhị phân. Các tệp mã máy phải nhắm mục tiêu một nền tảng máy tính cụ thể, đề cập đến sự kết hợp giữa hệ điều hành và kiến ​​trúc phần cứng. Ví dụ, mã máy nhị phân có thể nhắm mục tiêu Windows và dòng bộ vi xử lý Intel hoặc nó có thể nhắm mục tiêu MacOS và chip Apple M-Series. Một trình biên dịch khác thường được yêu cầu cho mỗi nền tảng máy tính.

Nói chung, các chương trình thực thi-hoặc sẵn sàng để chạy-được xác định là các tệp nhị phân và được đưa ra một phần mở rộng tên tệp như .bin hoặc .exe. Các lập trình viên thường nói về một chương trình thực thi dưới dạng nhị phân hoặc sẽ gọi các tệp ứng dụng được biên dịch của họ dưới dạng nhị phân. Các loại tệp này cũng có thể được gọi là mã đối tượng.

Về mặt truyền các tệp từ nơi này sang nơi khác, một tệp có thể được truyền dưới dạng nhị phân, có nghĩa là các chương trình xử lý nó không cố gắng nhìn trong đó hoặc thay đổi nó. Thay vào đó, họ chỉ vượt qua nó như một phần của những cái và số không, ý nghĩa của nó không được biết đến với bất kỳ thiết bị mạng nào.

Tìm hiểu sự khác biệt giữa các ngôn ngữ được giải thích so với các ngôn ngữ được biên dịch, lập trình bắt buộc so với mệnh lệnh và ngôn ngữ lập trình nguồn mở của Kotlin so với Swift.

Điều này đã được cập nhật lần cuối vào tháng 6 năm 2022June 2022

Tiếp tục đọc về tệp nhị phân

  • Đánh giá các ưu và nhược điểm của nền tảng mã thấp
  • Các ngôn ngữ lập trình theo yêu cầu, các nhà phát triển nên được biết
  • 11 nhà phát triển ngôn ngữ lập trình đám mây cần biết
  • Những điều cơ bản của việc làm việc với các ngôn ngữ lập trình khai báo
  • Ngôn ngữ lập trình kỹ sư DevOps quan trọng để học

Các tệp nhị phân có nghĩa là gì?

Một tệp nhị phân là một tệp có nội dung ở định dạng nhị phân bao gồm một loạt các byte tuần tự, mỗi loại có chiều dài tám bit. Nội dung phải được giải thích bởi một chương trình hoặc bộ xử lý phần cứng hiểu trước chính xác cách nội dung đó được định dạng và cách đọc dữ liệu.a file whose content is in a binary format consisting of a series of sequential bytes, each of which is eight bits in length. The content must be interpreted by a program or a hardware processor that understands in advance exactly how that content is formatted and how to read the data.

Các tệp nhị phân được sử dụng cho trong Python là gì?

Chủ yếu có hai loại tệp dữ liệu - tệp văn bản và tệp nhị phân.Một tệp văn bản bao gồm các ký tự có thể đọc được của con người, có thể được mở bởi bất kỳ trình soạn thảo văn bản nào.Mặt khác, các tệp nhị phân được tạo thành từ các ký tự và ký hiệu không thể đọc được con người, yêu cầu các chương trình cụ thể để truy cập nội dung của nó.require specific programs to access its contents.

Các tệp nhị phân của Python có phải là tệp nhị phân không?

Python có các công cụ để làm việc với các tệp nhị phân.Tệp nhị phân sử dụng chuỗi loại byte.Điều này có nghĩa là khi đọc dữ liệu nhị phân từ một tệp, một đối tượng loại byte được trả về.Tệp nhị phân được mở bằng hàm Open (), có tham số chế độ chứa ký tự 'B'.. Binary files use strings of type bytes. This means when reading binary data from a file, an object of type bytes is returned. The binary file is opened using the open() function, whose mode parameter contains the character 'b'.

Ví dụ về tệp nhị phân là gì?

Các tập tin nhị phân có thể được sử dụng để lưu trữ bất kỳ dữ liệu nào;Ví dụ: hình ảnh JPEG là một tệp nhị phân được thiết kế để đọc bởi một hệ thống máy tính.Dữ liệu bên trong một tệp nhị phân được lưu trữ dưới dạng byte thô, không thể đọc được con người.a JPEG image is a binary file designed to be read by a computer system. The data inside a binary file is stored as raw bytes, which is not human readable.