Trong hướng dẫn này, chúng tôi sẽ tìm hiểu về phương thức Python String Encode () với sự trợ giúp của các ví dụ. Show
Phương thức string.encode(encoding='UTF-8',errors='strict')1 trả về một phiên bản được mã hóa của chuỗi đã cho. Thí dụ
Cú pháp của chuỗi mã hóa ()Phương pháp cú pháp của phương pháp string.encode(encoding='UTF-8',errors='strict')1 là: string.encode(encoding='UTF-8',errors='strict') Chuỗi mã hóa () tham sốTheo mặc định, phương thức string.encode(encoding='UTF-8',errors='strict')1 không yêu cầu bất kỳ tham số nào. Nó trả về một phiên bản được mã hóa UTF-8 của chuỗi. Trong trường hợp thất bại, nó làm tăng ngoại lệ string.encode(encoding='UTF-8',errors='strict')4. Tuy nhiên, phải mất hai tham số:
Ví dụ 1: Mã hóa cho mã hóa UTF-8 mặc định
Đầu ra The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!' Ví dụ 2: Mã hóa với tham số lỗi
Đầu ra The string is: pythön! The encoded version (with ignore) is: b'pythn!' The encoded version (with replace) is: b'pyth?n!'
Ví dụ 2: Mã hóa với tham số lỗiLưu ý: Hãy thử các tham số mã hóa và lỗi khác nhau. Mã hóa chuỗiencoding. Vì Python 3.0, các chuỗi được lưu trữ dưới dạng unicode, tức là mỗi ký tự trong chuỗi được biểu thị bằng một điểm mã. Vì vậy, mỗi chuỗi chỉ là một chuỗi các điểm mã Unicode.utf-8, ascii, etc. Để lưu trữ hiệu quả các chuỗi này, chuỗi các điểm mã được chuyển đổi thành một tập hợp các byte. Quá trình được gọi là mã hóa.utf-8 encoding. Encode () làm gì trong Python? Trong thế giới ngày nay, an ninh là rất quan trọng trong nhiều ứng dụng. Do đó, cần lưu trữ thông tin an toàn trong cơ sở dữ liệu và phải lưu các bản sao của chuỗi phải được lưu. Để đạt được quy trình mã hóa này, hàm Python Encode () được sử dụng.converts a string value into a collection of bytes, using an encoding scheme specified by the user. Có nghĩa là gì bởi mã hóa trong Python?
Bỏ qua - bỏ qua Unicode không thể kiểm soát được từ kết quảPython3string.encode(encoding='UTF-8',errors='strict')6 string.encode(encoding='UTF-8',errors='strict')7 string.encode(encoding='UTF-8',errors='strict')8 string.encode(encoding='UTF-8',errors='strict')9 0 1Output: b'\xc2\xb6' Ví dụ 1: Có sẵn các sơ đồ mã hóa mã để in Code to print encoding schemes availableCó một số sơ đồ mã hóa nhất định được hỗ trợ bởi phương thức Python String Encode (). Chúng tôi có thể nhận được các mã hóa được hỗ trợ bằng mã Python bên dưới. Python3 2 3 4 5string.encode(encoding='UTF-8',errors='strict')6 string.encode(encoding='UTF-8',errors='strict')7 8 9string.encode(encoding='UTF-8',errors='strict')6 The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!'1 Output: The available encodings are : dict_keys(['ibm039', 'iso_ir_226', '1140', 'iso_ir_110', '1252', 'iso_8859_8', 'iso_8859_3', 'iso_ir_166', 'cp367', 'uu', 'quotedprintable', 'ibm775', 'iso_8859_16_2001', 'ebcdic_cp_ch', 'gb2312_1980', 'ibm852', 'uhc', 'macgreek', '850', 'iso2022jp_2', 'hz_gb_2312', 'elot_928', 'iso8859_1', 'eucjp', 'iso_ir_199', 'ibm865', 'cspc862latinhebrew', '863', 'iso_8859_5', 'latin4', 'windows_1253', 'csisolatingreek', 'latin5', '855', 'windows_1256', 'rot13', 'ms1361', 'windows_1254', 'ibm863', 'iso_8859_14_1998', 'utf8_ucs2', '500', 'iso8859', '775', 'l7', 'l2', 'gb18030_2000', 'l9', 'utf_32be', 'iso_ir_100', 'iso_8859_4', 'iso_ir_157', 'csibm857', 'shiftjis2004', 'iso2022jp_1', 'iso_8859_2_1987', 'cyrillic', 'ibm861', 'ms950', 'ibm437', '866', 'csibm863', '932', 'iso_8859_14', 'cskoi8r', 'csptcp154', '852', 'maclatin2', 'sjis', 'korean', '865', 'u32', 'csshiftjis', 'dbcs', 'csibm037', 'csibm1026', 'bz2', 'quopri', '860', '1255', '861', 'iso_ir_127', 'iso_celtic', 'chinese', 'l8', '1258', 'u_jis', 'cspc850multilingual', 'iso_2022_jp_2', 'greek8', 'csibm861', '646', 'unicode_1_1_utf_7', 'ibm862', 'latin2', 'ecma_118', 'csisolatinarabic', 'zlib', 'iso2022jp_3', 'ksx1001', '858', 'hkscs', 'shiftjisx0213', 'base64', 'ibm857', 'maccentraleurope', 'latin7', 'ruscii', 'cp_is', 'iso_ir_101', 'us_ascii', 'hebrew', 'ansi_x3.4_1986', 'csiso2022jp', 'iso_8859_15', 'ibm860', 'ebcdic_cp_us', 'x_mac_simp_chinese', 'csibm855', '1250', 'maciceland', 'iso_ir_148', 'iso2022jp', 'u16', 'u7', 's_jisx0213', 'iso_8859_6_1987', 'csisolatinhebrew', 'csibm424', 'quoted_printable', 'utf_16le', 'tis260', 'utf', 'x_mac_trad_chinese', '1256', 'cp866u', 'jisx0213', 'csiso58gb231280', 'windows_1250', 'cp1361', 'kz_1048', 'asmo_708', 'utf_16be', 'ecma_114', 'eucjis2004', 'x_mac_japanese', 'utf8', 'iso_ir_6', 'cp_gr', '037', 'big5_tw', 'eucgb2312_cn', 'iso_2022_jp_3', 'euc_cn', 'iso_8859_13', 'iso_8859_5_1988', 'maccyrillic', 'ks_c_5601_1987', 'greek', 'ibm869', 'roman8', 'csibm500', 'ujis', 'arabic', 'strk1048_2002', '424', 'iso_8859_11_2001', 'l5', 'iso_646.irv_1991', '869', 'ibm855', 'eucjisx0213', 'latin1', 'csibm866', 'ibm864', 'big5_hkscs', 'sjis_2004', 'us', 'iso_8859_7', 'macturkish', 'iso_2022_jp_2004', '437', 'windows_1255', 's_jis_2004', 's_jis', '1257', 'ebcdic_cp_wt', 'iso2022jp_2004', 'ms949', 'utf32', 'shiftjis', 'latin', 'windows_1251', '1125', 'ks_x_1001', 'iso_8859_10_1992', 'mskanji', 'cyrillic_asian', 'ibm273', 'tis620', '1026', 'csiso2022kr', 'cspc775baltic', 'iso_ir_58', 'latin8', 'ibm424', 'iso_ir_126', 'ansi_x3.4_1968', 'windows_1257', 'windows_1252', '949', 'base_64', 'ms936', 'csisolatin2', 'utf7', 'iso646_us', 'macroman', '1253', '862', 'iso_8859_1_1987', 'csibm860', 'gb2312_80', 'latin10', 'ksc5601', 'iso_8859_10', 'utf8_ucs4', 'csisolatin4', 'ebcdic_cp_be', 'iso_8859_1', 'hzgb', 'ansi_x3_4_1968', 'ks_c_5601', 'l3', 'cspc8codepage437', 'iso_8859_7_1987', '8859', 'ibm500', 'ibm1026', 'iso_8859_6', 'csibm865', 'ibm866', 'windows_1258', 'iso_ir_138', 'l4', 'utf_32le', 'iso_8859_11', 'thai', '864', 'euc_jis2004', 'cp936', '1251', 'zip', 'unicodebigunmarked', 'csHPRoman8', 'csibm858', 'utf16', '936', 'ibm037', 'iso_8859_8_1988', '857', 'csibm869', 'ebcdic_cp_he', 'cp819', 'euccn', 'iso_8859_2', 'ms932', 'iso_2022_jp_1', 'iso_2022_kr', 'csisolatin6', 'iso_2022_jp', 'x_mac_korean', 'latin3', 'csbig5', 'hz_gb', 'csascii', 'u8', 'csisolatin5', 'csisolatincyrillic', 'ms_kanji', 'cspcp852', 'rk1048', 'iso2022jp_ext', 'csibm273', 'iso_2022_jp_ext', 'ibm858', 'ibm850', 'sjisx0213', 'tis_620_2529_1', 'l10', 'iso_ir_109', 'ibm1125', '1254', 'euckr', 'tis_620_0', 'l1', 'ibm819', 'iso2022kr', 'ibm367', '950', 'r8', 'hex', 'cp154', 'tis_620_2529_0', 'iso_8859_16', 'pt154', 'ebcdic_cp_ca', 'ibm1140', 'l6', 'csibm864', 'csisolatin1', 'csisolatin3', 'latin6', 'iso_8859_9_1989', 'iso_8859_3_1988', 'unicodelittleunmarked', 'macintosh', '273', 'latin9', 'iso_8859_4_1988', 'iso_8859_9', 'ebcdic_cp_nl', 'iso_ir_144']) Ví dụ 2: Mã để mã hóa chuỗi Code to encode the stringPython3The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!'2 The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!'3 ________ 18 & nbsp; string.encode(encoding='UTF-8',errors='strict')6 The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!'6 0 1Output: b'\xc2\xb6' Lỗi khi sử dụng sơ đồ mã hóa saiVí dụ 1: Phương thức mã hóa chuỗi python () sẽ tăng unicodeencodeError nếu sơ đồ mã hóa saiPython3The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!'2 The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!'3 ________ 18 & nbsp; string.encode(encoding='UTF-8',errors='strict')6 The string is: pythön! The encoded version is: b'pyth\xc3\xb6n!'6 4 1Output: UnicodeEncodeError: 'ascii' codec can't encode character '\xb6' in position 0: ordinal not in range(128) Lỗi khi sử dụng sơ đồ mã hóa saiVí dụ 1: Phương thức mã hóa chuỗi python () sẽ tăng unicodeencodeError nếu sơ đồ mã hóa sai Python3Ví dụ 2: Sử dụng tham số ’lỗi để bỏ qua lỗi trong khi mã hóa Phương thức Python String Encode () với tham số lỗi được đặt thành ‘Bỏ qua, sẽ bỏ qua các lỗi trong việc chuyển đổi các ký tự thành sơ đồ mã hóa được chỉ định. Output: string.encode(encoding='UTF-8',errors='strict')0 Tại sao chúng ta sử dụng .encode trong Python?Encode () làm gì trong Python? Trong thế giới ngày nay, an ninh là rất quan trọng trong nhiều ứng dụng. Do đó, cần lưu trữ thông tin an toàn trong cơ sở dữ liệu và phải lưu các bản sao của chuỗi phải được lưu. Để đạt được quy trình mã hóa này, hàm Python Encode () được sử dụng.secure information storage in the database is required, and encoded copies of strings must be saved. To achieve this encoding process, Python encode() function is used.
Có nghĩa là gì bởi mã hóa trong Python?Python String Encode () chuyển đổi giá trị chuỗi thành một tập hợp các byte, sử dụng sơ đồ mã hóa được chỉ định bởi người dùng.converts a string value into a collection of bytes, using an encoding scheme specified by the user.
.Decode làm gì trong Python?Hàm giải mã byte python () được sử dụng để chuyển đổi byte thành đối tượng chuỗi.Cả hai chức năng này cho phép chúng tôi chỉ định sơ đồ xử lý lỗi để sử dụng cho các lỗi mã hóa/giải mã.Mặc định là 'nghiêm ngặt' có nghĩa là các lỗi mã hóa làm tăng unicodeEncodeError.convert bytes to string object. Both these functions allow us to specify the error handling scheme to use for encoding/decoding errors. The default is 'strict' meaning that encoding errors raise a UnicodeEncodeError.
Tại sao chúng ta sử dụng UTFTại sao sử dụng UTF-8?Một trang HTML chỉ có thể ở một mã hóa.Bạn không thể mã hóa các phần khác nhau của tài liệu trong các mã hóa khác nhau.Một mã hóa dựa trên Unicode như UTF-8 có thể hỗ trợ nhiều ngôn ngữ và có thể chứa các trang và biểu mẫu trong bất kỳ hỗn hợp nào của các ngôn ngữ đó.An HTML page can only be in one encoding. You cannot encode different parts of a document in different encodings. A Unicode-based encoding such as UTF-8 can support many languages and can accommodate pages and forms in any mixture of those languages. |