Hướng dẫn convert html entities to text - chuyển đổi các thực thể html thành văn bản

Nhân vật đặc biệt đối với bộ chuyển đổi thực thể HTML

Escapes/chuyển đổi các ký tự đặc biệt trong văn bản thành các thực thể HTML

Ví dụ: Tom & "Jerry" cho Tom & amp; & quot; Jerry & quot;: Tom & "Jerry" to Tom & "Jerry"

Chữ

Các thực thể HTML

Chuyển đổi từ các thực thể HTML (ký tự thoát) thành văn bản gốc

Ví dụ: Tom & amp; & quot; Jerry & quot; đến Tom & "Jerry": Tom & "Jerry" to Tom & "Jerry"

Các thực thể HTML

Chữ

AKA:

Các thực thể HTML



(Php 4> = 4.3.0, Php 5, Php 7, Php 8)

HTML_ENTITY_DECODE - Chuyển đổi các thực thể HTML thành các ký tự tương ứng của chúngConvert HTML entities to their corresponding characters

Sự mô tả

html_entity_decode (chuỗi $string, int $flags = ent_quotes | ent_subst acad | ent_html401,? chuỗi $encoding = null): chuỗi(string $string, int $flags = ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401, ?string $encoding = null): string

Chính xác, hàm này giải mã tất cả các thực thể (bao gồm tất cả các thực thể số) mà a) nhất thiết phải hợp lệ cho loại tài liệu đã chọn - tức là, đối với XML, hàm này không giải mã các thực thể có tên có thể được xác định trong một số DTD - và B) có ký tự hoặc ký tự nằm trong bộ ký tự được mã hóa được liên kết với mã hóa được chọn và được phép trong loại tài liệu đã chọn. Tất cả các thực thể khác đều còn lại như vậy.

Thông số

string

Chuỗi đầu vào.

flags

Một bitmask của một hoặc nhiều cờ sau, chỉ định cách xử lý các trích dẫn và loại tài liệu nào sẽ sử dụng. Mặc định là ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.

Có sẵn flags hằng số
Tên liên tụcSự mô tả
ENT_COMPAT html_entity_decode (chuỗi $string, int $flags = ent_quotes | ent_subst acad | ent_html401,? chuỗi $encoding = null): chuỗi
ENT_QUOTES Chính xác, hàm này giải mã tất cả các thực thể (bao gồm tất cả các thực thể số) mà a) nhất thiết phải hợp lệ cho loại tài liệu đã chọn - tức là, đối với XML, hàm này không giải mã các thực thể có tên có thể được xác định trong một số DTD - và B) có ký tự hoặc ký tự nằm trong bộ ký tự được mã hóa được liên kết với mã hóa được chọn và được phép trong loại tài liệu đã chọn. Tất cả các thực thể khác đều còn lại như vậy.
$flags0 Thông số
$flags1 string
$flags2 Chuỗi đầu vào.
$flags3 flags
$flags4 Một bitmask của một hoặc nhiều cờ sau, chỉ định cách xử lý các trích dẫn và loại tài liệu nào sẽ sử dụng. Mặc định là ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.
$flags5 Có sẵn flags hằng số
Tên liên tục

Sẽ chuyển đổi các tài khoản kép và để lại các trích dẫn đơn.

Sẽ chuyển đổi cả trích dẫn kép và đơn.

Sẽ để lại cả trích dẫn kép và đơn không được chuyển đổi.

Thay thế các chuỗi đơn vị mã không hợp lệ bằng ký tự thay thế Unicode U+FFFD (UTF-8) hoặc � (nếu không) thay vì trả về một chuỗi trống.

Xử lý mã là HTML 4.01.
Xử lý mã là XML 1. Xử lý mã là XHTML.Sự mô tả
html_entity_decode (chuỗi $string, int $flags = ent_quotes | ent_subst acad | ent_html401,? chuỗi $encoding = null): chuỗi Chính xác, hàm này giải mã tất cả các thực thể (bao gồm tất cả các thực thể số) mà a) nhất thiết phải hợp lệ cho loại tài liệu đã chọn - tức là, đối với XML, hàm này không giải mã các thực thể có tên có thể được xác định trong một số DTD - và B) có ký tự hoặc ký tự nằm trong bộ ký tự được mã hóa được liên kết với mã hóa được chọn và được phép trong loại tài liệu đã chọn. Tất cả các thực thể khác đều còn lại như vậy.Thông số
string Chuỗi đầu vào. flags
Một bitmask của một hoặc nhiều cờ sau, chỉ định cách xử lý các trích dẫn và loại tài liệu nào sẽ sử dụng. Mặc định là ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.Có sẵn flags hằng sốTên liên tục
Sẽ chuyển đổi các tài khoản kép và để lại các trích dẫn đơn.Sẽ chuyển đổi cả trích dẫn kép và đơn.Sẽ để lại cả trích dẫn kép và đơn không được chuyển đổi.
Thay thế các chuỗi đơn vị mã không hợp lệ bằng ký tự thay thế Unicode U+FFFD (UTF-8) hoặc � (nếu không) thay vì trả về một chuỗi trống. Xử lý mã là HTML 4.01. Xử lý mã là XML 1.
Xử lý mã là XHTML. Xử lý mã là HTML 5. $flags6
Một đối số tùy chọn xác định mã hóa được sử dụng khi chuyển đổi các ký tự. Nếu bị bỏ qua, $flags6 mặc định vào giá trị của tùy chọn cấu hình default_charset. Mặc dù đối số này là tùy chọn về mặt kỹ thuật, bạn rất được khuyến khích chỉ định giá trị chính xác cho mã của bạn nếu tùy chọn cấu hình default_charset có thể được đặt không chính xác cho đầu vào đã cho.
Các bộ ký tự sau được hỗ trợ:CharSets được hỗ trợCharset
Bí danh950 ISO-8859-1
ISO8859-1936 Tây Âu, Latin-1.
ISO-8859-5Sẽ chuyển đổi cả trích dẫn kép và đơn.Sẽ để lại cả trích dẫn kép và đơn không được chuyển đổi.
Thay thế các chuỗi đơn vị mã không hợp lệ bằng ký tự thay thế Unicode U+FFFD (UTF-8) hoặc � (nếu không) thay vì trả về một chuỗi trống. Xử lý mã là HTML 4.01. Xử lý mã là XML 1.
Xử lý mã là XHTML. Xử lý mã là HTML 5. Xử lý mã là XML 1.
Xử lý mã là XHTML.Sẽ chuyển đổi cả trích dẫn kép và đơn.Sẽ để lại cả trích dẫn kép và đơn không được chuyển đổi.
Thay thế các chuỗi đơn vị mã không hợp lệ bằng ký tự thay thế Unicode U+FFFD (UTF-8) hoặc � (nếu không) thay vì trả về một chuỗi trống.Sẽ chuyển đổi cả trích dẫn kép và đơn.Sẽ để lại cả trích dẫn kép và đơn không được chuyển đổi.nl_langinfo() and setlocale()), in this order. Not recommended.

Thay thế các chuỗi đơn vị mã không hợp lệ bằng ký tự thay thế Unicode U+FFFD (UTF-8) hoặc � (nếu không) thay vì trả về một chuỗi trống.: Any other character sets are not recognized. The default encoding will be used instead and a warning will be emitted.

Xử lý mã là HTML 4.01.

Xử lý mã là XML 1.

Xử lý mã là XHTML.

Xử lý mã là HTML 5.Sự mô tả
8.1.0 html_entity_decode (chuỗi $string, int $flags = ent_quotes | ent_subst acad | ent_html401,? chuỗi $encoding = null): chuỗiENT_COMPAT to ENT_QUOTES | $flags1 | $flags2.
8.0.0 Chính xác, hàm này giải mã tất cả các thực thể (bao gồm tất cả các thực thể số) mà a) nhất thiết phải hợp lệ cho loại tài liệu đã chọn - tức là, đối với XML, hàm này không giải mã các thực thể có tên có thể được xác định trong một số DTD - và B) có ký tự hoặc ký tự nằm trong bộ ký tự được mã hóa được liên kết với mã hóa được chọn và được phép trong loại tài liệu đã chọn. Tất cả các thực thể khác đều còn lại như vậy.

Thông số

string

$encoding5

$encoding6

$encoding7

Chuỗi đầu vào.

flags:

Một bitmask của một hoặc nhiều cờ sau, chỉ định cách xử lý các trích dẫn và loại tài liệu nào sẽ sử dụng. Mặc định là ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML401.trim()) but ASCII code 160 (0xa0) in the default ISO 8859-1 encoding.

Xem thêm

  • HTMLENTITY () - Chuyển đổi tất cả các ký tự áp dụng thành các thực thể HTML
  • HTMLSPECIALCHARS () - Chuyển đổi các ký tự đặc biệt thành các thực thể HTML
  • get_html_translation_table () - Trả về bảng dịch được sử dụng bởi htmlspecialchars và htmlentities
  • Urldecode () - Chuỗi được mã hóa url được mã hóa

Martin ¶

11 năm trước

$encoding8

$encoding9

null0

null1

null2

txnull ¶

7 năm trước

null3

null4

null5

Benjamin ¶

9 năm trước

null6

null7

null8

null9

null5

Daniel A. ¶

4 năm trước

string1

string2

string3

string4

string5

string6

null5

php dot net tại c dash ovidiu dot tk ¶

17 năm trước

string8

string9

flags0

flags1

Dot Neu Neu tại Gmail Dot Com ¶

12 năm trước

flags2

flags3

null5

Miễn phí tại Key Dot no ¶

12 năm trước

flags5

flags6

null5

Miễn phí tại Key Dot no ¶

Ẩn danh ¶

flags8

flags9

null5

1 năm trước

Matt Robinson ¶

ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML4011

ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML4012

ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML4013

ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML4014

ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML4015

null5

13 năm trước

tôi tại Richardsnazell dot com

ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML4017

ENT_QUOTES | ENT_SUBSTITUTE | ENT_HTML4018

null5

14 năm trước

Người chiến thắng ¶

flags0

flags1

flags2

flags3

null5

10 năm trước

Jojo ¶

flags5

flags6

flags7

null5

15 năm trước

17 năm trước

flags9

ENT_COMPAT0

ENT_COMPAT1

ENT_COMPAT2

ENT_COMPAT3

null5

Dot Neu Neu tại Gmail Dot Com ¶

12 năm trước

ENT_COMPAT5

ENT_COMPAT6

ENT_COMPAT7

ENT_COMPAT8

Miễn phí tại Key Dot no ¶

Ẩn danh ¶

ENT_COMPAT9

ENT_QUOTES0

ENT_QUOTES1

ENT_QUOTES2

ENT_QUOTES3

ENT_QUOTES4

ENT_QUOTES5

null5

1 năm trước

Matt Robinson ¶

ENT_QUOTES7

ENT_QUOTES8

ENT_QUOTES9

$flags00

null5

13 năm trước

Matt Robinson ¶

$flags02

$flags03

null5

13 năm trước

tôi tại Richardsnazell dot com

$flags05

$flags06

null5

Làm cách nào để chuyển đổi HTML thành văn bản?

Dưới đây là một số phương thức để chuyển đổi hoặc lưu, một trang web HTML dưới dạng tài liệu văn bản ...
Nhấp lại tab Tệp, sau đó nhấp vào tùy chọn Lưu dưới dạng ..
Trong danh sách lưu xuống dưới dạng loại, chọn tùy chọn văn bản đơn giản (*. TXT). ....
Nhấp vào nút Lưu để lưu dưới dạng tài liệu văn bản ..

Làm cách nào để giải mã mã HTML?

Tải dữ liệu HTML để giải mã từ tệp, sau đó nhấn nút 'Giải mã': Duyệt: Thay vào đó, nhập hoặc dán vào văn bản bạn muốn mã hóa HTML, sau đó nhấn nút 'Giải mã'.: Browse: Alternatively, type or paste in the text you want to HTML–decode, then press the 'Decode' button.

Sự khác biệt giữa các thực thể HTML () và htmlspecialchars () là gì?

?htmlspecialchars() function convert the special characters to HTML entities whereas htmlentities() function convert all applicable characters to HTML entities.

Giải mã thực thể HTML là gì?

giải mã.Một chức năng linh hoạt để giải mã các ký tự được mã hóa thực thể trở lại biểu diễn UTF-8 của chúng.Hàm này đặc biệt hữu ích khi làm việc với văn bản được chèn dưới dạng nội dung văn bản trong đánh dấu HTML/XML.A flexible function for decoding entity encoded characters back to their UTF-8 representation. This function is particularly useful when working with text that is to be inserted as text content in HTML/XML markup.