Cải thiện bài viết
Lưu bài viết
Python | Sửa đổi/phân tích cú pháp XML & NBSP; Ngôn ngữ đánh dấu có thể mở rộng (XML) là một ngôn ngữ đánh dấu xác định một tập hợp các quy tắc để mã hóa các tài liệu theo định dạng vừa có thể đọc được và có thể đọc được. và khả năng sử dụng trên Internet. Đó là một định dạng dữ liệu văn bản với sự hỗ trợ mạnh mẽ thông qua Unicode cho các ngôn ngữ con người khác nhau. Mặc dù thiết kế của XML tập trung vào các tài liệu, ngôn ngữ được sử dụng rộng rãi để thể hiện các cấu trúc dữ liệu tùy ý như các cấu trúc được sử dụng trong dịch vụ web.xml là một định dạng dữ liệu phân cấp vốn có và cách tự nhiên nhất để thể hiện nó là với một cây. Để thực hiện bất kỳ hoạt động nào như phân tích cú pháp, tìm kiếm, sửa đổi tệp XML, chúng tôi sử dụng modulexml.etree.elementtree.it có hai lớp.elementtree đại diện cho toàn bộ tài liệu XML dưới dạng cây giúp thực hiện các hoạt động. Phần tử đại diện cho một nút duy nhất trong cây này. Đọc và ghi từ toàn bộ tài liệu được thực hiện ở cấp phần tử. Xuất hiện với một phần tử XML duy nhất và các phần tử phụ của nó được thực hiện ở cấp phần tử. & NBSP;
Extensible Markup Language (XML) is a markup language that defines a set of rules for encoding documents in a format that is both human-readable and machine-readable.The design goals of XML focus on simplicity, generality, and usability across the Internet.It is a textual data
format with strong support via Unicode for different human languages. Although the design of XML focuses on documents, the language is widely used for the representation of arbitrary data structures such as those used in web services.
XML is an inherently hierarchical data format, and the most natural way to represent it is with a tree.To perform any operations like parsing, searching, modifying an XML file we use a modulexml.etree.ElementTree.It has two classes.ElementTree represents the whole XML document as a tree which helps while performing the operations. Element represents a single node in this tree.Reading and writing from the whole document are done on the ElementTree level.Interactions with a single XML element and its sub-elements are
done on the Element level.
Thuộc tính của phần tử: & nbsp;
Nhãn | Chuỗi xác định loại dữ liệu mà phần tử đại diện. Có thể truy cập bằng ElementName.tag. Can be accessed using elementname.tag. |
Số lượng thuộc tính | Được lưu trữ dưới dạng từ điển python.can có thể truy cập bởi ElementName.Attrib. Can be accesses by elementname.attrib. |
Chuỗi văn bản | Chuỗi thông tin liên quan đến phần tử. |
Chuỗi trẻ em | Thông tin chuỗi yếu tố con tùy chọn. |
Yếu tố trẻ em | Số lượng phần tử trẻ em đến một gốc cụ thể. |
Phân tích cú pháp: Chúng ta có thể phân tích dữ liệu XML từ một chuỗi hoặc tài liệu XML.Considing XML.ETREE.ElementTree là et.1. Et.parse (‘fileName,). Et.FromString (StringName) -để tạo một gốc từ chuỗi dữ liệu XML.example 1: & nbsp; tài liệu XML: & nbsp;
We can parse XML data from a string or an XML document.Considering xml.etree.ElementTree as ET.
1. ET.parse(‘Filename’).getroot() -ET.parse(‘fname’)-creates a tree and then we extract the root by .getroot().
2. ET.fromstring(stringname) -To create a root from an XML data string.
Example 1:
XML document:
XML
<?xml version="1.0"
<COUNTRIES>
<xml1 xml2=xml4>
xml6<__18
version7xml1>
<xml1 xml2==5>
xml6<xml8 xml2="1.0"2 version2___
version7xml1
version7COUNTRIES>
Mã Python: & nbsp; & nbsp;
Python3
?>4 ?>5
?>6=
?>8= <0<1<2
<3= <5
<6= <8
<9COUNTRIES0
<9COUNTRIES2
Output:
outputexample1
Phương pháp phần tử: 1) phần tử.Iter ('tag') -iterates trên tất cả các phần tử con (các phần tử phụ) & nbsp; 2) phần tử phần tử hiện tại. & nbsp; 3) phần tử. văn bản -gives Văn bản của phần tử. & nbsp; 6) phần tử.attrib-returns tất cả các thuộc tính có mặt. & nbsp; 7) phần tử.tag-returns tên phần tử.example 2: & nbsp; & nbsp;
1)Element.iter(‘tag’) -Iterates over all the child elements(Sub-tree elements)
2)Element.findall(‘tag’) -Finds only elements with a tag which are direct children of the current element.
3)Element.find(‘tag’) -Finds the first Child with the
particular tag.
4)Element.get(‘tag’) -Accesses the elements attributes.
5)Element.text -Gives the text of the element.
6)Element.attrib-returns all the attributes present.
7)Element.tag-returns the element name.
Example 2:
Python3
?>4 ?>5
?>6=
?>8= <0<1<2
<3= <5
<9 0
<6= <8
Phương pháp phần tử: 1) phần tử.Iter ('tag') -iterates trên tất cả các phần tử con (các phần tử phụ) & nbsp; 2) phần tử phần tử hiện tại. & nbsp; 3) phần tử. văn bản -gives Văn bản của phần tử. & nbsp; 6) phần tử.attrib-returns tất cả các thuộc tính có mặt. & nbsp; 7) phần tử.tag-returns tên phần tử.example 2: & nbsp; & nbsp;
<3= <8
<9xml11
Output:
Is
>0 2>2 4 5>7
Modifying the XML document can also be done through Element methods.
Methods:
1)Element.set(‘attrname’, ‘value’) – Modifying element attributes.
2)Element.SubElement(parent, new_childtag) -creates a new child tag under the parent.
3)Element.write(‘filename.xml’)-creates the tree of xml into another file.
4)Element.pop() -delete a
particular attribute.
5)Element.remove() -to delete a complete tag.
Example 3:
XML Document:
8= xml00xml01xml02
<?xml version="1.0"
<xml19>
<xml23>
<xml1 xml2=xml4>
xml6<xml36xml37xml36>
xml6<__18
xml44xml42>
xml6<xml49xml50xml49>
version7xml23>
<xml23>
xml6<xml2 xml28=xml66xml67__12
xml6<xml36xml73xml36>
xml6<xml42xml79
xml80xml42>
xml6<xml49xml86xml49>
version7xml23>
<xml23>
xml6<xml2 xml28=version02version03__12
xml6<xml36version09xml36>
xml6<xml42version15
version16xml42>
xml6<xml49xml86xml49>
version7xml23>
<xml23>
xml6<xml2 xml28=version38version39__12
xml6<xml36version45xml36>
xml6<xml42version51
version52xml42>
xml6<xml49version58xml49>
version7xml23>
version7xml19>
Mã Python: & nbsp; & nbsp;
Python3
?>4 ?>5
version70= <0version73<2
version75= version77
>0 version79>2 version81>4>55__2844
version87= version89>5version91version929____293version94<2
version97version98>5=00=01=02<2
=04=05=06=07<2
Is
=18= version89>5=222
=24=25=26=05=28=29<2
=31=32=33
=34=35<2
Đầu ra: & nbsp; & nbsp;