Xin chào các bạn. Hôm nay mình sẽ giới thiệu với các bạn về việc Xử lý file JSOn và file XML trong Python Show Nội dung chính
Nội dung chính
Xử lý file JSONJSON là một trong những định dạng file trao đổi dữ liệu thông dụng nhất hiện nay. Với kiến trúc đơn giản và tương đồng với cấu trúc của Python nên việc thao tác JSON trên Python rất dễ hiểu. Load file từ InternetThông thường dữ liệu JSON được lấy từ nguồn khác (như file, internet..) nên chương này sẽ bắt đầu bằng cách hướng dẫn download một file JSON từ Internet và sau đó mới parsing nội dung JSON download. Sử dụng module urllib2 để download file và module json để encode/decode JSON data. Ví dụ:
Ví dụ trên sẽ truy vấn đường dẫn https://api.github.com/users/voduytuan/repos để lấy danh sách Repository trên Github của mình dưới định dạng JSON. Parsing JSON DataNếu như bạn đã có JSON data dưới dạng chuỗi, muốn parsing chuỗi này thành Data thì sử dụng như cách dưới đây:
Encoding JSON DataNếu như bạn đã có một biến và muốn encode thành JSON string thì có thể dùng theo cách sau:
Xử lý file XMLTrong phần này, chúng ta sẽ parsing nội dung XML thành dữ liệu để xử lý. Để xử lý XML, ta sẽ sử dụng thư viện Beautifulsoup 4. Đây là một thư viện giúp việc triển khai việc parsing html, xml được nhanh chóng và tiện lợi. Cài đặt BeautifulsoupBạn có thể tham khảo hướng dẫn cách cài đặt tại website http://www.crummy.com/software/BeautifulSoup/bs4/doc/#insbeautiful-soup. Trên MacOS, có thể cài bằng pip như sau:
Cài đặt lxml parserĐể parsing xml từ beautifulsoup, tao sử dụng bộ parser xml có tên là lxml . Xem hướng dẫn cài đặt tại http://www.crummy.com/software/BeautifulSoup/bs4/doc/#insa-parser Trên MacOS, có thể cài bằng pip như sau:
Ví dụ về parsing XMLCho ví dụ sau:
Khi chạy thì sẽ hiển thị ra màn hình như sau:
Đối tượng thuộc class Trong ví dụ có một số cách truy xuất đến các phần tử như:
Parsing HTMLTương tự như
Dưới đây mình đã giới thiệu với các bạn về Xử lý file JSOn và file XML trong Python và một số ví dụ cơ bản. Nếu có bất kì thắc mắc gì hãy để lại comment ở phía dưới nhé. Tham Khảohttp://www.crummy.com/software/BeautifulSoup/bs4/doc/#insa-parser http://www.crummy.com/software/BeautifulSoup/bs4/doc/#insbeautiful-soup. https://linuxconfig.org/how-to-parse-data-from-json-into-python https://docs.python.org/2/library/xml.etree.elementtree.html |