Bây giờ hãy xem ví dụ về cách tìm url từ chuỗi trong python. Chúng ta sẽ nói về trích xuất url từ chuỗi bằng cách sử dụng mô-đun biểu thức chính quy của python. Tôi sẽ chia sẻ với bạn cách trích xuất url từ chuỗi bằng python
Chúng tôi có thể lấy một tệp đầu vào có chứa một số URL và xử lý nó thông qua chương trình sau để trích xuất các URL
Ở đây tôi sẽ cung cấp cho bạn ví dụ đơn giản về cách trích xuất url từ chuỗi trong ví dụ python, Vì vậy, hãy xem ví dụ bên dưới
đây là URL ‘ ’ được tìm thấy trong một chuỗi. ký tự bắt đầu được tìm thấy ở chỉ mục thứ 9 và ký tự cuối cùng được tìm thấy ở vị trí -2 (chỉ mục phủ định). Để chúng tôi có thể sử dụng lát cắt chuỗi, chúng tôi có thể trích xuất URL từ một chuỗiLà một nhà phát triển Python, chúng tôi phải hoàn thành rất nhiều công việc như xóa dữ liệu khỏi tệp hoặc văn bản trước khi xử lý các hoạt động kinh doanh khác
Ví dụ: bạn có tệp văn bản dữ liệu thô hoặc chuỗi văn bản và bạn phải đọc một số dữ liệu cụ thể như URL bằng cách thực hiện đối sánh Biểu thức chính quy thực tế
Biểu thức chính quy là gì và mô-đun nào được sử dụng trong Python?
Biểu thức chính quy là một chuỗi (các) ký tự đặc biệt được sử dụng chủ yếu để tìm và thay thế các mẫu trong một chuỗi hoặc tệp, sử dụng một…
Trích xuất URL đạt được từ một tệp văn bản bằng cách sử dụng cụm từ thông dụng. Biểu thức tìm nạp văn bản ở bất cứ nơi nào nó khớp với mẫu. Chỉ mô-đun re được sử dụng cho mục đích này
Thí dụ
Chúng tôi có thể lấy một tệp đầu vào có chứa một số URL và xử lý nó thông qua chương trình sau để trích xuất các URL. Hàm findall() được sử dụng để tìm tất cả các trường hợp khớp với biểu thức chính quy
Tệp đầu vào
Hiển thị là tệp đầu vào bên dưới. Cái nào chứa teo URL
Now a days you can learn almost anything by just visiting //www.google.com. But if you are completely new to computers or internet then first you need to leanr those fundamentals. Next you can visit a good e-learning site like - //www.tutorialspoint.com to learn further on a variety of subjects.Bây giờ, khi chúng tôi lấy tệp đầu vào ở trên và xử lý nó thông qua chương trình sau, chúng tôi sẽ nhận được đầu ra được yêu cầu chỉ cung cấp các URL được trích xuất từ tệp
Trong bài viết này, chúng ta sẽ xem cách trích xuất dữ liệu thời tiết từ google. Google không có API thời tiết riêng, nó lấy dữ liệu từ thời tiết. com và hiển thị nó khi bạn tìm kiếm trên Google. Vì vậy, chúng tôi sẽ thu thập dữ liệu từ Google và chúng tôi cũng sẽ thấy một phương pháp khác để tìm nạp mô tả sơ đồ về dữ liệu thời tiết của một vị trí trong hai ngày tới bằng Python mà không cần sử dụng API
Phương pháp 1
mô-đun cần thiết
yêu cầu. Yêu cầu cho phép bạn gửi HTTP/1. 1 yêu cầu cực kỳ dễ dàng. Yêu cầu HTTP trả về một đối tượng phản hồi với tất cả dữ liệu phản hồi được yêu cầu. Mô-đun này cũng không tích hợp sẵn với Python. Để cài đặt loại này, lệnh dưới đây trong thiết bị đầu cuối
Bao gồm ngôn ngữ. tiếng Anh (en. miui. com, xiaomi. eu) Trung Quốc (miui. com) Ba Lan (Axit, miuipolska. pl) Tiếng Slovak (ingbrzy, https. // miuios. cz) Tiếng Séc (VMach, https. // miuios. cz) Tiếng Bungari (Toàn cầu) Tiếng Hungary (vagyula, miui. hu) Tiếng Pháp (Toàn cầu) Tiếng Thụy Điển (Toàn cầu) Tiếng Nga (Toàn cầu) Tiếng Ukraina (Toàn cầu) Tiếng Belorussian (Toàn cầu) Tiếng Croatia (Masva, MIUI Adria) Tiếng Việt (Belmont-Gabriel) Tiếng Ý (miui). it) Tiếng Hy Lạp (Toàn cầu) Tiếng Na Uy (Toàn cầu) Tiếng Hà Lan (cueie, mannyribo, redmaner) Tiếng Tây Ban Nha (nosijf982) Tiếng Thổ Nhĩ Kỳ (suatsari) Tiếng Brazil-Bồ Đào Nha (Toàn cầu, Feurrado, Lobianco) Tiếng Bồ Đào Nha (KcNirvana, Lippe35) Tiếng Do Thái (Toàn cầu) Tiếng Romania (ashtefan)
Trích xuất các số từ một tệp văn bản và thêm chúng bằng Python
Cải thiện bài viết
Lưu bài viết
Thích bài viết
- Cập nhật lần cuối. 19 tháng 5 năm 2021
Cải thiện bài viết
Lưu bài viết
Python cũng hỗ trợ xử lý tệp và cho phép người dùng xử lý tệp i. e. , để đọc và ghi tệp, cùng với nhiều tùy chọn xử lý tệp khác, để thao tác trên tệp. Xử lý tệp dữ liệu trong Python được thực hiện ở hai loại tệp.
- Tệp văn bản (. txt)
- Tệp nhị phân (. bin)
Ở đây chúng tôi đang hoạt động trên. txt trong Python. Thông qua chương trình này, chúng tôi có thể trích xuất các số từ nội dung trong tệp văn bản và thêm tất cả chúng và in kết quả.
Cách tiếp cận
Đọc nội dung file ta sẽ so khớp kiểu ký tự với kiểu int. Nếu kết quả của đẳng thức là đúng, thì số sẽ được thêm vào số được lưu trong bộ nhớ được cấp phát cho biến 'a'. Chúng tôi bắt đầu biến 'a' ở đây với giá trị 0.
Python3
# Python program for writing
# to file
file = open('GFG.txt',The sum is: 240# Python program for writing0
# Python program for writing1
# Python program for writing2____5# Python program for writing4
# Python program for writing5
file# Python program for writing7
# Python program for writing8
file# to file0
Sử dụng mã trên, chúng tôi đã mở một tệp mới có tên 'GFG' ở chế độ ghi. Sử dụng hàm write() chúng ta đã chèn dữ liệu được cấp phát cho biến dữ liệu trong bộ nhớ. Sau đó, chúng tôi đã đóng tệp.
Đọc từ tệp được tạo ở trên và trích xuất các số nguyên.
Python3
# to file1
# to file2
# to file3_______5 open____7'GFG.txt',# to file9# Python program for writing0
file1
file2= file4
file5
file6= file8
file9
=0
________ 51 ________ 52 ________ 53 ________ 54
=5
=5=1 =8=3 open0
open1
open1open3
open1open5
open1open7 open8== (1(2
(3
(3______46______76= (8(9
'GFG.txt'0('GFG.txt'2'GFG.txt'3
Đầu ra.
Chương trình trên nhấn mạnh vào việc trích xuất các số từ nội dung được lưu trữ trong tệp văn bản có tên 'GFG'. Hơn nữa, các số sau đó được thêm vào sau khi đánh máy và được lưu trữ trong biến 'a'.
Ghi chú cá nhân của tôi arrow_drop_up
Tiết kiệm