Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

Đã hỏi 9 năm, 8 tháng trước 9 years, 8 months ago

Đã xem 386k lần 386k times

Các hoạt động sau đây khi tôi dán nó lên trình duyệt:

http://www.somesite.com/details.pl?urn=2344

Nhưng khi tôi thử đọc URL với Python không có gì xảy ra:

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile

Tôi có cần phải mã hóa URL, hoặc có điều gì tôi không thấy không?

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

Martin Thoma

114K149 Huy hiệu vàng575 Huy hiệu bạc882 Huy hiệu Đồng149 gold badges575 silver badges882 bronze badges

hỏi ngày 28 tháng 2 năm 2013 lúc 14:55Feb 28, 2013 at 14:55

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

Helen Neelyhelen NeelyHelen Neely

4.5618 Huy hiệu vàng39 Huy hiệu bạc61 Huy hiệu Đồng8 gold badges39 silver badges61 bronze badges

Đối với người dùng

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
1, để tiết kiệm thời gian, sử dụng mã sau,

from urllib.request import urlopen

link = "https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html"

f = urlopen(link)
myfile = f.read()
print(myfile)

Tôi biết có các chủ đề khác nhau cho lỗi:

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
2, nhưng nghĩ rằng điều này có thể tiết kiệm thời gian.

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

Asclepius

52.9K16 Huy hiệu vàng154 Huy hiệu bạc137 Huy hiệu đồng16 gold badges154 silver badges137 bronze badges

Đã trả lời ngày 25 tháng 8 năm 2017 lúc 17:38Aug 25, 2017 at 17:38

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

i.n.n.mi.n.n.mi.n.n.m

2.7886 Huy hiệu vàng25 Huy hiệu bạc 50 Huy hiệu Đồng6 gold badges25 silver badges50 bronze badges

2

Không có câu trả lời nào trong số này rất tốt cho Python 3 (được thử nghiệm trên phiên bản mới nhất tại thời điểm của bài đăng này).

Đây là cách bạn làm điều đó...

import urllib.request

try:
   with urllib.request.urlopen('http://www.python.org/') as f:
      print(f.read().decode('utf-8'))
except urllib.error.URLError as e:
   print(e.reason)

Trên đây là cho các nội dung trả về 'UTF-8'. Xóa .decode ('UTF-8') nếu bạn muốn Python "đoán mã hóa thích hợp".

Tài liệu: https://docs.python.org/3/l Library/urllib.request.html#module-urllib.Request

Đã trả lời ngày 24 tháng 5 năm 2019 lúc 14:50May 24, 2019 at 14:50

FreddiefreddieFreddie

8001 Huy hiệu vàng10 Huy hiệu bạc22 Huy hiệu đồng1 gold badge10 silver badges22 bronze badges

1

Một giải pháp với các công việc với Python 2.x và Python 3.x sử dụng thư viện tương thích Python 2 và 3

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
3:

from six.moves.urllib.request import urlopen
link = "http://www.somesite.com/details.pl?urn=2344"
response = urlopen(link)
content = response.read()
print(content)

Đã trả lời ngày 20 tháng 1 năm 2015 lúc 8:17Jan 20, 2015 at 8:17

Martin Thomamartin ThomaMartin Thoma

114K149 Huy hiệu vàng575 Huy hiệu bạc882 Huy hiệu Đồng149 gold badges575 silver badges882 bronze badges

hỏi ngày 28 tháng 2 năm 2013 lúc 14:55

from urllib.request import urlopen
response = urlopen('http://google.com/')
html = response.read()
print(html)

Helen Neelyhelen NeelyMar 8, 2018 at 9:21

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

4.5618 Huy hiệu vàng39 Huy hiệu bạc61 Huy hiệu ĐồngAkash Kinwad

Đối với người dùng

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
1, để tiết kiệm thời gian, sử dụng mã sau,1 gold badge7 silver badges21 bronze badges

1

#!/usr/bin/python
# -*- coding: utf-8 -*-
# Works on python 3 and python 2.
# when server knows where the request is coming from.

import sys

if sys.version_info[0] == 3:
    from urllib.request import urlopen
else:
    from urllib import urlopen
with urlopen('https://www.facebook.com/') as \
    url:
    data = url.read()

print data

# When the server does not know where the request is coming from.
# Works on python 3.

import urllib.request

user_agent = \
    'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'

url = 'https://www.facebook.com/'
headers = {'User-Agent': user_agent}

request = urllib.request.Request(url, None, headers)
response = urllib.request.urlopen(request)
data = response.read()
print data

Tôi biết có các chủ đề khác nhau cho lỗi:

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
2, nhưng nghĩ rằng điều này có thể tiết kiệm thời gian.Aug 24, 2019 at 7:14

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

Asclepius

import urllib

link = "http://www.somesite.com/details.pl?urn=2344"
f = urllib.urlopen(link)           
myfile = f.readline()  
print myfile

52.9K16 Huy hiệu vàng154 Huy hiệu bạc137 Huy hiệu đồngFeb 28, 2013 at 14:58

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

Đã trả lời ngày 25 tháng 8 năm 2017 lúc 17:38ATOzTOA

2.7886 Huy hiệu vàng25 Huy hiệu bạc 50 Huy hiệu Đồng22 gold badges93 silver badges116 bronze badges

1

Không có câu trả lời nào trong số này rất tốt cho Python 3 (được thử nghiệm trên phiên bản mới nhất tại thời điểm của bài đăng này).

import urllib

def read_text():
      quotes = urllib.urlopen("https://s3.amazonaws.com/udacity-hosted-downloads/ud036/movie_quotes.txt")
      contents_file = quotes.read()
      print contents_file

read_text()

Đây là cách bạn làm điều đó...Aug 22, 2017 at 11:00

# retrieving data from url
# only for python 3

import urllib.request

def main():
  url = "http://docs.python.org"

# retrieving data from URL
  webUrl = urllib.request.urlopen(url)
  print("Result code: " + str(webUrl.getcode()))

# print data from URL 
  print("Returned data: -----------------")
  data = webUrl.read().decode("utf-8")
  print(data)

if __name__ == "__main__":
  main()

Trên đây là cho các nội dung trả về 'UTF-8'. Xóa .decode ('UTF-8') nếu bạn muốn Python "đoán mã hóa thích hợp".Nov 27, 2019 at 7:37

 link = 'http://www.somesite.com/details.pl?urn=2344'
 f = urllib.urlopen(link)           
 myfile = f.readline()  
 print myfile
0

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

Tài liệu: https://docs.python.org/3/l Library/urllib.request.html#module-urllib.Request

Đã trả lời ngày 24 tháng 5 năm 2019 lúc 14:502 gold badges21 silver badges38 bronze badges

FreddiefreddieMay 16, 2020 at 7:59

Hướng dẫn how do i read the contents of a url in python? - làm cách nào để đọc nội dung của url trong python?

1

Làm cách nào để mở một url trong Python?

Phương pháp 2: Sử dụng chức năng thư viện Webbrowser:..
# Nhập mô -đun Webbrowser trong chương trình ..
Nhập Webbrowser ..
# Thêm một url javatpoint để mở nó trong trình duyệt ..
# Mở URL bằng hàm Open () của mô -đun ..
trình duyệt web. open_new_tab (url).

Làm cách nào để tải xuống một tệp văn bản từ URL trong Python?

Để tải xuống một tệp từ URL bằng Python, hãy làm theo ba bước sau:..
Cài đặt mô -đun yêu cầu và nhập nó vào dự án của bạn ..
Sử dụng yêu cầu. Nhận () để tải xuống dữ liệu đằng sau url đó ..
Viết tệp vào tệp trong hệ thống của bạn bằng cách gọi Open () ..

Làm cách nào để trích xuất một URL cụ thể từ một trang web trong Python?

Nhận tất cả các liên kết từ một trang web Tải xuống dữ liệu trang web (HTML) Tạo dữ liệu trang web đẹp và phân tích.Sử dụng phương pháp súp Findall để tìm tất cả các liên kết bằng thẻ A.Lưu trữ tất cả các liên kết trong danh sách.create beautifulsoup object and parse webpage data. use soups method findAll to find all links by the a tag. store all links in list.

Làm cách nào để lấy URL của một chuỗi trong Python?

Để tìm các URL trong một chuỗi nhất định, chúng tôi đã sử dụng hàm findall () từ mô -đun biểu thức chính quy của python.Điều này trả về tất cả các trận đấu không chồng chéo của mẫu trong chuỗi, như một danh sách các chuỗi.findall() function from the regular expression module of Python. This return all non-overlapping matches of pattern in string, as a list of strings.