Hướng dẫn beautifulsoup replace innerhtml - Beautifulsoup thay thế Internalhtml

Tôi đang cố gắng trích xuất bên trong từ một thẻ bằng mã sau:

theurl = "http://na.op.gg/summoner/userName=Darshan"
thepage = urlopen(theurl)
soup = BeautifulSoup(thepage,"html.parser")
rank = soup.findAll('span',{"class":"tierRank"})

Tuy nhiên tôi đang nhận được [< span class="tierRank" > Master < /span >] thay thế. Những gì tôi muốn hiển thị là chỉ có giá trị "chủ".

Sử dụng soup.get_text thay vì soup.findall không hoạt động.

Tôi đã thử thêm .text

rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
0 vào cuối dòng cuối cùng nhưng điều đó cũng không hoạt động.

Matt Morgan

4.5684 Huy hiệu vàng18 Huy hiệu bạc 30 Huy hiệu Đồng4 gold badges18 silver badges30 bronze badges

Hỏi ngày 19 tháng 4 năm 2018 lúc 1:40Apr 19, 2018 at 1:40

1

rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
1 Trả về một danh sách các yếu tố phù hợp với
rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
2.

  1. Bạn muốn phần tử đầu tiên trong danh sách đó.
  2. Bạn muốn
    rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
    
    3 từ phần tử đó, có thể được truy cập bằng phương thức
    rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
    
    4.

Tất cả cùng nhau:

rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()

Điều này sẽ lưu trữ "chủ" trong

rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
5.

Đã trả lời ngày 19 tháng 4 năm 2018 lúc 2:07Apr 19, 2018 at 2:07

Matt Morganmatt MorganMatt Morgan

4.5684 Huy hiệu vàng18 Huy hiệu bạc 30 Huy hiệu Đồng4 gold badges18 silver badges30 bronze badges

3

Hỏi ngày 19 tháng 4 năm 2018 lúc 1:40

rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
1 Trả về một danh sách các yếu tố phù hợp với
rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
2.Nov 12, 2020 at 15:22

Hướng dẫn beautifulsoup replace innerhtml - Beautifulsoup thay thế Internalhtml

Bạn muốn phần tử đầu tiên trong danh sách đó.

from bs4 import BeautifulSoup

soup = BeautifulSoup(open("C:\\test.html"), "html.parser")

for data1 in soup.find_all('td', {'class' : 'YourClass'}):
    print(data1.decode_contents(), sep="\n")

Bạn muốn

rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
3 từ phần tử đó, có thể được truy cập bằng phương thức
rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
4.Jan 16, 2021 at 20:58

Tất cả cùng nhau:Adel

Điều này sẽ lưu trữ "chủ" trong

rank = soup.findAll('span',{"class":"tierRank"})[0].decode_contents()
5.15 silver badges17 bronze badges

Đã trả lời ngày 19 tháng 4 năm 2018 lúc 2:07

Matt Morganmatt Morgan

from bs4 import BeautifulSoup

html_doc = '<div class="s-prose js-post-body" itemprop="text">test<p>I do nontire small program and it threw me off. </p><p>How do I just play a single audio file? </p></div>'

soup = BeautifulSoup(html_doc, 'html.parser')
eles = soup.find_all("div")
print(eles)

def innerHTML(html_tag):
    text = ""
    for c in html_tag.contents:
        text+=str(c)
    return text

text = innerHTML(eles[0])
print(text)

Sử dụng .decode_contents () nếu bạn muốn innerHTML (với thẻ html)div element in this example, the inner html of it is:

test<p>I do nontire small program and it threw me off. </p><p>How do I just play a single audio file? </p>

Đã trả lời ngày 12 tháng 11 năm 2020 lúc 15:22innerHTML() to get it.

Nếu bạn muốn như một số lượng lớn, bạn có thể sử dụng những điều sau

test<p>I do nontire small program and it threw me off. </p><p>How do I just play a single audio file? </p>

Đã trả lời ngày 16 tháng 1 năm 2021 lúc 20:58innerHTML() function in JavaScript.

Adeladel

1.42815 huy hiệu bạc17 Huy hiệu đồng

Không tồn tại chức năng bên trong trong BeautifulSoup. Điều đó có nghĩa là chúng ta không thể nhận được chuỗi HTML trong phần tử HTML là JavaScript. Trong hướng dẫn này, chúng tôi sẽ giới thiệu cho bạn cách xây dựng chức năng InsideHTML trong BeautifulSoup.

Đây là mã ví dụ:

Đối với phần tử HTML Div trong ví dụ này, HTML bên trong của nó là:

Sau đó, chúng ta có thể sử dụng hàm innerHtml () để có được nó.

Chạy mã ví dụ, chúng tôi sẽ nhận được:

Nó tương tự với hàm bên trong () trong javaScript.

Python BeautifulSoup Nhận giá trị thẻ

Lệnh sau: volume = súp.findall (span, {id: volume}) [0] cho: 16.103.3 Khi tôi phát hành một bản in (âm lượng). Làm thế nào để tôi chỉ nhận được ...

Hướng dẫn bên trong html

Giới thiệu 2+ 2+ hỗ trợ một liên kết thuộc tính [bên trong]] sẽ khiến HTML làm cho HTML. Nếu bạn sử dụng phép nội suy, nó sẽ được coi là một chuỗi. Trong bài viết này, bạn sẽ ...

Làm thế nào để bạn xóa các thẻ HTML trong Python?

Sau đó, chúng ta có thể sử dụng hàm innerHtml () để có được nó.

Chạy mã ví dụ, chúng tôi sẽ nhận được:

Nó tương tự với hàm bên trong () trong javaScript.

Python BeautifulSoup Nhận giá trị thẻ

Lệnh sau: volume = súp.findall (span, {id: volume}) [0] cho: 16.103.3 Khi tôi phát hành một bản in (âm lượng). Làm thế nào để tôi chỉ nhận được ...

Hướng dẫn bên trong html

Giới thiệu 2+ 2+ hỗ trợ một liên kết thuộc tính [bên trong]] sẽ khiến HTML làm cho HTML. Nếu bạn sử dụng phép nội suy, nó sẽ được coi là một chuỗi. Trong bài viết này, bạn sẽ ...

Làm thế nào để bạn xóa các thẻ HTML trong Python?

Sử dụng một regexing một regex, bạn có thể làm sạch mọi thứ bên trong: Nhập RE # theo khuyến nghị từ @freylis, biên dịch chỉ một lần CLECR = re.compile () def cleanHTML (RAW_HTML): ...

Hướng d

Nó tương tự với hàm bên trong () trong javaScript.

Python BeautifulSoup Nhận giá trị thẻ

Lệnh sau: volume = súp.findall (span, {id: volume}) [0] cho: 16.103.3 Khi tôi phát hành một bản in (âm lượng). Làm thế nào để tôi chỉ nhận được ...

Hướng dẫn bên trong html

Giới thiệu 2+ 2+ hỗ trợ một liên kết thuộc tính [bên trong]] sẽ khiến HTML làm cho HTML. Nếu bạn sử dụng phép nội suy, nó sẽ được coi là một chuỗi. Trong bài viết này, bạn sẽ ...

Làm thế nào để bạn xóa các thẻ HTML trong Python?

Sử dụng một regexing một regex, bạn có thể làm sạch mọi thứ bên trong: Nhập RE # theo khuyến nghị từ @freylis, biên dịch chỉ một lần CLECR = re.compile () def cleanHTML (RAW_HTML): ...

Hướng dẫn dùng outuput JavaScript

Khả năng hiển thị của JavaScriptJavaScript có thể hiện thị dữ liệu bằng một số cách khác nhau:Viết vào trong một thành phần HTML dùng innerHTML.Viết vào ...

Hướng dẫn dùng innterhtml JavaScript

Trong bài này chúng ta sẽ tìm hiểu thuộc tính innerHTML trong Javascript, đây là một thuộc tính có sẵn trong các node object.Bài viết này được đăng tại ...

Hướng dẫn dùng requests. python

Vietnamese (Tiếng Việt) translation by Dai Phong (you can also view the original English article) Requests là một mô-đun Python mà bạn có thể sử dụng để gửi tất cả các ...

Hướng dẫn dùng html prettify python

Đã đăng vào thg 1 10, 2019 7:30 SA 3 phút đọc Trong thực tế đôi khi bạn cần thu thập 1 số lượng lớn thông tin (ảnh, video, bài viết, ..) từ 1 trang web để ...

Hướng dẫn dùng fuc.com python

Python hiện là một trong những ngôn ngữ lập trình phổ biến nhất thế giới. Python đặc biệt phổ biến trong cộng đồng nghiên cứu. Tuy vậy Python không bị ...