Bình thường hóa khoảng trắng Python

Gói npm normalize-html-whitespace nhận tổng cộng 142.765 lượt tải xuống mỗi tuần. Do đó, chúng tôi đã cho điểm mức độ phổ biến của normalize-html-whitespace là Phổ biến

Dựa trên số liệu thống kê dự án từ kho lưu trữ GitHub cho gói npm normalize-html-whitespace, chúng tôi thấy rằng nó đã được gắn dấu sao 11 lần và 20 dự án khác trong hệ sinh thái phụ thuộc vào nó

Số lượt tải xuống được tính là trung bình động trong khoảng thời gian 12 tháng qua, không bao gồm các ngày cuối tuần và các điểm dữ liệu bị thiếu đã xác định

Cần xóa khoảng trắng khỏi chuỗi của bạn trong Python?

Xóa khoảng trắng khỏi chuỗi

Cần xóa tất cả khoảng trắng khỏi chuỗi trong Python?

Nếu đó chỉ là các ký tự khoảng trắng, bạn có thể sử dụng phương thức chuỗi >>> no_spaces 'Helloworld!' 0 để thay thế tất cả các khoảng trắng bằng một chuỗi trống

Nếu chúng ta gọi phương thức >>> no_spaces 'Helloworld!' 0 trên chuỗi >>> no_spaces 'Helloworld!' 2 này

>>> greeting = " Hello world! " >>> no_spaces = greeting.replace(" ", "")

Chuỗi >>> no_spaces 'Helloworld!' 3 kết quả sẽ bị xóa tất cả các ký tự khoảng trắng

>>> no_spaces 'Helloworld!'

Xóa tất cả khoảng trắng khỏi chuỗi

Nếu bạn đang cố xóa tất cả các loại ký tự khoảng trắng (dấu cách, tab, dòng mới, v.v. ), bạn có thể sử dụng các phương thức chuỗi >>> no_spaces 'Helloworld!' 4 và >>> no_spaces 'Helloworld!' 5

Nếu chúng ta gọi >>> no_spaces 'Helloworld!' 4 trên chuỗi >>> no_spaces 'Helloworld!' 7 này, Python sẽ phân tách trên tất cả các ký tự khoảng trắng liên tiếp

>>> version = "\tpy 310\n" >>> version.split() ['py', '310']

Phương thức chuỗi >>> no_spaces 'Helloworld!' 5 có thể nối một chuỗi có thể lặp lại bằng dấu phân cách (xem chuyển đổi danh sách thành chuỗi trong Python). Nếu chúng tôi tham gia với một dấu phân cách của chuỗi trống (_______0_______9), chúng tôi sẽ xóa tất cả các khoảng trắng một cách hiệu quả

>>> no_spaces = "".join(version.split()) >>> no_spaces 'py310'

Nếu cảm thấy thoải mái với biểu thức chính quy, bạn cũng có thể sử dụng biểu thức chính quy để thay thế tất cả các khoảng trắng liên tiếp bằng một chuỗi trống

>>> import re >>> no_spaces = re.sub(r"\s+", r"", version) >>> no_spaces 'py310'

Điều gì sẽ xảy ra nếu bạn chỉ cần loại bỏ các khoảng trắng thừa (thu gọn các khoảng trắng liên tiếp)?

Chúng ta có thể sử dụng các phương thức chuỗi >>> no_spaces 'Helloworld!' 4 và >>> no_spaces 'Helloworld!' 5 như trước đây, nhưng tham gia vào một ký tự khoảng trắng thay vì một chuỗi trống

>>> version = "\tpy 310\n" >>> normalized_spaces = " ".join(version.split()) >>> normalized_spaces 'py 310'

Lưu ý rằng điều này chuẩn hóa tất cả các ký tự khoảng trắng (vì vậy các dòng mới và các tab cũng sẽ được chuyển đổi) và nó xóa các khoảng trắng ở cuối chuỗi của chúng ta

Xoá khoảng trắng ở đầu và cuối chuỗi

Điều gì sẽ xảy ra nếu bạn chỉ cần xóa khoảng trắng ở đầu và cuối chuỗi của mình?

Bạn có thể sử dụng phương thức chuỗi >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 2

>>> version = "\tpy 310\n" >>> stripped_version = version.strip() >>> stripped_version 'py 310'

Theo mặc định, phương thức >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 2 sẽ xóa tất cả các ký tự khoảng trắng (không chỉ khoảng trắng)

Phương thức >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 2 cũng chấp nhận một đối số tùy chọn nếu bạn chỉ muốn loại bỏ một ký tự cụ thể. Nó cũng có hai phương thức anh em họ. >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 5 (để tách từ bên trái) và >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 6 (để tách từ bên phải)

Nếu bạn chỉ cần xóa ký tự xuống dòng tùy chọn ở cuối chuỗi, bạn có thể sử dụng >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 2 (chuyển vào ký tự >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 8)

>>> version = "\tpy 310\n" >>> no_trailing_newline = version.rstrip("\n") >>> no_trailing_newline '\tpy 310'

Bỏ khoảng trắng ở đầu và cuối mỗi dòng

Điều gì sẽ xảy ra nếu bạn cần loại bỏ khoảng trắng ở đầu và cuối mỗi dòng trong chuỗi của mình?

Bạn có thể tách các dòng của mình bằng >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 9, sử dụng khả năng hiểu để gọi phương thức >>> version = "\tpy 310\n" >>> version.split() ['py', '310'] 2 trên mỗi dòng, sau đó sử dụng phương thức >>> no_spaces 'Helloworld!' 5 để nối các dòng của bạn lại với nhau bằng các ký tự xuống dòng

>>> string = " Line 1\nLine 2 \n Line 3 \n" >>> stripped = "\n".join([ .. line.strip() .. for line in string.splitlines() .. ]) ... >>> stripped 'Line 1\nLine 2\nLine 3'

Mặc dù điều này đủ phức tạp để tôi thường bắt đầu tiếp cận các biểu thức chính quy vào thời điểm này

Chuẩn hóa khoảng trắng là gì?

Bộ xử lý chuẩn hóa khoảng trắng chuẩn hóa tất cả khoảng trắng trong các giá trị Chuỗi để nhiều khoảng trắng ở giữa các từ được chuẩn hóa thành một ký tự khoảng trắng . Nó cũng loại bỏ khoảng trắng đầu và cuối. Khoảng trắng được định nghĩa trong OEDQ là. không gian.

bình thường hóa là gì

Sử dụng chức năng này để cắt các khoảng trắng ở đầu và cuối (khoảng trống, tab và ký tự dòng mới) đồng thời chuyển đổi nhiều khoảng trắng thành một khoảng trống duy nhất.

Làm thế nào bạn sẽ loại bỏ nhiều khoảng trắng trong một chuỗi?

Sử dụng hàm replace() để thay thế tất cả các ký tự khoảng trắng bằng một khoảng trống. Chuỗi kết quả sẽ không có bất kỳ khoảng trắng nào ở giữa chúng

Làm cách nào để thêm không gian trong xpath?

Nếu một phần tử có khoảng trắng trong văn bản của nó hoặc trong giá trị của bất kỳ thuộc tính nào, thì để tạo xpath cho phần tử đó, chúng ta phải sử dụng hàm normalize-space . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Chủ đề