Python xóa tất cả các chữ cái không phải

Trong hướng dẫn này, chúng ta sẽ xem xét cách xóa các ký tự không phải chữ và số khỏi một chuỗi trong Python với sự trợ giúp của một số ví dụ

Các ký tự chữ và số là gì?

Một ký tự là một ký tự chữ và số nếu đó là một bảng chữ cái (a đến z, A đến Z) hoặc một chữ số (0 đến 9). Ví dụ: chuỗi

True
True
True
False
False
34 chỉ chứa các ký tự chữ và số trong khi chuỗi
True
True
True
False
False
35 chứa một ký tự không phải chữ và số (
True
True
True
False
False
36)

Python xóa tất cả các chữ cái không phải
Python xóa tất cả các chữ cái không phải

Bạn có thể sử dụng hàm chuỗi

True
True
True
False
False
37 để kiểm tra xem một ký tự có phải là ký tự chữ và số hay không

# check if character is alphanumeric
print('a'.isalnum())
print('A'.isalnum())
print('7'.isalnum())
print('_'.isalnum())
print('#'.isalnum())

đầu ra

True
True
True
False
False

Loại bỏ các ký tự không phải chữ và số khỏi một chuỗi thường được sử dụng như một bước tiền xử lý văn bản. Bây giờ chúng ta hãy xem cách xóa các ký tự không phải chữ và số khỏi một chuỗi với sự trợ giúp của một số ví dụ

Có một số cách bạn có thể xóa các ký tự không phải chữ và số khỏi một chuỗi trong Python

Sử dụng các hàm chuỗi True True True False False37 và chuỗi True True True False False1

Bạn có thể sử dụng hàm chuỗi

True
True
True
False
False
37 cùng với hàm chuỗi
True
True
True
False
False
1 để tạo một chuỗi chỉ có các ký tự chữ và số

# string with non alphanumeric characters
s = "[email protected]#$_123"
# remove non alphanuemeric characters
new_s = ''.join(c for c in s if c.isalnum())
print(new_s)

đầu ra

Striker123

Bạn có thể thấy rằng chuỗi kết quả không có bất kỳ ký tự nào không phải chữ và số. Ở đây, chúng tôi lặp lại tất cả các ký tự trong chuỗi gốc và chỉ giữ lại ký tự đó nếu đó là ký tự chữ và số mà chúng tôi kiểm tra bằng hàm chuỗi

True
True
True
False
False
37. Sau đó, chúng tôi sử dụng hàm chuỗi
True
True
True
False
False
1 để nối từng ký tự

Sử dụng biểu thức chính quy để xóa các ký tự không phải chữ và số

Chúng ta cũng có thể sử dụng các biểu thức chính quy để loại bỏ các ký tự như vậy. Ví dụ: chúng ta có thể viết một biểu thức chính quy để khớp với tất cả các ký tự không phải chữ và số trong chuỗi và sau đó thay thế chúng bằng một chuỗi rỗng. Bạn có thể sử dụng thư viện

True
True
True
False
False
6 trong Python để triển khai khớp mẫu biểu thức chính quy

________số 8

đầu ra

Striker123

Chúng tôi nhận được kết quả tương tự như trên

Để biết thêm về các biểu thức chính quy trong Python, hãy tham khảo hướng dẫn này

Bạn cũng có thể quan tâm đến -

  • Xóa ký tự đầu tiên khỏi chuỗi trong Python
  • Xóa ký tự cuối cùng khỏi chuỗi trong Python


Đăng ký nhận bản tin của chúng tôi để biết thêm thông tin và hướng dẫn.
Chúng tôi không gửi thư rác và bạn có thể chọn không tham gia bất kỳ lúc nào.


Tác giả

  • Python xóa tất cả các chữ cái không phải

    Piyush

    Piyush là một nhà khoa học dữ liệu đam mê sử dụng dữ liệu để hiểu mọi thứ tốt hơn và đưa ra quyết định sáng suốt. Trước đây, anh ấy từng là Nhà khoa học dữ liệu cho ZS và có bằng kỹ sư của IIT Roorkee. Sở thích của anh ấy bao gồm xem cricket, đọc sách và làm việc trong các dự án phụ

    Đưa ra một chuỗi, nhiệm vụ là xóa tất cả các ký tự trừ số và bảng chữ cái. Thao tác chuỗi là một nhiệm vụ rất quan trọng trong việc mã hóa và phát triển web hàng ngày. Hầu hết các yêu cầu và phản hồi trong truy vấn HTTP ở dạng chuỗi Python đôi khi có một số dữ liệu vô ích mà chúng tôi cần xóa.  

    Xóa tất cả các ký tự ngoại trừ các chữ cái bằng re. phụ

    Trong chức năng này, chúng tôi chứng minh việc loại bỏ các ký tự không phải là bảng chữ cái bằng cách sử dụng lại. phụ

    Python3




    True
    True
    True
    False
    False
    41
    True
    True
    True
    False
    False
    42

     

    True
    True
    True
    False
    False
    43

    ________ 144 ________ 145 ________ 100

     

    True
    True
    True
    False
    False
    01

    ________ 102 ________ 103 ________ 104 ________ 105

     

    True
    True
    True
    False
    False
    06
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    08
    True
    True
    True
    False
    False
    09
    True
    True
    True
    False
    False
    90

     

    True
    True
    True
    False
    False
    91

    ________ 102 ________ 103 ________ 194 ________ 195

    đầu ra

    True
    True
    True
    False
    False
    5

    Xóa tất cả các ký tự ngoại trừ chữ cái và số bằng cách sử dụng  isalpha() và isnumic()

    Ở đây, chức năng này thể hiện việc loại bỏ các ký tự không phải là số và bảng chữ cái bằng cách sử dụng isalpha() và isnumeric()

    Python3




    True
    True
    True
    False
    False
    41
    True
    True
    True
    False
    False
    42

     

    True
    True
    True
    False
    False
    43

    ________ 144 ________ 145 ________ 101

     

    True
    True
    True
    False
    False
    01

    ________ 102 ________ 103 ________ 104 ________ 105

     

    True
    True
    True
    False
    False
    07
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    09
    True
    True
    True
    False
    False
    00
    True
    True
    True
    False
    False
    01
    True
    True
    True
    False
    False
    02
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    44

    True
    True
    True
    False
    False
    05
    True
    True
    True
    False
    False
    06
    True
    True
    True
    False
    False
    07
    True
    True
    True
    False
    False
    08
    True
    True
    True
    False
    False
    09

     

    True
    True
    True
    False
    False
    06
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    412

     

    True
    True
    True
    False
    False
    91

    ________ 102 ________ 103 ________ 194 ________ 195

    đầu ra

    True
    True
    True
    False
    False
    0

    Xóa tất cả các ký tự trừ các chữ cái bằng alnum()

    Ở đây, chức năng này minh họa việc loại bỏ các ký tự không đánh số bằng cách sử dụng alnum()

    Python3




    True
    True
    True
    False
    False
    43

    True
    True
    True
    False
    False
    44
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    421

     

    True
    True
    True
    False
    False
    01

    ________ 102 ________ 103 ________ 104 ________ 105

     

    True
    True
    True
    False
    False
    07
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    09
    True
    True
    True
    False
    False
    00
    True
    True
    True
    False
    False
    01
    True
    True
    True
    False
    False
    02
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    44
    True
    True
    True
    False
    False
    06
    True
    True
    True
    False
    False
    436

    True
    True
    True
    False
    False
    06
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    412

     

    True
    True
    True
    False
    False
    91

    ________ 102 ________ 103 ________ 194 ________ 195

    đầu ra

    True
    True
    True
    False
    False
    9

    Xóa tất cả các ký tự ngoại trừ chữ cái và số bằng bộ lọc và trong

    Ở đây, chức năng này minh họa việc loại bỏ các ký tự không phải là số và bảng chữ cái bằng cách sử dụng bộ lọc

    Python3




    True
    True
    True
    False
    False
    43

    ________ 144 ________ 145 ________ 101

     

    True
    True
    True
    False
    False
    01

    ________ 102 ________ 103 ________ 104 ________ 105

     

    True
    True
    True
    False
    False
    454
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    456
    True
    True
    True
    False
    False
    457

     

    True
    True
    True
    False
    False
    07
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    09
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    002
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    004
    True
    True
    True
    False
    False
    005
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    007

    True
    True
    True
    False
    False
    06
    True
    True
    True
    False
    False
    45
    True
    True
    True
    False
    False
    412

     

    True
    True
    True
    False
    False
    91

    ________ 102 ________ 103 ________ 194 ________ 195

    đầu ra

    True
    True
    True
    False
    False
    0

    Xóa tất cả các ký tự trừ chữ cái và số bằng hàm ord()

    Ở đây, chức năng này minh họa việc loại bỏ các ký tự không phải là số và bảng chữ cái bằng cách sử dụng hàm ord()

    Python3




    True
    True
    True
    False
    False
    43

    ________ 144 ________ 145 ________ 101

     

    True
    True
    True
    False
    False
    01

    ________ 102 ________ 103 ________ 104 ________ 105

    True
    True
    True
    False
    False
    025
    True
    True
    True
    False
    False
    45____1027

    ________ 101 ________ 1029 ________ 103 ________ 1031

    True
    True
    True
    False
    False
    032
    True
    True
    True
    False
    False
    06
    True
    True
    True
    False
    False
    034
    True
    True
    True
    False
    False
    035
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    037
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    039
    True
    True
    True
    False
    False
    040
    True
    True
    True
    False
    False
    041
    True
    True
    True
    False
    False
    042
    True
    True
    True
    False
    False
    08
    True
    True
    True
    False
    False
    034
    True
    True
    True
    False
    False
    035
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    037
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    049
    True
    True
    True
    False
    False
    040
    True
    True
    True
    False
    False
    051
    True
    True
    True
    False
    False
    042
    True
    True
    True
    False
    False
    08
    True
    True
    True
    False
    False
    034
    True
    True
    True
    False
    False
    035
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    037
    True
    True
    True
    False
    False
    03
    True
    True
    True
    False
    False
    059
    True
    True
    True
    False
    False
    040
    True
    True
    True
    False
    False
    061
    True
    True
    True
    False
    False
    062