Tách số khỏi văn bản trong Google Trang tính

Vì vậy, tôi có một trang tính mới trong đó mỗi mặt hàng là một cột mới, tôi muốn trích xuất số lượng của từng mặt hàng từ ô phía trên, để tôi có thể so sánh mặt hàng đó với giá trị kho hiện có. Ví dụ: làm cách nào để trích xuất số lượng cho "MEN’S SS PERFORMANCE TEE - Antraxit (Số lượng. 19. 50 USD, Màu. Antraxit, Kích thước. S, Số lượng. 5)", tôi có thể thấy số lượng của nó là 5 nhưng làm cách nào để trích xuất nó trong ô mới. Cảm ơn bạn

Hồi đáp

Google Trang tính không thực sự cung cấp chức năng cụ thể để trích xuất các số từ một chuỗi. Tuy nhiên, có vô số chức năng khác nhau do Google Trang tính cung cấp mà chúng ta có thể tùy chỉnh để hoàn thành công việc

Trong hướng dẫn này, chúng ta sẽ xem xét một số cách mà chúng ta có thể sử dụng các hàm trong Google Trang tính để trích xuất các chuỗi con là số từ một chuỗi

Trong phần hướng dẫn này, chúng ta sẽ xem xét các loại công thức khác nhau có thể được sử dụng trong Google Trang tính để trích xuất số từ chuỗi trong từng trường hợp

 

Mục lục

  • Sử dụng hàm REGEX trong Google Sheets để trích xuất số từ chuỗi
    • Hàm REGEXEXTRACT
    • Hàm REGEXREPLACE
    • Biểu thức chính quy là gì?
  • Trích xuất số từ mọi nơi trong chuỗi trong Google Trang tính
  • Trích xuất các số từ đầu chuỗi trong Google Trang tính
  • Trích xuất các số từ cuối chuỗi trong Google Trang tính
  • Trích xuất tất cả các số trong một chuỗi bằng cách xóa phần văn bản
  • Trích xuất nhiều số từ các phần khác nhau của chuỗi thành các cột riêng biệt
  • Tách các phần của một số thành các cột riêng biệt dựa trên mẫu
  • Phần kết luận

 

Sử dụng hàm REGEX trong Google Sheets để trích xuất số từ chuỗi

Google Trang tính cung cấp một bộ hàm REGEX tiện dụng bao gồm các hàm như REGEXEXTRACT và REGEX REPLACE

Các hàm này cho phép sử dụng một chuỗi tìm kiếm bao gồm một biểu thức chính quy để tìm nhanh các số, chữ cái, ký hiệu cũng như các mẫu chuỗi trong một văn bản nhất định

Vì vậy, trước khi xem xét các trường hợp và ví dụ riêng lẻ, hãy cho chúng tôi hiểu cú pháp của các hàm này và cách chúng hoạt động

Hàm REGEXEXTRACT

Hàm REGEXEXTRACT được sử dụng để trích xuất các chuỗi con phù hợp từ một chuỗi. Nó nhận vào một chuỗi và một biểu thức chính quy, đồng thời trả về phần của chuỗi khớp với mẫu trong biểu thức chính quy

Cú pháp của hàm REGEXEXTRACT như sau

REGEXEXTRACT(text, reg_exp)

Đây,

  • văn bản là văn bản hoặc chuỗi mà bạn muốn trích xuất một chuỗi con
  • regex là một biểu thức chính quy. Đây là chuỗi tìm kiếm phải khớp với phần văn bản mà bạn muốn trích xuất

Khi một chuỗi văn bản chứa nhiều hơn một chuỗi con khớp với biểu thức chính quy, thì REGEXEXTRACT trả về chuỗi con khớp đầu tiên

Bấm vào đây để biết thêm thông tin về REGEXEXTRACT

 

Hàm REGEXREPLACE

Hàm REGEXREPLACE được sử dụng để thay thế các chuỗi con phù hợp trong một chuỗi. Nó nhận một chuỗi, một biểu thức chính quy và một chuỗi thay thế và nó trả về chuỗi có các chuỗi con phù hợp được thay thế

Cú pháp của hàm REGEXEXTRACT như sau

REGEXEXTRACT(text, reg_exp, replacement)

Đây,

  • text là văn bản hoặc chuỗi mà bạn muốn tìm (các) chuỗi con phù hợp
  • regex là một biểu thức chính quy. Đây là chuỗi tìm kiếm phải khớp với phần văn bản mà bạn muốn thay thế
  • thay thế là chuỗi văn bản sẽ thay thế tất cả các phiên bản phù hợp của reg_exp trong văn bản

Bấm vào đây để biết thêm thông tin về REGEXREPLACE

Biểu thức chính quy là gì?

Biểu thức chính quy không là gì ngoài một mẫu ký tự, bao gồm một số ký hiệu, chữ cái và/hoặc số đặc biệt, còn được gọi là siêu ký tự. Mẫu siêu ký tự này kết hợp với nhau để tạo thành một chuỗi tìm kiếm

Để trích xuất các số từ một chuỗi, đây là một số ký tự meta thường được sử dụng

siêu ký tự

Những gì nó đại diện

^

Sự bắt đầu của chuỗi

$

Cuối chuỗi

.

Một ký tự đơn

+

Một hoặc nhiều lần xuất hiện của một ký tự hoặc chuỗi

d

Một chữ số

w

Lá thư

 

Thoát khỏi một nhân vật đặc biệt

()

Một dãy ký tự kèm theo bên trong nó

[]

Bất kỳ một trong những ký tự kèm theo bên trong nó

Khi bạn tiếp tục đọc bài viết này, nó sẽ trở nên rõ ràng hơn về cách kết hợp các siêu ký tự này để thực hiện các biểu thức chính quy mạnh mẽ

 

Trích xuất số từ mọi nơi trong chuỗi trong Google Trang tính

Hãy xem xét danh sách các chuỗi sau đây

 

Tách số khỏi văn bản trong Google Trang tính

Hãy để chúng tôi cố gắng trích xuất các số từ mỗi chuỗi này

Biểu thức “d” đại diện cho một chữ số. Chúng tôi sử dụng ký hiệu ‘’ để Google Trang tính hiểu rằng chúng tôi muốn nói đến siêu ký tự ‘d’ chứ không phải chữ ‘d’

Vì vậy, nếu bạn muốn trích xuất một chữ số từ một chuỗi, bạn sử dụng biểu thức 'd'. Nhưng nếu bạn muốn trích xuất nhiều hơn một chữ số, bạn có thể sử dụng biểu thức 'd+'

Nói cách khác, nếu bạn muốn trích xuất lần xuất hiện đầu tiên của một chuỗi các chữ số từ một chuỗi, bạn có thể sử dụng công thức sau (coi chuỗi được trích xuất nằm trong ô A2)

=REGEXEXTRACT(A2,”d+”)

Ghi chú. Nếu có nhiều hơn một lần xuất hiện của một số trong chuỗi, công thức trên sẽ chỉ trả về số đầu tiên, như bạn có thể thấy trong hàng 4 của ảnh chụp màn hình bên dưới

Tách số khỏi văn bản trong Google Trang tính

 

Trích xuất các số từ đầu chuỗi trong Google Trang tính

Có thể có trường hợp bạn chỉ muốn trích xuất các số ở đầu chuỗi. Ví dụ, hãy xem xét danh sách các chuỗi sau đây

 

Tách số khỏi văn bản trong Google Trang tính

Chúng ta hãy cố gắng chỉ trích xuất các số ở đầu mỗi chuỗi này

Ký hiệu “^” được sử dụng để xác định rằng chúng tôi chỉ muốn các ký tự bắt đầu bằng biểu thức sau. Vì vậy, biểu thức “^d” chỉ đại diện cho chữ số ở đầu chuỗi đã cho

Nếu bạn muốn trích xuất nhiều hơn một chữ số từ đầu chuỗi, bạn có thể sử dụng biểu thức '^d+'

Bây giờ điều gì xảy ra nếu chuỗi hoàn toàn không bắt đầu bằng một số?

Trong trường hợp đó, hàm REGEXEXTRACT trả về lỗi

Tách số khỏi văn bản trong Google Trang tính

Để xử lý lỗi này, bạn có thể bọc một hàm IFERROR xung quanh hàm REGEXEXTRACT. Sau đó, chức năng này có thể đảm bảo rằng nếu chức năng REGEXEXTRACT trả về lỗi, một ô trống sẽ được hiển thị

Nói cách khác, nếu chuỗi không bắt đầu bằng một số, thì kết quả sẽ là một ô trống

Vì vậy, nếu bạn muốn trích xuất các số từ đầu chuỗi, bạn có thể sử dụng công thức sau (coi chuỗi cần trích xuất nằm trong ô A2)

=IFERROR(REGEXEXTRACT(A2,”^d+”),””)

Tách số khỏi văn bản trong Google Trang tính

 

Trích xuất các số từ cuối chuỗi trong Google Trang tính

Tương tự, nếu bạn chỉ muốn trích xuất các số ở cuối chuỗi, bạn chỉ cần thực hiện một điều chỉnh nhỏ cho cùng một công thức

Hãy xem xét danh sách các chuỗi sau đây

 

Tách số khỏi văn bản trong Google Trang tính

Chúng ta hãy cố gắng chỉ trích xuất các số ở cuối mỗi chuỗi này

Ký hiệu “$” được sử dụng để xác định rằng chúng tôi chỉ muốn các ký tự kết thúc bằng biểu thức trước đó. Vì vậy, biểu thức “d$” chỉ đại diện cho chữ số ở cuối chuỗi đã cho

Nếu bạn muốn trích xuất nhiều hơn một chữ số từ cuối chuỗi, bạn có thể sử dụng biểu thức 'd+$'

Như trước đây, nếu chuỗi của bạn hoàn toàn không kết thúc bằng một số, bạn có thể muốn xử lý chuỗi đó bằng hàm IFERROR

Vì vậy, nếu bạn muốn trích xuất các số từ cuối chuỗi, bạn có thể sử dụng công thức sau (coi chuỗi được trích xuất nằm trong ô A2)

=IFERROR(REGEXEXTRACT(A2,”d+$”),””)

Tách số khỏi văn bản trong Google Trang tính

 

Trích xuất tất cả các số trong một chuỗi bằng cách xóa phần văn bản

Bây giờ chúng ta hãy xem xét một vài trường hợp đặc biệt. Điều gì sẽ xảy ra nếu bạn có các số trong các phần khác nhau của văn bản và bạn muốn trích xuất và kết hợp tất cả chúng thành một số duy nhất?

Ví dụ, hãy xem xét danh sách các chuỗi sau đây

 

Tách số khỏi văn bản trong Google Trang tính

Trong mỗi chuỗi, các số được trải ra với các ký tự văn bản ở giữa chúng. Chúng tôi muốn trích xuất các số theo cùng một thứ tự và kết hợp chúng thành một số lớn duy nhất

Trong những trường hợp như vậy, cách tốt nhất là chỉ cần xóa tất cả các ký tự văn bản trong chuỗi. Đối với điều này, chúng ta có thể dễ dàng áp dụng chức năng REGEXREPLACE như sau

=REGEXREPLACE(A2,”[a-zA-Z]”,””)

Công thức trên sẽ xóa tất cả các bảng chữ cái khỏi chuỗi trong ô A2, chỉ để lại các số

Tách số khỏi văn bản trong Google Trang tính

 

Trích xuất nhiều số từ các phần khác nhau của chuỗi thành các cột riêng biệt

Ngoài ra, thay vì kết hợp các lần xuất hiện khác nhau của các số vào một cột, bạn có thể muốn tách số xuất hiện ở các phần khác nhau của văn bản thành các cột riêng biệt. Chức năng SPLIT sẽ hoạt động tốt cho bạn trong những trường hợp như vậy

Hàm SPLIT được sử dụng để chia một chuỗi văn bản (hoặc giá trị) xung quanh một dấu phân cách đã cho. Đầu ra được hiển thị thành các phần riêng biệt trong các ô liên tiếp của riêng chúng trong một hàng

Chúng ta hãy xem xét cùng một danh sách các chuỗi

 

Tách số khỏi văn bản trong Google Trang tính

Để tách các số xuất hiện ở các phần khác nhau của văn bản thành các cột riêng biệt, chúng ta có thể sử dụng hàm SPLIT như sau (coi chuỗi cần trích nằm trong ô A2)

=SPLIT(LOWER(A2);”abcdefghijklmnopqsrtuvwxyz”)

Công thức này sử dụng bất kỳ chữ cái nào trong bảng chữ cái làm dấu phân cách, do đó tách bất kỳ số nào xung quanh một chữ cái hoặc tập hợp các chữ cái thành các ô (hoặc cột) riêng biệt

Đây là những gì xảy ra khi bạn áp dụng công thức cho danh sách các chuỗi đã cho của chúng tôi

 

Tách số khỏi văn bản trong Google Trang tính

 

Tách các phần của một số thành các cột riêng biệt dựa trên mẫu

Điều tuyệt vời của các hàm REGEX là chúng có thể phát hiện các mẫu số trong một chuỗi, vì vậy chúng ta có thể dễ dàng tận dụng các mẫu để tách các số thành các phần cấu thành và hiển thị từng phần trong các cột riêng biệt

Ví dụ: giả sử bạn có một danh sách các chuỗi chứa số điện thoại và bạn muốn tách các số này thành các cột riêng biệt cho mã vùng, mã trao đổi và số thuê bao

 

Tách số khỏi văn bản trong Google Trang tính

Bây giờ chú ý mô hình trong các số điện thoại

  • Ba chữ số đầu tiên (của mã vùng) được đặt trong dấu ngoặc đơn
  • Ba chữ số tiếp theo (của mã trao đổi) xuất hiện sau dấu ngoặc đơn đóng và trước dấu gạch nối '-'
  • 4 số cuối (của số thuê bao) đứng ngay sau dấu gạch nối

Chúng ta có thể sử dụng mẫu này để chỉ định biểu thức chính quy, trong đó mỗi dãy số (mà chúng ta muốn trong một cột) có thể được biểu diễn trong dấu ngoặc tròn

Để chỉ định có bao nhiêu ký tự trong một chuỗi, chúng ta có thể sử dụng dấu ngoặc nhọn. Điều này có nghĩa là nếu chúng ta muốn chỉ định một dãy gồm 3 số, chúng ta có thể sử dụng biểu thức “(. {3})” hoặc “(…)”

Hãy để chúng tôi đặt mọi thứ lại với nhau. Để trích xuất số điện thoại từ chuỗi trong ô A2 và tách nó thành ba cột, chúng ta có thể sử dụng công thức

=REGEXEXTRACT(A2,"((.{3}))(.{3})-(.{4})")

Đây là những gì xảy ra khi bạn áp dụng công thức cho danh sách các chuỗi đã cho của chúng tôi

 

Tách số khỏi văn bản trong Google Trang tính

Phần kết luận

Trong hướng dẫn này, chúng tôi đã chỉ cho bạn cách trích xuất số từ một chuỗi trong Google Trang tính, sử dụng các loại tình huống khác nhau

Chúng tôi đã cố gắng trình bày cho bạn các trường hợp sử dụng khác nhau để bạn có thể quyết định công thức nào phù hợp nhất với mình

Chúng tôi cũng đã giải thích từng công thức để bạn có thể tùy chỉnh chúng khi cần và áp dụng chúng cho dữ liệu của riêng bạn

Chúng tôi hy vọng các ví dụ của chúng tôi hữu ích

Bài viết phổ biến nhất

Tách số khỏi văn bản trong Google Trang tính

5 cách đơn giản để làm nổi bật các bản sao trong Google Sheets

Tách số khỏi văn bản trong Google Trang tính

NẾU CHỨA Công thức Google Trang tính [2 Tùy chọn thông minh]

Tách số khỏi văn bản trong Google Trang tính

Cách áp dụng công thức cho toàn bộ cột trong Google Sheets

Tách số khỏi văn bản trong Google Trang tính

Cách VLOOKUP từ một trang tính khác trong Google Trang tính

Tách số khỏi văn bản trong Google Trang tính

Nahid Akhter

Nahid Akhter là một nhà văn, lập trình viên và người tạo nội dung khóa học trực tuyến. Cô có bằng Thạc sĩ Khoa học Máy tính và đã làm việc trong lĩnh vực giáo dục hơn 14 năm. Chuyên môn của cô ấy là lập trình và viết về Công nghệ, và các lĩnh vực cô ấy quan tâm bao gồm năng suất Văn phòng, Trí tuệ Nhân tạo, thiết kế và phát triển Web