Cách tìm ký tự Unicode trong Excel

Những người đặt phòng của bạn có thể đã sử dụng các ký tự đặc biệt khi điền vào biểu mẫu đặt phòng (chẳng hạn như é, ç, ü, v.v.). Khi xuất dữ liệu đăng ký, bạn sẽ thấy các ký tự đặc biệt này được hiển thị không chính xác trong Excel vì Microsoft Excel không thể hiển thị chính xác các tệp CSV tuân thủ UTF-8 khi chúng chứa các ký tự không phải tiếng Anh

Để giải quyết vấn đề này, vui lòng làm như sau sau khi lưu tệp CSV từ xuất đặt chỗ của bạn

Trên máy Windows

Phương pháp 1

  • Trên máy tính Windows, hãy mở tệp CSV bằng Notepad
  • Nhấp vào "Tệp> Lưu dưới dạng"
  • Trong cửa sổ hộp thoại xuất hiện - chọn "ANSI" từ trường "Mã hóa". Sau đó nhấp vào "Lưu"
  • Đó là tất cả. Mở tệp CSV mới này bằng Excel - các ký tự không phải tiếng Anh của bạn sẽ được hiển thị chính xác

Phương pháp 2

  • Trên máy tính Windows, nhấp vào "Tệp > Mới" trong Excel
  • Nhấp vào tab "Dữ liệu"
  • Sau đó nhấp vào tùy chọn "Từ văn bản". Chọn tệp CSV bạn đã lưu từ Accompa
  • Excel sẽ hiển thị "Trình hướng dẫn nhập văn bản"
  • Trong bước 1 của trình hướng dẫn này
    • Chọn nút radio "Được phân cách"
    • Trong trường "Nguồn gốc tệp" - chọn "65001. Unicode (UTF-8)"
  • Nhấp vào nút "Tiếp theo>"
  • Trong bước 2 của trình hướng dẫn này
    • Chọn hộp kiểm "Dấu phẩy"
  • Nhấp vào nút "Kết thúc"
  • Trong cửa sổ hộp thoại xuất hiện - nhấp vào nút "OK"
  • Excel sẽ hiển thị đúng tệp CSV của bạn - bao gồm các ký tự không phải tiếng Anh -

Trên máy Mac

Sử dụng ứng dụng "Numbers" thay vì Excel

Hàm Excel UNICODE trả về một số (điểm mã) tương ứng với một ký tự Unicode được cung cấp dưới dạng văn bản. Kết quả là một số trong ký hiệu thập phân. Ví dụ: ký hiệu Euro (€) là điểm mã 8364 trong ký hiệu thập phân, vì vậy công thức sau trả về 8364

=UNICODE("€") // returns 8364

Với ký hiệu Euro trong ô A1, công thức bên dưới có kết quả tương tự

=UNICODE(A1) // returns 8364

Nếu văn bản có nhiều hơn một ký tự, UNICODE trả về số của ký tự đầu tiên

=UNICODE("a") // returns 97
=UNICODE("apple") // returns 97

Ghi chú. hàm UNICHAR thực hiện chuyển đổi ngược lại, trả về ký tự Unicode tại một điểm mã nhất định

bảng chữ cái

Unicode là một tiêu chuẩn điện toán để mã hóa, biểu diễn và xử lý văn bản thống nhất trong hầu hết các hệ thống chữ viết trên thế giới. Giống như ASCII, Unicode là một bộ ký tự. Tuy nhiên, Unicode là một bộ ký tự rất lớn, vì Unicode là bộ ký tự siêu cấp của các bộ ký tự khác. Trong khi ASCII chứa 128 ký tự, Unicode 11. 0 (tháng 6 năm 2018) chứa 137.439 ký tự bao gồm 146 chữ viết hiện đại và lịch sử

Unicode có thể được triển khai trong các bảng mã khác nhau, ví dụ: UTF-8, UTF-16, v.v. UTF-8 thống trị web. Người ta ước tính rằng hơn 90% trang web sử dụng UTF-8. 128 điểm mã Unicode đầu tiên là các ký tự ASCII

Dưới đây là cách sử dụng hàm Clean trong Microsoft Excel 2019, 2016, 2013, 2010 và Excel cho Microsoft 365. Hàm Clean xóa nhiều ký tự máy tính không in được được sao chép hoặc nhập vào một trang tính vì những ký tự đó có thể ảnh hưởng đến việc in, sắp xếp và lọc dữ liệu

Hàm CLEAN Cú pháp và đối số

Cú pháp của hàm là bố cục của hàm và bao gồm tên, dấu ngoặc và đối số. Cú pháp của hàm CLEAN là

=CLEAN(Text)

Chữ

(bắt buộc) là một

tham chiếu ô

đến vị trí của dữ liệu này trong trang tính mà bạn muốn dọn dẹp

Ví dụ: giả sử ô A2 chứa công thức này

=CHAR(10)&"Calendar"&CHAR(9)

Để làm sạch nó, bạn sẽ nhập công thức vào một ô khác của bảng tính

=CLEAN(A2)

Kết quả sẽ chỉ để lại từ

Lịch

trong ô A2

Ngoài việc xóa các ký tự không in được, hàm CLEAN còn chuyển đổi số thành văn bản, điều này có thể dẫn đến lỗi nếu sau này bạn sử dụng dữ liệu đó trong các phép tính

Xóa các ký tự không in được, không phải ASCII

Mặc dù hàm CLEAN rất tuyệt vời để loại bỏ các ký tự ASCII không in được, nhưng có một số ký tự không in được nằm ngoài phạm vi ASCII mà bạn có thể muốn xóa

Các ký tự Unicode không in được bao gồm các số 129, 141, 143, 144 và 157. Ngoài ra, bạn có thể muốn xóa 127, đây là ký tự xóa và cũng không thể in được

Một cách để xóa dữ liệu đó là yêu cầu hàm SUBSTITUTE chuyển đổi dữ liệu đó thành ký tự ASCII mà hàm CLEAN có thể xóa. Bạn có thể lồng 2 hàm SUBSTITUTE và CLEAN vào để dễ dàng hơn

=CLEAN(SUBSTITUTE(A3,CHAR(129),CHAR(7)))

Ngoài ra, người ta có thể chỉ cần thay thế ký tự không in được vi phạm bằng ký tự không có gì ("")

=SUBSTITUTE(A4,CHAR(127),"")

Ký tự không in được là gì?

Cách tìm ký tự Unicode trong Excel
Cách tìm ký tự Unicode trong Excel

Mỗi ký tự trên máy tính — in được và không in được — có một số được gọi là giá trị hoặc mã ký tự Unicode. Một bộ ký tự khác, cũ hơn và được biết đến nhiều hơn là ASCII, viết tắt của Mã tiêu chuẩn Mỹ để trao đổi thông tin, đã được tích hợp vào bộ Unicode

Kết quả là 32 ký tự đầu tiên (0 đến 31) của bộ Unicode và ASCII giống hệt nhau. Chúng được sử dụng bởi các chương trình để điều khiển các thiết bị ngoại vi như máy in, trên các nền tảng khác nhau. Như vậy, chúng không nhằm mục đích sử dụng trong trang tính và có thể gây ra lỗi khi xuất hiện

Hàm CLEAN, có trước bộ ký tự Unicode, loại bỏ 32 ký tự ASCII không in được đầu tiên và các ký tự tương tự khỏi bộ Unicode