Có nhiều lý do để khai báo ngôn ngữ của trang HTML trong mã nguồn. Trước hết, nó giúp các tác nhân người dùng hiển thị chính xác nội dung văn bản của trang web dễ dàng hơn. Ngoài ra, đặc tả ngôn ngữ trong mã HTML giúp các công cụ tìm kiếm hiển thị kết quả tìm kiếm phù hợp cho người dùng từ các quốc gia khác nhau. Nếu ngôn ngữ của một trang không được chỉ định rõ ràng trong mã HTML, các công cụ tìm kiếm sẽ cố gắng xác định ngôn ngữ của trang đó dựa trên các yếu tố khác (xem Phần 2), nhưng điều này có thể dẫn đến hiểu sai
Ngoài ra, bạn cũng nên đánh dấu các thay đổi ngôn ngữ trong trang HTML chẳng hạn để dịch vụ dịch thuật hoạt động thuận lợi.
Kiểm tra khai báo ngôn ngữ
Kiểm tra khai báo ngôn ngữ của trang HTML của bạn
Như đã đề cập ở trên, các công cụ tìm kiếm có một số tùy chọn khác để xác định ngôn ngữ của trang web nếu bạn không khai báo nó trong mã HTML. Ví dụ: các công cụ tìm kiếm hiện đại như Google có thể sử dụng phân tích văn bản đơn giản để nhận dạng ngôn ngữ của nội dung trên trang web và do đó chỉ định nội dung đó cho chỉ mục quốc gia chính xác. Tuy nhiên, có thể có vấn đề nếu có ít nội dung văn bản để phân tích hoặc thậm chí văn bản bằng nhiều ngôn ngữ trên cùng một trang web
Hơn nữa, các công cụ tìm kiếm có thể sử dụng vị trí máy chủ hoặc phần mở rộng tên miền để xác định ngôn ngữ của trang web, nhưng điều này không phải lúc nào cũng dẫn đến kết quả chính xác. Ví dụ: một trang web có thể có tên miền kết thúc bằng. de và một máy chủ cũng được đặt tại Đức, tuy nhiên các trang riêng lẻ trên trang web này được viết bằng tiếng Anh
Vì vậy, để tránh hiểu sai, bạn phải luôn chỉ định ngôn ngữ của trang web trong mã HTML. Trong phần tiếp theo, chúng tôi sẽ giải thích cho bạn cách hoạt động của tính năng này
Cách khai báo ngôn ngữ trong HTML
Cách dễ nhất để đặt ngôn ngữ của trang là thông qua thuộc tính lang sau trong phần tử HTML (HTML 5)
Bạn phải luôn chỉ định thuộc tính lang này trong phần tử HTML vì nó cũng được kế thừa cho tất cả các phần tử khác và do đó cũng xác định ngôn ngữ cho văn bản trong vùng đầu. Điều này sẽ không xảy ra nếu bạn sử dụng thuộc tính lang trong phần tử body
Nếu các phần của văn bản trong một trang được viết bằng một ngôn ngữ khác, thuộc tính lang sẽ được thêm vào bất kỳ phần tử nào chứa các phần ngôn ngữ nước ngoài đó
Đối với các trang được phân phối dưới dạng XML, hãy sử dụng xml. thuộc tính lang
Các công cụ tìm kiếm cũng hiểu thông tin ngôn ngữ lỗi thời trong các thuộc tính meta của một trang web, chẳng hạn như
tuy nhiên, chúng không nên được sử dụng
Để xác định đúng mã ngôn ngữ gồm hai chữ cái theo ISO 639-1, bạn có thể sử dụng sổ đăng ký thẻ phụ ngôn ngữ IANA. Các mã này cũng có thể bao gồm hai phần, phần thứ nhất đề cập đến ngôn ngữ và phần thứ hai đề cập đến quốc gia sử dụng ngôn ngữ đó, e. g. "en-us" cho tiếng Anh Mỹ
Ví dụ: nếu bạn gặp vấn đề với việc khai báo ngôn ngữ trang web của mình thông qua thuộc tính lang, bạn có thể đặt hướng địa lý của trang web cho Google theo cách thủ công bằng Search Console (> Cài đặt trang web)
Các tùy chọn để cấu trúc các trang web đa ngôn ngữ
Nhân vật. Website đa ngôn ngữ - Tác giả. Khả năng tìm kiếm - Giấy phép. CC BY-SA 4. 0
Nếu một trang web chứa các trang và nội dung bằng các ngôn ngữ khác nhau, e. g. nếu một công ty hoạt động quốc tế, có nhiều cách khác nhau để cấu trúc nó
Ví dụ: bạn có thể mua miền quốc gia cho mỗi quốc gia, e. g. thí dụ. de, ví dụ. ví dụ. nó vv
Một tùy chọn khác là lưu trữ từng phiên bản ngôn ngữ trên một tên miền phụ, e. g. de. thí dụ. com, es. thí dụ. com, nó. thí dụ. com, v.v.
Ngoài ra, bạn có thể tạo một thư mục con cho mỗi ngôn ngữ, với phiên bản chính của trang web nằm trong thư mục gốc, chẳng hạn như. g. thí dụ. com/es/ hoặc ví dụ. com/it/
Đối với các trang động, cũng có thể thêm tham số ngôn ngữ cho ngôn ngữ tương ứng vào URL, e. g. thí dụ. com/sản phẩm. php?lang=es
Tóm tắt. Khai báo ngôn ngữ trong HTML FAQs
Có nhất thiết phải khai báo ngôn ngữ của trang HTML không?
Không, không nhất thiết phải khai báo ngôn ngữ của trang HTML. Tuy nhiên, nó rất được khuyến khích vì nó giúp ngăn ngừa lỗi
Làm thế nào để các công cụ tìm kiếm xử lý trang của bạn nếu bạn không khai báo ngôn ngữ của nó?
Nếu một trang không chứa khai báo ngôn ngữ, các công cụ tìm kiếm sẽ cố gắng tự xác định ngôn ngữ của trang đó
Thẻ LANG (tôi. e. thuộc tính lang="") được thiết kế để báo hiệu cho các công cụ phát âm của trình đọc màn hình chuyển sang ngôn ngữ khác. Vì lý do này và lý do khác, việc gắn thẻ văn bản Web bằng một ngôn ngữ cụ thể là bắt buộc trong WCAG 2. 0
WCAG 2. 0 Hướng dẫn 3. 1. 1—"Ngôn ngữ con người mặc định của mỗi trang Web có thể được xác định theo chương trình. "
Điều quan trọng hơn nữa là sử dụng gắn thẻ ngôn ngữ để báo hiệu sự thay đổi ngôn ngữ
WCAG 2. 0 Hướng dẫn 3. 1. 2—"Ngôn ngữ của con người trong từng đoạn văn hoặc cụm từ trong nội dung có thể được xác định theo chương trình ngoại trừ tên riêng, thuật ngữ kỹ thuật, từ thuộc ngôn ngữ không xác định và từ hoặc cụm từ đã trở thành một phần tiếng bản ngữ của văn bản xung quanh ngay lập tức. "
Khai báo ngôn ngữ trang
Thuộc tính LANG được thiết kế để báo hiệu cho trình đọc màn hình chuyển sang ngôn ngữ khác. Khuyến nghị chính thức của W3C là khai báo ngôn ngữ chính cho mỗi trang Web với thuộc tính <...lang => trong thẻ_______3_______. Các mã là mã Ngôn ngữ ISO-639, một số được liệt kê thêm trên trang này
GHI CHÚ. Bạn cũng phải khai báo mã hóa trong
ngoài ngôn ngữ. Ngôn ngữ và chữ viết của nó là độc lập
Khai báo chữ U. S. Trang tiếng Anh (Penn State)
<html lang="en-US"> ... </html>
Khai báo một trang tiếng Anh Anh
<html lang="en-GB"> ... </html>
Trình đọc màn hình hỗ trợ thẻ này có thể chuyển sang giọng Anh
Khai Trang Pháp
<html lang="fr"> ... </html>
Trình đọc màn hình hỗ trợ thẻ này có thể chuyển sang giọng Pháp
chuyển đổi ngôn ngữ
Nếu chuyển đổi ngôn ngữ trong một trang, bạn có thể nhúng thuộc tính LANG attribute
trong các thẻ khác như P, TD, SPAN, DIV và
thẻ khác. Ví dụ
Kiểm tra văn bản với thẻ Lang
Câu này mặc định là tiếng Anh Mỹ
Câu này sẽ được đọc với giọng Anh
Esta frase es en español. (Người Tây Ban Nha)
Cụm từ Cette est en français. (Người Pháp)
Mae’r frawddeg hon yng Nghymraeg. (Tiếng Wales – Không được hỗ trợ)
Xem mã
<...lang =>2 <...lang =>3 <...lang =>4 <...lang =>5 <...lang =>6
Mã ngôn ngữ chung
Hai Thư vs. ba lá thư
Bộ mã ngôn ngữ đầu tiên (ISO-639) gồm hai mã chữ cái, nhưng không bao gồm mọi ngôn ngữ. Do đó, các bộ mã gồm ba chữ cái (ISO-639-2/ISO-639-3) đã được tạo để bao gồm nhiều ngôn ngữ hơn
Đối với bất kỳ ngôn ngữ nào, các tiêu chuẩn cho biết sử dụng mã gồm hai chữ cái nếu nó tồn tại. Chỉ sử dụng mã gồm ba chữ cái nếu không có mã nào khác. Xem Bảng mã ISO 639 để biết danh sách đầy đủ các mã ngôn ngữ bao gồm mã ISO-639 gốc và các biến thể sau này
Ngôn ngữ Tây Âu
Các mã này được hỗ trợ trong nhiều trình đọc màn hình, bao gồm JAWS
LanguageCodeBiến thểTiếng Anhvi
- Tiếng Anh Mỹ – Code. en-Mỹ
- Anh Anh – Mã. en-GB
- Tiếng Tây Ban Nha Castilian – Mã. es-ES
- Tiếng Tây Ban Nha Mexico – Mã. es-MX
- Các biến thể quốc gia Tây Ban Nha khác
- Tiếng Pháp Canada – Mã. fr-CA
- Các biến thể quốc gia Pháp khác
- Tiếng Bồ Đào Nha Brazil – Mã. pt-BR
- Tiếng Bồ Đào Nha Châu Âu – Mã. pt-PT
- Xem trang tiếng Bồ Đào Nha
Ngôn ngữ ngoài Tây Âu
Ngôn ngữMãBiến thểTiếng Ả Rậpar
Xem thông tin tiếng Ả Rập Chinesezh- Tiếng Trung giản thể – Mã. zh-CN
- Tiếng Trung phồn thể – Mật mã. zh-TW
- Hồng Kông – Mã. zh-HK
- Các biến thể khác của Trung Quốc
ngôn ngữ cổ đại
Ngôn ngữMãBiến thểHy Lạp cổ đạigrc
- Hy Lạp hiện đại. el
Tín hiệu bổ sung về nội dung không phải tiếng Anh
Ngoài việc sử dụng thẻ LANG, bạn cũng có thể bao gồm một chỉ báo trong văn bản để người dùng trình đọc màn hình cũ hơn có thể sử dụng ngôn ngữ theo cách thủ công. Điều này có thể được thực hiện bằng cách đánh vần phần đầu/cuối của đoạn văn trong văn bản (tốt nhất là trong thẻ H1,H2 hoặc là một phần của tập hợp các liên kết) hoặc trong thẻ alt của một hình ảnh vô hình
Đánh vần tên ngôn ngữ trong văn bản
Bản dịch của U. N. Tuyên ngôn thế giới về quyền lợi của con người
. … (Menu cung cấp nhanh
danh sách các đoạn văn không phải tiếng Anh). Vẫn nên sử dụng thẻ LANG
Bài báo tiếng Tây Ban Nha 1 (Đánh vần)
Điều 1
Todos los seres humanos nacen libres e iguales en degnidad and derechos y, dotados como están de razón y conciencia, deben comportarse fraternalmente los unos con los otros
Pháp Điều 1
Bài báo hàng đầu
Tous les êtres humains naissent libres et égaux en dignité et en droits. Ils sont doués de raison et de lương tâm et doivent agir les uns envers les autres dans un esprit de fraternité
Với đồ họa vô hình
Một kỹ thuật cũ hơn là thêm một hình ảnh vô hình và sử dụng văn bản ALT để báo hiệu việc chuyển sang ngôn ngữ khác. Vẫn nên sử dụng thẻ LANG