PHP cắt không gian tiếng Nhật

Có 2 phương pháp nhập tiếng Nhật chính trên máy tính. Một là thông qua một phiên bản tiếng Nhật được La tinh hóa gọi là rōmaji (nghĩa đen là "ký tự La Mã"), và một là thông qua các phím bàn phím tương ứng với chữ kana của Nhật Bản. Một số hệ thống cũng có thể hoạt động thông qua giao diện người dùng đồ họa hoặc GUI, trong đó các ký tự được chọn bằng cách nhấp vào nút hoặc bản đồ hình ảnh

Bàn phím tiếng Nhật[sửa]

Bàn phím chơi game của Microsoft dành cho thị trường Nhật Bản

Bàn phím kanji cũ trước khi chuyển đổi kana sang kanji được phát minh

Bàn phím tiếng Nhật (như trong hình thứ hai) có cả chữ hiragana và chữ La Mã. Bố cục bàn phím JIS, hay Tiêu chuẩn công nghiệp Nhật Bản, giữ các chữ cái La Mã trong bố cục QWERTY tiếng Anh, với các số phía trên chúng. Nhiều ký hiệu không phải chữ và số giống như trên bàn phím tiếng Anh, nhưng một số ký hiệu nằm ở những nơi khác. Các ký hiệu hiragana cũng được sắp xếp theo một cách nhất quán trên các bàn phím khác nhau. Ví dụ: các phím Q, W, E, R, T, Y tương ứng với た, て, い, す, か, ん (ta, te, i, su, ka, và n) tương ứng khi máy tính được sử dụng cho

Phím nhập [ chỉnh sửa ]

Vì đầu vào tiếng Nhật yêu cầu chuyển đổi giữa chế độ nhập chữ La Mã và chữ hiragana, cũng như chuyển đổi giữa chữ hiragana và chữ Hán (như được thảo luận bên dưới), thường có một số phím đặc biệt trên bàn phím. Điều này thay đổi từ máy tính này sang máy tính khác và một số nhà cung cấp hệ điều hành đã cố gắng cung cấp giao diện người dùng nhất quán bất kể loại bàn phím đang được sử dụng. Trên bàn phím không phải tiếng Nhật, chuỗi phím tùy chọn hoặc phím điều khiển có thể thực hiện tất cả các tác vụ được đề cập bên dưới

Trên hầu hết các bàn phím tiếng Nhật, một phím chuyển đổi giữa các ký tự La Mã và ký tự tiếng Nhật. Đôi khi, mỗi chế độ (tiếng La Mã và tiếng Nhật) thậm chí có thể có phím riêng để tránh sự mơ hồ khi người dùng gõ nhanh

Cũng có thể có một phím để hướng dẫn máy tính chuyển đổi các ký tự hiragana mới nhất thành chữ kanji, mặc dù thông thường phím cách phục vụ cùng một mục đích vì chữ viết tiếng Nhật không sử dụng khoảng trắng

Một số bàn phím có phím chế độ để chuyển giữa các dạng viết khác nhau. Tất nhiên, điều này chỉ xảy ra trên bàn phím có nhiều hơn một bộ ký hiệu tiếng Nhật. Hiragana, katakana, katakana nửa chiều rộng, chữ cái La Mã nửa chiều rộng và chữ cái La Mã toàn chiều rộng là một số tùy chọn. Một ký tự tiếng Nhật điển hình là hình vuông trong khi các ký tự La Mã thường có chiều rộng thay đổi. Vì tất cả các ký tự tiếng Nhật chiếm không gian của một ô vuông, nên đôi khi nên nhập các ký tự La Mã ở dạng ô vuông giống nhau để duy trì bố cục lưới của văn bản. Các ký tự La Mã này đã được trang bị cho một ô ký tự hình vuông được gọi là toàn chiều rộng, trong khi các ký tự bình thường được gọi là nửa chiều rộng. Trong một số phông chữ, chúng được khớp với nửa ô vuông, giống như một số phông chữ đơn cách, trong khi ở những phông chữ khác thì không. Thông thường, các phông chữ có sẵn ở hai biến thể, một biến thể có ký tự nửa chiều rộng đơn cách và một biến thể khác có ký tự nửa chiều rộng tỷ lệ. Tên của kiểu chữ với các ký tự nửa chiều rộng theo tỷ lệ thường có tiền tố là "P" cho "tỷ lệ thuận"

Cuối cùng, một bàn phím có thể có một phím đặc biệt để báo cho hệ điều hành biết rằng chữ kana cuối cùng được nhập không được chuyển đổi thành chữ kanji. Đôi khi đây chỉ là phím Return/Enter

Bàn phím chuyển ngón tay cái[sửa]

Bàn phím shift ngón tay cái là một thiết kế thay thế, phổ biến đối với những người đánh máy chuyên nghiệp của Nhật Bản. Giống như một bàn phím tiếng Nhật tiêu chuẩn, nó có các ký tự hiragana được đánh dấu bên cạnh các chữ cái Latinh, nhưng bố cục hoàn toàn khác. Hầu hết các phím chữ cái đều có hai ký tự kana được liên kết với chúng, cho phép tất cả các ký tự nằm vừa trong ba hàng, giống như trong bố cục của phương Tây. Ở vị trí của phím dấu cách trên bàn phím thông thường, có hai phím bổ trợ bổ sung, được thao tác bằng ngón tay cái - một trong số chúng được sử dụng để nhập ký tự thay thế được đánh dấu và phím còn lại được sử dụng cho âm thanh được lồng tiếng. Các âm thanh nửa lồng tiếng được nhập bằng cách sử dụng phím shift thông thường do ngón tay út điều khiển hoặc thay thế âm thanh lồng tiếng cho các ký tự không có biến thể lồng tiếng

Việc chuyển đổi kana-to-kanji được thực hiện giống như khi sử dụng bất kỳ loại bàn phím nào khác. Có các phím chuyển đổi chuyên dụng trên một số thiết kế, trong khi trên các thiết kế khác, phím shift ngón tay cái tăng gấp đôi như vậy

Đầu vào Rōmaji[sửa mã nguồn]

Để thay thế cho việc nhập trực tiếp kana, một số trình soạn thảo phương thức nhập liệu tiếng Nhật cho phép nhập văn bản tiếng Nhật bằng cách sử dụng rōmaji, sau đó có thể được chuyển đổi thành kana hoặc kanji. Phương pháp này không yêu cầu sử dụng bàn phím tiếng Nhật có dấu kana

Điện thoại di động[sửa]

Keitai input[edit]

Bàn phím điện thoại xách tay Nhật Bản (Model Samsung 708SC)

Hệ thống chính được sử dụng để nhập tiếng Nhật trên các thế hệ điện thoại di động trước đây dựa trên bàn phím số. Mỗi số được liên kết với một chuỗi kana cụ thể, chẳng hạn như ka, ki, ku, ke, ko cho '2' và nút được nhấn liên tục để lấy đúng kana – mỗi phím tương ứng với một cột trong gojūon (5 . [1] Các dấu Dakuten và handakuten, dấu chấm câu và các ký hiệu khác có thể được thêm vào bằng các nút khác theo cách tương tự. Chuyển đổi Kana sang kanji được thực hiện thông qua mũi tên và các phím khác

Đầu vào nhanh [ chỉnh sửa ]

Flick input là một phương thức nhập liệu tiếng Nhật được sử dụng trên điện thoại thông minh. Cách bố trí phím giống như đầu vào Keitai, nhưng thay vì nhấn phím liên tục, người dùng có thể vuốt từ phím theo một hướng nhất định để tạo ký tự mong muốn. [1] Các IME của điện thoại thông minh Nhật Bản như Google Japanese Input, POBox và S-Shoin đều hỗ trợ đầu vào flick

Bố cục Godan[sửa | sửa mã nguồn]

Ngoài bố cục QWERTY và 12 phím tiêu chuẩn của ngành, Google Japanese Input cung cấp bố cục bàn phím Godan 15 phím, đây là bố cục bảng chữ cái được tối ưu hóa cho kiểu nhập romaji. Các chữ cái nằm trong một lưới năm hàng ba cột. Cột bên trái bao gồm năm nguyên âm, theo thứ tự như các cột trong bảng Gojūon (a, i, u, e, o), trong khi cột ở giữa và bên phải bao gồm các chữ cái cho chín phụ âm vô thanh chính của kana, . Các ký tự khác được gõ bằng cử chỉ flick

  • Mười hai phụ âm Latinh khác không cần thiết để soạn các kana (b, c, d, f, g, j, l, p, q, v, x, z) được soạn trên các phụ âm vô thanh bằng cách vuốt chúng lên hoặc sang phải hoặc
  • Các kana chính có tiếng được cấu tạo giống như trong romaji, bằng cách gõ (không vuốt) phụ âm vô thanh trên hai cột cuối cùng, sau đó vuốt nguyên âm trên cột đầu tiên
  • Các chữ kana hữu thanh khác (với dạng handakuon hoặc dạng nhỏ) được soạn bằng cách gõ phụ âm vô thanh, sau đó vuốt nguyên âm, sau đó vuốt phím [đặc biệt] (ở giữa hàng cuối cùng) để chọn handakuon (vuốt sang trái
  • Chữ kana nhỏ có thể được viết bằng cách vuốt sang l hoặc x, sau đó viết chữ cái mong muốn, e. g. inputs fa and hu/fu, then la/xa both give out ふぁ/ファ fa, as in ファミコン Famikon
  • Các chữ số thập phân được soạn bằng cách vuốt xuống các phím nằm ở 3 hàng đầu tiên (chữ số 1 đến 9) hoặc ở giữa hàng thứ 4 (chữ số 0)
  • Bốn dấu chấm câu chính được tạo bằng cách vuốt r ở cuối hàng thứ tư (vuốt xuống để tìm dấu phẩy, sang trái để xem dấu chấm, lên để xem dấu chấm hỏi, sang phải để xem dấu chấm than)
  • Các dấu hiệu hoặc điều khiển đầu vào khác có thể được tạo bằng cách nhập hoặc vuốt các vị trí không sử dụng khác của các phím khác. Nhưng phiên bản xúc giác của bố cục thêm các phím trong hai cột bổ sung để nhập dấu cách, Enter, Backspace, di chuyển con trỏ nhập sang trái hoặc phải, chuyển đổi ký tự trước đó giữa hiragana và katakana và chọn các chế độ nhập khác
  • Writing just c gives out か・く・こ when written with a, u and o respectively, and し・せ when with i and e, respectively
  • Để viết sokuon trước ち, các đầu vào CÓ ký tự này là. lt(s)u/xt(s)u, ti/chi. Tchi đầu vào không hoạt động
  • [Đặc biệt] bao gồm ゛, ゜ và 小 (dakuten, handakuten, small)

Không giống như đầu vào 12 phím, việc lặp lại một phím trong Godan không được hiểu là một cử chỉ để lướt qua kana với các nguyên âm khác nhau, mà đúng hơn, nó sẽ được hiểu là một chữ cái romaji được lặp lại hoạt động giống như trong chế độ bố cục QWERTY. [2]

Bố cục bàn phím tiếng Nhật và biểu đồ so sánh đầu vàoBố tríMáy tính để bànKeitaiĐiện thoại thông minhNhập theo chu kỳNhập nhanhNhập Romaji12 phímKhôngCóCóCóCóCóKhôngQWERTYCóKhôngCóKhôngKhôngCóChúaKhôngKhôngCóKhôngCóCóCó

Các thiết bị tiêu dùng khác ở Nhật Bản cho phép nhập văn bản thông qua lập trình trên màn hình, chẳng hạn như máy quay video kỹ thuật số và bảng điều khiển trò chơi điện tử, cho phép người dùng chuyển đổi giữa bàn phím số và hệ thống nhập bàn phím đầy đủ (QWERTY hoặc thứ tự ABC).

Kana to kanji conversion[edit]

Sau khi nhập kana, chúng sẽ được giữ nguyên hoặc được chuyển đổi thành kanji (ký tự Trung Quốc). Ngôn ngữ Nhật Bản có nhiều từ đồng âm và việc chuyển đổi cách đánh vần kana (đại diện cho cách phát âm) thành chữ kanji (đại diện cho dạng viết tiêu chuẩn của từ) thường là quá trình một-nhiều. Bộ chuyển đổi kana sang kanji cung cấp một danh sách các cách viết kanji ứng viên cho kana đầu vào và người dùng có thể sử dụng phím cách hoặc phím mũi tên để cuộn qua danh sách các ứng cử viên cho đến khi họ tìm được cách viết đúng. Khi đạt được dạng văn bản chính xác, nhấn phím Enter hoặc đôi khi là phím "henkan" để kết thúc quá trình chuyển đổi. Lựa chọn này cũng có thể được kiểm soát thông qua GUI bằng chuột hoặc thiết bị trỏ khác

Nếu bắt buộc phải nhập chữ hiragana, nhấn phím Enter ngay sau khi nhập ký tự sẽ kết thúc quá trình chuyển đổi và cho ra chữ hiragana như đã gõ. Nếu katakana được yêu cầu, nó thường được trình bày dưới dạng tùy chọn cùng với các lựa chọn kanji. Ngoài ra, trên một số bàn phím, nhấn nút muhenkan (無変換, "không chuyển đổi") sẽ chuyển đổi giữa katakana và hiragana

Hoạt động của một IME điển hình

Trình chuyển đổi kana sang kanji tinh vi (được gọi chung là trình chỉnh sửa phương thức nhập hoặc IME), cho phép chuyển đổi nhiều từ kana thành kanji cùng một lúc, giúp người dùng không phải thực hiện chuyển đổi ở từng giai đoạn. Người dùng có thể chuyển đổi ở bất kỳ giai đoạn đầu vào nào bằng cách nhấn phím cách hoặc nút henkan và trình chuyển đổi cố gắng đoán cách phân chia từ chính xác. Một số chương trình IME hiển thị định nghĩa ngắn gọn của từng từ để giúp người dùng chọn đúng chữ Hán

Đôi khi, bộ chuyển đổi kana sang kanji có thể đoán đúng chữ kanji cho tất cả các từ, nhưng nếu không, các phím con trỏ (mũi tên) có thể được sử dụng để di chuyển tới và lui giữa các từ ứng viên hoặc các phím chữ số có thể được sử dụng để chọn một trong các từ đó. . Nếu ranh giới từ đã chọn không chính xác, có thể di chuyển ranh giới từ bằng cách sử dụng phím điều khiển (hoặc phím shift, e. g. trên iBus-Anthy) cộng với các phím mũi tên

Hệ thống học tập[sửa]

Các hệ thống hiện đại tìm hiểu sở thích chuyển đổi của người dùng và đặt các ứng viên được chọn gần đây nhất ở đầu danh sách chuyển đổi, đồng thời ghi nhớ những từ mà người dùng có khả năng sử dụng khi xem xét ranh giới từ

Hệ thống dự báo[sửa]

Các hệ thống được sử dụng trên điện thoại di động thậm chí còn đi xa hơn và cố gắng đoán toàn bộ cụm từ hoặc câu. Sau khi nhập một vài chữ kana, điện thoại sẽ tự động cung cấp toàn bộ cụm từ hoặc câu dưới dạng các ứng viên hoàn thành có thể, vượt xa những gì đã được nhập. Điều này thường dựa trên các từ được gửi trong các tin nhắn trước đó

Làm cách nào để cắt tất cả khoảng trắng trong PHP?

Hàm trim() trong PHP xóa khoảng trắng hoặc bất kỳ ký tự được xác định trước nào khác khỏi cả bên trái và bên phải của chuỗi . ltrim() và rtrim() được sử dụng để xóa các khoảng trắng này hoặc các ký tự khác khỏi bên trái và bên phải của chuỗi.

Làm cách nào để cắt \n cuối cùng trong PHP?

Xóa n ký tự cuối cùng . Hàm substr() chấp nhận ba đối số, đối số đầu tiên là chuỗi, đối số thứ hai là vị trí bắt đầu, đối số thứ ba là độ dài. use the built-in substr() function in PHP. The substr() function accepts three arguments, the first one is string , the second is start position, third is length.

Làm cách nào để cắt các ký tự kết thúc trong PHP?

Trả lời. Sử dụng hàm rtrim() .

Làm cách nào để loại bỏ khoảng trắng hoặc các ký tự khác từ đầu và cuối chuỗi?

Sử dụng. phương thức strip() để xóa khoảng trắng và ký tự ở đầu và cuối chuỗi. Sử dụng. Phương thức lstrip() để chỉ xóa khoảng trắng và ký tự từ đầu chuỗi.