2013-07-01 41 views
7

Với ký tự Unicode, chúng tôi muốn tìm hiểu ngôn ngữ nào bao gồm ký tự này và quan trọng hơn là phải hiểu từng ngôn ngữ là Left-To-Right hay không. Ví dụ: ký tự A có thể là cả EnglishSpanish là cả hai ngôn ngữ LTR.Làm cách nào để tìm hiểu ngôn ngữ từ một nhân vật?

Tôi muốn điều này cho trình soạn thảo văn bản của riêng mình. Bất cứ ai có thể giúp tôi trong việc tìm kiếm một hàm API hoặc một cái gì đó giải quyết vấn đề của tôi?

Cảm ơn trước

+3

Tôi không nghĩ rằng có API cho điều này trong Windows. Tôi nghĩ rằng cách bạn làm điều này là để thực hiện tra cứu của riêng bạn của cơ sở dữ liệu ký tự Unicode: http://www.unicode.org/ucd/ hoặc tìm một thư viện mà làm như vậy. Tôi nghi ngờ ICU sẽ làm như vậy. –

+0

Điều gì về ⌬, ∬, ✄ và ↸? –

+2

@AndreasRejbrand Họ là BIDI trung lập. Đó là tất cả trong UCD. –

Trả lời

7

Unicode-khôn ngoan, LTR/RTL là một tài sản của nhân vật, không phải của những ngôn ngữ mà sử dụng nhân vật đó. Điều này quan trọng bởi vì nhúng tiếng Anh trong một văn bản tiếng Ả Rập nên được hiển thị từ trái sang phải, ngay cả khi đơn giản tài liệu nói chung có thể được đánh dấu là tiếng Ả Rập. Nếu bạn đang sử dụng JCL, bạn có thể lấy các thuộc tính này bằng cách sử dụng các hàm UnicodeIsLeftToRightUnicodeIsRightToLeft. Lưu ý rằng các ký tự có thể không phải từ trái sang phải hay từ phải sang trái và cũng lưu ý rằng JCL sử dụng một bản sao riêng của danh sách ký tự Unicode có thể là một phiên bản khác với phiên bản Windows cụ thể.

1

Về câu hỏi trong tiêu đề, bạn sẽ cần phải thực hiện một nghiên cứu sâu rộng về việc sử dụng các ký tự trong các ngôn ngữ của thế giới. Có một vài nghìn ngôn ngữ, mặc dù nhiều người trong số họ không có hệ thống viết thường xuyên; mặt khác, một số ngôn ngữ có nhiều hệ thống chữ viết. Các biến thể khác nhau của một ngôn ngữ có thể có các tiết mục khác nhau của các ký tự.

Vì vậy, đây sẽ là nỗ lực lớn, mặc dù một số dữ liệu đã được biên soạn, ví dụ: trong tiết mục CLDR - nhưng khái niệm "các ký tự được sử dụng trong ngôn ngữ" không rõ ràng. (Có phải các ký tự æ, è, và ö được sử dụng bằng tiếng Anh không? Chúng chắc chắn xuất hiện dưới một số dạng tiếng Anh viết.)

Vì vậy, sẽ không thực tế khi mong đợi tìm một thói quen thư viện cho các mục đích đó.

Rõ ràng nhu cầu thực sự của bạn là để quyết định xem ký tự là ký tự từ trái sang phải hay ký tự từ phải sang trái. Nhưng để hoàn thành, tôi đã cung cấp câu trả lời cho những gì bạn thực sự hỏi và có thể có liên quan trong một số ngữ cảnh khác.