Các ứng dụng Unicode trong Website Tiếng Việt

pdf 29 trang hoanguyen 2540
Bạn đang xem 20 trang mẫu của tài liệu "Các ứng dụng Unicode trong Website Tiếng Việt", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfcac_ung_dung_unicode_trong_website_tieng_viet.pdf

Nội dung text: Các ứng dụng Unicode trong Website Tiếng Việt

  1. Các ӭng dөng Unicode trong web site tiӃng ViӋt 1 MӨC LӨC Unicode cho chӳ ViӋt 2 Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi Unicode 4 Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt 8 Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ thành tiêu chuҭn Unicode 9 Dùng Frontpage 98/ 2000 viӃt webpage Unicode ViӋt ngӳ 10 Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt Trong MS-WORD 16 Cách chӑn Settings trong OutLook Express (IE 5) ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR 18 Cách chӑn Settings trong OutLook 2000 ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR 22 Cách ÿánh chӳ ViӋt trong Hotmail 26 Cách ÿánh chӳ ViӋt trong Yahoo! Mail 28
  2. Các ӭng dөng Unicode trong web site tiӃng ViӋt 2 Unicode cho chӳ ViӋt Unicode là mӝt cách dùng chӳ ViӋt theo tiêu chuҭn quӕc tӃ cho tin hӑc. Ðһc ÿiӇm chính cӫa nó là ngѭӡi ta dùng 2 bytes (16 bits) cho mӛi mүu tӵ nhѭ ô, ѫ, ă. Cho ÿӃn nay có nhiӅu bӝ chӳ ViӋt Nam nhѭ VISCII, VPS, VNI vv ÿang ÿѭӑc dùng rҩt thӏnh hành trong nhiӅu áp dөng phҫn mӅm khác nhau. VISCII là mӝt chuҭn cӫa nhóm khoa hӑc gia Tricholor. Trong chuҭn nҫy mӛi mүu tӵÿѭӧc biӇu diӉn bҵng mӝt byte (8 bits). Nhóm Tricholor dùng các con sӕ trӕng cӫa bӝ chӳ ASCII ( cӫa Mӻ - A là viӃt tҳt cho American, trong khi VI cho Vietnamese) ÿӇ biӇu diӉn các chӳ ViӋt Nam có dҩu. Vì con sӕ lӟn nhҩt có thӇ biӇu diӇn bҵng 1 byte là 255, ÿó chính là tәng sӕ mүu tӵ ViӋt Nam tӕi ÿa ta có thӇ dùng ÿѭӧc bҩt cӭ lúc nào. Rҩt tiӃc chӳ ViӋt Nam cҫn hѫn 255 mүu tӵ nên ngѭӡi ta phҧi ÿһt thêm bӝ chӳ Hoa (thí dө nhѭ UHoàiH 1.1) hay thay thӃ các dҩu hiӋu ít dùng, nhѭ dҩu ngoһc kép, bҵng nhӳng mүu tӵ ViӋt Nam cҫn phҧi có. Tӭc là hӉ muӕn có ÿҫy ÿӫ bӝ chӳ ViӋt ta phҧi hy sinh vài dҩu hiӋu ít dùng cӫa bӝ chӳ ASCII. Bӝ chӳ VPS cӫa Hӝi Vietnamese Professionals Society cNJng dùng cùng mӝt nguyên tҳc nhѭ VISCII. Có ÿiӅu khác là vì VPS ÿѭӧc triӇn khai ӣ Pháp, nên các khoa hӑc gia muӕn bҳt ÿҫu bҵng mӝt bӝ chӳ dùng cho tiӃng Pháp rӗi mӣ mang thêm ÿӇ dùng cho chӳ ViӋt. Nói tóm lҥi, hai bӝ chӳ VISCII và VPS khác nhau chӍӣ chӛ quy ѭӟc dùng con sӕ nào ÿӇ biӇu diӉn mӝt mүu tӵ ViӋt Nam. Ӣ ViӋt Nam có kiӇu chӳ .vnTimes rҩt thӏnh hành trên các trang Web. Các khoa hӑc gia thiӃt kӃ kiӇu chӳ nҫy cNJng dùng mӝt nguyên tҳc giӕng nhѭ trong VISCII và VPS. Nói mӝt cách khác, ta có thӇ dӏch (convert, map) tӯ kiӇu chӳ nҫy qua kiӇu chӳ kia rҩt dӉ dàng vì có mӕi liên hӋ tӯng mүu tӵ mӝt (one-to-one correspondence). KiӇu chӳ VNI hѫi khác mӝt chút vì có nhiӅu chӛ ngѭӡi ta dùng 2 bytes ÿӇ biӇu diӇn mӝt mүu tӵ. VNI là mӝt trong nhӳng bӝ chӳÿҫu tiên ÿѭӧc dùng cho chӳ ViӋt trong tin hӑc. ÐiӅu ÿáng nói là sӵ thành công vӅ thѭѫng mҥi cӫa VNI. Mһc dҫu muӕn ÿánh máy vӟi bӝ chӳ VNI ta phҧi trҧ tiӅn, công ty VNI tích cӵc nhҩt trong viӋc triӇn khai các áp dөng phҫn mӅm cӫa VNI ÿӇ phөc vө khách hàng. Trong khi ÿó các tә chӭc Tricholor và Vietnamese Professionals Society là gӗm nhӳng khoa hӑc gia thiӋn nguyӋn, tҩt cҧÿӅu có viӋc làm toàn thӡi gian nên công viӋc triӇn khai phҫn mӅm cho các bӝ chӳ phҧi bӏ giӟi hҥn.
  3. Các ӭng dөng Unicode trong web site tiӃng ViӋt 3 Còn VietNet chҷng qua chӍ là mӝt quy ѭӟc vӅ cách dùng các mүu tӵ có sҹn cӫa ASCII ÿӇ ÿánh tiӃng ViӋt. Nhӳng dҩu dùng cho các nguyên âm ÿѭӧc ÿánh thêm, thí dө nhѭ chӳ "Ðѭa ÿón" ÿѭӧc ÿánh là "DDu+a ddón". Do ÿó, nói cho ÿúng ra VietNet không phҧi là mӝt bӝ chӳ.
  4. Các ӭng dөng Unicode trong web site tiӃng ViӋt 4 Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi Unicode VPS VISCII VNI TCVN Unicode Unicode VIQR VPS VISCII VNI TCVN UTF-8 Hex Hex Hex Hex Hex Symbol Hex Dec 61 00E1 a' á E1 á E1 aù ¸ B8 á C3 A1 F9 225 61 00E0 a` à E0 à E0 aø µ B5 à C3 A0 F8 224 61 1EA3 a? ä E4 ä E4 aû ¶ B6 ҧ E1 BA A3 FB 7843 61 00E3 a~ ã E3 ã E3 aõ · B7 ã C3 A3 F5 227 61 1EA1 a. å E5 Õ D5 aï ¹ B9 ҥ E1 BA A1 EF 7841 61 0103 a( æ E6 å E5 aê ¨ A8 ă C4 83 EA 259 61 1EAF a(' ¡ A1 ¡ A1 aé ¾ BE ҳ E1 BA AF E9 7855 61 1EB1 a(` ¢ A2 ¢ A2 aè » BB ҵ E1 BA B1 E8 7857 61 1EB3 a(? £ A3 Æ C6 aú ¼ BC ҷ E1 BA B3 FA 7859 61 1EB5 a(~ ¤ A4 Ç C7 aü ½ BD ҹ E1 BA B5 FC 7861 61 1EB7 a(. ¥ A5 £ A3 aë Æ C6 һ E1 BA B7 EB 7863 61 00E2 a^ â E2 â E2 aâ © A9 â C3 A2 E2 226 a^' Ã C3 ¤ A4 aá 61 Ê CA ҩ 1EA5 E1 BA A5
  5. Các ӭng dөng Unicode trong web site tiӃng ViӋt 5 E1 7845 61 1EA7 a^` À C0 ¥ A5 aà Ç C7 ҫ E1 BA A7 E0 7847 61 1EA9 a^? Ä C4 ¦ A6 aå È C8 ҭ E1 BA A9 E5 7849 61 1EAB a^~ Å C5 ç E7 aã É C9 ү E1 BA AB E3 7851 61 1EAD a^. Æ C6 § A7 aä Ë CB ұ E1 BA AD E4 7853 65 00E9 e' é E9 é E9 eù Ð D0 é C3 A9 F9 233 65 00E8 e` è E8 è E8 eø Ì CC è C3 A8 F8 232 65 1EBB e? È C8 ë EB eû Î CE ҿ E1 BA BB FB 7867 65 1EBD e~ ë EB ¨ A8 eõ Ï CF Ӂ E1 BA BD F5 7869 65 1EB9 e. Ë CB © A9 eï Ñ D1 ҽ E1 BA B9 EF 7865 65 00EA e^ ê EA ê EA eâ ª AA ê C3 AA E2 234 65 1EBF e^' ‰ 89 ª AA eá Õ D5 Ӄ E1 BA BF E1 7871 65 1EC1 e^` Š 8A « AB eà Ò D2 Ӆ E1 BB 81 E0 7873 65 1EC3 e^? ‹ 8B ¬ AC eå Ó D3 Ӈ E1 BB 83 E5 7875 65 1EC5 e^~ Í CD AD eã Ô D4 Ӊ E1 BB 85 E3 7877 65 1EC7 e^. Œ 8C ® AE eä Ö D6 Ӌ E1 BB 87 E4 7879 i' í ED í ED í ED Ý DD í 00ED C3 AD
  6. Các ӭng dөng Unicode trong web site tiӃng ViӋt 6 237 00EC i` ì EC ì EC ì EC × D7 ì C3 AC 236 1EC9 i? Ì CC ï EF æ E6 Ø D8 Ӎ E1 BB 89 7881 0129 i~ ï EF î EE ó F3 Ü DC ƭ C4 A9 297 1ECB i. Î CE ¸ B8 ò F2 Þ DE ӏ E1 BB 8B 7883 6F 00F3 o' ó F3 ó F3 où ã E3 ó C3 B3 F9 243 6F 00F2 o` ò F2 ò F2 oø ß DF ò C3 B2 F8 242 6F 1ECF o? Õ D5 ö F6 oû á E1 ӓ E1 BB 8F FB 7887 6F 00F5 o~ õ F5 õ F5 oõ â E2 õ C3 B5 F5 245 6F 1ECD o. † 86 ÷ F7 oï ä E4 ӑ E1 BB 8D EF 7885 6F 00F4 o^ ô F4 ô F4 oâ « AB ô C3 B4 E2 244 6F 1ED1 o^' Ó D3 ¯ AF oá è E8 ӕ E1 BB 91 E1 7889 6F 1ED3 o^` Ò D2 ° B0 oà å E5 ӗ E1 BB 93 E0 7891 6F 1ED5 o^? ° B0 ± B1 oå æ E6 ә E1 BB 95 E5 7893 6F 1ED7 o^~ ‡ 87 ² B2 oã ç E7 ӛ E1 BB 97 E3 7895 6F 1ED9 o^. ¶ B6 µ B5 oä é E9 ӝ E1 BB 99 E4 7897 o+ Ö D6 ½ BD ô F4 ¬ AC ѫ 01A1 C6 A1
  7. Các ӭng dөng Unicode trong web site tiӃng ViӋt 7 417 F4 1EDB o+' § A7 ¾ BE ôù í ED ӟ E1 BB 9B F9 7899 F4 1EDD o+` © A9 ¶ B6 ôø ê EA ӡ E1 BB 9D F8 7901 F4 1EDF o+? ª AA · B7 ôû ë EB ӣ E1 BB 9F FB 7903 F4 1EE1 o+~ « AB Þ DE ôõ ì EC ӥ E1 BB A1 F5 7905 F4 1EE3 o+. ® AE þ FE ôï î EE ӧ E1 BB A3 EF 7907 u'</Fon
  8. Các ӭng dөng Unicode trong web site tiӃng ViӋt 8 Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt Font ch trong khung này thay Font- Tahoma ӳ Family: ÿәi theo thӇ Font trong combo box bên trái Ðây là font chӳ trong m t ph n c a m t câu. Font- 5 ӝ ҫ ӫ ӝ Size: NӃu font chӳ nào không có glyphs mүu tӵ chӳ ViӋt thì bҥn sӁ Font- Normal Weight: không ÿӑc ÿѭѫc chӳ ViӋt mà chӍ thҩy ô vuông. Khi bҥn thay ÿәi font trong Bҥn có thӇ dùng phѭѫng tiӋn này combo box: Font-Family, ÿӇ set Default font ѭa chuӝng Font-Size hay Font-Weight, cho browser ÿang dùng cӫa bҥn. văn bҧn trong khung bên phҧi cNJng sӁ thay ÿәi và dùng theo font bҥn chӑn. Bҥn sӁ không ÿӑc ÿѭӧc chӳ ViӋt nӃu font bҥn chӑn không chӭa mүu tӵ glyphs Unicode tiӃng ViӋt. Trang web này giúp bҥn lӵa ra nhӳng font Unicode trong máy cӫa bҥn, font nào có thӇ sӱ dөng ÿӇ trình bày Unicode chӳ ViӋt và font nào không thӇ dùng ÿӇ trình bày Unicode chӳ ViӋt.
  9. Các ӭng dөng Unicode trong web site tiӃng ViӋt 9 Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ thành tiêu chuҭn Unicode NӃu bҥn ÿã có mӝt mҥng ÿiӇm ÿѭӧc viӃt bҵng mӝt trong các mã tiêu chuҭn ViӋt ngӳ sau ÿây: Viscii, VPS, VNI và .vnTime và bҥn muӕn biӃn toàn bӝ mҥng ÿiӇm cӫa bҥn thành tiêu chuҭn Unicode thì ÿây ÿúng là chѭѫng trình bҥn cҫn dùng. Chѭѫng trình VNtoUnicode có thӇ chuyӇn các trang web ViӋt ngӳ trong mӝt folder hay directory thành trang web ViӋt ngӳ Unicode. Các mã tiêu chuҭn ViӋt ngӳÿѭӧc hӛ trӧ gӗm Viscii, VPS, VNI và .vnTime nhѭng bҥn có thӇ nӟi rӝng hӛ trӧ cho các tiêu chuҭn khác bҵng cách thêm chúng vào mã lұp trình. Chѭѫng trình này ÿѭӧc viӃt bҵng Microsoft Visual Basic 6.0, do tiӃn sƭ Lê Ðӭc Hӗng thӵc hiӋn và tҩt cҧ các mã lұp trình và bҧng mүu chuyӉn mã ÿӅu ÿѭӧc gói trong hӗ sѫ vntounicode.zip ÿӇ bҥn download. Mӛi tiêu chuҭn ÿӅu có mӝt bҧng mã hoán chuyӇn (mapping table) nhѭ VNItoUnicode.txt, VISCIItoUnicode.txt, VPStoUnicode and VNTimetoUnicode. Bҥn có thӇ thêm bҧng mã ÿӕi chiӃu khác cho mã tiêu chuҭn ViӋt ngӳ khác. Chѭѫng trình này chӫ yӃu làm 3 viӋc nhѭ sau: x ChuyӇn tҩt cҧ các cһp tӵ nhѭ "aù" thành Unicode tѭѫng ӭng. x ChuyӇn tҩt cҧ tên Font thành "Tahoma". x ChuyӇn mүu tӵ ViӋt thành mã sӕ Unicode. Trong hӗ sѫ zip có chӭa các trang web mүu bҵng VPS, VNI, VISCII và .vnTime vӟi các trang web Unicode mã sӕ và UTF-8 tѭѫng ӭng. Mӝt khi bҥn ÿã có trang bҵng mã sӕ Unicode, thì bҥn có thӇ tiӃn thêm mӝt bѭӟc chuyӇn trang Unicode mã sӕ thành trang web UTF-8. Vì chѭѫng trình này làm viӋc theo tӯng nhóm trang web ÿѭӧc ÿһt trong mӝt folder nên tӕc ÿӝ hoán chuyӇn sӁ tăng lên rҩt nhiӅu. Bҥn có thӇ sӱa ÿәi mã lұp trình cӫa chѭѫng trình này ÿӇ sӱ dөng nhӳng Font khác nhѭ Arial, Courier New, Times New Romans, Verdana vân vân. Bҥn cNJng có thӇ sӱa ÿәi mã lұp trình này ÿӇ tӵÿӝng hóa chѭѫng trình hoán chuyӇn theo nhu cҫu cӫa bҥn. NӃu bҥn biӃn cҧi mã lұp trình này, chúng tôi kǤ vӑng bҥn sӁ thông báo cho chúng tôi biӃt và gӱi cho chúng tôi mӝt bҧn biӃn cҧi cӫa bҥn ÿӇ nhӳng sӵ thay ÿәi hӳu dөng khác có thӇÿѭӧc ÿѭa vào trong các bҧn chѭѫng trình tѭѫng lai.
  10. Các ӭng dөng Unicode trong web site tiӃng ViӋt 10 Dùng Frontpage 98/ 2000 viӃt webpage Unicode ViӋt ngӳ NӃu bҥn ÿang dùng Windows 2000 Professional/ Server thì bҥn có thӇ gõ chӳ ViӋt Unicode (dùng các chѭѫng trình gõ chӳ ViӋt nhѭ VPS, VietKey, VNI vv ) trong Notepad hay WordPad 2000 ÿӇ viӃt webpage chӳ ViӋt trӵc tiӃp bҵng HTML. Nhѭng nӃu bҥn ÿang dùng Windows 95.x hay Windows 98.x thì Fronpage là công cө không thӇ thiӃu ÿѭӧc ÿӇ giúp bҥn viӃt webpage Unicode ViӋt ngӳ mӝt cách dӉ dàng tiӋn lӧi. HiӋn nay (tháng Tѭ 2001) trên thӏ trѭӡng Web Editors thì Frontpage 98/ 2000 là mӝt trong vài wysiwyg editors hӛ trӧ Unicode. Các web editors khác nhѭ Cold Fusion 4.x, Dreamweaver 4, Dreamweaver UltraDev 4, NetOject Fusion 5 vân vân ÿӅu không hӛ trӧ Unicode. Dƭ nhiên chúng ta vүn có thӇ dùng nhӳng web editors trên ÿӇ viӃt webpage ViӋt Ngӳ nhѭng bҩt tiӋn ӣ chӛ là không ÿӑc ÿѭӧc tiӃng ViӋt và không thҩy ÿѭӧc lӛi chính tҧÿӇ sӳa lӛi câu văn Bҥn có thӇ dùng các chѭѫng trình gõ chӳ ViӋt mӟi nhҩt cӫa VPS, VietKey, VNI vân vân ÿӇ gõ chӳ ViӋt Unicode. Các chѭѫng trình trên có thӇ dùng trong hҫu hӃt các ӭng dөng cӫa bӝ Office 97, Office 2000 và mӝt sӕӭng dөng khác. Trѭӟc kia Frontpage 97 và Frontpage 98 là chѭѫng trình ÿӝc lұp cӫa Microsoft, nhѭng kӇ tӯ Frontpage 2000, Micorsoft ÿã nhұp nó vào thành viên cӫa bӝ Office 2000. Tҩt cҧ các bӝ Frontpage nói trên ÿӅu hӛ trӧ Unicode nhѭng dƭ nhiên là bӝ Frontpage 2000 là có hӛ trӧ Unicode ÿҫy ÿӫ nhҩt. Trong phҫn này chúng tôi chӍ bàn ÿӃn phҫn dùng Unicode cӫa Frontpage 2000 trong webpage ViӋt ngӳ và các bҥn có thӇ suy diӉn tӯ bӝ này cho bӝ Frontpage 98. Trong Frontpage 2000 bҥn có thӇ mӣ mӝt trang mӟi bҵng cách vào: File > New > Page Sau khi mӝt trang mӟi ÿã ÿѭӧc mӣ ra sҹn sàng cho bҥn ÿѭa dӳ liӋu và hình ҧnh trang trí vào thì trong phҫn góc dѭӟi bên trái cӫa Window chánh View/
  11. Các ӭng dөng Unicode trong web site tiӃng ViӋt 11 Page bҥn sӁ thҩy có 3 tab chӑn lӵa sau ÿây: Normal, HTML, Preview. Tóm tҳc cách dùng cӫa 3 tabs này nhѭ sau: Normal: cho phép bҥn nhìn wysiwyg cӫa trang web bҥn ÿang làm viӋc và cho bҥn sӱa chӳa tùy ý trang web này. HTML: bҥn ÿӑc thҩy toàn bӝ tag nӝi HTML cӫa trang và có thӇ sӱa chӳa trang web bҵng HTML tag nhѭ bҥn làm viӋc trên trang web khi mӣ bҵng NotePad. Preview: bҥn chӍ nhìn thҩy wysiwyg cӫa trang web nhѭng không sӱa ÿѭӧc. Sau khi gõ vào tab Normal ÿӇ có thӇ biên soҥn trang web, bҥn nhҩp chuӝt phҧi trong bҩt kǤ chӛ nào trong trang web ÿӇ cho ra popup menu rӗi chӑn Page Properties , mӝt window nhѭ sau hiӋn lên: Tҩt cҧ các setting ÿӇ sӱ dөng Unicode cho mӑi trang web ÿӅu nҵm trong tab Language nên bҥn gõ vào Language tab ÿӇ thҩy window sau:
  12. Các ӭng dөng Unicode trong web site tiӃng ViӋt 12 Tùy theo cách setting cӫa bҥn ÿһt trong Tools/ Web Setting, Page Properties/ Language sӁ hiӋn lên khác nhau. Hình trên là cách setting cӫa các trang trong Vovisoft ÿӇ sӱ dөng Unicode NCR và phҫn setting trên sӁ tӵÿӝng viӃt cho bҥn hàng meta tag sau (meta tag có chӳÿұm) trong phҫn Heading tag cӫa trang: Using Unicode in Frontpage 2000 NӃu bҥn chӑn Vietnamese trong combo box (Mark current document as:) nhѭ hình sau: thì bҥn sӁ có thêm hàng meta tag nhѭ sau:
  13. Các ӭng dөng Unicode trong web site tiӃng ViӋt 13 Chӳ "vi" trong content="vi" là ký hiӋu tҳt (short string) cӫa locale ID Vietnam. NӃu bҥn muӕn tìm hiӇu thêm vӅ các ký hiӋu tҳt locale ID dùng cho ngôn ngӳ các quӕc gia thì gõ vào ÿây. Meta tag này dùng xác ÿӏnh ngôn ngӳÿѭӧc dùng trong trang web ÿӇ Frontpage ӭng dөng ÿúng phҫn mӅm kiӇm tra ÿánh vҫn và giúp các Search Engine xác ÿӏnh ngôn ngӳÿѭӧc dùng trong trang web mà nó ÿang lөc tìm. Hàng meta tag vӅ locale theo bút giҧ là không cҫn thiӃt cho các trang sӱ dөng Unicode cho tiӃng ViӋt nhѭ các trang web trong Vovisoft. Tuy nhiên nӃu dùng locale Vietnam (Vietnamese Windows) theo Microsoft và dùng codepage 1258 cho tiӃng ViӋt thì meta tag này sӁ giúp cho nhӳng ai ÿã set trong browser sӱ dөng Vietnamese 1258 có thӇ chҥy thҷng vào các trang dùng Vietnamese 1258 cӫa mҥng có ÿa ngôn ngӳ mà tiӃng ViӋt là mӝt trong các ngôn ngӳÿѭӧc ӭng dөng. ÐiӅu ÿáng chú ý là code page 1258 không phҧi là mã Unicode vì có mӝt sӕ mã ÿiӇm (code points) không xӃp theo tӵ vӏ trong giҧi sӕ Unicode. Nói tóm lҥi bҥn set Language Tab trong Page Properties cӫa Frontpage 2000 nhѭ sau nӃu dùng Unicode NCR: Page Language Mark current document as: HTML encoding Save the document as: US/Western European (codepage 1252) Reload the current document as: và set Language Tab trong Page Properties cӫa Frontpage 2000 nhѭ sau nӃu dùng Unicode UTF-8: Page Language Mark current document as: HTML encoding Save the document as: Multilingual (UTF-8) Reload the current document as: Bҥn sӁ thҩy trong phҫn Header tag cӫa trang có phҫn meta tag sau: Mӝt ÿiӅu ÿӝc ÿáo cӫa Frontpage 2000 là bҥn có thӇ chuyӇn ÿәi tӯ NCR thành UTF-8 hay ngѭӧc lҥi mӝt cách dӉ dàng bҵng cách set charset=1252 thành charset=utf-8 hay ngѭӧc lҥi rӗi "Save" trang web là bҥn có ngay mã Unicode NCR hay UTF-8. Có lҿ cho ÿӃn giӡ cNJng chѭa có chѭѫng trình Web Editor nào xӱ lý Unicode nhuyӉn nhѭ Frontpage 2000.
  14. Các ӭng dөng Unicode trong web site tiӃng ViӋt 14 NCR là mӝt phѭѫng pháp biӇu hiӋn Unicode bҵng tӵ vӏ trong giҧi sӕ ký tӵ Unicode 16 bit còn UTF-8 là mӝt cách mã cӕt bҵng 8 bit cӫa Unicode. NӃu bҥn chѭa rõ thӃ nào là Unicode NCR và thӃ nào là UTF-8 thì mӡi bҥn gõ vào ÿây. NӃu bҥn chӍ dùng Frontpage 2000 ÿӇ viӃt website ViӋt ngӳ bҵng Unicode thôi thì bҥn có thӇ set luôn cho trang mӟi default cӫa Frontpage 2000 có charset là 1252 hoһc UTF-8. Bҥn vào Tools/ Web settings và trong hӝp Window hiӋn lên, bҥn chӑn tab Language rӗi trong: Server message language: chӑn English Default page encoding: chӑn US/Western European Rӗi nhҩn vào nút OK. Tӯ giӡ trӣÿi cӭ mӛi lҫn bҥn mӣ mӝt trang Frontpage mӟi ÿӇ viӃt bài thì trang mӟi ÿó ÿã có sҹn hàng meta tag sau: ÿӇ bҥn gõ Unicode chӳ ViӋt theo Decimal NCR. NӃu bҥn muӕn dùng UTF-8 thì trong: Default page encoding: chӑn Multilingual (UTF-8) và khi mӣ mӝt trang mӟi bҥn sӁ có sҹn meta tag sau:
  15. Các ӭng dөng Unicode trong web site tiӃng ViӋt 15 Sau khi set sҹn các phҫn trên, bҥn chӍ còn mӝt ÿiӇm nên lѭu ý ÿó là luôn áp dөng font: Tahoma, Arial, Times New Roman vv vào tҩt cҧ text ViӋt ngӳ vì nӃu không sӁ có browser (ÿã set sҹn nhӳng fonts default không chӭa glyphs chӳ ViӋt) không ÿӑc ÿѭӧc Unicode ViӋt ngӳ cӫa bҥn. Ghi chú: Các bҧn Internet Explorer 4.x trӣ vӅ sau ÿӅu có thӇ trình bày ÿúng Unicode theo NCR hay UTF-8 khi ÿһt ÿúng charset theo dҥng cӫa nó nhѭng Netscape 4.x thì chӍ có thӇ hiӇn thӏ Unicode ÿúng nӃu trang web ÿѭӧc mã theo UTF-8. NӃu bҥn muӕn cҧ hai browsers trên ÿӅu có thӇ hiӇn thӏÿѭӧc trang web ViӋt ngӳ cӫa bҥn thì bҥn nên dùng UTF-8 cho các trang web ViӋt ngӳ. Mӝt ÿiӇm lҥ nӳa là theo mӝt sӕ báo cáo và theo kinh nghiӋm cӫa bút giҧ thì Netscape 4.x có thӇ hiӇn thӏÿѭӧc Unicode mã theo NCR vӟi ÿiӅu kiӋn là meta tag phҧi set theo: Nhѭ vұy có nghƭa là Netscape 4.x ÿã xem UTF-8 nhѭ mӝt code page (giӕng nhѭ các codepages: 1251, 1252 1258 vân vân ) chӭ không phҧi là mӝt dҥng mã Unicode 8 bit nhѭng qua Netscape 6.x thì ÿiӅu này ÿã ÿѭӧc chӍnh lҥi.
  16. Các ӭng dөng Unicode trong web site tiӃng ViӋt 16 Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt Trong MS-WORD ThiӃt KӃ MS-WORD Template: 1. Vào Tools \ Options \ File Location tab ÿӇ xem biӃt directory cӫa Startup files. 2. Ra khӓi MS-WORD và copy vnunicode.dot vào directory cӫa startup files. Thѭӡng thѭӡng directory này là C:\Windows\Application Data\Microsoft\Word\Startup\ 3. Mӣ MS-WORD trӣ lҥi và vào Tools \ Templates and Add-Ins và check [check box] cӫa vnunicode.dot nӃu cҫn. 4. HiӋn giӡ nên dùng font Tahoma cho bҧo ÿҧm. Bҥn có thӇ vào Format \ Styles ÿӇ set Tahoma làm default font. Trong tѭѫng lai có thӇ dùng các fonts khác nhѭ Arial, Times New Roman, v v 5. NӃu muӕn thì vào Tools \ Auto Correct và uncheck hӃt tҩt cҧ các check boxes ÿӇ MS-Word khӓi tӵÿӝng ÿәi nhӳng chӳ nhѭ i thành I (ÿây là mӝt feature có thӇ rҩt phiӅn phӭc hѫn là ích lӧi). Cách Ĉánh Dҩu: Dùng các nút bҩm sau ÿây ÿӇ ÿánh dҩu trѭӟc khi bҩm nút nguyên âm. Nút Bҩm Trѭӟc Khi Bҩm Dҩu Thí Dө Nút Nguyên Âm á : Ctrl + 1, A Sҳc Ctrl + 1 Á : Ctrl + 1, Shift + A à : Ctrl + 2 , A HuyӅn Ctrl + 2 À : Ctrl + 2 , Shift+A ҧ : Ctrl + 3 , A Hӓi Ctrl + 3 Ҧ : Ctrl + 3 , Shift+A ã : Ctrl + 4 , A Ngã Ctrl + 4 Ã : Ctrl + 4 , Shift+A ҥ : Ctrl + 5 , A Nһng Ctrl + 5 Ҥ : Ctrl + 5 , Shift+A â : Ctrl + 6 , A Â ê ô Ctrl + 6 Â : Ctrl + 6 , Shift+A
  17. Các ӭng dөng Unicode trong web site tiӃng ViӋt 17 ă : Ctrl + 7 , A Ă Ctrl + 7 Ă : Ctrl + 7, Shift+A ѭ : Ctrl + 8 , A Ѭѭ Ctrl + 8 Ѭ : Ctrl + 8 , Shift+U ÿ : Ctrl + 9 , D Ð Ctrl + 9 Ð : Ctrl + 9 , Shift+D ҩ : Alt + 1 , A ҩӃӕ Atl + 1 Ҩ : Alt + 1 , shift+A ҫ : Alt + 2 , A ҫӅӗ Atl + 2 Ҫ : Alt + 2 , shift+A ҭ : Alt + 3 , A ҭӇә Alt + 3 Ҭ : Alt + 3 , Shift+A ү : Alt + 4 , A үӉӛ Alt + 4 Ү : Alt + 4 , Shift+A ұ : Alt + 5 , A ұӋӝ Alt + 5 Ұ : Alt + 5 , Shift+A ҳ : Ctrl+Alt + 1 , A ҳӟӭ Ctrl + Alt + 1 Ҳ : Ctrl+Alt + 1 , Shift+A ҵ : Ctrl+Alt + 2 , A ҵӡӯ Ctrl + Alt + 2 Ҷ : Ctrl+Alt + 2 , Shift+A ҷ : Ctrl+Alt + 3 , A ҷӣӱ Ctrl + Alt + 3 Ҷ : Ctrl+Alt + 3 , Shift+A ҹ : Ctrl+Alt + 4 , A ҹӥӳ Ctrl + Alt + 4 Ҹ : Ctrl+Alt + 4 ,Shift+A һ : Ctrl+Alt + 5 , A һӧӵ Ctrl + Alt + 5 Һ : Ctrl+Alt + 5 , Shift+A Nói tóm lҥi: 1. ÿánh dҩu trѭӟc, nguyên âm sau. 2. dùng Ctrl cho dҩu ÿѫn, Alt cho ô hay â vӟi dҩu và Ctrl + Alt cho ѭ hay ѫ vӟi dҩu
  18. Các ӭng dөng Unicode trong web site tiӃng ViӋt 18 Cách chӑn Settings trong OutLook Express (IE 5) ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR Các bҥn sӱ dөng OutLook Express cӫa IE 5x ÿӇ nhұn email có thӇ chӑn các settings cӫa OutLook Express nhѭ sau ÿӇ có thӇÿӑc ÿѭӧc chӳ ViӋt Unicode: Trên Menu cӫa OutLook Express gõ vào Tools - Options - Read ÿӇ mӣ tab box sau ÿây: Hình 1 Gõ vào nút Fonts trong phҫn Fonts cӫa (hình 1) ÿӇ mӣ dialogue sau ÿây:
  19. Các ӭng dөng Unicode trong web site tiӃng ViӋt 19 Hình 2 Trong phҫn [Font settings] chӑn Western European nhѭ hình trên Trong phҫn Proportional font chӑn Tahoma nhѭ hình trên Trong phҫn Encoding chӑn Western European (windows) nhѭ hình trên Gõ vào nút [Set as Default] rӗi gõ vào nút OK ÿӇ ÿóng dialogue trên lҥi Gõ vào nút International settings trong (hình 1) ÿӇ mӣ dialogue sau ÿây: Hình 3 Dialogue trên cho thҩy Western European (Windows) là Default encoding cӫa OutLook Express
  20. Các ӭng dөng Unicode trong web site tiӃng ViӋt 20 NӃu muӕn dùng OutLook Express ÿӇ gӱi email chӳ ViӋt thì có thӇ set nhѭ sau: Trong phҫn tab Send cӫa dialogue sau ÿây, gõ vào nút International Settings Hình 4 Trong phҫn Default encoding cӫa dialogue sau ÿây chӑn Western European (Windows) Hình 5
  21. Các ӭng dөng Unicode trong web site tiӃng ViӋt 21 Gõ vào nút OK ÿӇ ÿóng dialogue trên lҥi Trong hình 4 trên gõ vào nút HTML ÿӇ mӣ dialogue sau ÿây: Hình 6 Trong phҫn [Encode text using] chӑn None rӗi gõ nút OK ÿӇ ÿóng dialogue lҥi Các phҫn khác giӳ nguyên nhѭ default cӫa nó. Bҥn có thӇ dùng chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 ÿӇ ÿánh chӳ ViӋt trong Outlook Express. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa Mã cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi ÿánh chӳ ViӋt. Tuy nhiên nӃu bҥn không muӕn nhӭc ÿҫu vӅ các setting khi gӱi ÿiӋn thѭ thì bҥn có thӇ dùng ngay VoviMail ÿӇ ÿánh chӳ ViӋt mà không cҫn chҥy mӝt chѭѫng trình bên ngoài.
  22. Các ӭng dөng Unicode trong web site tiӃng ViӋt 22 Cách chӑn Settings trong OutLook 2000 ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR Các bҥn sӱ dөng OutLook 2000 ÿӇ nhұn email có thӇ chӑn các settings cӫa OutLook nhѭ sau ÿӇ có thӇÿӑc ÿѭӧc chӳ ViӋt Unicode: Trên Menu cӫa OutLook gõ vào Tools - Options - Mail Format ÿӇ mӣ tab box sau ÿây: Hình 1 Trong [Send in this message format] cӫa (hình 1) chӑn HTML nhѭ hình trên Gõ vào nút Settings ÿӇ mӣ dialogue sau ÿây:
  23. Các ӭng dөng Unicode trong web site tiӃng ViӋt 23 Hình 2 Trong phҫn [Encode text using] cӫa (hình 2) chӑn None nhѭ hình trên rӗi gõ nút OK Gõ vào nút International Options cӫa (hình 1) ÿӇ mӣ dialogue sau ÿây: Hình 3 Chӑn Western European (Windows) cho cҧ hai combo box nhѭ hình trên Trong phҫn Stationery and Fonts trong (hình 1), gõ vào nút Fonts ÿӇ mӣ dialogue sau ÿây:
  24. Các ӭng dөng Unicode trong web site tiӃng ViӋt 24 Hình 4 Trong phҫn Message Fonts cӫa dialogue trên chӑn font Tahoma cho cҧ hai phҫn: When composing a new message (NӃu bҥn muӕn chuyӇn Email bҵng chӳ ViӋt) when replying and forwarding (NӃu bҥn muӕn chuyӇn Email bҵng chӳ ViӋt) Gõ vào nút Fonts cӫa phҫn Stationery and Fonts trong (hình 1) ÿӇ mӣ ra dialogue sau ÿây:
  25. Các ӭng dөng Unicode trong web site tiӃng ViӋt 25 Hình 5 Trong phҫn Font settings chӑn Western European nhѭ hình 5 Trong phҫn Proportional font chӑn Tahoma nhѭ hình 5 Các phҫn còn lҥi cӭ giӳ nguyên nhѭ default cӫa OutLook Cách chӑn setting nhѭ trên sӁ cho phép bҥn ÿӑc ÿѭӧc chӳ ViӋt Unicode ÿӗng thӡi ÿiӋn thѭ gӳi trҧ lӡi cNJng sӁ chuyӇn chӳ ViӋt ÿúng cho ngѭӡi nhұn. Bҥn có thӇ dùng chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 ÿӇ ÿánh chӳ ViӋt trong Outlook 2000. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa Mã cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi ÿánh chӳ ViӋt. Tuy nhiên nӃu bҥn không muӕn nhӭc ÿҫu vӅ các setting khi gӱi ÿiӋn thѭ thì bҥn có thӇ dùng ngay VoviMail ÿӇ ÿánh chӳ ViӋt mà không cҫn chҥy mӝt chѭѫng trình bên ngoài. ÐiӅu kiӋn cҫn có ÿӇ viӃt và ÿӑc Unicode: Operating system: Windows 95.bx, 98.x, 98 Me, NT4, Windows 2000 Professional, Windows 2000 Server and up Browser: IE 4.x and IE 5.x., NE 6x, Netscape còn gһp nhiӅu trӣ ngҥi vӅ xӱ lý Unicode.
  26. Các ӭng dөng Unicode trong web site tiӃng ViӋt 26 Cách ÿánh chӳ ViӋt trong Hotmail Sau khi vào trang Hotmail ÿӇ ÿӑc hay gӱi ÿiӋn thѭ, bҥn gõ vào Compose trên menu bar ngang ÿӇ vào trang viӃt và chuyӇn ÿiӋn thѭ. Gõ vào checkbox "Rich Text Format" (cҫn phҧi check vào ÿây thì mӟi có thӇ xӱ lý Unicode) thì bҥn sӁ thҩy phҫn ÿánh chӳ và gӱi ÿiӋn thѭ nhѭ hình sau: NӃu bҥn dùng mӝt chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 thì bҥn có thӇ ÿánh chӳ viӋt vào khung chӳ cӫa Hotmail ÿӇ gӱi bҵng font Unicode. Tuy nhiên trong VPS 4.0 bҥn cҫn set ÿúng thì mӟi ÿánh ÿѭӧc ra chӳ ViӋt Unicode. Muӕn vұy, bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa Mã cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi ÿánh chӳ ViӋt.
  27. Các ӭng dөng Unicode trong web site tiӃng ViӋt 27 Nhӳng Font sau ÿây có thӇ có glyphs Unicode chӳ ViӋt trong hӋ thӕng Windows cӫa bҥn: Arial, Courier New, Times New Romance và Verdana. Khi ÿánh chӳ ViӋt mà thҩy ô vuông thì bҥn cҫn chӑn mӝt trong nhӳng font trên ÿӇ xem chӳ ViӋt hiӋn ra ÿúng hay không. NӃu không có font nào hiӋn ÿúng chӳ ViӋt thì có nghƭa là fonts trong máy cӫa bҥn ÿã quá cNJ, bҥn cҫn ÿӃn website cӫa Microsoft ÿӇ download fonts mӟi hѫn. Các bҥn muӕn ÿánh chӳ ViӋt ÿӇ ngѭӡi ÿӑc có thӇ nhұn ÿúng chӳ ViӋt thì bҥn có thӇ dùng VoviMail cӫa Vovisoft ÿӇ ÿánh chӳ ViӋt và chuyӇn ÿiӋn thѭ ÿӃn ÿӏa chӍÿiӋn thѭ Hotmail. Hotmail tӵÿӝng chuyӇn ÿúng chӳ ViӋt Unicode gӱi bҵng VoviMail và ngѭӡi nhұn có hӝp thѭ Hotmail sӁÿӑc ÿѭӧc chӳ ViӋt tӭc thì. ÐiӅu kiӋn cҫn có ÿӇ ÿӑc Unicode: Operating system: Windows 95.bx, 98.x, 98 Me, NT4, Windows 2000 Professional, Windows 2000 Server and up Browser: IE 4.x and IE 5.x., NE 6x, Netscape còn gһp nhiӅu trӣ ngҥi vӅ xӱ lý Unicode.
  28. Các ӭng dөng Unicode trong web site tiӃng ViӋt 28 Cách ÿánh chӳ ViӋt trong Yahoo! Mail Muӕn ÿánh chӳ ViӋt bҵng font Unicode trong Yahoo! Mail, bҥn cҫn có chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa Mã cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi ÿánh chӳ ViӋt. Sau khi chҥy Vps vӟi setting nhѭÿã nói ӣ trên, bҥn có thӇ gõ chӳ ViӋt vào khung chӳ cӫa Yahoo! Mail nhѭ hình sau: Yahoo! sӁ trình bày Unicode chӳ ViӋt ÿúng hay sai tùy theo font có trong máy cӫa bҥn. Trӣ ngҥi cӫa Yahoo là không ÿӇ font Tahoma cho ngѭӡi dùng chӑn nên khi máy nào không có font Unicode chӳ ViӋt trong các font ÿһc ÿӏnh trong Yahoo! Mail thì sӁ gһp trӣ ngҥi trong vҩn ÿӅ ÿӑc ÿiӋn thѭ. Bҥn có thӇ làm mӝt cuӝc thӱ nghiӋm bҵng cách highlight mӝt phҫn chӳ ViӋt trong khung chӳ rӗi chӑn tӯng font mӝt trong combobox Font. Bҥn sӁ thҩy có mӝt
  29. Các ӭng dөng Unicode trong web site tiӃng ViӋt 29 sӕ font không cho hiӋn ÿúng chӳ ViӋt. Tҥi sao? Tҥi vì nhӳng font ÿó không có glyhps Unicode chӳ ViӋt. Các bҥn muӕn ÿánh chӳ ViӋt ÿӇ ngѭӡi ÿӑc có thӇ nhұn ÿúng chӳ ViӋt thì bҥn có thӇ dùng VoviMail cӫa Vovisoft ÿӇ ÿánh chӳ ViӋt và chuyӇn ÿiӋn thѭ ÿӃn ÿӏa chӍÿiӋn thѭ Yahoo! Yahoo! Mail tӵÿӝng chuyӇn ÿúng chӳ ViӋt Unicode gӱi bҵng VoviMail và ngѭӡi nhұn có hӝp thѭ Yahoo! sӁÿӑc ÿѭӧc chӳ ViӋt tӭc khҳc. ÐiӅu kiӋn cҫn có ÿӇ viӃt và ÿӑc Unicode: Operating system: Windows 95.bx, 98.x, 98 Me, NT4, Windows 2000 Professional, Windows 2000 Server and up Browser: IE 4.x and IE 5.x.; NE 6x, Netscape còn gһp nhiӅu trӣ ngҥi vӅ xӱ lý Unicode.