X-Git-Url: https://perl5.git.perl.org/perl5.git/blobdiff_plain/a5921eb16cb5d703c15b13cc9ddc5fc0fd55de81..2cf6a769045cf8d7f28ae3ec911e8908b8d22a68:/README.tw diff --git a/README.tw b/README.tw index 20be834..5944bd8 100644 --- a/README.tw +++ b/README.tw @@ -1,163 +1,149 @@ -If you read this file _as_is_, just ignore the funny characters you -see. It is written in the POD format (see perlpod manpage) which is -specially designed to be readable as is. +=encoding utf8 -The following documentation is written in Big5 encoding. - -¦pªG§A¥Î¤@¯ëªº¤å¦r½s¿è¾¹¾\Äý³o¥÷¤å¥ó, ½Ð©¿²¤¤å¤¤©_¯Sªºµù°O¦r²Å. -³o¥÷¤å¥ó¬O¥H POD (²©ú¤å¥ó®æ¦¡) ¼g¦¨; ³oºØ®æ¦¡¬O¬°¤F¯àÅý¤Hª½±µÅª¨ú, -¦Ó¯S§O³]­pªº. Ãö©ó¦¹®æ¦¡ªº¶i¤@¨B¸ê°T, ½Ð°Ñ¦Ò perlpod ½u¤W¤å¥ó. - -=encoding big5 +如果你用一般的文字編輯器閱覽這份文件, 請忽略文中奇特的註記字符. +這份文件是以 POD (簡明文件格式) 寫成; 這種格式是為了能讓人直接讀取, +而特別設計的. 關於此格式的進一步資訊, 請參考 perlpod 線上文件. =head1 NAME -perltw - ¥¿Å餤¤å Perl «ü«n +perltw - 正體中文 Perl 指南 =head1 DESCRIPTION -Åwªï¨Ó¨ì Perl ªº¤Ñ¦a! +歡迎來到 Perl 的天地! -±q 5.8.0 ª©¶}©l, Perl ¨ã³Æ¤F§¹µ½ªº Unicode (¸U°ê½X) ¤ä´©, -¤]³s±a¤ä´©¤F³\¦h©Ô¤B»y¨t¥H¥~ªº½s½X¤è¦¡; CJK (¤¤¤éÁú) «K¬O¨ä¤¤ªº¤@³¡¥÷. -Unicode ¬O°ê»Ú©Êªº¼Ð·Ç, ¸Õ¹Ï²[»\¥@¬É¤W©Ò¦³ªº¦r²Å: ¦è¤è¥@¬É, ªF¤è¥@¬É, -¥H¤Î¨âªÌ¶¡ªº¤@¤Á (§Æþ¤å, ±Ô§Q¨È¤å, ªü©Ô§B¤å, §Æ§B¨Ó¤å, ¦L«×¤å, -¦L¦a¦w¤å, µ¥µ¥). ¥¦¤]®e¯Ç¤F¦hºØ§@·~¨t²Î»P¥­»O (¦p PC ¤Î³Áª÷¶ð). +從 5.8.0 版開始, Perl 具備了完善的 Unicode (萬國碼) 支援, +也連帶支援了許多拉丁語系以外的編碼方式; CJK (中日韓) 便是其中的一部份. +Unicode 是國際性的標準, 試圖涵蓋世界上所有的字符: 西方世界, 東方世界, +以及兩者間的一切 (希臘文, 敘利亞文, 阿拉伯文, 希伯來文, 印度文, +印地安文, 等等). 它也容納了多種作業系統與平臺 (如 PC 及麥金塔). -Perl ¥»¨­¥H Unicode ¶i¦æ¾Þ§@. ³oªí¥Ü Perl ¤º³¡ªº¦r¦ê¸ê®Æ¥i¥Î Unicode -ªí¥Ü; Perl ªº¨ç¦¡»Pºâ²Å (¨Ò¦p¥¿³Wªí¥Ü¦¡¤ñ¹ï) ¤]¯à¹ï Unicode ¶i¦æ¾Þ§@. -¦b¿é¤J¤Î¿é¥X®É, ¬°¤F³B²z¥H Unicode ¤§«eªº½s½X¤è¦¡Àx¦sªº¸ê®Æ, Perl -´£¨Ñ¤F Encode ³o­Ó¼Ò²Õ, ¥i¥HÅý§A»´©ö¦aŪ¨ú¤Î¼g¤J¦³ªº½s½X¸ê®Æ. +Perl 本身以 Unicode 進行操作. 這表示 Perl 內部的字串資料可用 Unicode +表示; Perl 的函式與算符 (例如正規表示式比對) 也能對 Unicode 進行操作. +在輸入及輸出時, 為了處理以 Unicode 之前的編碼方式儲存的資料, Perl +提供了 Encode 這個模組, 可以讓你輕易地讀取及寫入舊有的編碼資料. -Encode ©µ¦ù¼Ò²Õ¤ä´©¤U¦C¥¿Å餤¤åªº½s½X¤è¦¡ ('big5' ªí¥Ü 'big5-eten'): +Encode 延伸模組支援下列正體中文的編碼方式 ('big5' 表示 'big5-eten'): - big5-eten Big5 ½s½X (§t­Ê¤Ñ©µ¦ù¦r§Î) - big5-hkscs Big5 + ­»´ä¥~¦r¶°, 2001 ¦~ª© - cp950 ¦r½X­¶ 950 (Big5 + ·L³n²K¥[ªº¦r²Å) + big5-eten Big5 編碼 (含倚天延伸字形) + big5-hkscs Big5 + 香港外字集, 2001 年版 + cp950 字碼頁 950 (Big5 + 微軟添加的字符) -Á|¨Ò¨Ó»¡, ±N Big5 ½s½XªºÀÉ®×Âন Unicode, ¯­»ÝÁä¤J¤U¦C«ü¥O: +舉例來說, 將 Big5 編碼的檔案轉成 Unicode, 祗需鍵入下列指令: - perl -Mencoding=big5,STDOUT,utf8 -pe1 < file.big5 > file.utf8 + perl -MEncode -pe '$_= encode( utf8 => decode( big5 => $_ ) )' \ + < file.big5 > file.utf8 -Perl ¤]¤ºªþ¤F "piconv", ¤@¤ä§¹¥þ¥H Perl ¼g¦¨ªº¦r²ÅÂà´«¤u¨ãµ{¦¡, ¥Îªk¦p¤U: +Perl 也內附了 "piconv", 一支完全以 Perl 寫成的字符轉換工具程式, 用法如下: piconv -f big5 -t utf8 < file.big5 > file.utf8 piconv -f utf8 -t big5 < file.utf8 > file.big5 -¥t¥~, §Q¥Î encoding ¼Ò²Õ, §A¥i¥H»´©ö¼g¥X¥H¦r²Å¬°³æ¦ìªºµ{¦¡½X, ¦p¤U©Ò¥Ü: +另外,若程式碼本身以 utf8 編碼儲存,配合使用 utf8 模組,可讓程式碼中字串以及其運 +算皆以字符為單位,而不以位元為單位,如下所示: #!/usr/bin/env perl - # ±Ò°Ê big5 ¦r¦ê¸ÑªR; ¼Ð·Ç¿é¥X¤J¤Î¼Ð·Ç¿ù»~³£³]¬° big5 ½s½X - use encoding 'big5', STDIN => 'big5', STDOUT => 'big5'; - print length("Àd¾m"); # 2 (Âù¤Þ¸¹ªí¥Ü¦r²Å) - print length('Àd¾m'); # 4 (³æ¤Þ¸¹ªí¥Ü¦ì¤¸²Õ) - print index("½Î½Î±Ð»£", "να"); # -1 (¤£¥]§t¦¹¤l¦r¦ê) - print index('½Î½Î±Ð»£', 'να'); # 1 (±q²Ä¤G­Ó¦ì¤¸²Õ¶}©l) + use utf8; + print length("駱駝"); # 2 (不是 6) + print index("諄諄教誨", "教誨"); # 2 (從 0 起算第 2 個字符) -¦b³Ì«á¤@¦C¨Ò¤l¸Ì, "½Î" ªº²Ä¤G­Ó¦ì¤¸²Õ»P "½Î" ªº²Ä¤@­Ó¦ì¤¸²Õµ²¦X¦¨ Big5 -½Xªº "ν"; "½Î" ªº²Ä¤G­Ó¦ì¤¸²Õ«h»P "±Ð" ªº²Ä¤@­Ó¦ì¤¸²Õµ²¦X¦¨ "α". -³o¸Ñ¨M¤F¥H«e Big5 ½X¤ñ¹ï³B²z¤W±`¨£ªº°ÝÃD. -=head2 ÃB¥~ªº¤¤¤å½s½X +=head2 額外的中文編碼 -¦pªG»Ý­n§ó¦hªº¤¤¤å½s½X, ¥i¥H±q CPAN (L) ¤U¸ü -Encode::HanExtra ¼Ò²Õ. ¥¦¥Ø«e´£¨Ñ¤U¦C½s½X¤è¦¡: +如果需要更多的中文編碼, 可以從 CPAN (L) 下載 +Encode::HanExtra 模組. 它目前提供下列編碼方式: - cccii 1980 ¦~¤å«Ø·|ªº¤¤¤å¸ê°T¥æ´«½X - euc-tw Unix ©µ¦ù¦r²Å¶°, ¥]§t CNS11643 ¥­­± 1-7 - big5plus ¤¤¤å¼Æ¦ì¤Æ§Þ³N±À¼s°òª÷·|ªº Big5+ - big5ext ¤¤¤å¼Æ¦ì¤Æ§Þ³N±À¼s°òª÷·|ªº Big5e + cccii 1980 年文建會的中文資訊交換碼 + euc-tw Unix 延伸字符集, 包含 CNS11643 平面 1-7 + big5plus 中文數位化技術推廣基金會的 Big5+ + big5ext 中文數位化技術推廣基金會的 Big5e -¥t¥~, Encode::HanConvert ¼Ò²Õ«h´£¨Ñ¤F²ÁcÂà´«¥Îªº¨âºØ½s½X: +另外, Encode::HanConvert 模組則提供了簡繁轉換用的兩種編碼: - big5-simp Big5 ¥¿Å餤¤å»P Unicode ²Å餤¤å¤¬Âà - gbk-trad GBK ²Å餤¤å»P Unicode ¥¿Å餤¤å¤¬Âà + big5-simp Big5 正體中文與 Unicode 簡體中文互轉 + gbk-trad GBK 簡體中文與 Unicode 正體中文互轉 -­Y·Q¦b GBK »P Big5 ¤§¶¡¤¬Âà, ½Ð°Ñ¦Ò¸Ó¼Ò²Õ¤ºªþªº b2g.pl »P g2b.pl ¨â¤äµ{¦¡, -©Î¦bµ{¦¡¤º¨Ï¥Î¤U¦C¼gªk: +若想在 GBK 與 Big5 之間互轉, 請參考該模組內附的 b2g.pl 與 g2b.pl 兩支程式, +或在程式內使用下列寫法: use Encode::HanConvert; - $euc_cn = big5_to_gb($big5); # ±q Big5 Âର GBK - $big5 = gb_to_big5($euc_cn); # ±q GBK Âର Big5 + $euc_cn = big5_to_gb($big5); # 從 Big5 轉為 GBK + $big5 = gb_to_big5($euc_cn); # 從 GBK 轉為 Big5 -=head2 ¶i¤@¨Bªº¸ê°T +=head2 進一步的資訊 -½Ð°Ñ¦Ò Perl ¤ºªþªº¤j¶q»¡©ú¤å¥ó (¤£©¯¥þ¬O¥Î­^¤å¼gªº), ¨Ó¾Ç²ß§ó¦hÃö©ó -Perl ªºª¾ÃÑ, ¥H¤Î Unicode ªº¨Ï¥Î¤è¦¡. ¤£¹L, ¥~³¡ªº¸ê·½¬Û·íÂ×´I: +請參考 Perl 內附的大量說明文件 (不幸全是用英文寫的), 來學習更多關於 +Perl 的知識, 以及 Unicode 的使用方式. 不過, 外部的資源相當豐富: -=head2 ´£¨Ñ Perl ¸ê·½ªººô§} +=head2 提供 Perl 資源的網址 =over 4 =item L -Perl ªº­º­¶ (¥Ñ¼ÚµÜ§¤½¥qºûÅ@) +Perl 的首頁 (由歐萊禮公司維護) =item L -Perl ºî¦X¨åÂúô (Comprehensive Perl Archive Network) +Perl 綜合典藏網 (Comprehensive Perl Archive Network) =item L -Perl ¶l»¼½×¾Â¤@Äý +Perl 郵遞論壇一覽 =back -=head2 ¾Ç²ß Perl ªººô§} +=head2 學習 Perl 的網址 =over 4 -=item L +=item L -¥¿Å餤¤åª©ªº¼ÚµÜ§ Perl ®ÑÂÇ +正體中文版的歐萊禮 Perl 書藉 =item L -»OÆW Perl ³s½u°Q½×°Ï (¤]´N¬O¦U¤j BBS ªº Perl ³s½uª©) +臺灣 Perl 連線討論區 (也就是各大 BBS 的 Perl 連線版) =back -=head2 Perl ¨Ï¥ÎªÌ¶°·| +=head2 Perl 使用者集會 =over 4 -=item L +=item L -»OÆW Perl ±À¼s²Õ¤@Äý +臺灣 Perl 推廣組一覽 -=item L +=item L -ÃÀ¥ß¨ó½u¤W²á¤Ñ«Ç +Perl.tw 線上聊天室 =back -=head2 Unicode ¬ÛÃöºô§} +=head2 Unicode 相關網址 =over 4 =item L -Unicode ¾Ç³N¾Ç·| (Unicode ¼Ð·Çªº¨î©wªÌ) +Unicode 學術學會 (Unicode 標準的制定者) =item L -Unix/Linux ¤Wªº UTF-8 ¤Î Unicode µª«È°Ý +Unix/Linux 上的 UTF-8 及 Unicode 答客問 =back -=head2 ¤¤¤å¤Æ¸ê°T +=head2 中文化資訊 =over 4 -=item ¬°¤°»ò¥s "¥¿Å餤¤å" ¤£¥s "ÁcÅ餤¤å"? - -L - -=item ¤¤¤å¤Æ³nÅéÁp·ù +=item 中文化軟體聯盟 L -=item Linux ³nÅ餤¤å¤Æ­p¹º +=item Linux 軟體中文化計劃 L @@ -165,12 +151,12 @@ L =head1 SEE ALSO -L, L, L, L, L +L, L, L, L =head1 AUTHORS Jarkko Hietaniemi Ejhi@iki.fiE -Autrijus Tang (­ð©vº~) Eautrijus@autrijus.orgE +Audrey Tang (唐鳳) Eaudreyt@audreyt.orgE =cut