Converted Asian documentations to utf-8
authorLeon Timmermans <fawaka@gmail.com>
Sun, 14 Apr 2013 07:59:33 +0000 (09:59 +0200)
committerLeon Timmermans <fawaka@gmail.com>
Sun, 14 Apr 2013 08:06:44 +0000 (10:06 +0200)
Transcoded README.{cn,jp,ko} to utf-8
Fixed encoding lines for README.{cn,jp,ko,tw}
Fixed verbatim text for README.{cn,ko}

README.cn
README.jp
README.ko
README.tw

index e45ebff..04eb4de 100644 (file)
--- a/README.cn
+++ b/README.cn
-If you read this file _as_is_, just ignore the funny characters you
-see. It is written in the POD format (see perlpod manpage) which is
-specially designed to be readable as is.
+=encoding utf8
 
-The following documentation is written in EUC-CN encoding.
-
-��������һ�������ֱ༭�����������ļ�, �������������ص�ע���ַ�.
-�����ļ����� POD (�����ļ���ʽ) д��; ���ָ�ʽ��Ϊ��������ֱ���Ķ�,
-���ر����Ƶ�. ���ڴ˸�ʽ�Ľ�һ����Ϣ, ���ο� perlpod �����ļ�.
-
-=encoding euc-cn
+如果你用一般的文字编辑器阅览这份文件, 请忽略文中奇特的注记字符.
+这份文件是以 POD (简明文件格式) 写成; 这种格式是为了能让人直接阅读,
+而特别设计的. 关于此格式的进一步信息, 请参考 perlpod 线上文件.
 
 =head1 NAME
 
-perlcn - �������� Perl ָ��
+perlcn - 简体中文 Perl 指南
 
 =head1 DESCRIPTION
 
-��ӭ���� Perl ������!
+欢迎来到 Perl 的天地!
 
-�� 5.8.0 �濪ʼ, Perl �߱������Ƶ� Unicode (ͳһ��) ֧Ԯ,
-Ҳ����֧Ԯ������������ϵ�����ı��뷽ʽ; CJK (���պ�) �������е�һ����.
-Unicode �ǹ����Եı�׼, ��ͼ�������������е��ַ�: ��������, ��������,
-�Լ����߼���һ�� (ϣ����, ��������, ��������, ϣ������, ӡ����,
-ӡ�ذ���, �ȵ�). ��Ҳ�����˶�����ҵϵͳ��ƽ̨ (�� PC ��������).
+从 5.8.0 版开始, Perl 具备了完善的 Unicode (统一码) 支援,
+也连带支援了许多拉丁语系以外的编码方式; CJK (中日韩) 便是其中的一部份.
+Unicode 是国际性的标准, 试图涵盖世界上所有的字符: 西方世界, 东方世界,
+以及两者间的一切 (希腊文, 叙利亚文, 亚拉伯文, 希伯来文, 印度文,
+印地安文, 等等). 它也容纳了多种作业系统与平台 (如 PC 及麦金塔).
 
-Perl ������ Unicode ���в���. ����ʾ Perl �ڲ����ַ������ݿ��� Unicode
-��ʾ; Perl �ĺ�ʽ������ (����������ʾʽ�ȶ�) Ҳ�ܶ� Unicode ���в���.
-�����뼰����ʱ, Ϊ�˴����� Unicode ֮ǰ�ı��뷽ʽ���ŵ�����, Perl
-�ṩ�� Encode ����ģ��, �����������׵ض�ȡ��д�����еı�������.
+Perl 本身以 Unicode 进行操作. 这表示 Perl 内部的字符串数据可用 Unicode
+表示; Perl 的函式与算符 (例如正规表示式比对) 也能对 Unicode 进行操作.
+在输入及输出时, 为了处理以 Unicode 之前的编码方式存放的数据, Perl
+提供了 Encode 这个模块, 可以让你轻易地读取及写入旧有的编码数据.
 
-Encode ����ģ��֧Ԯ���м������ĵı��뷽ʽ ('gb2312' ��ʾ 'euc-cn'):
+Encode 延伸模块支援下列简体中文的编码方式 ('gb2312' 表示 'euc-cn'):
 
-    euc-cn     Unix �����ַ���, Ҳ�����׳ƵĹ�����
-    gb2312-raw δ�������� (�ͱ���) GB2312 �ַ���
-    gb12345    δ���������й��÷������ı���
-    iso-ir-165 GB2312 + GB6345 + GB8565 + �����ַ�
-    cp936      ����ҳ 936, Ҳ������ 'GBK' (����������) ָ��
-    hz         7 �����ݳ�ʽ GB2312 ����
+    euc-cn     Unix 延伸字符集, 也就是俗称的国标码
+    gb2312-raw 未经处理的 (低比特) GB2312 字符表
+    gb12345    未经处理的中国用繁体中文编码
+    iso-ir-165 GB2312 + GB6345 + GB8565 + 新增字符
+    cp936      字码页 936, 也可以用 'GBK' (扩充国标码) 指明
+    hz         7 比特逸出式 GB2312 编码
 
-������˵, �� EUC-CN �����ĵ���ת�� Unicode, ������������ָ��:
+举例来说, 将 EUC-CN 编码的档案转成 Unicode, 祗需键入下列指令:
 
     perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8
 
-Perl Ҳ�ڸ��� "piconv", һ֧��ȫ�� Perl д�ɵ��ַ�ת�����߳���, �÷�����:
+Perl 也内附了 "piconv", 一支完全以 Perl 写成的字符转换工具程序, 用法如下:
 
     piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
     piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn
 
-����, ���� encoding ģ��, ����������д�����ַ�Ϊ��λ�ij�����, ������ʾ:
+另外, 利用 encoding 模块, 你可以轻易写出以字符为单位的程序码, 如下所示:
 
     #!/usr/bin/env perl
-    # ���� euc-cn �ִ�����; ��׼�����뼰��׼��������Ϊ euc-cn ����
+    # 启动 euc-cn 字串解析; 标准输出入及标准错误都设为 euc-cn 编码
     use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn';
-    print length("����");           #  2 (˫���ű�ʾ�ַ�)
-    print length('����');           #  4 (�����ű�ʾ�ֽ�)
-    print index("׻׻�̻�", "�׻�"); # -1 (�����������ַ���)
-    print index('׻׻�̻�', '�׻�'); #  1 (�ӵڶ����ֽڿ�ʼ)
+    print length("骆驼");         #  2 (双引号表示字符)
+    print length('骆驼');         #  4 (单引号表示字节)
+    print index("谆谆教诲", "蛔唤"); # -1 (不包含此子字符串)
+    print index('谆谆教诲', '蛔唤'); #  1 (从第二个字节开始)
 
-������һ��������, "׻" �ĵڶ����ֽ��� "׻" �ĵ�һ���ֽڽ��ϳ� EUC-CN
-���� "��"; "׻" �ĵڶ����ֽ����� "��" �ĵ�һ���ֽڽ��ϳ� "��".
-����������ǰ EUC-CN ���ȶԴ����ϳ���������.
+在最后一列例子里, "谆" 的第二个字节与 "谆" 的第一个字节结合成 EUC-CN
+码的 "蛔"; "谆" 的第二个字节则与 "教" 的第一个字节结合成 "唤".
+这解决了以前 EUC-CN 码比对处理上常见的问题.
 
-=head2 ���������ı���
+=head2 额外的中文编码
 
-������Ҫ���������ı���, ���Դ� CPAN (L<http://www.cpan.org/>) ����
-Encode::HanExtra ģ��. ��Ŀǰ�ṩ���б��뷽ʽ:
+如果需要更多的中文编码, 可以从 CPAN (L<http://www.cpan.org/>) 下载
+Encode::HanExtra 模块. 它目前提供下列编码方式:
 
-    gb18030    �������Ĺ�����, ������������
+    gb18030    扩充过的国标码, 包含繁体中文
 
-����, Encode::HanConvert ģ�����ṩ�˼���ת���õ����ֱ���:
+另外, Encode::HanConvert 模块则提供了简繁转换用的两种编码:
 
-    big5-simp  Big5 ���������� Unicode �������Ļ�ת
-    gbk-trad   GBK ���������� Unicode �������Ļ�ת
+    big5-simp  Big5 繁体中文与 Unicode 简体中文互转
+    gbk-trad   GBK 简体中文与 Unicode 繁体中文互转
 
-������ GBK �� Big5 ֮�以ת, ���ο���ģ���ڸ��� b2g.pl �� g2b.pl ��֧����,
-���ڳ�����ʹ������д��:
+若想在 GBK 与 Big5 之间互转, 请参考该模块内附的 b2g.pl 与 g2b.pl 两支程序,
+或在程序内使用下列写法:
 
     use Encode::HanConvert;
-    $euc_cn = big5_to_gb($big5); # �� Big5 תΪ GBK
-    $big5 = gb_to_big5($euc_cn); # �� GBK תΪ Big5
+    $euc_cn = big5_to_gb($big5); # 从 Big5 转为 GBK
+    $big5 = gb_to_big5($euc_cn); # 从 GBK 转为 Big5
 
-=head2 ��һ������Ϣ
+=head2 进一步的信息
 
-���ο� Perl �ڸ��Ĵ���˵���ļ� (����ȫ����Ӣ��д��), ��ѧϰ��������
-Perl ��֪ʶ, �Լ� Unicode ��ʹ�÷�ʽ. ����, �ⲿ����Դ�൱�ḻ:
+请参考 Perl 内附的大量说明文件 (不幸全是用英文写的), 来学习更多关于
+Perl 的知识, 以及 Unicode 的使用方式. 不过, 外部的资源相当丰富:
 
-=head2 �ṩ Perl ��Դ����ַ
+=head2 提供 Perl 资源的网址
 
 =over 4
 
 =item L<http://www.perl.com/>
 
-Perl ����ҳ (��ŷ������˾ά��)
+Perl 的首页 (由欧莱礼公司维���)
 
 =item L<http://www.cpan.org/>
 
-Perl �ۺϵ����� (Comprehensive Perl Archive Network)
+Perl 综合典藏网 (Comprehensive Perl Archive Network)
 
 =item L<http://lists.perl.org/>
 
-Perl �ʵ���̳һ��
+Perl 邮递论坛一览
 
 =back
 
-=head2 ѧϰ Perl ����ַ
+=head2 学习 Perl 的网址
 
 =over 4
 
 =item L<http://www.oreilly.com.cn/index.php?func=booklist&cat=68>
 
-�������İ���ŷ���� Perl ����
+简体中文版的欧莱礼 Perl 书藉
 
 =back
 
-=head2 Perl ʹ���߼���
+=head2 Perl 使用者集会
 
 =over 4
 
 =item L<http://www.pm.org/groups/asia.html>
 
-�й� Perl �ƹ���һ��
+中国 Perl 推广组一览
 
 =back
 
-=head2 Unicode ������ַ
+=head2 Unicode 相关网址
 
 =over 4
 
 =item L<http://www.unicode.org/>
 
-Unicode ѧ��ѧ�� (Unicode ��׼���ƶ���)
+Unicode 学术学会 (Unicode 标准的制定者)
 
 =item L<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
 
-Unix/Linux �ϵ� UTF-8 �� Unicode ������
+Unix/Linux 上的 UTF-8 及 Unicode 答客问
 
 =back
 
@@ -145,6 +139,6 @@ L<Encode>, L<Encode::CN>, L<encoding>, L<perluniintro>, L<perlunicode>
 
 Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt>
 
-Audrey Tang (�Ʒ�) E<lt>audreyt@audreyt.orgE<gt>
+Audrey Tang (唐凤) E<lt>audreyt@audreyt.orgE<gt>
 
 =cut
index 934a91f..2a1fa57 100644 (file)
--- a/README.jp
+++ b/README.jp
@@ -1,24 +1,18 @@
-If you read this file _as_is_, just ignore the funny characters you
-see. It is written in the POD format (see perlpod manpage) which is
-specially designed to be readable as is.
-
-The following documentation is written in euc-jp encoding.
-
-=encoding euc-jp
+=encoding utf8
 
 =head1 NAME
 
-perljp - ���ܸ� Perl ������
+perljp - 日本語 Perl ガイド
 
-=head1 ����
+=head1 説明
 
-Perl �������ؤ褦����!
+Perl の世界へようこそ!
 
-Perl 5.8.0 ���ꡢUnicode���ݡ��Ȥ������˶������졢���η��̥��ƥ�ʸ���ʳ���ʸ���ɤΥ��ݡ��Ȥ� CJK (�����졢���ܸ졢�ϥ󥰥�)���ޤ��Ʋä����ޤ�����Unicode����������ʸ�������Ĥ�ʸ���ɤǰ������Ȥ��ܻؤ���ɸ�൬�ʤǤ��ꡢ�줫�������Ϥ��ޤ����δ֤�ʸ���ʥ��ꥷ��ʸ���꡼��ʸ�����ӥ�ʸ�����إ֥饤ʸ�����ǥ�����ʥ�����ʸ�����ʤɤʤɡˤ䡢�����ޤǤ�OS�٥��������ȼ��������Ƥ���ʸ��(PC������Macintosh)�����Ǥ˴ޤޤ��Ƥ��ޤ���
+Perl 5.8.0 より、Unicodeサポートが大幅に強化され、その結果ラテン文字以外の文字コードのサポートが CJK (中国語、日本語、ハングル)を含めて加わりました。Unicodeは世界中の文字を一つの文字コードで扱うことを目指した標準規格であり、東から西、はたまたその間の文字(ギリシャ文字、キリール文字、アラビア文字、ヘブライ文字、ディーヴァナガーリ文字、などなど)や、これまではOSベンダーが独自に定めていた文字(PCおよびMacintosh)がすでに含まれています。
 
-Perl ���Ȥ� Unicode ��ư�\e937�ޤ���Perl �������ץ�����ʸ�������ƥ���������ɽ���� Unicode �������Ȥ��Ƥ��ޤ��������������ϤΤ����ˤϡ������ޤǻȤ����Ƥ������ޤ��ޤ�ʸ���ɤ��б������⥸�塼�롢�� Encode �פ�ɸ��������Ƥ��ꡢUnicode �Ȥ�������ʸ���ɤ������Ѵ�����ñ�˹Ԥ����褦�ˤʤäƤ��ޤ���
+Perl 自身は Unicode で動作します。Perl スクリプト内の文字列リテラルや正規表現は Unicode を前提としています。そして入出力のためには、これまで使われてきたさまざまな文字コードに対応するモジュール、「 Encode 」が標準装備されており、Unicode とこれらの文字コードの相互変換も簡単に行えるようになっています。
 
-�������� Encode �����ݡ��Ȥ���ʸ���ɤϰʲ��ΤȤ����Ǥ���
+現時点で Encode がサポートする文字コードは以下のとおりです。
 
   7bit-jis      AdobeStandardEncoding AdobeSymbol       AdobeZdingbat
   ascii             big5              big5-hkscs        cp1006
@@ -50,32 +44,32 @@ Perl 
   UTF-16LE          UTF-32            UTF-32BE          UTF-32LE
   utf8              viscii                              
 
-(��114����)
+(全114種類)
 
-�㤨�С�ʸ����FOO�Υե�������UTF-8���Ѵ������ˤϡ��ʲ��Τ褦�ˤ��ޤ���
+例えば、文字コードFOOのファイルをUTF-8に変換するには、以下のようにします。
 
     perl -Mencoding=FOO,STDOUT,utf8 -pe1 < file.FOO > file.utf8
 
-�ޤ���Perl�ˤϡ�������Perl�ǽ񤫤줿ʸ�����Ѵ��桼�ƥ����ƥ���piconv����°���Ƥ����Τǡ��ʲ��Τ褦�ˤ��뤳�Ȥ��Ǥ��ޤ���
+また、Perlには、全部がPerlで書かれた文字コード変換ユーティリティ、piconvも付属しているので、以下のようにすることもできます。
 
    piconv -f FOO -t utf8 < file.FOO > file.utf8
    piconv -f utf8 -t FOO < file.utf8 > file.FOO
 
 =head2 About (jcode.pl|Jcode.pm|JPerl)
 
-5.8�����Ρ��������ץȤ�EUC-JP�Ǥ����Х��ƥ��������ϰ������Ȥ��Ǥ��ޤ������ޤ��������Ϥ򰷤��⥸�塼���Ȥ��Ƥ�Jcode.pm��( http://openlab.ring.gr.jp/Jcode/ )��perl4�ѤΥ桼�ƥ����ƥ��Ȥ��Ƥ�jcode.pl�����줾��¸�ߤ������ܸ��ΰ�����CGI�Ǥ褯���Ѥ����Ƥ��뤳�Ȥ���¸�������⾯�ʤ��ʤ����Ȼפ����ޤ��������������ܸ��ˤ�������ɽ���򤦤ޤ��������Ȥ��Բ�ǽ�Ǥ�����
+5.8以前の、スクリプトがEUC-JPであればリテラルだけは扱うことができました。また、入出力を扱うモジュールとしてはJcode.pmが( http://openlab.ring.gr.jp/Jcode/ )、perl4用のユーティリティとしてはjcode.plがそれぞれ存在し、日本語の扱えるCGIでよく利用されていることを御存じの方も少なくないかと思われます。ただし、日本語による正規表現をうまく扱うことは不可能でした。
 
-5.005������Perl�ˤϡ����ܸ����ò����������饤���ǡ�Jperl��¸�ߤ��ޤ���( http://homepage2.nifty.com/kipp/perl/jperl/index.html )���ޤ���Mac OS 9.x/Classic�Ѥ�Perl��MacPerl�����ܸ��Ǥ�MacJPerl�Ȥ���¸�ߤ��Ƥޤ�����( http://habilis.net/macjperl/ ).�������Ǥ�ʸ���ɤȤ���EUC-JP�˲ä�Shift_JIS�⤽�Τޤް������Ȥ��Ǥ����ޤ����ܸ��ˤ�������ɽ���򰷤����Ȥ���ǽ�Ǥ�����
+5.005以前のPerlには、日本語に特化したローカライズ版、Jperlが存在しました( http://homepage2.nifty.com/kipp/perl/jperl/index.html )。また、Mac OS 9.x/Classic用のPerl、MacPerlの日本語版もMacJPerlとして存在してました。( http://habilis.net/macjperl/ ).これらでは文字コードとしてEUC-JPに加えShift_JISもそのまま扱うことができ、また日本語による正規表現を扱うことも可能でした。
 
-Perl5.8�Ǥϡ��������ε�ǽ�����٤�Perl���Τ����Ǽ¸��Ǥ������ˡ����ܸ��Τߤʤ餺�嵭114��ʸ���ɤ򤹤٤ơ�������Ʊ���˰������Ȥ��Ǥ��ޤ��������ˡ�CPAN�ʤɤ��鿷����ʸ�����ѤΥ⥸�塼�������ꤹ�뤳�Ȥ���ñ�ˤǤ����褦�ˤʤäƤ��ޤ���
+Perl5.8では、これらの機能がすべてPerl本体だけで実現できる上に、日本語のみならず上記114の文字コードをすべて、しかも同時に扱うことができます。さらに、CPANなどから新しい文字コード用のモジュールを入手することも簡単にできるようになっています。
 
 =over 4
 
 =item *
 
-������
+入出力
 
-�ʲ������Ϥ��Ť���Shift_JIS�����Ϥ�EUC-JP���Ѵ����ƽ��Ϥ��ޤ���
+以下の例はいづれもShift_JISの入力をEUC-JPに変換して出力します。
 
   # jcode.pl
   require "jcode.pl";
@@ -94,7 +88,7 @@ Perl5.8
     from_to($_, 'shiftjis', 'euc-jp');
     print;
   }
-  # Perl 5.8 - encoding �����Ѥ���
+  # Perl 5.8 - encoding を利用して
   use encoding 'euc-jp', STDIN => 'shiftjis';
   while(<>){
        print;
@@ -102,33 +96,33 @@ Perl5.8
 
 =item *
 
-Jperl �ߴ��������ץ�
+Jperl 互換スクリプト
 
- ��������"shebang"���ѹ����������ǡ�Jperl�Ѥ�script�ΤۤȤ��ɤ��ѹ��ʤ������Ѳ�ǽ���Ȼפ����ޤ���
+いわゆる"shebang"を変更するだけで、Jperl用のscriptのほとんどは変更なしに利用可能だと思われます。
 
    #!/path/to/jperl
-   ��
+   ↓
    #!/path/to/perl -Mencoding=euc-jp
 
- �ܤ����� perldoc encoding �򻲾Ȥ��Ƥ���������
+詳しくは perldoc encoding を参照してください。
 
 =back
 
-=head2 �����˾ܤ���
+=head2 さらに詳しく
 
-Perl�ˤ������ʻ�������°���Ƥ��ꡢPerl�ο���ǽ��Unicode���ݡ��ȡ�������Encode�⥸�塼���λ���ˡ�ʤɤ��٤������夵���Ƥ��ޤ��ʻ�ǰ�ʤ��顢�ۤȤ��ɱѸ��ǤϤ����ޤ����ˡ��ʲ��Υ��ޥ��ɤǤ������ΰ���������뤳�Ȥ���ǽ�Ǥ���
+Perlには膨大な資料が付属しており、Perlの新機能やUnicodeサポート、そしてEncodeモジュールの使用法などが細かく網羅されています(残念ながら、ほとんど英語ではありますが)。以下のコマンドでそれらの一部を閲覧することが可能です。
 
-  perldoc perlunicode # Perl��Unicode���ݡ�������
-  perldoc Encode      # Encode�⥸�塼���˴ؤ���
-  perldoc Encode::JP  # �������ܸ�ʸ���ɤ˴ؤ���
+  perldoc perlunicode # PerlのUnicodeサポート全般
+  perldoc Encode      # Encodeモジュールに関して
+  perldoc Encode::JP  # うち日本語文字コードに関して
 
-=head2 Perl���̤˴ؤ��� URL
+=head2 Perl全般に関する URL
 
 =over 4
 
 =item L<http://www.perl.com/>
 
-Perl �ۡ����ڡ��� (O'Reilly and Associates)
+Perl ホームペー��� (O'Reilly and Associates)
 
 =item L<http://www.cpan.org/>
 
@@ -136,29 +130,29 @@ CPAN (Comprehensive Perl Archive Network)
 
 =item L<http://lists.perl.org/>
 
-Perl �᡼���󥰥ꥹ�Ƚ�
+Perl メーリングリスト集
 
 =back
 
-=head2 Perl�ν�������Ω�� URL
+=head2 Perlの修得に役立つ URL
 
 =over 4
 
 =item L<http://www.oreilly.com.tw/>
 
-O'Reilly �Ҥ�Perl��Ϣ����(���λ�������)
+O'Reilly 社のPerl関連書籍(繁体字中国語)
 
 =item L<http://www.oreilly.com.cn/>
 
-O'Reilly �Ҥ�Perl��Ϣ����(���λ�������)
+O'Reilly 社のPerl関連書籍(簡体字中国語)
 
 =item L<http://www.oreilly.co.jp/catalog/>
 
-���饤�꡼�Ҥ�Perl��Ϣ����(���ܸ�)
+オライリー社のPerl関連書籍(日本語)
 
 =back
 
-=head2 Perl �桼�������롼��
+=head2 Perl ユーザーグループ
 
 =over 4
 
@@ -166,13 +160,13 @@ O'Reilly 
 
 =back
 
-=head2 Unicode��Ϣ��URL
+=head2 Unicode関連のURL
 
 =over 4
 
 =item L<http://www.unicode.org/>
 
-Unicode ���󥽡������� (Unicode���ʤ���������)
+Unicode コンソーシアム (Unicode規格の選定団体)
 
 =item L<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
 
@@ -180,13 +174,13 @@ UTF-8 and Unicode FAQ for Unix/Linux
 
 =item L<http://wiki.kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html>
 
-UTF-8 and Unicode FAQ for Unix/Linux (�ϥ󥰥���)
+UTF-8 and Unicode FAQ for Unix/Linux (ハングル訳)
 
 =back
 
 =head1 AUTHORS
 
 Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt>
-Dan Kogai (��������) E<lt>dankogai@dan.co.jpE<gt>
+Dan Kogai (小飼 弾) E<lt>dankogai@dan.co.jpE<gt>
 
 =cut
index 4f23ea9..2632135 100644 (file)
--- a/README.ko
+++ b/README.ko
-If you read this file _as_is_, just ignore the funny characters you
-see. It is written in the POD format (see perlpod manpage) which is
-specially designed to be readable as is.
+=encoding utf8
 
-This file is in Korean encoded in EUC-KR. 
-
-�� ������ perldoc�� �Ἥ ���� �ʰ� ���� ���� ���쿡�� �� �κ���
-������ ǥ���ϱ� ���� ���� =head, =item, 'L' ���� �����Ͻʽÿ�.
-�� ������ ���� perldoc�� ���� �ʰ� �������� �дµ� �� ������
-���� POD �������� ¥�� �ֽ��ϴ�.  �� �ڼ��� ���� perlpod
-�Ŵ����� �����Ͻʽÿ�. 
-
-=encoding euc-kr
+이 문서를 perldoc을 써서 보지 않고 직접 보는 경우에는 각 부분의
+역할을 표시하기 위해 쓰인 =head, =item, 'L' 등은 무시하십시오.
+이 문서는 따로 perldoc을 쓰지 않고 보더라도 읽는데 별 지장이
+없는 POD 형식으로 짜여 있습니다.  더 자세한 것은 perlpod
+매뉴얼을 참고하십시오. 
 
 =head1 NAME
 
-perlko - Perl�� �ѱ��� ���ڵ�
+perlko - Perl과 한국어 인코딩
 
 =head1 DESCRIPTION
 
-Perl�� ���迡 ���� ���� ȯ���մϴ� !
+Perl의 세계에 오신 것을 환영합니다 !
 
 
-Perl�� 5.8.0�Ǻ��� �����ڵ�/ISO 10646�� ���� �������� ������ �մϴ�.
-�����ڵ� ������ ��ȯ���� �������� ������ ���� ��������
-�����ڵ� ������ ���� �־��� ���ݵ� �θ� ���̰� �ִ� ������ ���ڵ���
-�����մϴ�.  �����ڵ��� �� ���迡�� ���̴� ���� ���\ee26 ���� ǥ�� ü�� -
-������ ��ƾ ���ĺ�, Ű�� ���ĺ�, �׸��� ���ĺ�, �ε��� ���� �ƽþ���
-������ �迭 ��ũ��Ʈ, �ƶ� ����, ���긮 ����, �������� ����, �ѱ����� �ѱ�,
-�Ϻ����� ����, �Ϲ� �ε����� ǥ�� ü�� ��-�� �����ϴ� ���� ��ǥ�� �ϰ�
-�ֱ� ������ ������ ���̴�  �� ���� �� ���� �׸��� �\eff5 ü�迡 ������
-���� ���հ� ���ڵ��� �� �� �ִ� ���� ���ڴ� �����̰�  ���� ���� ���տ���
-�����ϰ� ���� �ʴ� ���� ���� ���ڸ�  �����ϰ� �ֽ��ϴ�.
+Perl은 5.8.0판부터 유니코드/ISO 10646에 대한 광범위한 지원을 합니다.
+유니코드 지원의 일환으로 한중일을 비롯한 세계 각국에서
+유니코드 이전에 쓰고 있었고 지금도 널리 쓰이고 있는 수많은 인코딩을
+지원합니다.  유니코드는 전 세계에서 쓰이는 모든 언어를 위한 표기 체계 -
+유럽의 라틴 알파벳, 키릴 알파벳, 그리스 알파벳, 인도와 동남 아시아의
+브라미 계열 스크립트, 아랍 문자, 히브리 문자, 한중일의 한자, 한국어의 한글,
+일본어의 가나, 북미 인디안의 표기 체계 등-를 수용하는 것을 목표로 하고
+있기 때문에 기존에 쓰이던  각 언어 및 국가 그리고 운영 체계에 고유한
+문자 집합과 인코딩에 쓸 수 있는 모든 글자는 물론이고  기존 문자 집합에서
+지원하고 있지 않던 아주 많은 글자를  포함하고 있습니다.
 
 
-Perl�� ���������� �����ڵ带 ���� ǥ���� ���� �����մϴ�. ���� ��ü������
-���ϸ� Perl ��ũ��Ʈ �ȿ���  UTF-8 ���ڿ��� �� �� �ְ�
-���� �Լ��� ������(���� ����, ���Խ�, index, substr)�� ����Ʈ ����
-���� �����ڵ� ���� ������ �����մϴ�. (�� �ڼ��� ���� 
-perlunicode �Ŵ����� �����Ͻʽÿ�.) �����ڵ尡 �θ� ���޵DZ� ����
-�θ� ���̰� �־���, ������ �θ� ���̰� �ִ� ����/�� ���\eeb0 ���ڵ�����
-�������� �ϰ� �̵� ���ڵ����� �� �����Ϳ� ������ �ٷ��� ���� ���� ����
-'Encode'��  �������ϴ�. �������� 'Encode'��  �Ἥ ������ ���ڵ� ������
-��ȯ�� ���� �� �� �ֽ��ϴ�.
+Perl은 내부적으로 유니코드를 문자 표현을 위해 사용합니다. 보다 구체적으로
+말하면 Perl 스크립트 안에서  UTF-8 문자열을 쓸 수 있고
+각종 함수와 연산자(예를 들어, 정규식, index, substr)가 바이트 단위
+대신 유니코드 글자 단위로 동작합니다. (더 자세한 것은 
+perlunicode 매뉴얼을 참고하십시오.) 유니코드가 널리 보급되기 전에
+널리 쓰이고 있었고, 여전히 널리 쓰이고 있는 각국/각 언어별 인코딩으로
+입출력을 하고 이들 인코딩으로 된 데이터와 문서를 다루는 것을 돕기 위해
+'Encode'가  쓰였습니다. 무엇보다 'Encode'를  써서 수많은 인코딩 사이의
+변환을 쉽게 할 수 있습니다.
 
-'Encode'�� ������ ���� �ѱ��� ���ڵ��� �����մϴ�.
+'Encode'는 다음과 같은 한국어 인코딩을 지원합니다.
 
 =over 4
 
-=item euc-kr 
+=item euc-kr 
 
-  US-ASCII�� KS X 1001�� ���� ���� ��Ƽ����Ʈ ���ڵ� (���� �ϼ����̶���
-  �Ҹ�.) KS X 2901�� RFC 1557 ����.
+US-ASCII와 KS X 1001을 같이 쓰는 멀티바이트 인코딩 (흔히 완성형이라고
+불림.) KS X 2901과 RFC 1557 참고.
 
-=item  cp949     
+=item * cp949     
 
-       MS-Windows 9x/ME���� ���̴� Ȯ�� �ϼ���.  euc-kr�� 8,822����
-       �ѱ� ������ ���� ����.  alias�� uhc, windows-949, x-windows-949,
-       ks_c_5601-1987. �� ������ �̸��� �������� ���� �̸�������, Microsoft
-       ��ǰ���� CP949�� �ǹ̷� ���̰� ����.
+MS-Windows 9x/ME에서 쓰이는 확장 완성형.  euc-kr에 8,822자의
+한글 음절을 더한 것임.  alias는 uhc, windows-949, x-windows-949,
+ks_c_5601-1987. 맨 마지막 이름은 적절하지 않은 이름이지만, Microsoft
+제품에서 CP949의 의미로 쓰이고 있음.
 
-=item  johab          
+=item * johab          
 
-       KS X 1001:1998 �η� 3���� ������ ������.  ���� �����丮�� cp949��
-       ���������� US-ASCII��  KS X 1001�� 8,822���� �ѱ� ������ ���� ����.
-       ���ڵ� ������ ���� �ٸ�
+KS X 1001:1998 부록 3에서 규정한 조합형.  문자 레퍼토리는 cp949와
+마찬가지로 US-ASCII와  KS X 1001에 8,822자의 한글 음절을 더한 것임.
+인코딩 방식은 전혀 다름
 
-=item iso-2022-kr     
+=item iso-2022-kr     
 
-       RFC 1557���� ������ �ѱ��� ���ͳ� ���� ��ȯ�� ���ڵ����� US-ASCII��
-       KS X 1001�� �����丮�� �ϴ� ������ euc-kr�� ������ ���ڵ� ������ �ٸ�.
-       1997-8�� ������ �������� �� �̻� ���� ��ȯ�� ������ ����.
+RFC 1557에서 규정한 한국어 인터넷 메일 교환용 인코딩으로 US-ASCII와
+KS X 1001을 레퍼토리로 하는 점에서 euc-kr과 같지만 인코딩 방식이 다름.
+1997-8년 경까지 쓰였으나 더 이상 메일 교환에 쓰이지 않음.
 
-=item  ksc5601-raw     
+=item * ksc5601-raw     
 
-       KS X 1001(KS C 5601)�� GL(��, MSB�� 0���� �� ����) �� ������ ����
-       ���ڵ�. US-ASCII�� �������� �ʰ� �ܵ����� ���̴� ���� X11 �\efe1�� �۲�
-       ���ڵ� (ksc5601.1987-0. '0'�� GL�� �ǹ���.)���� ���̴� ���� �����ϰ���
-       ���� ����. KS C 5601�� 1997�� KS X 1001�� �̸��� �ٲپ���.  1998�⿡��  ��
-       ���� (����ȭ ��ȣ�� ���� ��ǥ ��ȣ)�� ��������.
+KS X 1001(KS C 5601)을 GL(즉, MSB를 0으로 한 경우) 에 놓았을 때의
+인코딩. US-ASCII와 결합하지 않고 단독으로 쓰이는 일은 X11 등에서 글꼴
+인코딩 (ksc5601.1987-0. '0'은 GL을 의미함.)으로 쓰이는 것을 제외하고는
+거의 없음. KS C 5601은 1997년 KS X 1001로 이름을 바꾸었음.  1998년에는  두
+글자 (유로화 부호와 등록 상표 부호)가 더해졌음.
 
 =back
 
- �� ���� ���� ������ �Ʒ��� ���Դϴ�
+몇 가지 사용 예제를 아래에 보입니다
 
-���� ����, euc-kr ���ڵ����� �� ������ UTF-8�� ��ȯ�Ϸ��� ������
-���� �ϸ� �˴ϴ�
+예를 들어, euc-kr 인코딩으로 된 파일을 UTF-8로 변환하려면 다음과
+같이 하면 됩니다
 
 
     perl -Mencoding=euc-kr,STDOUT,utf8 -pe1  < file.euckr > file.utf8
 
-����ȯ�� ������ ���� �� �� �ֽ��ϴ�
+역변환은 다음과 같이 할 수 있습니다
 
     perl -Mencoding=utf8,STDOUT,euc-kr -pe1  < file.utf8  > file.euckr
 
-  �̷� ��ȯ�� ���� ���ϰ� �� �� �ֵ��� Encode ������ �Ἥ 
-�����ϰ� Perl�θ� ���� piconv�� Perl�� ���� �ֽ��ϴ�.
-�� �̸����� �� �� �ֵ��� piconv�� Unix�� �ִ� iconv��
-�𵨷� �� ���Դϴ�. �� �������� �Ʒ��� �����ϴ�.
+이런 변환을 좀더 편리하게 할 수 있도록 Encode 모듈을 써서 
+순수하게 Perl로만 쓰인 piconv가 Perl에 들어 있습니다.
+그 이름에서 알 수 있듯이 piconv는 Unix에 있는 iconv를
+모델로 한 것입니다. 그 사용법은 아래와 같습니다.
 
    piconv -f euc-kr -t utf8 < file.euckr > file.utf8
    piconv -f utf8 -t euc-kr < file.utf8 > file.euckr
 
-  ��, 'PerlIO::encoding' ������ �Ἥ �ѱ��� ���ڵ��� ���鼭 ���� ����
-(����Ʈ ������ �ƴ϶�) ó���� ���� �� �� �ֽ��ϴ�.
+또, 'PerlIO::encoding' 모듈을 써서 한국어 인코딩을 쓰면서 글자 단위
+(바이트 단위가 아니라) 처리를 쉽게 할 수 있습니다.
 
   #!/path/to/perl 
 
   use encoding 'euc-kr', STDIN => 'euc-kr',
                          STDOUT-> 'euc-kr', STDERR=>'euc-kr';
 
-  print length("����");        # 2  (ū ����ǥ�� ���� ���� ó���� ����)
-  print length('����');        # 4  (���� ����ǥ�� ����Ʈ ���� ó���� ����)
-  print index("�Ѱ�, �뵿��", "��");   # -1 ('��'�� ����)
-  print index('�Ѱ�, �뵿��', '��');   # 7 (8��°�� 9��° ����Ʈ�� '��'��
-                                            �ڵ尪�� ��ġ��.)
+  print length("가나");        # 2  (큰 따옴표는 글자 단위 처리를 지시)
+  print length('가나');        # 4  (작은 따옴표는 바이트 단위 처리를 지시)
+  print index("한강, 대동강", "염");   # -1 ('염'이 없음)
+  print index('한강, 대동강', '염');   # 7 (8번째와 9번째 바이트가 '염'의
+                                            코드값과 일치함.)
 
 
-=head2 �� �ڼ��� �˰� ������...
+=head2 더 자세히 알고 싶으면...
 
-  Perl�� ��ġ�ϸ�  ������ �ڼ��� ������ ���� ���� ����, �� ������ ����
-Perl ���� �� �ƴ϶� �����ڵ� ����, Encode�� ������ �\efe1 ���� ����
-���� �� �ֽ��ϴ�.  ���� �� ������ ���� ���� ������ ���� �ֽ��ϴ�.
+Perl을 설치하면  대단히 자세한 문서가 같이 따라 오며, 이 문서를 통해
+Perl 전반 뿐 아니라 유니코드 지원, Encode의 사용법 등에 많은 것을
+배울 수 있습니다.  아직 이 문서는 현재 모두 영어로 쓰여 있습니다.
 
 
-=head2 Perl ���� �ڷ�
+=head2 Perl 관련 자료
 
-������ ������  ���� �ܿ��� ������ ���� �ڷᰡ �ֽ��ϴ�. �� ������ ����
-������ ���� �ƴϰ� �Ϻ� ��ǥ���� �͸� ���� ���Դϴ�.
+위에서 언급한  문서 외에도 다음과 같은 자료가 있습니다. 이 목록은 결코
+완전한 것이 아니고 일부 대표적인 것만 모은 것입니다.
 
 =over 4
 
 =item L<http://www.perl.com/>          
 
-   O'Reilly�� Perl �� ������ 
+   O'Reilly의 Perl 웹 페이지 
 
 =item L<http://www.cpan.org/>
 
@@ -140,57 +134,57 @@ Perl 
 
 =item L<http://lists.perl.org/>        
 
-  Perl ���ϸ� ����Ʈ. ���� ����Ʈ ���\ed65
-  perl-unicode���� 'Encode'�� ���� ������.
+  Perl 메일링 리스트. 많은 리스트 가운데
+  perl-unicode에서 'Encode'에 대해 논의함.
 
 =back
 
-=head2 Perl�� �� ���� �����ϴµ� ������ �� �� �ִ� �ѱ��� ���� ����Ʈ
+=head2 Perl을 더 깊게 공부하는데 도움을 줄 수 있는 한국어 관련 사이트
 
 =over 4
 
 =item L<http://www.perl.or.kr/>
 
-  Perl �ѱ� ������ ���� 
+  Perl 한국 사용자 모임 
 
 =item L<news:han.comp.lang.perl/>
 
-  �ѱ��� Perl ���� �׷�
+  한국어 Perl 뉴스 그룹
 
 =item L<http://www.hanb.co.kr/search/searchResult.html?keyword=perl>
 
-  O'Reilly���� ���� �ѱ��� Perl ���� ����
+  O'Reilly에서 나온 한국어 Perl 서적 목록
 
 =item L<http://www.perlschool.net/>
 
-  Perl ���� ���� �� �ҽ�, �ֱ� ����, ���� �ؿ� ����Ʈ ��ũ 
+  Perl 기초 강좌 및 소스, 최근 동향, 관련 해외 사이트 링크 
 
 =item L<http://www.perl.co.kr>
 
-  Perl�� ���õ� CGI, DB, ���� �\efe1 ����  ���� �� ���� ����
+  Perl에 관련된 CGI, DB, 연동 등에 대한  정보 및 뉴스 제공
 
 =back 
 
-=head2 �����ڵ� �� �ѱ��� ���ڵ� ���� �ڷ�
+=head2 유니코드 및 한국어 인코딩 관련 자료
 
 =over 4
 
 =item L<http://www.unicode.org/>
 
-  �����ڵ� ���ҽþ�.  
+  유니코드 컨소시엄.  
 
 =item L<http://std.dkuug.dk/JTC1/SC2/WG2>
 
-�⺻������ Unicode�� ���� ISO ǥ����  ISO/IEC 10646 UCS(Universal
-Character Set)�� ������  ISO/IEC JTC1/SC2/WG2�� �� ������
+기본적으로 Unicode와 같은 ISO 표준인  ISO/IEC 10646 UCS(Universal
+Character Set)을 만드는  ISO/IEC JTC1/SC2/WG2의 웹 페이지
 
 =item L<http://www.cl.cam.ac.uk/~mgk25/unicode.html>
 
-  ���н�/���������� �����ڵ��� UTF-8 ���뿡 ���� ������(FAQ)
+  유닉스/리눅스에서 유니코드와 UTF-8 사용에 대한 문답집(FAQ)
 
 =item L<http://wiki.kldp.org/Translations/html/UTF8-Unicode-KLDP/UTF8-Unicode-KLDP.html>
 
-  ���н�/���������� �����ڵ��� UTF-8 ���뿡 ���� ������(FAQ)��  �ѱ��� ����
+  유닉스/리눅스에서 유니코드와 UTF-8 사용에 대한 문답집(FAQ)의  한국어 번역
 
 =back
 
@@ -202,6 +196,6 @@ L<Encode>, L<Encode::KR>, L<encoding>, L<perluniintro>, L<perlunicode>
 =head1 AUTHORS
 
 Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt>
-������ E<lt>jshin@mailaps.orgE<gt>
+신정식 E<lt>jshin@mailaps.orgE<gt>
 
 =cut
index 4e029d9..2a4dcf5 100644 (file)
--- a/README.tw
+++ b/README.tw
@@ -1,15 +1,9 @@
-If you read this file _as_is_, just ignore the funny characters you
-see. It is written in the POD format (see perlpod manpage) which is
-specially designed to be readable as is.
-
-The following documentation is written in UTF-8 encoding.
+=encoding utf8
 
 如果你用一般的文字編輯器閱覽這份文件, 請忽略文中奇特的註記字符.
 這份文件是以 POD (簡明文件格式) 寫成; 這種格式是為了能讓人直接讀取,
 而特別設計的. 關於此格式的進一步資訊, 請參考 perlpod 線上文件.
 
-=encoding UTF-8
-
 =head1 NAME
 
 perltw - 正體中文 Perl 指南