1 If you read this file _as_is_, just ignore the funny characters you
2 see. It is written in the POD format (see perlpod manpage) which is
3 specially designed to be readable as is.
5 The following documentation is written in EUC-CN encoding.
7 ��������һ�������ֱ༭�����������ļ�, �������������ص�ע���ַ�.
8 �����ļ����� POD (�����ļ���ʽ) д��; ���ָ�ʽ��Ϊ��������ֱ���Ķ�,
9 ���ر����Ƶ�. ���ڴ˸�ʽ�Ľ�һ����Ϣ, ���ο� perlpod �����ļ�.
15 perlcn - �������� Perl ָ��
21 �� 5.8.0 �濪ʼ, Perl �߱������Ƶ� Unicode (ͳһ��) ֧Ԯ,
22 Ҳ����֧Ԯ������������ϵ�����ı��뷽ʽ; CJK (���պ�) �������е�һ����.
23 Unicode �ǹ����Եı�, ��ͼ�������������е��ַ�: ��������, ��������,
24 �Լ�������һ�� (ϣ����, ��������, ��������, ϣ������, ӡ����,
25 ӡ�ذ���, �ȵ�). ��Ҳ�����˶�����ҵϵͳ��ƽ̨ (�� PC ��������).
27 Perl ������ Unicode ���в���. ����ʾ Perl �ڲ����ַ������ݿ��� Unicode
28 ��ʾ; Perl �ĺ�ʽ������ (����������ʾʽ�ȶ�) Ҳ�ܶ� Unicode ���в���.
29 �����뼰����ʱ, Ϊ�˴����� Unicode ֮ǰ�ı��뷽ʽ���ŵ�����, Perl
30 �ṩ�� Encode ����ģ��, �����������ض�ȡ��д�����еı�������.
32 Encode ����ģ��֧Ԯ���м������ĵı��뷽ʽ ('gb2312' ��ʾ 'euc-cn'):
34 euc-cn Unix �����ַ���, Ҳ�����׳ƵĹ�����
35 gb2312-raw δ�������� (�ͱ���) GB2312 �ַ���
36 gb12345 δ���������й��÷������ı���
37 iso-ir-165 GB2312 + GB6345 + GB8565 + �����ַ�
38 cp936 ����ҳ 936, Ҳ������ 'GBK' (����������) ָ��
39 hz 7 �����ݳ�ʽ GB2312 ����
41 ������˵, �� EUC-CN �����ĵ���ת�� Unicode, ������������ָ��:
43 perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8
45 Perl Ҳ�ڸ��� "piconv", һ֧��ȫ�� Perl д�ɵ��ַ�ת�����߳���, �÷�����:
47 piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
48 piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn
50 ����, ���� encoding ģ��, ����������д�����ַ�Ϊ��λ�ij�����, ������ʾ:
53 # ���� euc-cn �ִ�����; �������뼰����������Ϊ euc-cn ����
54 use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn';
55 print length("����"); # 2 (˫���ű�ʾ�ַ�)
56 print length('����'); # 4 (�����ű�ʾ�ֽ�)
57 print index("�̻�", "��"); # -1 (�����������ַ���)
58 print index('�̻�', '��'); # 1 (�ӵڶ����ֽڿ�ʼ)
60 ������һ��������, "" �ĵڶ����ֽ��� "" �ĵ�һ���ֽڽ��ϳ� EUC-CN
61 ���� "��"; "" �ĵڶ����ֽ����� "��" �ĵ�һ���ֽڽ��ϳ� "��".
62 ����������ǰ EUC-CN ���ȶԴ����ϳ���������.
66 ������Ҫ���������ı���, ���Դ� CPAN (L<http://www.cpan.org/>) ����
67 Encode::HanExtra ģ��. ��Ŀǰ�ṩ���б��뷽ʽ:
69 gb18030 ������������, ������������
71 ����, Encode::HanConvert ģ�����ṩ�˼���ת���õ����ֱ���:
73 big5-simp Big5 ���������� Unicode �������Ļ�ת
74 gbk-trad GBK ���������� Unicode �������Ļ�ת
76 ������ GBK �� Big5 ֮�以ת, ���ο���ģ���ڸ��� b2g.pl �� g2b.pl ��֧����,
79 use Encode::HanConvert;
80 $euc_cn = big5_to_gb($big5); # �� Big5 תΪ GBK
81 $big5 = gb_to_big5($euc_cn); # �� GBK תΪ Big5
85 ���ο� Perl �ڸ��Ĵ���˵���ļ� (����ȫ����Ӣ��д��), ��ѧϰ��������
86 Perl ��֪ʶ, �Լ� Unicode ��ʹ�÷�ʽ. ����, �ⲿ����Դ�൱�ḻ:
88 =head2 �ṩ Perl ��Դ����ַ
92 =item L<http://www.perl.com/>
94 Perl ����ҳ (��ŷ������˾ά��)
96 =item L<http://www.cpan.org/>
98 Perl �ۺϵ����� (Comprehensive Perl Archive Network)
100 =item L<http://lists.perl.org/>
110 =item L<http://www.oreilly.com.cn/indexcat.php?c=perl>
112 �������İ���ŷ���� Perl ����
120 =item L<http://www.pm.org/groups/asia.html>
126 =head2 Unicode ������ַ
130 =item L<http://www.unicode.org/>
132 Unicode ѧ��ѧ�� (Unicode �����ƶ���)
134 =item L<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
136 Unix/Linux �ϵ� UTF-8 �� Unicode ������
142 L<Encode>, L<Encode::CN>, L<encoding>, L<perluniintro>, L<perlunicode>
146 Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt>
148 Audrey Tang (�Ʒ�) E<lt>audreyt@audreyt.orgE<gt>