PATCH: [perl #114220] /\h/ not equiv to /[\h]/
[perl.git] / README.cn
1 If you read this file _as_is_, just ignore the funny characters you
2 see. It is written in the POD format (see perlpod manpage) which is
3 specially designed to be readable as is.
4
5 The following documentation is written in EUC-CN encoding.
6
7 ��������һ�������ֱ༭�����������ļ�, �������������ص�ע���ַ�.
8 �����ļ����� POD (�����ļ���ʽ) д��; ���ָ�ʽ��Ϊ��������ֱ���Ķ�,
9 ���ر����Ƶ�. ���ڴ˸�ʽ�Ľ�һ����Ϣ, ���ο� perlpod �����ļ�.
10
11 =encoding euc-cn
12
13 =head1 NAME
14
15 perlcn - �������� Perl ָ��
16
17 =head1 DESCRIPTION
18
19 ��ӭ���� Perl ������!
20
21 �� 5.8.0 �濪ʼ, Perl �߱������Ƶ� Unicode (ͳһ��) ֧Ԯ,
22 Ҳ����֧Ԯ������������ϵ�����ı��뷽ʽ; CJK (���պ�) �������е�һ����.
23 Unicode �ǹ����Եı�׼, ��ͼ�������������е��ַ�: ��������, ��������,
24 �Լ����߼���һ�� (ϣ����, ��������, ��������, ϣ������, ӡ����,
25 ӡ�ذ���, �ȵ�). ��Ҳ�����˶�����ҵϵͳ��ƽ̨ (�� PC ��������).
26
27 Perl ������ Unicode ���в���. ����ʾ Perl �ڲ����ַ������ݿ��� Unicode
28 ��ʾ; Perl �ĺ�ʽ������ (����������ʾʽ�ȶ�) Ҳ�ܶ� Unicode ���в���.
29 �����뼰����ʱ, Ϊ�˴����� Unicode ֮ǰ�ı��뷽ʽ���ŵ�����, Perl
30 �ṩ�� Encode ����ģ��, �����������׵ض�ȡ��д�����еı�������.
31
32 Encode ����ģ��֧Ԯ���м������ĵı��뷽ʽ ('gb2312' ��ʾ 'euc-cn'):
33
34     euc-cn      Unix �����ַ���, Ҳ�����׳ƵĹ�����
35     gb2312-raw  δ�������� (�ͱ���) GB2312 �ַ���
36     gb12345     δ���������й��÷������ı���
37     iso-ir-165  GB2312 + GB6345 + GB8565 + �����ַ�
38     cp936       ����ҳ 936, Ҳ������ 'GBK' (����������) ָ��
39     hz          7 �����ݳ�ʽ GB2312 ����
40
41 ������˵, �� EUC-CN �����ĵ���ת�� Unicode, ������������ָ��:
42
43     perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8
44
45 Perl Ҳ�ڸ��� "piconv", һ֧��ȫ�� Perl д�ɵ��ַ�ת�����߳���, �÷�����:
46
47     piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
48     piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn
49
50 ����, ���� encoding ģ��, ����������д�����ַ�Ϊ��λ�ij�����, ������ʾ:
51
52     #!/usr/bin/env perl
53     # ���� euc-cn �ִ�����; ��׼�����뼰��׼��������Ϊ euc-cn ����
54     use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn';
55     print length("����");            #  2 (˫���ű�ʾ�ַ�)
56     print length('����');            #  4 (�����ű�ʾ�ֽ�)
57     print index("׻׻�̻�", "�׻�"); # -1 (�����������ַ���)
58     print index('׻׻�̻�', '�׻�'); #  1 (�ӵڶ����ֽڿ�ʼ)
59
60 ������һ��������, "׻" �ĵڶ����ֽ��� "׻" �ĵ�һ���ֽڽ��ϳ� EUC-CN
61 ���� "��"; "׻" �ĵڶ����ֽ����� "��" �ĵ�һ���ֽڽ��ϳ� "��".
62 ����������ǰ EUC-CN ���ȶԴ����ϳ���������.
63
64 =head2 ���������ı���
65
66 ������Ҫ���������ı���, ���Դ� CPAN (L<http://www.cpan.org/>) ����
67 Encode::HanExtra ģ��. ��Ŀǰ�ṩ���б��뷽ʽ:
68
69     gb18030     �������Ĺ�����, ������������
70
71 ����, Encode::HanConvert ģ�����ṩ�˼���ת���õ����ֱ���:
72
73     big5-simp   Big5 ���������� Unicode �������Ļ�ת
74     gbk-trad    GBK ���������� Unicode �������Ļ�ת
75
76 ������ GBK �� Big5 ֮�以ת, ���ο���ģ���ڸ��� b2g.pl �� g2b.pl ��֧����,
77 ���ڳ�����ʹ������д��:
78
79     use Encode::HanConvert;
80     $euc_cn = big5_to_gb($big5); # �� Big5 תΪ GBK
81     $big5 = gb_to_big5($euc_cn); # �� GBK תΪ Big5
82
83 =head2 ��һ������Ϣ
84
85 ���ο� Perl �ڸ��Ĵ���˵���ļ� (����ȫ����Ӣ��д��), ��ѧϰ��������
86 Perl ��֪ʶ, �Լ� Unicode ��ʹ�÷�ʽ. ����, �ⲿ����Դ�൱�ḻ:
87
88 =head2 �ṩ Perl ��Դ����ַ
89
90 =over 4
91
92 =item L<http://www.perl.com/>
93
94 Perl ����ҳ (��ŷ������˾ά��)
95
96 =item L<http://www.cpan.org/>
97
98 Perl �ۺϵ����� (Comprehensive Perl Archive Network)
99
100 =item L<http://lists.perl.org/>
101
102 Perl �ʵ���̳һ��
103
104 =back
105
106 =head2 ѧϰ Perl ����ַ
107
108 =over 4
109
110 =item L<http://www.oreilly.com.cn/index.php?func=booklist&cat=68>
111
112 �������İ���ŷ���� Perl ����
113
114 =back
115
116 =head2 Perl ʹ���߼���
117
118 =over 4
119
120 =item L<http://www.pm.org/groups/asia.html>
121
122 �й� Perl �ƹ���һ��
123
124 =back
125
126 =head2 Unicode ������ַ
127
128 =over 4
129
130 =item L<http://www.unicode.org/>
131
132 Unicode ѧ��ѧ�� (Unicode ��׼���ƶ���)
133
134 =item L<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>
135
136 Unix/Linux �ϵ� UTF-8 �� Unicode ������
137
138 =back
139
140 =head1 SEE ALSO
141
142 L<Encode>, L<Encode::CN>, L<encoding>, L<perluniintro>, L<perlunicode>
143
144 =head1 AUTHORS
145
146 Jarkko Hietaniemi E<lt>jhi@iki.fiE<gt>
147
148 Audrey Tang (�Ʒ�) E<lt>audreyt@audreyt.orgE<gt>
149
150 =cut