This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
amigaos4: flock unimplemented
[perl5.git] / cpan / Unicode-Normalize / t / norm.t
1
2 BEGIN {
3     unless ('A' eq pack('U', 0x41)) {
4         print "1..0 # Unicode::Normalize cannot pack a Unicode code point\n";
5         exit 0;
6     }
7     unless (0x41 == unpack('U', 'A')) {
8         print "1..0 # Unicode::Normalize cannot get a Unicode code point\n";
9         exit 0;
10     }
11 }
12
13 BEGIN {
14     if ($ENV{PERL_CORE}) {
15         chdir('t') if -d 't';
16         @INC = $^O eq 'MacOS' ? qw(::lib) : qw(../lib);
17     }
18 }
19
20 #########################
21
22 use strict;
23 use warnings;
24 BEGIN { $| = 1; print "1..64\n"; }
25 my $count = 0;
26 sub ok ($;$) {
27     my $p = my $r = shift;
28     if (@_) {
29         my $x = shift;
30         $p = !defined $x ? !defined $r : !defined $r ? 0 : $r eq $x;
31     }
32     print $p ? "ok" : "not ok", ' ', ++$count, "\n";
33 }
34
35 use Unicode::Normalize qw(normalize);
36
37 ok(1);
38
39 sub _pack_U   { Unicode::Normalize::pack_U(@_) }
40 sub _unpack_U { Unicode::Normalize::unpack_U(@_) }
41
42 #########################
43
44 ok(normalize('D', ""), "");
45 ok(normalize('C', ""), "");
46 ok(normalize('KD',""), "");
47 ok(normalize('KC',""), "");
48
49 ok(normalize('D', "A"), "A");
50 ok(normalize('C', "A"), "A");
51 ok(normalize('KD',"A"), "A");
52 ok(normalize('KC',"A"), "A");
53
54 ok(normalize('NFD', ""), "");
55 ok(normalize('NFC', ""), "");
56 ok(normalize('NFKD',""), "");
57 ok(normalize('NFKC',""), "");
58
59 ok(normalize('NFD', "A"), "A");
60 ok(normalize('NFC', "A"), "A");
61 ok(normalize('NFKD',"A"), "A");
62 ok(normalize('NFKC',"A"), "A");
63
64 # 17
65
66 # don't modify the source
67 my $sNFD = "\x{FA19}";
68 ok(normalize('NFD', $sNFD), "\x{795E}");
69 ok($sNFD, "\x{FA19}");
70
71 my $sNFC = "\x{FA1B}";
72 ok(normalize('NFC', $sNFC), "\x{798F}");
73 ok($sNFC, "\x{FA1B}");
74
75 my $sNFKD = "\x{FA1E}";
76 ok(normalize('NFKD', $sNFKD), "\x{7FBD}");
77 ok($sNFKD, "\x{FA1E}");
78
79 my $sNFKC = "\x{FA26}";
80 ok(normalize('NFKC', $sNFKC), "\x{90FD}");
81 ok($sNFKC, "\x{FA26}");
82
83 # 25
84
85 sub hexNFC {
86   join " ", map sprintf("%04X", $_),
87   _unpack_U normalize 'C', _pack_U map hex, split ' ', shift;
88 }
89 sub hexNFD {
90   join " ", map sprintf("%04X", $_),
91   _unpack_U normalize 'D', _pack_U map hex, split ' ', shift;
92 }
93
94 ok(hexNFD("1E14 AC01"), "0045 0304 0300 1100 1161 11A8");
95 ok(hexNFD("AC00 AE00"), "1100 1161 1100 1173 11AF");
96
97 ok(hexNFC("0061 0315 0300 05AE 05C4 0062"), "00E0 05AE 05C4 0315 0062");
98 ok(hexNFC("00E0 05AE 05C4 0315 0062"),      "00E0 05AE 05C4 0315 0062");
99 ok(hexNFC("0061 05AE 0300 05C4 0315 0062"), "00E0 05AE 05C4 0315 0062");
100 ok(hexNFC("0045 0304 0300 AC00 11A8"), "1E14 AC01");
101 ok(hexNFC("1100 1161 1100 1173 11AF"), "AC00 AE00");
102 ok(hexNFC("1100 0300 1161 1173 11AF"), "1100 0300 1161 1173 11AF");
103
104 ok(hexNFD("0061 0315 0300 05AE 05C4 0062"), "0061 05AE 0300 05C4 0315 0062");
105 ok(hexNFD("00E0 05AE 05C4 0315 0062"),      "0061 05AE 0300 05C4 0315 0062");
106 ok(hexNFD("0061 05AE 0300 05C4 0315 0062"), "0061 05AE 0300 05C4 0315 0062");
107 ok(hexNFC("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062");
108 ok(hexNFC("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062");
109 ok(hexNFD("0061 05C4 0315 0300 05AE 0062"), "0061 05AE 05C4 0300 0315 0062");
110 ok(hexNFD("0061 05AE 05C4 0300 0315 0062"), "0061 05AE 05C4 0300 0315 0062");
111 ok(hexNFC("0000 0041 0000 0000"), "0000 0041 0000 0000");
112 ok(hexNFD("0000 0041 0000 0000"), "0000 0041 0000 0000");
113
114 ok(hexNFC("AC00 11A7"), "AC00 11A7");
115 ok(hexNFC("AC00 11A8"), "AC01");
116 ok(hexNFC("AC00 11A9"), "AC02");
117 ok(hexNFC("AC00 11C2"), "AC1B");
118 ok(hexNFC("AC00 11C3"), "AC00 11C3");
119
120 # 47
121
122 # Test Cases from Public Review Issue #29: Normalization Issue
123 # cf. http://www.unicode.org/review/pr-29.html
124 ok(hexNFC("0B47 0300 0B3E"), "0B47 0300 0B3E");
125 ok(hexNFC("1100 0300 1161"), "1100 0300 1161");
126 ok(hexNFC("0B47 0B3E 0300"), "0B4B 0300");
127 ok(hexNFC("1100 1161 0300"), "AC00 0300");
128 ok(hexNFC("0B47 0300 0B3E 0327"), "0B47 0300 0B3E 0327");
129 ok(hexNFC("1100 0300 1161 0327"), "1100 0300 1161 0327");
130
131 ok(hexNFC("0300 0041"), "0300 0041");
132 ok(hexNFC("0300 0301 0041"), "0300 0301 0041");
133 ok(hexNFC("0301 0300 0041"), "0301 0300 0041");
134 ok(hexNFC("0000 0300 0000 0301"), "0000 0300 0000 0301");
135 ok(hexNFC("0000 0301 0000 0300"), "0000 0301 0000 0300");
136
137 ok(hexNFC("0327 0061 0300"), "0327 00E0");
138 ok(hexNFC("0301 0061 0300"), "0301 00E0");
139 ok(hexNFC("0315 0061 0300"), "0315 00E0");
140 ok(hexNFC("0000 0327 0061 0300"), "0000 0327 00E0");
141 ok(hexNFC("0000 0301 0061 0300"), "0000 0301 00E0");
142 ok(hexNFC("0000 0315 0061 0300"), "0000 0315 00E0");
143
144 # 64
145