This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Make pp_reverse fetch the lexical $_ from the correct pad
[perl5.git] / lib / charnames.t
1 #!./perl
2
3 my @WARN;
4
5 BEGIN {
6     unless(grep /blib/, @INC) {
7         chdir 't' if -d 't';
8         @INC = '../lib';
9         require './test.pl';
10     }
11     $SIG{__WARN__} = sub { push @WARN, @_ };
12 }
13
14 require File::Spec;
15
16 $| = 1;
17
18 print "1..81\n";
19
20 use charnames ':full';
21
22 print "not " unless "Here\N{EXCLAMATION MARK}?" eq "Here!?";
23 print "ok 1\n";
24
25 {
26   use bytes;                    # TEST -utf8 can switch utf8 on
27
28   print "# \$res=$res \$\@='$@'\nnot "
29     if $res = eval <<'EOE'
30 use charnames ":full";
31 "Here: \N{CYRILLIC SMALL LETTER BE}!";
32 1
33 EOE
34       or $@ !~ /above 0xFF/;
35   print "ok 2\n";
36   # print "# \$res=$res \$\@='$@'\n";
37
38   print "# \$res=$res \$\@='$@'\nnot "
39     if $res = eval <<'EOE'
40 use charnames 'cyrillic';
41 "Here: \N{Be}!";
42 1
43 EOE
44       or $@ !~ /CYRILLIC CAPITAL LETTER BE.*above 0xFF/;
45   print "ok 3\n";
46 }
47
48 # If octal representation of unicode char is \0xyzt, then the utf8 is \3xy\2zt
49 if (ord('A') == 65) { # as on ASCII or UTF-8 machines
50     $encoded_be = "\320\261";
51     $encoded_alpha = "\316\261";
52     $encoded_bet = "\327\221";
53     $encoded_deseng = "\360\220\221\215";
54 }
55 else { # EBCDIC where UTF-EBCDIC may be used (this may be 1047 specific since
56        # UTF-EBCDIC is codepage specific)
57     $encoded_be = "\270\102\130";
58     $encoded_alpha = "\264\130";
59     $encoded_bet = "\270\125\130";
60     $encoded_deseng = "\336\102\103\124";
61 }
62
63 sub to_bytes {
64     unpack"U0a*", shift;
65 }
66
67 {
68   use charnames ':full';
69
70   print "not " unless to_bytes("\N{CYRILLIC SMALL LETTER BE}") eq $encoded_be;
71   print "ok 4\n";
72
73   use charnames qw(cyrillic greek :short);
74
75   print "not " unless to_bytes("\N{be},\N{alpha},\N{hebrew:bet}")
76     eq "$encoded_be,$encoded_alpha,$encoded_bet";
77   print "ok 5\n";
78 }
79
80 {
81     use charnames ':full';
82     print "not " unless "\x{263a}" eq "\N{WHITE SMILING FACE}";
83     print "ok 6\n";
84     print "not " unless length("\x{263a}") == 1;
85     print "ok 7\n";
86     print "not " unless length("\N{WHITE SMILING FACE}") == 1;
87     print "ok 8\n";
88     print "not " unless sprintf("%vx", "\x{263a}") eq "263a";
89     print "ok 9\n";
90     print "not " unless sprintf("%vx", "\N{WHITE SMILING FACE}") eq "263a";
91     print "ok 10\n";
92     print "not " unless sprintf("%vx", "\xFF\N{WHITE SMILING FACE}") eq "ff.263a";
93     print "ok 11\n";
94     print "not " unless sprintf("%vx", "\x{ff}\N{WHITE SMILING FACE}") eq "ff.263a";
95     print "ok 12\n";
96 }
97
98 {
99    use charnames qw(:full);
100    use utf8;
101
102     my $x = "\x{221b}";
103     my $named = "\N{CUBE ROOT}";
104
105     print "not " unless ord($x) == ord($named);
106     print "ok 13\n";
107 }
108
109 {
110    use charnames qw(:full);
111    use utf8;
112    print "not " unless "\x{100}\N{CENT SIGN}" eq "\x{100}"."\N{CENT SIGN}";
113    print "ok 14\n";
114 }
115
116 {
117   use charnames ':full';
118
119   print "not "
120       unless to_bytes("\N{DESERET SMALL LETTER ENG}") eq $encoded_deseng;
121   print "ok 15\n";
122 }
123
124 {
125   # 20001114.001
126
127   no utf8; # naked Latin-1
128
129   if (ord("Ä") == 0xc4) { # Try to do this only on Latin-1.
130       use charnames ':full';
131       my $text = "\N{LATIN CAPITAL LETTER A WITH DIAERESIS}";
132       print "not " unless $text eq "\xc4" && ord($text) == 0xc4;
133       print "ok 16\n";
134   } else {
135       print "ok 16 # Skip: not Latin-1\n";
136   }
137 }
138
139 {
140     print "not " unless charnames::viacode(0x1234) eq "ETHIOPIC SYLLABLE SEE";
141     print "ok 17\n";
142
143     # Unused Hebrew.
144     print "not " if defined charnames::viacode(0x0590);
145     print "ok 18\n";
146 }
147
148 {
149     print "not " unless
150         sprintf("%04X", charnames::vianame("GOTHIC LETTER AHSA")) eq "10330";
151     print "ok 19\n";
152
153     print "not " if
154         defined charnames::vianame("NONE SUCH");
155     print "ok 20\n";
156 }
157
158 {
159     # check that caching at least hasn't broken anything
160
161     print "not " unless charnames::viacode(0x1234) eq "ETHIOPIC SYLLABLE SEE";
162     print "ok 21\n";
163
164     print "not " unless
165         sprintf("%04X", charnames::vianame("GOTHIC LETTER AHSA")) eq "10330";
166     print "ok 22\n";
167
168 }
169
170 print "not " unless "\N{CHARACTER TABULATION}" eq "\t";
171 print "ok 23\n";
172
173 print "not " unless "\N{ESCAPE}" eq "\e";
174 print "ok 24\n";
175
176 print "not " unless "\N{NULL}" eq "\c@";
177 print "ok 25\n";
178
179 print "not " unless "\N{LINE FEED (LF)}" eq "\n";
180 print "ok 26\n";
181
182 print "not " unless "\N{LINE FEED}" eq "\n";
183 print "ok 27\n";
184
185 print "not " unless "\N{LF}" eq "\n";
186 print "ok 28\n";
187
188 my $nel = ord("A") == 193 ? qr/^(?:\x15|\x25)$/ : qr/^\x85$/;
189
190 print "not " unless "\N{NEXT LINE (NEL)}" =~ $nel;
191 print "ok 29\n";
192
193 print "not " unless "\N{NEXT LINE}" =~ $nel;
194 print "ok 30\n";
195
196 print "not " unless "\N{NEL}" =~ $nel;
197 print "ok 31\n";
198
199 print "not " unless "\N{BYTE ORDER MARK}" eq chr(0xFEFF);
200 print "ok 32\n";
201
202 print "not " unless "\N{BOM}" eq chr(0xFEFF);
203 print "ok 33\n";
204
205 {
206     use warnings 'deprecated';
207
208     print "not " unless "\N{HORIZONTAL TABULATION}" eq "\t";
209     print "ok 34\n";
210
211     print "not " unless grep { /"HORIZONTAL TABULATION" is deprecated/ } @WARN;
212     print "ok 35\n";
213
214     no warnings 'deprecated';
215
216     print "not " unless "\N{VERTICAL TABULATION}" eq "\013";
217     print "ok 36\n";
218
219     print "not " if grep { /"VERTICAL TABULATION" is deprecated/ } @WARN;
220     print "ok 37\n";
221 }
222
223 print "not " unless charnames::viacode(0xFEFF) eq "ZERO WIDTH NO-BREAK SPACE";
224 print "ok 38\n";
225
226 {
227     use warnings;
228     print "not " unless ord("\N{BOM}") == 0xFEFF;
229     print "ok 39\n";
230 }
231
232 print "not " unless ord("\N{ZWNJ}") == 0x200C;
233 print "ok 40\n";
234
235 print "not " unless ord("\N{ZWJ}") == 0x200D;
236 print "ok 41\n";
237
238 print "not " unless "\N{U+263A}" eq "\N{WHITE SMILING FACE}";
239 print "ok 42\n";
240
241 {
242     print "not " unless
243         0x3093 == charnames::vianame("HIRAGANA LETTER N");
244     print "ok 43\n";
245
246     print "not " unless
247         0x0397 == charnames::vianame("GREEK CAPITAL LETTER ETA");
248     print "ok 44\n";
249 }
250
251 print "not " if defined charnames::viacode(0x110000);
252 print "ok 45\n";
253
254 print "not " if grep { /you asked for U+110000/ } @WARN;
255 print "ok 46\n";
256
257 print "not " unless "NULL" eq charnames::viacode(0);
258 print "ok 47\n";
259
260
261 # ---- Alias extensions
262
263 my $alifile = File::Spec->catfile(File::Spec->updir, qw(lib unicore xyzzy_alias.pl));
264 my $i = 0;
265
266 my @prgs;
267 {   local $/ = undef;
268     @prgs = split "\n########\n", <DATA>;
269     }
270
271 my $i = 47;
272 for (@prgs) {
273     my ($code, $exp) = ((split m/\nEXPECT\n/), '$');
274     my ($prog, $fil) = ((split m/\nFILE\n/, $code), "");
275     my $tmpfile = tempfile();
276     open my $tmp, "> $tmpfile" or die "Could not open $tmpfile: $!";
277     print $tmp $prog, "\n";
278     close $tmp or die "Could not close $tmpfile: $!";
279     if ($fil) {
280         $fil .= "\n";
281         open my $ali, "> $alifile" or die "Could not open $alifile: $!";
282         print $ali $fil;
283         close $ali or die "Could not close $alifile: $!";
284         }
285     my $res = runperl( switches => $switch, 
286                        progfile => $tmpfile,
287                        stderr => 1 );
288     my $status = $?;
289     $res =~ s/[\r\n]+$//;
290     $res =~ s/tmp\d+/-/g;                       # fake $prog from STDIN
291     $res =~ s/\n%[A-Z]+-[SIWEF]-.*$//           # clip off DCL status msg
292         if $^O eq "VMS";
293     $exp =~ s/[\r\n]+$//;
294     my $pfx = ($res =~ s/^PREFIX\n//);
295     my $rexp = qr{^$exp};
296     if ($res =~ s/^SKIPPED\n//) {
297         print "$results\n";
298         }
299     elsif (($pfx and $res !~ /^\Q$expected/) or
300           (!$pfx and $res !~ $rexp)) {
301         print STDERR
302             "PROG:\n$prog\n",
303             "FILE:\n$fil",
304             "EXPECTED:\n$exp\n",
305             "GOT:\n$res\n";
306         print "not ";
307         }
308     print "ok ", ++$i, "\n";
309     $fil or next;
310     1 while unlink $alifile;
311     }
312
313 # [perl #30409] charnames.pm clobbers default variable
314 $_ = 'foobar';
315 eval "use charnames ':full';";
316 print "not " unless $_ eq 'foobar';
317 print "ok 75\n";
318
319 # Unicode slowdown noted by Phil Pennock, traced to a bug fix in index
320 # SADAHIRO Tomoyuki's suggestion is to ensure that the UTF-8ness of both
321 # arguments are indentical before calling index.
322 # To do this can take advantage of the fact that unicore/Name.pl is 7 bit
323 # (or at least should be). So assert that that it's true here.
324
325 my $names = do "unicore/Name.pl";
326 print defined $names ? "ok 76\n" : "not ok 76\n";
327 if (ord('A') == 65) { # as on ASCII or UTF-8 machines
328   my $non_ascii = $names =~ tr/\0-\177//c;
329   print $non_ascii ? "not ok 77 # $non_ascii\n" : "ok 77\n";
330 } else {
331   print "ok 77\n";
332 }
333
334 # Verify that charnames propagate to eval("")
335 my $evaltry = eval q[ "Eval: \N{LEFT-POINTING DOUBLE ANGLE QUOTATION MARK}" ];
336 if ($@) {
337     print "# $@not ok 78\nnot ok 79\n";
338 } else {
339     print "ok 78\n";
340     print "not " unless $evaltry eq "Eval: \N{LEFT-POINTING DOUBLE ANGLE QUOTATION MARK}";
341     print "ok 79\n";
342 }
343
344 # Verify that db includes the normative NameAliases.txt names
345 print "not " unless "\N{U+1D0C5}" eq "\N{BYZANTINE MUSICAL SYMBOL FTHORA SKLIRON CHROMA VASIS}";
346 print "ok 80\n";
347
348 # [perl #73174] use of \N{FOO} used to reset %^H
349
350 {
351     use charnames ":full";
352     my $res;
353     BEGIN { $^H{73174} = "foo" }
354     BEGIN { $res = ($^H{73174} // "") }
355     # forces loading of utf8.pm, which used to reset %^H
356     $res .= '-1' if ":" =~ /\N{COLON}/i;
357     BEGIN { $res .= '-' . ($^H{73174} // "") }
358     $res .= '-' . ($^H{73174} // "");
359     $res .= '-2' if ":" =~ /\N{COLON}/;
360     $res .= '-3' if ":" =~ /\N{COLON}/i;
361     print $res eq "foo-foo-1--2-3" ? "" : "not ",
362         "ok 81 - \$^H{foo} correct after /\\N{bar}/i (res=$res)\n";
363 }
364
365 __END__
366 # unsupported pragma
367 use charnames ":scoobydoo";
368 "Here: \N{e_ACUTE}!\n";
369 EXPECT
370 unsupported special ':scoobydoo' in charnames at
371 ########
372 # wrong type of alias (missing colon)
373 use charnames "alias";
374 "Here: \N{e_ACUTE}!\n";
375 EXPECT
376 Unknown charname 'e_ACUTE' at
377 ########
378 # alias without an argument
379 use charnames ":alias";
380 "Here: \N{e_ACUTE}!\n";
381 EXPECT
382 :alias needs an argument in charnames at
383 ########
384 # reversed sequence
385 use charnames ":alias" => ":full";
386 "Here: \N{e_ACUTE}!\n";
387 EXPECT
388 :alias cannot use existing pragma :full \(reversed order\?\) at
389 ########
390 # alias with hashref but no :full
391 use charnames ":alias" => { e_ACUTE => "LATIN SMALL LETTER E WITH ACUTE" };
392 "Here: \N{e_ACUTE}!\n";
393 EXPECT
394 Unknown charname 'LATIN SMALL LETTER E WITH ACUTE' at
395 ########
396 # alias with hashref but with :short
397 use charnames ":short", ":alias" => { e_ACUTE => "LATIN SMALL LETTER E WITH ACUTE" };
398 "Here: \N{e_ACUTE}!\n";
399 EXPECT
400 Unknown charname 'LATIN SMALL LETTER E WITH ACUTE' at
401 ########
402 # alias with hashref to :full OK
403 use charnames ":full", ":alias" => { e_ACUTE => "LATIN SMALL LETTER E WITH ACUTE" };
404 "Here: \N{e_ACUTE}!\n";
405 EXPECT
406 $
407 ########
408 # alias with hashref to :short but using :full
409 use charnames ":full", ":alias" => { e_ACUTE => "LATIN:e WITH ACUTE" };
410 "Here: \N{e_ACUTE}!\n";
411 EXPECT
412 Unknown charname 'LATIN:e WITH ACUTE' at
413 ########
414 # alias with hashref to :short OK
415 use charnames ":short", ":alias" => { e_ACUTE => "LATIN:e WITH ACUTE" };
416 "Here: \N{e_ACUTE}!\n";
417 EXPECT
418 $
419 ########
420 # alias with bad hashref
421 use charnames ":short", ":alias" => "e_ACUTE";
422 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
423 EXPECT
424 unicore/e_ACUTE_alias.pl cannot be used as alias file for charnames at
425 ########
426 # alias with arrayref
427 use charnames ":short", ":alias" => [ e_ACUTE => "LATIN:e WITH ACUTE" ];
428 "Here: \N{e_ACUTE}!\n";
429 EXPECT
430 Only HASH reference supported as argument to :alias at
431 ########
432 # alias with bad hashref
433 use charnames ":short", ":alias" => { e_ACUTE => "LATIN:e WITH ACUTE", "a_ACUTE" };
434 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
435 EXPECT
436 Use of uninitialized value
437 ########
438 # alias with hashref two aliases
439 use charnames ":short", ":alias" => {
440     e_ACUTE => "LATIN:e WITH ACUTE",
441     a_ACUTE => "",
442     };
443 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
444 EXPECT
445 Unknown charname '' at
446 ########
447 # alias with hashref two aliases
448 use charnames ":short", ":alias" => {
449     e_ACUTE => "LATIN:e WITH ACUTE",
450     a_ACUTE => "LATIN:a WITH ACUTE",
451     };
452 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
453 EXPECT
454 $
455 ########
456 # alias with hashref using mixed aliasses
457 use charnames ":short", ":alias" => {
458     e_ACUTE => "LATIN:e WITH ACUTE",
459     a_ACUTE => "LATIN SMALL LETTER A WITH ACUT",
460     };
461 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
462 EXPECT
463 Unknown charname 'LATIN SMALL LETTER A WITH ACUT' at
464 ########
465 # alias with hashref using mixed aliasses
466 use charnames ":short", ":alias" => {
467     e_ACUTE => "LATIN:e WITH ACUTE",
468     a_ACUTE => "LATIN SMALL LETTER A WITH ACUTE",
469     };
470 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
471 EXPECT
472 Unknown charname 'LATIN SMALL LETTER A WITH ACUTE' at
473 ########
474 # alias with hashref using mixed aliasses
475 use charnames ":full", ":alias" => {
476     e_ACUTE => "LATIN:e WITH ACUTE",
477     a_ACUTE => "LATIN SMALL LETTER A WITH ACUTE",
478     };
479 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
480 EXPECT
481 Unknown charname 'LATIN:e WITH ACUTE' at
482 ########
483 # alias with nonexisting file
484 use charnames ":full", ":alias" => "xyzzy";
485 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
486 EXPECT
487 unicore/xyzzy_alias.pl cannot be used as alias file for charnames at
488 ########
489 # alias with bad file name
490 use charnames ":full", ":alias" => "xy 7-";
491 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
492 EXPECT
493 Charnames alias files can only have identifier characters at
494 ########
495 # alias with non_absolute (existing) file name (which it should /not/ use)
496 use charnames ":full", ":alias" => "perl";
497 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
498 EXPECT
499 unicore/perl_alias.pl cannot be used as alias file for charnames at
500 ########
501 # alias with bad file
502 use charnames ":full", ":alias" => "xyzzy";
503 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
504 FILE
505 #!perl
506 0;
507 EXPECT
508 unicore/xyzzy_alias.pl did not return a \(valid\) list of alias pairs at
509 ########
510 # alias with file with empty list
511 use charnames ":full", ":alias" => "xyzzy";
512 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
513 FILE
514 #!perl
515 ();
516 EXPECT
517 Unknown charname 'e_ACUTE' at
518 ########
519 # alias with file OK but file has :short aliasses
520 use charnames ":full", ":alias" => "xyzzy";
521 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
522 FILE
523 #!perl
524 (   e_ACUTE => "LATIN:e WITH ACUTE",
525     a_ACUTE => "LATIN:a WITH ACUTE",
526     );
527 EXPECT
528 Unknown charname 'LATIN:e WITH ACUTE' at
529 ########
530 # alias with :short and file OK
531 use charnames ":short", ":alias" => "xyzzy";
532 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
533 FILE
534 #!perl
535 (   e_ACUTE => "LATIN:e WITH ACUTE",
536     a_ACUTE => "LATIN:a WITH ACUTE",
537     );
538 EXPECT
539 $
540 ########
541 # alias with :short and file OK has :long aliasses
542 use charnames ":short", ":alias" => "xyzzy";
543 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
544 FILE
545 #!perl
546 (   e_ACUTE => "LATIN SMALL LETTER E WITH ACUTE",
547     a_ACUTE => "LATIN SMALL LETTER A WITH ACUTE",
548     );
549 EXPECT
550 Unknown charname 'LATIN SMALL LETTER E WITH ACUTE' at
551 ########
552 # alias with file implicit :full but file has :short aliasses
553 use charnames ":alias" => ":xyzzy";
554 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
555 FILE
556 #!perl
557 (   e_ACUTE => "LATIN:e WITH ACUTE",
558     a_ACUTE => "LATIN:a WITH ACUTE",
559     );
560 EXPECT
561 Unknown charname 'LATIN:e WITH ACUTE' at
562 ########
563 # alias with file implicit :full and file has :long aliasses
564 use charnames ":alias" => ":xyzzy";
565 "Here: \N{e_ACUTE}\N{a_ACUTE}!\n";
566 FILE
567 #!perl
568 (   e_ACUTE => "LATIN SMALL LETTER E WITH ACUTE",
569     a_ACUTE => "LATIN SMALL LETTER A WITH ACUTE",
570     );
571 EXPECT
572 $