This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
[perl #90160] U* gives ‘U0 mode on an empty string’
[perl5.git] / t / uni / lex_utf8.t
1 #!./perl -w
2 #
3 # This script is written intentionally in UTF-8
4
5 BEGIN {
6     $| = 1;
7
8     require './test.pl';
9     skip_all_if_miniperl("no dynamic loading on miniperl, no re");
10     skip_all('EBCDIC') if $::IS_EBCDIC;
11 }
12
13 use strict;
14
15 plan (tests => 10);
16 use charnames ':full';
17
18 use utf8;
19
20 my $A_with_ogonek = "Ą";
21 my $micro_sign = "µ";
22 my $hex_first = "a\x{A2}Ą";
23 my $hex_last = "aĄ\x{A2}";
24 my $name_first = "b\N{MICRO SIGN}Ɓ";
25 my $name_last = "bƁ\N{MICRO SIGN}";
26 my $uname_first = "b\N{U+00B5}Ɓ";
27 my $uname_last = "bƁ\N{U+00B5}";
28 my $octal_first = "c\377Ć";
29 my $octal_last = "cĆ\377";
30
31 do {
32         use bytes;
33         is((join "", unpack("C*", $A_with_ogonek)), "196" . "132", 'single char above 0x100');
34         is((join "", unpack("C*", $micro_sign)), "194" . "181", 'single char in 0x80 .. 0xFF');
35         is((join "", unpack("C*", $hex_first)), "97" . "194" . "162" . "196" . "132", 'a . \x{A2} . char above 0x100');
36         is((join "", unpack("C*", $hex_last)), "97" . "196" . "132" . "194" . "162", 'a . char above 0x100 . \x{A2}');
37         is((join "", unpack("C*", $name_first)), "98" . "194" . "181" . "198" . "129", 'b . \N{MICRO SIGN} . char above 0x100');
38         is((join "", unpack("C*", $name_last)), "98" . "198" . "129" . "194" . "181", 'b . char above 0x100 . \N{MICRO SIGN}');
39         is((join "", unpack("C*", $uname_first)), "98" . "194" . "181" . "198" . "129", 'b . \N{U+00B5} . char above 0x100');
40         is((join "", unpack("C*", $uname_last)), "98" . "198" . "129" . "194" . "181", 'b . char above 0x100 . \N{U+00B5}');
41         is((join "", unpack("C*", $octal_first)), "99" . "195" . "191" . "196" . "134", 'c . \377 . char above 0x100');
42         is((join "", unpack("C*", $octal_last)), "99" . "196" . "134" . "195" . "191", 'c . char above 0x100 . \377');
43 }
44 __END__
45