This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Re: [PATCH] Initial attempt at named captures for perls regexp engine
[perl5.git] / t / op / regexp.t
1 #!./perl
2
3 # The tests are in a separate file 't/op/re_tests'.
4 # Each line in that file is a separate test.
5 # There are five columns, separated by tabs.
6 #
7 # Column 1 contains the pattern, optionally enclosed in C<''>.
8 # Modifiers can be put after the closing C<'>.
9 #
10 # Column 2 contains the string to be matched.
11 #
12 # Column 3 contains the expected result:
13 #       y       expect a match
14 #       n       expect no match
15 #       c       expect an error
16 #       B       test exposes a known bug in Perl, should be skipped
17 #       b       test exposes a known bug in Perl, should be skipped if noamp
18 #
19 # Columns 4 and 5 are used only if column 3 contains C<y> or C<c>.
20 #
21 # Column 4 contains a string, usually C<$&>.
22 #
23 # Column 5 contains the expected result of double-quote
24 # interpolating that string after the match, or start of error message.
25 #
26 # Column 6, if present, contains a reason why the test is skipped.
27 # This is printed with "skipped", for harness to pick up.
28 #
29 # \n in the tests are interpolated, as are variables of the form ${\w+}.
30 #
31 # If you want to add a regular expression test that can't be expressed
32 # in this format, don't add it here: put it in op/pat.t instead.
33 #
34 # Note that columns 2,3 and 5 are all enclosed in double quotes and then
35 # evalled; so something like a\"\x{100}$1 has length 3+length($1).
36
37 BEGIN {
38     chdir 't' if -d 't';
39     @INC = '../lib';
40 }
41
42 $iters = shift || 1;            # Poor man performance suite, 10000 is OK.
43
44 open(TESTS,'op/re_tests') || open(TESTS,'t/op/re_tests') || open(TESTS,':op:re_tests') ||
45         die "Can't open re_tests";
46
47 while (<TESTS>) { }
48 $numtests = $.;
49 seek(TESTS,0,0);
50 $. = 0;
51
52 $bang = sprintf "\\%03o", ord "!"; # \41 would not be portable.
53 $ffff  = chr(0xff) x 2;
54 $nulnul = "\0" x 2;
55 $OP = $qr ? 'qr' : 'm';
56
57 $| = 1;
58 print "1..$numtests\n# $iters iterations\n";
59 TEST:
60 while (<TESTS>) {
61     chomp;
62     s/\\n/\n/g;
63     ($pat, $subject, $result, $repl, $expect, $reason) = split(/\t/,$_,6);
64     $input = join(':',$pat,$subject,$result,$repl,$expect);
65     infty_subst(\$pat);
66     infty_subst(\$expect);
67     $pat = "'$pat'" unless $pat =~ /^[:'\/]/;
68     $pat =~ s/(\$\{\w+\})/$1/eeg;
69     $pat =~ s/\\n/\n/g;
70     $subject = eval qq("$subject");
71     $expect  = eval qq("$expect");
72     $expect = $repl = '-' if $skip_amp and $input =~ /\$[&\`\']/;
73     $skip = ($skip_amp ? ($result =~ s/B//i) : ($result =~ s/B//));
74     $reason = 'skipping $&' if $reason eq  '' && $skip_amp;
75     $result =~ s/B//i unless $skip;
76
77     for $study ('', 'study $subject') {
78         $c = $iters;
79         if ($repl eq 'pos') {
80             $code= <<EOFCODE;
81                 $study;
82                 pos(\$subject)=0;
83                 \$match = ( \$subject =~ m${pat}g );
84                 \$got = pos(\$subject);
85 EOFCODE
86         }
87         elsif ($qr_embed) {
88             $code= <<EOFCODE;
89                 my \$RE = qr$pat;
90                 $study;
91                 \$match = (\$subject =~ /(?:)\$RE(?:)/) while \$c--;
92                 \$got = "$repl";
93 EOFCODE
94         }
95         else {
96             $code= <<EOFCODE;
97                 $study;
98                 \$match = (\$subject =~ $OP$pat$addg) while \$c--;
99                 \$got = "$repl";
100 EOFCODE
101         }
102         eval $code;
103         chomp( $err = $@ );
104         if ($result eq 'c') {
105             if ($err !~ m!^\Q$expect!) { print "not ok $. (compile) $input => `$err'\n"; next TEST }
106             last;  # no need to study a syntax error
107         }
108         elsif ( $skip ) {
109             print "ok $. # skipped", length($reason) ? " $reason" : '', "\n";
110             next TEST;
111         }
112         elsif ($@) {
113             print "not ok $. $input => error `$err'\n$code\n$@\n"; next TEST;
114         }
115         elsif ($result eq 'n') {
116             if ($match) { print "not ok $. ($study) $input => false positive\n"; next TEST }
117         }
118         else {
119             if (!$match || $got ne $expect) {
120                 print "not ok $. ($study) $input => `$got', match=$match\n$code\n";
121                 next TEST;
122             }
123         }
124     }
125     print "ok $.\n";
126 }
127
128 close(TESTS);
129
130 sub infty_subst                             # Special-case substitution
131 {                                           #  of $reg_infty and friends
132     my $tp = shift;
133     $$tp =~ s/,\$reg_infty_m}/,$reg_infty_m}/o;
134     $$tp =~ s/,\$reg_infty_p}/,$reg_infty_p}/o;
135     $$tp =~ s/,\$reg_infty}/,$reg_infty}/o;
136 }