This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Test for +x bits for all the files in exec-bit.txt
[perl5.git] / t / op / index.t
1 #!./perl
2
3 BEGIN {
4     chdir 't' if -d 't';
5     @INC = '../lib';
6     require './test.pl';
7 }
8
9 use strict;
10 plan( tests => 113 );
11
12 run_tests() unless caller;
13
14 sub run_tests {
15
16 my $foo = 'Now is the time for all good men to come to the aid of their country.';
17
18 my $first = substr($foo,0,index($foo,'the'));
19 is($first, "Now is ");
20
21 my $last = substr($foo,rindex($foo,'the'),100);
22 is($last, "their country.");
23
24 $last = substr($foo,index($foo,'Now'),2);
25 is($last, "No");
26
27 $last = substr($foo,rindex($foo,'Now'),2);
28 is($last, "No");
29
30 $last = substr($foo,index($foo,'.'),100);
31 is($last, ".");
32
33 $last = substr($foo,rindex($foo,'.'),100);
34 is($last, ".");
35
36 is(index("ababa","a",-1), 0);
37 is(index("ababa","a",0), 0);
38 is(index("ababa","a",1), 2);
39 is(index("ababa","a",2), 2);
40 is(index("ababa","a",3), 4);
41 is(index("ababa","a",4), 4);
42 is(index("ababa","a",5), -1);
43
44 is(rindex("ababa","a",-1), -1);
45 is(rindex("ababa","a",0), 0);
46 is(rindex("ababa","a",1), 0);
47 is(rindex("ababa","a",2), 2);
48 is(rindex("ababa","a",3), 2);
49 is(rindex("ababa","a",4), 4);
50 is(rindex("ababa","a",5), 4);
51
52 # tests for empty search string
53 is(index("abc", "", -1), 0);
54 is(index("abc", "", 0), 0);
55 is(index("abc", "", 1), 1);
56 is(index("abc", "", 2), 2);
57 is(index("abc", "", 3), 3);
58 is(index("abc", "", 4), 3);
59 is(rindex("abc", "", -1), 0);
60 is(rindex("abc", "", 0), 0);
61 is(rindex("abc", "", 1), 1);
62 is(rindex("abc", "", 2), 2);
63 is(rindex("abc", "", 3), 3);
64 is(rindex("abc", "", 4), 3);
65
66 $a = "foo \x{1234}bar";
67
68 is(index($a, "\x{1234}"), 4);
69 is(index($a, "bar",    ), 5);
70
71 is(rindex($a, "\x{1234}"), 4);
72 is(rindex($a, "foo",    ), 0);
73
74 {
75     my $needle = "\x{1230}\x{1270}";
76     my @needles = split ( //, $needle );
77     my $haystack = "\x{1228}\x{1228}\x{1230}\x{1270}";
78     foreach ( @needles ) {
79         my $a = index ( "\x{1228}\x{1228}\x{1230}\x{1270}", $_ );
80         my $b = index ( $haystack, $_ );
81         is($a, $b, q{[perl #22375] 'split'/'index' problem for utf8});
82     }
83     $needle = "\x{1270}\x{1230}"; # Transpose them.
84     @needles = split ( //, $needle );
85     foreach ( @needles ) {
86         my $a = index ( "\x{1228}\x{1228}\x{1230}\x{1270}", $_ );
87         my $b = index ( $haystack, $_ );
88         is($a, $b, q{[perl #22375] 'split'/'index' problem for utf8});
89     }
90 }
91
92 {
93     my $search;
94     my $text;
95     $search = latin1_to_native("foo \xc9 bar");
96     $text = latin1_to_native("a\xa3\xa3a $search    $search quux");
97
98     my $text_utf8 = $text;
99     utf8::upgrade($text_utf8);
100     my $search_utf8 = $search;
101     utf8::upgrade($search_utf8);
102
103     is (index($text, $search), 5);
104     is (rindex($text, $search), 18);
105     is (index($text, $search_utf8), 5);
106     is (rindex($text, $search_utf8), 18);
107     is (index($text_utf8, $search), 5);
108     is (rindex($text_utf8, $search), 18);
109     is (index($text_utf8, $search_utf8), 5);
110     is (rindex($text_utf8, $search_utf8), 18);
111
112     my $text_octets = $text_utf8;
113     utf8::encode ($text_octets);
114     my $search_octets = $search_utf8;
115     utf8::encode ($search_octets);
116
117     is (index($text_octets, $search_octets), 7, "index octets, octets")
118         or _diag ($text_octets, $search_octets);
119     is (rindex($text_octets, $search_octets), 21, "rindex octets, octets");
120     is (index($text_octets, $search_utf8), -1);
121     is (rindex($text_octets, $search_utf8), -1);
122     is (index($text_utf8, $search_octets), -1);
123     is (rindex($text_utf8, $search_octets), -1);
124
125     is (index($text_octets, $search), -1);
126     is (rindex($text_octets, $search), -1);
127     is (index($text, $search_octets), -1);
128     is (rindex($text, $search_octets), -1);
129 }
130
131 foreach my $utf8 ('', ', utf-8') {
132     foreach my $arraybase (0, 1, -1, -2) {
133         my $expect_pos = 2 + $arraybase;
134
135         my $prog = "no warnings 'deprecated';\n";
136         $prog .= "\$[ = $arraybase; \$big = \"N\\xabN\\xab\"; ";
137         $prog .= '$big .= chr 256; chop $big; ' if $utf8;
138         $prog .= 'print rindex $big, "N", 2 + $[';
139
140         fresh_perl_is($prog, $expect_pos, {}, "\$[ = $arraybase$utf8");
141     }
142 }
143
144 SKIP: {
145     skip "UTF-EBCDIC is limited to 0x7fffffff", 3 if ord("A") == 193;
146
147     my $a = "\x{80000000}";
148     my $s = $a.'defxyz';
149     is(index($s, 'def'), 1, "0x80000000 is a single character");
150
151     my $b = "\x{fffffffd}";
152     my $t = $b.'pqrxyz';
153     is(index($t, 'pqr'), 1, "0xfffffffd is a single character");
154
155     local ${^UTF8CACHE} = -1;
156     is(index($t, 'xyz'), 4, "0xfffffffd and utf8cache");
157 }
158
159
160 # Tests for NUL characters.
161 {
162     my @tests = (
163         ["",            -1, -1, -1],
164         ["foo",         -1, -1, -1],
165         ["\0",           0, -1, -1],
166         ["\0\0",         0,  0, -1],
167         ["\0\0\0",       0,  0,  0],
168         ["foo\0",        3, -1, -1],
169         ["foo\0foo\0\0", 3,  7, -1],
170     );
171     foreach my $l (1 .. 3) {
172         my $q = "\0" x $l;
173         my $i = 0;
174         foreach my $test (@tests) {
175             $i ++;
176             my $str = $$test [0];
177             my $res = $$test [$l];
178
179             {
180                 is (index ($str, $q), $res, "Find NUL character(s)");
181             }
182
183             #
184             # Bug #53746 shows a difference between variables and literals,
185             # so test literals as well.
186             #
187             my $test_str = qq {is (index ("$str", "$q"), $res, } .
188                            qq {"Find NUL character(s)")};
189                $test_str =~ s/\0/\\0/g;
190
191             eval $test_str;
192             die $@ if $@;
193         }
194     }
195 }
196
197 {
198     # RT#75898
199     is(eval { utf8::upgrade($_ = " "); index $_, " ", 72 }, -1,
200        'UTF-8 cache handles offset beyond the end of the string');
201     $_ = "\x{100}BC";
202     is(index($_, "C", 4), -1,
203        'UTF-8 cache handles offset beyond the end of the string');
204 }
205
206 }