This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Another C<return NORMAL> needed post bb4c52e023e0, missed from 805bf316c58a.
[perl5.git] / pp.c
1 /*    pp.c
2  *
3  *    Copyright (C) 1991, 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000,
4  *    2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008 by Larry Wall and others
5  *
6  *    You may distribute under the terms of either the GNU General Public
7  *    License or the Artistic License, as specified in the README file.
8  *
9  */
10
11 /*
12  * 'It's a big house this, and very peculiar.  Always a bit more
13  *  to discover, and no knowing what you'll find round a corner.
14  *  And Elves, sir!'                            --Samwise Gamgee
15  *
16  *     [p.225 of _The Lord of the Rings_, II/i: "Many Meetings"]
17  */
18
19 /* This file contains general pp ("push/pop") functions that execute the
20  * opcodes that make up a perl program. A typical pp function expects to
21  * find its arguments on the stack, and usually pushes its results onto
22  * the stack, hence the 'pp' terminology. Each OP structure contains
23  * a pointer to the relevant pp_foo() function.
24  */
25
26 #include "EXTERN.h"
27 #define PERL_IN_PP_C
28 #include "perl.h"
29 #include "keywords.h"
30
31 #include "reentr.h"
32
33 /* XXX I can't imagine anyone who doesn't have this actually _needs_
34    it, since pid_t is an integral type.
35    --AD  2/20/1998
36 */
37 #ifdef NEED_GETPID_PROTO
38 extern Pid_t getpid (void);
39 #endif
40
41 /*
42  * Some BSDs and Cygwin default to POSIX math instead of IEEE.
43  * This switches them over to IEEE.
44  */
45 #if defined(LIBM_LIB_VERSION)
46     _LIB_VERSION_TYPE _LIB_VERSION = _IEEE_;
47 #endif
48
49 /* variations on pp_null */
50
51 PP(pp_stub)
52 {
53     dVAR;
54     dSP;
55     if (GIMME_V == G_SCALAR)
56         XPUSHs(&PL_sv_undef);
57     RETURN;
58 }
59
60 /* Pushy stuff. */
61
62 PP(pp_padav)
63 {
64     dVAR; dSP; dTARGET;
65     I32 gimme;
66     assert(SvTYPE(TARG) == SVt_PVAV);
67     if (PL_op->op_private & OPpLVAL_INTRO)
68         if (!(PL_op->op_private & OPpPAD_STATE))
69             SAVECLEARSV(PAD_SVl(PL_op->op_targ));
70     EXTEND(SP, 1);
71     if (PL_op->op_flags & OPf_REF) {
72         PUSHs(TARG);
73         RETURN;
74     } else if (LVRET) {
75         if (GIMME == G_SCALAR)
76             Perl_croak(aTHX_ "Can't return array to lvalue scalar context");
77         PUSHs(TARG);
78         RETURN;
79     }
80     gimme = GIMME_V;
81     if (gimme == G_ARRAY) {
82         const I32 maxarg = AvFILL(MUTABLE_AV(TARG)) + 1;
83         EXTEND(SP, maxarg);
84         if (SvMAGICAL(TARG)) {
85             U32 i;
86             for (i=0; i < (U32)maxarg; i++) {
87                 SV * const * const svp = av_fetch(MUTABLE_AV(TARG), i, FALSE);
88                 SP[i+1] = (svp) ? *svp : &PL_sv_undef;
89             }
90         }
91         else {
92             Copy(AvARRAY((const AV *)TARG), SP+1, maxarg, SV*);
93         }
94         SP += maxarg;
95     }
96     else if (gimme == G_SCALAR) {
97         SV* const sv = sv_newmortal();
98         const I32 maxarg = AvFILL(MUTABLE_AV(TARG)) + 1;
99         sv_setiv(sv, maxarg);
100         PUSHs(sv);
101     }
102     RETURN;
103 }
104
105 PP(pp_padhv)
106 {
107     dVAR; dSP; dTARGET;
108     I32 gimme;
109
110     assert(SvTYPE(TARG) == SVt_PVHV);
111     XPUSHs(TARG);
112     if (PL_op->op_private & OPpLVAL_INTRO)
113         if (!(PL_op->op_private & OPpPAD_STATE))
114             SAVECLEARSV(PAD_SVl(PL_op->op_targ));
115     if (PL_op->op_flags & OPf_REF)
116         RETURN;
117     else if (LVRET) {
118         if (GIMME == G_SCALAR)
119             Perl_croak(aTHX_ "Can't return hash to lvalue scalar context");
120         RETURN;
121     }
122     gimme = GIMME_V;
123     if (gimme == G_ARRAY) {
124         RETURNOP(do_kv());
125     }
126     else if (gimme == G_SCALAR) {
127         SV* const sv = Perl_hv_scalar(aTHX_ MUTABLE_HV(TARG));
128         SETs(sv);
129     }
130     RETURN;
131 }
132
133 /* Translations. */
134
135 const char S_no_symref_sv[] =
136     "Can't use string (\"%" SVf32 "\"%s) as %s ref while \"strict refs\" in use";
137
138 PP(pp_rv2gv)
139 {
140     dVAR; dSP; dTOPss;
141
142     if (SvROK(sv)) {
143       wasref:
144         tryAMAGICunDEREF(to_gv);
145
146         sv = SvRV(sv);
147         if (SvTYPE(sv) == SVt_PVIO) {
148             GV * const gv = MUTABLE_GV(sv_newmortal());
149             gv_init(gv, 0, "", 0, 0);
150             GvIOp(gv) = MUTABLE_IO(sv);
151             SvREFCNT_inc_void_NN(sv);
152             sv = MUTABLE_SV(gv);
153         }
154         else if (!isGV_with_GP(sv))
155             DIE(aTHX_ "Not a GLOB reference");
156     }
157     else {
158         if (!isGV_with_GP(sv)) {
159             if (SvGMAGICAL(sv)) {
160                 mg_get(sv);
161                 if (SvROK(sv))
162                     goto wasref;
163             }
164             if (!SvOK(sv) && sv != &PL_sv_undef) {
165                 /* If this is a 'my' scalar and flag is set then vivify
166                  * NI-S 1999/05/07
167                  */
168                 if (SvREADONLY(sv))
169                     Perl_croak(aTHX_ "%s", PL_no_modify);
170                 if (PL_op->op_private & OPpDEREF) {
171                     GV *gv;
172                     if (cUNOP->op_targ) {
173                         STRLEN len;
174                         SV * const namesv = PAD_SV(cUNOP->op_targ);
175                         const char * const name = SvPV(namesv, len);
176                         gv = MUTABLE_GV(newSV(0));
177                         gv_init(gv, CopSTASH(PL_curcop), name, len, 0);
178                     }
179                     else {
180                         const char * const name = CopSTASHPV(PL_curcop);
181                         gv = newGVgen(name);
182                     }
183                     prepare_SV_for_RV(sv);
184                     SvRV_set(sv, MUTABLE_SV(gv));
185                     SvROK_on(sv);
186                     SvSETMAGIC(sv);
187                     goto wasref;
188                 }
189                 if (PL_op->op_flags & OPf_REF ||
190                     PL_op->op_private & HINT_STRICT_REFS)
191                     DIE(aTHX_ PL_no_usym, "a symbol");
192                 if (ckWARN(WARN_UNINITIALIZED))
193                     report_uninit(sv);
194                 RETSETUNDEF;
195             }
196             if ((PL_op->op_flags & OPf_SPECIAL) &&
197                 !(PL_op->op_flags & OPf_MOD))
198             {
199                 SV * const temp = MUTABLE_SV(gv_fetchsv(sv, 0, SVt_PVGV));
200                 if (!temp
201                     && (!is_gv_magical_sv(sv,0)
202                         || !(sv = MUTABLE_SV(gv_fetchsv(sv, GV_ADD,
203                                                         SVt_PVGV))))) {
204                     RETSETUNDEF;
205                 }
206                 sv = temp;
207             }
208             else {
209                 if (PL_op->op_private & HINT_STRICT_REFS)
210                     DIE(aTHX_ S_no_symref_sv, sv, (SvCUR(sv)>32 ? "..." : ""), "a symbol");
211                 if ((PL_op->op_private & (OPpLVAL_INTRO|OPpDONT_INIT_GV))
212                     == OPpDONT_INIT_GV) {
213                     /* We are the target of a coderef assignment.  Return
214                        the scalar unchanged, and let pp_sasssign deal with
215                        things.  */
216                     RETURN;
217                 }
218                 sv = MUTABLE_SV(gv_fetchsv(sv, GV_ADD, SVt_PVGV));
219             }
220         }
221     }
222     if (PL_op->op_private & OPpLVAL_INTRO)
223         save_gp(MUTABLE_GV(sv), !(PL_op->op_flags & OPf_SPECIAL));
224     SETs(sv);
225     RETURN;
226 }
227
228 /* Helper function for pp_rv2sv and pp_rv2av  */
229 GV *
230 Perl_softref2xv(pTHX_ SV *const sv, const char *const what,
231                 const svtype type, SV ***spp)
232 {
233     dVAR;
234     GV *gv;
235
236     PERL_ARGS_ASSERT_SOFTREF2XV;
237
238     if (PL_op->op_private & HINT_STRICT_REFS) {
239         if (SvOK(sv))
240             Perl_die(aTHX_ S_no_symref_sv, sv, (SvCUR(sv)>32 ? "..." : ""), what);
241         else
242             Perl_die(aTHX_ PL_no_usym, what);
243     }
244     if (!SvOK(sv)) {
245         if (PL_op->op_flags & OPf_REF)
246             Perl_die(aTHX_ PL_no_usym, what);
247         if (ckWARN(WARN_UNINITIALIZED))
248             report_uninit(sv);
249         if (type != SVt_PV && GIMME_V == G_ARRAY) {
250             (*spp)--;
251             return NULL;
252         }
253         **spp = &PL_sv_undef;
254         return NULL;
255     }
256     if ((PL_op->op_flags & OPf_SPECIAL) &&
257         !(PL_op->op_flags & OPf_MOD))
258         {
259             gv = gv_fetchsv(sv, 0, type);
260             if (!gv
261                 && (!is_gv_magical_sv(sv,0)
262                     || !(gv = gv_fetchsv(sv, GV_ADD, type))))
263                 {
264                     **spp = &PL_sv_undef;
265                     return NULL;
266                 }
267         }
268     else {
269         gv = gv_fetchsv(sv, GV_ADD, type);
270     }
271     return gv;
272 }
273
274 PP(pp_rv2sv)
275 {
276     dVAR; dSP; dTOPss;
277     GV *gv = NULL;
278
279     if (SvROK(sv)) {
280       wasref:
281         tryAMAGICunDEREF(to_sv);
282
283         sv = SvRV(sv);
284         switch (SvTYPE(sv)) {
285         case SVt_PVAV:
286         case SVt_PVHV:
287         case SVt_PVCV:
288         case SVt_PVFM:
289         case SVt_PVIO:
290             DIE(aTHX_ "Not a SCALAR reference");
291         default: NOOP;
292         }
293     }
294     else {
295         gv = MUTABLE_GV(sv);
296
297         if (!isGV_with_GP(gv)) {
298             if (SvGMAGICAL(sv)) {
299                 mg_get(sv);
300                 if (SvROK(sv))
301                     goto wasref;
302             }
303             gv = Perl_softref2xv(aTHX_ sv, "a SCALAR", SVt_PV, &sp);
304             if (!gv)
305                 RETURN;
306         }
307         sv = GvSVn(gv);
308     }
309     if (PL_op->op_flags & OPf_MOD) {
310         if (PL_op->op_private & OPpLVAL_INTRO) {
311             if (cUNOP->op_first->op_type == OP_NULL)
312                 sv = save_scalar(MUTABLE_GV(TOPs));
313             else if (gv)
314                 sv = save_scalar(gv);
315             else
316                 Perl_croak(aTHX_ "%s", PL_no_localize_ref);
317         }
318         else if (PL_op->op_private & OPpDEREF)
319             vivify_ref(sv, PL_op->op_private & OPpDEREF);
320     }
321     SETs(sv);
322     RETURN;
323 }
324
325 PP(pp_av2arylen)
326 {
327     dVAR; dSP;
328     AV * const av = MUTABLE_AV(TOPs);
329     const I32 lvalue = PL_op->op_flags & OPf_MOD || LVRET;
330     if (lvalue) {
331         SV ** const sv = Perl_av_arylen_p(aTHX_ MUTABLE_AV(av));
332         if (!*sv) {
333             *sv = newSV_type(SVt_PVMG);
334             sv_magic(*sv, MUTABLE_SV(av), PERL_MAGIC_arylen, NULL, 0);
335         }
336         SETs(*sv);
337     } else {
338         SETs(sv_2mortal(newSViv(
339             AvFILL(MUTABLE_AV(av)) + CopARYBASE_get(PL_curcop)
340         )));
341     }
342     RETURN;
343 }
344
345 PP(pp_pos)
346 {
347     dVAR; dSP; dTARGET; dPOPss;
348
349     if (PL_op->op_flags & OPf_MOD || LVRET) {
350         if (SvTYPE(TARG) < SVt_PVLV) {
351             sv_upgrade(TARG, SVt_PVLV);
352             sv_magic(TARG, NULL, PERL_MAGIC_pos, NULL, 0);
353         }
354
355         LvTYPE(TARG) = '.';
356         if (LvTARG(TARG) != sv) {
357             SvREFCNT_dec(LvTARG(TARG));
358             LvTARG(TARG) = SvREFCNT_inc_simple(sv);
359         }
360         PUSHs(TARG);    /* no SvSETMAGIC */
361         RETURN;
362     }
363     else {
364         if (SvTYPE(sv) >= SVt_PVMG && SvMAGIC(sv)) {
365             const MAGIC * const mg = mg_find(sv, PERL_MAGIC_regex_global);
366             if (mg && mg->mg_len >= 0) {
367                 I32 i = mg->mg_len;
368                 if (DO_UTF8(sv))
369                     sv_pos_b2u(sv, &i);
370                 PUSHi(i + CopARYBASE_get(PL_curcop));
371                 RETURN;
372             }
373         }
374         RETPUSHUNDEF;
375     }
376 }
377
378 PP(pp_rv2cv)
379 {
380     dVAR; dSP;
381     GV *gv;
382     HV *stash_unused;
383     const I32 flags = (PL_op->op_flags & OPf_SPECIAL)
384         ? 0
385         : ((PL_op->op_private & (OPpLVAL_INTRO|OPpMAY_RETURN_CONSTANT)) == OPpMAY_RETURN_CONSTANT)
386             ? GV_ADD|GV_NOEXPAND
387             : GV_ADD;
388     /* We usually try to add a non-existent subroutine in case of AUTOLOAD. */
389     /* (But not in defined().) */
390
391     CV *cv = sv_2cv(TOPs, &stash_unused, &gv, flags);
392     if (cv) {
393         if (CvCLONE(cv))
394             cv = MUTABLE_CV(sv_2mortal(MUTABLE_SV(cv_clone(cv))));
395         if ((PL_op->op_private & OPpLVAL_INTRO)) {
396             if (gv && GvCV(gv) == cv && (gv = gv_autoload4(GvSTASH(gv), GvNAME(gv), GvNAMELEN(gv), FALSE)))
397                 cv = GvCV(gv);
398             if (!CvLVALUE(cv))
399                 DIE(aTHX_ "Can't modify non-lvalue subroutine call");
400         }
401     }
402     else if ((flags == (GV_ADD|GV_NOEXPAND)) && gv && SvROK(gv)) {
403         cv = MUTABLE_CV(gv);
404     }    
405     else
406         cv = MUTABLE_CV(&PL_sv_undef);
407     SETs(MUTABLE_SV(cv));
408     RETURN;
409 }
410
411 PP(pp_prototype)
412 {
413     dVAR; dSP;
414     CV *cv;
415     HV *stash;
416     GV *gv;
417     SV *ret = &PL_sv_undef;
418
419     if (SvPOK(TOPs) && SvCUR(TOPs) >= 7) {
420         const char * s = SvPVX_const(TOPs);
421         if (strnEQ(s, "CORE::", 6)) {
422             const int code = keyword(s + 6, SvCUR(TOPs) - 6, 1);
423             if (code < 0) {     /* Overridable. */
424 #define MAX_ARGS_OP ((sizeof(I32) - 1) * 2)
425                 int i = 0, n = 0, seen_question = 0, defgv = 0;
426                 I32 oa;
427                 char str[ MAX_ARGS_OP * 2 + 2 ]; /* One ';', one '\0' */
428
429                 if (code == -KEY_chop || code == -KEY_chomp
430                         || code == -KEY_exec || code == -KEY_system)
431                     goto set;
432                 if (code == -KEY_mkdir) {
433                     ret = newSVpvs_flags("_;$", SVs_TEMP);
434                     goto set;
435                 }
436                 if (code == -KEY_keys || code == -KEY_values || code == -KEY_each) {
437                     ret = newSVpvs_flags("\\[@%]", SVs_TEMP);
438                     goto set;
439                 }
440                 if (code == -KEY_readpipe) {
441                     s = "CORE::backtick";
442                 }
443                 while (i < MAXO) {      /* The slow way. */
444                     if (strEQ(s + 6, PL_op_name[i])
445                         || strEQ(s + 6, PL_op_desc[i]))
446                     {
447                         goto found;
448                     }
449                     i++;
450                 }
451                 goto nonesuch;          /* Should not happen... */
452               found:
453                 defgv = PL_opargs[i] & OA_DEFGV;
454                 oa = PL_opargs[i] >> OASHIFT;
455                 while (oa) {
456                     if (oa & OA_OPTIONAL && !seen_question && !defgv) {
457                         seen_question = 1;
458                         str[n++] = ';';
459                     }
460                     if ((oa & (OA_OPTIONAL - 1)) >= OA_AVREF
461                         && (oa & (OA_OPTIONAL - 1)) <= OA_SCALARREF
462                         /* But globs are already references (kinda) */
463                         && (oa & (OA_OPTIONAL - 1)) != OA_FILEREF
464                     ) {
465                         str[n++] = '\\';
466                     }
467                     str[n++] = ("?$@@%&*$")[oa & (OA_OPTIONAL - 1)];
468                     oa = oa >> 4;
469                 }
470                 if (defgv && str[n - 1] == '$')
471                     str[n - 1] = '_';
472                 str[n++] = '\0';
473                 ret = newSVpvn_flags(str, n - 1, SVs_TEMP);
474             }
475             else if (code)              /* Non-Overridable */
476                 goto set;
477             else {                      /* None such */
478               nonesuch:
479                 DIE(aTHX_ "Can't find an opnumber for \"%s\"", s+6);
480             }
481         }
482     }
483     cv = sv_2cv(TOPs, &stash, &gv, 0);
484     if (cv && SvPOK(cv))
485         ret = newSVpvn_flags(SvPVX_const(cv), SvCUR(cv), SVs_TEMP);
486   set:
487     SETs(ret);
488     RETURN;
489 }
490
491 PP(pp_anoncode)
492 {
493     dVAR; dSP;
494     CV *cv = MUTABLE_CV(PAD_SV(PL_op->op_targ));
495     if (CvCLONE(cv))
496         cv = MUTABLE_CV(sv_2mortal(MUTABLE_SV(cv_clone(cv))));
497     EXTEND(SP,1);
498     PUSHs(MUTABLE_SV(cv));
499     RETURN;
500 }
501
502 PP(pp_srefgen)
503 {
504     dVAR; dSP;
505     *SP = refto(*SP);
506     RETURN;
507 }
508
509 PP(pp_refgen)
510 {
511     dVAR; dSP; dMARK;
512     if (GIMME != G_ARRAY) {
513         if (++MARK <= SP)
514             *MARK = *SP;
515         else
516             *MARK = &PL_sv_undef;
517         *MARK = refto(*MARK);
518         SP = MARK;
519         RETURN;
520     }
521     EXTEND_MORTAL(SP - MARK);
522     while (++MARK <= SP)
523         *MARK = refto(*MARK);
524     RETURN;
525 }
526
527 STATIC SV*
528 S_refto(pTHX_ SV *sv)
529 {
530     dVAR;
531     SV* rv;
532
533     PERL_ARGS_ASSERT_REFTO;
534
535     if (SvTYPE(sv) == SVt_PVLV && LvTYPE(sv) == 'y') {
536         if (LvTARGLEN(sv))
537             vivify_defelem(sv);
538         if (!(sv = LvTARG(sv)))
539             sv = &PL_sv_undef;
540         else
541             SvREFCNT_inc_void_NN(sv);
542     }
543     else if (SvTYPE(sv) == SVt_PVAV) {
544         if (!AvREAL((const AV *)sv) && AvREIFY((const AV *)sv))
545             av_reify(MUTABLE_AV(sv));
546         SvTEMP_off(sv);
547         SvREFCNT_inc_void_NN(sv);
548     }
549     else if (SvPADTMP(sv) && !IS_PADGV(sv))
550         sv = newSVsv(sv);
551     else {
552         SvTEMP_off(sv);
553         SvREFCNT_inc_void_NN(sv);
554     }
555     rv = sv_newmortal();
556     sv_upgrade(rv, SVt_IV);
557     SvRV_set(rv, sv);
558     SvROK_on(rv);
559     return rv;
560 }
561
562 PP(pp_ref)
563 {
564     dVAR; dSP; dTARGET;
565     const char *pv;
566     SV * const sv = POPs;
567
568     if (sv)
569         SvGETMAGIC(sv);
570
571     if (!sv || !SvROK(sv))
572         RETPUSHNO;
573
574     pv = sv_reftype(SvRV(sv),TRUE);
575     PUSHp(pv, strlen(pv));
576     RETURN;
577 }
578
579 PP(pp_bless)
580 {
581     dVAR; dSP;
582     HV *stash;
583
584     if (MAXARG == 1)
585         stash = CopSTASH(PL_curcop);
586     else {
587         SV * const ssv = POPs;
588         STRLEN len;
589         const char *ptr;
590
591         if (ssv && !SvGMAGICAL(ssv) && !SvAMAGIC(ssv) && SvROK(ssv))
592             Perl_croak(aTHX_ "Attempt to bless into a reference");
593         ptr = SvPV_const(ssv,len);
594         if (len == 0)
595             Perl_ck_warner(aTHX_ packWARN(WARN_MISC),
596                            "Explicit blessing to '' (assuming package main)");
597         stash = gv_stashpvn(ptr, len, GV_ADD);
598     }
599
600     (void)sv_bless(TOPs, stash);
601     RETURN;
602 }
603
604 PP(pp_gelem)
605 {
606     dVAR; dSP;
607
608     SV *sv = POPs;
609     const char * const elem = SvPV_nolen_const(sv);
610     GV * const gv = MUTABLE_GV(POPs);
611     SV * tmpRef = NULL;
612
613     sv = NULL;
614     if (elem) {
615         /* elem will always be NUL terminated.  */
616         const char * const second_letter = elem + 1;
617         switch (*elem) {
618         case 'A':
619             if (strEQ(second_letter, "RRAY"))
620                 tmpRef = MUTABLE_SV(GvAV(gv));
621             break;
622         case 'C':
623             if (strEQ(second_letter, "ODE"))
624                 tmpRef = MUTABLE_SV(GvCVu(gv));
625             break;
626         case 'F':
627             if (strEQ(second_letter, "ILEHANDLE")) {
628                 /* finally deprecated in 5.8.0 */
629                 deprecate("*glob{FILEHANDLE}");
630                 tmpRef = MUTABLE_SV(GvIOp(gv));
631             }
632             else
633                 if (strEQ(second_letter, "ORMAT"))
634                     tmpRef = MUTABLE_SV(GvFORM(gv));
635             break;
636         case 'G':
637             if (strEQ(second_letter, "LOB"))
638                 tmpRef = MUTABLE_SV(gv);
639             break;
640         case 'H':
641             if (strEQ(second_letter, "ASH"))
642                 tmpRef = MUTABLE_SV(GvHV(gv));
643             break;
644         case 'I':
645             if (*second_letter == 'O' && !elem[2])
646                 tmpRef = MUTABLE_SV(GvIOp(gv));
647             break;
648         case 'N':
649             if (strEQ(second_letter, "AME"))
650                 sv = newSVhek(GvNAME_HEK(gv));
651             break;
652         case 'P':
653             if (strEQ(second_letter, "ACKAGE")) {
654                 const HV * const stash = GvSTASH(gv);
655                 const HEK * const hek = stash ? HvNAME_HEK(stash) : NULL;
656                 sv = hek ? newSVhek(hek) : newSVpvs("__ANON__");
657             }
658             break;
659         case 'S':
660             if (strEQ(second_letter, "CALAR"))
661                 tmpRef = GvSVn(gv);
662             break;
663         }
664     }
665     if (tmpRef)
666         sv = newRV(tmpRef);
667     if (sv)
668         sv_2mortal(sv);
669     else
670         sv = &PL_sv_undef;
671     XPUSHs(sv);
672     RETURN;
673 }
674
675 /* Pattern matching */
676
677 PP(pp_study)
678 {
679     dVAR; dSP; dPOPss;
680     register unsigned char *s;
681     register I32 pos;
682     register I32 ch;
683     register I32 *sfirst;
684     register I32 *snext;
685     STRLEN len;
686
687     if (sv == PL_lastscream) {
688         if (SvSCREAM(sv))
689             RETPUSHYES;
690     }
691     s = (unsigned char*)(SvPV(sv, len));
692     pos = len;
693     if (pos <= 0 || !SvPOK(sv) || SvUTF8(sv)) {
694         /* No point in studying a zero length string, and not safe to study
695            anything that doesn't appear to be a simple scalar (and hence might
696            change between now and when the regexp engine runs without our set
697            magic ever running) such as a reference to an object with overloaded
698            stringification.  */
699         RETPUSHNO;
700     }
701
702     if (PL_lastscream) {
703         SvSCREAM_off(PL_lastscream);
704         SvREFCNT_dec(PL_lastscream);
705     }
706     PL_lastscream = SvREFCNT_inc_simple(sv);
707
708     s = (unsigned char*)(SvPV(sv, len));
709     pos = len;
710     if (pos <= 0)
711         RETPUSHNO;
712     if (pos > PL_maxscream) {
713         if (PL_maxscream < 0) {
714             PL_maxscream = pos + 80;
715             Newx(PL_screamfirst, 256, I32);
716             Newx(PL_screamnext, PL_maxscream, I32);
717         }
718         else {
719             PL_maxscream = pos + pos / 4;
720             Renew(PL_screamnext, PL_maxscream, I32);
721         }
722     }
723
724     sfirst = PL_screamfirst;
725     snext = PL_screamnext;
726
727     if (!sfirst || !snext)
728         DIE(aTHX_ "do_study: out of memory");
729
730     for (ch = 256; ch; --ch)
731         *sfirst++ = -1;
732     sfirst -= 256;
733
734     while (--pos >= 0) {
735         register const I32 ch = s[pos];
736         if (sfirst[ch] >= 0)
737             snext[pos] = sfirst[ch] - pos;
738         else
739             snext[pos] = -pos;
740         sfirst[ch] = pos;
741     }
742
743     SvSCREAM_on(sv);
744     /* piggyback on m//g magic */
745     sv_magic(sv, NULL, PERL_MAGIC_regex_global, NULL, 0);
746     RETPUSHYES;
747 }
748
749 PP(pp_trans)
750 {
751     dVAR; dSP; dTARG;
752     SV *sv;
753
754     if (PL_op->op_flags & OPf_STACKED)
755         sv = POPs;
756     else if (PL_op->op_private & OPpTARGET_MY)
757         sv = GETTARGET;
758     else {
759         sv = DEFSV;
760         EXTEND(SP,1);
761     }
762     TARG = sv_newmortal();
763     PUSHi(do_trans(sv));
764     RETURN;
765 }
766
767 /* Lvalue operators. */
768
769 PP(pp_schop)
770 {
771     dVAR; dSP; dTARGET;
772     do_chop(TARG, TOPs);
773     SETTARG;
774     RETURN;
775 }
776
777 PP(pp_chop)
778 {
779     dVAR; dSP; dMARK; dTARGET; dORIGMARK;
780     while (MARK < SP)
781         do_chop(TARG, *++MARK);
782     SP = ORIGMARK;
783     XPUSHTARG;
784     RETURN;
785 }
786
787 PP(pp_schomp)
788 {
789     dVAR; dSP; dTARGET;
790     SETi(do_chomp(TOPs));
791     RETURN;
792 }
793
794 PP(pp_chomp)
795 {
796     dVAR; dSP; dMARK; dTARGET;
797     register I32 count = 0;
798
799     while (SP > MARK)
800         count += do_chomp(POPs);
801     XPUSHi(count);
802     RETURN;
803 }
804
805 PP(pp_undef)
806 {
807     dVAR; dSP;
808     SV *sv;
809
810     if (!PL_op->op_private) {
811         EXTEND(SP, 1);
812         RETPUSHUNDEF;
813     }
814
815     sv = POPs;
816     if (!sv)
817         RETPUSHUNDEF;
818
819     SV_CHECK_THINKFIRST_COW_DROP(sv);
820
821     switch (SvTYPE(sv)) {
822     case SVt_NULL:
823         break;
824     case SVt_PVAV:
825         av_undef(MUTABLE_AV(sv));
826         break;
827     case SVt_PVHV:
828         hv_undef(MUTABLE_HV(sv));
829         break;
830     case SVt_PVCV:
831         if (cv_const_sv((const CV *)sv))
832             Perl_ck_warner(aTHX_ packWARN(WARN_MISC), "Constant subroutine %s undefined",
833                            CvANON((const CV *)sv) ? "(anonymous)"
834                            : GvENAME(CvGV((const CV *)sv)));
835         /* FALLTHROUGH */
836     case SVt_PVFM:
837         {
838             /* let user-undef'd sub keep its identity */
839             GV* const gv = CvGV((const CV *)sv);
840             cv_undef(MUTABLE_CV(sv));
841             CvGV((const CV *)sv) = gv;
842         }
843         break;
844     case SVt_PVGV:
845         if (SvFAKE(sv)) {
846             SvSetMagicSV(sv, &PL_sv_undef);
847             break;
848         }
849         else if (isGV_with_GP(sv)) {
850             GP *gp;
851             HV *stash;
852
853             /* undef *Foo:: */
854             if((stash = GvHV((const GV *)sv)) && HvNAME_get(stash))
855                 mro_isa_changed_in(stash);
856             /* undef *Pkg::meth_name ... */
857             else if(GvCVu((const GV *)sv) && (stash = GvSTASH((const GV *)sv))
858                     && HvNAME_get(stash))
859                 mro_method_changed_in(stash);
860
861             gp_free(MUTABLE_GV(sv));
862             Newxz(gp, 1, GP);
863             GvGP(sv) = gp_ref(gp);
864             GvSV(sv) = newSV(0);
865             GvLINE(sv) = CopLINE(PL_curcop);
866             GvEGV(sv) = MUTABLE_GV(sv);
867             GvMULTI_on(sv);
868             break;
869         }
870         /* FALL THROUGH */
871     default:
872         if (SvTYPE(sv) >= SVt_PV && SvPVX_const(sv) && SvLEN(sv)) {
873             SvPV_free(sv);
874             SvPV_set(sv, NULL);
875             SvLEN_set(sv, 0);
876         }
877         SvOK_off(sv);
878         SvSETMAGIC(sv);
879     }
880
881     RETPUSHUNDEF;
882 }
883
884 PP(pp_predec)
885 {
886     dVAR; dSP;
887     if (SvTYPE(TOPs) >= SVt_PVAV || isGV_with_GP(TOPs))
888         DIE(aTHX_ "%s", PL_no_modify);
889     if (!SvREADONLY(TOPs) && SvIOK_notUV(TOPs) && !SvNOK(TOPs) && !SvPOK(TOPs)
890         && SvIVX(TOPs) != IV_MIN)
891     {
892         SvIV_set(TOPs, SvIVX(TOPs) - 1);
893         SvFLAGS(TOPs) &= ~(SVp_NOK|SVp_POK);
894     }
895     else
896         sv_dec(TOPs);
897     SvSETMAGIC(TOPs);
898     return NORMAL;
899 }
900
901 PP(pp_postinc)
902 {
903     dVAR; dSP; dTARGET;
904     if (SvTYPE(TOPs) >= SVt_PVAV || isGV_with_GP(TOPs))
905         DIE(aTHX_ "%s", PL_no_modify);
906     sv_setsv(TARG, TOPs);
907     if (!SvREADONLY(TOPs) && SvIOK_notUV(TOPs) && !SvNOK(TOPs) && !SvPOK(TOPs)
908         && SvIVX(TOPs) != IV_MAX)
909     {
910         SvIV_set(TOPs, SvIVX(TOPs) + 1);
911         SvFLAGS(TOPs) &= ~(SVp_NOK|SVp_POK);
912     }
913     else
914         sv_inc(TOPs);
915     SvSETMAGIC(TOPs);
916     /* special case for undef: see thread at 2003-03/msg00536.html in archive */
917     if (!SvOK(TARG))
918         sv_setiv(TARG, 0);
919     SETs(TARG);
920     return NORMAL;
921 }
922
923 PP(pp_postdec)
924 {
925     dVAR; dSP; dTARGET;
926     if (SvTYPE(TOPs) >= SVt_PVAV || isGV_with_GP(TOPs))
927         DIE(aTHX_ "%s", PL_no_modify);
928     sv_setsv(TARG, TOPs);
929     if (!SvREADONLY(TOPs) && SvIOK_notUV(TOPs) && !SvNOK(TOPs) && !SvPOK(TOPs)
930         && SvIVX(TOPs) != IV_MIN)
931     {
932         SvIV_set(TOPs, SvIVX(TOPs) - 1);
933         SvFLAGS(TOPs) &= ~(SVp_NOK|SVp_POK);
934     }
935     else
936         sv_dec(TOPs);
937     SvSETMAGIC(TOPs);
938     SETs(TARG);
939     return NORMAL;
940 }
941
942 /* Ordinary operators. */
943
944 PP(pp_pow)
945 {
946     dVAR; dSP; dATARGET; SV *svl, *svr;
947 #ifdef PERL_PRESERVE_IVUV
948     bool is_int = 0;
949 #endif
950     tryAMAGICbin(pow,opASSIGN);
951     svl = sv_2num(TOPm1s);
952     svr = sv_2num(TOPs);
953 #ifdef PERL_PRESERVE_IVUV
954     /* For integer to integer power, we do the calculation by hand wherever
955        we're sure it is safe; otherwise we call pow() and try to convert to
956        integer afterwards. */
957     {
958         SvIV_please(svr);
959         if (SvIOK(svr)) {
960             SvIV_please(svl);
961             if (SvIOK(svl)) {
962                 UV power;
963                 bool baseuok;
964                 UV baseuv;
965
966                 if (SvUOK(svr)) {
967                     power = SvUVX(svr);
968                 } else {
969                     const IV iv = SvIVX(svr);
970                     if (iv >= 0) {
971                         power = iv;
972                     } else {
973                         goto float_it; /* Can't do negative powers this way.  */
974                     }
975                 }
976
977                 baseuok = SvUOK(svl);
978                 if (baseuok) {
979                     baseuv = SvUVX(svl);
980                 } else {
981                     const IV iv = SvIVX(svl);
982                     if (iv >= 0) {
983                         baseuv = iv;
984                         baseuok = TRUE; /* effectively it's a UV now */
985                     } else {
986                         baseuv = -iv; /* abs, baseuok == false records sign */
987                     }
988                 }
989                 /* now we have integer ** positive integer. */
990                 is_int = 1;
991
992                 /* foo & (foo - 1) is zero only for a power of 2.  */
993                 if (!(baseuv & (baseuv - 1))) {
994                     /* We are raising power-of-2 to a positive integer.
995                        The logic here will work for any base (even non-integer
996                        bases) but it can be less accurate than
997                        pow (base,power) or exp (power * log (base)) when the
998                        intermediate values start to spill out of the mantissa.
999                        With powers of 2 we know this can't happen.
1000                        And powers of 2 are the favourite thing for perl
1001                        programmers to notice ** not doing what they mean. */
1002                     NV result = 1.0;
1003                     NV base = baseuok ? baseuv : -(NV)baseuv;
1004
1005                     if (power & 1) {
1006                         result *= base;
1007                     }
1008                     while (power >>= 1) {
1009                         base *= base;
1010                         if (power & 1) {
1011                             result *= base;
1012                         }
1013                     }
1014                     SP--;
1015                     SETn( result );
1016                     SvIV_please(svr);
1017                     RETURN;
1018                 } else {
1019                     register unsigned int highbit = 8 * sizeof(UV);
1020                     register unsigned int diff = 8 * sizeof(UV);
1021                     while (diff >>= 1) {
1022                         highbit -= diff;
1023                         if (baseuv >> highbit) {
1024                             highbit += diff;
1025                         }
1026                     }
1027                     /* we now have baseuv < 2 ** highbit */
1028                     if (power * highbit <= 8 * sizeof(UV)) {
1029                         /* result will definitely fit in UV, so use UV math
1030                            on same algorithm as above */
1031                         register UV result = 1;
1032                         register UV base = baseuv;
1033                         const bool odd_power = (bool)(power & 1);
1034                         if (odd_power) {
1035                             result *= base;
1036                         }
1037                         while (power >>= 1) {
1038                             base *= base;
1039                             if (power & 1) {
1040                                 result *= base;
1041                             }
1042                         }
1043                         SP--;
1044                         if (baseuok || !odd_power)
1045                             /* answer is positive */
1046                             SETu( result );
1047                         else if (result <= (UV)IV_MAX)
1048                             /* answer negative, fits in IV */
1049                             SETi( -(IV)result );
1050                         else if (result == (UV)IV_MIN) 
1051                             /* 2's complement assumption: special case IV_MIN */
1052                             SETi( IV_MIN );
1053                         else
1054                             /* answer negative, doesn't fit */
1055                             SETn( -(NV)result );
1056                         RETURN;
1057                     } 
1058                 }
1059             }
1060         }
1061     }
1062   float_it:
1063 #endif    
1064     {
1065         NV right = SvNV(svr);
1066         NV left  = SvNV(svl);
1067         (void)POPs;
1068
1069 #if defined(USE_LONG_DOUBLE) && defined(HAS_AIX_POWL_NEG_BASE_BUG)
1070     /*
1071     We are building perl with long double support and are on an AIX OS
1072     afflicted with a powl() function that wrongly returns NaNQ for any
1073     negative base.  This was reported to IBM as PMR #23047-379 on
1074     03/06/2006.  The problem exists in at least the following versions
1075     of AIX and the libm fileset, and no doubt others as well:
1076
1077         AIX 4.3.3-ML10      bos.adt.libm 4.3.3.50
1078         AIX 5.1.0-ML04      bos.adt.libm 5.1.0.29
1079         AIX 5.2.0           bos.adt.libm 5.2.0.85
1080
1081     So, until IBM fixes powl(), we provide the following workaround to
1082     handle the problem ourselves.  Our logic is as follows: for
1083     negative bases (left), we use fmod(right, 2) to check if the
1084     exponent is an odd or even integer:
1085
1086         - if odd,  powl(left, right) == -powl(-left, right)
1087         - if even, powl(left, right) ==  powl(-left, right)
1088
1089     If the exponent is not an integer, the result is rightly NaNQ, so
1090     we just return that (as NV_NAN).
1091     */
1092
1093         if (left < 0.0) {
1094             NV mod2 = Perl_fmod( right, 2.0 );
1095             if (mod2 == 1.0 || mod2 == -1.0) {  /* odd integer */
1096                 SETn( -Perl_pow( -left, right) );
1097             } else if (mod2 == 0.0) {           /* even integer */
1098                 SETn( Perl_pow( -left, right) );
1099             } else {                            /* fractional power */
1100                 SETn( NV_NAN );
1101             }
1102         } else {
1103             SETn( Perl_pow( left, right) );
1104         }
1105 #else
1106         SETn( Perl_pow( left, right) );
1107 #endif  /* HAS_AIX_POWL_NEG_BASE_BUG */
1108
1109 #ifdef PERL_PRESERVE_IVUV
1110         if (is_int)
1111             SvIV_please(svr);
1112 #endif
1113         RETURN;
1114     }
1115 }
1116
1117 PP(pp_multiply)
1118 {
1119     dVAR; dSP; dATARGET; SV *svl, *svr;
1120     tryAMAGICbin(mult,opASSIGN);
1121     svl = sv_2num(TOPm1s);
1122     svr = sv_2num(TOPs);
1123 #ifdef PERL_PRESERVE_IVUV
1124     SvIV_please(svr);
1125     if (SvIOK(svr)) {
1126         /* Unless the left argument is integer in range we are going to have to
1127            use NV maths. Hence only attempt to coerce the right argument if
1128            we know the left is integer.  */
1129         /* Left operand is defined, so is it IV? */
1130         SvIV_please(svl);
1131         if (SvIOK(svl)) {
1132             bool auvok = SvUOK(svl);
1133             bool buvok = SvUOK(svr);
1134             const UV topmask = (~ (UV)0) << (4 * sizeof (UV));
1135             const UV botmask = ~((~ (UV)0) << (4 * sizeof (UV)));
1136             UV alow;
1137             UV ahigh;
1138             UV blow;
1139             UV bhigh;
1140
1141             if (auvok) {
1142                 alow = SvUVX(svl);
1143             } else {
1144                 const IV aiv = SvIVX(svl);
1145                 if (aiv >= 0) {
1146                     alow = aiv;
1147                     auvok = TRUE; /* effectively it's a UV now */
1148                 } else {
1149                     alow = -aiv; /* abs, auvok == false records sign */
1150                 }
1151             }
1152             if (buvok) {
1153                 blow = SvUVX(svr);
1154             } else {
1155                 const IV biv = SvIVX(svr);
1156                 if (biv >= 0) {
1157                     blow = biv;
1158                     buvok = TRUE; /* effectively it's a UV now */
1159                 } else {
1160                     blow = -biv; /* abs, buvok == false records sign */
1161                 }
1162             }
1163
1164             /* If this does sign extension on unsigned it's time for plan B  */
1165             ahigh = alow >> (4 * sizeof (UV));
1166             alow &= botmask;
1167             bhigh = blow >> (4 * sizeof (UV));
1168             blow &= botmask;
1169             if (ahigh && bhigh) {
1170                 NOOP;
1171                 /* eg 32 bit is at least 0x10000 * 0x10000 == 0x100000000
1172                    which is overflow. Drop to NVs below.  */
1173             } else if (!ahigh && !bhigh) {
1174                 /* eg 32 bit is at most 0xFFFF * 0xFFFF == 0xFFFE0001
1175                    so the unsigned multiply cannot overflow.  */
1176                 const UV product = alow * blow;
1177                 if (auvok == buvok) {
1178                     /* -ve * -ve or +ve * +ve gives a +ve result.  */
1179                     SP--;
1180                     SETu( product );
1181                     RETURN;
1182                 } else if (product <= (UV)IV_MIN) {
1183                     /* 2s complement assumption that (UV)-IV_MIN is correct.  */
1184                     /* -ve result, which could overflow an IV  */
1185                     SP--;
1186                     SETi( -(IV)product );
1187                     RETURN;
1188                 } /* else drop to NVs below. */
1189             } else {
1190                 /* One operand is large, 1 small */
1191                 UV product_middle;
1192                 if (bhigh) {
1193                     /* swap the operands */
1194                     ahigh = bhigh;
1195                     bhigh = blow; /* bhigh now the temp var for the swap */
1196                     blow = alow;
1197                     alow = bhigh;
1198                 }
1199                 /* now, ((ahigh * blow) << half_UV_len) + (alow * blow)
1200                    multiplies can't overflow. shift can, add can, -ve can.  */
1201                 product_middle = ahigh * blow;
1202                 if (!(product_middle & topmask)) {
1203                     /* OK, (ahigh * blow) won't lose bits when we shift it.  */
1204                     UV product_low;
1205                     product_middle <<= (4 * sizeof (UV));
1206                     product_low = alow * blow;
1207
1208                     /* as for pp_add, UV + something mustn't get smaller.
1209                        IIRC ANSI mandates this wrapping *behaviour* for
1210                        unsigned whatever the actual representation*/
1211                     product_low += product_middle;
1212                     if (product_low >= product_middle) {
1213                         /* didn't overflow */
1214                         if (auvok == buvok) {
1215                             /* -ve * -ve or +ve * +ve gives a +ve result.  */
1216                             SP--;
1217                             SETu( product_low );
1218                             RETURN;
1219                         } else if (product_low <= (UV)IV_MIN) {
1220                             /* 2s complement assumption again  */
1221                             /* -ve result, which could overflow an IV  */
1222                             SP--;
1223                             SETi( -(IV)product_low );
1224                             RETURN;
1225                         } /* else drop to NVs below. */
1226                     }
1227                 } /* product_middle too large */
1228             } /* ahigh && bhigh */
1229         } /* SvIOK(svl) */
1230     } /* SvIOK(svr) */
1231 #endif
1232     {
1233       NV right = SvNV(svr);
1234       NV left  = SvNV(svl);
1235       (void)POPs;
1236       SETn( left * right );
1237       RETURN;
1238     }
1239 }
1240
1241 PP(pp_divide)
1242 {
1243     dVAR; dSP; dATARGET; SV *svl, *svr;
1244     tryAMAGICbin(div,opASSIGN);
1245     svl = sv_2num(TOPm1s);
1246     svr = sv_2num(TOPs);
1247     /* Only try to do UV divide first
1248        if ((SLOPPYDIVIDE is true) or
1249            (PERL_PRESERVE_IVUV is true and one or both SV is a UV too large
1250             to preserve))
1251        The assumption is that it is better to use floating point divide
1252        whenever possible, only doing integer divide first if we can't be sure.
1253        If NV_PRESERVES_UV is true then we know at compile time that no UV
1254        can be too large to preserve, so don't need to compile the code to
1255        test the size of UVs.  */
1256
1257 #ifdef SLOPPYDIVIDE
1258 #  define PERL_TRY_UV_DIVIDE
1259     /* ensure that 20./5. == 4. */
1260 #else
1261 #  ifdef PERL_PRESERVE_IVUV
1262 #    ifndef NV_PRESERVES_UV
1263 #      define PERL_TRY_UV_DIVIDE
1264 #    endif
1265 #  endif
1266 #endif
1267
1268 #ifdef PERL_TRY_UV_DIVIDE
1269     SvIV_please(svr);
1270     if (SvIOK(svr)) {
1271         SvIV_please(svl);
1272         if (SvIOK(svl)) {
1273             bool left_non_neg = SvUOK(svl);
1274             bool right_non_neg = SvUOK(svr);
1275             UV left;
1276             UV right;
1277
1278             if (right_non_neg) {
1279                 right = SvUVX(svr);
1280             }
1281             else {
1282                 const IV biv = SvIVX(svr);
1283                 if (biv >= 0) {
1284                     right = biv;
1285                     right_non_neg = TRUE; /* effectively it's a UV now */
1286                 }
1287                 else {
1288                     right = -biv;
1289                 }
1290             }
1291             /* historically undef()/0 gives a "Use of uninitialized value"
1292                warning before dieing, hence this test goes here.
1293                If it were immediately before the second SvIV_please, then
1294                DIE() would be invoked before left was even inspected, so
1295                no inpsection would give no warning.  */
1296             if (right == 0)
1297                 DIE(aTHX_ "Illegal division by zero");
1298
1299             if (left_non_neg) {
1300                 left = SvUVX(svl);
1301             }
1302             else {
1303                 const IV aiv = SvIVX(svl);
1304                 if (aiv >= 0) {
1305                     left = aiv;
1306                     left_non_neg = TRUE; /* effectively it's a UV now */
1307                 }
1308                 else {
1309                     left = -aiv;
1310                 }
1311             }
1312
1313             if (left >= right
1314 #ifdef SLOPPYDIVIDE
1315                 /* For sloppy divide we always attempt integer division.  */
1316 #else
1317                 /* Otherwise we only attempt it if either or both operands
1318                    would not be preserved by an NV.  If both fit in NVs
1319                    we fall through to the NV divide code below.  However,
1320                    as left >= right to ensure integer result here, we know that
1321                    we can skip the test on the right operand - right big
1322                    enough not to be preserved can't get here unless left is
1323                    also too big.  */
1324
1325                 && (left > ((UV)1 << NV_PRESERVES_UV_BITS))
1326 #endif
1327                 ) {
1328                 /* Integer division can't overflow, but it can be imprecise.  */
1329                 const UV result = left / right;
1330                 if (result * right == left) {
1331                     SP--; /* result is valid */
1332                     if (left_non_neg == right_non_neg) {
1333                         /* signs identical, result is positive.  */
1334                         SETu( result );
1335                         RETURN;
1336                     }
1337                     /* 2s complement assumption */
1338                     if (result <= (UV)IV_MIN)
1339                         SETi( -(IV)result );
1340                     else {
1341                         /* It's exact but too negative for IV. */
1342                         SETn( -(NV)result );
1343                     }
1344                     RETURN;
1345                 } /* tried integer divide but it was not an integer result */
1346             } /* else (PERL_ABS(result) < 1.0) or (both UVs in range for NV) */
1347         } /* left wasn't SvIOK */
1348     } /* right wasn't SvIOK */
1349 #endif /* PERL_TRY_UV_DIVIDE */
1350     {
1351         NV right = SvNV(svr);
1352         NV left  = SvNV(svl);
1353         (void)POPs;(void)POPs;
1354 #if defined(NAN_COMPARE_BROKEN) && defined(Perl_isnan)
1355         if (! Perl_isnan(right) && right == 0.0)
1356 #else
1357         if (right == 0.0)
1358 #endif
1359             DIE(aTHX_ "Illegal division by zero");
1360         PUSHn( left / right );
1361         RETURN;
1362     }
1363 }
1364
1365 PP(pp_modulo)
1366 {
1367     dVAR; dSP; dATARGET; tryAMAGICbin(modulo,opASSIGN);
1368     {
1369         UV left  = 0;
1370         UV right = 0;
1371         bool left_neg = FALSE;
1372         bool right_neg = FALSE;
1373         bool use_double = FALSE;
1374         bool dright_valid = FALSE;
1375         NV dright = 0.0;
1376         NV dleft  = 0.0;
1377         SV * svl;
1378         SV * const svr = sv_2num(TOPs);
1379         SvIV_please(svr);
1380         if (SvIOK(svr)) {
1381             right_neg = !SvUOK(svr);
1382             if (!right_neg) {
1383                 right = SvUVX(svr);
1384             } else {
1385                 const IV biv = SvIVX(svr);
1386                 if (biv >= 0) {
1387                     right = biv;
1388                     right_neg = FALSE; /* effectively it's a UV now */
1389                 } else {
1390                     right = -biv;
1391                 }
1392             }
1393         }
1394         else {
1395             dright = SvNV(svr);
1396             right_neg = dright < 0;
1397             if (right_neg)
1398                 dright = -dright;
1399             if (dright < UV_MAX_P1) {
1400                 right = U_V(dright);
1401                 dright_valid = TRUE; /* In case we need to use double below.  */
1402             } else {
1403                 use_double = TRUE;
1404             }
1405         }
1406         sp--;
1407
1408         /* At this point use_double is only true if right is out of range for
1409            a UV.  In range NV has been rounded down to nearest UV and
1410            use_double false.  */
1411         svl = sv_2num(TOPs);
1412         SvIV_please(svl);
1413         if (!use_double && SvIOK(svl)) {
1414             if (SvIOK(svl)) {
1415                 left_neg = !SvUOK(svl);
1416                 if (!left_neg) {
1417                     left = SvUVX(svl);
1418                 } else {
1419                     const IV aiv = SvIVX(svl);
1420                     if (aiv >= 0) {
1421                         left = aiv;
1422                         left_neg = FALSE; /* effectively it's a UV now */
1423                     } else {
1424                         left = -aiv;
1425                     }
1426                 }
1427             }
1428         }
1429         else {
1430             dleft = SvNV(svl);
1431             left_neg = dleft < 0;
1432             if (left_neg)
1433                 dleft = -dleft;
1434
1435             /* This should be exactly the 5.6 behaviour - if left and right are
1436                both in range for UV then use U_V() rather than floor.  */
1437             if (!use_double) {
1438                 if (dleft < UV_MAX_P1) {
1439                     /* right was in range, so is dleft, so use UVs not double.
1440                      */
1441                     left = U_V(dleft);
1442                 }
1443                 /* left is out of range for UV, right was in range, so promote
1444                    right (back) to double.  */
1445                 else {
1446                     /* The +0.5 is used in 5.6 even though it is not strictly
1447                        consistent with the implicit +0 floor in the U_V()
1448                        inside the #if 1. */
1449                     dleft = Perl_floor(dleft + 0.5);
1450                     use_double = TRUE;
1451                     if (dright_valid)
1452                         dright = Perl_floor(dright + 0.5);
1453                     else
1454                         dright = right;
1455                 }
1456             }
1457         }
1458         sp--;
1459         if (use_double) {
1460             NV dans;
1461
1462             if (!dright)
1463                 DIE(aTHX_ "Illegal modulus zero");
1464
1465             dans = Perl_fmod(dleft, dright);
1466             if ((left_neg != right_neg) && dans)
1467                 dans = dright - dans;
1468             if (right_neg)
1469                 dans = -dans;
1470             sv_setnv(TARG, dans);
1471         }
1472         else {
1473             UV ans;
1474
1475             if (!right)
1476                 DIE(aTHX_ "Illegal modulus zero");
1477
1478             ans = left % right;
1479             if ((left_neg != right_neg) && ans)
1480                 ans = right - ans;
1481             if (right_neg) {
1482                 /* XXX may warn: unary minus operator applied to unsigned type */
1483                 /* could change -foo to be (~foo)+1 instead     */
1484                 if (ans <= ~((UV)IV_MAX)+1)
1485                     sv_setiv(TARG, ~ans+1);
1486                 else
1487                     sv_setnv(TARG, -(NV)ans);
1488             }
1489             else
1490                 sv_setuv(TARG, ans);
1491         }
1492         PUSHTARG;
1493         RETURN;
1494     }
1495 }
1496
1497 PP(pp_repeat)
1498 {
1499   dVAR; dSP; dATARGET; tryAMAGICbin(repeat,opASSIGN);
1500   {
1501     register IV count;
1502     dPOPss;
1503     SvGETMAGIC(sv);
1504     if (SvIOKp(sv)) {
1505          if (SvUOK(sv)) {
1506               const UV uv = SvUV(sv);
1507               if (uv > IV_MAX)
1508                    count = IV_MAX; /* The best we can do? */
1509               else
1510                    count = uv;
1511          } else {
1512               const IV iv = SvIV(sv);
1513               if (iv < 0)
1514                    count = 0;
1515               else
1516                    count = iv;
1517          }
1518     }
1519     else if (SvNOKp(sv)) {
1520          const NV nv = SvNV(sv);
1521          if (nv < 0.0)
1522               count = 0;
1523          else
1524               count = (IV)nv;
1525     }
1526     else
1527          count = SvIV(sv);
1528     if (GIMME == G_ARRAY && PL_op->op_private & OPpREPEAT_DOLIST) {
1529         dMARK;
1530         static const char oom_list_extend[] = "Out of memory during list extend";
1531         const I32 items = SP - MARK;
1532         const I32 max = items * count;
1533
1534         MEM_WRAP_CHECK_1(max, SV*, oom_list_extend);
1535         /* Did the max computation overflow? */
1536         if (items > 0 && max > 0 && (max < items || max < count))
1537            Perl_croak(aTHX_ oom_list_extend);
1538         MEXTEND(MARK, max);
1539         if (count > 1) {
1540             while (SP > MARK) {
1541 #if 0
1542               /* This code was intended to fix 20010809.028:
1543
1544                  $x = 'abcd';
1545                  for (($x =~ /./g) x 2) {
1546                      print chop; # "abcdabcd" expected as output.
1547                  }
1548
1549                * but that change (#11635) broke this code:
1550
1551                $x = [("foo")x2]; # only one "foo" ended up in the anonlist.
1552
1553                * I can't think of a better fix that doesn't introduce
1554                * an efficiency hit by copying the SVs. The stack isn't
1555                * refcounted, and mortalisation obviously doesn't
1556                * Do The Right Thing when the stack has more than
1557                * one pointer to the same mortal value.
1558                * .robin.
1559                */
1560                 if (*SP) {
1561                     *SP = sv_2mortal(newSVsv(*SP));
1562                     SvREADONLY_on(*SP);
1563                 }
1564 #else
1565                if (*SP)
1566                    SvTEMP_off((*SP));
1567 #endif
1568                 SP--;
1569             }
1570             MARK++;
1571             repeatcpy((char*)(MARK + items), (char*)MARK,
1572                 items * sizeof(const SV *), count - 1);
1573             SP += max;
1574         }
1575         else if (count <= 0)
1576             SP -= items;
1577     }
1578     else {      /* Note: mark already snarfed by pp_list */
1579         SV * const tmpstr = POPs;
1580         STRLEN len;
1581         bool isutf;
1582         static const char oom_string_extend[] =
1583           "Out of memory during string extend";
1584
1585         SvSetSV(TARG, tmpstr);
1586         SvPV_force(TARG, len);
1587         isutf = DO_UTF8(TARG);
1588         if (count != 1) {
1589             if (count < 1)
1590                 SvCUR_set(TARG, 0);
1591             else {
1592                 const STRLEN max = (UV)count * len;
1593                 if (len > MEM_SIZE_MAX / count)
1594                      Perl_croak(aTHX_ oom_string_extend);
1595                 MEM_WRAP_CHECK_1(max, char, oom_string_extend);
1596                 SvGROW(TARG, max + 1);
1597                 repeatcpy(SvPVX(TARG) + len, SvPVX(TARG), len, count - 1);
1598                 SvCUR_set(TARG, SvCUR(TARG) * count);
1599             }
1600             *SvEND(TARG) = '\0';
1601         }
1602         if (isutf)
1603             (void)SvPOK_only_UTF8(TARG);
1604         else
1605             (void)SvPOK_only(TARG);
1606
1607         if (PL_op->op_private & OPpREPEAT_DOLIST) {
1608             /* The parser saw this as a list repeat, and there
1609                are probably several items on the stack. But we're
1610                in scalar context, and there's no pp_list to save us
1611                now. So drop the rest of the items -- robin@kitsite.com
1612              */
1613             dMARK;
1614             SP = MARK;
1615         }
1616         PUSHTARG;
1617     }
1618     RETURN;
1619   }
1620 }
1621
1622 PP(pp_subtract)
1623 {
1624     dVAR; dSP; dATARGET; bool useleft; SV *svl, *svr;
1625     tryAMAGICbin(subtr,opASSIGN);
1626     svl = sv_2num(TOPm1s);
1627     svr = sv_2num(TOPs);
1628     useleft = USE_LEFT(svl);
1629 #ifdef PERL_PRESERVE_IVUV
1630     /* See comments in pp_add (in pp_hot.c) about Overflow, and how
1631        "bad things" happen if you rely on signed integers wrapping.  */
1632     SvIV_please(svr);
1633     if (SvIOK(svr)) {
1634         /* Unless the left argument is integer in range we are going to have to
1635            use NV maths. Hence only attempt to coerce the right argument if
1636            we know the left is integer.  */
1637         register UV auv = 0;
1638         bool auvok = FALSE;
1639         bool a_valid = 0;
1640
1641         if (!useleft) {
1642             auv = 0;
1643             a_valid = auvok = 1;
1644             /* left operand is undef, treat as zero.  */
1645         } else {
1646             /* Left operand is defined, so is it IV? */
1647             SvIV_please(svl);
1648             if (SvIOK(svl)) {
1649                 if ((auvok = SvUOK(svl)))
1650                     auv = SvUVX(svl);
1651                 else {
1652                     register const IV aiv = SvIVX(svl);
1653                     if (aiv >= 0) {
1654                         auv = aiv;
1655                         auvok = 1;      /* Now acting as a sign flag.  */
1656                     } else { /* 2s complement assumption for IV_MIN */
1657                         auv = (UV)-aiv;
1658                     }
1659                 }
1660                 a_valid = 1;
1661             }
1662         }
1663         if (a_valid) {
1664             bool result_good = 0;
1665             UV result;
1666             register UV buv;
1667             bool buvok = SvUOK(svr);
1668         
1669             if (buvok)
1670                 buv = SvUVX(svr);
1671             else {
1672                 register const IV biv = SvIVX(svr);
1673                 if (biv >= 0) {
1674                     buv = biv;
1675                     buvok = 1;
1676                 } else
1677                     buv = (UV)-biv;
1678             }
1679             /* ?uvok if value is >= 0. basically, flagged as UV if it's +ve,
1680                else "IV" now, independent of how it came in.
1681                if a, b represents positive, A, B negative, a maps to -A etc
1682                a - b =>  (a - b)
1683                A - b => -(a + b)
1684                a - B =>  (a + b)
1685                A - B => -(a - b)
1686                all UV maths. negate result if A negative.
1687                subtract if signs same, add if signs differ. */
1688
1689             if (auvok ^ buvok) {
1690                 /* Signs differ.  */
1691                 result = auv + buv;
1692                 if (result >= auv)
1693                     result_good = 1;
1694             } else {
1695                 /* Signs same */
1696                 if (auv >= buv) {
1697                     result = auv - buv;
1698                     /* Must get smaller */
1699                     if (result <= auv)
1700                         result_good = 1;
1701                 } else {
1702                     result = buv - auv;
1703                     if (result <= buv) {
1704                         /* result really should be -(auv-buv). as its negation
1705                            of true value, need to swap our result flag  */
1706                         auvok = !auvok;
1707                         result_good = 1;
1708                     }
1709                 }
1710             }
1711             if (result_good) {
1712                 SP--;
1713                 if (auvok)
1714                     SETu( result );
1715                 else {
1716                     /* Negate result */
1717                     if (result <= (UV)IV_MIN)
1718                         SETi( -(IV)result );
1719                     else {
1720                         /* result valid, but out of range for IV.  */
1721                         SETn( -(NV)result );
1722                     }
1723                 }
1724                 RETURN;
1725             } /* Overflow, drop through to NVs.  */
1726         }
1727     }
1728 #endif
1729     {
1730         NV value = SvNV(svr);
1731         (void)POPs;
1732
1733         if (!useleft) {
1734             /* left operand is undef, treat as zero - value */
1735             SETn(-value);
1736             RETURN;
1737         }
1738         SETn( SvNV(svl) - value );
1739         RETURN;
1740     }
1741 }
1742
1743 PP(pp_left_shift)
1744 {
1745     dVAR; dSP; dATARGET; tryAMAGICbin(lshift,opASSIGN);
1746     {
1747       const IV shift = POPi;
1748       if (PL_op->op_private & HINT_INTEGER) {
1749         const IV i = TOPi;
1750         SETi(i << shift);
1751       }
1752       else {
1753         const UV u = TOPu;
1754         SETu(u << shift);
1755       }
1756       RETURN;
1757     }
1758 }
1759
1760 PP(pp_right_shift)
1761 {
1762     dVAR; dSP; dATARGET; tryAMAGICbin(rshift,opASSIGN);
1763     {
1764       const IV shift = POPi;
1765       if (PL_op->op_private & HINT_INTEGER) {
1766         const IV i = TOPi;
1767         SETi(i >> shift);
1768       }
1769       else {
1770         const UV u = TOPu;
1771         SETu(u >> shift);
1772       }
1773       RETURN;
1774     }
1775 }
1776
1777 PP(pp_lt)
1778 {
1779     dVAR; dSP; tryAMAGICbinSET(lt,0);
1780 #ifdef PERL_PRESERVE_IVUV
1781     SvIV_please(TOPs);
1782     if (SvIOK(TOPs)) {
1783         SvIV_please(TOPm1s);
1784         if (SvIOK(TOPm1s)) {
1785             bool auvok = SvUOK(TOPm1s);
1786             bool buvok = SvUOK(TOPs);
1787         
1788             if (!auvok && !buvok) { /* ## IV < IV ## */
1789                 const IV aiv = SvIVX(TOPm1s);
1790                 const IV biv = SvIVX(TOPs);
1791                 
1792                 SP--;
1793                 SETs(boolSV(aiv < biv));
1794                 RETURN;
1795             }
1796             if (auvok && buvok) { /* ## UV < UV ## */
1797                 const UV auv = SvUVX(TOPm1s);
1798                 const UV buv = SvUVX(TOPs);
1799                 
1800                 SP--;
1801                 SETs(boolSV(auv < buv));
1802                 RETURN;
1803             }
1804             if (auvok) { /* ## UV < IV ## */
1805                 UV auv;
1806                 const IV biv = SvIVX(TOPs);
1807                 SP--;
1808                 if (biv < 0) {
1809                     /* As (a) is a UV, it's >=0, so it cannot be < */
1810                     SETs(&PL_sv_no);
1811                     RETURN;
1812                 }
1813                 auv = SvUVX(TOPs);
1814                 SETs(boolSV(auv < (UV)biv));
1815                 RETURN;
1816             }
1817             { /* ## IV < UV ## */
1818                 const IV aiv = SvIVX(TOPm1s);
1819                 UV buv;
1820                 
1821                 if (aiv < 0) {
1822                     /* As (b) is a UV, it's >=0, so it must be < */
1823                     SP--;
1824                     SETs(&PL_sv_yes);
1825                     RETURN;
1826                 }
1827                 buv = SvUVX(TOPs);
1828                 SP--;
1829                 SETs(boolSV((UV)aiv < buv));
1830                 RETURN;
1831             }
1832         }
1833     }
1834 #endif
1835 #ifndef NV_PRESERVES_UV
1836 #ifdef PERL_PRESERVE_IVUV
1837     else
1838 #endif
1839     if (SvROK(TOPs) && !SvAMAGIC(TOPs) && SvROK(TOPm1s) && !SvAMAGIC(TOPm1s)) {
1840         SP--;
1841         SETs(boolSV(SvRV(TOPs) < SvRV(TOPp1s)));
1842         RETURN;
1843     }
1844 #endif
1845     {
1846 #if defined(NAN_COMPARE_BROKEN) && defined(Perl_isnan)
1847       dPOPTOPnnrl;
1848       if (Perl_isnan(left) || Perl_isnan(right))
1849           RETSETNO;
1850       SETs(boolSV(left < right));
1851 #else
1852       dPOPnv;
1853       SETs(boolSV(TOPn < value));
1854 #endif
1855       RETURN;
1856     }
1857 }
1858
1859 PP(pp_gt)
1860 {
1861     dVAR; dSP; tryAMAGICbinSET(gt,0);
1862 #ifdef PERL_PRESERVE_IVUV
1863     SvIV_please(TOPs);
1864     if (SvIOK(TOPs)) {
1865         SvIV_please(TOPm1s);
1866         if (SvIOK(TOPm1s)) {
1867             bool auvok = SvUOK(TOPm1s);
1868             bool buvok = SvUOK(TOPs);
1869         
1870             if (!auvok && !buvok) { /* ## IV > IV ## */
1871                 const IV aiv = SvIVX(TOPm1s);
1872                 const IV biv = SvIVX(TOPs);
1873
1874                 SP--;
1875                 SETs(boolSV(aiv > biv));
1876                 RETURN;
1877             }
1878             if (auvok && buvok) { /* ## UV > UV ## */
1879                 const UV auv = SvUVX(TOPm1s);
1880                 const UV buv = SvUVX(TOPs);
1881                 
1882                 SP--;
1883                 SETs(boolSV(auv > buv));
1884                 RETURN;
1885             }
1886             if (auvok) { /* ## UV > IV ## */
1887                 UV auv;
1888                 const IV biv = SvIVX(TOPs);
1889
1890                 SP--;
1891                 if (biv < 0) {
1892                     /* As (a) is a UV, it's >=0, so it must be > */
1893                     SETs(&PL_sv_yes);
1894                     RETURN;
1895                 }
1896                 auv = SvUVX(TOPs);
1897                 SETs(boolSV(auv > (UV)biv));
1898                 RETURN;
1899             }
1900             { /* ## IV > UV ## */
1901                 const IV aiv = SvIVX(TOPm1s);
1902                 UV buv;
1903                 
1904                 if (aiv < 0) {
1905                     /* As (b) is a UV, it's >=0, so it cannot be > */
1906                     SP--;
1907                     SETs(&PL_sv_no);
1908                     RETURN;
1909                 }
1910                 buv = SvUVX(TOPs);
1911                 SP--;
1912                 SETs(boolSV((UV)aiv > buv));
1913                 RETURN;
1914             }
1915         }
1916     }
1917 #endif
1918 #ifndef NV_PRESERVES_UV
1919 #ifdef PERL_PRESERVE_IVUV
1920     else
1921 #endif
1922     if (SvROK(TOPs) && !SvAMAGIC(TOPs) && SvROK(TOPm1s) && !SvAMAGIC(TOPm1s)) {
1923         SP--;
1924         SETs(boolSV(SvRV(TOPs) > SvRV(TOPp1s)));
1925         RETURN;
1926     }
1927 #endif
1928     {
1929 #if defined(NAN_COMPARE_BROKEN) && defined(Perl_isnan)
1930       dPOPTOPnnrl;
1931       if (Perl_isnan(left) || Perl_isnan(right))
1932           RETSETNO;
1933       SETs(boolSV(left > right));
1934 #else
1935       dPOPnv;
1936       SETs(boolSV(TOPn > value));
1937 #endif
1938       RETURN;
1939     }
1940 }
1941
1942 PP(pp_le)
1943 {
1944     dVAR; dSP; tryAMAGICbinSET(le,0);
1945 #ifdef PERL_PRESERVE_IVUV
1946     SvIV_please(TOPs);
1947     if (SvIOK(TOPs)) {
1948         SvIV_please(TOPm1s);
1949         if (SvIOK(TOPm1s)) {
1950             bool auvok = SvUOK(TOPm1s);
1951             bool buvok = SvUOK(TOPs);
1952         
1953             if (!auvok && !buvok) { /* ## IV <= IV ## */
1954                 const IV aiv = SvIVX(TOPm1s);
1955                 const IV biv = SvIVX(TOPs);
1956                 
1957                 SP--;
1958                 SETs(boolSV(aiv <= biv));
1959                 RETURN;
1960             }
1961             if (auvok && buvok) { /* ## UV <= UV ## */
1962                 UV auv = SvUVX(TOPm1s);
1963                 UV buv = SvUVX(TOPs);
1964                 
1965                 SP--;
1966                 SETs(boolSV(auv <= buv));
1967                 RETURN;
1968             }
1969             if (auvok) { /* ## UV <= IV ## */
1970                 UV auv;
1971                 const IV biv = SvIVX(TOPs);
1972
1973                 SP--;
1974                 if (biv < 0) {
1975                     /* As (a) is a UV, it's >=0, so a cannot be <= */
1976                     SETs(&PL_sv_no);
1977                     RETURN;
1978                 }
1979                 auv = SvUVX(TOPs);
1980                 SETs(boolSV(auv <= (UV)biv));
1981                 RETURN;
1982             }
1983             { /* ## IV <= UV ## */
1984                 const IV aiv = SvIVX(TOPm1s);
1985                 UV buv;
1986
1987                 if (aiv < 0) {
1988                     /* As (b) is a UV, it's >=0, so a must be <= */
1989                     SP--;
1990                     SETs(&PL_sv_yes);
1991                     RETURN;
1992                 }
1993                 buv = SvUVX(TOPs);
1994                 SP--;
1995                 SETs(boolSV((UV)aiv <= buv));
1996                 RETURN;
1997             }
1998         }
1999     }
2000 #endif
2001 #ifndef NV_PRESERVES_UV
2002 #ifdef PERL_PRESERVE_IVUV
2003     else
2004 #endif
2005     if (SvROK(TOPs) && !SvAMAGIC(TOPs) && SvROK(TOPm1s) && !SvAMAGIC(TOPm1s)) {
2006         SP--;
2007         SETs(boolSV(SvRV(TOPs) <= SvRV(TOPp1s)));
2008         RETURN;
2009     }
2010 #endif
2011     {
2012 #if defined(NAN_COMPARE_BROKEN) && defined(Perl_isnan)
2013       dPOPTOPnnrl;
2014       if (Perl_isnan(left) || Perl_isnan(right))
2015           RETSETNO;
2016       SETs(boolSV(left <= right));
2017 #else
2018       dPOPnv;
2019       SETs(boolSV(TOPn <= value));
2020 #endif
2021       RETURN;
2022     }
2023 }
2024
2025 PP(pp_ge)
2026 {
2027     dVAR; dSP; tryAMAGICbinSET(ge,0);
2028 #ifdef PERL_PRESERVE_IVUV
2029     SvIV_please(TOPs);
2030     if (SvIOK(TOPs)) {
2031         SvIV_please(TOPm1s);
2032         if (SvIOK(TOPm1s)) {
2033             bool auvok = SvUOK(TOPm1s);
2034             bool buvok = SvUOK(TOPs);
2035         
2036             if (!auvok && !buvok) { /* ## IV >= IV ## */
2037                 const IV aiv = SvIVX(TOPm1s);
2038                 const IV biv = SvIVX(TOPs);
2039
2040                 SP--;
2041                 SETs(boolSV(aiv >= biv));
2042                 RETURN;
2043             }
2044             if (auvok && buvok) { /* ## UV >= UV ## */
2045                 const UV auv = SvUVX(TOPm1s);
2046                 const UV buv = SvUVX(TOPs);
2047
2048                 SP--;
2049                 SETs(boolSV(auv >= buv));
2050                 RETURN;
2051             }
2052             if (auvok) { /* ## UV >= IV ## */
2053                 UV auv;
2054                 const IV biv = SvIVX(TOPs);
2055
2056                 SP--;
2057                 if (biv < 0) {
2058                     /* As (a) is a UV, it's >=0, so it must be >= */
2059                     SETs(&PL_sv_yes);
2060                     RETURN;
2061                 }
2062                 auv = SvUVX(TOPs);
2063                 SETs(boolSV(auv >= (UV)biv));
2064                 RETURN;
2065             }
2066             { /* ## IV >= UV ## */
2067                 const IV aiv = SvIVX(TOPm1s);
2068                 UV buv;
2069
2070                 if (aiv < 0) {
2071                     /* As (b) is a UV, it's >=0, so a cannot be >= */
2072                     SP--;
2073                     SETs(&PL_sv_no);
2074                     RETURN;
2075                 }
2076                 buv = SvUVX(TOPs);
2077                 SP--;
2078                 SETs(boolSV((UV)aiv >= buv));
2079                 RETURN;
2080             }
2081         }
2082     }
2083 #endif
2084 #ifndef NV_PRESERVES_UV
2085 #ifdef PERL_PRESERVE_IVUV
2086     else
2087 #endif
2088     if (SvROK(TOPs) && !SvAMAGIC(TOPs) && SvROK(TOPm1s) && !SvAMAGIC(TOPm1s)) {
2089         SP--;
2090         SETs(boolSV(SvRV(TOPs) >= SvRV(TOPp1s)));
2091         RETURN;
2092     }
2093 #endif
2094     {
2095 #if defined(NAN_COMPARE_BROKEN) && defined(Perl_isnan)
2096       dPOPTOPnnrl;
2097       if (Perl_isnan(left) || Perl_isnan(right))
2098           RETSETNO;
2099       SETs(boolSV(left >= right));
2100 #else
2101       dPOPnv;
2102       SETs(boolSV(TOPn >= value));
2103 #endif
2104       RETURN;
2105     }
2106 }
2107
2108 PP(pp_ne)
2109 {
2110     dVAR; dSP; tryAMAGICbinSET(ne,0);
2111 #ifndef NV_PRESERVES_UV
2112     if (SvROK(TOPs) && !SvAMAGIC(TOPs) && SvROK(TOPm1s) && !SvAMAGIC(TOPm1s)) {
2113         SP--;
2114         SETs(boolSV(SvRV(TOPs) != SvRV(TOPp1s)));
2115         RETURN;
2116     }
2117 #endif
2118 #ifdef PERL_PRESERVE_IVUV
2119     SvIV_please(TOPs);
2120     if (SvIOK(TOPs)) {
2121         SvIV_please(TOPm1s);
2122         if (SvIOK(TOPm1s)) {
2123             const bool auvok = SvUOK(TOPm1s);
2124             const bool buvok = SvUOK(TOPs);
2125         
2126             if (auvok == buvok) { /* ## IV == IV or UV == UV ## */
2127                 /* Casting IV to UV before comparison isn't going to matter
2128                    on 2s complement. On 1s complement or sign&magnitude
2129                    (if we have any of them) it could make negative zero
2130                    differ from normal zero. As I understand it. (Need to
2131                    check - is negative zero implementation defined behaviour
2132                    anyway?). NWC  */
2133                 const UV buv = SvUVX(POPs);
2134                 const UV auv = SvUVX(TOPs);
2135
2136                 SETs(boolSV(auv != buv));
2137                 RETURN;
2138             }
2139             {                   /* ## Mixed IV,UV ## */
2140                 IV iv;
2141                 UV uv;
2142                 
2143                 /* != is commutative so swap if needed (save code) */
2144                 if (auvok) {
2145                     /* swap. top of stack (b) is the iv */
2146                     iv = SvIVX(TOPs);
2147                     SP--;
2148                     if (iv < 0) {
2149                         /* As (a) is a UV, it's >0, so it cannot be == */
2150                         SETs(&PL_sv_yes);
2151                         RETURN;
2152                     }
2153                     uv = SvUVX(TOPs);
2154                 } else {
2155                     iv = SvIVX(TOPm1s);
2156                     SP--;
2157                     if (iv < 0) {
2158                         /* As (b) is a UV, it's >0, so it cannot be == */
2159                         SETs(&PL_sv_yes);
2160                         RETURN;
2161                     }
2162                     uv = SvUVX(*(SP+1)); /* Do I want TOPp1s() ? */
2163                 }
2164                 SETs(boolSV((UV)iv != uv));
2165                 RETURN;
2166             }
2167         }
2168     }
2169 #endif
2170     {
2171 #if defined(NAN_COMPARE_BROKEN) && defined(Perl_isnan)
2172       dPOPTOPnnrl;
2173       if (Perl_isnan(left) || Perl_isnan(right))
2174           RETSETYES;
2175       SETs(boolSV(left != right));
2176 #else
2177       dPOPnv;
2178       SETs(boolSV(TOPn != value));
2179 #endif
2180       RETURN;
2181     }
2182 }
2183
2184 PP(pp_ncmp)
2185 {
2186     dVAR; dSP; dTARGET; tryAMAGICbin(ncmp,0);
2187 #ifndef NV_PRESERVES_UV
2188     if (SvROK(TOPs) && !SvAMAGIC(TOPs) && SvROK(TOPm1s) && !SvAMAGIC(TOPm1s)) {
2189         const UV right = PTR2UV(SvRV(POPs));
2190         const UV left = PTR2UV(SvRV(TOPs));
2191         SETi((left > right) - (left < right));
2192         RETURN;
2193     }
2194 #endif
2195 #ifdef PERL_PRESERVE_IVUV
2196     /* Fortunately it seems NaN isn't IOK */
2197     SvIV_please(TOPs);
2198     if (SvIOK(TOPs)) {
2199         SvIV_please(TOPm1s);
2200         if (SvIOK(TOPm1s)) {
2201             const bool leftuvok = SvUOK(TOPm1s);
2202             const bool rightuvok = SvUOK(TOPs);
2203             I32 value;
2204             if (!leftuvok && !rightuvok) { /* ## IV <=> IV ## */
2205                 const IV leftiv = SvIVX(TOPm1s);
2206                 const IV rightiv = SvIVX(TOPs);
2207                 
2208                 if (leftiv > rightiv)
2209                     value = 1;
2210                 else if (leftiv < rightiv)
2211                     value = -1;
2212                 else
2213                     value = 0;
2214             } else if (leftuvok && rightuvok) { /* ## UV <=> UV ## */
2215                 const UV leftuv = SvUVX(TOPm1s);
2216                 const UV rightuv = SvUVX(TOPs);
2217                 
2218                 if (leftuv > rightuv)
2219                     value = 1;
2220                 else if (leftuv < rightuv)
2221                     value = -1;
2222                 else
2223                     value = 0;
2224             } else if (leftuvok) { /* ## UV <=> IV ## */
2225                 const IV rightiv = SvIVX(TOPs);
2226                 if (rightiv < 0) {
2227                     /* As (a) is a UV, it's >=0, so it cannot be < */
2228                     value = 1;
2229                 } else {
2230                     const UV leftuv = SvUVX(TOPm1s);
2231                     if (leftuv > (UV)rightiv) {
2232                         value = 1;
2233                     } else if (leftuv < (UV)rightiv) {
2234                         value = -1;
2235                     } else {
2236                         value = 0;
2237                     }
2238                 }
2239             } else { /* ## IV <=> UV ## */
2240                 const IV leftiv = SvIVX(TOPm1s);
2241                 if (leftiv < 0) {
2242                     /* As (b) is a UV, it's >=0, so it must be < */
2243                     value = -1;
2244                 } else {
2245                     const UV rightuv = SvUVX(TOPs);
2246                     if ((UV)leftiv > rightuv) {
2247                         value = 1;
2248                     } else if ((UV)leftiv < rightuv) {
2249                         value = -1;
2250                     } else {
2251                         value = 0;
2252                     }
2253                 }
2254             }
2255             SP--;
2256             SETi(value);
2257             RETURN;
2258         }
2259     }
2260 #endif
2261     {
2262       dPOPTOPnnrl;
2263       I32 value;
2264
2265 #ifdef Perl_isnan
2266       if (Perl_isnan(left) || Perl_isnan(right)) {
2267           SETs(&PL_sv_undef);
2268           RETURN;
2269        }
2270       value = (left > right) - (left < right);
2271 #else
2272       if (left == right)
2273         value = 0;
2274       else if (left < right)
2275         value = -1;
2276       else if (left > right)
2277         value = 1;
2278       else {
2279         SETs(&PL_sv_undef);
2280         RETURN;
2281       }
2282 #endif
2283       SETi(value);
2284       RETURN;
2285     }
2286 }
2287
2288 PP(pp_sle)
2289 {
2290     dVAR; dSP;
2291
2292     int amg_type = sle_amg;
2293     int multiplier = 1;
2294     int rhs = 1;
2295
2296     switch (PL_op->op_type) {
2297     case OP_SLT:
2298         amg_type = slt_amg;
2299         /* cmp < 0 */
2300         rhs = 0;
2301         break;
2302     case OP_SGT:
2303         amg_type = sgt_amg;
2304         /* cmp > 0 */
2305         multiplier = -1;
2306         rhs = 0;
2307         break;
2308     case OP_SGE:
2309         amg_type = sge_amg;
2310         /* cmp >= 0 */
2311         multiplier = -1;
2312         break;
2313     }
2314
2315     tryAMAGICbinSET_var(amg_type,0);
2316     {
2317       dPOPTOPssrl;
2318       const int cmp = (IN_LOCALE_RUNTIME
2319                  ? sv_cmp_locale(left, right)
2320                  : sv_cmp(left, right));
2321       SETs(boolSV(cmp * multiplier < rhs));
2322       RETURN;
2323     }
2324 }
2325
2326 PP(pp_seq)
2327 {
2328     dVAR; dSP; tryAMAGICbinSET(seq,0);
2329     {
2330       dPOPTOPssrl;
2331       SETs(boolSV(sv_eq(left, right)));
2332       RETURN;
2333     }
2334 }
2335
2336 PP(pp_sne)
2337 {
2338     dVAR; dSP; tryAMAGICbinSET(sne,0);
2339     {
2340       dPOPTOPssrl;
2341       SETs(boolSV(!sv_eq(left, right)));
2342       RETURN;
2343     }
2344 }
2345
2346 PP(pp_scmp)
2347 {
2348     dVAR; dSP; dTARGET;  tryAMAGICbin(scmp,0);
2349     {
2350       dPOPTOPssrl;
2351       const int cmp = (IN_LOCALE_RUNTIME
2352                  ? sv_cmp_locale(left, right)
2353                  : sv_cmp(left, right));
2354       SETi( cmp );
2355       RETURN;
2356     }
2357 }
2358
2359 PP(pp_bit_and)
2360 {
2361     dVAR; dSP; dATARGET; tryAMAGICbin(band,opASSIGN);
2362     {
2363       dPOPTOPssrl;
2364       SvGETMAGIC(left);
2365       SvGETMAGIC(right);
2366       if (SvNIOKp(left) || SvNIOKp(right)) {
2367         if (PL_op->op_private & HINT_INTEGER) {
2368           const IV i = SvIV_nomg(left) & SvIV_nomg(right);
2369           SETi(i);
2370         }
2371         else {
2372           const UV u = SvUV_nomg(left) & SvUV_nomg(right);
2373           SETu(u);
2374         }
2375       }
2376       else {
2377         do_vop(PL_op->op_type, TARG, left, right);
2378         SETTARG;
2379       }
2380       RETURN;
2381     }
2382 }
2383
2384 PP(pp_bit_or)
2385 {
2386     dVAR; dSP; dATARGET;
2387     const int op_type = PL_op->op_type;
2388
2389     tryAMAGICbin_var((op_type == OP_BIT_OR ? bor_amg : bxor_amg), opASSIGN);
2390     {
2391       dPOPTOPssrl;
2392       SvGETMAGIC(left);
2393       SvGETMAGIC(right);
2394       if (SvNIOKp(left) || SvNIOKp(right)) {
2395         if (PL_op->op_private & HINT_INTEGER) {
2396           const IV l = (USE_LEFT(left) ? SvIV_nomg(left) : 0);
2397           const IV r = SvIV_nomg(right);
2398           const IV result = op_type == OP_BIT_OR ? (l | r) : (l ^ r);
2399           SETi(result);
2400         }
2401         else {
2402           const UV l = (USE_LEFT(left) ? SvUV_nomg(left) : 0);
2403           const UV r = SvUV_nomg(right);
2404           const UV result = op_type == OP_BIT_OR ? (l | r) : (l ^ r);
2405           SETu(result);
2406         }
2407       }
2408       else {
2409         do_vop(op_type, TARG, left, right);
2410         SETTARG;
2411       }
2412       RETURN;
2413     }
2414 }
2415
2416 PP(pp_negate)
2417 {
2418     dVAR; dSP; dTARGET; tryAMAGICun(neg);
2419     {
2420         SV * const sv = sv_2num(TOPs);
2421         const int flags = SvFLAGS(sv);
2422         SvGETMAGIC(sv);
2423         if ((flags & SVf_IOK) || ((flags & (SVp_IOK | SVp_NOK)) == SVp_IOK)) {
2424             /* It's publicly an integer, or privately an integer-not-float */
2425         oops_its_an_int:
2426             if (SvIsUV(sv)) {
2427                 if (SvIVX(sv) == IV_MIN) {
2428                     /* 2s complement assumption. */
2429                     SETi(SvIVX(sv));    /* special case: -((UV)IV_MAX+1) == IV_MIN */
2430                     RETURN;
2431                 }
2432                 else if (SvUVX(sv) <= IV_MAX) {
2433                     SETi(-SvIVX(sv));
2434                     RETURN;
2435                 }
2436             }
2437             else if (SvIVX(sv) != IV_MIN) {
2438                 SETi(-SvIVX(sv));
2439                 RETURN;
2440             }
2441 #ifdef PERL_PRESERVE_IVUV
2442             else {
2443                 SETu((UV)IV_MIN);
2444                 RETURN;
2445             }
2446 #endif
2447         }
2448         if (SvNIOKp(sv))
2449             SETn(-SvNV(sv));
2450         else if (SvPOKp(sv)) {
2451             STRLEN len;
2452             const char * const s = SvPV_const(sv, len);
2453             if (isIDFIRST(*s)) {
2454                 sv_setpvs(TARG, "-");
2455                 sv_catsv(TARG, sv);
2456             }
2457             else if (*s == '+' || *s == '-') {
2458                 sv_setsv(TARG, sv);
2459                 *SvPV_force(TARG, len) = *s == '-' ? '+' : '-';
2460             }
2461             else if (DO_UTF8(sv)) {
2462                 SvIV_please(sv);
2463                 if (SvIOK(sv))
2464                     goto oops_its_an_int;
2465                 if (SvNOK(sv))
2466                     sv_setnv(TARG, -SvNV(sv));
2467                 else {
2468                     sv_setpvs(TARG, "-");
2469                     sv_catsv(TARG, sv);
2470                 }
2471             }
2472             else {
2473                 SvIV_please(sv);
2474                 if (SvIOK(sv))
2475                   goto oops_its_an_int;
2476                 sv_setnv(TARG, -SvNV(sv));
2477             }
2478             SETTARG;
2479         }
2480         else
2481             SETn(-SvNV(sv));
2482     }
2483     RETURN;
2484 }
2485
2486 PP(pp_not)
2487 {
2488     dVAR; dSP; tryAMAGICunSET(not);
2489     *PL_stack_sp = boolSV(!SvTRUE(*PL_stack_sp));
2490     return NORMAL;
2491 }
2492
2493 PP(pp_complement)
2494 {
2495     dVAR; dSP; dTARGET; tryAMAGICun(compl);
2496     {
2497       dTOPss;
2498       SvGETMAGIC(sv);
2499       if (SvNIOKp(sv)) {
2500         if (PL_op->op_private & HINT_INTEGER) {
2501           const IV i = ~SvIV_nomg(sv);
2502           SETi(i);
2503         }
2504         else {
2505           const UV u = ~SvUV_nomg(sv);
2506           SETu(u);
2507         }
2508       }
2509       else {
2510         register U8 *tmps;
2511         register I32 anum;
2512         STRLEN len;
2513
2514         (void)SvPV_nomg_const(sv,len); /* force check for uninit var */
2515         sv_setsv_nomg(TARG, sv);
2516         tmps = (U8*)SvPV_force(TARG, len);
2517         anum = len;
2518         if (SvUTF8(TARG)) {
2519           /* Calculate exact length, let's not estimate. */
2520           STRLEN targlen = 0;
2521           STRLEN l;
2522           UV nchar = 0;
2523           UV nwide = 0;
2524           U8 * const send = tmps + len;
2525           U8 * const origtmps = tmps;
2526           const UV utf8flags = UTF8_ALLOW_ANYUV;
2527
2528           while (tmps < send) {
2529             const UV c = utf8n_to_uvchr(tmps, send-tmps, &l, utf8flags);
2530             tmps += l;
2531             targlen += UNISKIP(~c);
2532             nchar++;
2533             if (c > 0xff)
2534                 nwide++;
2535           }
2536
2537           /* Now rewind strings and write them. */
2538           tmps = origtmps;
2539
2540           if (nwide) {
2541               U8 *result;
2542               U8 *p;
2543
2544               Newx(result, targlen + 1, U8);
2545               p = result;
2546               while (tmps < send) {
2547                   const UV c = utf8n_to_uvchr(tmps, send-tmps, &l, utf8flags);
2548                   tmps += l;
2549                   p = uvchr_to_utf8_flags(p, ~c, UNICODE_ALLOW_ANY);
2550               }
2551               *p = '\0';
2552               sv_usepvn_flags(TARG, (char*)result, targlen,
2553                               SV_HAS_TRAILING_NUL);
2554               SvUTF8_on(TARG);
2555           }
2556           else {
2557               U8 *result;
2558               U8 *p;
2559
2560               Newx(result, nchar + 1, U8);
2561               p = result;
2562               while (tmps < send) {
2563                   const U8 c = (U8)utf8n_to_uvchr(tmps, send-tmps, &l, utf8flags);
2564                   tmps += l;
2565                   *p++ = ~c;
2566               }
2567               *p = '\0';
2568               sv_usepvn_flags(TARG, (char*)result, nchar, SV_HAS_TRAILING_NUL);
2569               SvUTF8_off(TARG);
2570           }
2571           SETTARG;
2572           RETURN;
2573         }
2574 #ifdef LIBERAL
2575         {
2576             register long *tmpl;
2577             for ( ; anum && (unsigned long)tmps % sizeof(long); anum--, tmps++)
2578                 *tmps = ~*tmps;
2579             tmpl = (long*)tmps;
2580             for ( ; anum >= (I32)sizeof(long); anum -= (I32)sizeof(long), tmpl++)
2581                 *tmpl = ~*tmpl;
2582             tmps = (U8*)tmpl;
2583         }
2584 #endif
2585         for ( ; anum > 0; anum--, tmps++)
2586             *tmps = ~*tmps;
2587         SETTARG;
2588       }
2589       RETURN;
2590     }
2591 }
2592
2593 /* integer versions of some of the above */
2594
2595 PP(pp_i_multiply)
2596 {
2597     dVAR; dSP; dATARGET; tryAMAGICbin(mult,opASSIGN);
2598     {
2599       dPOPTOPiirl;
2600       SETi( left * right );
2601       RETURN;
2602     }
2603 }
2604
2605 PP(pp_i_divide)
2606 {
2607     IV num;
2608     dVAR; dSP; dATARGET; tryAMAGICbin(div,opASSIGN);
2609     {
2610       dPOPiv;
2611       if (value == 0)
2612           DIE(aTHX_ "Illegal division by zero");
2613       num = POPi;
2614
2615       /* avoid FPE_INTOVF on some platforms when num is IV_MIN */
2616       if (value == -1)
2617           value = - num;
2618       else
2619           value = num / value;
2620       PUSHi( value );
2621       RETURN;
2622     }
2623 }
2624
2625 #if defined(__GLIBC__) && IVSIZE == 8
2626 STATIC
2627 PP(pp_i_modulo_0)
2628 #else
2629 PP(pp_i_modulo)
2630 #endif
2631 {
2632      /* This is the vanilla old i_modulo. */
2633      dVAR; dSP; dATARGET; tryAMAGICbin(modulo,opASSIGN);
2634      {
2635           dPOPTOPiirl;
2636           if (!right)
2637                DIE(aTHX_ "Illegal modulus zero");
2638           /* avoid FPE_INTOVF on some platforms when left is IV_MIN */
2639           if (right == -1)
2640               SETi( 0 );
2641           else
2642               SETi( left % right );
2643           RETURN;
2644      }
2645 }
2646
2647 #if defined(__GLIBC__) && IVSIZE == 8
2648 STATIC
2649 PP(pp_i_modulo_1)
2650
2651 {
2652      /* This is the i_modulo with the workaround for the _moddi3 bug
2653       * in (at least) glibc 2.2.5 (the PERL_ABS() the workaround).
2654       * See below for pp_i_modulo. */
2655      dVAR; dSP; dATARGET; tryAMAGICbin(modulo,opASSIGN);
2656      {
2657           dPOPTOPiirl;
2658           if (!right)
2659                DIE(aTHX_ "Illegal modulus zero");
2660           /* avoid FPE_INTOVF on some platforms when left is IV_MIN */
2661           if (right == -1)
2662               SETi( 0 );
2663           else
2664               SETi( left % PERL_ABS(right) );
2665           RETURN;
2666      }
2667 }
2668
2669 PP(pp_i_modulo)
2670 {
2671      dVAR; dSP; dATARGET; tryAMAGICbin(modulo,opASSIGN);
2672      {
2673           dPOPTOPiirl;
2674           if (!right)
2675                DIE(aTHX_ "Illegal modulus zero");
2676           /* The assumption is to use hereafter the old vanilla version... */
2677           PL_op->op_ppaddr =
2678                PL_ppaddr[OP_I_MODULO] =
2679                    Perl_pp_i_modulo_0;
2680           /* .. but if we have glibc, we might have a buggy _moddi3
2681            * (at least glicb 2.2.5 is known to have this bug), in other
2682            * words our integer modulus with negative quad as the second
2683            * argument might be broken.  Test for this and re-patch the
2684            * opcode dispatch table if that is the case, remembering to
2685            * also apply the workaround so that this first round works
2686            * right, too.  See [perl #9402] for more information. */
2687           {
2688                IV l =   3;
2689                IV r = -10;
2690                /* Cannot do this check with inlined IV constants since
2691                 * that seems to work correctly even with the buggy glibc. */
2692                if (l % r == -3) {
2693                     /* Yikes, we have the bug.
2694                      * Patch in the workaround version. */
2695                     PL_op->op_ppaddr =
2696                          PL_ppaddr[OP_I_MODULO] =
2697                              &Perl_pp_i_modulo_1;
2698                     /* Make certain we work right this time, too. */
2699                     right = PERL_ABS(right);
2700                }
2701           }
2702           /* avoid FPE_INTOVF on some platforms when left is IV_MIN */
2703           if (right == -1)
2704               SETi( 0 );
2705           else
2706               SETi( left % right );
2707           RETURN;
2708      }
2709 }
2710 #endif
2711
2712 PP(pp_i_add)
2713 {
2714     dVAR; dSP; dATARGET; tryAMAGICbin(add,opASSIGN);
2715     {
2716       dPOPTOPiirl_ul;
2717       SETi( left + right );
2718       RETURN;
2719     }
2720 }
2721
2722 PP(pp_i_subtract)
2723 {
2724     dVAR; dSP; dATARGET; tryAMAGICbin(subtr,opASSIGN);
2725     {
2726       dPOPTOPiirl_ul;
2727       SETi( left - right );
2728       RETURN;
2729     }
2730 }
2731
2732 PP(pp_i_lt)
2733 {
2734     dVAR; dSP; tryAMAGICbinSET(lt,0);
2735     {
2736       dPOPTOPiirl;
2737       SETs(boolSV(left < right));
2738       RETURN;
2739     }
2740 }
2741
2742 PP(pp_i_gt)
2743 {
2744     dVAR; dSP; tryAMAGICbinSET(gt,0);
2745     {
2746       dPOPTOPiirl;
2747       SETs(boolSV(left > right));
2748       RETURN;
2749     }
2750 }
2751
2752 PP(pp_i_le)
2753 {
2754     dVAR; dSP; tryAMAGICbinSET(le,0);
2755     {
2756       dPOPTOPiirl;
2757       SETs(boolSV(left <= right));
2758       RETURN;
2759     }
2760 }
2761
2762 PP(pp_i_ge)
2763 {
2764     dVAR; dSP; tryAMAGICbinSET(ge,0);
2765     {
2766       dPOPTOPiirl;
2767       SETs(boolSV(left >= right));
2768       RETURN;
2769     }
2770 }
2771
2772 PP(pp_i_eq)
2773 {
2774     dVAR; dSP; tryAMAGICbinSET(eq,0);
2775     {
2776       dPOPTOPiirl;
2777       SETs(boolSV(left == right));
2778       RETURN;
2779     }
2780 }
2781
2782 PP(pp_i_ne)
2783 {
2784     dVAR; dSP; tryAMAGICbinSET(ne,0);
2785     {
2786       dPOPTOPiirl;
2787       SETs(boolSV(left != right));
2788       RETURN;
2789     }
2790 }
2791
2792 PP(pp_i_ncmp)
2793 {
2794     dVAR; dSP; dTARGET; tryAMAGICbin(ncmp,0);
2795     {
2796       dPOPTOPiirl;
2797       I32 value;
2798
2799       if (left > right)
2800         value = 1;
2801       else if (left < right)
2802         value = -1;
2803       else
2804         value = 0;
2805       SETi(value);
2806       RETURN;
2807     }
2808 }
2809
2810 PP(pp_i_negate)
2811 {
2812     dVAR; dSP; dTARGET; tryAMAGICun(neg);
2813     SETi(-TOPi);
2814     RETURN;
2815 }
2816
2817 /* High falutin' math. */
2818
2819 PP(pp_atan2)
2820 {
2821     dVAR; dSP; dTARGET; tryAMAGICbin(atan2,0);
2822     {
2823       dPOPTOPnnrl;
2824       SETn(Perl_atan2(left, right));
2825       RETURN;
2826     }
2827 }
2828
2829 PP(pp_sin)
2830 {
2831     dVAR; dSP; dTARGET;
2832     int amg_type = sin_amg;
2833     const char *neg_report = NULL;
2834     NV (*func)(NV) = Perl_sin;
2835     const int op_type = PL_op->op_type;
2836
2837     switch (op_type) {
2838     case OP_COS:
2839         amg_type = cos_amg;
2840         func = Perl_cos;
2841         break;
2842     case OP_EXP:
2843         amg_type = exp_amg;
2844         func = Perl_exp;
2845         break;
2846     case OP_LOG:
2847         amg_type = log_amg;
2848         func = Perl_log;
2849         neg_report = "log";
2850         break;
2851     case OP_SQRT:
2852         amg_type = sqrt_amg;
2853         func = Perl_sqrt;
2854         neg_report = "sqrt";
2855         break;
2856     }
2857
2858     tryAMAGICun_var(amg_type);
2859     {
2860       const NV value = POPn;
2861       if (neg_report) {
2862           if (op_type == OP_LOG ? (value <= 0.0) : (value < 0.0)) {
2863               SET_NUMERIC_STANDARD();
2864               DIE(aTHX_ "Can't take %s of %"NVgf, neg_report, value);
2865           }
2866       }
2867       XPUSHn(func(value));
2868       RETURN;
2869     }
2870 }
2871
2872 /* Support Configure command-line overrides for rand() functions.
2873    After 5.005, perhaps we should replace this by Configure support
2874    for drand48(), random(), or rand().  For 5.005, though, maintain
2875    compatibility by calling rand() but allow the user to override it.
2876    See INSTALL for details.  --Andy Dougherty  15 July 1998
2877 */
2878 /* Now it's after 5.005, and Configure supports drand48() and random(),
2879    in addition to rand().  So the overrides should not be needed any more.
2880    --Jarkko Hietaniemi  27 September 1998
2881  */
2882
2883 #ifndef HAS_DRAND48_PROTO
2884 extern double drand48 (void);
2885 #endif
2886
2887 PP(pp_rand)
2888 {
2889     dVAR; dSP; dTARGET;
2890     NV value;
2891     if (MAXARG < 1)
2892         value = 1.0;
2893     else
2894         value = POPn;
2895     if (value == 0.0)
2896         value = 1.0;
2897     if (!PL_srand_called) {
2898         (void)seedDrand01((Rand_seed_t)seed());
2899         PL_srand_called = TRUE;
2900     }
2901     value *= Drand01();
2902     XPUSHn(value);
2903     RETURN;
2904 }
2905
2906 PP(pp_srand)
2907 {
2908     dVAR; dSP;
2909     const UV anum = (MAXARG < 1) ? seed() : POPu;
2910     (void)seedDrand01((Rand_seed_t)anum);
2911     PL_srand_called = TRUE;
2912     EXTEND(SP, 1);
2913     RETPUSHYES;
2914 }
2915
2916 PP(pp_int)
2917 {
2918     dVAR; dSP; dTARGET; tryAMAGICun(int);
2919     {
2920       SV * const sv = sv_2num(TOPs);
2921       const IV iv = SvIV(sv);
2922       /* XXX it's arguable that compiler casting to IV might be subtly
2923          different from modf (for numbers inside (IV_MIN,UV_MAX)) in which
2924          else preferring IV has introduced a subtle behaviour change bug. OTOH
2925          relying on floating point to be accurate is a bug.  */
2926
2927       if (!SvOK(sv)) {
2928         SETu(0);
2929       }
2930       else if (SvIOK(sv)) {
2931         if (SvIsUV(sv))
2932             SETu(SvUV(sv));
2933         else
2934             SETi(iv);
2935       }
2936       else {
2937           const NV value = SvNV(sv);
2938           if (value >= 0.0) {
2939               if (value < (NV)UV_MAX + 0.5) {
2940                   SETu(U_V(value));
2941               } else {
2942                   SETn(Perl_floor(value));
2943               }
2944           }
2945           else {
2946               if (value > (NV)IV_MIN - 0.5) {
2947                   SETi(I_V(value));
2948               } else {
2949                   SETn(Perl_ceil(value));
2950               }
2951           }
2952       }
2953     }
2954     RETURN;
2955 }
2956
2957 PP(pp_abs)
2958 {
2959     dVAR; dSP; dTARGET; tryAMAGICun(abs);
2960     {
2961       SV * const sv = sv_2num(TOPs);
2962       /* This will cache the NV value if string isn't actually integer  */
2963       const IV iv = SvIV(sv);
2964
2965       if (!SvOK(sv)) {
2966         SETu(0);
2967       }
2968       else if (SvIOK(sv)) {
2969         /* IVX is precise  */
2970         if (SvIsUV(sv)) {
2971           SETu(SvUV(sv));       /* force it to be numeric only */
2972         } else {
2973           if (iv >= 0) {
2974             SETi(iv);
2975           } else {
2976             if (iv != IV_MIN) {
2977               SETi(-iv);
2978             } else {
2979               /* 2s complement assumption. Also, not really needed as
2980                  IV_MIN and -IV_MIN should both be %100...00 and NV-able  */
2981               SETu(IV_MIN);
2982             }
2983           }
2984         }
2985       } else{
2986         const NV value = SvNV(sv);
2987         if (value < 0.0)
2988           SETn(-value);
2989         else
2990           SETn(value);
2991       }
2992     }
2993     RETURN;
2994 }
2995
2996 PP(pp_oct)
2997 {
2998     dVAR; dSP; dTARGET;
2999     const char *tmps;
3000     I32 flags = PERL_SCAN_ALLOW_UNDERSCORES;
3001     STRLEN len;
3002     NV result_nv;
3003     UV result_uv;
3004     SV* const sv = POPs;
3005
3006     tmps = (SvPV_const(sv, len));
3007     if (DO_UTF8(sv)) {
3008          /* If Unicode, try to downgrade
3009           * If not possible, croak. */
3010          SV* const tsv = sv_2mortal(newSVsv(sv));
3011         
3012          SvUTF8_on(tsv);
3013          sv_utf8_downgrade(tsv, FALSE);
3014          tmps = SvPV_const(tsv, len);
3015     }
3016     if (PL_op->op_type == OP_HEX)
3017         goto hex;
3018
3019     while (*tmps && len && isSPACE(*tmps))
3020         tmps++, len--;
3021     if (*tmps == '0')
3022         tmps++, len--;
3023     if (*tmps == 'x') {
3024     hex:
3025         result_uv = grok_hex (tmps, &len, &flags, &result_nv);
3026     }
3027     else if (*tmps == 'b')
3028         result_uv = grok_bin (tmps, &len, &flags, &result_nv);
3029     else
3030         result_uv = grok_oct (tmps, &len, &flags, &result_nv);
3031
3032     if (flags & PERL_SCAN_GREATER_THAN_UV_MAX) {
3033         XPUSHn(result_nv);
3034     }
3035     else {
3036         XPUSHu(result_uv);
3037     }
3038     RETURN;
3039 }
3040
3041 /* String stuff. */
3042
3043 PP(pp_length)
3044 {
3045     dVAR; dSP; dTARGET;
3046     SV * const sv = TOPs;
3047
3048     if (SvGAMAGIC(sv)) {
3049         /* For an overloaded or magic scalar, we can't know in advance if
3050            it's going to be UTF-8 or not. Also, we can't call sv_len_utf8 as
3051            it likes to cache the length. Maybe that should be a documented
3052            feature of it.
3053         */
3054         STRLEN len;
3055         const char *const p
3056             = sv_2pv_flags(sv, &len,
3057                            SV_UNDEF_RETURNS_NULL|SV_CONST_RETURN|SV_GMAGIC);
3058
3059         if (!p)
3060             SETs(&PL_sv_undef);
3061         else if (DO_UTF8(sv)) {
3062             SETi(utf8_length((U8*)p, (U8*)p + len));
3063         }
3064         else
3065             SETi(len);
3066     } else if (SvOK(sv)) {
3067         /* Neither magic nor overloaded.  */
3068         if (DO_UTF8(sv))
3069             SETi(sv_len_utf8(sv));
3070         else
3071             SETi(sv_len(sv));
3072     } else {
3073         SETs(&PL_sv_undef);
3074     }
3075     RETURN;
3076 }
3077
3078 PP(pp_substr)
3079 {
3080     dVAR; dSP; dTARGET;
3081     SV *sv;
3082     I32 len = 0;
3083     STRLEN curlen;
3084     STRLEN utf8_curlen;
3085     I32 pos;
3086     I32 rem;
3087     I32 fail;
3088     const I32 lvalue = PL_op->op_flags & OPf_MOD || LVRET;
3089     const char *tmps;
3090     const I32 arybase = CopARYBASE_get(PL_curcop);
3091     SV *repl_sv = NULL;
3092     const char *repl = NULL;
3093     STRLEN repl_len;
3094     const int num_args = PL_op->op_private & 7;
3095     bool repl_need_utf8_upgrade = FALSE;
3096     bool repl_is_utf8 = FALSE;
3097
3098     SvTAINTED_off(TARG);                        /* decontaminate */
3099     SvUTF8_off(TARG);                           /* decontaminate */
3100     if (num_args > 2) {
3101         if (num_args > 3) {
3102             repl_sv = POPs;
3103             repl = SvPV_const(repl_sv, repl_len);
3104             repl_is_utf8 = DO_UTF8(repl_sv) && SvCUR(repl_sv);
3105         }
3106         len = POPi;
3107     }
3108     pos = POPi;
3109     sv = POPs;
3110     PUTBACK;
3111     if (repl_sv) {
3112         if (repl_is_utf8) {
3113             if (!DO_UTF8(sv))
3114                 sv_utf8_upgrade(sv);
3115         }
3116         else if (DO_UTF8(sv))
3117             repl_need_utf8_upgrade = TRUE;
3118     }
3119     tmps = SvPV_const(sv, curlen);
3120     if (DO_UTF8(sv)) {
3121         utf8_curlen = sv_len_utf8(sv);
3122         if (utf8_curlen == curlen)
3123             utf8_curlen = 0;
3124         else
3125             curlen = utf8_curlen;
3126     }
3127     else
3128         utf8_curlen = 0;
3129
3130     if (pos >= arybase) {
3131         pos -= arybase;
3132         rem = curlen-pos;
3133         fail = rem;
3134         if (num_args > 2) {
3135             if (len < 0) {
3136                 rem += len;
3137                 if (rem < 0)
3138                     rem = 0;
3139             }
3140             else if (rem > len)
3141                      rem = len;
3142         }
3143     }
3144     else {
3145         pos += curlen;
3146         if (num_args < 3)
3147             rem = curlen;
3148         else if (len >= 0) {
3149             rem = pos+len;
3150             if (rem > (I32)curlen)
3151                 rem = curlen;
3152         }
3153         else {
3154             rem = curlen+len;
3155             if (rem < pos)
3156                 rem = pos;
3157         }
3158         if (pos < 0)
3159             pos = 0;
3160         fail = rem;
3161         rem -= pos;
3162     }
3163     if (fail < 0) {
3164         if (lvalue || repl)
3165             Perl_croak(aTHX_ "substr outside of string");
3166         Perl_ck_warner(aTHX_ packWARN(WARN_SUBSTR), "substr outside of string");
3167         RETPUSHUNDEF;
3168     }
3169     else {
3170         const I32 upos = pos;
3171         const I32 urem = rem;
3172         if (utf8_curlen)
3173             sv_pos_u2b(sv, &pos, &rem);
3174         tmps += pos;
3175         /* we either return a PV or an LV. If the TARG hasn't been used
3176          * before, or is of that type, reuse it; otherwise use a mortal
3177          * instead. Note that LVs can have an extended lifetime, so also
3178          * dont reuse if refcount > 1 (bug #20933) */
3179         if (SvTYPE(TARG) > SVt_NULL) {
3180             if ( (SvTYPE(TARG) == SVt_PVLV)
3181                     ? (!lvalue || SvREFCNT(TARG) > 1)
3182                     : lvalue)
3183             {
3184                 TARG = sv_newmortal();
3185             }
3186         }
3187
3188         sv_setpvn(TARG, tmps, rem);
3189 #ifdef USE_LOCALE_COLLATE
3190         sv_unmagic(TARG, PERL_MAGIC_collxfrm);
3191 #endif
3192         if (utf8_curlen)
3193             SvUTF8_on(TARG);
3194         if (repl) {
3195             SV* repl_sv_copy = NULL;
3196
3197             if (repl_need_utf8_upgrade) {
3198                 repl_sv_copy = newSVsv(repl_sv);
3199                 sv_utf8_upgrade(repl_sv_copy);
3200                 repl = SvPV_const(repl_sv_copy, repl_len);
3201                 repl_is_utf8 = DO_UTF8(repl_sv_copy) && SvCUR(sv);
3202             }
3203             if (!SvOK(sv))
3204                 sv_setpvs(sv, "");
3205             sv_insert_flags(sv, pos, rem, repl, repl_len, 0);
3206             if (repl_is_utf8)
3207                 SvUTF8_on(sv);
3208             SvREFCNT_dec(repl_sv_copy);
3209         }
3210         else if (lvalue) {              /* it's an lvalue! */
3211             if (!SvGMAGICAL(sv)) {
3212                 if (SvROK(sv)) {
3213                     SvPV_force_nolen(sv);
3214                     Perl_ck_warner(aTHX_ packWARN(WARN_SUBSTR),
3215                                    "Attempt to use reference as lvalue in substr");
3216                 }
3217                 if (isGV_with_GP(sv))
3218                     SvPV_force_nolen(sv);
3219                 else if (SvOK(sv))      /* is it defined ? */
3220                     (void)SvPOK_only_UTF8(sv);
3221                 else
3222                     sv_setpvs(sv, ""); /* avoid lexical reincarnation */
3223             }
3224
3225             if (SvTYPE(TARG) < SVt_PVLV) {
3226                 sv_upgrade(TARG, SVt_PVLV);
3227                 sv_magic(TARG, NULL, PERL_MAGIC_substr, NULL, 0);
3228             }
3229
3230             LvTYPE(TARG) = 'x';
3231             if (LvTARG(TARG) != sv) {
3232                 SvREFCNT_dec(LvTARG(TARG));
3233                 LvTARG(TARG) = SvREFCNT_inc_simple(sv);
3234             }
3235             LvTARGOFF(TARG) = upos;
3236             LvTARGLEN(TARG) = urem;
3237         }
3238     }
3239     SPAGAIN;
3240     PUSHs(TARG);                /* avoid SvSETMAGIC here */
3241     RETURN;
3242 }
3243
3244 PP(pp_vec)
3245 {
3246     dVAR; dSP; dTARGET;
3247     register const IV size   = POPi;
3248     register const IV offset = POPi;
3249     register SV * const src = POPs;
3250     const I32 lvalue = PL_op->op_flags & OPf_MOD || LVRET;
3251
3252     SvTAINTED_off(TARG);                /* decontaminate */
3253     if (lvalue) {                       /* it's an lvalue! */
3254         if (SvREFCNT(TARG) > 1) /* don't share the TARG (#20933) */
3255             TARG = sv_newmortal();
3256         if (SvTYPE(TARG) < SVt_PVLV) {
3257             sv_upgrade(TARG, SVt_PVLV);
3258             sv_magic(TARG, NULL, PERL_MAGIC_vec, NULL, 0);
3259         }
3260         LvTYPE(TARG) = 'v';
3261         if (LvTARG(TARG) != src) {
3262             SvREFCNT_dec(LvTARG(TARG));
3263             LvTARG(TARG) = SvREFCNT_inc_simple(src);
3264         }
3265         LvTARGOFF(TARG) = offset;
3266         LvTARGLEN(TARG) = size;
3267     }
3268
3269     sv_setuv(TARG, do_vecget(src, offset, size));
3270     PUSHs(TARG);
3271     RETURN;
3272 }
3273
3274 PP(pp_index)
3275 {
3276     dVAR; dSP; dTARGET;
3277     SV *big;
3278     SV *little;
3279     SV *temp = NULL;
3280     STRLEN biglen;
3281     STRLEN llen = 0;
3282     I32 offset;
3283     I32 retval;
3284     const char *big_p;
3285     const char *little_p;
3286     const I32 arybase = CopARYBASE_get(PL_curcop);
3287     bool big_utf8;
3288     bool little_utf8;
3289     const bool is_index = PL_op->op_type == OP_INDEX;
3290
3291     if (MAXARG >= 3) {
3292         /* arybase is in characters, like offset, so combine prior to the
3293            UTF-8 to bytes calculation.  */
3294         offset = POPi - arybase;
3295     }
3296     little = POPs;
3297     big = POPs;
3298     big_p = SvPV_const(big, biglen);
3299     little_p = SvPV_const(little, llen);
3300
3301     big_utf8 = DO_UTF8(big);
3302     little_utf8 = DO_UTF8(little);
3303     if (big_utf8 ^ little_utf8) {
3304         /* One needs to be upgraded.  */
3305         if (little_utf8 && !PL_encoding) {
3306             /* Well, maybe instead we might be able to downgrade the small
3307                string?  */
3308             char * const pv = (char*)bytes_from_utf8((U8 *)little_p, &llen,
3309                                                      &little_utf8);
3310             if (little_utf8) {
3311                 /* If the large string is ISO-8859-1, and it's not possible to
3312                    convert the small string to ISO-8859-1, then there is no
3313                    way that it could be found anywhere by index.  */
3314                 retval = -1;
3315                 goto fail;
3316             }
3317
3318             /* At this point, pv is a malloc()ed string. So donate it to temp
3319                to ensure it will get free()d  */
3320             little = temp = newSV(0);
3321             sv_usepvn(temp, pv, llen);
3322             little_p = SvPVX(little);
3323         } else {
3324             temp = little_utf8
3325                 ? newSVpvn(big_p, biglen) : newSVpvn(little_p, llen);
3326
3327             if (PL_encoding) {
3328                 sv_recode_to_utf8(temp, PL_encoding);
3329             } else {
3330                 sv_utf8_upgrade(temp);
3331             }
3332             if (little_utf8) {
3333                 big = temp;
3334                 big_utf8 = TRUE;
3335                 big_p = SvPV_const(big, biglen);
3336             } else {
3337                 little = temp;
3338                 little_p = SvPV_const(little, llen);
3339             }
3340         }
3341     }
3342     if (SvGAMAGIC(big)) {
3343         /* Life just becomes a lot easier if I use a temporary here.
3344            Otherwise I need to avoid calls to sv_pos_u2b(), which (dangerously)
3345            will trigger magic and overloading again, as will fbm_instr()
3346         */
3347         big = newSVpvn_flags(big_p, biglen,
3348                              SVs_TEMP | (big_utf8 ? SVf_UTF8 : 0));
3349         big_p = SvPVX(big);
3350     }
3351     if (SvGAMAGIC(little) || (is_index && !SvOK(little))) {
3352         /* index && SvOK() is a hack. fbm_instr() calls SvPV_const, which will
3353            warn on undef, and we've already triggered a warning with the
3354            SvPV_const some lines above. We can't remove that, as we need to
3355            call some SvPV to trigger overloading early and find out if the
3356            string is UTF-8.
3357            This is all getting to messy. The API isn't quite clean enough,
3358            because data access has side effects.
3359         */
3360         little = newSVpvn_flags(little_p, llen,
3361                                 SVs_TEMP | (little_utf8 ? SVf_UTF8 : 0));
3362         little_p = SvPVX(little);
3363     }
3364
3365     if (MAXARG < 3)
3366         offset = is_index ? 0 : biglen;
3367     else {
3368         if (big_utf8 && offset > 0)
3369             sv_pos_u2b(big, &offset, 0);
3370         if (!is_index)
3371             offset += llen;
3372     }
3373     if (offset < 0)
3374         offset = 0;
3375     else if (offset > (I32)biglen)
3376         offset = biglen;
3377     if (!(little_p = is_index
3378           ? fbm_instr((unsigned char*)big_p + offset,
3379                       (unsigned char*)big_p + biglen, little, 0)
3380           : rninstr(big_p,  big_p  + offset,
3381                     little_p, little_p + llen)))
3382         retval = -1;
3383     else {
3384         retval = little_p - big_p;
3385         if (retval > 0 && big_utf8)
3386             sv_pos_b2u(big, &retval);
3387     }
3388     SvREFCNT_dec(temp);
3389  fail:
3390     PUSHi(retval + arybase);
3391     RETURN;
3392 }
3393
3394 PP(pp_sprintf)
3395 {
3396     dVAR; dSP; dMARK; dORIGMARK; dTARGET;
3397     if (SvTAINTED(MARK[1]))
3398         TAINT_PROPER("sprintf");
3399     do_sprintf(TARG, SP-MARK, MARK+1);
3400     TAINT_IF(SvTAINTED(TARG));
3401     SP = ORIGMARK;
3402     PUSHTARG;
3403     RETURN;
3404 }
3405
3406 PP(pp_ord)
3407 {
3408     dVAR; dSP; dTARGET;
3409
3410     SV *argsv = POPs;
3411     STRLEN len;
3412     const U8 *s = (U8*)SvPV_const(argsv, len);
3413
3414     if (PL_encoding && SvPOK(argsv) && !DO_UTF8(argsv)) {
3415         SV * const tmpsv = sv_2mortal(newSVsv(argsv));
3416         s = (U8*)sv_recode_to_utf8(tmpsv, PL_encoding);
3417         argsv = tmpsv;
3418     }
3419
3420     XPUSHu(DO_UTF8(argsv) ?
3421            utf8n_to_uvchr(s, UTF8_MAXBYTES, 0, UTF8_ALLOW_ANYUV) :
3422            (UV)(*s & 0xff));
3423
3424     RETURN;
3425 }
3426
3427 PP(pp_chr)
3428 {
3429     dVAR; dSP; dTARGET;
3430     char *tmps;
3431     UV value;
3432
3433     if (((SvIOK_notUV(TOPs) && SvIV(TOPs) < 0)
3434          ||
3435          (SvNOK(TOPs) && SvNV(TOPs) < 0.0))) {
3436         if (IN_BYTES) {
3437             value = POPu; /* chr(-1) eq chr(0xff), etc. */
3438         } else {
3439             (void) POPs; /* Ignore the argument value. */
3440             value = UNICODE_REPLACEMENT;
3441         }
3442     } else {
3443         value = POPu;
3444     }
3445
3446     SvUPGRADE(TARG,SVt_PV);
3447
3448     if (value > 255 && !IN_BYTES) {
3449         SvGROW(TARG, (STRLEN)UNISKIP(value)+1);
3450         tmps = (char*)uvchr_to_utf8_flags((U8*)SvPVX(TARG), value, 0);
3451         SvCUR_set(TARG, tmps - SvPVX_const(TARG));
3452         *tmps = '\0';
3453         (void)SvPOK_only(TARG);
3454         SvUTF8_on(TARG);
3455         XPUSHs(TARG);
3456         RETURN;
3457     }
3458
3459     SvGROW(TARG,2);
3460     SvCUR_set(TARG, 1);
3461     tmps = SvPVX(TARG);
3462     *tmps++ = (char)value;
3463     *tmps = '\0';
3464     (void)SvPOK_only(TARG);
3465
3466     if (PL_encoding && !IN_BYTES) {
3467         sv_recode_to_utf8(TARG, PL_encoding);
3468         tmps = SvPVX(TARG);
3469         if (SvCUR(TARG) == 0 || !is_utf8_string((U8*)tmps, SvCUR(TARG)) ||
3470             UNICODE_IS_REPLACEMENT(utf8_to_uvchr((U8*)tmps, NULL))) {
3471             SvGROW(TARG, 2);
3472             tmps = SvPVX(TARG);
3473             SvCUR_set(TARG, 1);
3474             *tmps++ = (char)value;
3475             *tmps = '\0';
3476             SvUTF8_off(TARG);
3477         }
3478     }
3479
3480     XPUSHs(TARG);
3481     RETURN;
3482 }
3483
3484 PP(pp_crypt)
3485 {
3486 #ifdef HAS_CRYPT
3487     dVAR; dSP; dTARGET;
3488     dPOPTOPssrl;
3489     STRLEN len;
3490     const char *tmps = SvPV_const(left, len);
3491
3492     if (DO_UTF8(left)) {
3493          /* If Unicode, try to downgrade.
3494           * If not possible, croak.
3495           * Yes, we made this up.  */
3496          SV* const tsv = sv_2mortal(newSVsv(left));
3497
3498          SvUTF8_on(tsv);
3499          sv_utf8_downgrade(tsv, FALSE);
3500          tmps = SvPV_const(tsv, len);
3501     }
3502 #   ifdef USE_ITHREADS
3503 #     ifdef HAS_CRYPT_R
3504     if (!PL_reentrant_buffer->_crypt_struct_buffer) {
3505       /* This should be threadsafe because in ithreads there is only
3506        * one thread per interpreter.  If this would not be true,
3507        * we would need a mutex to protect this malloc. */
3508         PL_reentrant_buffer->_crypt_struct_buffer =
3509           (struct crypt_data *)safemalloc(sizeof(struct crypt_data));
3510 #if defined(__GLIBC__) || defined(__EMX__)
3511         if (PL_reentrant_buffer->_crypt_struct_buffer) {
3512             PL_reentrant_buffer->_crypt_struct_buffer->initialized = 0;
3513             /* work around glibc-2.2.5 bug */
3514             PL_reentrant_buffer->_crypt_struct_buffer->current_saltbits = 0;
3515         }
3516 #endif
3517     }
3518 #     endif /* HAS_CRYPT_R */
3519 #   endif /* USE_ITHREADS */
3520 #   ifdef FCRYPT
3521     sv_setpv(TARG, fcrypt(tmps, SvPV_nolen_const(right)));
3522 #   else
3523     sv_setpv(TARG, PerlProc_crypt(tmps, SvPV_nolen_const(right)));
3524 #   endif
3525     SETTARG;
3526     RETURN;
3527 #else
3528     DIE(aTHX_
3529       "The crypt() function is unimplemented due to excessive paranoia.");
3530     return NORMAL;
3531 #endif
3532 }
3533
3534 /* Generally UTF-8 and UTF-EBCDIC are indistinguishable at this level.  So 
3535  * most comments below say UTF-8, when in fact they mean UTF-EBCDIC as well */
3536
3537 /* Both the characters below can be stored in two UTF-8 bytes.  In UTF-8 the max
3538  * character that 2 bytes can hold is U+07FF, and in UTF-EBCDIC it is U+03FF.
3539  * See http://www.unicode.org/unicode/reports/tr16 */
3540 #define LATIN_CAPITAL_LETTER_Y_WITH_DIAERESIS 0x0178    /* Also is title case */
3541 #define GREEK_CAPITAL_LETTER_MU 0x039C  /* Upper and title case of MICRON */
3542
3543 /* Below are several macros that generate code */
3544 /* Generates code to store a unicode codepoint c that is known to occupy
3545  * exactly two UTF-8 and UTF-EBCDIC bytes; it is stored into p and p+1. */
3546 #define STORE_UNI_TO_UTF8_TWO_BYTE(p, c)                                    \
3547     STMT_START {                                                            \
3548         *(p) = UTF8_TWO_BYTE_HI(c);                                         \
3549         *((p)+1) = UTF8_TWO_BYTE_LO(c);                                     \
3550     } STMT_END
3551
3552 /* Like STORE_UNI_TO_UTF8_TWO_BYTE, but advances p to point to the next
3553  * available byte after the two bytes */
3554 #define CAT_UNI_TO_UTF8_TWO_BYTE(p, c)                                      \
3555     STMT_START {                                                            \
3556         *(p)++ = UTF8_TWO_BYTE_HI(c);                                       \
3557         *((p)++) = UTF8_TWO_BYTE_LO(c);                                     \
3558     } STMT_END
3559
3560 /* Generates code to store the upper case of latin1 character l which is known
3561  * to have its upper case be non-latin1 into the two bytes p and p+1.  There
3562  * are only two characters that fit this description, and this macro knows
3563  * about them, and that the upper case values fit into two UTF-8 or UTF-EBCDIC
3564  * bytes */
3565 #define STORE_NON_LATIN1_UC(p, l)                                           \
3566 STMT_START {                                                                \
3567     if ((l) == LATIN_SMALL_LETTER_Y_WITH_DIAERESIS) {                       \
3568         STORE_UNI_TO_UTF8_TWO_BYTE((p), LATIN_CAPITAL_LETTER_Y_WITH_DIAERESIS);  \
3569     } else { /* Must be the following letter */                                                             \
3570         STORE_UNI_TO_UTF8_TWO_BYTE((p), GREEK_CAPITAL_LETTER_MU);           \
3571     }                                                                       \
3572 } STMT_END
3573
3574 /* Like STORE_NON_LATIN1_UC, but advances p to point to the next available byte
3575  * after the character stored */
3576 #define CAT_NON_LATIN1_UC(p, l)                                             \
3577 STMT_START {                                                                \
3578     if ((l) == LATIN_SMALL_LETTER_Y_WITH_DIAERESIS) {                       \
3579         CAT_UNI_TO_UTF8_TWO_BYTE((p), LATIN_CAPITAL_LETTER_Y_WITH_DIAERESIS);    \
3580     } else {                                                                \
3581         CAT_UNI_TO_UTF8_TWO_BYTE((p), GREEK_CAPITAL_LETTER_MU);             \
3582     }                                                                       \
3583 } STMT_END
3584
3585 /* Generates code to add the two UTF-8 bytes (probably u) that are the upper
3586  * case of l into p and p+1.  u must be the result of toUPPER_LATIN1_MOD(l),
3587  * and must require two bytes to store it.  Advances p to point to the next
3588  * available position */
3589 #define CAT_TWO_BYTE_UNI_UPPER_MOD(p, l, u)                                 \
3590 STMT_START {                                                                \
3591     if ((u) != LATIN_SMALL_LETTER_Y_WITH_DIAERESIS) {                       \
3592         CAT_UNI_TO_UTF8_TWO_BYTE((p), (u)); /* not special, just save it */ \
3593     } else if (l == LATIN_SMALL_LETTER_SHARP_S) {                           \
3594         *(p)++ = 'S'; *(p)++ = 'S'; /* upper case is 'SS' */                \
3595     } else {/* else is one of the other two special cases */                \
3596         CAT_NON_LATIN1_UC((p), (l));                                        \
3597     }                                                                       \
3598 } STMT_END
3599
3600 PP(pp_ucfirst)
3601 {
3602     /* Actually is both lcfirst() and ucfirst().  Only the first character
3603      * changes.  This means that possibly we can change in-place, ie., just
3604      * take the source and change that one character and store it back, but not
3605      * if read-only etc, or if the length changes */
3606
3607     dVAR;
3608     dSP;
3609     SV *source = TOPs;
3610     STRLEN slen; /* slen is the byte length of the whole SV. */
3611     STRLEN need;
3612     SV *dest;
3613     bool inplace;   /* ? Convert first char only, in-place */
3614     bool doing_utf8 = FALSE;               /* ? using utf8 */
3615     bool convert_source_to_utf8 = FALSE;   /* ? need to convert */
3616     const int op_type = PL_op->op_type;
3617     const U8 *s;
3618     U8 *d;
3619     U8 tmpbuf[UTF8_MAXBYTES_CASE+1];
3620     STRLEN ulen;    /* ulen is the byte length of the original Unicode character
3621                      * stored as UTF-8 at s. */
3622     STRLEN tculen;  /* tculen is the byte length of the freshly titlecased (or
3623                      * lowercased) character stored in tmpbuf.  May be either
3624                      * UTF-8 or not, but in either case is the number of bytes */
3625
3626     SvGETMAGIC(source);
3627     if (SvOK(source)) {
3628         s = (const U8*)SvPV_nomg_const(source, slen);
3629     } else {
3630         if (ckWARN(WARN_UNINITIALIZED))
3631             report_uninit(source);
3632         s = (const U8*)"";
3633         slen = 0;
3634     }
3635
3636     /* We may be able to get away with changing only the first character, in
3637      * place, but not if read-only, etc.  Later we may discover more reasons to
3638      * not convert in-place. */
3639     inplace = SvPADTMP(source) && !SvREADONLY(source) && SvTEMP(source);
3640
3641     /* First calculate what the changed first character should be.  This affects
3642      * whether we can just swap it out, leaving the rest of the string unchanged,
3643      * or even if have to convert the dest to UTF-8 when the source isn't */
3644
3645     if (! slen) {   /* If empty */
3646         need = 1; /* still need a trailing NUL */
3647     }
3648     else if (DO_UTF8(source)) { /* Is the source utf8? */
3649         doing_utf8 = TRUE;
3650
3651 /* TODO: This is #ifdefd out because it has hard-coded the standard mappings,
3652  * and doesn't allow for the user to specify their own.  When code is added to
3653  * detect if there is a user-defined mapping in force here, and if so to use
3654  * that, then the code below can be compiled.  The detection would be a good
3655  * thing anyway, as currently the user-defined mappings only work on utf8
3656  * strings, and thus depend on the chosen internal storage method, which is a
3657  * bad thing */
3658 #ifdef GO_AHEAD_AND_BREAK_USER_DEFINED_CASE_MAPPINGS
3659         if (UTF8_IS_INVARIANT(*s)) {
3660
3661             /* An invariant source character is either ASCII or, in EBCDIC, an
3662              * ASCII equivalent or a caseless C1 control.  In both these cases,
3663              * the lower and upper cases of any character are also invariants
3664              * (and title case is the same as upper case).  So it is safe to
3665              * use the simple case change macros which avoid the overhead of
3666              * the general functions.  Note that if perl were to be extended to
3667              * do locale handling in UTF-8 strings, this wouldn't be true in,
3668              * for example, Lithuanian or Turkic.  */
3669             *tmpbuf = (op_type == OP_LCFIRST) ? toLOWER(*s) : toUPPER(*s);
3670             tculen = ulen = 1;
3671             need = slen + 1;
3672         }
3673         else if (UTF8_IS_DOWNGRADEABLE_START(*s)) {
3674             U8 chr;
3675
3676             /* Similarly, if the source character isn't invariant but is in the
3677              * latin1 range (or EBCDIC equivalent thereof), we have the case
3678              * changes compiled into perl, and can avoid the overhead of the
3679              * general functions.  In this range, the characters are stored as
3680              * two UTF-8 bytes, and it so happens that any changed-case version
3681              * is also two bytes (in both ASCIIish and EBCDIC machines). */
3682             tculen = ulen = 2;
3683             need = slen + 1;
3684
3685             /* Convert the two source bytes to a single Unicode code point
3686              * value, change case and save for below */
3687             chr = UTF8_ACCUMULATE(*s, *(s+1));
3688             if (op_type == OP_LCFIRST) {    /* lower casing is easy */
3689                 U8 lower = toLOWER_LATIN1(chr);
3690                 STORE_UNI_TO_UTF8_TWO_BYTE(tmpbuf, lower);
3691             }
3692             else {      /* ucfirst */
3693                 U8 upper = toUPPER_LATIN1_MOD(chr);
3694
3695                 /* Most of the latin1 range characters are well-behaved.  Their
3696                  * title and upper cases are the same, and are also in the
3697                  * latin1 range.  The macro above returns their upper (hence
3698                  * title) case, and all that need be done is to save the result
3699                  * for below.  However, several characters are problematic, and
3700                  * have to be handled specially.  The MOD in the macro name
3701                  * above means that these tricky characters all get mapped to
3702                  * the single character LATIN_SMALL_LETTER_Y_WITH_DIAERESIS.
3703                  * This mapping saves some tests for the majority of the
3704                  * characters */
3705
3706                 if (upper != LATIN_SMALL_LETTER_Y_WITH_DIAERESIS) {
3707
3708                     /* Not tricky.  Just save it. */
3709                     STORE_UNI_TO_UTF8_TWO_BYTE(tmpbuf, upper);
3710                 }
3711                 else if (chr == LATIN_SMALL_LETTER_SHARP_S) {
3712
3713                     /* This one is tricky because it is two characters long,
3714                      * though the UTF-8 is still two bytes, so the stored
3715                      * length doesn't change */
3716                     *tmpbuf = 'S';  /* The UTF-8 is 'Ss' */
3717                     *(tmpbuf + 1) = 's';
3718                 }
3719                 else {
3720
3721                     /* The other two have their title and upper cases the same,
3722                      * but are tricky because the changed-case characters
3723                      * aren't in the latin1 range.  They, however, do fit into
3724                      * two UTF-8 bytes */
3725                     STORE_NON_LATIN1_UC(tmpbuf, chr);    
3726                 }
3727             }
3728         }
3729         else {
3730 #endif  /* end of dont want to break user-defined casing */
3731
3732             /* Here, can't short-cut the general case */
3733
3734             utf8_to_uvchr(s, &ulen);
3735             if (op_type == OP_UCFIRST) toTITLE_utf8(s, tmpbuf, &tculen);
3736             else toLOWER_utf8(s, tmpbuf, &tculen);
3737
3738             /* we can't do in-place if the length changes.  */
3739             if (ulen != tculen) inplace = FALSE;
3740             need = slen + 1 - ulen + tculen;
3741 #ifdef GO_AHEAD_AND_BREAK_USER_DEFINED_CASE_MAPPINGS
3742         }
3743 #endif
3744     }
3745     else { /* Non-zero length, non-UTF-8,  Need to consider locale and if
3746             * latin1 is treated as caseless.  Note that a locale takes
3747             * precedence */ 
3748         tculen = 1;     /* Most characters will require one byte, but this will
3749                          * need to be overridden for the tricky ones */
3750         need = slen + 1;
3751
3752         if (op_type == OP_LCFIRST) {
3753
3754             /* lower case the first letter: no trickiness for any character */
3755             *tmpbuf = (IN_LOCALE_RUNTIME) ? toLOWER_LC(*s) :
3756                         ((IN_UNI_8_BIT) ? toLOWER_LATIN1(*s) : toLOWER(*s));
3757         }
3758         /* is ucfirst() */
3759         else if (IN_LOCALE_RUNTIME) {
3760             *tmpbuf = toUPPER_LC(*s);   /* This would be a bug if any locales
3761                                          * have upper and title case different
3762                                          */
3763         }
3764         else if (! IN_UNI_8_BIT) {
3765             *tmpbuf = toUPPER(*s);      /* Returns caseless for non-ascii, or
3766                                          * on EBCDIC machines whatever the
3767                                          * native function does */
3768         }
3769         else { /* is ucfirst non-UTF-8, not in locale, and cased latin1 */
3770             *tmpbuf = toUPPER_LATIN1_MOD(*s);
3771
3772             /* tmpbuf now has the correct title case for all latin1 characters
3773              * except for the several ones that have tricky handling.  All
3774              * of these are mapped by the MOD to the letter below. */
3775             if (*tmpbuf == LATIN_SMALL_LETTER_Y_WITH_DIAERESIS) {
3776
3777                 /* The length is going to change, with all three of these, so
3778                  * can't replace just the first character */
3779                 inplace = FALSE;
3780
3781                 /* We use the original to distinguish between these tricky
3782                  * cases */
3783                 if (*s == LATIN_SMALL_LETTER_SHARP_S) {
3784                     /* Two character title case 'Ss', but can remain non-UTF-8 */
3785                     need = slen + 2;
3786                     *tmpbuf = 'S';
3787                     *(tmpbuf + 1) = 's';   /* Assert: length(tmpbuf) >= 2 */
3788                     tculen = 2;
3789                 }
3790                 else {
3791
3792                     /* The other two tricky ones have their title case outside
3793                      * latin1.  It is the same as their upper case. */
3794                     doing_utf8 = TRUE;
3795                     STORE_NON_LATIN1_UC(tmpbuf, *s);
3796
3797                     /* The UTF-8 and UTF-EBCDIC lengths of both these characters
3798                      * and their upper cases is 2. */
3799                     tculen = ulen = 2;
3800
3801                     /* The entire result will have to be in UTF-8.  Assume worst
3802                      * case sizing in conversion. (all latin1 characters occupy
3803                      * at most two bytes in utf8) */
3804                     convert_source_to_utf8 = TRUE;
3805                     need = slen * 2 + 1;
3806                 }
3807             } /* End of is one of the three special chars */
3808         } /* End of use Unicode (Latin1) semantics */
3809     } /* End of changing the case of the first character */
3810
3811     /* Here, have the first character's changed case stored in tmpbuf.  Ready to
3812      * generate the result */
3813     if (inplace) {
3814
3815         /* We can convert in place.  This means we change just the first
3816          * character without disturbing the rest; no need to grow */
3817         dest = source;
3818         s = d = (U8*)SvPV_force_nomg(source, slen);
3819     } else {
3820         dTARGET;
3821
3822         dest = TARG;
3823
3824         /* Here, we can't convert in place; we earlier calculated how much
3825          * space we will need, so grow to accommodate that */
3826         SvUPGRADE(dest, SVt_PV);
3827         d = (U8*)SvGROW(dest, need);
3828         (void)SvPOK_only(dest);
3829
3830         SETs(dest);
3831     }
3832
3833     if (doing_utf8) {
3834         if (! inplace) {
3835             if (! convert_source_to_utf8) {
3836
3837                 /* Here  both source and dest are in UTF-8, but have to create
3838                  * the entire output.  We initialize the result to be the
3839                  * title/lower cased first character, and then append the rest
3840                  * of the string. */
3841                 sv_setpvn(dest, (char*)tmpbuf, tculen);
3842                 if (slen > ulen) {
3843                     sv_catpvn(dest, (char*)(s + ulen), slen - ulen);
3844                 }
3845             }
3846             else {
3847                 const U8 *const send = s + slen;
3848
3849                 /* Here the dest needs to be in UTF-8, but the source isn't,
3850                  * except we earlier UTF-8'd the first character of the source
3851                  * into tmpbuf.  First put that into dest, and then append the
3852                  * rest of the source, converting it to UTF-8 as we go. */
3853
3854                 /* Assert tculen is 2 here because the only two characters that
3855                  * get to this part of the code have 2-byte UTF-8 equivalents */
3856                 *d++ = *tmpbuf;
3857                 *d++ = *(tmpbuf + 1);
3858                 s++;    /* We have just processed the 1st char */
3859
3860                 for (; s < send; s++) {
3861                     d = uvchr_to_utf8(d, *s);
3862                 }
3863                 *d = '\0';
3864                 SvCUR_set(dest, d - (U8*)SvPVX_const(dest));
3865             }
3866             SvUTF8_on(dest);
3867         }
3868         else {   /* in-place UTF-8.  Just overwrite the first character */
3869             Copy(tmpbuf, d, tculen, U8);
3870             SvCUR_set(dest, need - 1);
3871         }
3872     }
3873     else {  /* Neither source nor dest are in or need to be UTF-8 */
3874         if (slen) {
3875             if (IN_LOCALE_RUNTIME) {
3876                 TAINT;
3877                 SvTAINTED_on(dest);
3878             }
3879             if (inplace) {  /* in-place, only need to change the 1st char */
3880                 *d = *tmpbuf;
3881             }
3882             else {      /* Not in-place */
3883
3884                 /* Copy the case-changed character(s) from tmpbuf */
3885                 Copy(tmpbuf, d, tculen, U8);
3886                 d += tculen - 1; /* Code below expects d to point to final
3887                                   * character stored */
3888             }
3889         }
3890         else {  /* empty source */
3891             /* See bug #39028: Don't taint if empty  */
3892             *d = *s;
3893         }
3894
3895         /* In a "use bytes" we don't treat the source as UTF-8, but, still want
3896          * the destination to retain that flag */
3897         if (SvUTF8(source))
3898             SvUTF8_on(dest);
3899
3900         if (!inplace) { /* Finish the rest of the string, unchanged */
3901             /* This will copy the trailing NUL  */
3902             Copy(s + 1, d + 1, slen, U8);
3903             SvCUR_set(dest, need - 1);
3904         }
3905     }
3906     SvSETMAGIC(dest);
3907     RETURN;
3908 }
3909
3910 /* There's so much setup/teardown code common between uc and lc, I wonder if
3911    it would be worth merging the two, and just having a switch outside each
3912    of the three tight loops.  There is less and less commonality though */
3913 PP(pp_uc)
3914 {
3915     dVAR;
3916     dSP;
3917     SV *source = TOPs;
3918     STRLEN len;
3919     STRLEN min;
3920     SV *dest;
3921     const U8 *s;
3922     U8 *d;
3923
3924     SvGETMAGIC(source);
3925
3926     if (SvPADTMP(source) && !SvREADONLY(source) && !SvAMAGIC(source)
3927         && SvTEMP(source) && !DO_UTF8(source)
3928         && (IN_LOCALE_RUNTIME || ! IN_UNI_8_BIT)) {
3929
3930         /* We can convert in place.  The reason we can't if in UNI_8_BIT is to
3931          * make the loop tight, so we overwrite the source with the dest before
3932          * looking at it, and we need to look at the original source
3933          * afterwards.  There would also need to be code added to handle
3934          * switching to not in-place in midstream if we run into characters
3935          * that change the length.
3936          */
3937         dest = source;
3938         s = d = (U8*)SvPV_force_nomg(source, len);
3939         min = len + 1;
3940     } else {
3941         dTARGET;
3942
3943         dest = TARG;
3944
3945         /* The old implementation would copy source into TARG at this point.
3946            This had the side effect that if source was undef, TARG was now
3947            an undefined SV with PADTMP set, and they don't warn inside
3948            sv_2pv_flags(). However, we're now getting the PV direct from
3949            source, which doesn't have PADTMP set, so it would warn. Hence the
3950            little games.  */
3951
3952         if (SvOK(source)) {
3953             s = (const U8*)SvPV_nomg_const(source, len);
3954         } else {
3955             if (ckWARN(WARN_UNINITIALIZED))
3956                 report_uninit(source);
3957             s = (const U8*)"";
3958             len = 0;
3959         }
3960         min = len + 1;
3961
3962         SvUPGRADE(dest, SVt_PV);
3963         d = (U8*)SvGROW(dest, min);
3964         (void)SvPOK_only(dest);
3965
3966         SETs(dest);
3967     }
3968
3969     /* Overloaded values may have toggled the UTF-8 flag on source, so we need
3970        to check DO_UTF8 again here.  */
3971
3972     if (DO_UTF8(source)) {
3973         const U8 *const send = s + len;
3974         U8 tmpbuf[UTF8_MAXBYTES+1];
3975
3976 /* This is ifdefd out because it needs more work and thought.  It isn't clear
3977  * that we should do it.  These are hard-coded rules from the Unicode standard,
3978  * and may change.  5.2 gives new guidance on the iota subscript, for example,
3979  * which has not been checked against this; and secondly it may be that we are
3980  * passed a subset of the context, via a \U...\E, for example, and its not
3981  * clear what the best approach is to that */
3982 #ifdef CONTEXT_DEPENDENT_CASING
3983         bool in_iota_subscript = FALSE;
3984 #endif
3985
3986         while (s < send) {
3987 #ifdef CONTEXT_DEPENDENT_CASING
3988             if (in_iota_subscript && ! is_utf8_mark(s)) {
3989                 /* A non-mark.  Time to output the iota subscript */
3990 #define GREEK_CAPITAL_LETTER_IOTA 0x0399
3991 #define COMBINING_GREEK_YPOGEGRAMMENI 0x0345
3992
3993                 CAT_UNI_TO_UTF8_TWO_BYTE(d, GREEK_CAPITAL_LETTER_IOTA);
3994                 in_iota_subscript = FALSE;
3995             }
3996 #endif
3997
3998
3999 /* See comments at the first instance in this file of this ifdef */
4000 #ifdef GO_AHEAD_AND_BREAK_USER_DEFINED_CASE_MAPPINGS
4001
4002             /* If the UTF-8 character is invariant, then it is in the range
4003              * known by the standard macro; result is only one byte long */
4004             if (UTF8_IS_INVARIANT(*s)) {
4005                 *d++ = toUPPER(*s);
4006                 s++;
4007             }
4008             else if (UTF8_IS_DOWNGRADEABLE_START(*s)) {
4009
4010                 /* Likewise, if it fits in a byte, its case change is in our
4011                  * table */
4012                 U8 orig = UTF8_ACCUMULATE(*s, *(s+1));
4013                 U8 upper = toUPPER_LATIN1_MOD(orig);
4014                 CAT_TWO_BYTE_UNI_UPPER_MOD(d, orig, upper);
4015                 s += 2;
4016             }
4017             else {
4018 #else
4019             {
4020 #endif
4021
4022                 /* Otherwise, need the general UTF-8 case.  Get the changed
4023                  * case value and copy it to the output buffer */
4024
4025                 const STRLEN u = UTF8SKIP(s);
4026                 STRLEN ulen;
4027
4028 #ifndef CONTEXT_DEPENDENT_CASING
4029                 toUPPER_utf8(s, tmpbuf, &ulen);
4030 #else
4031                 const UV uv = toUPPER_utf8(s, tmpbuf, &ulen);
4032                 if (uv == GREEK_CAPITAL_LETTER_IOTA && utf8_to_uvchr(s, 0) == COMBINING_GREEK_YPOGEGRAMMENI) {
4033                     in_iota_subscript = TRUE;
4034                 }
4035                 else {
4036 #endif
4037                     if (ulen > u && (SvLEN(dest) < (min += ulen - u))) {
4038                         /* If the eventually required minimum size outgrows
4039                          * the available space, we need to grow. */
4040                         const UV o = d - (U8*)SvPVX_const(dest);
4041
4042                         /* If someone uppercases one million U+03B0s we
4043                          * SvGROW() one million times.  Or we could try
4044                          * guessing how much to allocate without allocating too
4045                          * much.  Such is life.  See corresponding comment in lc code
4046                          * for another option */
4047                         SvGROW(dest, min);
4048                         d = (U8*)SvPVX(dest) + o;
4049                     }
4050                     Copy(tmpbuf, d, ulen, U8);
4051                     d += ulen;
4052 #ifdef CONTEXT_DEPENDENT_CASING
4053                 }
4054 #endif
4055                 s += u;
4056             }
4057         }
4058 #ifdef CONTEXT_DEPENDENT_CASING
4059         if (in_iota_subscript) CAT_UNI_TO_UTF8_TWO_BYTE(d, GREEK_CAPITAL_LETTER_IOTA);
4060 #endif
4061         SvUTF8_on(dest);
4062         *d = '\0';
4063         SvCUR_set(dest, d - (U8*)SvPVX_const(dest));
4064     } else {    /* Not UTF-8 */
4065         if (len) {
4066             const U8 *const send = s + len;
4067
4068             /* Use locale casing if in locale; regular style if not treating
4069              * latin1 as having case; otherwise the latin1 casing.  Do the
4070              * whole thing in a tight loop, for speed, */
4071             if (IN_LOCALE_RUNTIME) {
4072                 TAINT;
4073                 SvTAINTED_on(dest);
4074                 for (; s < send; d++, s++)
4075                     *d = toUPPER_LC(*s);
4076             }
4077             else if (! IN_UNI_8_BIT) {
4078                 for (; s < send; d++, s++) {
4079                     *d = toUPPER(*s);
4080                 }
4081             }
4082             else {
4083                 for (; s < send; d++, s++) {
4084                     *d = toUPPER_LATIN1_MOD(*s);
4085                     if (*d != LATIN_SMALL_LETTER_Y_WITH_DIAERESIS) continue;
4086
4087                     /* The mainstream case is the tight loop above.  To avoid
4088                      * extra tests in that, all three characters that require
4089                      * special handling are mapped by the MOD to the one tested
4090                      * just above.  
4091                      * Use the source to distinguish between the three cases */
4092
4093                     if (*s == LATIN_SMALL_LETTER_SHARP_S) {
4094
4095                         /* uc() of this requires 2 characters, but they are
4096                          * ASCII.  If not enough room, grow the string */
4097                         if (SvLEN(dest) < ++min) {      
4098                             const UV o = d - (U8*)SvPVX_const(dest);
4099                             SvGROW(dest, min);
4100                             d = (U8*)SvPVX(dest) + o;
4101                         }
4102                         *d++ = 'S'; *d = 'S'; /* upper case is 'SS' */
4103                         continue;   /* Back to the tight loop; still in ASCII */
4104                     }
4105
4106                     /* The other two special handling characters have their
4107                      * upper cases outside the latin1 range, hence need to be
4108                      * in UTF-8, so the whole result needs to be in UTF-8.  So,
4109                      * here we are somewhere in the middle of processing a
4110                      * non-UTF-8 string, and realize that we will have to convert
4111                      * the whole thing to UTF-8.  What to do?  There are
4112                      * several possibilities.  The simplest to code is to
4113                      * convert what we have so far, set a flag, and continue on
4114                      * in the loop.  The flag would be tested each time through
4115                      * the loop, and if set, the next character would be
4116                      * converted to UTF-8 and stored.  But, I (khw) didn't want
4117                      * to slow down the mainstream case at all for this fairly
4118                      * rare case, so I didn't want to add a test that didn't
4119                      * absolutely have to be there in the loop, besides the
4120                      * possibility that it would get too complicated for
4121                      * optimizers to deal with.  Another possibility is to just
4122                      * give up, convert the source to UTF-8, and restart the
4123                      * function that way.  Another possibility is to convert
4124                      * both what has already been processed and what is yet to
4125                      * come separately to UTF-8, then jump into the loop that
4126                      * handles UTF-8.  But the most efficient time-wise of the
4127                      * ones I could think of is what follows, and turned out to
4128                      * not require much extra code.  */
4129
4130                     /* Convert what we have so far into UTF-8, telling the
4131                      * function that we know it should be converted, and to
4132                      * allow extra space for what we haven't processed yet.
4133                      * Assume the worst case space requirements for converting
4134                      * what we haven't processed so far: that it will require
4135                      * two bytes for each remaining source character, plus the
4136                      * NUL at the end.  This may cause the string pointer to
4137                      * move, so re-find it. */
4138
4139                     len = d - (U8*)SvPVX_const(dest);
4140                     SvCUR_set(dest, len);
4141                     len = sv_utf8_upgrade_flags_grow(dest,
4142                                                 SV_GMAGIC|SV_FORCE_UTF8_UPGRADE,
4143                                                 (send -s) * 2 + 1);
4144                     d = (U8*)SvPVX(dest) + len;
4145
4146                     /* And append the current character's upper case in UTF-8 */
4147                     CAT_NON_LATIN1_UC(d, *s);
4148
4149                     /* Now process the remainder of the source, converting to
4150                      * upper and UTF-8.  If a resulting byte is invariant in
4151                      * UTF-8, output it as-is, otherwise convert to UTF-8 and
4152                      * append it to the output. */
4153
4154                     s++;
4155                     for (; s < send; s++) {
4156                         U8 upper = toUPPER_LATIN1_MOD(*s);
4157                         if UTF8_IS_INVARIANT(upper) {
4158                             *d++ = upper;
4159                         }
4160                         else {
4161                             CAT_TWO_BYTE_UNI_UPPER_MOD(d, *s, upper);
4162                         }
4163                     }
4164
4165                     /* Here have processed the whole source; no need to continue
4166                      * with the outer loop.  Each character has been converted
4167                      * to upper case and converted to UTF-8 */
4168
4169                     break;
4170                 } /* End of processing all latin1-style chars */
4171             } /* End of processing all chars */
4172         } /* End of source is not empty */
4173
4174         if (source != dest) {
4175             *d = '\0';  /* Here d points to 1 after last char, add NUL */
4176             SvCUR_set(dest, d - (U8*)SvPVX_const(dest));
4177         }
4178     } /* End of isn't utf8 */
4179     SvSETMAGIC(dest);
4180     RETURN;
4181 }
4182
4183 PP(pp_lc)
4184 {
4185     dVAR;
4186     dSP;
4187     SV *source = TOPs;
4188     STRLEN len;
4189     STRLEN min;
4190     SV *dest;
4191     const U8 *s;
4192     U8 *d;
4193
4194     SvGETMAGIC(source);
4195
4196     if (SvPADTMP(source) && !SvREADONLY(source) && !SvAMAGIC(source)
4197         && SvTEMP(source) && !DO_UTF8(source)) {
4198
4199         /* We can convert in place, as lowercasing anything in the latin1 range
4200          * (or else DO_UTF8 would have been on) doesn't lengthen it */
4201         dest = source;
4202         s = d = (U8*)SvPV_force_nomg(source, len);
4203         min = len + 1;
4204     } else {
4205         dTARGET;
4206
4207         dest = TARG;
4208
4209         /* The old implementation would copy source into TARG at this point.
4210            This had the side effect that if source was undef, TARG was now
4211            an undefined SV with PADTMP set, and they don't warn inside
4212            sv_2pv_flags(). However, we're now getting the PV direct from
4213            source, which doesn't have PADTMP set, so it would warn. Hence the
4214            little games.  */
4215
4216         if (SvOK(source)) {
4217             s = (const U8*)SvPV_nomg_const(source, len);
4218         } else {
4219             if (ckWARN(WARN_UNINITIALIZED))
4220                 report_uninit(source);
4221             s = (const U8*)"";
4222             len = 0;
4223         }
4224         min = len + 1;
4225
4226         SvUPGRADE(dest, SVt_PV);
4227         d = (U8*)SvGROW(dest, min);
4228         (void)SvPOK_only(dest);
4229
4230         SETs(dest);
4231     }
4232
4233     /* Overloaded values may have toggled the UTF-8 flag on source, so we need
4234        to check DO_UTF8 again here.  */
4235
4236     if (DO_UTF8(source)) {
4237         const U8 *const send = s + len;
4238         U8 tmpbuf[UTF8_MAXBYTES_CASE+1];
4239
4240         while (s < send) {
4241 /* See comments at the first instance in this file of this ifdef */
4242 #ifdef GO_AHEAD_AND_BREAK_USER_DEFINED_CASE_MAPPINGS
4243             if (UTF8_IS_INVARIANT(*s)) {
4244
4245                 /* Invariant characters use the standard mappings compiled in.
4246                  */
4247                 *d++ = toLOWER(*s);
4248                 s++;
4249             }
4250             else if (UTF8_IS_DOWNGRADEABLE_START(*s)) {
4251
4252                 /* As do the ones in the Latin1 range */
4253                 U8 lower = toLOWER_LATIN1(UTF8_ACCUMULATE(*s, *(s+1)));
4254                 CAT_UNI_TO_UTF8_TWO_BYTE(d, lower);
4255                 s += 2;
4256             }
4257             else {
4258 #endif
4259                 /* Here, is utf8 not in Latin-1 range, have to go out and get
4260                  * the mappings from the tables. */
4261
4262                 const STRLEN u = UTF8SKIP(s);
4263                 STRLEN ulen;
4264
4265 /* See comments at the first instance in this file of this ifdef */
4266 #ifndef CONTEXT_DEPENDENT_CASING
4267                 toLOWER_utf8(s, tmpbuf, &ulen);
4268 #else
4269                 /* Here is context dependent casing, not compiled in currently;
4270                  * needs more thought and work */
4271
4272                 const UV uv = toLOWER_utf8(s, tmpbuf, &ulen);
4273
4274                 /* If the lower case is a small sigma, it may be that we need
4275                  * to change it to a final sigma.  This happens at the end of 
4276                  * a word that contains more than just this character, and only
4277                  * when we started with a capital sigma. */
4278                 if (uv == UNICODE_GREEK_SMALL_LETTER_SIGMA &&
4279                     s > send - len &&   /* Makes sure not the first letter */
4280                     utf8_to_uvchr(s, 0) == UNICODE_GREEK_CAPITAL_LETTER_SIGMA
4281                 ) {
4282
4283                     /* We use the algorithm in:
4284                      * http://www.unicode.org/versions/Unicode5.0.0/ch03.pdf (C
4285                      * is a CAPITAL SIGMA): If C is preceded by a sequence
4286                      * consisting of a cased letter and a case-ignorable
4287                      * sequence, and C is not followed by a sequence consisting
4288                      * of a case ignorable sequence and then a cased letter,
4289                      * then when lowercasing C, C becomes a final sigma */
4290
4291                     /* To determine if this is the end of a word, need to peek
4292                      * ahead.  Look at the next character */
4293                     const U8 *peek = s + u;
4294
4295                     /* Skip any case ignorable characters */
4296                     while (peek < send && is_utf8_case_ignorable(peek)) {
4297                         peek += UTF8SKIP(peek);
4298                     }
4299
4300                     /* If we reached the end of the string without finding any
4301                      * non-case ignorable characters, or if the next such one
4302                      * is not-cased, then we have met the conditions for it
4303                      * being a final sigma with regards to peek ahead, and so
4304                      * must do peek behind for the remaining conditions. (We
4305                      * know there is stuff behind to look at since we tested
4306                      * above that this isn't the first letter) */
4307                     if (peek >= send || ! is_utf8_cased(peek)) {
4308                         peek = utf8_hop(s, -1);
4309
4310                         /* Here are at the beginning of the first character
4311                          * before the original upper case sigma.  Keep backing
4312                          * up, skipping any case ignorable characters */
4313                         while (is_utf8_case_ignorable(peek)) {
4314                             peek = utf8_hop(peek, -1);
4315                         }
4316
4317                         /* Here peek points to the first byte of the closest
4318                          * non-case-ignorable character before the capital
4319                          * sigma.  If it is cased, then by the Unicode
4320                          * algorithm, we should use a small final sigma instead
4321                          * of what we have */
4322                         if (is_utf8_cased(peek)) {
4323                             STORE_UNI_TO_UTF8_TWO_BYTE(tmpbuf,
4324                                         UNICODE_GREEK_SMALL_LETTER_FINAL_SIGMA);
4325                         }
4326                     }
4327                 }
4328                 else {  /* Not a context sensitive mapping */
4329 #endif  /* End of commented out context sensitive */
4330                     if (ulen > u && (SvLEN(dest) < (min += ulen - u))) {
4331
4332                         /* If the eventually required minimum size outgrows
4333                          * the available space, we need to grow. */
4334                         const UV o = d - (U8*)SvPVX_const(dest);
4335
4336                         /* If someone lowercases one million U+0130s we
4337                          * SvGROW() one million times.  Or we could try
4338                          * guessing how much to allocate without allocating too
4339                          * much.  Such is life.  Another option would be to
4340                          * grow an extra byte or two more each time we need to
4341                          * grow, which would cut down the million to 500K, with
4342                          * little waste */
4343                         SvGROW(dest, min);
4344                         d = (U8*)SvPVX(dest) + o;
4345                     }
4346 #ifdef CONTEXT_DEPENDENT_CASING
4347                 }
4348 #endif
4349                 /* Copy the newly lowercased letter to the output buffer we're
4350                  * building */
4351                 Copy(tmpbuf, d, ulen, U8);
4352                 d += ulen;
4353                 s += u;
4354 #ifdef GO_AHEAD_AND_BREAK_USER_DEFINED_CASE_MAPPINGS
4355             }
4356 #endif
4357         }   /* End of looping through the source string */
4358         SvUTF8_on(dest);
4359         *d = '\0';
4360         SvCUR_set(dest, d - (U8*)SvPVX_const(dest));
4361     } else {    /* Not utf8 */
4362         if (len) {
4363             const U8 *const send = s + len;
4364
4365             /* Use locale casing if in locale; regular style if not treating
4366              * latin1 as having case; otherwise the latin1 casing.  Do the
4367              * whole thing in a tight loop, for speed, */
4368             if (IN_LOCALE_RUNTIME) {
4369                 TAINT;
4370                 SvTAINTED_on(dest);
4371                 for (; s < send; d++, s++)
4372                     *d = toLOWER_LC(*s);
4373             }
4374             else if (! IN_UNI_8_BIT) {
4375                 for (; s < send; d++, s++) {
4376                     *d = toLOWER(*s);
4377                 }
4378             }
4379             else {
4380                 for (; s < send; d++, s++) {
4381                     *d = toLOWER_LATIN1(*s);
4382                 }
4383             }
4384         }
4385         if (source != dest) {
4386             *d = '\0';
4387             SvCUR_set(dest, d - (U8*)SvPVX_const(dest));
4388         }
4389     }
4390     SvSETMAGIC(dest);
4391     RETURN;
4392 }
4393
4394 PP(pp_quotemeta)
4395 {
4396     dVAR; dSP; dTARGET;
4397     SV * const sv = TOPs;
4398     STRLEN len;
4399     register const char *s = SvPV_const(sv,len);
4400
4401     SvUTF8_off(TARG);                           /* decontaminate */
4402     if (len) {
4403         register char *d;
4404         SvUPGRADE(TARG, SVt_PV);
4405         SvGROW(TARG, (len * 2) + 1);
4406         d = SvPVX(TARG);
4407         if (DO_UTF8(sv)) {
4408             while (len) {
4409                 if (UTF8_IS_CONTINUED(*s)) {
4410                     STRLEN ulen = UTF8SKIP(s);
4411                     if (ulen > len)
4412                         ulen = len;
4413                     len -= ulen;
4414                     while (ulen--)
4415                         *d++ = *s++;
4416                 }
4417                 else {
4418                     if (!isALNUM(*s))
4419                         *d++ = '\\';
4420                     *d++ = *s++;
4421                     len--;
4422                 }
4423             }
4424             SvUTF8_on(TARG);
4425         }
4426         else {
4427             while (len--) {
4428                 if (!isALNUM(*s))
4429                     *d++ = '\\';
4430                 *d++ = *s++;
4431             }
4432         }
4433         *d = '\0';
4434         SvCUR_set(TARG, d - SvPVX_const(TARG));
4435         (void)SvPOK_only_UTF8(TARG);
4436     }
4437     else
4438         sv_setpvn(TARG, s, len);
4439     SETTARG;
4440     RETURN;
4441 }
4442
4443 /* Arrays. */
4444
4445 PP(pp_aslice)
4446 {
4447     dVAR; dSP; dMARK; dORIGMARK;
4448     register AV *const av = MUTABLE_AV(POPs);
4449     register const I32 lval = (PL_op->op_flags & OPf_MOD || LVRET);
4450
4451     if (SvTYPE(av) == SVt_PVAV) {
4452         const I32 arybase = CopARYBASE_get(PL_curcop);
4453         const bool localizing = PL_op->op_private & OPpLVAL_INTRO;
4454         bool can_preserve = FALSE;
4455
4456         if (localizing) {
4457             MAGIC *mg;
4458             HV *stash;
4459
4460             can_preserve = SvCANEXISTDELETE(av);
4461         }
4462
4463         if (lval && localizing) {
4464             register SV **svp;
4465             I32 max = -1;
4466             for (svp = MARK + 1; svp <= SP; svp++) {
4467                 const I32 elem = SvIV(*svp);
4468                 if (elem > max)
4469                     max = elem;
4470             }
4471             if (max > AvMAX(av))
4472                 av_extend(av, max);
4473         }
4474
4475         while (++MARK <= SP) {
4476             register SV **svp;
4477             I32 elem = SvIV(*MARK);
4478             bool preeminent = TRUE;
4479
4480             if (elem > 0)
4481                 elem -= arybase;
4482             if (localizing && can_preserve) {
4483                 /* If we can determine whether the element exist,
4484                  * Try to preserve the existenceness of a tied array
4485                  * element by using EXISTS and DELETE if possible.
4486                  * Fallback to FETCH and STORE otherwise. */
4487                 preeminent = av_exists(av, elem);
4488             }
4489
4490             svp = av_fetch(av, elem, lval);
4491             if (lval) {
4492                 if (!svp || *svp == &PL_sv_undef)
4493                     DIE(aTHX_ PL_no_aelem, elem);
4494                 if (localizing) {
4495                     if (preeminent)
4496                         save_aelem(av, elem, svp);
4497                     else
4498                         SAVEADELETE(av, elem);
4499                 }
4500             }
4501             *MARK = svp ? *svp : &PL_sv_undef;
4502         }
4503     }
4504     if (GIMME != G_ARRAY) {
4505         MARK = ORIGMARK;
4506         *++MARK = SP > ORIGMARK ? *SP : &PL_sv_undef;
4507         SP = MARK;
4508     }
4509     RETURN;
4510 }
4511
4512 PP(pp_aeach)
4513 {
4514     dVAR;
4515     dSP;
4516     AV *array = MUTABLE_AV(POPs);
4517     const I32 gimme = GIMME_V;
4518     IV *iterp = Perl_av_iter_p(aTHX_ array);
4519     const IV current = (*iterp)++;
4520
4521     if (current > av_len(array)) {
4522         *iterp = 0;
4523         if (gimme == G_SCALAR)
4524             RETPUSHUNDEF;
4525         else
4526             RETURN;
4527     }
4528
4529     EXTEND(SP, 2);
4530     mPUSHi(CopARYBASE_get(PL_curcop) + current);
4531     if (gimme == G_ARRAY) {
4532         SV **const element = av_fetch(array, current, 0);
4533         PUSHs(element ? *element : &PL_sv_undef);
4534     }
4535     RETURN;
4536 }
4537
4538 PP(pp_akeys)
4539 {
4540     dVAR;
4541     dSP;
4542     AV *array = MUTABLE_AV(POPs);
4543     const I32 gimme = GIMME_V;
4544
4545     *Perl_av_iter_p(aTHX_ array) = 0;
4546
4547     if (gimme == G_SCALAR) {