toke.c: Remove redundant PL_lex_stuff null checks

[perl5.git] / toke.c
diff --git a/toke.c b/toke.c

index 51075e5..5373510 100644 (file)
--- a/toke.c
+++ b/toke.c
@@ -186,6 +186,7 @@ static const char* const lex_state_names[] = {
   * FUN1         : not used, except for not, which isn't a UNIOP
   * BOop         : bitwise or or xor
   * BAop         : bitwise and
+ * BCop         : bitwise complement
   * SHop         : shift operator
   * PWop         : power operator
   * PMop         : pattern-matching operator
@@ -206,7 +207,7 @@ static const char* const lex_state_names[] = {
  
  #define TOKEN(retval) return ( PL_bufptr = s, REPORT(retval))
  #define OPERATOR(retval) return (PL_expect = XTERM, PL_bufptr = s, REPORT(retval))
-#define AOPERATOR(retval) return ao((PL_expect = XTERM, PL_bufptr = s, REPORT(retval)))
+#define AOPERATOR(retval) return ao((PL_expect = XTERM, PL_bufptr = s, retval))
  #define PREBLOCK(retval) return (PL_expect = XBLOCK,PL_bufptr = s, REPORT(retval))
  #define PRETERMBLOCK(retval) return (PL_expect = XTERMBLOCK,PL_bufptr = s, REPORT(retval))
  #define PREREF(retval) return (PL_expect = XREF,PL_bufptr = s, REPORT(retval))
@@ -220,14 +221,16 @@ static const char* const lex_state_names[] = {
  #define FUN0(f)  return (pl_yylval.ival=f, PL_expect=XOPERATOR, PL_bufptr=s, REPORT((int)FUNC0))
  #define FUN0OP(f)  return (pl_yylval.opval=f, CLINE, PL_expect=XOPERATOR, PL_bufptr=s, REPORT((int)FUNC0OP))
  #define FUN1(f)  return (pl_yylval.ival=f, PL_expect=XOPERATOR, PL_bufptr=s, REPORT((int)FUNC1))
-#define BOop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)BITOROP)))
-#define BAop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)BITANDOP)))
-#define SHop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)SHIFTOP)))
-#define PWop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)POWOP)))
+#define BOop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, (int)BITOROP))
+#define BAop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, (int)BITANDOP))
+#define BCop(f) return pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr = s, \
+                      REPORT('~')
+#define SHop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, (int)SHIFTOP))
+#define PWop(f)  return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, (int)POWOP))
  #define PMop(f)  return(pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)MATCHOP))
-#define Aop(f)   return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)ADDOP)))
+#define Aop(f)   return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, (int)ADDOP))
  #define AopNOASSIGN(f) return (pl_yylval.ival=f, PL_bufptr=s, REPORT((int)ADDOP))
-#define Mop(f)   return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)MULOP)))
+#define Mop(f)   return ao((pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, (int)MULOP))
  #define Eop(f)   return (pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)EQOP))
  #define Rop(f)   return (pl_yylval.ival=f, PL_expect=XTERM, PL_bufptr=s, REPORT((int)RELOP))
  
@@ -399,7 +402,7 @@ S_tokereport(pTHX_ I32 rv, const YYSTYPE* lvalp)
         }
         if (name)
             Perl_sv_catpv(aTHX_ report, name);
-       else if ((char)rv > ' ' && (char)rv <= '~')
+       else if (isGRAPH(rv))
         {
             Perl_sv_catpvf(aTHX_ report, "'%c'", (char)rv);
             if ((char)rv == 'p')
@@ -486,7 +489,7 @@ S_ao(pTHX_ int toketype)
             pl_yylval.ival = OP_DORASSIGN;
         toketype = ASSIGNOP;
      }
-    return toketype;
+    return REPORT(toketype);
  }
  
  /*
@@ -730,7 +733,7 @@ Perl_lex_start(pTHX_ SV *line, PerlIO *rsfp, U32 flags)
      parser->bufend = parser->bufptr + SvCUR(parser->linestr);
      parser->last_lop = parser->last_uni = NULL;
  
-    assert(FITS_IN_8_BITS(LEX_IGNORE_UTF8_HINTS|LEX_EVALBYTES
+    STATIC_ASSERT_STMT(FITS_IN_8_BITS(LEX_IGNORE_UTF8_HINTS|LEX_EVALBYTES
                                                          |LEX_DONT_CLOSE_RSFP));
      parser->lex_flags = (U8) (flags & (LEX_IGNORE_UTF8_HINTS|LEX_EVALBYTES
                                                          |LEX_DONT_CLOSE_RSFP));
@@ -1968,7 +1971,7 @@ S_newSV_maybe_utf8(pTHX_ const char *const start, STRLEN len)
      SV * const sv = newSVpvn_utf8(start, len,
                                   !IN_BYTES
                                   && UTF
-                                 && !is_ascii_string((const U8*)start, len)
+                                 && !is_invariant_string((const U8*)start, len)
                                   && is_utf8_string((const U8*)start, len));
      return sv;
  }
@@ -2005,9 +2008,10 @@ S_force_word(pTHX_ char *start, int token, int check_keyword, int allow_pack)
         s = scan_word(s, PL_tokenbuf, sizeof PL_tokenbuf, allow_pack, &len);
         if (check_keyword) {
           char *s2 = PL_tokenbuf;
+         STRLEN len2 = len;
           if (allow_pack && len > 6 && strnEQ(s2, "CORE::", 6))
-           s2 += 6, len -= 6;
-         if (keyword(s2, len, 0))
+           s2 += 6, len2 -= 6;
+         if (keyword(s2, len2, 0))
             return start;
         }
         if (token == METHOD) {
@@ -2272,7 +2276,9 @@ S_sublex_start(pTHX)
         return THING;
      }
      if (op_type == OP_CONST) {
-       SV *sv = tokeq(PL_lex_stuff);
+       SV *sv = PL_lex_stuff;
+       PL_lex_stuff = NULL;
+       sv = tokeq(sv);
  
         if (SvTYPE(sv) == SVt_PVIV) {
             /* Overloaded constants, nothing fancy: Convert to SVt_PV: */
@@ -2283,7 +2289,6 @@ S_sublex_start(pTHX)
             sv = nsv;
         }
         pl_yylval.opval = (OP*)newSVOP(op_type, 0, sv);
-       PL_lex_stuff = NULL;
         return THING;
      }
  
@@ -2363,6 +2368,12 @@ S_sublex_push(pTHX)
      PL_lex_stuff = NULL;
      PL_sublex_info.repl = NULL;
  
+    /* Arrange for PL_lex_stuff to be freed on scope exit, in case it gets
+       set for an inner quote-like operator and then an error causes scope-
+       popping.  We must not have a PL_lex_stuff value left dangling, as
+       that breaks assumptions elsewhere.  See bug #123617.  */
+    SAVEGENERICSV(PL_lex_stuff);
+
      PL_bufend = PL_bufptr = PL_oldbufptr = PL_oldoldbufptr = PL_linestart
         = SvPVX(PL_linestr);
      PL_bufend += SvCUR(PL_linestr);
@@ -2457,7 +2468,7 @@ S_sublex_done(pTHX)
                  + PL_parser->herelines;
             PL_parser->herelines = 0;
         }
-       return ',';
+       return '/';
      }
      else {
         const line_t l = CopLINE(PL_curcop);
@@ -2491,6 +2502,9 @@ S_get_and_check_backslash_N_name(pTHX_ const char* s, const char* const e)
  
      PERL_ARGS_ASSERT_GET_AND_CHECK_BACKSLASH_N_NAME;
  
+    if (!SvCUR(res))
+        return res;
+
      if (UTF && ! is_utf8_string_loc((U8 *) backslash_ptr,
                                       e - backslash_ptr,
                                       &first_bad_char_loc))
@@ -3189,9 +3203,13 @@ S_scan_const(pTHX_ char *start)
                         SvPOK_on(sv);
                         *d = '\0';
                         /* See Note on sizing above.  */
-                       sv_utf8_upgrade_flags_grow(sv,
-                                       SV_GMAGIC|SV_FORCE_UTF8_UPGRADE,
-                                       UNISKIP(uv) + (STRLEN)(send - s) + 1);
+                       sv_utf8_upgrade_flags_grow(
+                                         sv,
+                                         SV_GMAGIC|SV_FORCE_UTF8_UPGRADE
+                                                  /* Above-latin1 in string
+                                                   * implies no encoding */
+                                                  |SV_UTF8_NO_ENCODING,
+                                         UNISKIP(uv) + (STRLEN)(send - s) + 1);
                         d = SvPVX(sv) + SvCUR(sv);
                         has_utf8 = TRUE;
                      }
@@ -3277,38 +3295,43 @@ S_scan_const(pTHX_ char *start)
                 /* Here it looks like a named character */
  
                 if (*s == 'U' && s[1] == '+') { /* \N{U+...} */
-                   I32 flags = PERL_SCAN_ALLOW_UNDERSCORES
-                               | PERL_SCAN_DISALLOW_PREFIX;
-                   STRLEN len;
-
                     s += 2;         /* Skip to next char after the 'U+' */
-                   len = e - s;
-                   uv = grok_hex(s, &len, &flags, NULL);
-                   if (len == 0 || len != (STRLEN)(e - s)) {
-                       yyerror("Invalid hexadecimal number in \\N{U+...}");
-                       s = e + 1;
-                       continue;
-                   }
-
                     if (PL_lex_inpat) {
-                       s -= 5;     /* Include the '\N{U+' */
-#ifdef EBCDIC
-                        /* On EBCDIC platforms, in \N{U+...}, the '...' is a
-                         * Unicode value, so convert to native so downstream
-                         * code can continue to assume it's native */
-                       d += my_snprintf(d, e - s + 1 + 1,  /* includes the '}'
-                                                              and the \0 */
-                                         "\\N{U+%X}",
-                                         (unsigned int) UNI_TO_NATIVE(uv));
-#else
-                        /* On non-EBCDIC platforms, pass it through unchanged.
-                         * The reason we evaluated the number above is to make
-                         * sure there wasn't a syntax error. */
-                       Copy(s, d, e - s + 1, char);    /* +1 is for the '}' */
-                       d += e - s + 1;
-#endif
+
+                        /* In patterns, we can have \N{U+xxxx.yyyy.zzzz...} */
+                        /* Check the syntax.  */
+                        const char *orig_s;
+                        orig_s = s - 5;
+                        if (!isXDIGIT(*s)) {
+                          bad_NU:
+                            yyerror(
+                                "Invalid hexadecimal number in \\N{U+...}"
+                            );
+                            s = e + 1;
+                            continue;
+                        }
+                        while (++s < e) {
+                            if (isXDIGIT(*s))
+                                continue;
+                            else if ((*s == '.' || *s == '_')
+                                  && isXDIGIT(s[1]))
+                                continue;
+                            goto bad_NU;
+                        }
+
+                        /* Pass everything through unchanged.
+                         * +1 is for the '}' */
+                        Copy(orig_s, d, e - orig_s + 1, char);
+                        d += e - orig_s + 1;
                     }
                     else {  /* Not a pattern: convert the hex to string */
+                        I32 flags = PERL_SCAN_ALLOW_UNDERSCORES
+                               | PERL_SCAN_SILENT_ILLDIGIT
+                               | PERL_SCAN_DISALLOW_PREFIX;
+                        STRLEN len = e - s;
+                        uv = grok_hex(s, &len, &flags, NULL);
+                        if (len == 0 || (len != (STRLEN)(e - s)))
+                            goto bad_NU;
  
                           /* If the destination is not in utf8, unconditionally
                           * recode it to be so.  This is because \N{} implies
@@ -3471,8 +3494,8 @@ S_scan_const(pTHX_ char *start)
                             const STRLEN off = d - SvPVX_const(sv);
                             d = off + SvGROW(sv, off + len + (STRLEN)(send - s) + 1);
                         }
-                        if (! SvUTF8(res)) {    /* Make sure is \N{} return is UTF-8 */
-                            sv_utf8_upgrade(res);
+                        if (! SvUTF8(res)) {    /* Make sure \N{} return is UTF-8 */
+                            sv_utf8_upgrade_flags(res, SV_UTF8_NO_ENCODING);
                              str = SvPV_const(res, len);
                          }
                         Copy(str, d, len, char);
@@ -3588,8 +3611,8 @@ S_scan_const(pTHX_ char *start)
                    " >= %"UVuf, (UV)SvCUR(sv), (UV)SvLEN(sv));
  
      SvPOK_on(sv);
-    if (PL_encoding && !has_utf8) {
-       sv_recode_to_utf8(sv, PL_encoding);
+    if (IN_ENCODING && !has_utf8) {
+       sv_recode_to_utf8(sv, _get_encoding());
         if (SvUTF8(sv))
             has_utf8 = TRUE;
      }
@@ -3785,11 +3808,10 @@ S_intuit_more(pTHX_ char *s)
                     && !(last_un_char == '$' || last_un_char == '@'
                          || last_un_char == '&')
                     && isALPHA(*s) && s[1] && isALPHA(s[1])) {
-                   char *d = tmpbuf;
+                   char *d = s;
                     while (isALPHA(*s))
-                       *d++ = *s++;
-                   *d = '\0';
-                   if (keyword(tmpbuf, d - tmpbuf, 0))
+                       s++;
+                   if (keyword(d, s - d, 0))
                         weight -= 150;
                 }
                 if (un_char == last_un_char + 1)
@@ -4944,7 +4966,7 @@ Perl_yylex(pTHX)
         Perl_croak(aTHX_
        "\t(Maybe you didn't strip carriage returns after a network transfer?)\n");
  #endif
-    case ' ': case '\t': case '\f': case 013:
+    case ' ': case '\t': case '\f': case '\v':
         s++;
         goto retry;
      case '#':
@@ -5197,11 +5219,18 @@ Perl_yylex(pTHX)
         TERM('%');
      }
      case '^':
+       d = s;
+       bof = FEATURE_BITWISE_IS_ENABLED;
+       if (bof && s[1] == '.')
+           s++;
         if (!PL_lex_allbrackets && PL_lex_fakeeof >=
                 (s[1] == '=' ? LEX_FAKEEOF_ASSIGN : LEX_FAKEEOF_BITWISE))
+       {
+           s = d;
             TOKEN(0);
+       }
         s++;
-       BOop(OP_BIT_XOR);
+       BOop(bof ? d == s-2 ? OP_SBIT_XOR : OP_NBIT_XOR : OP_BIT_XOR);
      case '[':
         if (PL_lex_brackets > 100)
             Renew(PL_lex_brackstack, PL_lex_brackets + 10, char);
@@ -5224,7 +5253,11 @@ Perl_yylex(pTHX)
             Eop(OP_SMARTMATCH);
         }
         s++;
-       OPERATOR('~');
+       if ((bof = FEATURE_BITWISE_IS_ENABLED) && *s == '.') {
+           s++;
+           BCop(OP_SCOMPLEMENT);
+       }
+       BCop(bof ? OP_NCOMPLEMENT : OP_COMPLEMENT);
      case ',':
         if (!PL_lex_allbrackets && PL_lex_fakeeof >= LEX_FAKEEOF_COMMA)
             TOKEN(0);
@@ -5297,7 +5330,7 @@ Perl_yylex(pTHX)
                     sv_catsv(sv, PL_lex_stuff);
                     attrs = op_append_elem(OP_LIST, attrs,
                                         newSVOP(OP_CONST, 0, sv));
-                   SvREFCNT_dec(PL_lex_stuff);
+                   SvREFCNT_dec_NN(PL_lex_stuff);
                     PL_lex_stuff = NULL;
                 }
                 else {
@@ -5324,6 +5357,19 @@ Perl_yylex(pTHX)
                         sv_free(sv);
                         CvMETHOD_on(PL_compcv);
                     }
+                   else if (!PL_in_my && len == 5
+                         && strnEQ(SvPVX(sv), "const", len))
+                   {
+                       sv_free(sv);
+                       Perl_ck_warner_d(aTHX_
+                           packWARN(WARN_EXPERIMENTAL__CONST_ATTR),
+                          ":const is experimental"
+                       );
+                       CvANONCONST_on(PL_compcv);
+                       if (!CvANON(PL_compcv))
+                           yyerror(":const is not permitted on named "
+                                   "subroutines");
+                   }
                     /* After we've set the flags, it could be argued that
                        we don't need to do the attributes.pm-based setting
                        process, and shouldn't bother appending recognized
@@ -5438,6 +5484,7 @@ Perl_yylex(pTHX)
         }
         switch (PL_expect) {
         case XTERM:
+       case XTERMORDORDOR:
             PL_lex_brackstack[PL_lex_brackets++] = XOPERATOR;
             PL_lex_allbrackets++;
             OPERATOR(HASHBRACK);
@@ -5501,9 +5548,10 @@ Perl_yylex(pTHX)
                     OPERATOR(HASHBRACK);
                 }
                 if (PL_expect == XREF && PL_oldoldbufptr != PL_last_lop) {
-                   /* ${...} or @{...} etc., but not print {...} */
-                   PL_expect = XTERM;
-                   break;
+                   /* ${...} or @{...} etc., but not print {...}
+                    * Skip the disambiguation and treat this as a block.
+                    */
+                   goto block_expectation;
                 }
                 /* This hack serves to disambiguate a pair of curlies
                  * as being a block or an anon hash.  Normally, expectation
@@ -5587,7 +5635,28 @@ Perl_yylex(pTHX)
                                    || (*t == '=' && t[1] == '>')))
                     OPERATOR(HASHBRACK);
                 if (PL_expect == XREF)
-                   PL_expect = XTERM;
+               {
+                 block_expectation:
+                   /* If there is an opening brace or 'sub:', treat it
+                      as a term to make ${{...}}{k} and &{sub:attr...}
+                      dwim.  Otherwise, treat it as a statement, so
+                      map {no strict; ...} works.
+                    */
+                   s = skipspace(s);
+                   if (*s == '{') {
+                       PL_expect = XTERM;
+                       break;
+                   }
+                   if (strnEQ(s, "sub", 3)) {
+                       d = s + 3;
+                       d = skipspace(d);
+                       if (*d == ':') {
+                           PL_expect = XTERM;
+                           break;
+                       }
+                   }
+                   PL_expect = XSTATE;
+               }
                 else {
                     PL_lex_brackstack[PL_lex_brackets-1] = XSTATE;
                     PL_expect = XSTATE;
@@ -5596,8 +5665,7 @@ Perl_yylex(pTHX)
             break;
         }
         pl_yylval.ival = CopLINE(PL_curcop);
-       if (isSPACE(*s) || *s == '#')
-           PL_copline = NOLINE;   /* invalidate current command line number */
+       PL_copline = NOLINE;   /* invalidate current command line number */
         TOKEN(formbrack ? '=' : '{');
      case '}':
         if (PL_lex_brackets && PL_lex_brackstack[PL_lex_brackets-1] == XFAKEEOF)
@@ -5659,13 +5727,21 @@ Perl_yylex(pTHX)
                 Perl_warner(aTHX_ packWARN(WARN_SEMICOLON), "%s", PL_warn_nosemi);
                 CopLINE_inc(PL_curcop);
             }
+           d = s;
+           if ((bof = FEATURE_BITWISE_IS_ENABLED) && *s == '.')
+               s++;
             if (!PL_lex_allbrackets && PL_lex_fakeeof >=
                     (*s == '=' ? LEX_FAKEEOF_ASSIGN : LEX_FAKEEOF_BITWISE)) {
+               s = d;
                 s--;
                 TOKEN(0);
             }
-           PL_parser->saw_infix_sigil = 1;
-           BAop(OP_BIT_AND);
+           if (d == s) {
+               PL_parser->saw_infix_sigil = 1;
+               BAop(bof ? OP_NBIT_AND : OP_BIT_AND);
+           }
+           else
+               BAop(OP_SBIT_AND);
         }
  
         PL_tokenbuf[0] = '&';
@@ -5691,12 +5767,15 @@ Perl_yylex(pTHX)
             AOPERATOR(OROR);
         }
         s--;
+       d = s;
+       if ((bof = FEATURE_BITWISE_IS_ENABLED) && *s == '.')
+           s++;
         if (!PL_lex_allbrackets && PL_lex_fakeeof >=
                 (*s == '=' ? LEX_FAKEEOF_ASSIGN : LEX_FAKEEOF_BITWISE)) {
-           s--;
+           s = d - 1;
             TOKEN(0);
         }
-       BOop(OP_BIT_OR);
+       BOop(bof ? s == d ? OP_NBIT_OR : OP_SBIT_OR : OP_BIT_OR);
      case '=':
         s++;
         {
@@ -5726,30 +5805,30 @@ Perl_yylex(pTHX)
             s--;
             if (PL_expect == XSTATE && isALPHA(tmp) &&
                 (s == PL_linestart+1 || s[-2] == '\n') )
-               {
-                   if ((PL_in_eval && !PL_rsfp && !PL_parser->filtered)
-                       || PL_lex_state != LEX_NORMAL) {
-                       d = PL_bufend;
-                       while (s < d) {
-                           if (*s++ == '\n') {
-                               incline(s);
-                               if (strnEQ(s,"=cut",4)) {
-                                   s = strchr(s,'\n');
-                                   if (s)
-                                       s++;
-                                   else
-                                       s = d;
-                                   incline(s);
-                                   goto retry;
-                               }
-                           }
-                       }
-                       goto retry;
-                   }
-                   s = PL_bufend;
-                   PL_parser->in_pod = 1;
-                   goto retry;
-               }
+            {
+                if ((PL_in_eval && !PL_rsfp && !PL_parser->filtered)
+                    || PL_lex_state != LEX_NORMAL) {
+                    d = PL_bufend;
+                    while (s < d) {
+                        if (*s++ == '\n') {
+                            incline(s);
+                            if (strnEQ(s,"=cut",4)) {
+                                s = strchr(s,'\n');
+                                if (s)
+                                    s++;
+                                else
+                                    s = d;
+                                incline(s);
+                                goto retry;
+                            }
+                        }
+                    }
+                    goto retry;
+                }
+                s = PL_bufend;
+                PL_parser->in_pod = 1;
+                goto retry;
+            }
         }
         if (PL_expect == XBLOCK) {
             const char *t = s;
@@ -6230,7 +6309,7 @@ Perl_yylex(pTHX)
             }
             /* avoid v123abc() or $h{v1}, allow C<print v10;> */
             if (!isALPHA(*start) && (PL_expect == XTERM
-                       || PL_expect == XSTATE
+                       || PL_expect == XREF || PL_expect == XSTATE
                         || PL_expect == XTERMORDORDOR)) {
                 GV *const gv = gv_fetchpvn_flags(s, start - s,
                                                      UTF ? SVf_UTF8 : 0, SVt_PVCV);
@@ -6367,7 +6446,7 @@ Perl_yylex(pTHX)
             char tmpbuf[sizeof PL_tokenbuf + 1];
             *tmpbuf = '&';
             Copy(PL_tokenbuf, tmpbuf+1, len, char);
-           off = pad_findmy_pvn(tmpbuf, len+1, UTF ? SVf_UTF8 : 0);
+           off = pad_findmy_pvn(tmpbuf, len+1, 0);
             if (off != NOT_IN_PAD) {
                 assert(off); /* we assume this is boolean-true below */
                 if (PAD_COMPNAME_FLAGS_isOUR(off)) {
@@ -6899,13 +6978,13 @@ Perl_yylex(pTHX)
                 if (!IN_BYTES) {
                     if (UTF)
                         PerlIO_apply_layers(aTHX_ PL_rsfp, NULL, ":utf8");
-                   else if (PL_encoding) {
+                   else if (IN_ENCODING) {
                         SV *name;
                         dSP;
                         ENTER;
                         SAVETMPS;
                         PUSHMARK(sp);
-                       XPUSHs(PL_encoding);
+                       XPUSHs(_get_encoding());
                         PUTBACK;
                         call_method("name", G_SCALAR);
                         SPAGAIN;
@@ -6925,7 +7004,9 @@ Perl_yylex(pTHX)
         }
  
         case KEY___SUB__:
-           FUN0OP(newPVOP(OP_RUNCV,0,NULL));
+           FUN0OP(CvCLONE(PL_compcv)
+                       ? newOP(OP_RUNCV, 0)
+                       : newPVOP(OP_RUNCV,0,NULL));
  
         case KEY_AUTOLOAD:
         case KEY_DESTROY:
@@ -7596,10 +7677,8 @@ Perl_yylex(pTHX)
             }
             if (!words)
                 words = newNULLLIST();
-           if (PL_lex_stuff) {
-               SvREFCNT_dec(PL_lex_stuff);
-               PL_lex_stuff = NULL;
-           }
+           SvREFCNT_dec_NN(PL_lex_stuff);
+           PL_lex_stuff = NULL;
             PL_expect = XOPERATOR;
             pl_yylval.opval = sawparens(words);
             TOKEN(QWLIST);
@@ -7854,7 +7933,7 @@ Perl_yylex(pTHX)
                     *PL_tokenbuf = '&';
                     if (memchr(tmpbuf, ':', len) || key != KEY_sub
                      || pad_findmy_pvn(
-                           PL_tokenbuf, len + 1, UTF ? SVf_UTF8 : 0
+                           PL_tokenbuf, len + 1, 0
                         ) != NOT_IN_PAD)
                         sv_setpvn(PL_subname, tmpbuf, len);
                     else {
@@ -8155,7 +8234,7 @@ S_pending_ident(pTHX)
      if (!has_colon) {
         if (!PL_in_my)
             tmp = pad_findmy_pvn(PL_tokenbuf, tokenbuf_len,
-                                    UTF ? SVf_UTF8 : 0);
+                                 0);
          if (tmp != NOT_IN_PAD) {
              /* might be an "our" variable" */
              if (PAD_COMPNAME_FLAGS_isOUR(tmp)) {
@@ -8273,7 +8352,7 @@ S_checkcomma(pTHX_ const char *s, const char *name, const char *what)
                 char tmpbuf[256];
                 Copy(w, tmpbuf+1, s - w, char);
                 *tmpbuf = '&';
-               off = pad_findmy_pvn(tmpbuf, s-w+1, UTF ? SVf_UTF8 : 0);
+               off = pad_findmy_pvn(tmpbuf, s-w+1, 0);
                 if (off != NOT_IN_PAD) return;
             }
             Perl_croak(aTHX_ "No comma allowed after %s", what);
@@ -8370,7 +8449,7 @@ S_new_constant(pTHX_ const char *s, STRLEN len, const char *key, STRLEN keylen,
         yyerror_pv(msg, UTF ? SVf_UTF8 : 0);
         return SvREFCNT_inc_simple_NN(sv);
      }
-now_ok:
+  now_ok:
      cv = *cvp;
      if (!pv && s)
         pv = newSVpvn_flags(s, len, SVs_TEMP);
@@ -8561,12 +8640,22 @@ S_scan_ident(pTHX_ char *s, char *dest, STRLEN destlen, I32 ck_uni)
   *
   *      Because all ASCII characters have the same representation whether
   *      encoded in UTF-8 or not, we can use the foo_A macros below and '\0' and
- *      '{' without knowing if is UTF-8 or not */
+ *      '{' without knowing if is UTF-8 or not.
+ * EBCDIC already uses the rules that ASCII platforms will use after the
+ * deprecation cycle; see comment below about the deprecation. */
+#ifdef EBCDIC
+#   define VALID_LEN_ONE_IDENT(s, is_utf8)                                    \
+    (isGRAPH_A(*(s)) || ((is_utf8)                                            \
+                         ? isIDFIRST_utf8((U8*) (s))                          \
+                         : (isGRAPH_L1(*s)                                    \
+                            && LIKELY((U8) *(s) != LATIN1_TO_NATIVE(0xAD)))))
+#else
  #   define VALID_LEN_ONE_IDENT(s, is_utf8) (! isSPACE_A(*(s))                 \
                                              && LIKELY(*(s) != '\0')           \
                                              && (! is_utf8                     \
                                                  || isASCII_utf8((U8*) (s))    \
                                                  || isIDFIRST_utf8((U8*) (s))))
+#endif
      if ((s <= PL_bufend - (is_utf8)
                            ? UTF8SKIP(s)
                            : 1)
@@ -8904,10 +8993,8 @@ S_scan_subst(pTHX_ char *start)
      first_line = CopLINE(PL_curcop);
      s = scan_str(s,FALSE,FALSE,FALSE,NULL);
      if (!s) {
-       if (PL_lex_stuff) {
-           SvREFCNT_dec(PL_lex_stuff);
-           PL_lex_stuff = NULL;
-       }
+       SvREFCNT_dec_NN(PL_lex_stuff);
+       PL_lex_stuff = NULL;
         Perl_croak(aTHX_ "Substitution replacement not terminated");
      }
      PL_multi_start = first_start;      /* so whole substitution is taken together */
@@ -8986,10 +9073,8 @@ S_scan_trans(pTHX_ char *start)
  
      s = scan_str(s,FALSE,FALSE,FALSE,NULL);
      if (!s) {
-       if (PL_lex_stuff) {
-           SvREFCNT_dec(PL_lex_stuff);
-           PL_lex_stuff = NULL;
-       }
+       SvREFCNT_dec_NN(PL_lex_stuff);
+       PL_lex_stuff = NULL;
         Perl_croak(aTHX_ "Transliteration replacement not terminated");
      }
  
@@ -9246,7 +9331,14 @@ S_scan_heredoc(pTHX_ char *s)
                     origline + 1 + PL_parser->herelines);
         if (!lex_next_chunk(LEX_NO_TERM)
          && (!SvCUR(tmpstr) || SvEND(tmpstr)[-1] != '\n')) {
-           SvREFCNT_dec(linestr_save);
+           /* Simply freeing linestr_save might seem simpler here, as it
+              does not matter what PL_linestr points to, since we are
+              about to croak; but in a quote-like op, linestr_save
+              will have been prospectively freed already, via
+              SAVEFREESV(PL_linestr) in sublex_push, so it’s easier to
+              restore PL_linestr. */
+           SvREFCNT_dec_NN(PL_linestr);
+           PL_linestr = linestr_save;
             goto interminable;
         }
         CopLINE_set(PL_curcop, origline);
@@ -9296,8 +9388,8 @@ S_scan_heredoc(pTHX_ char *s)
      if (!IN_BYTES) {
         if (UTF && is_utf8_string((U8*)SvPVX_const(tmpstr), SvCUR(tmpstr)))
             SvUTF8_on(tmpstr);
-       else if (PL_encoding)
-           sv_recode_to_utf8(tmpstr, PL_encoding);
+       else if (IN_ENCODING)
+           sv_recode_to_utf8(tmpstr, _get_encoding());
      }
      PL_lex_stuff = tmpstr;
      pl_yylval.ival = op_type;
@@ -9408,7 +9500,7 @@ S_scan_inputsymbol(pTHX_ char *start)
             /* try to find it in the pad for this block, otherwise find
                add symbol table ops
             */
-           const PADOFFSET tmp = pad_findmy_pvn(d, len, UTF ? SVf_UTF8 : 0);
+           const PADOFFSET tmp = pad_findmy_pvn(d, len, 0);
             if (tmp != NOT_IN_PAD) {
                 if (PAD_COMPNAME_FLAGS_isOUR(tmp)) {
                     HV * const stash = PAD_COMPNAME_OURSTASH(tmp);
@@ -9432,7 +9524,7 @@ S_scan_inputsymbol(pTHX_ char *start)
             else {
                 GV *gv;
                 ++d;
-intro_sym:
+              intro_sym:
                 gv = gv_fetchpv(d,
                                 GV_ADDMULTI | ( UTF ? SVf_UTF8 : 0 ),
                                 SVt_PV);
@@ -9587,12 +9679,12 @@ S_scan_str(pTHX_ char *start, int keep_bracketed_quoted, int keep_delims, int re
         sv_catpvn(sv, s, termlen);
      s += termlen;
      for (;;) {
-       if (PL_encoding && !UTF && !re_reparse) {
+       if (IN_ENCODING && !UTF && !re_reparse) {
             bool cont = TRUE;
  
             while (cont) {
                 int offset = s - SvPVX_const(PL_linestr);
-               const bool found = sv_cat_decode(sv, PL_encoding, PL_linestr,
+               const bool found = sv_cat_decode(sv, _get_encoding(), PL_linestr,
                                            &offset, (char*)termstr, termlen);
                 const char *ns;
                 char *svlast;
@@ -9805,13 +9897,13 @@ S_scan_str(pTHX_ char *start, int keep_bracketed_quoted, int keep_delims, int re
  
      /* at this point, we have successfully read the delimited string */
  
-    if (!PL_encoding || UTF || re_reparse) {
+    if (!IN_ENCODING || UTF || re_reparse) {
  
         if (keep_delims)
             sv_catpvn(sv, s, termlen);
         s += termlen;
      }
-    if (has_utf8 || (PL_encoding && !re_reparse))
+    if (has_utf8 || (IN_ENCODING && !re_reparse))
         SvUTF8_on(sv);
  
      PL_multi_end = CopLINE(PL_curcop);
@@ -10374,7 +10466,7 @@ Perl_scan_num(pTHX_ const char *start, YYSTYPE* lvalp)
  
      /* if it starts with a v, it could be a v-string */
      case 'v':
-vstring:
+    vstring:
                 sv = newSV(5); /* preallocate storage space */
                 ENTER_with_name("scan_vstring");
                 SAVEFREESV(sv);
@@ -10468,7 +10560,7 @@ S_scan_formline(pTHX_ char *s)
         if (needargs) {
             const char *s2 = s;
             while (*s2 == '\r' || *s2 == ' ' || *s2 == '\t' || *s2 == '\f'
-               || *s2 == 013)
+               || *s2 == '\v')
                 s2++;
             if (*s2 == '{') {
                 PL_expect = XTERMBLOCK;
@@ -10481,8 +10573,8 @@ S_scan_formline(pTHX_ char *s)
         if (!IN_BYTES) {
             if (UTF && is_utf8_string((U8*)SvPVX_const(stuff), SvCUR(stuff)))
                 SvUTF8_on(stuff);
-           else if (PL_encoding)
-               sv_recode_to_utf8(stuff, PL_encoding);
+           else if (IN_ENCODING)
+               sv_recode_to_utf8(stuff, _get_encoding());
         }
         NEXTVAL_NEXTTOKE.opval = (OP*)newSVOP(OP_CONST, 0, stuff);
         force_next(THING);
@@ -10513,8 +10605,7 @@ Perl_start_subparse(pTHX_ I32 is_format, U32 flags)
      CvOUTSIDE(PL_compcv) = MUTABLE_CV(SvREFCNT_inc_simple(outsidecv));
      CvOUTSIDE_SEQ(PL_compcv) = PL_cop_seqmax;
      if (outsidecv && CvPADLIST(outsidecv))
-       CvPADLIST(PL_compcv)->xpadl_outid =
-           PadlistNAMES(CvPADLIST(outsidecv));
+       CvPADLIST(PL_compcv)->xpadl_outid = CvPADLIST(outsidecv)->xpadl_id;
  
      return oldsavestack_ix;
  }
@@ -10526,7 +10617,6 @@ S_yywarn(pTHX_ const char *const s, U32 flags)
  
      PL_in_eval |= EVAL_WARNONLY;
      yyerror_pv(s, flags);
-    PL_in_eval &= ~EVAL_WARNONLY;
      return 0;
  }
  
@@ -10592,7 +10682,7 @@ Perl_yyerror_pvn(pTHX_ const char *const s, STRLEN len, U32 flags)
      }
      else if (yychar > 255)
         sv_catpvs(where_sv, "next token ???");
-    else if (yychar == -2) { /* YYEMPTY */
+    else if (yychar == YYEMPTY) {
         if (PL_lex_state == LEX_NORMAL ||
            (PL_lex_state == LEX_KNOWNEXT && PL_lex_defer == LEX_NORMAL))
             sv_catpvs(where_sv, "at end of line");
@@ -10630,6 +10720,7 @@ Perl_yyerror_pvn(pTHX_ const char *const s, STRLEN len, U32 flags)
          PL_multi_end = 0;
      }
      if (PL_in_eval & EVAL_WARNONLY) {
+       PL_in_eval &= ~EVAL_WARNONLY;
         Perl_ck_warner_d(aTHX_ packWARN(WARN_SYNTAX), "%"SVf, SVfARG(msg));
      }
      else
@@ -11500,10 +11591,16 @@ Perl_parse_subsignature(pTHX)
                                 scalar(newUNOP(OP_RV2AV, 0,
                                     newGVOP(OP_GV, 0, PL_defgv))),
                                 newSVOP(OP_CONST, 0, newSViv(1))),
-                           newLISTOP(OP_DIE, 0, newOP(OP_PUSHMARK, 0),
-                               newSVOP(OP_CONST, 0,
-                                   newSVpvs("Odd name/value argument "
-                                       "for subroutine"))));
+                           op_convert_list(OP_DIE, 0,
+                               op_convert_list(OP_SPRINTF, 0,
+                                   op_append_list(OP_LIST,
+                                       newSVOP(OP_CONST, 0,
+                                           newSVpvs("Odd name/value argument for subroutine at %s line %d.\n")),
+                                       newSLICEOP(0,
+                                           op_append_list(OP_LIST,
+                                               newSVOP(OP_CONST, 0, newSViv(1)),
+                                               newSVOP(OP_CONST, 0, newSViv(2))),
+                                           newOP(OP_CALLER, 0))))));
                     if (pos != min_arity)
                         chkop = newLOGOP(OP_AND, 0,
                                     newBINOP(OP_GT, 0,
@@ -11566,9 +11663,16 @@ Perl_parse_subsignature(pTHX)
                         scalar(newUNOP(OP_RV2AV, 0,
                             newGVOP(OP_GV, 0, PL_defgv))),
                         newSVOP(OP_CONST, 0, newSViv(min_arity))),
-                   newLISTOP(OP_DIE, 0, newOP(OP_PUSHMARK, 0),
-                       newSVOP(OP_CONST, 0,
-                           newSVpvs("Too few arguments for subroutine"))))),
+                   op_convert_list(OP_DIE, 0,
+                       op_convert_list(OP_SPRINTF, 0,
+                           op_append_list(OP_LIST,
+                               newSVOP(OP_CONST, 0,
+                                   newSVpvs("Too few arguments for subroutine at %s line %d.\n")),
+                               newSLICEOP(0,
+                                   op_append_list(OP_LIST,
+                                       newSVOP(OP_CONST, 0, newSViv(1)),
+                                       newSVOP(OP_CONST, 0, newSViv(2))),
+                                   newOP(OP_CALLER, 0))))))),
             initops);
      }
      if (max_arity != -1) {
@@ -11579,9 +11683,16 @@ Perl_parse_subsignature(pTHX)
                         scalar(newUNOP(OP_RV2AV, 0,
                             newGVOP(OP_GV, 0, PL_defgv))),
                         newSVOP(OP_CONST, 0, newSViv(max_arity))),
-                   newLISTOP(OP_DIE, 0, newOP(OP_PUSHMARK, 0),
-                       newSVOP(OP_CONST, 0,
-                           newSVpvs("Too many arguments for subroutine"))))),
+                   op_convert_list(OP_DIE, 0,
+                       op_convert_list(OP_SPRINTF, 0,
+                           op_append_list(OP_LIST,
+                               newSVOP(OP_CONST, 0,
+                                   newSVpvs("Too many arguments for subroutine at %s line %d.\n")),
+                               newSLICEOP(0,
+                                   op_append_list(OP_LIST,
+                                       newSVOP(OP_CONST, 0, newSViv(1)),
+                                       newSVOP(OP_CONST, 0, newSViv(2))),
+                                   newOP(OP_CALLER, 0))))))),
             initops);
      }
      return initops;