perl 5.002
[perl.git] / toke.c
1 /*    toke.c
2  *
3  *    Copyright (c) 1991-1994, Larry Wall
4  *
5  *    You may distribute under the terms of either the GNU General Public
6  *    License or the Artistic License, as specified in the README file.
7  *
8  */
9
10 /*
11  *   "It all comes from here, the stench and the peril."  --Frodo
12  */
13
14 #include "EXTERN.h"
15 #include "perl.h"
16
17 static void check_uni _((void));
18 static void  force_next _((I32 type));
19 static char *force_word _((char *start, int token, int check_keyword, int allow_pack, int allow_tick));
20 static SV *q _((SV *sv));
21 static char *scan_const _((char *start));
22 static char *scan_formline _((char *s));
23 static char *scan_heredoc _((char *s));
24 static char *scan_ident _((char *s, char *send, char *dest, I32 ck_uni));
25 static char *scan_inputsymbol _((char *start));
26 static char *scan_pat _((char *start));
27 static char *scan_str _((char *start));
28 static char *scan_subst _((char *start));
29 static char *scan_trans _((char *start));
30 static char *scan_word _((char *s, char *dest, int allow_package, STRLEN *slp));
31 static char *skipspace _((char *s));
32 static void checkcomma _((char *s, char *name, char *what));
33 static void force_ident _((char *s, int kind));
34 static void incline _((char *s));
35 static int intuit_method _((char *s, GV *gv));
36 static int intuit_more _((char *s));
37 static I32 lop _((I32 f, expectation x, char *s));
38 static void missingterm _((char *s));
39 static void no_op _((char *what, char *s));
40 static void set_csh _((void));
41 static I32 sublex_done _((void));
42 static I32 sublex_start _((void));
43 #ifdef CRIPPLED_CC
44 static int uni _((I32 f, char *s));
45 #endif
46 static char * filter_gets _((SV *sv, FILE *fp));
47 static void restore_rsfp _((void *f));
48
49 /* The following are arranged oddly so that the guard on the switch statement
50  * can get by with a single comparison (if the compiler is smart enough).
51  */
52
53 #define LEX_NORMAL              9
54 #define LEX_INTERPNORMAL        8
55 #define LEX_INTERPCASEMOD       7
56 #define LEX_INTERPSTART         6
57 #define LEX_INTERPEND           5
58 #define LEX_INTERPENDMAYBE      4
59 #define LEX_INTERPCONCAT        3
60 #define LEX_INTERPCONST         2
61 #define LEX_FORMLINE            1
62 #define LEX_KNOWNEXT            0
63
64 #ifdef I_FCNTL
65 #include <fcntl.h>
66 #endif
67 #ifdef I_SYS_FILE
68 #include <sys/file.h>
69 #endif
70
71 #ifdef ff_next
72 #undef ff_next
73 #endif
74
75 #include "keywords.h"
76
77 #ifdef CLINE
78 #undef CLINE
79 #endif
80 #define CLINE (copline = (curcop->cop_line < copline ? curcop->cop_line : copline))
81
82 #define TOKEN(retval) return (bufptr = s,(int)retval)
83 #define OPERATOR(retval) return (expect = XTERM,bufptr = s,(int)retval)
84 #define AOPERATOR(retval) return ao((expect = XTERM,bufptr = s,(int)retval))
85 #define PREBLOCK(retval) return (expect = XBLOCK,bufptr = s,(int)retval)
86 #define PRETERMBLOCK(retval) return (expect = XTERMBLOCK,bufptr = s,(int)retval)
87 #define PREREF(retval) return (expect = XREF,bufptr = s,(int)retval)
88 #define TERM(retval) return (CLINE, expect = XOPERATOR,bufptr = s,(int)retval)
89 #define LOOPX(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)LOOPEX)
90 #define FTST(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)UNIOP)
91 #define FUN0(f) return(yylval.ival = f,expect = XOPERATOR,bufptr = s,(int)FUNC0)
92 #define FUN1(f) return(yylval.ival = f,expect = XOPERATOR,bufptr = s,(int)FUNC1)
93 #define BOop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)BITOROP))
94 #define BAop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)BITANDOP))
95 #define SHop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)SHIFTOP))
96 #define PWop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)POWOP))
97 #define PMop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)MATCHOP)
98 #define Aop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)ADDOP))
99 #define Mop(f) return ao((yylval.ival=f,expect = XTERM,bufptr = s,(int)MULOP))
100 #define Eop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)EQOP)
101 #define Rop(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)RELOP)
102
103 /* This bit of chicanery makes a unary function followed by
104  * a parenthesis into a function with one argument, highest precedence.
105  */
106 #define UNI(f) return(yylval.ival = f, \
107         expect = XTERM, \
108         bufptr = s, \
109         last_uni = oldbufptr, \
110         last_lop_op = f, \
111         (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
112
113 #define UNIBRACK(f) return(yylval.ival = f, \
114         bufptr = s, \
115         last_uni = oldbufptr, \
116         (*s == '(' || (s = skipspace(s), *s == '(') ? (int)FUNC1 : (int)UNIOP) )
117
118 /* grandfather return to old style */
119 #define OLDLOP(f) return(yylval.ival=f,expect = XTERM,bufptr = s,(int)LSTOP)
120
121 static int
122 ao(toketype)
123 int toketype;
124 {
125     if (*bufptr == '=') {
126         bufptr++;
127         if (toketype == ANDAND)
128             yylval.ival = OP_ANDASSIGN;
129         else if (toketype == OROR)
130             yylval.ival = OP_ORASSIGN;
131         toketype = ASSIGNOP;
132     }
133     return toketype;
134 }
135
136 static void
137 no_op(what, s)
138 char *what;
139 char *s;
140 {
141     char tmpbuf[128];
142     char *oldbp = bufptr;
143     bool is_first = (oldbufptr == SvPVX(linestr));
144     bufptr = s;
145     sprintf(tmpbuf, "%s found where operator expected", what);
146     yywarn(tmpbuf);
147     if (is_first)
148         warn("\t(Missing semicolon on previous line?)\n");
149     else if (oldoldbufptr && isIDFIRST(*oldoldbufptr)) {
150         char *t;
151         for (t = oldoldbufptr; *t && (isALNUM(*t) || *t == ':'); t++) ;
152         if (t < bufptr && isSPACE(*t))
153             warn("\t(Do you need to predeclare %.*s?)\n",
154                 t - oldoldbufptr, oldoldbufptr);
155
156     }
157     else
158         warn("\t(Missing operator before %.*s?)\n", s - oldbp, oldbp);
159     bufptr = oldbp;
160 }
161
162 static void
163 missingterm(s)
164 char *s;
165 {
166     char tmpbuf[3];
167     char q;
168     if (s) {
169         char *nl = strrchr(s,'\n');
170         if (nl)
171             *nl = '\0';
172     }
173     else if (multi_close < 32 || multi_close == 127) {
174         *tmpbuf = '^';
175         tmpbuf[1] = multi_close ^ 64;
176         s = "\\n";
177         tmpbuf[2] = '\0';
178         s = tmpbuf;
179     }
180     else {
181         *tmpbuf = multi_close;
182         tmpbuf[1] = '\0';
183         s = tmpbuf;
184     }
185     q = strchr(s,'"') ? '\'' : '"';
186     croak("Can't find string terminator %c%s%c anywhere before EOF",q,s,q);
187 }
188
189 void
190 deprecate(s)
191 char *s;
192 {
193     if (dowarn)
194         warn("Use of %s is deprecated", s);
195 }
196
197 static void
198 depcom()
199 {
200     deprecate("comma-less variable list");
201 }
202
203 void
204 lex_start(line)
205 SV *line;
206 {
207     char *s;
208     STRLEN len;
209
210     SAVEINT(lex_dojoin);
211     SAVEINT(lex_brackets);
212     SAVEINT(lex_fakebrack);
213     SAVEINT(lex_casemods);
214     SAVEINT(lex_starts);
215     SAVEINT(lex_state);
216     SAVESPTR(lex_inpat);
217     SAVEINT(lex_inwhat);
218     SAVEINT(curcop->cop_line);
219     SAVEPPTR(bufptr);
220     SAVEPPTR(bufend);
221     SAVEPPTR(oldbufptr);
222     SAVEPPTR(oldoldbufptr);
223     SAVESPTR(linestr);
224     SAVEPPTR(lex_brackstack);
225     SAVEPPTR(lex_casestack);
226     SAVEDESTRUCTOR(restore_rsfp, rsfp);
227
228     lex_state = LEX_NORMAL;
229     lex_defer = 0;
230     expect = XSTATE;
231     lex_brackets = 0;
232     lex_fakebrack = 0;
233     New(899, lex_brackstack, 120, char);
234     New(899, lex_casestack, 12, char);
235     SAVEFREEPV(lex_brackstack);
236     SAVEFREEPV(lex_casestack);
237     lex_casemods = 0;
238     *lex_casestack = '\0';
239     lex_dojoin = 0;
240     lex_starts = 0;
241     if (lex_stuff)
242         SvREFCNT_dec(lex_stuff);
243     lex_stuff = Nullsv;
244     if (lex_repl)
245         SvREFCNT_dec(lex_repl);
246     lex_repl = Nullsv;
247     lex_inpat = 0;
248     lex_inwhat = 0;
249     linestr = line;
250     if (SvREADONLY(linestr))
251         linestr = sv_2mortal(newSVsv(linestr));
252     s = SvPV(linestr, len);
253     if (len && s[len-1] != ';') {
254         if (!(SvFLAGS(linestr) & SVs_TEMP))
255             linestr = sv_2mortal(newSVsv(linestr));
256         sv_catpvn(linestr, "\n;", 2);
257     }
258     SvTEMP_off(linestr);
259     oldoldbufptr = oldbufptr = bufptr = SvPVX(linestr);
260     bufend = bufptr + SvCUR(linestr);
261     SvREFCNT_dec(rs);
262     rs = newSVpv("\n", 1);
263     rsfp = 0;
264 }
265
266 void
267 lex_end()
268 {
269 }
270
271 static void
272 restore_rsfp(f)
273 void *f;
274 {
275     FILE *fp = (FILE*)f;
276
277     if (rsfp == stdin)
278         clearerr(rsfp);
279     else if (rsfp && (rsfp != fp))
280         fclose(rsfp);
281     rsfp = fp;
282 }
283
284 static void
285 incline(s)
286 char *s;
287 {
288     char *t;
289     char *n;
290     char ch;
291     int sawline = 0;
292
293     curcop->cop_line++;
294     if (*s++ != '#')
295         return;
296     while (*s == ' ' || *s == '\t') s++;
297     if (strnEQ(s, "line ", 5)) {
298         s += 5;
299         sawline = 1;
300     }
301     if (!isDIGIT(*s))
302         return;
303     n = s;
304     while (isDIGIT(*s))
305         s++;
306     while (*s == ' ' || *s == '\t')
307         s++;
308     if (*s == '"' && (t = strchr(s+1, '"')))
309         s++;
310     else {
311         if (!sawline)
312             return;             /* false alarm */
313         for (t = s; !isSPACE(*t); t++) ;
314     }
315     ch = *t;
316     *t = '\0';
317     if (t - s > 0)
318         curcop->cop_filegv = gv_fetchfile(s);
319     else
320         curcop->cop_filegv = gv_fetchfile(origfilename);
321     *t = ch;
322     curcop->cop_line = atoi(n)-1;
323 }
324
325 static char *
326 skipspace(s)
327 register char *s;
328 {
329     if (lex_formbrack && lex_brackets <= lex_formbrack) {
330         while (s < bufend && (*s == ' ' || *s == '\t'))
331             s++;
332         return s;
333     }
334     for (;;) {
335         while (s < bufend && isSPACE(*s))
336             s++;
337         if (s < bufend && *s == '#') {
338             while (s < bufend && *s != '\n')
339                 s++;
340             if (s < bufend)
341                 s++;
342         }
343         if (s < bufend || !rsfp || lex_state != LEX_NORMAL)
344             return s;
345         if ((s = filter_gets(linestr, rsfp)) == Nullch) {
346             if (minus_n || minus_p) {
347                 sv_setpv(linestr,minus_p ? ";}continue{print" : "");
348                 sv_catpv(linestr,";}");
349                 minus_n = minus_p = 0;
350             }
351             else
352                 sv_setpv(linestr,";");
353             oldoldbufptr = oldbufptr = bufptr = s = SvPVX(linestr);
354             bufend = SvPVX(linestr) + SvCUR(linestr);
355             if (preprocess && !in_eval)
356                 (void)my_pclose(rsfp);
357             else if ((FILE*)rsfp == stdin)
358                 clearerr(stdin);
359             else
360                 (void)fclose(rsfp);
361             rsfp = Nullfp;
362             return s;
363         }
364         oldoldbufptr = oldbufptr = bufptr = s;
365         bufend = bufptr + SvCUR(linestr);
366         incline(s);
367         if (perldb && curstash != debstash) {
368             SV *sv = NEWSV(85,0);
369
370             sv_upgrade(sv, SVt_PVMG);
371             sv_setsv(sv,linestr);
372             av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
373         }
374     }
375 }
376
377 static void
378 check_uni() {
379     char *s;
380     char ch;
381     char *t;
382
383     if (oldoldbufptr != last_uni)
384         return;
385     while (isSPACE(*last_uni))
386         last_uni++;
387     for (s = last_uni; isALNUM(*s) || *s == '-'; s++) ;
388     if ((t = strchr(s, '(')) && t < bufptr)
389         return;
390     ch = *s;
391     *s = '\0';
392     warn("Warning: Use of \"%s\" without parens is ambiguous", last_uni);
393     *s = ch;
394 }
395
396 #ifdef CRIPPLED_CC
397
398 #undef UNI
399 #define UNI(f) return uni(f,s)
400
401 static int
402 uni(f,s)
403 I32 f;
404 char *s;
405 {
406     yylval.ival = f;
407     expect = XTERM;
408     bufptr = s;
409     last_uni = oldbufptr;
410     last_lop_op = f;
411     if (*s == '(')
412         return FUNC1;
413     s = skipspace(s);
414     if (*s == '(')
415         return FUNC1;
416     else
417         return UNIOP;
418 }
419
420 #endif /* CRIPPLED_CC */
421
422 #define LOP(f,x) return lop(f,x,s)
423
424 static I32
425 lop(f,x,s)
426 I32 f;
427 expectation x;
428 char *s;
429 {
430     yylval.ival = f;
431     CLINE;
432     expect = x;
433     bufptr = s;
434     last_lop = oldbufptr;
435     last_lop_op = f;
436     if (nexttoke)
437         return LSTOP;
438     if (*s == '(')
439         return FUNC;
440     s = skipspace(s);
441     if (*s == '(')
442         return FUNC;
443     else
444         return LSTOP;
445 }
446
447 static void 
448 force_next(type)
449 I32 type;
450 {
451     nexttype[nexttoke] = type;
452     nexttoke++;
453     if (lex_state != LEX_KNOWNEXT) {
454         lex_defer = lex_state;
455         lex_expect = expect;
456         lex_state = LEX_KNOWNEXT;
457     }
458 }
459
460 static char *
461 force_word(start,token,check_keyword,allow_pack,allow_tick)
462 register char *start;
463 int token;
464 int check_keyword;
465 int allow_pack;
466 int allow_tick;
467 {
468     register char *s;
469     STRLEN len;
470     
471     start = skipspace(start);
472     s = start;
473     if (isIDFIRST(*s) ||
474         (allow_pack && *s == ':') ||
475         (allow_tick && *s == '\'') )
476     {
477         s = scan_word(s, tokenbuf, allow_pack, &len);
478         if (check_keyword && keyword(tokenbuf, len))
479             return start;
480         if (token == METHOD) {
481             s = skipspace(s);
482             if (*s == '(')
483                 expect = XTERM;
484             else {
485                 expect = XOPERATOR;
486                 force_next(')');
487                 force_next('(');
488             }
489         }
490         nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST,0, newSVpv(tokenbuf,0));
491         nextval[nexttoke].opval->op_private |= OPpCONST_BARE;
492         force_next(token);
493     }
494     return s;
495 }
496
497 static void
498 force_ident(s, kind)
499 register char *s;
500 int kind;
501 {
502     if (s && *s) {
503         OP* op = (OP*)newSVOP(OP_CONST, 0, newSVpv(s,0));
504         nextval[nexttoke].opval = op;
505         force_next(WORD);
506         if (kind) {
507             op->op_private = OPpCONST_ENTERED;
508             gv_fetchpv(s, TRUE,
509                 kind == '$' ? SVt_PV :
510                 kind == '@' ? SVt_PVAV :
511                 kind == '%' ? SVt_PVHV :
512                               SVt_PVGV
513                 );
514         }
515     }
516 }
517
518 static SV *
519 q(sv)
520 SV *sv;
521 {
522     register char *s;
523     register char *send;
524     register char *d;
525     STRLEN len;
526
527     if (!SvLEN(sv))
528         return sv;
529
530     s = SvPV_force(sv, len);
531     if (SvIVX(sv) == -1)
532         return sv;
533     send = s + len;
534     while (s < send && *s != '\\')
535         s++;
536     if (s == send)
537         return sv;
538     d = s;
539     while (s < send) {
540         if (*s == '\\') {
541             if (s + 1 < send && (s[1] == '\\'))
542                 s++;            /* all that, just for this */
543         }
544         *d++ = *s++;
545     }
546     *d = '\0';
547     SvCUR_set(sv, d - SvPVX(sv));
548
549     return sv;
550 }
551
552 static I32
553 sublex_start()
554 {
555     register I32 op_type = yylval.ival;
556
557     if (op_type == OP_NULL) {
558         yylval.opval = lex_op;
559         lex_op = Nullop;
560         return THING;
561     }
562     if (op_type == OP_CONST || op_type == OP_READLINE) {
563         yylval.opval = (OP*)newSVOP(op_type, 0, q(lex_stuff));
564         lex_stuff = Nullsv;
565         return THING;
566     }
567
568     push_scope();
569     SAVEINT(lex_dojoin);
570     SAVEINT(lex_brackets);
571     SAVEINT(lex_fakebrack);
572     SAVEINT(lex_casemods);
573     SAVEINT(lex_starts);
574     SAVEINT(lex_state);
575     SAVESPTR(lex_inpat);
576     SAVEINT(lex_inwhat);
577     SAVEINT(curcop->cop_line);
578     SAVEPPTR(bufptr);
579     SAVEPPTR(oldbufptr);
580     SAVEPPTR(oldoldbufptr);
581     SAVESPTR(linestr);
582     SAVEPPTR(lex_brackstack);
583     SAVEPPTR(lex_casestack);
584
585     linestr = lex_stuff;
586     lex_stuff = Nullsv;
587
588     bufend = bufptr = oldbufptr = oldoldbufptr = SvPVX(linestr);
589     bufend += SvCUR(linestr);
590     SAVEFREESV(linestr);
591
592     lex_dojoin = FALSE;
593     lex_brackets = 0;
594     lex_fakebrack = 0;
595     New(899, lex_brackstack, 120, char);
596     New(899, lex_casestack, 12, char);
597     SAVEFREEPV(lex_brackstack);
598     SAVEFREEPV(lex_casestack);
599     lex_casemods = 0;
600     *lex_casestack = '\0';
601     lex_starts = 0;
602     lex_state = LEX_INTERPCONCAT;
603     curcop->cop_line = multi_start;
604
605     lex_inwhat = op_type;
606     if (op_type == OP_MATCH || op_type == OP_SUBST)
607         lex_inpat = lex_op;
608     else
609         lex_inpat = 0;
610
611     expect = XTERM;
612     force_next('(');
613     if (lex_op) {
614         yylval.opval = lex_op;
615         lex_op = Nullop;
616         return PMFUNC;
617     }
618     else
619         return FUNC;
620 }
621
622 static I32
623 sublex_done()
624 {
625     if (!lex_starts++) {
626         expect = XOPERATOR;
627         yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv("",0));
628         return THING;
629     }
630
631     if (lex_casemods) {         /* oops, we've got some unbalanced parens */
632         lex_state = LEX_INTERPCASEMOD;
633         return yylex();
634     }
635
636     /* Is there a right-hand side to take care of? */
637     if (lex_repl && (lex_inwhat == OP_SUBST || lex_inwhat == OP_TRANS)) {
638         linestr = lex_repl;
639         lex_inpat = 0;
640         bufend = bufptr = oldbufptr = oldoldbufptr = SvPVX(linestr);
641         bufend += SvCUR(linestr);
642         SAVEFREESV(linestr);
643         lex_dojoin = FALSE;
644         lex_brackets = 0;
645         lex_fakebrack = 0;
646         lex_casemods = 0;
647         *lex_casestack = '\0';
648         lex_starts = 0;
649         if (SvCOMPILED(lex_repl)) {
650             lex_state = LEX_INTERPNORMAL;
651             lex_starts++;
652         }
653         else
654             lex_state = LEX_INTERPCONCAT;
655         lex_repl = Nullsv;
656         return ',';
657     }
658     else {
659         pop_scope();
660         bufend = SvPVX(linestr);
661         bufend += SvCUR(linestr);
662         expect = XOPERATOR;
663         return ')';
664     }
665 }
666
667 static char *
668 scan_const(start)
669 char *start;
670 {
671     register char *send = bufend;
672     SV *sv = NEWSV(93, send - start);
673     register char *s = start;
674     register char *d = SvPVX(sv);
675     bool dorange = FALSE;
676     I32 len;
677     char *leave =
678         lex_inpat
679             ? "\\.^$@AGZdDwWsSbB+*?|()-nrtfeaxc0123456789[{]} \t\n\r\f\v#"
680             : (lex_inwhat & OP_TRANS)
681                 ? ""
682                 : "";
683
684     while (s < send || dorange) {
685         if (lex_inwhat == OP_TRANS) {
686             if (dorange) {
687                 I32 i;
688                 I32 max;
689                 i = d - SvPVX(sv);
690                 SvGROW(sv, SvLEN(sv) + 256);
691                 d = SvPVX(sv) + i;
692                 d -= 2;
693                 max = (U8)d[1];
694                 for (i = (U8)*d; i <= max; i++)
695                     *d++ = i;
696                 dorange = FALSE;
697                 continue;
698             }
699             else if (*s == '-' && s+1 < send  && s != start) {
700                 dorange = TRUE;
701                 s++;
702             }
703         }
704         else if (*s == '(' && lex_inpat && s[1] == '?' && s[2] == '#') {
705             while (s < send && *s != ')')
706                 *d++ = *s++;
707         }
708         else if (*s == '#' && lex_inpat &&
709           ((PMOP*)lex_inpat)->op_pmflags & PMf_EXTENDED) {
710             while (s+1 < send && *s != '\n')
711                 *d++ = *s++;
712         }
713         else if (*s == '@' && s[1] && (isALNUM(s[1]) || strchr(":'{$", s[1])))
714             break;
715         else if (*s == '$') {
716             if (!lex_inpat)     /* not a regexp, so $ must be var */
717                 break;
718             if (s + 1 < send && !strchr(")| \n\t", s[1]))
719                 break;          /* in regexp, $ might be tail anchor */
720         }
721         if (*s == '\\' && s+1 < send) {
722             s++;
723             if (*s && strchr(leave, *s)) {
724                 *d++ = '\\';
725                 *d++ = *s++;
726                 continue;
727             }
728             if (lex_inwhat == OP_SUBST && !lex_inpat &&
729                 isDIGIT(*s) && *s != '0' && !isDIGIT(s[1]))
730             {
731                 if (dowarn)
732                     warn("\\%c better written as $%c", *s, *s);
733                 *--s = '$';
734                 break;
735             }
736             if (lex_inwhat != OP_TRANS && *s && strchr("lLuUEQ", *s)) {
737                 --s;
738                 break;
739             }
740             switch (*s) {
741             case '-':
742                 if (lex_inwhat == OP_TRANS) {
743                     *d++ = *s++;
744                     continue;
745                 }
746                 /* FALL THROUGH */
747             default:
748                 *d++ = *s++;
749                 continue;
750             case '0': case '1': case '2': case '3':
751             case '4': case '5': case '6': case '7':
752                 *d++ = scan_oct(s, 3, &len);
753                 s += len;
754                 continue;
755             case 'x':
756                 *d++ = scan_hex(++s, 2, &len);
757                 s += len;
758                 continue;
759             case 'c':
760                 s++;
761                 *d = *s++;
762                 if (isLOWER(*d))
763                     *d = toUPPER(*d);
764                 *d++ ^= 64;
765                 continue;
766             case 'b':
767                 *d++ = '\b';
768                 break;
769             case 'n':
770                 *d++ = '\n';
771                 break;
772             case 'r':
773                 *d++ = '\r';
774                 break;
775             case 'f':
776                 *d++ = '\f';
777                 break;
778             case 't':
779                 *d++ = '\t';
780                 break;
781             case 'e':
782                 *d++ = '\033';
783                 break;
784             case 'a':
785                 *d++ = '\007';
786                 break;
787             }
788             s++;
789             continue;
790         }
791         *d++ = *s++;
792     }
793     *d = '\0';
794     SvCUR_set(sv, d - SvPVX(sv));
795     SvPOK_on(sv);
796
797     if (SvCUR(sv) + 5 < SvLEN(sv)) {
798         SvLEN_set(sv, SvCUR(sv) + 1);
799         Renew(SvPVX(sv), SvLEN(sv), char);
800     }
801     if (s > bufptr)
802         yylval.opval = (OP*)newSVOP(OP_CONST, 0, sv);
803     else
804         SvREFCNT_dec(sv);
805     return s;
806 }
807
808 /* This is the one truly awful dwimmer necessary to conflate C and sed. */
809 static int
810 intuit_more(s)
811 register char *s;
812 {
813     if (lex_brackets)
814         return TRUE;
815     if (*s == '-' && s[1] == '>' && (s[2] == '[' || s[2] == '{'))
816         return TRUE;
817     if (*s != '{' && *s != '[')
818         return FALSE;
819     if (!lex_inpat)
820         return TRUE;
821
822     /* In a pattern, so maybe we have {n,m}. */
823     if (*s == '{') {
824         s++;
825         if (!isDIGIT(*s))
826             return TRUE;
827         while (isDIGIT(*s))
828             s++;
829         if (*s == ',')
830             s++;
831         while (isDIGIT(*s))
832             s++;
833         if (*s == '}')
834             return FALSE;
835         return TRUE;
836         
837     }
838
839     /* On the other hand, maybe we have a character class */
840
841     s++;
842     if (*s == ']' || *s == '^')
843         return FALSE;
844     else {
845         int weight = 2;         /* let's weigh the evidence */
846         char seen[256];
847         unsigned char un_char = 0, last_un_char;
848         char *send = strchr(s,']');
849         char tmpbuf[512];
850
851         if (!send)              /* has to be an expression */
852             return TRUE;
853
854         Zero(seen,256,char);
855         if (*s == '$')
856             weight -= 3;
857         else if (isDIGIT(*s)) {
858             if (s[1] != ']') {
859                 if (isDIGIT(s[1]) && s[2] == ']')
860                     weight -= 10;
861             }
862             else
863                 weight -= 100;
864         }
865         for (; s < send; s++) {
866             last_un_char = un_char;
867             un_char = (unsigned char)*s;
868             switch (*s) {
869             case '@':
870             case '&':
871             case '$':
872                 weight -= seen[un_char] * 10;
873                 if (isALNUM(s[1])) {
874                     scan_ident(s,send,tmpbuf,FALSE);
875                     if ((int)strlen(tmpbuf) > 1 && gv_fetchpv(tmpbuf,FALSE, SVt_PV))
876                         weight -= 100;
877                     else
878                         weight -= 10;
879                 }
880                 else if (*s == '$' && s[1] &&
881                   strchr("[#!%*<>()-=",s[1])) {
882                     if (/*{*/ strchr("])} =",s[2]))
883                         weight -= 10;
884                     else
885                         weight -= 1;
886                 }
887                 break;
888             case '\\':
889                 un_char = 254;
890                 if (s[1]) {
891                     if (strchr("wds]",s[1]))
892                         weight += 100;
893                     else if (seen['\''] || seen['"'])
894                         weight += 1;
895                     else if (strchr("rnftbxcav",s[1]))
896                         weight += 40;
897                     else if (isDIGIT(s[1])) {
898                         weight += 40;
899                         while (s[1] && isDIGIT(s[1]))
900                             s++;
901                     }
902                 }
903                 else
904                     weight += 100;
905                 break;
906             case '-':
907                 if (s[1] == '\\')
908                     weight += 50;
909                 if (strchr("aA01! ",last_un_char))
910                     weight += 30;
911                 if (strchr("zZ79~",s[1]))
912                     weight += 30;
913                 break;
914             default:
915                 if (!isALNUM(last_un_char) && !strchr("$@&",last_un_char) &&
916                         isALPHA(*s) && s[1] && isALPHA(s[1])) {
917                     char *d = tmpbuf;
918                     while (isALPHA(*s))
919                         *d++ = *s++;
920                     *d = '\0';
921                     if (keyword(tmpbuf, d - tmpbuf))
922                         weight -= 150;
923                 }
924                 if (un_char == last_un_char + 1)
925                     weight += 5;
926                 weight -= seen[un_char];
927                 break;
928             }
929             seen[un_char]++;
930         }
931         if (weight >= 0)        /* probably a character class */
932             return FALSE;
933     }
934
935     return TRUE;
936 }
937
938 static int
939 intuit_method(start,gv)
940 char *start;
941 GV *gv;
942 {
943     char *s = start + (*start == '$');
944     char tmpbuf[1024];
945     STRLEN len;
946     GV* indirgv;
947
948     if (gv) {
949         if (GvIO(gv))
950             return 0;
951         if (!GvCV(gv))
952             gv = 0;
953     }
954     s = scan_word(s, tmpbuf, TRUE, &len);
955     if (*start == '$') {
956         if (gv || last_lop_op == OP_PRINT || isUPPER(*tokenbuf))
957             return 0;
958         s = skipspace(s);
959         bufptr = start;
960         expect = XREF;
961         return *s == '(' ? FUNCMETH : METHOD;
962     }
963     if (!keyword(tmpbuf, len)) {
964         indirgv = gv_fetchpv(tmpbuf,FALSE, SVt_PVCV);
965         if (indirgv && GvCV(indirgv))
966             return 0;
967         /* filehandle or package name makes it a method */
968         if (!gv || GvIO(indirgv) || gv_stashpv(tmpbuf, FALSE)) {
969             s = skipspace(s);
970             nextval[nexttoke].opval =
971                 (OP*)newSVOP(OP_CONST, 0,
972                             newSVpv(tmpbuf,0));
973             nextval[nexttoke].opval->op_private =
974                 OPpCONST_BARE;
975             expect = XTERM;
976             force_next(WORD);
977             bufptr = s;
978             return *s == '(' ? FUNCMETH : METHOD;
979         }
980     }
981     return 0;
982 }
983
984 static char*
985 incl_perldb()
986 {
987     if (perldb) {
988         char *pdb = getenv("PERL5DB");
989
990         if (pdb)
991             return pdb;
992         return "BEGIN { require 'perl5db.pl' }";
993     }
994     return "";
995 }
996
997
998 /* Encoded script support. filter_add() effectively inserts a
999  * 'pre-processing' function into the current source input stream. 
1000  * Note that the filter function only applies to the current source file
1001  * (e.g., it will not affect files 'require'd or 'use'd by this one).
1002  *
1003  * The datasv parameter (which may be NULL) can be used to pass
1004  * private data to this instance of the filter. The filter function
1005  * can recover the SV using the FILTER_DATA macro and use it to
1006  * store private buffers and state information.
1007  *
1008  * The supplied datasv parameter is upgraded to a PVIO type
1009  * and the IoDIRP field is used to store the function pointer.
1010  * Note that IoTOP_NAME, IoFMT_NAME, IoBOTTOM_NAME, if set for
1011  * private use must be set using malloc'd pointers.
1012  */
1013 static int filter_debug = 0;
1014
1015 SV *
1016 filter_add(funcp, datasv)
1017     filter_t funcp;
1018     SV *datasv;
1019 {
1020     if (!funcp){ /* temporary handy debugging hack to be deleted */
1021         filter_debug = atoi((char*)datasv);
1022         return NULL;
1023     }
1024     if (!rsfp_filters)
1025         rsfp_filters = newAV();
1026     if (!datasv)
1027         datasv = newSV(0);
1028     if (!SvUPGRADE(datasv, SVt_PVIO))
1029         die("Can't upgrade filter_add data to SVt_PVIO");
1030     IoDIRP(datasv) = (DIR*)funcp; /* stash funcp into spare field */
1031     if (filter_debug)
1032         warn("filter_add func %lx (%s)", funcp, SvPV(datasv,na));
1033     av_unshift(rsfp_filters, 1);
1034     av_store(rsfp_filters, 0, datasv) ;
1035     return(datasv);
1036 }
1037  
1038
1039 /* Delete most recently added instance of this filter function. */
1040 void
1041 filter_del(funcp)
1042     filter_t funcp;
1043 {
1044     if (filter_debug)
1045         warn("filter_del func %lx", funcp);
1046     if (!rsfp_filters || AvFILL(rsfp_filters)<0)
1047         return;
1048     /* if filter is on top of stack (usual case) just pop it off */
1049     if (IoDIRP(FILTER_DATA(0)) == (void*)funcp){
1050         /* sv_free(av_pop(rsfp_filters)); */
1051         sv_free(av_shift(rsfp_filters));
1052
1053         return;
1054     }
1055     /* we need to search for the correct entry and clear it     */
1056     die("filter_del can only delete in reverse order (currently)");
1057 }
1058
1059
1060 /* Invoke the n'th filter function for the current rsfp.         */
1061 I32
1062 filter_read(idx, buf_sv, maxlen)
1063     int idx;
1064     SV *buf_sv;
1065     int maxlen;         /* 0 = read one text line */
1066 {
1067     filter_t funcp;
1068     SV *datasv = NULL;
1069
1070     if (!rsfp_filters)
1071         return -1;
1072     if (idx > AvFILL(rsfp_filters)){       /* Any more filters? */
1073         /* Provide a default input filter to make life easy.    */
1074         /* Note that we append to the line. This is handy.      */
1075         if (filter_debug)
1076             warn("filter_read %d: from rsfp\n", idx);
1077         if (maxlen) { 
1078             /* Want a block */
1079             int len ;
1080             int old_len = SvCUR(buf_sv) ;
1081
1082             /* ensure buf_sv is large enough */
1083             SvGROW(buf_sv, old_len + maxlen) ;
1084             if ((len = fread(SvPVX(buf_sv) + old_len, 1, maxlen, rsfp)) <= 0){
1085                 if (ferror(rsfp))
1086                     return -1;          /* error */
1087                 else
1088                     return 0 ;          /* end of file */
1089             }
1090             SvCUR_set(buf_sv, old_len + len) ;
1091         } else {
1092             /* Want a line */
1093             if (sv_gets(buf_sv, rsfp, SvCUR(buf_sv)) == NULL) {
1094                 if (ferror(rsfp))
1095                     return -1;          /* error */
1096                 else
1097                     return 0 ;          /* end of file */
1098             }
1099         }
1100         return SvCUR(buf_sv);
1101     }
1102     /* Skip this filter slot if filter has been deleted */
1103     if ( (datasv = FILTER_DATA(idx)) == &sv_undef){
1104         if (filter_debug)
1105             warn("filter_read %d: skipped (filter deleted)\n", idx);
1106         return FILTER_READ(idx+1, buf_sv, maxlen); /* recurse */
1107     }
1108     /* Get function pointer hidden within datasv        */
1109     funcp = (filter_t)IoDIRP(datasv);
1110     if (filter_debug)
1111         warn("filter_read %d: via function %lx (%s)\n",
1112                 idx, funcp, SvPV(datasv,na));
1113     /* Call function. The function is expected to       */
1114     /* call "FILTER_READ(idx+1, buf_sv)" first.         */
1115     /* Return: <0:error, =0:eof, >0:not eof             */
1116     return (*funcp)(idx, buf_sv, maxlen);
1117 }
1118
1119 static char *
1120 filter_gets(sv,fp)
1121 register SV *sv;
1122 register FILE *fp;
1123 {
1124     if (rsfp_filters) {
1125
1126         SvCUR_set(sv, 0);       /* start with empty line        */
1127         if (FILTER_READ(0, sv, 0) > 0)
1128             return ( SvPVX(sv) ) ;
1129         else
1130             return Nullch ;
1131     }
1132     else 
1133         return (sv_gets(sv, fp, 0)) ;
1134     
1135 }
1136
1137
1138 #ifdef DEBUGGING
1139     static char* exp_name[] =
1140         { "OPERATOR", "TERM", "REF", "STATE", "BLOCK", "TERMBLOCK" };
1141 #endif
1142
1143 extern int yychar;              /* last token */
1144
1145 int
1146 yylex()
1147 {
1148     register char *s;
1149     register char *d;
1150     register I32 tmp;
1151     STRLEN len;
1152
1153     switch (lex_state) {
1154 #ifdef COMMENTARY
1155     case LEX_NORMAL:            /* Some compilers will produce faster */
1156     case LEX_INTERPNORMAL:      /* code if we comment these out. */
1157         break;
1158 #endif
1159
1160     case LEX_KNOWNEXT:
1161         nexttoke--;
1162         yylval = nextval[nexttoke];
1163         if (!nexttoke) {
1164             lex_state = lex_defer;
1165             expect = lex_expect;
1166             lex_defer = LEX_NORMAL;
1167         }
1168         return(nexttype[nexttoke]);
1169
1170     case LEX_INTERPCASEMOD:
1171 #ifdef DEBUGGING
1172         if (bufptr != bufend && *bufptr != '\\')
1173             croak("panic: INTERPCASEMOD");
1174 #endif
1175         if (bufptr == bufend || bufptr[1] == 'E') {
1176             char oldmod;
1177             if (lex_casemods) {
1178                 oldmod = lex_casestack[--lex_casemods];
1179                 lex_casestack[lex_casemods] = '\0';
1180                 if (bufptr != bufend && strchr("LUQ", oldmod)) {
1181                     bufptr += 2;
1182                     lex_state = LEX_INTERPCONCAT;
1183                 }
1184                 return ')';
1185             }
1186             if (bufptr != bufend)
1187                 bufptr += 2;
1188             lex_state = LEX_INTERPCONCAT;
1189             return yylex();
1190         }
1191         else {
1192             s = bufptr + 1;
1193             if (strnEQ(s, "L\\u", 3) || strnEQ(s, "U\\l", 3))
1194                 tmp = *s, *s = s[2], s[2] = tmp;        /* misordered... */
1195             if (strchr("LU", *s) &&
1196                 (strchr(lex_casestack, 'L') || strchr(lex_casestack, 'U')))
1197             {
1198                 lex_casestack[--lex_casemods] = '\0';
1199                 return ')';
1200             }
1201             if (lex_casemods > 10) {
1202                 char* newlb = (char*)realloc(lex_casestack, lex_casemods + 2);
1203                 if (newlb != lex_casestack) {
1204                     SAVEFREEPV(newlb);
1205                     lex_casestack = newlb;
1206                 }
1207             }
1208             lex_casestack[lex_casemods++] = *s;
1209             lex_casestack[lex_casemods] = '\0';
1210             lex_state = LEX_INTERPCONCAT;
1211             nextval[nexttoke].ival = 0;
1212             force_next('(');
1213             if (*s == 'l')
1214                 nextval[nexttoke].ival = OP_LCFIRST;
1215             else if (*s == 'u')
1216                 nextval[nexttoke].ival = OP_UCFIRST;
1217             else if (*s == 'L')
1218                 nextval[nexttoke].ival = OP_LC;
1219             else if (*s == 'U')
1220                 nextval[nexttoke].ival = OP_UC;
1221             else if (*s == 'Q')
1222                 nextval[nexttoke].ival = OP_QUOTEMETA;
1223             else
1224                 croak("panic: yylex");
1225             bufptr = s + 1;
1226             force_next(FUNC);
1227             if (lex_starts) {
1228                 s = bufptr;
1229                 lex_starts = 0;
1230                 Aop(OP_CONCAT);
1231             }
1232             else
1233                 return yylex();
1234         }
1235
1236     case LEX_INTERPSTART:
1237         if (bufptr == bufend)
1238             return sublex_done();
1239         expect = XTERM;
1240         lex_dojoin = (*bufptr == '@');
1241         lex_state = LEX_INTERPNORMAL;
1242         if (lex_dojoin) {
1243             nextval[nexttoke].ival = 0;
1244             force_next(',');
1245             force_ident("\"", '$');
1246             nextval[nexttoke].ival = 0;
1247             force_next('$');
1248             nextval[nexttoke].ival = 0;
1249             force_next('(');
1250             nextval[nexttoke].ival = OP_JOIN;   /* emulate join($", ...) */
1251             force_next(FUNC);
1252         }
1253         if (lex_starts++) {
1254             s = bufptr;
1255             Aop(OP_CONCAT);
1256         }
1257         else
1258             return yylex();
1259         break;
1260
1261     case LEX_INTERPENDMAYBE:
1262         if (intuit_more(bufptr)) {
1263             lex_state = LEX_INTERPNORMAL;       /* false alarm, more expr */
1264             break;
1265         }
1266         /* FALL THROUGH */
1267
1268     case LEX_INTERPEND:
1269         if (lex_dojoin) {
1270             lex_dojoin = FALSE;
1271             lex_state = LEX_INTERPCONCAT;
1272             return ')';
1273         }
1274         /* FALLTHROUGH */
1275     case LEX_INTERPCONCAT:
1276 #ifdef DEBUGGING
1277         if (lex_brackets)
1278             croak("panic: INTERPCONCAT");
1279 #endif
1280         if (bufptr == bufend)
1281             return sublex_done();
1282
1283         if (SvIVX(linestr) == '\'') {
1284             SV *sv = newSVsv(linestr);
1285             if (!lex_inpat)
1286                 sv = q(sv);
1287             yylval.opval = (OP*)newSVOP(OP_CONST, 0, sv);
1288             s = bufend;
1289         }
1290         else {
1291             s = scan_const(bufptr);
1292             if (*s == '\\')
1293                 lex_state = LEX_INTERPCASEMOD;
1294             else
1295                 lex_state = LEX_INTERPSTART;
1296         }
1297
1298         if (s != bufptr) {
1299             nextval[nexttoke] = yylval;
1300             expect = XTERM;
1301             force_next(THING);
1302             if (lex_starts++)
1303                 Aop(OP_CONCAT);
1304             else {
1305                 bufptr = s;
1306                 return yylex();
1307             }
1308         }
1309
1310         return yylex();
1311     case LEX_FORMLINE:
1312         lex_state = LEX_NORMAL;
1313         s = scan_formline(bufptr);
1314         if (!lex_formbrack)
1315             goto rightbracket;
1316         OPERATOR(';');
1317     }
1318
1319     s = bufptr;
1320     oldoldbufptr = oldbufptr;
1321     oldbufptr = s;
1322     DEBUG_p( {
1323         fprintf(stderr,"### Tokener expecting %s at %s\n", exp_name[expect], s);
1324     } )
1325
1326   retry:
1327     switch (*s) {
1328     default:
1329         warn("Unrecognized character \\%03o ignored", *s++ & 255);
1330         goto retry;
1331     case 4:
1332     case 26:
1333         goto fake_eof;                  /* emulate EOF on ^D or ^Z */
1334     case 0:
1335         if (!rsfp) {
1336             if (lex_brackets)
1337                 yyerror("Missing right bracket");
1338             TOKEN(0);
1339         }
1340         if (s++ < bufend)
1341             goto retry;                 /* ignore stray nulls */
1342         last_uni = 0;
1343         last_lop = 0;
1344         if (!in_eval && !preambled) {
1345             preambled = TRUE;
1346             sv_setpv(linestr,incl_perldb());
1347             if (SvCUR(linestr))
1348                 sv_catpv(linestr,";");
1349             if (preambleav){
1350                 while(AvFILL(preambleav) >= 0) {
1351                     SV *tmpsv = av_shift(preambleav);
1352                     sv_catsv(linestr, tmpsv);
1353                     sv_catpv(linestr, ";");
1354                     sv_free(tmpsv);
1355                 }
1356                 sv_free((SV*)preambleav);
1357                 preambleav = NULL;
1358             }
1359             if (minus_n || minus_p) {
1360                 sv_catpv(linestr, "LINE: while (<>) {");
1361                 if (minus_l)
1362                     sv_catpv(linestr,"chomp;");
1363                 if (minus_a){
1364                     if (minus_F){
1365                       char tmpbuf1[50];
1366                       if ( splitstr[0] == '/' || 
1367                            splitstr[0] == '\'' || 
1368                            splitstr[0] == '"' )
1369                             sprintf( tmpbuf1, "@F=split(%s);", splitstr );
1370                         else
1371                             sprintf( tmpbuf1, "@F=split('%s');", splitstr );
1372                         sv_catpv(linestr,tmpbuf1);
1373                     }
1374                     else
1375                         sv_catpv(linestr,"@F=split(' ');");
1376                 }
1377             }
1378             sv_catpv(linestr, "\n");
1379             oldoldbufptr = oldbufptr = s = SvPVX(linestr);
1380             bufend = SvPVX(linestr) + SvCUR(linestr);
1381             if (perldb && curstash != debstash) {
1382                 SV *sv = NEWSV(85,0);
1383
1384                 sv_upgrade(sv, SVt_PVMG);
1385                 sv_setsv(sv,linestr);
1386                 av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
1387             }
1388             goto retry;
1389         }
1390         do {
1391             if ((s = filter_gets(linestr, rsfp)) == Nullch) {
1392               fake_eof:
1393                 if (rsfp) {
1394                     if (preprocess && !in_eval)
1395                         (void)my_pclose(rsfp);
1396                     else if ((FILE*)rsfp == stdin)
1397                         clearerr(stdin);
1398                     else
1399                         (void)fclose(rsfp);
1400                     rsfp = Nullfp;
1401                 }
1402                 if (!in_eval && (minus_n || minus_p)) {
1403                     sv_setpv(linestr,minus_p ? ";}continue{print" : "");
1404                     sv_catpv(linestr,";}");
1405                     oldoldbufptr = oldbufptr = s = SvPVX(linestr);
1406                     bufend = SvPVX(linestr) + SvCUR(linestr);
1407                     minus_n = minus_p = 0;
1408                     goto retry;
1409                 }
1410                 oldoldbufptr = oldbufptr = s = SvPVX(linestr);
1411                 sv_setpv(linestr,"");
1412                 TOKEN(';');     /* not infinite loop because rsfp is NULL now */
1413             }
1414             if (doextract) {
1415                 if (*s == '#' && s[1] == '!' && instr(s,"perl"))
1416                     doextract = FALSE;
1417
1418                 /* Incest with pod. */
1419                 if (*s == '=' && strnEQ(s, "=cut", 4)) {
1420                     sv_setpv(linestr, "");
1421                     oldoldbufptr = oldbufptr = s = SvPVX(linestr);
1422                     bufend = SvPVX(linestr) + SvCUR(linestr);
1423                     doextract = FALSE;
1424                 }
1425             }
1426             incline(s);
1427         } while (doextract);
1428         oldoldbufptr = oldbufptr = bufptr = s;
1429         if (perldb && curstash != debstash) {
1430             SV *sv = NEWSV(85,0);
1431
1432             sv_upgrade(sv, SVt_PVMG);
1433             sv_setsv(sv,linestr);
1434             av_store(GvAV(curcop->cop_filegv),(I32)curcop->cop_line,sv);
1435         }
1436         bufend = SvPVX(linestr) + SvCUR(linestr);
1437         if (curcop->cop_line == 1) {
1438             while (s < bufend && isSPACE(*s))
1439                 s++;
1440             if (*s == ':' && s[1] != ':') /* for csh execing sh scripts */
1441                 s++;
1442             if (!in_eval && *s == '#' && s[1] == '!') {
1443                 d = instr(s,"perl -");
1444                 if (!d)
1445                     d = instr(s,"perl");
1446                 if (!d &&
1447                     !minus_c &&
1448                     !instr(s,"indir") &&
1449                     instr(origargv[0],"perl"))
1450                 {
1451                     char **newargv;
1452                     char *cmd;
1453
1454                     s += 2;
1455                     if (*s == ' ')
1456                         s++;
1457                     cmd = s;
1458                     while (s < bufend && !isSPACE(*s))
1459                         s++;
1460                     *s++ = '\0';
1461                     while (s < bufend && isSPACE(*s))
1462                         s++;
1463                     if (s < bufend) {
1464                         Newz(899,newargv,origargc+3,char*);
1465                         newargv[1] = s;
1466                         while (s < bufend && !isSPACE(*s))
1467                             s++;
1468                         *s = '\0';
1469                         Copy(origargv+1, newargv+2, origargc+1, char*);
1470                     }
1471                     else
1472                         newargv = origargv;
1473                     newargv[0] = cmd;
1474                     execv(cmd,newargv);
1475                     croak("Can't exec %s", cmd);
1476                 }
1477                 if (d) {
1478                     int oldpdb = perldb;
1479                     int oldn = minus_n;
1480                     int oldp = minus_p;
1481
1482                     while (*d && !isSPACE(*d)) d++;
1483                     while (*d == ' ') d++;
1484
1485                     if (*d++ == '-') {
1486                         while (d = moreswitches(d)) ;
1487                         if (perldb && !oldpdb ||
1488                             minus_n && !oldn ||
1489                             minus_p && !oldp)
1490                         {
1491                             sv_setpv(linestr, "");
1492                             oldoldbufptr = oldbufptr = s = SvPVX(linestr);
1493                             bufend = SvPVX(linestr) + SvCUR(linestr);
1494                             preambled = FALSE;
1495                             if (perldb)
1496                                 (void)gv_fetchfile(origfilename);
1497                             goto retry;
1498                         }
1499                     }
1500                 }
1501             }
1502         }
1503         if (lex_formbrack && lex_brackets <= lex_formbrack) {
1504             bufptr = s;
1505             lex_state = LEX_FORMLINE;
1506             return yylex();
1507         }
1508         goto retry;
1509     case ' ': case '\t': case '\f': case '\r': case 013:
1510         s++;
1511         goto retry;
1512     case '#':
1513     case '\n':
1514         if (lex_state != LEX_NORMAL || (in_eval && !rsfp)) {
1515             d = bufend;
1516             while (s < d && *s != '\n')
1517                 s++;
1518             if (s < d)
1519                 s++;
1520             incline(s);
1521             if (lex_formbrack && lex_brackets <= lex_formbrack) {
1522                 bufptr = s;
1523                 lex_state = LEX_FORMLINE;
1524                 return yylex();
1525             }
1526         }
1527         else {
1528             *s = '\0';
1529             bufend = s;
1530         }
1531         goto retry;
1532     case '-':
1533         if (s[1] && isALPHA(s[1]) && !isALNUM(s[2])) {
1534             s++;
1535             bufptr = s;
1536             tmp = *s++;
1537
1538             while (s < bufend && (*s == ' ' || *s == '\t'))
1539                 s++;
1540
1541             if (strnEQ(s,"=>",2)) {
1542                 if (dowarn)
1543                     warn("Ambiguous use of -%c => resolved to \"-%c\" =>",
1544                         tmp, tmp);
1545                 s = force_word(bufptr,WORD,FALSE,FALSE,FALSE);
1546                 OPERATOR('-');          /* unary minus */
1547             }
1548             last_uni = oldbufptr;
1549             last_lop_op = OP_FTEREAD;   /* good enough */
1550             switch (tmp) {
1551             case 'r': FTST(OP_FTEREAD);
1552             case 'w': FTST(OP_FTEWRITE);
1553             case 'x': FTST(OP_FTEEXEC);
1554             case 'o': FTST(OP_FTEOWNED);
1555             case 'R': FTST(OP_FTRREAD);
1556             case 'W': FTST(OP_FTRWRITE);
1557             case 'X': FTST(OP_FTREXEC);
1558             case 'O': FTST(OP_FTROWNED);
1559             case 'e': FTST(OP_FTIS);
1560             case 'z': FTST(OP_FTZERO);
1561             case 's': FTST(OP_FTSIZE);
1562             case 'f': FTST(OP_FTFILE);
1563             case 'd': FTST(OP_FTDIR);
1564             case 'l': FTST(OP_FTLINK);
1565             case 'p': FTST(OP_FTPIPE);
1566             case 'S': FTST(OP_FTSOCK);
1567             case 'u': FTST(OP_FTSUID);
1568             case 'g': FTST(OP_FTSGID);
1569             case 'k': FTST(OP_FTSVTX);
1570             case 'b': FTST(OP_FTBLK);
1571             case 'c': FTST(OP_FTCHR);
1572             case 't': FTST(OP_FTTTY);
1573             case 'T': FTST(OP_FTTEXT);
1574             case 'B': FTST(OP_FTBINARY);
1575             case 'M': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTMTIME);
1576             case 'A': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTATIME);
1577             case 'C': gv_fetchpv("\024",TRUE, SVt_PV); FTST(OP_FTCTIME);
1578             default:
1579                 croak("Unrecognized file test: -%c", tmp);
1580                 break;
1581             }
1582         }
1583         tmp = *s++;
1584         if (*s == tmp) {
1585             s++;
1586             if (expect == XOPERATOR)
1587                 TERM(POSTDEC);
1588             else
1589                 OPERATOR(PREDEC);
1590         }
1591         else if (*s == '>') {
1592             s++;
1593             s = skipspace(s);
1594             if (isIDFIRST(*s)) {
1595                 s = force_word(s,METHOD,FALSE,TRUE,FALSE);
1596                 TOKEN(ARROW);
1597             }
1598             else if (*s == '$')
1599                 OPERATOR(ARROW);
1600             else
1601                 TERM(ARROW);
1602         }
1603         if (expect == XOPERATOR)
1604             Aop(OP_SUBTRACT);
1605         else {
1606             if (isSPACE(*s) || !isSPACE(*bufptr))
1607                 check_uni();
1608             OPERATOR('-');              /* unary minus */
1609         }
1610
1611     case '+':
1612         tmp = *s++;
1613         if (*s == tmp) {
1614             s++;
1615             if (expect == XOPERATOR)
1616                 TERM(POSTINC);
1617             else
1618                 OPERATOR(PREINC);
1619         }
1620         if (expect == XOPERATOR)
1621             Aop(OP_ADD);
1622         else {
1623             if (isSPACE(*s) || !isSPACE(*bufptr))
1624                 check_uni();
1625             OPERATOR('+');
1626         }
1627
1628     case '*':
1629         if (expect != XOPERATOR) {
1630             s = scan_ident(s, bufend, tokenbuf, TRUE);
1631             expect = XOPERATOR;
1632             force_ident(tokenbuf, '*');
1633             if (!*tokenbuf)
1634                 PREREF('*');
1635             TERM('*');
1636         }
1637         s++;
1638         if (*s == '*') {
1639             s++;
1640             PWop(OP_POW);
1641         }
1642         Mop(OP_MULTIPLY);
1643
1644     case '%':
1645         if (expect != XOPERATOR) {
1646             s = scan_ident(s, bufend, tokenbuf + 1, TRUE);
1647             if (tokenbuf[1]) {
1648                 expect = XOPERATOR;
1649                 tokenbuf[0] = '%';
1650                 if (in_my) {
1651                     if (strchr(tokenbuf,':'))
1652                         croak(no_myglob,tokenbuf);
1653                     nextval[nexttoke].opval = newOP(OP_PADANY, 0);
1654                     nextval[nexttoke].opval->op_targ = pad_allocmy(tokenbuf);
1655                     force_next(PRIVATEREF);
1656                     TERM('%');
1657                 }
1658                 if (!strchr(tokenbuf,':')) {
1659                     if (tmp = pad_findmy(tokenbuf)) {
1660                         nextval[nexttoke].opval = newOP(OP_PADANY, 0);
1661                         nextval[nexttoke].opval->op_targ = tmp;
1662                         force_next(PRIVATEREF);
1663                         TERM('%');
1664                     }
1665                 }
1666                 force_ident(tokenbuf + 1, *tokenbuf);
1667             }
1668             else
1669                 PREREF('%');
1670             TERM('%');
1671         }
1672         ++s;
1673         Mop(OP_MODULO);
1674
1675     case '^':
1676         s++;
1677         BOop(OP_BIT_XOR);
1678     case '[':
1679         lex_brackets++;
1680         /* FALL THROUGH */
1681     case '~':
1682     case ',':
1683         tmp = *s++;
1684         OPERATOR(tmp);
1685     case ':':
1686         if (s[1] == ':') {
1687             len = 0;
1688             goto just_a_word;
1689         }
1690         s++;
1691         OPERATOR(':');
1692     case '(':
1693         s++;
1694         if (last_lop == oldoldbufptr || last_uni == oldoldbufptr)
1695             oldbufptr = oldoldbufptr;           /* allow print(STDOUT 123) */
1696         else
1697             expect = XTERM;
1698         TOKEN('(');
1699     case ';':
1700         if (curcop->cop_line < copline)
1701             copline = curcop->cop_line;
1702         tmp = *s++;
1703         OPERATOR(tmp);
1704     case ')':
1705         tmp = *s++;
1706         s = skipspace(s);
1707         if (*s == '{')
1708             PREBLOCK(tmp);
1709         TERM(tmp);
1710     case ']':
1711         s++;
1712         if (lex_brackets <= 0)
1713             yyerror("Unmatched right bracket");
1714         else
1715             --lex_brackets;
1716         if (lex_state == LEX_INTERPNORMAL) {
1717             if (lex_brackets == 0) {
1718                 if (*s != '[' && *s != '{' && (*s != '-' || s[1] != '>'))
1719                     lex_state = LEX_INTERPEND;
1720             }
1721         }
1722         TERM(']');
1723     case '{':
1724       leftbracket:
1725         s++;
1726         if (lex_brackets > 100) {
1727             char* newlb = (char*)realloc(lex_brackstack, lex_brackets + 1);
1728             if (newlb != lex_brackstack) {
1729                 SAVEFREEPV(newlb);
1730                 lex_brackstack = newlb;
1731             }
1732         }
1733         switch (expect) {
1734         case XTERM:
1735             if (lex_formbrack) {
1736                 s--;
1737                 PRETERMBLOCK(DO);
1738             }
1739             if (oldoldbufptr == last_lop)
1740                 lex_brackstack[lex_brackets++] = XTERM;
1741             else
1742                 lex_brackstack[lex_brackets++] = XOPERATOR;
1743             OPERATOR(HASHBRACK);
1744             break;
1745         case XOPERATOR:
1746             while (s < bufend && (*s == ' ' || *s == '\t'))
1747                 s++;
1748             if (s < bufend && isALPHA(*s)) {
1749                 d = scan_word(s, tokenbuf, FALSE, &len);
1750                 while (d < bufend && (*d == ' ' || *d == '\t'))
1751                     d++;
1752                 if (*d == '}') {
1753                     if (dowarn &&
1754                       (keyword(tokenbuf, len) ||
1755                        perl_get_cv(tokenbuf, FALSE) ))
1756                         warn("Ambiguous use of {%s} resolved to {\"%s\"}",
1757                             tokenbuf, tokenbuf);
1758                     s = force_word(s,WORD,FALSE,TRUE,FALSE);
1759                 }
1760             }
1761             /* FALL THROUGH */
1762         case XBLOCK:
1763             lex_brackstack[lex_brackets++] = XSTATE;
1764             expect = XSTATE;
1765             break;
1766         case XTERMBLOCK:
1767             lex_brackstack[lex_brackets++] = XOPERATOR;
1768             expect = XSTATE;
1769             break;
1770         default: {
1771                 char *t;
1772                 if (oldoldbufptr == last_lop)
1773                     lex_brackstack[lex_brackets++] = XTERM;
1774                 else
1775                     lex_brackstack[lex_brackets++] = XOPERATOR;
1776                 s = skipspace(s);
1777                 if (*s == '}')
1778                     OPERATOR(HASHBRACK);
1779                 if (isALPHA(*s)) {
1780                     for (t = s; t < bufend && isALNUM(*t); t++) ;
1781                 }
1782                 else if (*s == '\'' || *s == '"') {
1783                     t = strchr(s+1,*s);
1784                     if (!t++)
1785                         t = s;
1786                 }
1787                 else
1788                     t = s;
1789                 while (t < bufend && isSPACE(*t))
1790                     t++;
1791                 if ((*t == ',' && !isLOWER(*s)) || (*t == '=' && t[1] == '>'))
1792                     OPERATOR(HASHBRACK);
1793                 if (expect == XREF)
1794                     expect = XTERM;
1795                 else {
1796                     lex_brackstack[lex_brackets-1] = XSTATE;
1797                     expect = XSTATE;
1798                 }
1799             }
1800             break;
1801         }
1802         yylval.ival = curcop->cop_line;
1803         if (isSPACE(*s) || *s == '#')
1804             copline = NOLINE;   /* invalidate current command line number */
1805         TOKEN('{');
1806     case '}':
1807       rightbracket:
1808         s++;
1809         if (lex_brackets <= 0)
1810             yyerror("Unmatched right bracket");
1811         else
1812             expect = (expectation)lex_brackstack[--lex_brackets];
1813         if (lex_brackets < lex_formbrack)
1814             lex_formbrack = 0;
1815         if (lex_state == LEX_INTERPNORMAL) {
1816             if (lex_brackets == 0) {
1817                 if (lex_fakebrack) {
1818                     lex_state = LEX_INTERPEND;
1819                     bufptr = s;
1820                     return yylex();             /* ignore fake brackets */
1821                 }
1822                 if (*s != '[' && *s != '{' && (*s != '-' || s[1] != '>'))
1823                     lex_state = LEX_INTERPEND;
1824             }
1825         }
1826         if (lex_brackets < lex_fakebrack) {
1827             bufptr = s;
1828             lex_fakebrack = 0;
1829             return yylex();             /* ignore fake brackets */
1830         }
1831         force_next('}');
1832         TOKEN(';');
1833     case '&':
1834         s++;
1835         tmp = *s++;
1836         if (tmp == '&')
1837             AOPERATOR(ANDAND);
1838         s--;
1839         if (expect == XOPERATOR) {
1840             if (dowarn && isALPHA(*s) && bufptr == SvPVX(linestr)) {
1841                 curcop->cop_line--;
1842                 warn(warn_nosemi);
1843                 curcop->cop_line++;
1844             }
1845             BAop(OP_BIT_AND);
1846         }
1847
1848         s = scan_ident(s-1, bufend, tokenbuf, TRUE);
1849         if (*tokenbuf) {
1850             expect = XOPERATOR;
1851             force_ident(tokenbuf, '&');
1852         }
1853         else
1854             PREREF('&');
1855         yylval.ival = (OPpENTERSUB_AMPER<<8);
1856         TERM('&');
1857
1858     case '|':
1859         s++;
1860         tmp = *s++;
1861         if (tmp == '|')
1862             AOPERATOR(OROR);
1863         s--;
1864         BOop(OP_BIT_OR);
1865     case '=':
1866         s++;
1867         tmp = *s++;
1868         if (tmp == '=')
1869             Eop(OP_EQ);
1870         if (tmp == '>')
1871             OPERATOR(',');
1872         if (tmp == '~')
1873             PMop(OP_MATCH);
1874         if (dowarn && tmp && isSPACE(*s) && strchr("+-*/%.^&|<",tmp))
1875             warn("Reversed %c= operator",tmp);
1876         s--;
1877         if (expect == XSTATE && isALPHA(tmp) &&
1878                 (s == SvPVX(linestr)+1 || s[-2] == '\n') )
1879         {
1880             if (in_eval && !rsfp) {
1881                 d = bufend;
1882                 while (s < d) {
1883                     if (*s++ == '\n') {
1884                         incline(s);
1885                         if (strnEQ(s,"=cut",4)) {
1886                             s = strchr(s,'\n');
1887                             if (s)
1888                                 s++;
1889                             else
1890                                 s = d;
1891                             incline(s);
1892                             goto retry;
1893                         }
1894                     }
1895                 }
1896                 goto retry;
1897             }
1898             s = bufend;
1899             doextract = TRUE;
1900             goto retry;
1901         }
1902         if (lex_brackets < lex_formbrack) {
1903             char *t;
1904             for (t = s; *t == ' ' || *t == '\t'; t++) ;
1905             if (*t == '\n' || *t == '#') {
1906                 s--;
1907                 expect = XBLOCK;
1908                 goto leftbracket;
1909             }
1910         }
1911         yylval.ival = 0;
1912         OPERATOR(ASSIGNOP);
1913     case '!':
1914         s++;
1915         tmp = *s++;
1916         if (tmp == '=')
1917             Eop(OP_NE);
1918         if (tmp == '~')
1919             PMop(OP_NOT);
1920         s--;
1921         OPERATOR('!');
1922     case '<':
1923         if (expect != XOPERATOR) {
1924             if (s[1] != '<' && !strchr(s,'>'))
1925                 check_uni();
1926             if (s[1] == '<')
1927                 s = scan_heredoc(s);
1928             else
1929                 s = scan_inputsymbol(s);
1930             TERM(sublex_start());
1931         }
1932         s++;
1933         tmp = *s++;
1934         if (tmp == '<')
1935             SHop(OP_LEFT_SHIFT);
1936         if (tmp == '=') {
1937             tmp = *s++;
1938             if (tmp == '>')
1939                 Eop(OP_NCMP);
1940             s--;
1941             Rop(OP_LE);
1942         }
1943         s--;
1944         Rop(OP_LT);
1945     case '>':
1946         s++;
1947         tmp = *s++;
1948         if (tmp == '>')
1949             SHop(OP_RIGHT_SHIFT);
1950         if (tmp == '=')
1951             Rop(OP_GE);
1952         s--;
1953         Rop(OP_GT);
1954
1955     case '$':
1956         if (s[1] == '#'  && (isALPHA(s[2]) || strchr("_{$:", s[2]))) {
1957             s = scan_ident(s+1, bufend, tokenbuf+1, FALSE);
1958             if (expect == XOPERATOR) {
1959                 if (lex_formbrack && lex_brackets == lex_formbrack) {
1960                     expect = XTERM;
1961                     depcom();
1962                     return ','; /* grandfather non-comma-format format */
1963                 }
1964                 else
1965                     no_op("Array length",s);
1966             }
1967             else if (!tokenbuf[1])
1968                 PREREF(DOLSHARP);
1969             if (!strchr(tokenbuf+1,':')) {
1970                 tokenbuf[0] = '@';
1971                 if (tmp = pad_findmy(tokenbuf)) {
1972                     nextval[nexttoke].opval = newOP(OP_PADANY, 0);
1973                     nextval[nexttoke].opval->op_targ = tmp;
1974                     expect = XOPERATOR;
1975                     force_next(PRIVATEREF);
1976                     TOKEN(DOLSHARP);
1977                 }
1978             }
1979             expect = XOPERATOR;
1980             force_ident(tokenbuf+1, *tokenbuf);
1981             TOKEN(DOLSHARP);
1982         }
1983         s = scan_ident(s, bufend, tokenbuf+1, FALSE);
1984         if (expect == XOPERATOR) {
1985             if (lex_formbrack && lex_brackets == lex_formbrack) {
1986                 expect = XTERM;
1987                 depcom();
1988                 return ',';     /* grandfather non-comma-format format */
1989             }
1990             else
1991                 no_op("Scalar",s);
1992         }
1993         if (tokenbuf[1]) {
1994             expectation oldexpect = expect;
1995
1996             /* This kludge not intended to be bulletproof. */
1997             if (tokenbuf[1] == '[' && !tokenbuf[2]) {
1998                 yylval.opval = newSVOP(OP_CONST, 0,
1999                                         newSViv((IV)compiling.cop_arybase));
2000                 yylval.opval->op_private = OPpCONST_ARYBASE;
2001                 TERM(THING);
2002             }
2003             tokenbuf[0] = '$';
2004             if (dowarn) {
2005                 char *t;
2006                 if (*s == '[' && oldexpect != XREF) {
2007                     for (t = s+1; isSPACE(*t) || isALNUM(*t) || *t == '$'; t++) ;
2008                     if (*t++ == ',') {
2009                         bufptr = skipspace(bufptr);
2010                         while (t < bufend && *t != ']') t++;
2011                         warn("Multidimensional syntax %.*s not supported",
2012                             t-bufptr+1, bufptr);
2013                     }
2014                 }
2015                 if (*s == '{' && strEQ(tokenbuf, "$SIG") &&
2016                   (t = strchr(s,'}')) && (t = strchr(t,'='))) {
2017                     char tmpbuf[1024];
2018                     STRLEN len;
2019                     for (t++; isSPACE(*t); t++) ;
2020                     if (isIDFIRST(*t)) {
2021                         t = scan_word(t, tmpbuf, TRUE, &len);
2022                         if (*t != '(' && perl_get_cv(tmpbuf, FALSE))
2023                             warn("You need to quote \"%s\"", tmpbuf);
2024                     }
2025                 }
2026             }
2027             expect = XOPERATOR;
2028             if (lex_state == LEX_NORMAL && isSPACE(*s)) {
2029                 bool islop = (last_lop == oldoldbufptr);
2030                 s = skipspace(s);
2031                 if (!islop || last_lop_op == OP_GREPSTART)
2032                     expect = XOPERATOR;
2033                 else if (strchr("$@\"'`q", *s))
2034                     expect = XTERM;             /* e.g. print $fh "foo" */
2035                 else if (strchr("&*<%", *s) && isIDFIRST(s[1]))
2036                     expect = XTERM;             /* e.g. print $fh &sub */
2037                 else if (isDIGIT(*s))
2038                     expect = XTERM;             /* e.g. print $fh 3 */
2039                 else if (*s == '.' && isDIGIT(s[1]))
2040                     expect = XTERM;             /* e.g. print $fh .3 */
2041                 else if (strchr("/?-+", *s) && !isSPACE(s[1]))
2042                     expect = XTERM;             /* e.g. print $fh -1 */
2043                 else if (*s == '<' && s[1] == '<' && !isSPACE(s[2]))
2044                     expect = XTERM;             /* print $fh <<"EOF" */
2045             }
2046             if (in_my) {
2047                 if (strchr(tokenbuf,':'))
2048                     croak(no_myglob,tokenbuf);
2049                 nextval[nexttoke].opval = newOP(OP_PADANY, 0);
2050                 nextval[nexttoke].opval->op_targ = pad_allocmy(tokenbuf);
2051                 force_next(PRIVATEREF);
2052             }
2053             else if (!strchr(tokenbuf,':')) {
2054                 if (oldexpect != XREF || oldoldbufptr == last_lop) {
2055                     if (intuit_more(s)) {
2056                         if (*s == '[')
2057                             tokenbuf[0] = '@';
2058                         else if (*s == '{')
2059                             tokenbuf[0] = '%';
2060                     }
2061                 }
2062                 if (tmp = pad_findmy(tokenbuf)) {
2063                     if (!tokenbuf[2] && *tokenbuf =='$' &&
2064                         tokenbuf[1] <= 'b' && tokenbuf[1] >= 'a')
2065                     {
2066                         for (d = in_eval ? oldoldbufptr : SvPVX(linestr);
2067                             d < bufend && *d != '\n';
2068                             d++)
2069                         {
2070                             if (strnEQ(d,"<=>",3) || strnEQ(d,"cmp",3)) {
2071                                 croak("Can't use \"my %s\" in sort comparison",
2072                                     tokenbuf);
2073                             }
2074                         }
2075                     }
2076                     nextval[nexttoke].opval = newOP(OP_PADANY, 0);
2077                     nextval[nexttoke].opval->op_targ = tmp;
2078                     force_next(PRIVATEREF);
2079                 }
2080                 else
2081                     force_ident(tokenbuf+1, *tokenbuf);
2082             }
2083             else
2084                 force_ident(tokenbuf+1, *tokenbuf);
2085         }
2086         else {
2087             if (s == bufend)
2088                 yyerror("Final $ should be \\$ or $name");
2089             PREREF('$');
2090         }
2091         TOKEN('$');
2092
2093     case '@':
2094         s = scan_ident(s, bufend, tokenbuf+1, FALSE);
2095         if (expect == XOPERATOR)
2096             no_op("Array",s);
2097         if (tokenbuf[1]) {
2098             GV* gv;
2099
2100             tokenbuf[0] = '@';
2101             expect = XOPERATOR;
2102             if (in_my) {
2103                 if (strchr(tokenbuf,':'))
2104                     croak(no_myglob,tokenbuf);
2105                 nextval[nexttoke].opval = newOP(OP_PADANY, 0);
2106                 nextval[nexttoke].opval->op_targ = pad_allocmy(tokenbuf);
2107                 force_next(PRIVATEREF);
2108                 TERM('@');
2109             }
2110             else if (!strchr(tokenbuf,':')) {
2111                 if (intuit_more(s)) {
2112                     if (*s == '{')
2113                         tokenbuf[0] = '%';
2114                 }
2115                 if (tmp = pad_findmy(tokenbuf)) {
2116                     nextval[nexttoke].opval = newOP(OP_PADANY, 0);
2117                     nextval[nexttoke].opval->op_targ = tmp;
2118                     force_next(PRIVATEREF);
2119                     TERM('@');
2120                 }
2121             }
2122
2123             /* Force them to make up their mind on "@foo". */
2124             if (lex_state != LEX_NORMAL && !lex_brackets &&
2125                     ( !(gv = gv_fetchpv(tokenbuf+1, FALSE, SVt_PVAV)) ||
2126                       (*tokenbuf == '@'
2127                         ? !GvAV(gv)
2128                         : !GvHV(gv) )))
2129             {
2130                 char tmpbuf[1024];
2131                 sprintf(tmpbuf, "Literal @%s now requires backslash",tokenbuf+1);
2132                 yyerror(tmpbuf);
2133             }
2134
2135             /* Warn about @ where they meant $. */
2136             if (dowarn) {
2137                 if (*s == '[' || *s == '{') {
2138                     char *t = s + 1;
2139                     while (*t && (isALNUM(*t) || strchr(" \t$#+-'\"", *t)))
2140                         t++;
2141                     if (*t == '}' || *t == ']') {
2142                         t++;
2143                         bufptr = skipspace(bufptr);
2144                         warn("Scalar value %.*s better written as $%.*s",
2145                             t-bufptr, bufptr, t-bufptr-1, bufptr+1);
2146                     }
2147                 }
2148             }
2149             force_ident(tokenbuf+1, *tokenbuf);
2150         }
2151         else {
2152             if (s == bufend)
2153                 yyerror("Final @ should be \\@ or @name");
2154             PREREF('@');
2155         }
2156         TERM('@');
2157
2158     case '/':                   /* may either be division or pattern */
2159     case '?':                   /* may either be conditional or pattern */
2160         if (expect != XOPERATOR) {
2161             check_uni();
2162             s = scan_pat(s);
2163             TERM(sublex_start());
2164         }
2165         tmp = *s++;
2166         if (tmp == '/')
2167             Mop(OP_DIVIDE);
2168         OPERATOR(tmp);
2169
2170     case '.':
2171         if (lex_formbrack && lex_brackets == lex_formbrack && s[1] == '\n' &&
2172                 (s == SvPVX(linestr) || s[-1] == '\n') ) {
2173             lex_formbrack = 0;
2174             expect = XSTATE;
2175             goto rightbracket;
2176         }
2177         if (expect == XOPERATOR || !isDIGIT(s[1])) {
2178             tmp = *s++;
2179             if (*s == tmp) {
2180                 s++;
2181                 if (*s == tmp) {
2182                     s++;
2183                     yylval.ival = OPf_SPECIAL;
2184                 }
2185                 else
2186                     yylval.ival = 0;
2187                 OPERATOR(DOTDOT);
2188             }
2189             if (expect != XOPERATOR)
2190                 check_uni();
2191             Aop(OP_CONCAT);
2192         }
2193         /* FALL THROUGH */
2194     case '0': case '1': case '2': case '3': case '4':
2195     case '5': case '6': case '7': case '8': case '9':
2196         s = scan_num(s);
2197         if (expect == XOPERATOR)
2198             no_op("Number",s);
2199         TERM(THING);
2200
2201     case '\'':
2202         s = scan_str(s);
2203         if (expect == XOPERATOR) {
2204             if (lex_formbrack && lex_brackets == lex_formbrack) {
2205                 expect = XTERM;
2206                 depcom();
2207                 return ',';     /* grandfather non-comma-format format */
2208             }
2209             else
2210                 no_op("String",s);
2211         }
2212         if (!s)
2213             missingterm((char*)0);
2214         yylval.ival = OP_CONST;
2215         TERM(sublex_start());
2216
2217     case '"':
2218         s = scan_str(s);
2219         if (expect == XOPERATOR) {
2220             if (lex_formbrack && lex_brackets == lex_formbrack) {
2221                 expect = XTERM;
2222                 depcom();
2223                 return ',';     /* grandfather non-comma-format format */
2224             }
2225             else
2226                 no_op("String",s);
2227         }
2228         if (!s)
2229             missingterm((char*)0);
2230         yylval.ival = OP_CONST;
2231         for (d = SvPV(lex_stuff, len); len; len--, d++) {
2232             if (*d == '$' || *d == '@' || *d == '\\') {
2233                 yylval.ival = OP_STRINGIFY;
2234                 break;
2235             }
2236         }
2237         TERM(sublex_start());
2238
2239     case '`':
2240         s = scan_str(s);
2241         if (expect == XOPERATOR)
2242             no_op("Backticks",s);
2243         if (!s)
2244             missingterm((char*)0);
2245         yylval.ival = OP_BACKTICK;
2246         set_csh();
2247         TERM(sublex_start());
2248
2249     case '\\':
2250         s++;
2251         if (dowarn && lex_inwhat && isDIGIT(*s))
2252             warn("Can't use \\%c to mean $%c in expression", *s, *s);
2253         if (expect == XOPERATOR)
2254             no_op("Backslash",s);
2255         OPERATOR(REFGEN);
2256
2257     case 'x':
2258         if (isDIGIT(s[1]) && expect == XOPERATOR) {
2259             s++;
2260             Mop(OP_REPEAT);
2261         }
2262         goto keylookup;
2263
2264     case '_':
2265     case 'a': case 'A':
2266     case 'b': case 'B':
2267     case 'c': case 'C':
2268     case 'd': case 'D':
2269     case 'e': case 'E':
2270     case 'f': case 'F':
2271     case 'g': case 'G':
2272     case 'h': case 'H':
2273     case 'i': case 'I':
2274     case 'j': case 'J':
2275     case 'k': case 'K':
2276     case 'l': case 'L':
2277     case 'm': case 'M':
2278     case 'n': case 'N':
2279     case 'o': case 'O':
2280     case 'p': case 'P':
2281     case 'q': case 'Q':
2282     case 'r': case 'R':
2283     case 's': case 'S':
2284     case 't': case 'T':
2285     case 'u': case 'U':
2286     case 'v': case 'V':
2287     case 'w': case 'W':
2288               case 'X':
2289     case 'y': case 'Y':
2290     case 'z': case 'Z':
2291
2292       keylookup:
2293         bufptr = s;
2294         s = scan_word(s, tokenbuf, FALSE, &len);
2295         
2296         if (*s == ':' && s[1] == ':' && strNE(tokenbuf, "CORE"))
2297             goto just_a_word;
2298
2299         tmp = keyword(tokenbuf, len);
2300
2301         /* Is this a word before a => operator? */
2302         d = s;
2303         while (d < bufend && (*d == ' ' || *d == '\t'))
2304                 d++;    /* no comments skipped here, or s### is misparsed */
2305         if (strnEQ(d,"=>",2)) {
2306             CLINE;
2307             if (dowarn && (tmp || perl_get_cv(tokenbuf, FALSE)))
2308                 warn("Ambiguous use of %s => resolved to \"%s\" =>",
2309                         tokenbuf, tokenbuf);
2310             yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf,0));
2311             yylval.opval->op_private = OPpCONST_BARE;
2312             TERM(WORD);
2313         }
2314
2315         if (tmp < 0) {                  /* second-class keyword? */
2316             GV* gv;
2317             if (expect != XOPERATOR &&
2318                 (*s != ':' || s[1] != ':') &&
2319                 (gv = gv_fetchpv(tokenbuf, FALSE, SVt_PVCV)) &&
2320                 GvIMPORTED_CV(gv))
2321             {
2322                 tmp = 0;
2323             }
2324             else
2325                 tmp = -tmp;
2326         }
2327
2328       reserved_word:
2329         switch (tmp) {
2330
2331         default:                        /* not a keyword */
2332           just_a_word: {
2333                 GV *gv;
2334                 char lastchar = (bufptr == oldoldbufptr ? 0 : bufptr[-1]);
2335
2336                 /* Get the rest if it looks like a package qualifier */
2337
2338                 if (*s == '\'' || *s == ':' && s[1] == ':') {
2339                     s = scan_word(s, tokenbuf + len, TRUE, &len);
2340                     if (!len)
2341                         croak("Bad name after %s::", tokenbuf);
2342                 }
2343
2344                 /* Do special processing at start of statement. */
2345
2346                 if (expect == XSTATE) {
2347                     while (isSPACE(*s)) s++;
2348                     if (*s == ':') {    /* It's a label. */
2349                         yylval.pval = savepv(tokenbuf);
2350                         s++;
2351                         CLINE;
2352                         TOKEN(LABEL);
2353                     }
2354                 }
2355                 else if (expect == XOPERATOR) {
2356                     if (bufptr == SvPVX(linestr)) {
2357                         curcop->cop_line--;
2358                         warn(warn_nosemi);
2359                         curcop->cop_line++;
2360                     }
2361                     else
2362                         no_op("Bare word",s);
2363                 }
2364
2365                 /* Look for a subroutine with this name in current package. */
2366
2367                 gv = gv_fetchpv(tokenbuf,FALSE, SVt_PVCV);
2368
2369                 /* Presume this is going to be a bareword of some sort. */
2370
2371                 CLINE;
2372                 yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf,0));
2373                 yylval.opval->op_private = OPpCONST_BARE;
2374
2375                 /* See if it's the indirect object for a list operator. */
2376
2377                 if (oldoldbufptr &&
2378                     oldoldbufptr < bufptr &&
2379                     (oldoldbufptr == last_lop || oldoldbufptr == last_uni) &&
2380                     /* NO SKIPSPACE BEFORE HERE! */
2381                     (expect == XREF ||
2382                      (opargs[last_lop_op] >> OASHIFT & 7) == OA_FILEREF) )
2383                 {
2384                     bool immediate_paren = *s == '(';
2385
2386                     /* (Now we can afford to cross potential line boundary.) */
2387                     s = skipspace(s);
2388
2389                     /* Two barewords in a row may indicate method call. */
2390
2391                     if ((isALPHA(*s) || *s == '$') && (tmp=intuit_method(s,gv)))
2392                         return tmp;
2393
2394                     /* If not a declared subroutine, it's an indirect object. */
2395                     /* (But it's an indir obj regardless for sort.) */
2396
2397                     if ((last_lop_op == OP_SORT ||
2398                          (!immediate_paren && (!gv || !GvCV(gv))) ) &&
2399                         (last_lop_op != OP_MAPSTART && last_lop_op != OP_GREPSTART)){
2400                         expect = (last_lop == oldoldbufptr) ? XTERM : XOPERATOR;
2401                         goto bareword;
2402                     }
2403                 }
2404
2405                 /* If followed by a paren, it's certainly a subroutine. */
2406
2407                 expect = XOPERATOR;
2408                 s = skipspace(s);
2409                 if (*s == '(') {
2410                     CLINE;
2411                     nextval[nexttoke].opval = yylval.opval;
2412                     expect = XOPERATOR;
2413                     force_next(WORD);
2414                     yylval.ival = 0;
2415                     TOKEN('&');
2416                 }
2417
2418                 /* If followed by var or block, call it a method (unless sub) */
2419
2420                 if ((*s == '$' || *s == '{') && (!gv || !GvCV(gv))) {
2421                     last_lop = oldbufptr;
2422                     last_lop_op = OP_METHOD;
2423                     PREBLOCK(METHOD);
2424                 }
2425
2426                 /* If followed by a bareword, see if it looks like indir obj. */
2427
2428                 if ((isALPHA(*s) || *s == '$') && (tmp = intuit_method(s,gv)))
2429                     return tmp;
2430
2431                 /* Not a method, so call it a subroutine (if defined) */
2432
2433                 if (gv && GvCV(gv)) {
2434                     CV* cv = GvCV(gv);
2435                     if (*s == '(') {
2436                         nextval[nexttoke].opval = yylval.opval;
2437                         expect = XTERM;
2438                         force_next(WORD);
2439                         yylval.ival = 0;
2440                         TOKEN('&');
2441                     }
2442                     if (lastchar == '-')
2443                         warn("Ambiguous use of -%s resolved as -&%s()",
2444                                 tokenbuf, tokenbuf);
2445                     last_lop = oldbufptr;
2446                     last_lop_op = OP_ENTERSUB;
2447                     /* Resolve to GV now. */
2448                     op_free(yylval.opval);
2449                     yylval.opval = newCVREF(0, newGVOP(OP_GV, 0, gv));
2450                     /* Is there a prototype? */
2451                     if (SvPOK(cv)) {
2452                         STRLEN len;
2453                         char *proto = SvPV((SV*)cv, len);
2454                         if (!len)
2455                             TERM(FUNC0SUB);
2456                         if (strEQ(proto, "$"))
2457                             OPERATOR(UNIOPSUB);
2458                         if (*proto == '&' && *s == '{') {
2459                             sv_setpv(subname,"__ANON__");
2460                             PREBLOCK(LSTOPSUB);
2461                         }
2462                     }
2463                     nextval[nexttoke].opval = yylval.opval;
2464                     expect = XTERM;
2465                     force_next(WORD);
2466                     TOKEN(NOAMP);
2467                 }
2468
2469                 if (hints & HINT_STRICT_SUBS &&
2470                     lastchar != '-' &&
2471                     strnNE(s,"->",2) &&
2472                     last_lop_op != OP_ACCEPT &&
2473                     last_lop_op != OP_PIPE_OP &&
2474                     last_lop_op != OP_SOCKPAIR)
2475                 {
2476                     warn(
2477                      "Bareword \"%s\" not allowed while \"strict subs\" in use",
2478                         tokenbuf);
2479                     ++error_count;
2480                 }
2481
2482                 /* Call it a bare word */
2483
2484             bareword:
2485                 if (dowarn) {
2486                     if (lastchar != '-') {
2487                         for (d = tokenbuf; *d && isLOWER(*d); d++) ;
2488                         if (!*d)
2489                             warn(warn_reserved, tokenbuf);
2490                     }
2491                 }
2492                 if (lastchar && strchr("*%&", lastchar)) {
2493                     warn("Operator or semicolon missing before %c%s",
2494                         lastchar, tokenbuf);
2495                     warn("Ambiguous use of %c resolved as operator %c",
2496                         lastchar, lastchar);
2497                 }
2498                 TOKEN(WORD);
2499             }
2500
2501         case KEY___LINE__:
2502         case KEY___FILE__: {
2503             if (tokenbuf[2] == 'L')
2504                 (void)sprintf(tokenbuf,"%ld",(long)curcop->cop_line);
2505             else
2506                 strcpy(tokenbuf, SvPVX(GvSV(curcop->cop_filegv)));
2507             yylval.opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(tokenbuf,0));
2508             TERM(THING);
2509         }
2510
2511         case KEY___DATA__:
2512         case KEY___END__: {
2513             GV *gv;
2514
2515             /*SUPPRESS 560*/
2516             if (rsfp && (!in_eval || tokenbuf[2] == 'D')) {
2517                 char dname[256];
2518                 char *pname = "main";
2519                 if (tokenbuf[2] == 'D')
2520                     pname = HvNAME(curstash ? curstash : defstash);
2521                 sprintf(dname,"%s::DATA", pname);
2522                 gv = gv_fetchpv(dname,TRUE, SVt_PVIO);
2523                 GvMULTI_on(gv);
2524                 if (!GvIO(gv))
2525                     GvIOp(gv) = newIO();
2526                 IoIFP(GvIOp(gv)) = rsfp;
2527 #if defined(HAS_FCNTL) && defined(F_SETFD)
2528                 {
2529                     int fd = fileno(rsfp);
2530                     fcntl(fd,F_SETFD,fd >= 3);
2531                 }
2532 #endif
2533                 if (preprocess)
2534                     IoTYPE(GvIOp(gv)) = '|';
2535                 else if ((FILE*)rsfp == stdin)
2536                     IoTYPE(GvIOp(gv)) = '-';
2537                 else
2538                     IoTYPE(GvIOp(gv)) = '<';
2539                 rsfp = Nullfp;
2540             }
2541             goto fake_eof;
2542         }
2543
2544         case KEY_AUTOLOAD:
2545         case KEY_DESTROY:
2546         case KEY_BEGIN:
2547         case KEY_END:
2548             if (expect == XSTATE) {
2549                 s = bufptr;
2550                 goto really_sub;
2551             }
2552             goto just_a_word;
2553
2554         case KEY_CORE:
2555             if (*s == ':' && s[1] == ':') {
2556                 s += 2;
2557                 d = s;
2558                 s = scan_word(s, tokenbuf, FALSE, &len);
2559                 tmp = keyword(tokenbuf, len);
2560                 if (tmp < 0)
2561                     tmp = -tmp;
2562                 goto reserved_word;
2563             }
2564             goto just_a_word;
2565
2566         case KEY_abs:
2567             UNI(OP_ABS);
2568
2569         case KEY_alarm:
2570             UNI(OP_ALARM);
2571
2572         case KEY_accept:
2573             LOP(OP_ACCEPT,XTERM);
2574
2575         case KEY_and:
2576             OPERATOR(ANDOP);
2577
2578         case KEY_atan2:
2579             LOP(OP_ATAN2,XTERM);
2580
2581         case KEY_bind:
2582             LOP(OP_BIND,XTERM);
2583
2584         case KEY_binmode:
2585             UNI(OP_BINMODE);
2586
2587         case KEY_bless:
2588             LOP(OP_BLESS,XTERM);
2589
2590         case KEY_chop:
2591             UNI(OP_CHOP);
2592
2593         case KEY_continue:
2594             PREBLOCK(CONTINUE);
2595
2596         case KEY_chdir:
2597             (void)gv_fetchpv("ENV",TRUE, SVt_PVHV);     /* may use HOME */
2598             UNI(OP_CHDIR);
2599
2600         case KEY_close:
2601             UNI(OP_CLOSE);
2602
2603         case KEY_closedir:
2604             UNI(OP_CLOSEDIR);
2605
2606         case KEY_cmp:
2607             Eop(OP_SCMP);
2608
2609         case KEY_caller:
2610             UNI(OP_CALLER);
2611
2612         case KEY_crypt:
2613 #ifdef FCRYPT
2614             if (!cryptseen++)
2615                 init_des();
2616 #endif
2617             LOP(OP_CRYPT,XTERM);
2618
2619         case KEY_chmod:
2620             if (dowarn) {
2621                 for (d = s; d < bufend && (isSPACE(*d) || *d == '('); d++) ;
2622                 if (*d != '0' && isDIGIT(*d))
2623                     yywarn("chmod: mode argument is missing initial 0");
2624             }
2625             LOP(OP_CHMOD,XTERM);
2626
2627         case KEY_chown:
2628             LOP(OP_CHOWN,XTERM);
2629
2630         case KEY_connect:
2631             LOP(OP_CONNECT,XTERM);
2632
2633         case KEY_chr:
2634             UNI(OP_CHR);
2635
2636         case KEY_cos:
2637             UNI(OP_COS);
2638
2639         case KEY_chroot:
2640             UNI(OP_CHROOT);
2641
2642         case KEY_do:
2643             s = skipspace(s);
2644             if (*s == '{')
2645                 PRETERMBLOCK(DO);
2646             if (*s != '\'')
2647                 s = force_word(s,WORD,FALSE,TRUE,FALSE);
2648             OPERATOR(DO);
2649
2650         case KEY_die:
2651             hints |= HINT_BLOCK_SCOPE;
2652             LOP(OP_DIE,XTERM);
2653
2654         case KEY_defined:
2655             UNI(OP_DEFINED);
2656
2657         case KEY_delete:
2658             UNI(OP_DELETE);
2659
2660         case KEY_dbmopen:
2661             gv_fetchpv("AnyDBM_File::ISA", GV_ADDMULTI, SVt_PVAV);
2662             LOP(OP_DBMOPEN,XTERM);
2663
2664         case KEY_dbmclose:
2665             UNI(OP_DBMCLOSE);
2666
2667         case KEY_dump:
2668             s = force_word(s,WORD,TRUE,FALSE,FALSE);
2669             LOOPX(OP_DUMP);
2670
2671         case KEY_else:
2672             PREBLOCK(ELSE);
2673
2674         case KEY_elsif:
2675             yylval.ival = curcop->cop_line;
2676             OPERATOR(ELSIF);
2677
2678         case KEY_eq:
2679             Eop(OP_SEQ);
2680
2681         case KEY_exists:
2682             UNI(OP_EXISTS);
2683             
2684         case KEY_exit:
2685             UNI(OP_EXIT);
2686
2687         case KEY_eval:
2688             s = skipspace(s);
2689             expect = (*s == '{') ? XTERMBLOCK : XTERM;
2690             UNIBRACK(OP_ENTEREVAL);
2691
2692         case KEY_eof:
2693             UNI(OP_EOF);
2694
2695         case KEY_exp:
2696             UNI(OP_EXP);
2697
2698         case KEY_each:
2699             UNI(OP_EACH);
2700
2701         case KEY_exec:
2702             set_csh();
2703             LOP(OP_EXEC,XREF);
2704
2705         case KEY_endhostent:
2706             FUN0(OP_EHOSTENT);
2707
2708         case KEY_endnetent:
2709             FUN0(OP_ENETENT);
2710
2711         case KEY_endservent:
2712             FUN0(OP_ESERVENT);
2713
2714         case KEY_endprotoent:
2715             FUN0(OP_EPROTOENT);
2716
2717         case KEY_endpwent:
2718             FUN0(OP_EPWENT);
2719
2720         case KEY_endgrent:
2721             FUN0(OP_EGRENT);
2722
2723         case KEY_for:
2724         case KEY_foreach:
2725             yylval.ival = curcop->cop_line;
2726             while (s < bufend && isSPACE(*s))
2727                 s++;
2728             if (isIDFIRST(*s))
2729                 croak("Missing $ on loop variable");
2730             OPERATOR(FOR);
2731
2732         case KEY_formline:
2733             LOP(OP_FORMLINE,XTERM);
2734
2735         case KEY_fork:
2736             FUN0(OP_FORK);
2737
2738         case KEY_fcntl:
2739             LOP(OP_FCNTL,XTERM);
2740
2741         case KEY_fileno:
2742             UNI(OP_FILENO);
2743
2744         case KEY_flock:
2745             LOP(OP_FLOCK,XTERM);
2746
2747         case KEY_gt:
2748             Rop(OP_SGT);
2749
2750         case KEY_ge:
2751             Rop(OP_SGE);
2752
2753         case KEY_grep:
2754             LOP(OP_GREPSTART, *s == '(' ? XTERM : XREF);
2755
2756         case KEY_goto:
2757             s = force_word(s,WORD,TRUE,FALSE,FALSE);
2758             LOOPX(OP_GOTO);
2759
2760         case KEY_gmtime:
2761             UNI(OP_GMTIME);
2762
2763         case KEY_getc:
2764             UNI(OP_GETC);
2765
2766         case KEY_getppid:
2767             FUN0(OP_GETPPID);
2768
2769         case KEY_getpgrp:
2770             UNI(OP_GETPGRP);
2771
2772         case KEY_getpriority:
2773             LOP(OP_GETPRIORITY,XTERM);
2774
2775         case KEY_getprotobyname:
2776             UNI(OP_GPBYNAME);
2777
2778         case KEY_getprotobynumber:
2779             LOP(OP_GPBYNUMBER,XTERM);
2780
2781         case KEY_getprotoent:
2782             FUN0(OP_GPROTOENT);
2783
2784         case KEY_getpwent:
2785             FUN0(OP_GPWENT);
2786
2787         case KEY_getpwnam:
2788             FUN1(OP_GPWNAM);
2789
2790         case KEY_getpwuid:
2791             FUN1(OP_GPWUID);
2792
2793         case KEY_getpeername:
2794             UNI(OP_GETPEERNAME);
2795
2796         case KEY_gethostbyname:
2797             UNI(OP_GHBYNAME);
2798
2799         case KEY_gethostbyaddr:
2800             LOP(OP_GHBYADDR,XTERM);
2801
2802         case KEY_gethostent:
2803             FUN0(OP_GHOSTENT);
2804
2805         case KEY_getnetbyname:
2806             UNI(OP_GNBYNAME);
2807
2808         case KEY_getnetbyaddr:
2809             LOP(OP_GNBYADDR,XTERM);
2810
2811         case KEY_getnetent:
2812             FUN0(OP_GNETENT);
2813
2814         case KEY_getservbyname:
2815             LOP(OP_GSBYNAME,XTERM);
2816
2817         case KEY_getservbyport:
2818             LOP(OP_GSBYPORT,XTERM);
2819
2820         case KEY_getservent:
2821             FUN0(OP_GSERVENT);
2822
2823         case KEY_getsockname:
2824             UNI(OP_GETSOCKNAME);
2825
2826         case KEY_getsockopt:
2827             LOP(OP_GSOCKOPT,XTERM);
2828
2829         case KEY_getgrent:
2830             FUN0(OP_GGRENT);
2831
2832         case KEY_getgrnam:
2833             FUN1(OP_GGRNAM);
2834
2835         case KEY_getgrgid:
2836             FUN1(OP_GGRGID);
2837
2838         case KEY_getlogin:
2839             FUN0(OP_GETLOGIN);
2840
2841         case KEY_glob:
2842             set_csh();
2843             LOP(OP_GLOB,XTERM);
2844
2845         case KEY_hex:
2846             UNI(OP_HEX);
2847
2848         case KEY_if:
2849             yylval.ival = curcop->cop_line;
2850             OPERATOR(IF);
2851
2852         case KEY_index:
2853             LOP(OP_INDEX,XTERM);
2854
2855         case KEY_int:
2856             UNI(OP_INT);
2857
2858         case KEY_ioctl:
2859             LOP(OP_IOCTL,XTERM);
2860
2861         case KEY_join:
2862             LOP(OP_JOIN,XTERM);
2863
2864         case KEY_keys:
2865             UNI(OP_KEYS);
2866
2867         case KEY_kill:
2868             LOP(OP_KILL,XTERM);
2869
2870         case KEY_last:
2871             s = force_word(s,WORD,TRUE,FALSE,FALSE);
2872             LOOPX(OP_LAST);
2873             
2874         case KEY_lc:
2875             UNI(OP_LC);
2876
2877         case KEY_lcfirst:
2878             UNI(OP_LCFIRST);
2879
2880         case KEY_local:
2881             yylval.ival = 0;
2882             OPERATOR(LOCAL);
2883
2884         case KEY_length:
2885             UNI(OP_LENGTH);
2886
2887         case KEY_lt:
2888             Rop(OP_SLT);
2889
2890         case KEY_le:
2891             Rop(OP_SLE);
2892
2893         case KEY_localtime:
2894             UNI(OP_LOCALTIME);
2895
2896         case KEY_log:
2897             UNI(OP_LOG);
2898
2899         case KEY_link:
2900             LOP(OP_LINK,XTERM);
2901
2902         case KEY_listen:
2903             LOP(OP_LISTEN,XTERM);
2904
2905         case KEY_lstat:
2906             UNI(OP_LSTAT);
2907
2908         case KEY_m:
2909             s = scan_pat(s);
2910             TERM(sublex_start());
2911
2912         case KEY_map:
2913             LOP(OP_MAPSTART,XREF);
2914             
2915         case KEY_mkdir:
2916             LOP(OP_MKDIR,XTERM);
2917
2918         case KEY_msgctl:
2919             LOP(OP_MSGCTL,XTERM);
2920
2921         case KEY_msgget:
2922             LOP(OP_MSGGET,XTERM);
2923
2924         case KEY_msgrcv:
2925             LOP(OP_MSGRCV,XTERM);
2926
2927         case KEY_msgsnd:
2928             LOP(OP_MSGSND,XTERM);
2929
2930         case KEY_my:
2931             in_my = TRUE;
2932             yylval.ival = 1;
2933             OPERATOR(LOCAL);
2934
2935         case KEY_next:
2936             s = force_word(s,WORD,TRUE,FALSE,FALSE);
2937             LOOPX(OP_NEXT);
2938
2939         case KEY_ne:
2940             Eop(OP_SNE);
2941
2942         case KEY_no:
2943             if (expect != XSTATE)
2944                 yyerror("\"no\" not allowed in expression");
2945             s = force_word(s,WORD,FALSE,TRUE,FALSE);
2946             yylval.ival = 0;
2947             OPERATOR(USE);
2948
2949         case KEY_not:
2950             OPERATOR(NOTOP);
2951
2952         case KEY_open:
2953             s = skipspace(s);
2954             if (isIDFIRST(*s)) {
2955                 char *t;
2956                 for (d = s; isALNUM(*d); d++) ;
2957                 t = skipspace(d);
2958                 if (strchr("|&*+-=!?:.", *t))
2959                     warn("Precedence problem: open %.*s should be open(%.*s)",
2960                         d-s,s, d-s,s);
2961             }
2962             LOP(OP_OPEN,XTERM);
2963
2964         case KEY_or:
2965             yylval.ival = OP_OR;
2966             OPERATOR(OROP);
2967
2968         case KEY_ord:
2969             UNI(OP_ORD);
2970
2971         case KEY_oct:
2972             UNI(OP_OCT);
2973
2974         case KEY_opendir:
2975             LOP(OP_OPEN_DIR,XTERM);
2976
2977         case KEY_print:
2978             checkcomma(s,tokenbuf,"filehandle");
2979             LOP(OP_PRINT,XREF);
2980
2981         case KEY_printf:
2982             checkcomma(s,tokenbuf,"filehandle");
2983             LOP(OP_PRTF,XREF);
2984
2985         case KEY_prototype:
2986             UNI(OP_PROTOTYPE);
2987
2988         case KEY_push:
2989             LOP(OP_PUSH,XTERM);
2990
2991         case KEY_pop:
2992             UNI(OP_POP);
2993
2994         case KEY_pos:
2995             UNI(OP_POS);
2996             
2997         case KEY_pack:
2998             LOP(OP_PACK,XTERM);
2999
3000         case KEY_package:
3001             s = force_word(s,WORD,FALSE,TRUE,FALSE);
3002             OPERATOR(PACKAGE);
3003
3004         case KEY_pipe:
3005             LOP(OP_PIPE_OP,XTERM);
3006
3007         case KEY_q:
3008             s = scan_str(s);
3009             if (!s)
3010                 missingterm((char*)0);
3011             yylval.ival = OP_CONST;
3012             TERM(sublex_start());
3013
3014         case KEY_quotemeta:
3015             UNI(OP_QUOTEMETA);
3016
3017         case KEY_qw:
3018             s = scan_str(s);
3019             if (!s)
3020                 missingterm((char*)0);
3021             force_next(')');
3022             nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, q(lex_stuff));
3023             lex_stuff = Nullsv;
3024             force_next(THING);
3025             force_next(',');
3026             nextval[nexttoke].opval = (OP*)newSVOP(OP_CONST, 0, newSVpv(" ",1));
3027             force_next(THING);
3028             force_next('(');
3029             yylval.ival = OP_SPLIT;
3030             CLINE;
3031             expect = XTERM;
3032             bufptr = s;
3033             last_lop = oldbufptr;
3034             last_lop_op = OP_SPLIT;
3035             return FUNC;
3036
3037         case KEY_qq:
3038             s = scan_str(s);
3039             if (!s)
3040                 missingterm((char*)0);
3041             yylval.ival = OP_STRINGIFY;
3042             if (SvIVX(lex_stuff) == '\'')
3043                 SvIVX(lex_stuff) = 0;   /* qq'$foo' should intepolate */
3044             TERM(sublex_start());
3045
3046         case KEY_qx:
3047             s = scan_str(s);
3048             if (!s)
3049                 missingterm((char*)0);
3050             yylval.ival = OP_BACKTICK;
3051             set_csh();
3052             TERM(sublex_start());
3053
3054         case KEY_return:
3055             OLDLOP(OP_RETURN);
3056
3057         case KEY_require:
3058             *tokenbuf = '\0';
3059             s = force_word(s,WORD,TRUE,TRUE,FALSE);
3060             if (isIDFIRST(*tokenbuf))
3061                 gv_stashpv(tokenbuf, TRUE);
3062             else if (*s == '<')
3063                 yyerror("<> should be quotes");
3064             UNI(OP_REQUIRE);
3065
3066         case KEY_reset:
3067             UNI(OP_RESET);
3068
3069         case KEY_redo:
3070             s = force_word(s,WORD,TRUE,FALSE,FALSE);
3071             LOOPX(OP_REDO);
3072
3073         case KEY_rename:
3074             LOP(OP_RENAME,XTERM);
3075
3076         case KEY_rand:
3077             UNI(OP_RAND);
3078
3079         case KEY_rmdir:
3080             UNI(OP_RMDIR);
3081
3082         case KEY_rindex:
3083             LOP(OP_RINDEX,XTERM);
3084
3085         case KEY_read:
3086             LOP(OP_READ,XTERM);
3087
3088         case KEY_readdir:
3089             UNI(OP_READDIR);
3090
3091         case KEY_readline:
3092             set_csh();
3093             UNI(OP_READLINE);
3094
3095         case KEY_readpipe:
3096             set_csh();
3097             UNI(OP_BACKTICK);
3098
3099         case KEY_rewinddir:
3100             UNI(OP_REWINDDIR);
3101
3102         case KEY_recv:
3103             LOP(OP_RECV,XTERM);
3104
3105         case KEY_reverse:
3106             LOP(OP_REVERSE,XTERM);
3107
3108         case KEY_readlink:
3109             UNI(OP_READLINK);
3110
3111         case KEY_ref:
3112             UNI(OP_REF);
3113
3114         case KEY_s:
3115             s = scan_subst(s);
3116             if (yylval.opval)
3117                 TERM(sublex_start());
3118             else
3119                 TOKEN(1);       /* force error */
3120
3121         case KEY_chomp:
3122             UNI(OP_CHOMP);
3123             
3124         case KEY_scalar:
3125             UNI(OP_SCALAR);
3126
3127         case KEY_select:
3128             LOP(OP_SELECT,XTERM);
3129
3130         case KEY_seek:
3131             LOP(OP_SEEK,XTERM);
3132
3133         case KEY_semctl:
3134             LOP(OP_SEMCTL,XTERM);
3135
3136         case KEY_semget:
3137             LOP(OP_SEMGET,XTERM);
3138
3139         case KEY_semop:
3140             LOP(OP_SEMOP,XTERM);
3141
3142         case KEY_send:
3143             LOP(OP_SEND,XTERM);
3144
3145         case KEY_setpgrp:
3146             LOP(OP_SETPGRP,XTERM);
3147
3148         case KEY_setpriority:
3149             LOP(OP_SETPRIORITY,XTERM);
3150
3151         case KEY_sethostent:
3152             FUN1(OP_SHOSTENT);
3153
3154         case KEY_setnetent:
3155             FUN1(OP_SNETENT);
3156
3157         case KEY_setservent:
3158             FUN1(OP_SSERVENT);
3159
3160         case KEY_setprotoent:
3161             FUN1(OP_SPROTOENT);
3162
3163         case KEY_setpwent:
3164             FUN0(OP_SPWENT);
3165
3166         case KEY_setgrent:
3167             FUN0(OP_SGRENT);
3168
3169         case KEY_seekdir:
3170             LOP(OP_SEEKDIR,XTERM);
3171
3172         case KEY_setsockopt:
3173             LOP(OP_SSOCKOPT,XTERM);
3174
3175         case KEY_shift:
3176             UNI(OP_SHIFT);
3177
3178         case KEY_shmctl:
3179             LOP(OP_SHMCTL,XTERM);
3180
3181         case KEY_shmget:
3182             LOP(OP_SHMGET,XTERM);
3183
3184         case KEY_shmread:
3185             LOP(OP_SHMREAD,XTERM);
3186
3187         case KEY_shmwrite:
3188             LOP(OP_SHMWRITE,XTERM);
3189
3190         case KEY_shutdown:
3191             LOP(OP_SHUTDOWN,XTERM);
3192
3193         case KEY_sin:
3194             UNI(OP_SIN);
3195
3196         case KEY_sleep:
3197             UNI(OP_SLEEP);
3198
3199         case KEY_socket:
3200             LOP(OP_SOCKET,XTERM);
3201
3202         case KEY_socketpair:
3203             LOP(OP_SOCKPAIR,XTERM);
3204
3205         case KEY_sort:
3206             checkcomma(s,tokenbuf,"subroutine name");
3207             s = skipspace(s);
3208             if (*s == ';' || *s == ')')         /* probably a close */
3209                 croak("sort is now a reserved word");
3210             expect = XTERM;
3211             s = force_word(s,WORD,TRUE,TRUE,TRUE);
3212             LOP(OP_SORT,XREF);
3213
3214         case KEY_split:
3215             LOP(OP_SPLIT,XTERM);
3216
3217         case KEY_sprintf:
3218             LOP(OP_SPRINTF,XTERM);
3219
3220         case KEY_splice:
3221             LOP(OP_SPLICE,XTERM);
3222
3223         case KEY_sqrt:
3224             UNI(OP_SQRT);
3225
3226         case KEY_srand:
3227             UNI(OP_SRAND);
3228
3229         case KEY_stat:
3230             UNI(OP_STAT);
3231
3232         case KEY_study:
3233             sawstudy++;
3234             UNI(OP_STUDY);
3235
3236         case KEY_substr:
3237             LOP(OP_SUBSTR,XTERM);
3238
3239         case KEY_format:
3240         case KEY_sub:
3241           really_sub:
3242             s = skipspace(s);
3243
3244             if (isIDFIRST(*s) || *s == '\'' || *s == ':') {
3245                 char tmpbuf[128];
3246                 expect = XBLOCK;
3247                 d = scan_word(s, tmpbuf, TRUE, &len);
3248                 if (strchr(tmpbuf, ':'))
3249                     sv_setpv(subname, tmpbuf);
3250                 else {
3251                     sv_setsv(subname,curstname);
3252                     sv_catpvn(subname,"::",2);
3253                     sv_catpvn(subname,tmpbuf,len);
3254                 }
3255                 s = force_word(s,WORD,FALSE,TRUE,TRUE);
3256                 s = skipspace(s);
3257             }
3258             else {
3259                 expect = XTERMBLOCK;
3260                 sv_setpv(subname,"?");
3261             }
3262
3263             if (tmp == KEY_format) {
3264                 s = skipspace(s);
3265                 if (*s == '=')
3266                     lex_formbrack = lex_brackets + 1;
3267                 OPERATOR(FORMAT);
3268             }
3269
3270             /* Look for a prototype */
3271             if (*s == '(') {
3272                 s = scan_str(s);
3273                 if (!s) {
3274                     if (lex_stuff)
3275                         SvREFCNT_dec(lex_stuff);
3276                     lex_stuff = Nullsv;
3277                     croak("Prototype not terminated");
3278                 }
3279                 nexttoke++;
3280                 nextval[1] = nextval[0];
3281                 nexttype[1] = nexttype[0];
3282                 nextval[0].opval = (OP*)newSVOP(OP_CONST, 0, lex_stuff);
3283                 nexttype[0] = THING;
3284                 if (nexttoke == 1) {
3285                     lex_defer = lex_state;
3286                     lex_expect = expect;
3287                     lex_state = LEX_KNOWNEXT;
3288                 }
3289                 lex_stuff = Nullsv;
3290             }
3291
3292             if (*SvPV(subname,na) == '?') {
3293                 sv_setpv(subname,"__ANON__");
3294                 TOKEN(ANONSUB);
3295             }
3296             PREBLOCK(SUB);
3297
3298         case KEY_system:
3299             set_csh();
3300             LOP(OP_SYSTEM,XREF);
3301
3302         case KEY_symlink:
3303             LOP(OP_SYMLINK,XTERM);
3304
3305         case KEY_syscall:
3306             LOP(OP_SYSCALL,XTERM);
3307
3308         case KEY_sysopen:
3309             LOP(OP_SYSOPEN,XTERM);
3310
3311         case KEY_sysread:
3312             LOP(OP_SYSREAD,XTERM);
3313
3314         case KEY_syswrite:
3315             LOP(OP_SYSWRITE,XTERM);
3316
3317         case KEY_tr:
3318             s = scan_trans(s);
3319             TERM(sublex_start());
3320
3321         case KEY_tell:
3322             UNI(OP_TELL);
3323
3324         case KEY_telldir:
3325             UNI(OP_TELLDIR);
3326
3327         case KEY_tie:
3328             LOP(OP_TIE,XTERM);
3329
3330         case KEY_tied:
3331             UNI(OP_TIED);
3332
3333         case KEY_time:
3334             FUN0(OP_TIME);
3335
3336         case KEY_times:
3337             FUN0(OP_TMS);
3338
3339         case KEY_truncate:
3340             LOP(OP_TRUNCATE,XTERM);
3341
3342         case KEY_uc:
3343             UNI(OP_UC);
3344
3345         case KEY_ucfirst:
3346             UNI(OP_UCFIRST);
3347
3348         case KEY_untie:
3349             UNI(OP_UNTIE);
3350
3351         case KEY_until:
3352             yylval.ival = curcop->cop_line;
3353             OPERATOR(UNTIL);
3354
3355         case KEY_unless:
3356             yylval.ival = curcop->cop_line;
3357             OPERATOR(UNLESS);
3358
3359         case KEY_unlink:
3360             LOP(OP_UNLINK,XTERM);
3361
3362         case KEY_undef:
3363             UNI(OP_UNDEF);
3364
3365         case KEY_unpack:
3366             LOP(OP_UNPACK,XTERM);
3367
3368         case KEY_utime:
3369             LOP(OP_UTIME,XTERM);
3370
3371         case KEY_umask:
3372             if (dowarn) {
3373                 for (d = s; d < bufend && (isSPACE(*d) || *d == '('); d++) ;
3374                 if (*d != '0' && isDIGIT(*d))
3375                     yywarn("umask: argument is missing initial 0");
3376             }
3377             UNI(OP_UMASK);
3378
3379         case KEY_unshift:
3380             LOP(OP_UNSHIFT,XTERM);
3381
3382         case KEY_use:
3383             if (expect != XSTATE)
3384                 yyerror("\"use\" not allowed in expression");
3385             s = force_word(s,WORD,FALSE,TRUE,FALSE);
3386             yylval.ival = 1;
3387             OPERATOR(USE);
3388
3389         case KEY_values:
3390             UNI(OP_VALUES);
3391
3392         case KEY_vec:
3393             sawvec = TRUE;
3394             LOP(OP_VEC,XTERM);
3395
3396         case KEY_while:
3397             yylval.ival = curcop->cop_line;
3398             OPERATOR(WHILE);
3399
3400         case KEY_warn:
3401             hints |= HINT_BLOCK_SCOPE;
3402             LOP(OP_WARN,XTERM);
3403
3404         case KEY_wait:
3405             FUN0(OP_WAIT);
3406
3407         case KEY_waitpid:
3408             LOP(OP_WAITPID,XTERM);
3409
3410         case KEY_wantarray:
3411             FUN0(OP_WANTARRAY);
3412
3413         case KEY_write:
3414             gv_fetchpv("\f",TRUE, SVt_PV);      /* Make sure $^L is defined */
3415             UNI(OP_ENTERWRITE);
3416
3417         case KEY_x:
3418             if (expect == XOPERATOR)
3419                 Mop(OP_REPEAT);
3420             check_uni();
3421             goto just_a_word;
3422
3423         case KEY_xor:
3424             yylval.ival = OP_XOR;
3425             OPERATOR(OROP);
3426
3427         case KEY_y:
3428             s = scan_trans(s);
3429             TERM(sublex_start());
3430         }
3431     }
3432 }
3433
3434 I32
3435 keyword(d, len)
3436 register char *d;
3437 I32 len;
3438 {
3439     switch (*d) {
3440     case '_':
3441         if (d[1] == '_') {
3442             if (strEQ(d,"__LINE__"))            return -KEY___LINE__;
3443             if (strEQ(d,"__FILE__"))            return -KEY___FILE__;
3444             if (strEQ(d,"__DATA__"))            return KEY___DATA__;
3445             if (strEQ(d,"__END__"))             return KEY___END__;
3446         }
3447         break;
3448     case 'A':
3449         if (strEQ(d,"AUTOLOAD"))                return KEY_AUTOLOAD;
3450         break;
3451     case 'a':
3452         switch (len) {
3453         case 3:
3454             if (strEQ(d,"and"))                 return -KEY_and;
3455             if (strEQ(d,"abs"))                 return -KEY_abs;
3456             break;
3457         case 5:
3458             if (strEQ(d,"alarm"))               return -KEY_alarm;
3459             if (strEQ(d,"atan2"))               return -KEY_atan2;
3460             break;
3461         case 6:
3462             if (strEQ(d,"accept"))              return -KEY_accept;
3463             break;
3464         }
3465         break;
3466     case 'B':
3467         if (strEQ(d,"BEGIN"))                   return KEY_BEGIN;
3468         break;
3469     case 'b':
3470         if (strEQ(d,"bless"))                   return -KEY_bless;
3471         if (strEQ(d,"bind"))                    return -KEY_bind;
3472         if (strEQ(d,"binmode"))                 return -KEY_binmode;
3473         break;
3474     case 'C':
3475         if (strEQ(d,"CORE"))                    return -KEY_CORE;
3476         break;
3477     case 'c':
3478         switch (len) {
3479         case 3:
3480             if (strEQ(d,"cmp"))                 return -KEY_cmp;
3481             if (strEQ(d,"chr"))                 return -KEY_chr;
3482             if (strEQ(d,"cos"))                 return -KEY_cos;
3483             break;
3484         case 4:
3485             if (strEQ(d,"chop"))                return KEY_chop;
3486             break;
3487         case 5:
3488             if (strEQ(d,"close"))               return -KEY_close;
3489             if (strEQ(d,"chdir"))               return -KEY_chdir;
3490             if (strEQ(d,"chomp"))               return KEY_chomp;
3491             if (strEQ(d,"chmod"))               return -KEY_chmod;
3492             if (strEQ(d,"chown"))               return -KEY_chown;
3493             if (strEQ(d,"crypt"))               return -KEY_crypt;
3494             break;
3495         case 6:
3496             if (strEQ(d,"chroot"))              return -KEY_chroot;
3497             if (strEQ(d,"caller"))              return -KEY_caller;
3498             break;
3499         case 7:
3500             if (strEQ(d,"connect"))             return -KEY_connect;
3501             break;
3502         case 8:
3503             if (strEQ(d,"closedir"))            return -KEY_closedir;
3504             if (strEQ(d,"continue"))            return -KEY_continue;
3505             break;
3506         }
3507         break;
3508     case 'D':
3509         if (strEQ(d,"DESTROY"))                 return KEY_DESTROY;
3510         break;
3511     case 'd':
3512         switch (len) {
3513         case 2:
3514             if (strEQ(d,"do"))                  return KEY_do;
3515             break;
3516         case 3:
3517             if (strEQ(d,"die"))                 return -KEY_die;
3518             break;
3519         case 4:
3520             if (strEQ(d,"dump"))                return -KEY_dump;
3521             break;
3522         case 6:
3523             if (strEQ(d,"delete"))              return KEY_delete;
3524             break;
3525         case 7:
3526             if (strEQ(d,"defined"))             return KEY_defined;
3527             if (strEQ(d,"dbmopen"))             return -KEY_dbmopen;
3528             break;
3529         case 8:
3530             if (strEQ(d,"dbmclose"))            return -KEY_dbmclose;
3531             break;
3532         }
3533         break;
3534     case 'E':
3535         if (strEQ(d,"EQ")) { deprecate(d);      return -KEY_eq;}
3536         if (strEQ(d,"END"))                     return KEY_END;
3537         break;
3538     case 'e':
3539         switch (len) {
3540         case 2:
3541             if (strEQ(d,"eq"))                  return -KEY_eq;
3542             break;
3543         case 3:
3544             if (strEQ(d,"eof"))                 return -KEY_eof;
3545             if (strEQ(d,"exp"))                 return -KEY_exp;
3546             break;
3547         case 4:
3548             if (strEQ(d,"else"))                return KEY_else;
3549             if (strEQ(d,"exit"))                return -KEY_exit;
3550             if (strEQ(d,"eval"))                return KEY_eval;
3551             if (strEQ(d,"exec"))                return -KEY_exec;
3552             if (strEQ(d,"each"))                return KEY_each;
3553             break;
3554         case 5:
3555             if (strEQ(d,"elsif"))               return KEY_elsif;
3556             break;
3557         case 6:
3558             if (strEQ(d,"exists"))              return KEY_exists;
3559             if (strEQ(d,"elseif")) warn("elseif should be elsif");
3560             break;
3561         case 8:
3562             if (strEQ(d,"endgrent"))            return -KEY_endgrent;
3563             if (strEQ(d,"endpwent"))            return -KEY_endpwent;
3564             break;
3565         case 9:
3566             if (strEQ(d,"endnetent"))           return -KEY_endnetent;
3567             break;
3568         case 10:
3569             if (strEQ(d,"endhostent"))          return -KEY_endhostent;
3570             if (strEQ(d,"endservent"))          return -KEY_endservent;
3571             break;
3572         case 11:
3573             if (strEQ(d,"endprotoent"))         return -KEY_endprotoent;
3574             break;
3575         }
3576         break;
3577     case 'f':
3578         switch (len) {
3579         case 3:
3580             if (strEQ(d,"for"))                 return KEY_for;
3581             break;
3582         case 4:
3583             if (strEQ(d,"fork"))                return -KEY_fork;
3584             break;
3585         case 5:
3586             if (strEQ(d,"fcntl"))               return -KEY_fcntl;
3587             if (strEQ(d,"flock"))               return -KEY_flock;
3588             break;
3589         case 6:
3590             if (strEQ(d,"format"))              return KEY_format;
3591             if (strEQ(d,"fileno"))              return -KEY_fileno;
3592             break;
3593         case 7:
3594             if (strEQ(d,"foreach"))             return KEY_foreach;
3595             break;
3596         case 8:
3597             if (strEQ(d,"formline"))            return -KEY_formline;
3598             break;
3599         }
3600         break;
3601     case 'G':
3602         if (len == 2) {
3603             if (strEQ(d,"GT")) { deprecate(d);  return -KEY_gt;}
3604             if (strEQ(d,"GE")) { deprecate(d);  return -KEY_ge;}
3605         }
3606         break;
3607     case 'g':
3608         if (strnEQ(d,"get",3)) {
3609             d += 3;
3610             if (*d == 'p') {
3611                 switch (len) {
3612                 case 7:
3613                     if (strEQ(d,"ppid"))        return -KEY_getppid;
3614                     if (strEQ(d,"pgrp"))        return -KEY_getpgrp;
3615                     break;
3616                 case 8:
3617                     if (strEQ(d,"pwent"))       return -KEY_getpwent;
3618                     if (strEQ(d,"pwnam"))       return -KEY_getpwnam;
3619                     if (strEQ(d,"pwuid"))       return -KEY_getpwuid;
3620                     break;
3621                 case 11:
3622                     if (strEQ(d,"peername"))    return -KEY_getpeername;
3623                     if (strEQ(d,"protoent"))    return -KEY_getprotoent;
3624                     if (strEQ(d,"priority"))    return -KEY_getpriority;
3625                     break;
3626                 case 14:
3627                     if (strEQ(d,"protobyname")) return -KEY_getprotobyname;
3628                     break;
3629                 case 16:
3630                     if (strEQ(d,"protobynumber"))return -KEY_getprotobynumber;
3631                     break;
3632                 }
3633             }
3634             else if (*d == 'h') {
3635                 if (strEQ(d,"hostbyname"))      return -KEY_gethostbyname;
3636                 if (strEQ(d,"hostbyaddr"))      return -KEY_gethostbyaddr;
3637                 if (strEQ(d,"hostent"))         return -KEY_gethostent;
3638             }
3639             else if (*d == 'n') {
3640                 if (strEQ(d,"netbyname"))       return -KEY_getnetbyname;
3641                 if (strEQ(d,"netbyaddr"))       return -KEY_getnetbyaddr;
3642                 if (strEQ(d,"netent"))          return -KEY_getnetent;
3643             }
3644             else if (*d == 's') {
3645                 if (strEQ(d,"servbyname"))      return -KEY_getservbyname;
3646                 if (strEQ(d,"servbyport"))      return -KEY_getservbyport;
3647                 if (strEQ(d,"servent"))         return -KEY_getservent;
3648                 if (strEQ(d,"sockname"))        return -KEY_getsockname;
3649                 if (strEQ(d,"sockopt"))         return -KEY_getsockopt;
3650             }
3651             else if (*d == 'g') {
3652                 if (strEQ(d,"grent"))           return -KEY_getgrent;
3653                 if (strEQ(d,"grnam"))           return -KEY_getgrnam;
3654                 if (strEQ(d,"grgid"))           return -KEY_getgrgid;
3655             }
3656             else if (*d == 'l') {
3657                 if (strEQ(d,"login"))           return -KEY_getlogin;
3658             }
3659             else if (strEQ(d,"c"))              return -KEY_getc;
3660             break;
3661         }
3662         switch (len) {
3663         case 2:
3664             if (strEQ(d,"gt"))                  return -KEY_gt;
3665             if (strEQ(d,"ge"))                  return -KEY_ge;
3666             break;
3667         case 4:
3668             if (strEQ(d,"grep"))                return KEY_grep;
3669             if (strEQ(d,"goto"))                return KEY_goto;
3670             if (strEQ(d,"glob"))                return -KEY_glob;
3671             break;
3672         case 6:
3673             if (strEQ(d,"gmtime"))              return -KEY_gmtime;
3674             break;
3675         }
3676         break;
3677     case 'h':
3678         if (strEQ(d,"hex"))                     return -KEY_hex;
3679         break;
3680     case 'i':
3681         switch (len) {
3682         case 2:
3683             if (strEQ(d,"if"))                  return KEY_if;
3684             break;
3685         case 3:
3686             if (strEQ(d,"int"))                 return -KEY_int;
3687             break;
3688         case 5:
3689             if (strEQ(d,"index"))               return -KEY_index;
3690             if (strEQ(d,"ioctl"))               return -KEY_ioctl;
3691             break;
3692         }
3693         break;
3694     case 'j':
3695         if (strEQ(d,"join"))                    return -KEY_join;
3696         break;
3697     case 'k':
3698         if (len == 4) {
3699             if (strEQ(d,"keys"))                return KEY_keys;
3700             if (strEQ(d,"kill"))                return -KEY_kill;
3701         }
3702         break;
3703     case 'L':
3704         if (len == 2) {
3705             if (strEQ(d,"LT")) { deprecate(d);  return -KEY_lt;}
3706             if (strEQ(d,"LE")) { deprecate(d);  return -KEY_le;}
3707         }
3708         break;
3709     case 'l':
3710         switch (len) {
3711         case 2:
3712             if (strEQ(d,"lt"))                  return -KEY_lt;
3713             if (strEQ(d,"le"))                  return -KEY_le;
3714             if (strEQ(d,"lc"))                  return -KEY_lc;
3715             break;
3716         case 3:
3717             if (strEQ(d,"log"))                 return -KEY_log;
3718             break;
3719         case 4:
3720             if (strEQ(d,"last"))                return KEY_last;
3721             if (strEQ(d,"link"))                return -KEY_link;
3722             break;
3723         case 5:
3724             if (strEQ(d,"local"))               return KEY_local;
3725             if (strEQ(d,"lstat"))               return -KEY_lstat;
3726             break;
3727         case 6:
3728             if (strEQ(d,"length"))              return -KEY_length;
3729             if (strEQ(d,"listen"))              return -KEY_listen;
3730             break;
3731         case 7:
3732             if (strEQ(d,"lcfirst"))             return -KEY_lcfirst;
3733             break;
3734         case 9:
3735             if (strEQ(d,"localtime"))           return -KEY_localtime;
3736             break;
3737         }
3738         break;
3739     case 'm':
3740         switch (len) {
3741         case 1:                                 return KEY_m;
3742         case 2:
3743             if (strEQ(d,"my"))                  return KEY_my;
3744             break;
3745         case 3:
3746             if (strEQ(d,"map"))                 return KEY_map;
3747             break;
3748         case 5:
3749             if (strEQ(d,"mkdir"))               return -KEY_mkdir;
3750             break;
3751         case 6:
3752             if (strEQ(d,"msgctl"))              return -KEY_msgctl;
3753             if (strEQ(d,"msgget"))              return -KEY_msgget;
3754             if (strEQ(d,"msgrcv"))              return -KEY_msgrcv;
3755             if (strEQ(d,"msgsnd"))              return -KEY_msgsnd;
3756             break;
3757         }
3758         break;
3759     case 'N':
3760         if (strEQ(d,"NE")) { deprecate(d);      return -KEY_ne;}
3761         break;
3762     case 'n':
3763         if (strEQ(d,"next"))                    return KEY_next;
3764         if (strEQ(d,"ne"))                      return -KEY_ne;
3765         if (strEQ(d,"not"))                     return -KEY_not;
3766         if (strEQ(d,"no"))                      return KEY_no;
3767         break;
3768     case 'o':
3769         switch (len) {
3770         case 2:
3771             if (strEQ(d,"or"))                  return -KEY_or;
3772             break;
3773         case 3:
3774             if (strEQ(d,"ord"))                 return -KEY_ord;
3775             if (strEQ(d,"oct"))                 return -KEY_oct;
3776             break;
3777         case 4:
3778             if (strEQ(d,"open"))                return -KEY_open;
3779             break;
3780         case 7:
3781             if (strEQ(d,"opendir"))             return -KEY_opendir;
3782             break;
3783         }
3784         break;
3785     case 'p':
3786         switch (len) {
3787         case 3:
3788             if (strEQ(d,"pop"))                 return KEY_pop;
3789             if (strEQ(d,"pos"))                 return KEY_pos;
3790             break;
3791         case 4:
3792             if (strEQ(d,"push"))                return KEY_push;
3793             if (strEQ(d,"pack"))                return -KEY_pack;
3794             if (strEQ(d,"pipe"))                return -KEY_pipe;
3795             break;
3796         case 5:
3797             if (strEQ(d,"print"))               return KEY_print;
3798             break;
3799         case 6:
3800             if (strEQ(d,"printf"))              return KEY_printf;
3801             break;
3802         case 7:
3803             if (strEQ(d,"package"))             return KEY_package;
3804             break;
3805         case 9:
3806             if (strEQ(d,"prototype"))           return KEY_prototype;
3807         }
3808         break;
3809     case 'q':
3810         if (len <= 2) {
3811             if (strEQ(d,"q"))                   return KEY_q;
3812             if (strEQ(d,"qq"))                  return KEY_qq;
3813             if (strEQ(d,"qw"))                  return KEY_qw;
3814             if (strEQ(d,"qx"))                  return KEY_qx;
3815         }
3816         else if (strEQ(d,"quotemeta"))          return -KEY_quotemeta;
3817         break;
3818     case 'r':
3819         switch (len) {
3820         case 3:
3821             if (strEQ(d,"ref"))                 return -KEY_ref;
3822             break;
3823         case 4:
3824             if (strEQ(d,"read"))                return -KEY_read;
3825             if (strEQ(d,"rand"))                return -KEY_rand;
3826             if (strEQ(d,"recv"))                return -KEY_recv;
3827             if (strEQ(d,"redo"))                return KEY_redo;
3828             break;
3829         case 5:
3830             if (strEQ(d,"rmdir"))               return -KEY_rmdir;
3831             if (strEQ(d,"reset"))               return -KEY_reset;
3832             break;
3833         case 6:
3834             if (strEQ(d,"return"))              return KEY_return;
3835             if (strEQ(d,"rename"))              return -KEY_rename;
3836             if (strEQ(d,"rindex"))              return -KEY_rindex;
3837             break;
3838         case 7:
3839             if (strEQ(d,"require"))             return -KEY_require;
3840             if (strEQ(d,"reverse"))             return -KEY_reverse;
3841             if (strEQ(d,"readdir"))             return -KEY_readdir;
3842             break;
3843         case 8:
3844             if (strEQ(d,"readlink"))            return -KEY_readlink;
3845             if (strEQ(d,"readline"))            return -KEY_readline;
3846             if (strEQ(d,"readpipe"))            return -KEY_readpipe;
3847             break;
3848         case 9:
3849             if (strEQ(d,"rewinddir"))           return -KEY_rewinddir;
3850             break;
3851         }
3852         break;
3853     case 's':
3854         switch (d[1]) {
3855         case 0:                                 return KEY_s;
3856         case 'c':
3857             if (strEQ(d,"scalar"))              return KEY_scalar;
3858             break;
3859         case 'e':
3860             switch (len) {
3861             case 4:
3862                 if (strEQ(d,"seek"))            return -KEY_seek;
3863                 if (strEQ(d,"send"))            return -KEY_send;
3864                 break;
3865             case 5:
3866                 if (strEQ(d,"semop"))           return -KEY_semop;
3867                 break;
3868             case 6:
3869                 if (strEQ(d,"select"))          return -KEY_select;
3870                 if (strEQ(d,"semctl"))          return -KEY_semctl;
3871                 if (strEQ(d,"semget"))          return -KEY_semget;
3872                 break;
3873             case 7:
3874                 if (strEQ(d,"setpgrp"))         return -KEY_setpgrp;
3875                 if (strEQ(d,"seekdir"))         return -KEY_seekdir;
3876                 break;
3877             case 8:
3878                 if (strEQ(d,"setpwent"))        return -KEY_setpwent;
3879                 if (strEQ(d,"setgrent"))        return -KEY_setgrent;
3880                 break;
3881             case 9:
3882                 if (strEQ(d,"setnetent"))       return -KEY_setnetent;
3883                 break;
3884             case 10:
3885                 if (strEQ(d,"setsockopt"))      return -KEY_setsockopt;
3886                 if (strEQ(d,"sethostent"))      return -KEY_sethostent;
3887                 if (strEQ(d,"setservent"))      return -KEY_setservent;
3888                 break;
3889             case 11:
3890                 if (strEQ(d,"setpriority"))     return -KEY_setpriority;
3891                 if (strEQ(d,"setprotoent"))     return -KEY_setprotoent;
3892                 break;
3893             }
3894             break;
3895         case 'h':
3896             switch (len) {
3897             case 5:
3898                 if (strEQ(d,"shift"))           return KEY_shift;
3899                 break;
3900             case 6:
3901                 if (strEQ(d,"shmctl"))          return -KEY_shmctl;
3902                 if (strEQ(d,"shmget"))          return -KEY_shmget;
3903                 break;
3904             case 7:
3905                 if (strEQ(d,"shmread"))         return -KEY_shmread;
3906                 break;
3907             case 8:
3908                 if (strEQ(d,"shmwrite"))        return -KEY_shmwrite;
3909                 if (strEQ(d,"shutdown"))        return -KEY_shutdown;
3910                 break;
3911             }
3912             break;
3913         case 'i':
3914             if (strEQ(d,"sin"))                 return -KEY_sin;
3915             break;
3916         case 'l':
3917             if (strEQ(d,"sleep"))               return -KEY_sleep;
3918             break;
3919         case 'o':
3920             if (strEQ(d,"sort"))                return KEY_sort;
3921             if (strEQ(d,"socket"))              return -KEY_socket;
3922             if (strEQ(d,"socketpair"))          return -KEY_socketpair;
3923             break;
3924         case 'p':
3925             if (strEQ(d,"split"))               return KEY_split;
3926             if (strEQ(d,"sprintf"))             return -KEY_sprintf;
3927             if (strEQ(d,"splice"))              return KEY_splice;
3928             break;
3929         case 'q':
3930             if (strEQ(d,"sqrt"))                return -KEY_sqrt;
3931             break;
3932         case 'r':
3933             if (strEQ(d,"srand"))               return -KEY_srand;
3934             break;
3935         case 't':
3936             if (strEQ(d,"stat"))                return -KEY_stat;
3937             if (strEQ(d,"study"))               return KEY_study;
3938             break;
3939         case 'u':
3940             if (strEQ(d,"substr"))              return -KEY_substr;
3941             if (strEQ(d,"sub"))                 return KEY_sub;
3942             break;
3943         case 'y':
3944             switch (len) {
3945             case 6:
3946                 if (strEQ(d,"system"))          return -KEY_system;
3947                 break;
3948             case 7:
3949                 if (strEQ(d,"sysopen"))         return -KEY_sysopen;
3950                 if (strEQ(d,"sysread"))         return -KEY_sysread;
3951                 if (strEQ(d,"symlink"))         return -KEY_symlink;
3952                 if (strEQ(d,"syscall"))         return -KEY_syscall;
3953                 break;
3954             case 8:
3955                 if (strEQ(d,"syswrite"))        return -KEY_syswrite;
3956                 break;
3957             }
3958             break;
3959         }
3960         break;
3961     case 't':
3962         switch (len) {
3963         case 2:
3964             if (strEQ(d,"tr"))                  return KEY_tr;
3965             break;
3966         case 3:
3967             if (strEQ(d,"tie"))                 return KEY_tie;
3968             break;
3969         case 4:
3970             if (strEQ(d,"tell"))                return -KEY_tell;
3971             if (strEQ(d,"tied"))                return KEY_tied;
3972             if (strEQ(d,"time"))                return -KEY_time;
3973             break;
3974         case 5:
3975             if (strEQ(d,"times"))               return -KEY_times;
3976             break;
3977         case 7:
3978             if (strEQ(d,"telldir"))             return -KEY_telldir;
3979             break;
3980         case 8:
3981             if (strEQ(d,"truncate"))            return -KEY_truncate;
3982             break;
3983         }
3984         break;
3985     case 'u':
3986         switch (len) {
3987         case 2:
3988             if (strEQ(d,"uc"))                  return -KEY_uc;
3989             break;
3990         case 3:
3991             if (strEQ(d,"use"))                 return KEY_use;
3992             break;
3993         case 5:
3994             if (strEQ(d,"undef"))               return KEY_undef;
3995             if (strEQ(d,"until"))               return KEY_until;
3996             if (strEQ(d,"untie"))               return KEY_untie;
3997             if (strEQ(d,"utime"))               return -KEY_utime;
3998             if (strEQ(d,"umask"))               return -KEY_umask;
3999             break;
4000         case 6:
4001             if (strEQ(d,"unless"))              return KEY_unless;
4002             if (strEQ(d,"unpack"))              return -KEY_unpack;
4003             if (strEQ(d,"unlink"))              return -KEY_unlink;
4004             break;
4005         case 7:
4006             if (strEQ(d,"unshift"))             return KEY_unshift;
4007             if (strEQ(d,"ucfirst"))             return -KEY_ucfirst;
4008             break;
4009         }
4010         break;
4011     case 'v':
4012         if (strEQ(d,"values"))                  return -KEY_values;
4013         if (strEQ(d,"vec"))                     return -KEY_vec;
4014         break;
4015     case 'w':
4016         switch (len) {
4017         case 4:
4018             if (strEQ(d,"warn"))                return -KEY_warn;
4019             if (strEQ(d,"wait"))                return -KEY_wait;
4020             break;
4021         case 5:
4022             if (strEQ(d,"while"))               return KEY_while;
4023             if (strEQ(d,"write"))               return -KEY_write;
4024             break;
4025         case 7:
4026             if (strEQ(d,"waitpid"))             return -KEY_waitpid;
4027             break;
4028         case 9:
4029             if (strEQ(d,"wantarray"))           return -KEY_wantarray;
4030             break;
4031         }
4032         break;
4033     case 'x':
4034         if (len == 1)                           return -KEY_x;
4035         if (strEQ(d,"xor"))                     return -KEY_xor;
4036         break;
4037     case 'y':
4038         if (len == 1)                           return KEY_y;
4039         break;
4040     case 'z':
4041         break;
4042     }
4043     return 0;
4044 }
4045
4046 static void
4047 checkcomma(s,name,what)
4048 register char *s;
4049 char *name;
4050 char *what;
4051 {
4052     char *w;
4053
4054     if (dowarn && *s == ' ' && s[1] == '(') {   /* XXX gotta be a better way */
4055         int level = 1;
4056         for (w = s+2; *w && level; w++) {
4057             if (*w == '(')
4058                 ++level;
4059             else if (*w == ')')
4060                 --level;
4061         }
4062         if (*w)
4063             for (; *w && isSPACE(*w); w++) ;
4064         if (!*w || !strchr(";|})]oa!=", *w))    /* an advisory hack only... */
4065             warn("%s (...) interpreted as function",name);
4066     }
4067     while (s < bufend && isSPACE(*s))
4068         s++;
4069     if (*s == '(')
4070         s++;
4071     while (s < bufend && isSPACE(*s))
4072         s++;
4073     if (isIDFIRST(*s)) {
4074         w = s++;
4075         while (isALNUM(*s))
4076             s++;
4077         while (s < bufend && isSPACE(*s))
4078             s++;
4079         if (*s == ',') {
4080             int kw;
4081             *s = '\0';
4082             kw = keyword(w, s - w) || perl_get_cv(w, FALSE) != 0;
4083             *s = ',';
4084             if (kw)
4085                 return;
4086             croak("No comma allowed after %s", what);
4087         }
4088     }
4089 }
4090
4091 static char *
4092 scan_word(s, dest, allow_package, slp)
4093 register char *s;
4094 char *dest;
4095 int allow_package;
4096 STRLEN *slp;
4097 {
4098     register char *d = dest;
4099     for (;;) {
4100         if (isALNUM(*s))
4101             *d++ = *s++;
4102         else if (*s == '\'' && allow_package && isIDFIRST(s[1])) {
4103             *d++ = ':';
4104             *d++ = ':';
4105             s++;
4106         }
4107         else if (*s == ':' && s[1] == ':' && allow_package && isIDFIRST(s[2])) {
4108             *d++ = *s++;
4109             *d++ = *s++;
4110         }
4111         else {
4112             *d = '\0';
4113             *slp = d - dest;
4114             return s;
4115         }
4116     }
4117 }
4118
4119 static char *
4120 scan_ident(s,send,dest,ck_uni)
4121 register char *s;
4122 register char *send;
4123 char *dest;
4124 I32 ck_uni;
4125 {
4126     register char *d;
4127     char *bracket = 0;
4128     char funny = *s++;
4129
4130     if (lex_brackets == 0)
4131         lex_fakebrack = 0;
4132     if (isSPACE(*s))
4133         s = skipspace(s);
4134     d = dest;
4135     if (isDIGIT(*s)) {
4136         while (isDIGIT(*s))
4137             *d++ = *s++;
4138     }
4139     else {
4140         for (;;) {
4141             if (isALNUM(*s))
4142                 *d++ = *s++;
4143             else if (*s == '\'' && isIDFIRST(s[1])) {
4144                 *d++ = ':';
4145                 *d++ = ':';
4146                 s++;
4147             }
4148             else if (*s == ':' && s[1] == ':') {
4149                 *d++ = *s++;
4150                 *d++ = *s++;
4151             }
4152             else
4153                 break;
4154         }
4155     }
4156     *d = '\0';
4157     d = dest;
4158     if (*d) {
4159         if (lex_state != LEX_NORMAL)
4160             lex_state = LEX_INTERPENDMAYBE;
4161         return s;
4162     }
4163     if (*s == '$' && s[1] &&
4164       (isALPHA(s[1]) || strchr("$_{", s[1]) || strnEQ(s+1,"::",2)) )
4165         return s;
4166     if (*s == '{') {
4167         bracket = s;
4168         s++;
4169     }
4170     else if (ck_uni)
4171         check_uni();
4172     if (s < send)
4173         *d = *s++;
4174     d[1] = '\0';
4175     if (*d == '^' && *s && (isUPPER(*s) || strchr("[\\]^_?", *s))) {
4176         *d = *s++ ^ 64;
4177     }
4178     if (bracket) {
4179         if (isSPACE(s[-1])) {
4180             while (s < send && (*s == ' ' || *s == '\t')) s++;
4181             *d = *s;
4182         }
4183         if (isALPHA(*d) || *d == '_') {
4184             d++;
4185             while (isALNUM(*s) || *s == ':')
4186                 *d++ = *s++;
4187             *d = '\0';
4188             while (s < send && (*s == ' ' || *s == '\t')) s++;
4189             if ((*s == '[' || *s == '{')) {
4190                 if (dowarn && keyword(dest, d - dest)) {
4191                     char *brack = *s == '[' ? "[...]" : "{...}";
4192                     warn("Ambiguous use of %c{%s%s} resolved to %c%s%s",
4193                         funny, dest, brack, funny, dest, brack);
4194                 }
4195                 lex_fakebrack = lex_brackets+1;
4196                 bracket++;
4197                 lex_brackstack[lex_brackets++] = XOPERATOR;
4198                 return s;
4199             }
4200         }
4201         if (*s == '}') {
4202             s++;
4203             if (lex_state == LEX_INTERPNORMAL && !lex_brackets)
4204                 lex_state = LEX_INTERPEND;
4205             if (funny == '#')
4206                 funny = '@';
4207             if (dowarn &&
4208               (keyword(dest, d - dest) || perl_get_cv(dest, FALSE)))
4209                 warn("Ambiguous use of %c{%s} resolved to %c%s",
4210                     funny, dest, funny, dest);
4211         }
4212         else {
4213             s = bracket;                /* let the parser handle it */
4214             *dest = '\0';
4215         }
4216     }
4217     else if (lex_state == LEX_INTERPNORMAL && !lex_brackets && !intuit_more(s))
4218         lex_state = LEX_INTERPEND;
4219     return s;
4220 }
4221
4222 void pmflag(pmfl,ch)
4223 U16* pmfl;
4224 int ch;
4225 {
4226     if (ch == 'i') {
4227         sawi = TRUE;
4228         *pmfl |= PMf_FOLD;
4229     }
4230     else if (ch == 'g')
4231         *pmfl |= PMf_GLOBAL;
4232     else if (ch == 'o')
4233         *pmfl |= PMf_KEEP;
4234     else if (ch == 'm')
4235         *pmfl |= PMf_MULTILINE;
4236     else if (ch == 's')
4237         *pmfl |= PMf_SINGLELINE;
4238     else if (ch == 'x')
4239         *pmfl |= PMf_EXTENDED;
4240 }
4241
4242 static char *
4243 scan_pat(start)
4244 char *start;
4245 {
4246     PMOP *pm;
4247     char *s;
4248
4249     s = scan_str(start);
4250     if (!s) {
4251         if (lex_stuff)
4252             SvREFCNT_dec(lex_stuff);
4253         lex_stuff = Nullsv;
4254         croak("Search pattern not terminated");
4255     }
4256     pm = (PMOP*)newPMOP(OP_MATCH, 0);
4257     if (multi_open == '?')
4258         pm->op_pmflags |= PMf_ONCE;
4259
4260     while (*s && strchr("iogmsx", *s))
4261         pmflag(&pm->op_pmflags,*s++);
4262
4263     pm->op_pmpermflags = pm->op_pmflags;
4264     lex_op = (OP*)pm;
4265     yylval.ival = OP_MATCH;
4266     return s;
4267 }
4268
4269 static char *
4270 scan_subst(start)
4271 char *start;
4272 {
4273     register char *s;
4274     register PMOP *pm;
4275     I32 es = 0;
4276
4277     yylval.ival = OP_NULL;
4278
4279     s = scan_str(start);
4280
4281     if (!s) {
4282         if (lex_stuff)
4283             SvREFCNT_dec(lex_stuff);
4284         lex_stuff = Nullsv;
4285         croak("Substitution pattern not terminated");
4286     }
4287
4288     if (s[-1] == multi_open)
4289         s--;
4290
4291     s = scan_str(s);
4292     if (!s) {
4293         if (lex_stuff)
4294             SvREFCNT_dec(lex_stuff);
4295         lex_stuff = Nullsv;
4296         if (lex_repl)
4297             SvREFCNT_dec(lex_repl);
4298         lex_repl = Nullsv;
4299         croak("Substitution replacement not terminated");
4300     }
4301
4302     pm = (PMOP*)newPMOP(OP_SUBST, 0);
4303     while (*s && strchr("iogmsex", *s)) {
4304         if (*s == 'e') {
4305             s++;
4306             es++;
4307         }
4308         else
4309             pmflag(&pm->op_pmflags,*s++);
4310     }
4311
4312     if (es) {
4313         SV *repl;
4314         pm->op_pmflags |= PMf_EVAL;
4315         repl = newSVpv("",0);
4316         while (es-- > 0)
4317             sv_catpv(repl, es ? "eval " : "do ");
4318         sv_catpvn(repl, "{ ", 2);
4319         sv_catsv(repl, lex_repl);
4320         sv_catpvn(repl, " };", 2);
4321         SvCOMPILED_on(repl);
4322         SvREFCNT_dec(lex_repl);
4323         lex_repl = repl;
4324     }
4325
4326     pm->op_pmpermflags = pm->op_pmflags;
4327     lex_op = (OP*)pm;
4328     yylval.ival = OP_SUBST;
4329     return s;
4330 }
4331
4332 void
4333 hoistmust(pm)
4334 register PMOP *pm;
4335 {
4336     if (!pm->op_pmshort && pm->op_pmregexp->regstart &&
4337         (!pm->op_pmregexp->regmust || pm->op_pmregexp->reganch & ROPT_ANCH)
4338        ) {
4339         if (!(pm->op_pmregexp->reganch & ROPT_ANCH))
4340             pm->op_pmflags |= PMf_SCANFIRST;
4341         else if (pm->op_pmflags & PMf_FOLD)
4342             return;
4343         pm->op_pmshort = SvREFCNT_inc(pm->op_pmregexp->regstart);
4344         pm->op_pmslen = SvCUR(pm->op_pmshort);
4345     }
4346     else if (pm->op_pmregexp->regmust) {/* is there a better short-circuit? */
4347         if (pm->op_pmshort &&
4348           sv_eq(pm->op_pmshort,pm->op_pmregexp->regmust))
4349         {
4350             if (pm->op_pmflags & PMf_SCANFIRST) {
4351                 SvREFCNT_dec(pm->op_pmshort);
4352                 pm->op_pmshort = Nullsv;
4353             }
4354             else {
4355                 SvREFCNT_dec(pm->op_pmregexp->regmust);
4356                 pm->op_pmregexp->regmust = Nullsv;
4357                 return;
4358             }
4359         }
4360         if (!pm->op_pmshort ||  /* promote the better string */
4361           ((pm->op_pmflags & PMf_SCANFIRST) &&
4362            (SvCUR(pm->op_pmshort) < SvCUR(pm->op_pmregexp->regmust)) )){
4363             SvREFCNT_dec(pm->op_pmshort);               /* ok if null */
4364             pm->op_pmshort = pm->op_pmregexp->regmust;
4365             pm->op_pmslen = SvCUR(pm->op_pmshort);
4366             pm->op_pmregexp->regmust = Nullsv;
4367             pm->op_pmflags |= PMf_SCANFIRST;
4368         }
4369     }
4370 }
4371
4372 static char *
4373 scan_trans(start)
4374 char *start;
4375 {
4376     register char* s;
4377     OP *op;
4378     short *tbl;
4379     I32 squash;
4380     I32 delete;
4381     I32 complement;
4382
4383     yylval.ival = OP_NULL;
4384
4385     s = scan_str(start);
4386     if (!s) {
4387         if (lex_stuff)
4388             SvREFCNT_dec(lex_stuff);
4389         lex_stuff = Nullsv;
4390         croak("Translation pattern not terminated");
4391     }
4392     if (s[-1] == multi_open)
4393         s--;
4394
4395     s = scan_str(s);
4396     if (!s) {
4397         if (lex_stuff)
4398             SvREFCNT_dec(lex_stuff);
4399         lex_stuff = Nullsv;
4400         if (lex_repl)
4401             SvREFCNT_dec(lex_repl);
4402         lex_repl = Nullsv;
4403         croak("Translation replacement not terminated");
4404     }
4405
4406     New(803,tbl,256,short);
4407     op = newPVOP(OP_TRANS, 0, (char*)tbl);
4408
4409     complement = delete = squash = 0;
4410     while (*s == 'c' || *s == 'd' || *s == 's') {
4411         if (*s == 'c')
4412             complement = OPpTRANS_COMPLEMENT;
4413         else if (*s == 'd')
4414             delete = OPpTRANS_DELETE;
4415         else
4416             squash = OPpTRANS_SQUASH;
4417         s++;
4418     }
4419     op->op_private = delete|squash|complement;
4420
4421     lex_op = op;
4422     yylval.ival = OP_TRANS;
4423     return s;
4424 }
4425
4426 static char *
4427 scan_heredoc(s)
4428 register char *s;
4429 {
4430     SV *herewas;
4431     I32 op_type = OP_SCALAR;
4432     I32 len;
4433     SV *tmpstr;
4434     char term;
4435     register char *d;
4436     char *peek;
4437
4438     s += 2;
4439     d = tokenbuf;
4440     if (!rsfp)
4441         *d++ = '\n';
4442     for (peek = s; *peek == ' ' || *peek == '\t'; peek++) ;
4443     if (*peek && strchr("`'\"",*peek)) {
4444         s = peek;
4445         term = *s++;
4446         s = cpytill(d,s,bufend,term,&len);
4447         if (s < bufend)
4448             s++;
4449         d += len;
4450     }
4451     else {
4452         if (*s == '\\')
4453             s++, term = '\'';
4454         else
4455             term = '"';
4456         if (!isALNUM(*s))
4457             deprecate("bare << to mean <<\"\"");
4458         while (isALNUM(*s))
4459             *d++ = *s++;
4460     }                           /* assuming tokenbuf won't clobber */
4461     *d++ = '\n';
4462     *d = '\0';
4463     len = d - tokenbuf;
4464     d = "\n";
4465     if (rsfp || !(d=ninstr(s,bufend,d,d+1)))
4466         herewas = newSVpv(s,bufend-s);
4467     else
4468         s--, herewas = newSVpv(s,d-s);
4469     s += SvCUR(herewas);
4470
4471     tmpstr = NEWSV(87,80);
4472     sv_upgrade(tmpstr, SVt_PVIV);
4473     if (term == '\'') {
4474         op_type = OP_CONST;
4475         SvIVX(tmpstr) = -1;
4476     }
4477     else if (term == '`') {
4478         op_type = OP_BACKTICK;
4479         SvIVX(tmpstr) = '\\';
4480     }
4481
4482     CLINE;
4483     multi_start = curcop->cop_line;
4484     multi_open = multi_close = '<';
4485     term = *tokenbuf;
4486     if (!rsfp) {
4487         d = s;
4488         while (s < bufend &&
4489           (*s != term || bcmp(s,tokenbuf,len) != 0) ) {
4490             if (*s++ == '\n')
4491                 curcop->cop_line++;
4492         }
4493         if (s >= bufend) {
4494             curcop->cop_line = multi_start;
4495             missingterm(tokenbuf);
4496         }
4497         sv_setpvn(tmpstr,d+1,s-d);
4498         s += len - 1;
4499         sv_catpvn(herewas,s,bufend-s);
4500         sv_setsv(linestr,herewas);
4501         oldoldbufptr = oldbufptr = bufptr = s = SvPVX(linestr);
4502         bufend = SvPVX(linestr) + SvCUR(linestr);
4503     }
4504     else
4505         sv_setpvn(tmpstr,"",0);   /* avoid "uninitialized" warning */
4506     while (s >= bufend) {       /* multiple line string? */
4507         if (!rsfp ||
4508          !(oldoldbufptr = oldbufptr = s = filter_gets(linestr, rsfp))) {
4509             curcop->cop_line = multi_start;
4510             missingterm(tokenbuf);
4511         }
4512         curcop->cop_line++;
4513         if (perldb && curstash != debstash) {
4514             SV *sv = NEWSV(88,0);
4515
4516             sv_upgrade(sv, SVt_PVMG);
4517             sv_setsv(sv,linestr);
4518             av_store(GvAV(curcop->cop_filegv),
4519               (I32)curcop->cop_line,sv);
4520         }
4521         bufend = SvPVX(linestr) + SvCUR(linestr);
4522         if (*s == term && bcmp(s,tokenbuf,len) == 0) {
4523             s = bufend - 1;
4524             *s = ' ';
4525             sv_catsv(linestr,herewas);
4526             bufend = SvPVX(linestr) + SvCUR(linestr);
4527         }
4528         else {
4529             s = bufend;
4530             sv_catsv(tmpstr,linestr);
4531         }
4532     }
4533     multi_end = curcop->cop_line;
4534     s++;
4535     if (SvCUR(tmpstr) + 5 < SvLEN(tmpstr)) {
4536         SvLEN_set(tmpstr, SvCUR(tmpstr) + 1);
4537         Renew(SvPVX(tmpstr), SvLEN(tmpstr), char);
4538     }
4539     SvREFCNT_dec(herewas);
4540     lex_stuff = tmpstr;
4541     yylval.ival = op_type;
4542     return s;
4543 }
4544
4545 static char *
4546 scan_inputsymbol(start)
4547 char *start;
4548 {
4549     register char *s = start;
4550     register char *d;
4551     I32 len;
4552
4553     d = tokenbuf;
4554     s = cpytill(d, s+1, bufend, '>', &len);
4555     if (s < bufend)
4556         s++;
4557     else
4558         croak("Unterminated <> operator");
4559
4560     if (*d == '$' && d[1]) d++;
4561     while (*d && (isALNUM(*d) || *d == '\'' || *d == ':'))
4562         d++;
4563     if (d - tokenbuf != len) {
4564         yylval.ival = OP_GLOB;
4565         set_csh();
4566         s = scan_str(start);
4567         if (!s)
4568             croak("Glob not terminated");
4569         return s;
4570     }
4571     else {
4572         d = tokenbuf;
4573         if (!len)
4574             (void)strcpy(d,"ARGV");
4575         if (*d == '$') {
4576             I32 tmp;
4577             if (tmp = pad_findmy(d)) {
4578                 OP *op = newOP(OP_PADSV, 0);