This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
utf8.c: Bypass a subroutine wrapper
[perl5.git] / parser.h
1 /*    parser.h
2  *
3  *    Copyright (c) 2006, 2007, 2009, 2010, 2011 Larry Wall and others
4  *
5  *    You may distribute under the terms of either the GNU General Public
6  *    License or the Artistic License, as specified in the README file.
7  * 
8  * This file defines the layout of the parser object used by the parser
9  * and lexer (perly.c, toke.c).
10  */
11
12 #define YYEMPTY         (-2)
13
14 typedef struct {
15     YYSTYPE val;    /* semantic value */
16     short   state;
17     I32     savestack_ix;       /* size of savestack at this state */
18     CV      *compcv; /* value of PL_compcv when this value was created */
19 #ifdef DEBUGGING
20     const char  *name; /* token/rule name for -Dpv */
21 #endif
22 } yy_stack_frame;
23
24 typedef struct yy_parser {
25
26     /* parser state */
27
28     struct yy_parser *old_parser; /* previous value of PL_parser */
29     YYSTYPE         yylval;     /* value of lookahead symbol, set by yylex() */
30     int             yychar;     /* The lookahead symbol.  */
31
32     /* Number of tokens to shift before error messages enabled.  */
33     int             yyerrstatus;
34
35     int             stack_size;
36     int             yylen;      /* length of active reduction */
37     yy_stack_frame  *stack;     /* base of stack */
38     yy_stack_frame  *ps;        /* current stack frame */
39
40     /* lexer state */
41
42     I32         lex_brackets;   /* square and curly bracket count */
43     I32         lex_casemods;   /* casemod count */
44     char        *lex_brackstack;/* what kind of brackets to pop */
45     char        *lex_casestack; /* what kind of case mods in effect */
46     U8          lex_defer;      /* state after determined token */
47     bool        lex_dojoin;     /* doing an array interpolation */
48     U8          lex_expect;     /* expect after determined token */
49     U8          expect;         /* how to interpret ambiguous tokens */
50     I32         lex_formbrack;  /* bracket count at outer format level */
51     OP          *lex_inpat;     /* in pattern $) and $| are special */
52     OP          *lex_op;        /* extra info to pass back on op */
53     SV          *lex_repl;      /* runtime replacement from s/// */
54     U16         lex_inwhat;     /* what kind of quoting are we in */
55     OPCODE      last_lop_op;    /* last named list or unary operator */
56     I32         lex_starts;     /* how many interps done on level */
57     SV          *lex_stuff;     /* runtime pattern from m// or s/// */
58     I32         multi_start;    /* 1st line of multi-line string */
59     I32         multi_end;      /* last line of multi-line string */
60     char        multi_open;     /* delimiter of said string */
61     char        multi_close;    /* delimiter of said string */
62     char        pending_ident;  /* pending identifier lookup */
63     bool        preambled;
64     I32         lex_allbrackets;/* (), [], {}, ?: bracket count */
65     SUBLEXINFO  sublex_info;
66     SV          *linestr;       /* current chunk of src text */
67     char        *bufptr;        /* carries the cursor (current parsing
68                                    position) from one invocation of yylex
69                                    to the next */
70     char        *oldbufptr;     /* in yylex, beginning of current token */
71     char        *oldoldbufptr;  /* in yylex, beginning of previous token */
72     char        *bufend;        
73     char        *linestart;     /* beginning of most recently read line */
74     char        *last_uni;      /* position of last named-unary op */
75     char        *last_lop;      /* position of last list operator */
76     line_t      copline;        /* current line number */
77     U16         in_my;          /* we're compiling a "my"/"our" declaration */
78     U8          lex_state;      /* next token is determined */
79     U8          error_count;    /* how many compile errors so far, max 10 */
80     HV          *in_my_stash;   /* declared class of this "my" declaration */
81     PerlIO      *rsfp;          /* current source file pointer */
82     AV          *rsfp_filters;  /* holds chain of active source filters */
83     U8          form_lex_state; /* remember lex_state when parsing fmt */
84
85 #ifdef PERL_MAD
86     SV          *endwhite;
87     I32         faketokens;
88     I32         lasttoke;
89     SV          *nextwhite;
90     I32         realtokenstart;
91     SV          *skipwhite;
92     SV          *thisclose;
93     MADPROP *   thismad;
94     SV          *thisopen;
95     SV          *thisstuff;
96     SV          *thistoken;
97     SV          *thiswhite;
98
99 /* What we know when we're in LEX_KNOWNEXT state. */
100     NEXTTOKE    nexttoke[5];    /* value of next token, if any */
101     I32         curforce;
102 #else
103     YYSTYPE     nextval[5];     /* value of next token, if any */
104     I32         nexttype[5];    /* type of next token */
105     I32         nexttoke;
106 #endif
107
108     COP         *saved_curcop;  /* the previous PL_curcop */
109     char        tokenbuf[256];
110
111     U8          lex_fakeeof;    /* precedence at which to fake EOF */
112     U8          lex_flags;
113     PERL_BITFIELD16     in_pod:1;      /* lexer is within a =pod section */
114     PERL_BITFIELD16     filtered:1;    /* source filters in evalbytes */
115 } yy_parser;
116
117 /* flags for lexer API */
118 #define LEX_STUFF_UTF8          0x00000001
119 #define LEX_KEEP_PREVIOUS       0x00000002
120
121 #ifdef PERL_CORE
122 # define LEX_START_SAME_FILTER  0x00000001
123 # define LEX_IGNORE_UTF8_HINTS  0x00000002
124 # define LEX_EVALBYTES          0x00000004
125 # define LEX_START_COPIED       0x00000008
126 # define LEX_DONT_CLOSE_RSFP    0x00000010
127 # define LEX_START_FLAGS \
128         (LEX_START_SAME_FILTER|LEX_START_COPIED \
129         |LEX_IGNORE_UTF8_HINTS|LEX_EVALBYTES|LEX_DONT_CLOSE_RSFP)
130 #endif
131
132 /* flags for parser API */
133 #define PARSE_OPTIONAL          0x00000001
134
135 /* values for lex_fakeeof */
136 enum {
137     LEX_FAKEEOF_NEVER,      /* don't fake EOF */
138     LEX_FAKEEOF_CLOSING,    /* fake EOF at unmatched closing punctuation */
139     LEX_FAKEEOF_NONEXPR,    /* ... and at token that can't be in expression */
140     LEX_FAKEEOF_LOWLOGIC,   /* ... and at low-precedence logic operator */
141     LEX_FAKEEOF_COMMA,      /* ... and at comma */
142     LEX_FAKEEOF_ASSIGN,     /* ... and at assignment operator */
143     LEX_FAKEEOF_IFELSE,     /* ... and at ?: operator */
144     LEX_FAKEEOF_RANGE,      /* ... and at range operator */
145     LEX_FAKEEOF_LOGIC,      /* ... and at logic operator */
146     LEX_FAKEEOF_BITWISE,    /* ... and at bitwise operator */
147     LEX_FAKEEOF_COMPARE,    /* ... and at comparison operator */
148     LEX_FAKEEOF_MAX
149 };
150
151 /*
152  * Local variables:
153  * c-indentation-style: bsd
154  * c-basic-offset: 4
155  * indent-tabs-mode: nil
156  * End:
157  *
158  * ex: set ts=8 sts=4 sw=4 et:
159  */