\N{...} now treated as literal for EBCDIC qr/[...]/
authorKarl Williamson <khw@cpan.org>
Mon, 6 Oct 2014 18:02:25 +0000 (12:02 -0600)
committerKarl Williamson <khw@cpan.org>
Tue, 7 Oct 2014 14:51:10 +0000 (08:51 -0600)
commit423df6e4ea0fd95811eb041174e9e88a3e25975f
treeb10229c2e50f44f3ee26800c58623beb9b515b86
parent8498497fc66084a5698b2e8e44bd811ece344d84
\N{...} now treated as literal for EBCDIC qr/[...]/

Perl specially handles some ranges in bracketed character classes to
deal with gaps between, for example, "i" and "j".  The next commit will
better document this.  This special handling is only invoked when both
ends of the range are literals.  This commit extends that so that a
\N{...} construct is considered a literal for this purpose.

There really shouldn't be any difference in the handling of "A" vs
"\N{LATIN CAPITAL LETTER A}".  And this commit makes them be handled the
same.

It further makes \N{U+0041} be treated the same.  The programmer here is
effectively saying "A", and invoking the Unicode definition for it, so
it stands to reason that the range s/he wants should also be interpreted
the Unicode way.
regcomp.c
t/re/pat.t