This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
regex: Add lower bound to ANYOFH nodes UTF-8 byte
authorKarl Williamson <khw@cpan.org>
Tue, 4 Jun 2019 18:16:10 +0000 (12:16 -0600)
committerKarl Williamson <khw@cpan.org>
Wed, 26 Jun 2019 15:01:27 +0000 (09:01 -0600)
commit29a889ef8a5621dae70b129c9b5db9e83e1087f9
treedb39af97de82472d6b107fa39e08fcc8274bf335
parentf6eaa562638a777c6c2e56637898eb90a0f40412
regex: Add lower bound to ANYOFH nodes UTF-8 byte

This commit adds a lower bound for the first UTF-8 byte matchable by an
ANYOFH node.  The flags field is otherwise unused, and using it for this
purpose allows code to rule out match possibilities without having to
convert from UTF-8 to code point.

It might be better to do the inverse instead, to have the field be an
upper bound.  The reason is that the conversion is cheap for smaller
numbers.  The commit following mostly addresses this.
pod/perldebguts.pod
regcomp.c
regcomp.sym
regexec.c
regnodes.h
t/re/anyof.t