"" =~ /\b{gcb}/ should fail; same \b{wb}, \b{sb}
authorKarl Williamson <khw@cpan.org>
Mon, 19 Oct 2015 18:14:36 +0000 (12:14 -0600)
committerKarl Williamson <khw@cpan.org>
Mon, 19 Oct 2015 18:40:24 +0000 (12:40 -0600)
commita7a8bd1ed56dbdb7e63735924945bbb66b7e2e5c
tree533c7a08e31e28aa24888065b383635469d30617
parent67481c39e5c4241caaadaabb962ba281af64d9aa
"" =~ /\b{gcb}/ should fail; same \b{wb}, \b{sb}

The Unicode standard indicates that these breaks should succeed at the
beginning and end of text.  It appears to me to be an oversight on their
part to not make an exception when there is no actual text.  (Their test
suite does not cover this case.)  I blindly implemented their algorithm
for 5.22, but it really is the wrong thing to do.
regexec.c