This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
perlretut: Remove references to Unicode blocks
authorKarl Williamson <public@khwilliamson.com>
Thu, 31 Mar 2011 17:21:28 +0000 (11:21 -0600)
committerKarl Williamson <public@khwilliamson.com>
Thu, 31 Mar 2011 17:33:22 +0000 (11:33 -0600)
blocks are mostly useless, and not suitable for an introduction
to regular expressions.  It was not always the case, as in very early
Unicode these were the best approximation to the much more useful
Script concept.  But that changed 10 or so years ago.

pod/perlretut.pod

index 84d4d8a..dd528c2 100644 (file)
@@ -1988,10 +1988,7 @@ Unicode has also been separated into various sets of characters
 which you can test with C<\p{...}> (in) and C<\P{...}> (not in).
 To test whether a character is (or is not) an element of a script
 you would use the script name, for example C<\p{Latin}>, C<\p{Greek}>,
-or C<\P{Katakana}>. Other sets are the Unicode blocks, the names
-of which begin with "In". One such block is dedicated to mathematical
-operators, and its pattern formula is <C\p{InMathematicalOperators>}>.
-For the full list see L<perluniprops>.
+or C<\P{Katakana}>.
 
 What we have described so far is the single form of the C<\p{...}> character
 classes.  There is also a compound form which you may run into.  These