This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Update perldelta
[perl5.git] / pod / perlreref.pod
index 5ce6463..6d5a30d 100644 (file)
@@ -50,7 +50,7 @@ as the L</"SEE ALSO"> section in this document.
      as a double quoted string unless a single-quote (') is the delimiter.
 
   ?pattern? is like m/pattern/ but matches only once. No alternate
-      delimiters can be used. Must be reset with L<reset|perlfunc/reset>.
+      delimiters can be used.  Must be reset with reset().
 
 =head2 SYNTAX
 
@@ -78,7 +78,7 @@ These work as in normal strings.
    \n       Newline
    \r       Carriage return
    \t       Tab
-   \038     Any octal ASCII value
+   \037     Any octal ASCII value
    \x7f     Any hexadecimal ASCII value
    \x{263a} A wide hexadecimal value
    \cx      Control-x
@@ -104,15 +104,19 @@ This one works differently from normal strings:
    [f-j-]   Dash escaped or at start or end means 'dash'
    [^f-j]   Caret indicates "match any character _except_ these"
 
-The following work within or without a character class:
+The following sequences work within or without a character class.
+The first six are locale aware, all are Unicode aware.  The default
+character class equivalent are given.  See L<perllocale> and
+L<perlunicode> for details.
 
-   \d      A digit, same as [0-9]
-   \D      A nondigit, same as [^0-9]
-   \w      A word character (alphanumeric), same as [a-zA-Z0-9_]
-   \W      A non-word character, [^a-zA-Z0-9_]
-   \s      A whitespace character, same as [ \t\n\r\f]
-   \S      A non-whitespace character, [^ \t\n\r\f]
-   \C      Match a byte (with Unicode, '.' matches char)
+   \d      A digit                     [0-9]
+   \D      A nondigit                  [^0-9]
+   \w      A word character            [a-zA-Z0-9_]
+   \W      A non-word character        [^a-zA-Z0-9_]
+   \s      A whitespace character      [ \t\n\r\f]
+   \S      A non-whitespace character  [^ \t\n\r\f]
+
+   \C      Match a byte (with Unicode, '.' matches a character)
    \pP     Match P-named (Unicode) property
    \p{...} Match Unicode property with long name
    \PP     Match non-P
@@ -121,21 +125,21 @@ The following work within or without a character class:
 
 POSIX character classes and their Unicode and Perl equivalents:
 
-   alnum   IsAlnum             Alphanumeric
-   alpha   IsAlpha             Alphabetic
-   ascii   IsASCII             Any ASCII char
-   blank   IsSpace  [ \t]      Horizontal whitespace (GNU)
-   cntrl   IsCntrl             Control characters
-   digit   IsDigit  \d         Digits
-   graph   IsGraph             Alphanumeric and punctuation
-   lower   IsLower             Lowercase chars (locale aware)
-   print   IsPrint             Alphanumeric, punct, and space
-   punct   IsPunct             Punctuation
-   space   IsSpace  [\s\ck]    Whitespace
-           IsSpacePerl   \s    Perl's whitespace definition
-   upper   IsUpper             Uppercase chars (locale aware)
-   word    IsWord   \w         Alphanumeric plus _ (Perl)
-   xdigit  IsXDigit [\dA-Fa-f] Hexadecimal digit
+   alnum   IsAlnum              Alphanumeric
+   alpha   IsAlpha              Alphabetic
+   ascii   IsASCII              Any ASCII char
+   blank   IsSpace  [ \t]       Horizontal whitespace (GNU extension)
+   cntrl   IsCntrl              Control characters
+   digit   IsDigit  \d          Digits
+   graph   IsGraph              Alphanumeric and punctuation
+   lower   IsLower              Lowercase chars (locale and Unicode aware)
+   print   IsPrint              Alphanumeric, punct, and space
+   punct   IsPunct              Punctuation
+   space   IsSpace  [\s\ck]     Whitespace
+           IsSpacePerl   \s     Perl's whitespace definition
+   upper   IsUpper              Uppercase chars (locale and Unicode aware)
+   word    IsWord   \w          Alphanumeric plus _ (Perl extension)
+   xdigit  IsXDigit [0-9A-Fa-f] Hexadecimal digit
 
 Within a character class:
 
@@ -225,20 +229,20 @@ Captured groups are numbered according to their I<opening> paren.
 The first four of these are like the escape sequences C<\L>, C<\l>,
 C<\U>, and C<\u>.  For Titlecase, see L</Titlecase>.
 
-=head2 Terminology
+=head2 TERMINOLOGY
 
 =head3 Titlecase
 
 Unicode concept which most often is equal to uppercase, but for
 certain characters like the German "sharp s" there is a difference.
 
-=head2 AUTHOR
+=head1 AUTHOR
 
 Iain Truskett.
 
 This document may be distributed under the same terms as Perl itself.
 
-=head2 SEE ALSO
+=head1 SEE ALSO
 
 =over 4
 
@@ -292,7 +296,7 @@ reference on the topic.
 
 =back
 
-=head2 THANKS
+=head1 THANKS
 
 David P.C. Wollmann,
 Richard Soderberg,