This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
diag.t: Remove printf conversion modifiers from msgs
[perl5.git] / t / porting / diag.t
index a9db20c..c8b2d0e 100644 (file)
 #!/usr/bin/perl
 use warnings;
 use strict;
-use Test::More 'no_plan';
+
+require './test.pl';
+
+plan('no_plan');
+
 $|=1;
 
+# --make-exceptions-list outputs the list of strings that don't have
+# perldiag.pod entries to STDERR without TAP formatting, so they can
+# easily be put in the __DATA__ section of this file.  This was done
+# initially so as to not create new test failures upon the initial
+# creation of this test file.  You probably shouldn't do it again.
+# Just add the documentation instead.
 my $make_exceptions_list = ($ARGV[0]||'') eq '--make-exceptions-list';
 
-open my $diagfh, "<:raw", "../pod/perldiag.pod"
-  or die "Can't open ../pod/perldiag.pod: $!";
+chdir '..' or die "Can't chdir ..: $!";
+BEGIN { defined $ENV{PERL_UNICODE} and push @INC, "lib"; }
+
+my @functions;
+
+open my $func_fh, "<", "embed.fnc" or die "Can't open embed.fnc: $!";
+
+# Look for functions in embed.fnc that look like they could be diagnostic ones.
+while (<$func_fh>) {
+  chomp;
+  s/^\s+//;
+  while (s/\s*\\$//) {      # Grab up all continuation lines, these end in \
+    my $next = <$func_fh>;
+    $next =~ s/^\s+//;
+    chomp $next;
+    $_ .= $next;
+  }
+  next if /^:/;     # Lines beginning with colon are comments.
+  next unless /\|/; # Lines without a vertical bar are something we can't deal
+                    # with
+  my @fields = split /\s*\|\s*/;
+  next unless $fields[2] =~ /warn|err|(\b|_)die|croak/i;
+  push @functions, $fields[2];
+
+  # The flag p means that this function may have a 'Perl_' prefix
+  # The flag s means that this function may have a 'S_' prefix
+  push @functions, "Perl_$fields[2]", if $fields[0] =~ /p/;
+  push @functions, "S_$fields[2]", if $fields[0] =~ /s/;
+}
+
+close $func_fh;
+
+my $function_re = join '|', @functions;
+my $source_msg_re = qr/(?<routine>\bDIE\b|$function_re)/;
 
 my %entries;
+
+# Get the ignores that are compiled into this file
 while (<DATA>) {
   chomp;
   $entries{$_}{todo}=1;
 }
 
+my $pod = "pod/perldiag.pod";
 my $cur_entry;
+open my $diagfh, "<", $pod
+  or die "Can't open $pod: $!";
+
+my $category_re = qr/ [a-z0-9]+?/;      # Note: requires an initial space
+my $severity_re = qr/ . (?: \| . )* /x; # A severity is a single char, but can
+                                        # be of the form 'S|P|W'
 while (<$diagfh>) {
   if (m/^=item (.*)/) {
     $cur_entry = $1;
-  } elsif (m/^\((.)(?: ([a-z]+?))?\)/ and !$entries{$cur_entry}{severity}) {
-    # Make sure to init this here, so an actual entry in perldiag overwrites
-    # one in DATA.
+
+    if (exists $entries{$cur_entry}) {
+        fail($cur_entry);
+        diag("   Remove the TODO entry \"$cur_entry\",\n"
+           . "   from $0 as it is already in $pod near line $.");
+    }
+    # Make sure to init this here, so an actual entry in perldiag
+    # overwrites one in DATA.
     $entries{$cur_entry}{todo} = 0;
-    $entries{$cur_entry}{severity} = $1;
-    $entries{$cur_entry}{category} = $2;
+    $entries{$cur_entry}{line_number} = $.;
+    next;
+  }
+
+  next if ! defined $cur_entry;
+
+  if (! $entries{$cur_entry}{severity}) {
+    if (/^ \( ( $severity_re )
+
+        # Can have multiple categories separated by commas
+        (?: ( $category_re ) (?: , $category_re)* )? \) /x)
+    {
+      $entries{$cur_entry}{severity} = $1;
+      $entries{$cur_entry}{category} = $2;
+    }
+    elsif (! $entries{$cur_entry}{first_line} && $_ =~ /\S/) {
+
+      # Keep track of first line of text if doesn't contain a severity, so
+      # that can later examine it to determine if that is ok or not
+      $entries{$cur_entry}{first_line} = $_;
+    }
   }
 }
 
-my @todo = ('..');
+foreach my $cur_entry ( keys %entries) {
+    next if $entries{$cur_entry}{todo}; # If in this file, won't have a severity
+    if (! exists $entries{$cur_entry}{severity}
+
+            # If there is no first line, it was two =items in a row, so the
+            # second one is the one with with text, not this one.
+        && exists $entries{$cur_entry}{first_line}
+
+            # If the first line refers to another message, no need for severity
+        && $entries{$cur_entry}{first_line} !~ /^See/)
+    {
+        fail($cur_entry);
+        diag(
+            "   $pod entry at line $entries{$cur_entry}{line_number}\n"
+          . "       \"$cur_entry\"\n"
+          . "   is missing a severity and/or category"
+        );
+    }
+}
+
+# Recursively descend looking for source files.
+my @todo = sort <*>;
 while (@todo) {
   my $todo = shift @todo;
-  next if $todo ~~ ['../t', '../lib', '../ext', '../dist', '../cpan'];
+  next if $todo ~~ ['t', 'lib', 'ext', 'dist', 'cpan'];
   # opmini.c is just a copy of op.c, so there's no need to check again.
-  next if $todo eq '../opmini.c';
+  next if $todo eq 'opmini.c';
   if (-d $todo) {
-    push @todo, glob "$todo/*";
+    unshift @todo, sort glob "$todo/*";
   } elsif ($todo =~ m/\.[ch]$/) {
     check_file($todo);
   }
 }
 
+sub find_message {
+  my ($line) = @_;
+  my $text_re = qr/"(?<text>(?:\\"|[^"])*?)"/;
+  if ($line =~ m/$source_msg_re(?:_nocontext)? \s*
+    \(aTHX_ \s*
+    (?:packWARN\d*\((?<category>.*?)\),)? \s*
+    $text_re /x
+  ) {
+    return [$+{'text'}, $+{'category'}];
+  }
+  elsif ( $line =~ m{BADVERSION\([^"]*$text_re}) {
+    return [$+{'text'}, undef];
+  }
+  return;
+}
+
+# Standardize messages with variants into the form that appears
+# in perldiag.pod -- useful for things without a diag_listed_as annotation
+sub standardize {
+  my ($name) = @_;
+
+  if    ( $name =~ m/^(Invalid strict version format) \([^\)]*\)/ ) {
+    $name = "$1 (\%s)";
+  }
+  elsif ( $name =~ m/^(Invalid version format) \([^\)]*\)/ ) {
+    $name = "$1 (\%s)";
+  }
+  elsif ($name =~ m/^panic: /) {
+    $name = "panic: \%s";
+  }
+
+  return $name;
+}
+
 sub check_file {
   my ($codefn) = @_;
 
-  print "# $codefn\n";
+  print "# Checking $codefn\n";
 
-  open my $codefh, "<:raw", $codefn
+  open my $codefh, "<", $codefn
     or die "Can't open $codefn: $!";
 
   my $listed_as;
@@ -67,7 +197,10 @@ sub check_file {
     }
     next if /^#/;
     next if /^ * /;
-    while (m/\bDIE\b|Perl_(croak|die|warn(er)?)/ and not m/\);$/) {
+
+    my $multiline = 0;
+    # Loop to accumulate the message text all on one line.
+    while (m/$source_msg_re/ and not m/\);$/) {
       my $nextline = <$codefh>;
       # Means we fell off the end of the file.  Not terribly surprising;
       # this code tries to merge a lot of things that aren't regular C
@@ -83,10 +216,14 @@ sub check_file {
         $nextline =~ s/^"//;
       }
       $_ = "$_$nextline";
+      ++$multiline;
     }
     # This should happen *after* unwrapping, or we don't reformat the things
     # in later lines.
     # List from perlguts.pod "Formatted Printing of IVs, UVs, and NVs"
+    # Convert from internal formats to ones that the readers will be familiar
+    # with, while removing any format modifiers, such as precision, the
+    # presence of which would just confuse the pod's explanation
     my %specialformats = (IVdf => 'd',
                           UVuf => 'd',
                           UVof => 'o',
@@ -96,32 +233,37 @@ sub check_file {
                           NVff => 'f',
                           NVgf => 'f',
                           SVf  => 's');
+    my $format_modifiers = qr/ [#0\ +-]*              # optional flags
+                              (?: [1-9][0-9]* | \* )? # optional field width
+                              (?: \. \d* )?           # optional precision
+                              (?: h|l )?              # optional length modifier
+                            /x;
     for my $from (keys %specialformats) {
-      s/%"\s*$from\s*"/\%$specialformats{$from}/g;
-      s/%"\s*$from/\%$specialformats{$from}"/g;
+      s/%$format_modifiers"\s*$from\s*"/\%$specialformats{$from}/g;
+      s/%$format_modifiers"\s*$from/\%$specialformats{$from}"/g;
     }
+
+    # Remove any remaining format modifiers, but not in %%
+    s/ (?<!%) % $format_modifiers ( [dioxXucsfeEgGp] ) /%$1/xg;
+
     # The %"foo" thing needs to happen *before* this regex.
-    if (m/(?:DIE|Perl_(croak|die|warn|warner))(?:_nocontext)? \s*
-          \(aTHX_ \s*
-          (?:packWARN\d*\((.*?)\),)? \s*
-          "((?:\\"|[^"])*?)"/x) {
-      # diag($_);
-      # DIE is just return Perl_die
-      my $severity = {croak => [qw/P F/],
+    if ( my $found = find_message($_) ) {
+    # diag($_);
+    # DIE is just return Perl_die
+    my ($name, $category) = @$found;
+    my $severity = {croak => [qw/P F/],
                       die   => [qw/P F/],
                       warn  => [qw/W D S/],
-                     }->{$1||'die'};
-      my @categories;
-      if ($2) {
-        @categories = map {s/^WARN_//; lc $_} split /\s*[|,]\s*/, $2;
-      }
-      my $name;
-      if ($listed_as and $listed_as_line == $.) {
+                     }->{$+{'routine'}||'die'};
+    my @categories;
+    if (defined $category) {
+        @categories = map {s/^WARN_//; lc $_} split /\s*[|,]\s*/, $category;
+    }
+    if ($listed_as and $listed_as_line == $. - $multiline) {
         $name = $listed_as;
-      } else {
-        $name = $3;
-        # The form listed in perldiag ignores most sorts of fancy printf formatting,
-        # or makes it more perlish.
+    } else {
+        # The form listed in perldiag ignores most sorts of fancy printf
+        # formatting, or makes it more perlish.
         $name =~ s/%%/\\%/g;
         $name =~ s/%l[ud]/%d/g;
         $name =~ s/%\.(\d+|\*)s/\%s/g;
@@ -129,6 +271,7 @@ sub check_file {
         $name =~ s/\\t/\t/g;
         $name =~ s/\\n/ /g;
         $name =~ s/\s+$//;
+        $name =~ s/(\\)\\/$1/g;
       }
 
       # Extra explanatory info on an already-listed error, doesn't
@@ -144,47 +287,65 @@ sub check_file {
       # inside an #if 0 block.
       next if $name eq 'SKIPME';
 
+      $name = standardize($name);
+
       if (exists $entries{$name}) {
-        if ($entries{$name}{todo}) {
+        if ( $entries{$name}{seen}++ ) {
+          # no need to repeat entries we've tested
+        } elsif ($entries{$name}{todo}) {
         TODO: {
-            local $TODO = 'in DATA';
-            fail("Presence of '$name' from $codefn line $.");
+            no warnings 'once';
+            local $::TODO = 'in DATA';
+            # There is no listing, but it is in the list of exceptions.  TODO FAIL.
+            fail($name);
+            diag(
+              "    Message '$name'\n    from $codefn line $. is not listed in $pod\n".
+              "    (but it wasn't documented in 5.10 either, so marking it TODO)."
+            );
           }
         } else {
-          ok("Presence of '$name' from $codefn line $.");
+          # We found an actual valid entry in perldiag.pod for this error.
+          pass($name);
         }
         # Later, should start checking that the severity is correct, too.
-      } elsif ($name =~ m/^panic: /) {
-        # Just too many panic:s, they are hard to diagnose, and there
-        # is a generic "panic: %s" entry.  Leave these for another
-        # pass.
-        ok("Presence of '$name' from $codefn line $., covered by panic: %s entry");
       } else {
         if ($make_exceptions_list) {
+          # We're making an updated version of the exception list, to
+          # stick in the __DATA__ section.  I honestly can't think of
+          # a situation where this is the right thing to do, but I'm
+          # leaving it here, just in case one of my descendents thinks
+          # it's a good idea.
           print STDERR "$name\n";
         } else {
-          fail("Presence of '$name' from $codefn line $.");
+          # No listing found, and no excuse either.
+          # Find the correct place in perldiag.pod, and add a stanza beginning =item $name.
+          fail($name);
+          diag("    Message '$name'\n    from $codefn line $. is not listed in $pod");
         }
+        # seen it, so only fail once for this message
+        $entries{$name}{seen}++;
       }
 
       die if $name =~ /%$/;
     }
   }
 }
-# Lists all missing things as of the inaguration of this script, so we
+# Lists all missing things as of the inauguration of this script, so we
 # don't have to go from "meh" to perfect all at once.
+# 
+# PLEASE DO NOT ADD TO THIS LIST.  Instead, write an entry in
+# pod/perldiag.pod for your new (warning|error).
+
+# Also FIXME this test, as the first entry in TODO *is* covered by the
+# description: Malformed UTF-8 character (%s)
 __DATA__
-Ambiguous call resolved as CORE::%s(), %s
-Ambiguous use of %c resolved as operator %c
-Ambiguous use of %c{%s} resolved to %c%s
-Ambiguous use of %c{%s%s} resolved to %c%s%s
-Ambiguous use of -%s resolved as -&%s()
+Malformed UTF-8 character (unexpected non-continuation byte 0x%x, immediately after start byte 0x%x)
+
+%s (%d) does not match %s (%d),
+%s (%d) smaller than %s (%d),
 Argument "%s" isn't numeric
 Argument "%s" isn't numeric in %s
-Assertion: marks beyond string end
-Assertion: string is shorter than advertised
 Attempt to clear deleted array
-Attempt to free non-arena SV: 0x%x
 Attempt to free non-existent shared string '%s'%s
 Attempt to free temp prematurely: SV 0x%x
 Attempt to free unreferenced scalar: SV 0x%x
@@ -219,21 +380,20 @@ Can't %s %s%s%s
 Can't %s `%s' with ARGV[0] being `%s' (looking for executables only, not found)
 Can't take %s of %f
 Can't use '%c' after -mname
-Can't use \\%c to mean $%c in expression
+Can't use string ("%s"%s) as a subroutine ref while "strict refs" in use
 Can't use when() outside a topicalizer
-\\%c better written as $%c
+\%c better written as $%c
 Character(s) in '%c' format wrapped in %s
 $%c is no longer supported
 Cloning substitution context is unimplemented
 Code missing after '/' in pack
 Code missing after '/' in unpack
-Compilation failed in require
 Corrupted regexp opcode %d > %d
 '%c' outside of string in pack
 Debug leaking scalars child failed%s%s with errno %d: %s
 Deep recursion on anonymous subroutine
 defined(\%hash) is deprecated
-Don't know how to handle magic of type \\%o
+Don't know how to handle magic of type \%o
 -Dp not implemented on this platform
 entering effective gid failed
 entering effective uid failed
@@ -251,12 +411,14 @@ glob failed (child exited with status %d%s)
 Goto undefined subroutine
 Goto undefined subroutine &%s
 Hash \%%s missing the \% in argument %d of %s()
-Illegal character \\%03o (carriage return)
 Illegal character %sin prototype for %s : %s
+Integer overflow in binary number
 Integer overflow in decimal number
+Integer overflow in hexadecimal number
+Integer overflow in octal number
 Integer overflow in version %d
 internal \%<num>p might conflict with future printf extensions
-invalid control request: '\\%03o'
+invalid control request: '\%o'
 Invalid module name %s with -%c option: contains single ':'
 invalid option -D%c, use -D'' to see choices
 Invalid range "%c-%c" in transliteration operator
@@ -266,43 +428,32 @@ Invalid type '%c' in pack
 Invalid type '%c' in %s
 Invalid type '%c' in unpack
 Invalid type ',' in %s
-Invalid version format (alpha without decimal)
-Invalid version format (misplaced _ in number)
-Invalid version object
+It is proposed that "\c{" no longer be valid. It has historically evaluated to  ";".  If you disagree with this proposal, send email to perl5-porters@perl.org Otherwise, or in the meantime, you can work around this failure by changing "\c{" to ";"
 'j' not supported on this platform
 'J' not supported on this platform
-Layer does not match this perl
 leaving effective gid failed
 leaving effective uid failed
 List form of piped open not implemented
 Lost precision when decrementing %f by 1
 Lost precision when incrementing %f by 1
 %lx
-Malformed UTF-16 surrogate
 Malformed UTF-8 character (fatal)
 '\%' may not be used in pack
 Missing (suid) fd script name
 More than one argument to open
 More than one argument to open(,':%s')
-mprotect for %p %d failed with %d
-mprotect RW for %p %d failed with %d
+mprotect for %p %u failed with %d
+mprotect RW for %p %u failed with %d
 No code specified for -%c
 No directory specified for -I
 No such class field "%s"
 Not an XSUB reference
 Not %s reference
-Offset outside string
-Opening dirhandle %s also as a file
-Opening filehandle %s also as a directory
 Operator or semicolon missing before %c%s
-Overloaded dereference did not return a reference
-Perl bug: predicted utf8 length not available
-PERL_SIGNALS illegal: "%s"
 Perl %s required (did you mean %s?)--this is only %s, stopped
 Perl %s required--this is only %s, stopped
 Perls since %s too modern--this is %s, stopped
-Possible unintended interpolation of $\\ in regex
-ptr wrong %p != %p fl=%08
+ptr wrong %p != %p fl=%x nl=%p e=%p for %d
 Recompile perl with -DDEBUGGING to use -D switch (did you mean -d ?)
 Recursive call to Perl_load_module in PerlIO_find_layer
 refcnt_dec: fd %d < 0
@@ -312,8 +463,10 @@ refcnt_inc: fd %d < 0
 refcnt_inc: fd %d: %d <= 0
 Reversed %c= operator
 Runaway prototype
-%s(%.0f) failed
-%s(%.0f) too large
+%s(%.0
+%s(%f) failed
+%s(%f) too large
+%s(%f) too small
 Scalar value %s better written as $%s
 %sCompilation failed in regexp
 %sCompilation failed in require
@@ -351,15 +504,13 @@ U0 mode on a byte string
 Unbalanced string table refcount: (%d) for "%s"
 Undefined top format called
 Unexpected constant lvalue entersub entry via type/targ %d:%d
-Unicode non-character 0x%04
+Unicode non-character 0x%X
 Unknown PerlIO layer "scalar"
-Unknown Unicode option letter '%c'
-unrecognised control character '%c'
 Unstable directory path, current directory changed unexpectedly
-Unsupported script encoding UTF16-BE
-Unsupported script encoding UTF16-LE
-Unsupported script encoding UTF32-BE
-Unsupported script encoding UTF32-LE
+Unsupported script encoding UTF-16BE
+Unsupported script encoding UTF-16LE
+Unsupported script encoding UTF-32BE
+Unsupported script encoding UTF-32LE
 Unterminated compressed integer in unpack
 Usage: CODE(0x%x)(%s)
 Usage: %s(%s)
@@ -367,8 +518,7 @@ Usage: %s::%s(%s)
 Usage: VMS::Filespec::unixrealpath(spec)
 Usage: VMS::Filespec::vmsrealpath(spec)
 Use of inherited AUTOLOAD for non-method %s::%s() is deprecated
-UTF-16 surrogate 0x%04
-utf8 "\\x%02X" does not map to Unicode
+utf8 "\x%X" does not map to Unicode
 Value of logical "%s" too long. Truncating to %i bytes
 value of node is %d in Offset macro
 Value of %s%s can be "0"; test with defined()
@@ -377,7 +527,6 @@ vector argument not supported with alpha versions
 Wide character
 Wide character in $/
 Wide character in print
-Wide character in %s
 Within []-length '%c' not allowed in %s
 Wrong syntax (suid) fd script name "%s"
 'X' outside of string in unpack