This is a live mirror of the Perl 5 development currently hosted at
4 years agoPerl_sv_vcatpvfn_flags: move %*v handling earlier
David Mitchell [Fri, 26 May 2017 21:19:44 +0000 (22:19 +0100)]
Perl_sv_vcatpvfn_flags: move %*v handling earlier

Where the v flag appears, and it has non-default separator, i.e.
*v or *NNN$v, retrieve the next or NNNth arg (which defines the separator)
earlier - as soon as we encounter the v flag. This should in theory make
no functional difference since no args are processed between those two
points (so no chance of us stealing something else's arg).

Doing it ealrier makes the conditions simpler (we don't have to check for
(vectorize && vectorarg) later).

The whole code block has been moved as-is with no changes apart from

4 years agoPerl_sv_vcatpvfn_flags: move Inf handling for ints
David Mitchell [Fri, 26 May 2017 17:19:11 +0000 (18:19 +0100)]
Perl_sv_vcatpvfn_flags: move Inf handling for ints

integer-like format types handle Inf/Nan specially. Currently the code to
handle this in the main execution path, guarded by

    if (strchr("BbcDdiOouUXx", c)) ...

After the previous few commits reorganised the int-arg getting code, this
block can now be moved into an int-only section, so not slowing down
other format types.

There should be no functional changes.

I've added some comments to the %c branch explaining why its a special

4 years agoPerl_sv_vcatpvfn_flags: unify int arg fetching
David Mitchell [Fri, 26 May 2017 16:23:09 +0000 (17:23 +0100)]
Perl_sv_vcatpvfn_flags: unify int arg fetching

There are two big blocks of code that do signed and unsigned 'get next int
arg' processing. Combine them (sort of).

Previously it was a bit like

    case 'd':
    case 'i':
        base = 10;
        if (vectorize)
            uv = ...
        else if (arg)
            iv = ...
            iv = SvIV_nomg(argsv);
        if (!vectorize)
            uv = f(iv) for some f.
        goto integer;

    case 'x' base = 16; goto uns_integer;
    case 'u' base = 10; goto uns_integer;
        if (vectorize)
            uv = ...
        else if (arg)
            uv = ...
            uv = SvUV_nomg(argsv);

        ... do stuff with base and uv ...

Now it's more like

    case 'd': base = -10; goto get_int_arg_val;
    case 'i': base = -10; goto get_int_arg_val;
    case 'x': base =  16; goto get_int_arg_val;
    case 'u': base =  10; goto get_int_arg_val;


        if (vectorize)
            uv = ...
        else if (base < 0) {
            /* signed int type */
            base = -base;
            if (arg)
                iv = ...
                iv = SvIV_nomg(argsv);
            uv = f(iv) for some f.
        else {
            /* unsigned int type */
            if (arg)
                uv = ...
                uv = SvUV_nomg(argsv);

        ... do stuff with base and uv ...

Note that in particular the vectorize block of code is no longer
duplicated. This will also allow the next commit to handle Inf/overload
just after the 'get_int_arg_val' label rather than doing it before the
main switch and slowing down the non-integer format types.

Should be no functional changes

4 years agoPerl_sv_vcatpvfn_flags: move %c handling to ints
David Mitchell [Fri, 26 May 2017 15:39:30 +0000 (16:39 +0100)]
Perl_sv_vcatpvfn_flags: move %c handling to ints

%c is in some ways like integer formats - we treat the arg as an integer
(with '0+' overloading and Inf/Nan handling), but then at the end convert
it into a 1 char string rather than sequence of 0..9's.

Move the %c code partially into the main integer handling block of
code; this will shortly allow us to unify the SV-as-integer handling code.

4 years agoPerl_sv_vcatpvfn_flags: %p and Inf/Nan
David Mitchell [Fri, 26 May 2017 15:05:18 +0000 (16:05 +0100)]
Perl_sv_vcatpvfn_flags: %p and Inf/Nan

sprintf("%p", 0+Inf) should print the address of an SV, not the literal
string "Inf". Ditto NaN.

Similarly, sprintf("%p", $x) should print the address of the $x SV,
not triggering a tie fetch or overload method call, nor using the address
of any SV returned by such calls.

4 years agoPerl_sv_vcatpvfn_flags: make 'fill' var a boolean
David Mitchell [Thu, 25 May 2017 11:09:52 +0000 (12:09 +0100)]
Perl_sv_vcatpvfn_flags: make 'fill' var a boolean

Currently the 'fill' local variable is a char, but it only ever holds the
values ' ' or '0'. Make it into a boolean flag instead.

4 years agoPerl_sv_vcatpvfn_flags: do %p specials in %p case
David Mitchell [Thu, 25 May 2017 10:56:44 +0000 (11:56 +0100)]
Perl_sv_vcatpvfn_flags: do %p specials in %p case

There are currently a few special-cased %p variants (but only when called
from C, not from perl) such as %-p, %2p etc. Currently these are handled
specially at the top of main format-element loop, which penalises every
format type. Instead move the handling into the "case 'p'" branch of the
main switch. Which seems more logical, as well as more efficient.

I've also heavily rewritten the big comment block about all the special %p

4 years agoPerl_sv_vcatpvfn_flags: move UTF8f handling code
David Mitchell [Thu, 25 May 2017 09:29:04 +0000 (10:29 +0100)]
Perl_sv_vcatpvfn_flags: move UTF8f handling code

The special UTF8f format (which is usually defined as something like
"%d%lu%4p") is currently handled as a special case at the top of the main
format-element loop.

Instead move it into the "case "'d'" branch so that it doesn't slow down

4 years agoPerl_sv_vcatpvfn_flags: add %n code comment
David Mitchell [Wed, 24 May 2017 15:29:16 +0000 (16:29 +0100)]
Perl_sv_vcatpvfn_flags: add %n code comment

point out thngs like "%-4.5n" don't currently warn

4 years agoPerl_sv_vcatpvfn_flags: make %n missing arg fatal
David Mitchell [Wed, 24 May 2017 15:09:25 +0000 (16:09 +0100)]
Perl_sv_vcatpvfn_flags: make %n missing arg fatal

Normally sprintf et al just warn if there aren't enough args; but since %n
wants to write the current string length to the next arg, make it fatal.

Formerly it would croak anyway, but with a spurious "Modification of a
read-only value" error as it as it tried to set &PL_sv_no

4 years agoPerl_sv_vcatpvfn_flags: comment %n deficiency
David Mitchell [Wed, 24 May 2017 14:58:06 +0000 (15:58 +0100)]
Perl_sv_vcatpvfn_flags: comment %n deficiency

This should be fixed sometime:

    /* XXX if sv was originally non-utf8 with a char in the
     * range 0x80-0xff, then if it got upgraded, we should
     * calculate char len rather than byte len here */

4 years agoPerl_sv_vcatpvfn_flags: skip IN_LC(LC_NUMERIC)
David Mitchell [Sat, 20 May 2017 15:01:26 +0000 (16:01 +0100)]
Perl_sv_vcatpvfn_flags: skip IN_LC(LC_NUMERIC)

In a couple of places it does

    if (PL_numeric_radix_sv && IN_LC(LC_NUMERIC)) { ... }

But PL_numeric_radix_sv is set to NULL unless we have a non-standard
radix point (i.e. not "."), and this can only happen when we're in the
scope of 'use locale'. So the IN_LC() should be a redundant (and
expensive) test. Replace it with an assert.

4 years agoPerl_sv_vcatpvfn_flags: set locale at most once
David Mitchell [Sat, 20 May 2017 14:51:31 +0000 (15:51 +0100)]
Perl_sv_vcatpvfn_flags: set locale at most once

Calls to external snprintf-ish functions or that directly access
PL_numeric_radix_sv are supposed to sandwich this access within


The code in Perl_sv_vcatpvfn_flags() seems to have gotten a bit confused
as to whether its trying to only set STORE_LC_NUMERIC_SET_TO_NEEDED()
once, then handle one of more %[aefh] format elements, then only
restore on exit. There is code at the end of the function which says:

    RESTORE_LC_NUMERIC();   /* Done outside loop, so don't have to save/restore
                               each iteration. */

but in practice various places within this function (and its helper
function S_format_hexfp() inconsistently repeatedly do

This commit changes it so that STORE_LC_NUMERIC_SET_TO_NEEDED() is called
at most once, the first time a % format involving a radix point is
encountered, and does RESTORE_LC_NUMERIC(); exactly once at the end of the

Note that while calling STORE_LC_NUMERIC_SET_TO_NEEDED() multiple times
is harmless, its quite expensive, as each time it has to check whether
it's in the scope of 'use locale'. RESTORE_LC_NUMERIC() is cheap if
STORE_LC_NUMERIC_SET_TO_NEEDED() earlier determined that there was nothing
to do.

4 years agoPerl_sv_vcatpvfn_flags: remove redundant code
David Mitchell [Sat, 20 May 2017 12:01:02 +0000 (13:01 +0100)]
Perl_sv_vcatpvfn_flags: remove redundant code

At the start of the function, it marks the output as being utf8 if the
first arg is utf8. But this should be taken care of when the individual
args (including the first one are processed). So its redundant code.

In fact it would sometimes cause the resultant string to be unnecessarily
upgraded to utf8, e.g.:

    my $precis = "9";
    my $s = sprintf "%.*f\n", $precis, 1.1;
    # whoops, $s is now utf8

4 years agoPerl_sv_vcatpvfn_flags: remove "%.Ng" special-case
David Mitchell [Sat, 20 May 2017 11:07:23 +0000 (12:07 +0100)]
Perl_sv_vcatpvfn_flags: remove "%.Ng" special-case

This function has special-case handling for the formats "%.0f" and
"%.NNg", to speed things up. This special-casing appears twice,
once near the top of the function for where the format matches exactly
"%.0f" or "%.Ng" (N is 1..99), and once again in the main loop of the
function, where it handles those format elements embedded in the larger
format: "....%.0f..." and "....%.Ng..." (N > 0).

The problem with the "%.Ng" code is that it isn't as robust as the more
general "....%.Ng..." code - in particular the latter checks for a
locale-dependent radix-point when determining needed buffer size.

This commit removes the "%.Ng" special-cased code but leaves the
"....%.Ng..." special-cased code. It makes the former about 7% slower
compared to the situation at the start of this branch. (Part of the effort
in this branch has been to make the "....%.Ng..." code faster, so that
there's less of an overall performance hit by removing "%.Ng").

4 years agoPerl_sv_vcatpvfn_flags: handle %.NNNg case earlier
David Mitchell [Fri, 19 May 2017 15:15:31 +0000 (16:15 +0100)]
Perl_sv_vcatpvfn_flags: handle %.NNNg case earlier

In the main loop, we look for %.NNNg and handle it specially.
Change it so that the special-case is only used when precis is small
enough to that it fits in the local ebuf[] rather than the malloced
PL_efloatbuf. This allows the check for this special case to be done
earlier with less redundant calculations.

4 years agoPerl_sv_vcatpvfn_flags: use quick concat for %.0f
David Mitchell [Fri, 19 May 2017 14:45:51 +0000 (15:45 +0100)]
Perl_sv_vcatpvfn_flags: use quick concat for %.0f

Most floating-point formats now use the quick concat path. But the
"%.0f" shortcut was accidentally bypassing that path. This commit fixes

4 years agoPerl_sv_vcatpvfn_flags: simplify concat of f/p str
David Mitchell [Thu, 18 May 2017 11:47:51 +0000 (12:47 +0100)]
Perl_sv_vcatpvfn_flags: simplify concat of f/p str

Since floating-point formats do their own formatting and padding, skip the
block of code at the end of the main loop which handles appending eptr to
sv, and do our own stripped-down version.

4 years agoPerl_sv_vcatpvfn_flags: s/gconverts/Gconvert's/
David Mitchell [Thu, 18 May 2017 10:44:17 +0000 (11:44 +0100)]
Perl_sv_vcatpvfn_flags: s/gconverts/Gconvert's/

fix a comment, so that a search for the word 'Gconvert' gets a match.
So that a later comment 'See earlier comment about buggy Gconvert' makes

4 years agoPerl_sv_vcatpvfn_flags: tighten hexfp var scope
David Mitchell [Thu, 18 May 2017 10:32:27 +0000 (11:32 +0100)]
Perl_sv_vcatpvfn_flags: tighten hexfp var scope

Only have the 'hexfp' var declared within the innermost scope it is
actually needed for.

4 years agoPerl_sv_vcatpvfn_flags: rename 'is_simple' var
David Mitchell [Thu, 18 May 2017 10:17:32 +0000 (11:17 +0100)]
Perl_sv_vcatpvfn_flags: rename 'is_simple' var

the definition of 'simple' required the format to have a precision.

4 years agoPerl_sv_vcatpvfn_flags: move pod closer
David Mitchell [Thu, 18 May 2017 10:03:28 +0000 (11:03 +0100)]
Perl_sv_vcatpvfn_flags: move pod closer

Several static functions etc had been added between the pod and the
main function. Move the pod to be just above it.

Also incorporate a comment into the pod about utf8ness of pattern and SV
needing to match.

4 years agoPerl_sv_vcatpvfn_flags: eliminate utf8buf[] var
David Mitchell [Thu, 18 May 2017 09:45:56 +0000 (10:45 +0100)]
Perl_sv_vcatpvfn_flags: eliminate utf8buf[] var

%c for a >255 char generates its utf8 byte representation and stores it in
thiis temporarly buffer:

    U8 utf8buf[UTF8_MAXBYTES+1]

But we already have another temporary buffer, ebuf, for creating floating
point strings, which is big enough. So use that instead.

4 years agoPerl_sv_vcatpvfn_flags: reorganise loop vars
David Mitchell [Thu, 18 May 2017 09:37:42 +0000 (10:37 +0100)]
Perl_sv_vcatpvfn_flags: reorganise loop vars

There are a big chunk of local vars declared at the top of the main loop.
Reorder the declarations to group similar vars together, and add a comment
to each var explaining what its for.

No functional changes.

4 years agoPerl_sv_vcatpvfn_flags: move vars to inner scope
David Mitchell [Thu, 18 May 2017 08:49:08 +0000 (09:49 +0100)]
Perl_sv_vcatpvfn_flags: move vars to inner scope

Add a new scope around the floating-point code, then move some
locals var declarations into that scope.

4 years agoPerl_sv_vcatpvfn_flags: extract hex f/p code
David Mitchell [Thu, 18 May 2017 08:41:15 +0000 (09:41 +0100)]
Perl_sv_vcatpvfn_flags: extract hex f/p code

There is a large block of code (nearly 300 lines) in
Perl_sv_vcatpvfn_flags(), which handles the %a/%A hexadecimal
floating-point format. Move it into new static function,

No functional changes.

4 years agoPerl_sv_vcatpvfn_flags: move some macros earlier
David Mitchell [Thu, 18 May 2017 08:03:20 +0000 (09:03 +0100)]
Perl_sv_vcatpvfn_flags: move some macros earlier

There are some macro definitions in the body of Perl_sv_vcatpvfn_flags()
which handle some possible differences between double and long double.
Move these to before the function as they will shortly need to be visible
to a new helper function. At the same time, prefix their names with with
VCATPVFN_ to make clear what they're for.

For the same reason I've also added a new typedef, vcatpvfn_long_double_t.

I also eliminated the FV_ISFINITE macro definition as its no longer used.

4 years agoremove HAS_LDBL_SPRINTF_BUG code
David Mitchell [Wed, 17 May 2017 12:36:27 +0000 (13:36 +0100)]

This code was added in 2002 to work round an Irix 6 rounding bug in
long double sprintfs.

I strongly suspect that any such OS bug has long been fixed and/or such
machines have been retired or are unlikely to have new perls installed on

Part of the motivation for removing this code is that following the
previous commit, that block of code's use of the float_need variable
is likely to be wrong (since it now includes exponent etc), but I have no
way of testing it.

I've left the probe code in hints/, so if anyone ever reports
sprintf.t failures on an old Irix platform, perl -V should show if their
system still has the bug. At that point someone brave could resurrect this
block of code.

4 years agoPerl_sv_vcatpvfn_flags: better calc f/p buf size
David Mitchell [Wed, 17 May 2017 11:27:18 +0000 (12:27 +0100)]
Perl_sv_vcatpvfn_flags: better calc f/p buf size

How it works out the needed buffer size for the various floating point
formats is a bit opaque. This commit extensively documents and
rationalises the process. In particular it will no longer allocate a very
large buffer for %g printing a large number (%g switches to %e style
format rather than %f in cases like this). Also it no longer relies on a
+40 fudge factor to accommodate exponents - this is now factored in

It still includes a +20 safety fudge factor for production builds, but
this is disabled under DEBUGGING so that ASAN and the like are likely to
more quickly spot issues during development.

4 years agosprintf: handle sized int-ish formats with Inf/Nan
David Mitchell [Tue, 16 May 2017 15:30:13 +0000 (16:30 +0100)]
sprintf: handle sized int-ish formats with Inf/Nan

The code path taken when int-ish formats saw an Inf/Nan was to jump to the
floating-point handler, but then that would warn about (valid) size
qualifiers. For example before:

    $ perl -we'printf "[%hi]\n", Inf'
    Invalid conversion in printf: "%hi" at -e line 1.
    Redundant argument in printf at -e line 1.

After this commit:

    $ perl -we'printf "[%hi]\n", Inf'

It also makes the code simpler.

4 years agoPerl_sv_vcatpvfn_flags: handle Inf/Nan in 1 place
David Mitchell [Tue, 16 May 2017 07:53:19 +0000 (08:53 +0100)]
Perl_sv_vcatpvfn_flags: handle Inf/Nan in 1 place

At the start of the float section, check whether the value if Inf/Nan
and handle directly. This stops later blocks of code having to test for it
too. Also simplify the formatting of Inf/Nan - let the general code at the
end of the block do any pre/post padding.

4 years agoPerl_sv_vcatpvfn_flags: sort PL_numeric_radix_sv
David Mitchell [Mon, 15 May 2017 17:59:54 +0000 (18:59 +0100)]
Perl_sv_vcatpvfn_flags: sort PL_numeric_radix_sv

Under locales the radix point may not be just a simple '.' but a Unicode
string like "\N{ARABIC DECIMAL SEPARATOR}". Currently the hex f/p code
explicitly takes account of the length of this string when calculating the
buffer length, but the other branches don't - they just rely on the
"add 40 fudge factor" to protect them.

Instead, handle its length for all branches, and simplify utf8 handling.
Currently it checks post-format whether the radix point was utf8, and if
so marks the resulting buffer as utf8. Instead, check for utf8-ness at the
same time we check for length.

This new approach doesn't check whether the resulting string actually
contains the radix point string, so in principle the string could be
marked utf8 but not have any >127 chars. I think this is harmless.

4 years agoPerl_sv_vcatpvfn_flags() split %.0f and %.Ng
David Mitchell [Mon, 15 May 2017 19:42:12 +0000 (20:42 +0100)]
Perl_sv_vcatpvfn_flags() split %.0f and %.Ng

The format elements "%.0f" and "%.NNNg" are handled specially in the main
loop. Split the code block which handles them and process %.0f earlier. It
doesn't need to allocate a variable-length buffer or worry about the
length of the radix string.

4 years agoS_F0convert(): remove Nan/Inf handling
David Mitchell [Mon, 15 May 2017 13:49:50 +0000 (14:49 +0100)]
S_F0convert(): remove Nan/Inf handling

This function handles sprintf "%.0f". It also handles Inf/Nan, but neither
of its callers will call it with such an nv. Its code for handling them is
also broken - it returns the \0 following the "Inf" or "Nan! string.

So just remove this unneeded and broken functionality.

At the same time document what S_F0convert() does.

4 years agoPerl_sv_vcatpvfn_flags: fix arg to SNPRINTF_G()
David Mitchell [Mon, 15 May 2017 12:54:17 +0000 (13:54 +0100)]
Perl_sv_vcatpvfn_flags: fix arg to SNPRINTF_G()

One of the callers of SNPRINTF_G() passes 'size' as its third arg - but
there is no such variable. This code happens only to be used in the
!USE_QUADMATH branch, and the SNPRINTF_G macro only uses that arg under
USE_QUADMATH. So it doesn't matter. But replace 'size' with 'sizeof(ebuf)'
in case that changes in future.

4 years agoPerl_sv_vcatpvfn_flags: reduce scope of local var
David Mitchell [Mon, 15 May 2017 11:51:56 +0000 (12:51 +0100)]
Perl_sv_vcatpvfn_flags: reduce scope of local var

fix_ldbl_sprintf_bug is only used in one block of code so declare it in
that block.
Given that that block is only compiled under HAS_LDBL_SPRINTF_BUG,
which seems only to be for some obscure Irix issues from 2002,
I haven't actually tested this.

4 years agouse SvCUR(PL_numeric_radix_sv) not SvLEN()
David Mitchell [Mon, 15 May 2017 10:59:49 +0000 (11:59 +0100)]
use SvCUR(PL_numeric_radix_sv) not SvLEN()

When determining the length of buffer needed to output the decimal point
in the current locale, use SvCUR(PL_numeric_radix_sv) rather than
SvLEN(PL_numeric_radix_sv). I presume this was a thinko in the original
commit. Using SvLEN currently seems harmless, since typically SvCUR <
SvLEN, but one could conceive a future scenario where locale info is set
using alien string buffers with SvLEN(sv) == 0.

4 years agoPerl_sv_vcatpvfn_flags: reindent block
David Mitchell [Thu, 11 May 2017 08:06:05 +0000 (09:06 +0100)]
Perl_sv_vcatpvfn_flags: reindent block

whitespace only

4 years agoPerl_sv_vcatpvfn_flags: reduce scope of 'int i'
David Mitchell [Thu, 11 May 2017 08:00:30 +0000 (09:00 +0100)]
Perl_sv_vcatpvfn_flags: reduce scope of 'int i'

Declare an 'i' var wherever needed for local use, rather than being in
scope for 1600 lines.

4 years agoPerl_sv_vcatpvfn_flags: get rid of an (int) cast
David Mitchell [Wed, 10 May 2017 16:23:51 +0000 (17:23 +0100)]
Perl_sv_vcatpvfn_flags: get rid of an (int) cast

harmless in this case, but there really shouldn't be (int) casts
on string length and ptr diff calculations

4 years agoPerl_sv_vcatpvfn_flags: calc (width - elen) once
David Mitchell [Wed, 10 May 2017 15:58:58 +0000 (16:58 +0100)]
Perl_sv_vcatpvfn_flags: calc (width - elen) once

There's a couple of blocks of code which repeat the expression
(width - elen). Calculate this once at the top. This makes it slightly
easier to audit the code for signed/unsigned wrap etc.

Should be no functional change.

4 years agoPerl_sv_vcatpvfn_flags: avoid 1-byte buf overrun
David Mitchell [Wed, 10 May 2017 15:17:18 +0000 (16:17 +0100)]
Perl_sv_vcatpvfn_flags: avoid 1-byte buf overrun

This only occurs on the "%a" (hex) format, and only happens when
processing a denormalised value whose bit pattern is 0xf....f or similar,
and when rounding up it needs to insert a '1' at the head of the number
and shift the rest of the digits down one.

In practice this never seems to happen - the top nybble of a denormalised
float value always seems to be 0x1 (presumably because that's implicit) so
there's never any carry to a higher digit. Maybe other platforms do it

Also VHEX_SIZE seems to be rounded up, so in practice there's no overrun.

But better safe than sorry.

4 years agoPerl_sv_vcatpvfn_flags: avoid a potential wrap
David Mitchell [Wed, 10 May 2017 14:27:49 +0000 (15:27 +0100)]
Perl_sv_vcatpvfn_flags: avoid a potential wrap

In the floating-point hex (%a) code, it checks whether the requested
precision is smaller than the hex buf size. It does this by casting
(precis + 1) to signed. Since precis can be any user-supplied value,
this can wrap. Instead, cast the (buffer_length - 1) to unsigned, since
this is bounded to a small constant value > 1.

In practise this makes no difference currently, as a large precis will
have caused a malloc panic earlier anyway. But that might change in

4 years agoPerl_sv_vcatpvfn_flags: simplify an expression
David Mitchell [Wed, 10 May 2017 13:03:25 +0000 (14:03 +0100)]
Perl_sv_vcatpvfn_flags: simplify an expression

In the hex floating/point code, (subnormal ? vfnz : vhex) is equivalent to
v0, which we just set to the same value.

So keep things simple.

4 years agosprintf(): handle mangled formats better with utf8
David Mitchell [Wed, 10 May 2017 10:19:38 +0000 (11:19 +0100)]
sprintf(): handle mangled formats better with utf8

Currently if sprintf() detects an error in the format while processing
a %.... entry, it copies the bytes as-is from the % to the point the
error was detected, then continues, If the output string and format string
don't have the same utf8-ness, this can result in badly-formed utf8

This commit changes the code so that it just appends a '%' then restarts
processing from the character following the %. Most of the time this just
again results with the characters following the % being output as-is,
expect this time the 'normal' character-copying code path is taken, which
handles utf8 mismatches correctly.

By doing this, it also removes a block of code which contained a "roll
your own" string appender which used SvGROW() and Copy(). This was one
further place which was potentially open to wrapping and block overrun

This commit may cause occasional changes in behaviour, depending on
whether there are any further '%' characters within the bad section of the
format.  Now these will be reprocessed, possibly triggering further
'Invalid conversion' type warnings.

4 years agoPerl_sv_vcatpvfn_flags: simplify wrap checking
David Mitchell [Tue, 9 May 2017 14:55:07 +0000 (15:55 +0100)]
Perl_sv_vcatpvfn_flags: simplify wrap checking

The main SvGROW() has a new-length arg roughly equivalent to

    (SvCUR(sv) + elen + zeros + esignlen + dotstrlen + 1);

Rationalise the overflow/wrap checking by doing each individual addition
separately with its own check. This is slightly redundant as some of the
values are interdependent, but this way it's easier to see whether all
possible overflows are being checked for.


4 years agoPerl_sv_vcatpvfn_flags: reduce scope of 'gap' var
David Mitchell [Tue, 9 May 2017 14:32:49 +0000 (15:32 +0100)]
Perl_sv_vcatpvfn_flags: reduce scope of 'gap' var

shouldn't make any functional difference

4 years agoPerl_sv_vcatpvfn_flags: reindent a block of code
David Mitchell [Tue, 9 May 2017 14:29:25 +0000 (15:29 +0100)]
Perl_sv_vcatpvfn_flags: reindent a block of code

(whitespace-only change)

indent a chunk of code ready for the next commit.

4 years agoPerl_sv_vcatpvfn_flags: reduce scope of 'have' var
David Mitchell [Tue, 9 May 2017 13:48:59 +0000 (14:48 +0100)]
Perl_sv_vcatpvfn_flags: reduce scope of 'have' var

Just declare this var in the small block where its needed, rather than
being in scope for 500+ lines.

Should be no functional changes.

4 years agoPerl_sv_vcatpvfn_flags: split the 'need' local var
David Mitchell [Tue, 9 May 2017 13:36:40 +0000 (14:36 +0100)]
Perl_sv_vcatpvfn_flags: split the 'need' local var

The 'need' local var has a wide scope (over 500 lines), and is used for
two separate purposes. Split it into two separate vars. One remains wide
scope, but is just used to calculate the new value of PL_efloatsize. Rename
that one to 'float_need'.

For the second use, introduce a new scope of just 6 lines with its own
'need' variable'.

This should make no functional difference but makes the code slightly
easier to understand and analyse.

4 years agosprintf(): add memory wrap tests
David Mitchell [Tue, 9 May 2017 13:29:11 +0000 (14:29 +0100)]
sprintf(): add memory wrap tests

In various places Perl_sv_vcatpvfn_flags() does croak_memory_wrap()
(including a couple added by the previous commit to fix RT #131260),
but there don't appear to be any tests for them.

So this commit adds some tests.

4 years agoFix dmake build breakage when using Visual C++
Steve Hay [Wed, 7 Jun 2017 07:39:20 +0000 (08:39 +0100)]
Fix dmake build breakage when using Visual C++

This was introduced by commit 1f664ef531. dmake with VC++ is not a common
combination, but I should have tested it :-(

4 years agoperldelta for 1097da16b21f
Tony Cook [Wed, 7 Jun 2017 05:17:44 +0000 (15:17 +1000)]
perldelta for 1097da16b21f

4 years ago[perl #131263] clear the UTF8 flag on a glob if it isn't UTF8
Tony Cook [Wed, 7 Jun 2017 05:00:26 +0000 (15:00 +1000)]
[perl #131263] clear the UTF8 flag on a glob if it isn't UTF8

Previously sv_2pv_flags() would set the UTF8 flag on a glob if it
had a UTF8 name, but wouldn't clear tha flag if it didn't.

This meant a name change, eg. if assigned another glob, from a UTF8
name to a non-UTF8 name would leave the flag set.

4 years ago[perl #131221] improve duplication of :via handles
Tony Cook [Thu, 1 Jun 2017 05:11:27 +0000 (15:11 +1000)]
[perl #131221] improve duplication of :via handles

Previously duplication (as with open ... ">&...") would fail
unless the user supplied a GETARG, which wasn't documented, and
resulted in an attempt to free and unreferened scalar if supplied.

Cloning on thread creation was simply broken.

We now handle GETARG correctly, and provide a useful default if it
returns nothing.

Cloning on thread creation now duplicates the appropriate parts of the
parent thread's handle.

4 years agoFatalize the use of code points above 0xFF for bitwise operators.
Abigail [Tue, 6 Jun 2017 23:27:47 +0000 (01:27 +0200)]
Fatalize the use of code points above 0xFF for bitwise operators.

This commit removes quite a number of tests, mostly from t/op/bop.t,
which test the behaviour of such code points in combination of
bitwise operators. Since it's now fatal, the tests are no longer useful.

4 years agoenforce size constraint via STATIC_ASSERT, not just a comment
Lukas Mai [Tue, 6 Jun 2017 23:00:58 +0000 (01:00 +0200)]
enforce size constraint via STATIC_ASSERT, not just a comment

Lukas Mai [Tue, 6 Jun 2017 22:55:34 +0000 (00:55 +0200)]

There's nothing that stops you from using it in a local scope and doing
so can be useful occasionally.

I believe this change in names is harmless because there are no direct
users of STATIC_ASSERT_GLOBAL in core or on CPAN; they all go through

4 years agoFatalize inheriting AUTOLOAD for non-methods.
Abigail [Tue, 6 Jun 2017 21:16:30 +0000 (23:16 +0200)]
Fatalize inheriting AUTOLOAD for non-methods.

This was deprecated in 5.004.

4 years agobuildtoc: explicitly accept -q (RT #131520)
Lukas Mai [Tue, 6 Jun 2017 21:01:35 +0000 (23:01 +0200)]
buildtoc: explicitly accept -q (RT #131520)

Normally the default behavior of Getopt::Long is to enable auto_abbrev,
which allows '--quiet' to be spelled as '-q', but not when

 ./perl -Ilib -I. -f pod/buildtoc -q
 Unknown option: q
 pod/buildtoc: Usage: pod/buildtoc [--quiet]
 make: *** [makefile:405: pod/perltoc.pod] Error 255

4 years agoRemove B::OP:terse
Abigail [Tue, 6 Jun 2017 18:59:59 +0000 (20:59 +0200)]
Remove B::OP:terse

This method was deprecated, and, according to the comments, didn't
work correctly anyway.

4 years agoperldelta entry for 13f4dd346e6f3b61534a20f246de3a80b3feb743
Abigail [Tue, 6 Jun 2017 18:00:04 +0000 (20:00 +0200)]
perldelta entry for 13f4dd346e6f3b61534a20f246de3a80b3feb743

4 years agoRemove diag entry about comma-less format variable list.
Abigail [Tue, 6 Jun 2017 17:50:47 +0000 (19:50 +0200)]
Remove diag entry about comma-less format variable list.

Commit c7321345b8729a0b98040be0b0b96e41f6a13ba8 removed accepting
comma-less format variables, so this entry can go.

4 years agoOut of range Unicode code point is now fatal.
Abigail [Tue, 6 Jun 2017 17:40:11 +0000 (19:40 +0200)]
Out of range Unicode code point is now fatal.

Followup on 13f4dd346e6f3b61534a20f246de3a80b3feb743. This commit patch
pod/perldiag, to change the "Use of code point 0x%s is deprecated"
deprecation message into the "Use of code point 0x%s is not allowed"
fatal error.

Adjusted the wording of the description accordingly.

4 years agoForbid out of range Unicode code points.
Abigail [Tue, 6 Jun 2017 16:51:37 +0000 (18:51 +0200)]
Forbid out of range Unicode code points.

Unicode allows code points up to 0x10FFFF, but Perl allows much more.
However, code points above IV_MAX may not always work correctly, and
may even cause the interpreter to hang. Code points exceeding IV_MAX
have been deprecated since 5.24, and will be illegal in 5.28.

This commit removes many tests (without replacing them) as they were
testing behaviour of code points exceeding IV_MAX.

4 years ago[PATCH] corelist: Provide access to info on utilities via Module::CoreList::Utils
Thomas Sibley [Tue, 6 Jun 2017 12:11:58 +0000 (13:11 +0100)]
[PATCH] corelist: Provide access to info on utilities via Module::CoreList::Utils

Signed-off-by: Chris 'BinGOs' Williams <>
4 years agoPorting/ typo in error message
David Mitchell [Mon, 5 Jun 2017 16:14:15 +0000 (17:14 +0100)]
Porting/ typo in error message

4 years agoremove -DH (DEBUG_H) misfeature
David Mitchell [Mon, 5 Jun 2017 15:45:32 +0000 (16:45 +0100)]
remove -DH (DEBUG_H) misfeature

RT# 129300

This hash-dumping debugging flag corrupted hash values and has probably
not been used by anyone in 20 years.

4 years agosv.c: move some pod blocks
David Mitchell [Mon, 5 Jun 2017 15:36:08 +0000 (16:36 +0100)]
sv.c: move some pod blocks

The S_sv_uncow() definition, and a forward declaration of it, both get
between some pod and the function that pod describes. Move the pod around
a bit to be next their functions.

4 years agomake OP_REF support boolean context
David Mitchell [Fri, 6 Jan 2017 14:59:54 +0000 (14:59 +0000)]
make OP_REF support boolean context

RT #78288

When ref() is used in a boolean context, it's not necessary to return
the name of the package which an object is blessed into; instead a simple
truth value can be returned, which is faster.

Note that it has to cope with the subtlety of an object blessed into the
class "0", which should return false.

Porting/ shows for the expression !ref($r), approximately:
    unchanged         for a non-reference $r
    doubling of speed for a reference $r
    tripling of speed for a blessed reference $r

This commit builds on the mechanism already used to set the OPpTRUEBOOL
and OPpMAYBE_TRUEBOOL flags on padhv and rv2hv ops when used in boolean

4 years agoForbid setting $/ to a reference to a non-postive integer
Dagfinn Ilmari Mannsåker [Thu, 1 Jun 2017 16:33:15 +0000 (17:33 +0100)]
Forbid setting $/ to a reference to a non-postive integer

This used to work like setting it to 'undef', but has been deprecated
since Perl 5.20.

In passing, avoid duplicate duplicate uninitialized warning by reusing
the SvIV() result already stored in 'val'.

4 years agoFix inconsistent whitespace in mg.c
Dagfinn Ilmari Mannsåker [Fri, 2 Jun 2017 09:45:32 +0000 (10:45 +0100)]
Fix inconsistent whitespace in mg.c

A handful of assignments are lacking a space on the left-hand side,
which is not consistent with the rest of the project style
(perlstyle mandates «Space around most operators»).

Also, a comment was mis-aligned.

4 years agoForbid use of bare << to mean <<""
Dagfinn Ilmari Mannsåker [Fri, 2 Jun 2017 14:47:02 +0000 (15:47 +0100)]
Forbid use of bare << to mean <<""

It has ben deprecated since perl 5.000.

4 years agoDisallow opening the same symbol as both a file and directory handle
Dagfinn Ilmari Mannsåker [Fri, 2 Jun 2017 16:30:22 +0000 (17:30 +0100)]
Disallow opening the same symbol as both a file and directory handle

This has been deprecated since Perl 5.10

4 years agoUpdate ExtUtils-Install to CPAN version 2.14
Chris 'BinGOs' Williams [Mon, 5 Jun 2017 13:13:36 +0000 (14:13 +0100)]
Update ExtUtils-Install to CPAN version 2.14



- Fix tests for when perl path contains a space


- Fix win32 check


- 'make -s' support: set $INSTALL_QUIET automatically


- Optimisations:

  * use our instead of vars
  * lazy load modules
  * make OS variables into constants
  * move some calculations out of a loop


- Removed instructions using Build.PL from README

- Load Win32API::File for _move_file_at_boot only when needed

- Allow disabling autosplit by omitting autosplit dir

4 years agoclosure.t: fix typo
David Mitchell [Mon, 5 Jun 2017 14:33:42 +0000 (15:33 +0100)]
closure.t: fix typo

4 years agoperldata.pod: clarify hash in scalar context.
David Mitchell [Mon, 5 Jun 2017 14:32:10 +0000 (15:32 +0100)]
perldata.pod: clarify hash in scalar context.

RT ##131166

4 years agoFREETMPS when leaving eval, even when void/dying
David Mitchell [Mon, 22 Aug 2016 08:50:43 +0000 (09:50 +0100)]
FREETMPS when leaving eval, even when void/dying

[ This commit was originally added as v5.25.2-77-g214949f then reverted
by v5.25.2-89-gcc040a9, since it broke Variable::Magic. That distribution
has since been fixed, so this fix can be re-applied to blead ]

When a scope is exited normally (e.g. pp_leavetry, pp_leavesub),
we do a FREETMPS only in scalar or list context; in void context
we don't bother for efficiency reasons. Similarly, when there's an
exception and we unwind to (and then pop) an EVAL context, we haven't
been bothering to FREETMPS.

The problem with this in try/eval (exiting normally or via an exception)
is that it can delay some SVs getting freed until *after* $@ has been
set. If that freeing calls a destructor which happens to set $@,
then that overwrites the "real" value of $@.

For example

    sub DESTROY { eval { die "died in DESTROY"; } }
    eval { bless []; };
    is ($@, "");

Before this commit, that test would fail because $@ is "died in DESTROY".

This commit ensures that leaving an eval/try by whatever means always
clears the tmps stack before setting $@.


For now, I haven't added a FREETMPS to the other pp_leavefoo()
void context cases, since I can't think of a case where it would

4 years agoS_require_tie_mod(): use a new stack
David Mitchell [Tue, 14 Mar 2017 09:19:15 +0000 (09:19 +0000)]
S_require_tie_mod(): use a new stack

RT #130861

This function is used to load a module associated with various magic vars,
like $[ and %+. Since it can be called 'unexpectedly', it should use a new
stack. The issue in this ticket was equivalent to

    my $var = '[';

where the symbolic dereference triggered a run-time load of,
which grew the stack, invalidating the SP in pp_rv2sv.

Note that most of the stuff which S_require_tie_mod() calls, such as
load_module(), will do its own PUSHSTACK(); but S_require_tie_mod() also
does a bit of stack manipulation itself.

The test case includes a magic number, 125, which happens to be the exact
size necessary to trigger a stack realloc in S_require_tie_mod(). In later
perl versions this value may well change. But it seemed too expensive
to call fresh_perl_is() 100's of times with different values of $n.

This commit also adds a SPAGAIN to pp_rv2sv on the 'belt and braces'

This commit is based on an earlier effort by Aaron Crane.

4 years ago[MERGE] lots of fixups
David Mitchell [Mon, 5 Jun 2017 13:33:09 +0000 (14:33 +0100)]
[MERGE] lots of fixups

As of this point,

    ./TEST -deparse op/delete.t

passes all tests (that are no on its exclude list)/

4 years agoDeparse: support delete %h{foo bar}
David Mitchell [Mon, 5 Jun 2017 13:29:51 +0000 (14:29 +0100)]
Deparse: support delete %h{foo bar}

Key/value slicing was recently extended to delete too. Make Deparse
support this.

4 years agoPorting/deparse-skips.txt: add failing tests
David Mitchell [Mon, 27 Feb 2017 08:45:08 +0000 (08:45 +0000)]
Porting/deparse-skips.txt: add failing tests

Add the 27 currently unexpected failing tests to the 'known failing' list
in deparse-skips.txt. These most likely represent newer or modified test
scripts which tickle existing Deparse issues rather than regressions in
Deparse, but I haven't examined them to check.

By adding them in, we're kind of resetting the clock - perhaps in future
we won't allow new failures to appear.

There are now 174 known failing scripts out of 2555. At the start of this
branch there were 178 known failing and 84 unexpectedly failing scripts.
In 5.24.0 there were  207 known failing and 174 unexpectedly failing scripts.

Also, re-sort the list.

The following were added to to deparse-skips.txt by this commit:


4 years agopurge Porting/deparse-skips.txt
David Mitchell [Fri, 24 Feb 2017 20:25:18 +0000 (20:25 +0000)]
purge Porting/deparse-skips.txt

Many excluded files have since been removed, and some have been
renamed. Update Porting/deparse-skips.txt accordingly.

4 years agot/TEST: warn about unknown files deparse-skips.txt
David Mitchell [Fri, 24 Feb 2017 20:15:48 +0000 (20:15 +0000)]
t/TEST: warn about unknown files deparse-skips.txt

In ./TEST -deparse, when reading Porting/deparse-skips.txt, emit a warning
for each excluded file which no longer exists.

Also, move the scope of $in to just the sub that uses it.

4 years agodeparse-skips.txt: remove cpan/File-Path/t/taint.t
David Mitchell [Fri, 24 Feb 2017 20:00:34 +0000 (20:00 +0000)]
deparse-skips.txt: remove cpan/File-Path/t/taint.t

This was fixed a few commits ago, but I forgot to mark it fixed.

4 years agodeparse-skips.txt: add Archive-Tar/t/03_file.t
David Mitchell [Fri, 24 Feb 2017 17:37:31 +0000 (17:37 +0000)]
deparse-skips.txt: add Archive-Tar/t/03_file.t

This test script uses constant anon subs, which get deparsed back
into real subs and fail; e.g.

    use strict;
    { my $x; use constant FOO => sub { $x = 1 }; }

which gets deparsed as

    use strict;
    { my $x; use constant FOO => sub { $x = 1 }; }
    sub { $x = 1 }->();

and croaks with 'Global symbol "$x" requires explicit package name'

Since the name of the constant ('FOO') has been folded away, there's
no way to correctly deparse this unless more info is saved in the op tree.

4 years agosort Porting/deparse-skips.txt
David Mitchell [Fri, 24 Feb 2017 17:35:57 +0000 (17:35 +0000)]
sort Porting/deparse-skips.txt

have core test first, then cpan/dist etc. Sort alphabetically
within each category

4 years agoDeparse: better handle BEGIN { use_ok() }
David Mitchell [Fri, 24 Feb 2017 16:11:34 +0000 (16:11 +0000)]
Deparse: better handle BEGIN { use_ok() }

Commit v5.25.3-111-g8071973 added handling for the bad deparsing of

    BEGIN { use_ok() }

Basically by stripping out the bad code text *after* it had been deparsed.
However, this didn't catch all bad cases - in particular, where #line
directives got added:

    use Socket (@{
    #line 10 "t/000_load.t"

Under TEST -deparse, this fixes the following unexpectedly failing


and fixes the following expected-to-fail script:


4 years agoDeparse my var attributes correctly
David Mitchell [Fri, 24 Feb 2017 14:32:28 +0000 (14:32 +0000)]
Deparse my var attributes correctly

Formerly this:

    my $x :foo;

deparsed as

    'attributes'->import('main', \$x, 'foo'), my $x;

it now deparses as:

    my $x :foo;

It handles all the common forms, such as

    my Foo::Bar ($s, @a, %h) :foo(foo1) bar(bar1);

but doesn't yet handle an attribute declaration that's not a statement,

    f(1, $x :foo);

Under TEST -deparse, this fixes the following unexpectedly failing


and fixes the following expected-to-fail scripts:


4 years handle BEGIN { require expr }
David Mitchell [Thu, 23 Feb 2017 14:33:05 +0000 (14:33 +0000)] handle BEGIN { require expr }

Deparse examines BEGIN subs to see if they look like

    BEGIN { require Foo; ... }

and if so deparses them as 'use Foo' instead.

However, it can't cope when Foo is an expression rather than a constant,
such as

    BEGIN {
        require($ENV{PERL_CORE} ? '../../t/' : './t/');

and crashes.

This commit makes it instead recognise such op trees as not being part of
a 'use'.

Under TEST -deparse, this fixes the following unexpectedly failing


and fixes the following expected-to-fail scripts:


4 years agoDeparse: avoid deep recursion warning
David Mitchell [Thu, 23 Feb 2017 13:41:35 +0000 (13:41 +0000)]
Deparse: avoid deep recursion warning

sub _pessimise_walk_exe() recursively walks the optree, so can easily
exceed a depth of 100.

4 years agot/TEST -deparse: list unexpectedly passing scripts
David Mitchell [Thu, 23 Feb 2017 12:52:09 +0000 (12:52 +0000)]
t/TEST -deparse: list unexpectedly passing scripts

Currently Porting/deparse-skips.txt maintains a list of test scripts
that are expected fail when run after deparsing. If a script unexpectedly
passes, its listed as a failure in the summary at the end of the run.

Make the summary include a list of unexpected passes too to make it
easier to distinguish from failures.

4 years agoDeparse: don't remove escapes for tabs in patterns
David Mitchell [Thu, 23 Feb 2017 10:53:10 +0000 (10:53 +0000)]
Deparse: don't remove escapes for tabs in patterns

In the following, the T represents a literal tab character.

/\T/ and /\T/x were being deparsed as /T/ and /T/x.
In the particular case of /\T/x that actually changed the pattern's

So don't do that: leave the backslashes alone.

This makes
    ./TEST -deparse t/re/keep_tabs.t

4 years agoDeparse: make a complex pattern readable with /x
David Mitchell [Thu, 23 Feb 2017 10:30:42 +0000 (10:30 +0000)]
Deparse: make a complex pattern readable with /x

In sub re_unback().

It shouldn't change its functionality, but just add whitespace
and comments for readability.

4 years agoDeparse: handle OP_PADRANGE in regex code blocks
David Mitchell [Wed, 22 Feb 2017 16:54:51 +0000 (16:54 +0000)]
Deparse: handle OP_PADRANGE in regex code blocks

Deparse handles the OP_PADRANGE op by overlaying the view of the optree
with the original pad ops (as if they had never been optimised into a
single OP_PADRANGE op).

However, the op treewalk to pessimise such ops wasn't walking into
the op subtrees of code blocks in patterns. So for example

    /(?{ my ($x, $y) = @a; })/

was being deparsed (with a warning) as

    /(?{ (XXX) = @a; })/

With this commit, this passes again:

 ./TEST -deparse re/pat_re_eval.t

4 years agoDeparse.t: diag full code that failed to compile
David Mitchell [Wed, 22 Feb 2017 16:53:50 +0000 (16:53 +0000)]
Deparse.t: diag full code that failed to compile

makes it easier to debug when adding new tests that it doesn't like

4 years agomake porting/cmp_version.t clearer what happens
David Mitchell [Mon, 5 Jun 2017 11:32:12 +0000 (12:32 +0100)]
make porting/cmp_version.t clearer what happens

Add some code comments, and include the version number its comparing
against in the output.

4 years agoModule-CoreList/t/maintainer.t: silence warning
David Mitchell [Mon, 5 Jun 2017 11:13:20 +0000 (12:13 +0100)]
Module-CoreList/t/maintainer.t: silence warning

../dist/Module-CoreList/t/maintainer.t .. Name
"Module::CoreList::released" used only once: possible typo

4 years agoXPUSH*: reuse code from mPUSH* macros
Eugen Konkov [Mon, 5 Jun 2017 08:07:54 +0000 (09:07 +0100)]
XPUSH*: reuse code from mPUSH* macros

4 years agoEntware released perl-5.24.1
H.Merijn Brand [Sun, 4 Jun 2017 09:16:09 +0000 (11:16 +0200)]
Entware released perl-5.24.1