This is a live mirror of the Perl 5 development currently hosted at
4 years agoAdjust porting/authors.t for travisci
Nicolas R [Mon, 13 Nov 2017 19:54:49 +0000 (13:54 -0600)]
Adjust porting/authors.t for travisci

Add plan to porting/authors.t
skip_plan was used but no plan or tap output was defined.

When the test is run by TravisCI, use a shorten
revision range. We do not want to have a pull request impacted
by the previous state of blead, and we do not want to check
the merge commit from travis which is using the github author
primary email address.

4 years agoRemove win32 logic from t/porting/authors.t
Nicolas R [Mon, 13 Nov 2017 15:34:16 +0000 (09:34 -0600)]
Remove win32 logic from t/porting/authors.t

Remove special logic for windows by using 'qx'.
Allow test to be run from main root directory.

4 years agoSwitch some core modules to XSLoader
Nicolas R [Wed, 13 Sep 2017 17:22:32 +0000 (11:22 -0600)]
Switch some core modules to XSLoader

RT 132080: Remove perl 5.006 compatibilities with DynaLoader and use
XSLoader directly.

The traditional boiler plate to use XSLoader for Perl > 5.006 or
DynaLoader, does not make sense for core modules in perl 5.28+.

4 years agoTrack Unicode-Normalize Changes file so it can be updated as it is changed in Perl
Todd Rinaldo [Mon, 13 Nov 2017 20:08:11 +0000 (14:08 -0600)]
Track Unicode-Normalize Changes file so it can be updated as it is changed in Perl

4 years agoTweak travis.yml: ccache & notifications
Nicolas R [Mon, 13 Nov 2017 19:44:10 +0000 (13:44 -0600)]
Tweak travis.yml: ccache & notifications

- builds are now using ccache
- use multiline syntax for main script
- irc notifications are now enabled and sent to #p5p-qa channel

4 years agoMakefile.SH: factorize install.html target
Nicolas R [Wed, 8 Nov 2017 17:18:51 +0000 (10:18 -0700)]
Makefile.SH: factorize install.html target

Avoid duplicate definition of and install.html
targets. We could then use in a later commit a Configure option
to disable doc installation on demand.

4 years agoUpdate Unicode-Collate to CPAN version 1.23
Chris 'BinGOs' Williams [Mon, 13 Nov 2017 13:45:36 +0000 (13:45 +0000)]
Update Unicode-Collate to CPAN version 1.23


1.23  Mon Nov 13 19:10:28 2017
    - Now UCA_Version 36 (for Unicode 10.0.0) is supported.
      * But the default UCA_Version is still 34.
    - added nushu.t in t.

1.22  Sat Nov 11 10:53:35 2017
    - internal: someone suggests using 'exists' for checking the truth of
      $collator->{mapping}{$variable} and $collator->{maxlength}{$variable},
      where $variable may stand for codepoints whose mapping is not defined;
      though such a problem was not reproduced on my environment.

4 years agoFix sentence in perlobj.pod (missing a word)
Matthew Horsfall [Mon, 13 Nov 2017 14:34:02 +0000 (09:34 -0500)]
Fix sentence in perlobj.pod (missing a word)

Reported by geospeck

4 years agolocalise $@ around source filters
Zefram [Mon, 13 Nov 2017 13:30:36 +0000 (13:30 +0000)]
localise $@ around source filters

$@ could be clobbered by source filters, screwing up the reporting of
errors in the filtered source.  Prevent this by localising $@ around
each call to a source filter.  Fixes [perl #38920].

4 years agochange OP_MULTICONCAT nargs from UV to SSize_t
David Mitchell [Mon, 13 Nov 2017 11:50:14 +0000 (11:50 +0000)]
change OP_MULTICONCAT nargs from UV to SSize_t

Change it from unsigned to unsigned since it makes the SP-adjusting code
in pp_multiconcat easier without hitting undefined behaviour (RT #132390);
and change its size from UV to SSize_t since it represents the number
of args  on the stack.

4 years agorename op_aux field from 'size' to 'ssize'
David Mitchell [Mon, 13 Nov 2017 11:03:15 +0000 (11:03 +0000)]
rename op_aux field from 'size' to 'ssize'

This part of the op_aux union was added for OP_MULTICONCAT; its actually
of type SSize_t, so rename it to ssize to better reflect that it's signed.

This should make no functional difference.

4 years agoconfigpm: fix duplicate 'our' declaration
David Mitchell [Mon, 13 Nov 2017 09:18:07 +0000 (09:18 +0000)]
configpm: fix duplicate 'our' declaration

This file of old incorrectly had both

    use vars '$Config_SH_expanded';


    our $Config_SH_expanded;

lines. After a recent commit which did s/use vars/our/g, the duplicate
'our' declaration started warning.

4 years agoDo not (attempt to) install man pages when explicitly disabled
H.Merijn Brand [Mon, 13 Nov 2017 08:03:40 +0000 (09:03 +0100)]
Do not (attempt to) install man pages when explicitly disabled

Configure … -Dman1dir=none -Dman3dir=none …


4 years agoavoid redundant initialisation around Newxz()
Zefram [Mon, 13 Nov 2017 07:52:35 +0000 (07:52 +0000)]
avoid redundant initialisation around Newxz()

Reduce Newxz() to Newx() where all relevant parts of the memory are
being explicitly initialised, and don't explicitly zero memory that was
already zeroed.  [perl #36078]

4 years agoremove unused struct member "is_top_frame"
Zefram [Mon, 13 Nov 2017 07:49:13 +0000 (07:49 +0000)]
remove unused struct member "is_top_frame"

4 years agoduplicate full index for SAVEt_AELEM
Zefram [Mon, 13 Nov 2017 07:45:35 +0000 (07:45 +0000)]
duplicate full index for SAVEt_AELEM

The index in a SAVEt_AELEM save entry is now IV-sized, but only an I32
portion of it was being duplicated.  This would lead to restoring the
wrong element if a pseudfork were done with a localised array element
on the stack, if the array index were above the 32-bit range or on a
big-endian architecture.

4 years agofix sysconf panic
Zefram [Mon, 13 Nov 2017 01:07:00 +0000 (01:07 +0000)]
fix sysconf panic

If sysconf() failed to provide the page size, there was an attempt to
panic with an error message.  But rather than generate an error message
from errno, the code would attempt to read it from ERRSV.  Not only had
nothing put the error message into ERRSV, but the glob behind ERRSV
didn't even exist yet, so attempting to evaluate ERRSV would segv.
Change this to use Strerror() and never touch ERRSV.  [perl #115880]

4 years agoMerge branch 'smoke-me/jkeenan/afresh/132401-file-copy' into blead
James E Keenan [Sun, 12 Nov 2017 23:10:28 +0000 (18:10 -0500)]
Merge branch 'smoke-me/jkeenan/afresh/132401-file-copy' into blead

4 years agoFix sprintf multiconcat on 32bit big-endian systems with use64bitint
Dagfinn Ilmari Mannsåker [Wed, 8 Nov 2017 20:25:56 +0000 (20:25 +0000)]
Fix sprintf multiconcat on 32bit big-endian systems with use64bitint

The sprintf offset calculation was assigning to the 'uv' field of the
aux union, while the code was reading from the 'size' field, which leads
to all zeroes when sizeof(uv) > sizeof(size_t) on a big-endian system.

4 years agobetter document macros taking literal strings
Zefram [Sun, 12 Nov 2017 05:58:36 +0000 (05:58 +0000)]
better document macros taking literal strings

When giving a function-style prototype for a macro taking a literal string
parameter, put a string literal in place of a type for that parameter.
This goofy appearance makes it obvious that this isn't really a function,
and clues the reader in that the parameter can't actually be an arbitrary
expression of the right type.  Also change the nonsensical "NUL-terminated
literal string" to "literal string" to describe these parameters.
Fixes [perl #116286].

4 years agodocument IO::Select error detection
Zefram [Sun, 12 Nov 2017 04:16:13 +0000 (04:16 +0000)]
document IO::Select error detection

4 years agoprevent invalid memory access in S_check_uni (RT #132433)
Lukas Mai [Sun, 12 Nov 2017 01:58:32 +0000 (02:58 +0100)]
prevent invalid memory access in S_check_uni (RT #132433)

4 years agofix do dir returning no $!
Daniel Dragan [Sun, 16 Aug 2015 08:30:23 +0000 (04:30 -0400)]
fix do dir returning no $!

do()ing a directory was returning false/empty string in $!, which isn't
an error, yet documentation says $! should have the error code in it.
Fix this by returning EISDIR for dirs, and EINVAL for block devices.
[perl #125774]

Remove "errno = 0" and comment added in b2da7ead68, since now there is no
scenario where errno is uninitialized, since the dir and block device
failure branches now set errno, where previously they didn't.

4 years agoavoid reading errno twice in a row
Zefram [Sat, 11 Nov 2017 23:58:32 +0000 (23:58 +0000)]
avoid reading errno twice in a row

Reading errno can involve calling a function and indirecting through
its result, so cache the value of errno where possible.  [perl #122096]

4 years agosuppress clang warning in inode number handling
Zefram [Sat, 11 Nov 2017 23:21:48 +0000 (23:21 +0000)]
suppress clang warning in inode number handling

The gcc warning was already suppressed, but clang needs a different

4 years agoteach about PL_keyword_plugin_mutex
Lukas Mai [Sat, 11 Nov 2017 17:18:14 +0000 (18:18 +0100)]
teach about PL_keyword_plugin_mutex

This fixes t/porting/globvar.t.

4 years agoperldelta for reënabling of CV optimization
Father Chrysostomos [Fri, 10 Nov 2017 21:57:33 +0000 (13:57 -0800)]
perldelta for reënabling of CV optimization

4 years agoRevert "Temporarily revert CV-in-stash optimisation"
Father Chrysostomos [Sun, 29 Oct 2017 18:21:45 +0000 (11:21 -0700)]
Revert "Temporarily revert CV-in-stash optimisation"

This reverts commit 6eed25e2537643b77650cb3e4514ec9dc2e97d74.

4 years agoRevert "Simplify _MEM_WRAP_NEEDS_RUNTIME_CHECK()"
Lukas Mai [Sat, 11 Nov 2017 12:35:13 +0000 (13:35 +0100)]

This reverts commit 004073bac990d90244eb463f435c52d4040b36df.

4 years agofix MEM_SIZE_MAX definition
Lukas Mai [Sat, 11 Nov 2017 12:34:20 +0000 (13:34 +0100)]
fix MEM_SIZE_MAX definition

4 years agoperldelta entry for perlguts revision
Zefram [Sat, 11 Nov 2017 12:44:49 +0000 (12:44 +0000)]
perldelta entry for perlguts revision

4 years agobetter documentation of reference counts
Zefram [Sat, 11 Nov 2017 12:20:40 +0000 (12:20 +0000)]
better documentation of reference counts

4 years agoMerge wrap_keyword_plugin() into blead
Lukas Mai [Sat, 11 Nov 2017 10:19:05 +0000 (11:19 +0100)]
Merge wrap_keyword_plugin() into blead

4 years agoperldelta entry for wrap_keyword_plugin origin/smoke-me/mauke/keyword-plugin-mutex
Lukas Mai [Thu, 9 Nov 2017 00:19:58 +0000 (01:19 +0100)]
perldelta entry for wrap_keyword_plugin

4 years agotest wrap_keyword_plugin (RT #132413)
Lukas Mai [Thu, 9 Nov 2017 00:00:23 +0000 (01:00 +0100)]
test wrap_keyword_plugin (RT #132413)

4 years agoadd wrap_keyword_plugin function (RT #132413)
Lukas Mai [Wed, 8 Nov 2017 23:59:53 +0000 (00:59 +0100)]
add wrap_keyword_plugin function (RT #132413)

4 years agoavoid runtime module loading in File::Spec
Zefram [Sat, 11 Nov 2017 10:05:53 +0000 (10:05 +0000)]
avoid runtime module loading in File::Spec

Incidentally remove the ->_cwd method from the subclassing interface of
File::Spec::Unix, in favour of direct calls to Cwd::getcwd().

4 years agoreturn inode numbers as strings where necessary
Zefram [Sat, 11 Nov 2017 07:40:20 +0000 (07:40 +0000)]
return inode numbers as strings where necessary

We previously used a lossy conversion of inode numbers to floating point,
where they're too big to fit the IV/UV format.  That sucks; a rounded
inode number is nearly useless.  Instead, fall back to returning a
string of decimal digits.  That preserves the entire value, for code
that looks at it in the right way, and collapses to the former fallback
in other situations.

4 years ago[MERGE] Remove unnecessary use of 'use vars'
Todd Rinaldo [Sat, 11 Nov 2017 07:08:34 +0000 (01:08 -0600)]
[MERGE] Remove unnecessary use of 'use vars'

4 years agoDocument the removal of use vars from sources
Todd Rinaldo [Sat, 11 Nov 2017 07:03:26 +0000 (01:03 -0600)]
Document the removal of use vars from sources

4 years agoReplace multiple 'use vars' by 'our' in regen.
Nicolas R [Wed, 13 Sep 2017 22:52:16 +0000 (16:52 -0600)]
Replace multiple 'use vars' by 'our' in regen.

then run ./ to update perly files

4 years agoReplace multiple 'use vars' by 'our' in t
Todd Rinaldo [Sat, 11 Nov 2017 06:42:36 +0000 (00:42 -0600)]
Replace multiple 'use vars' by 'our' in t

4 years agoReplace multiple 'use vars' by 'our' in utils
Nicolas R [Tue, 12 Sep 2017 19:20:25 +0000 (13:20 -0600)]
Replace multiple 'use vars' by 'our' in utils

Using vars pragma is discouraged and has been superseded by 'our' declarations
available in Perl v5.6.0 or later.

4 years agoReplace multiple 'use vars' by 'our' in ext
Nicolas R [Tue, 12 Sep 2017 19:20:25 +0000 (13:20 -0600)]
Replace multiple 'use vars' by 'our' in ext

Using vars pragma is discouraged and has been superseded by 'our' declarations
available in Perl v5.6.0 or later.

This commit is about replacing the usage of 'vars' pragma
by 'our' in 'ext' directory.

4 years agoReplace multiple 'use vars' by 'our' in lib
Nicolas R [Tue, 12 Sep 2017 19:20:25 +0000 (13:20 -0600)]
Replace multiple 'use vars' by 'our' in lib

Using vars pragma is discouraged and has been superseded by 'our' declarations
available in Perl v5.6.0 or later.

This commit is about replacing the usage of 'vars' pragma
by 'our' in 'lib' directory.

4 years agoReplace multiple 'use vars' by 'our' in dist
Nicolas R [Tue, 12 Sep 2017 19:20:25 +0000 (13:20 -0600)]
Replace multiple 'use vars' by 'our' in dist

Using vars pragma is discouraged and has been superseded
by 'our' declarations available in Perl v5.6.0 or later.

Additionally using 'vars' pragma increase the memory consumption of a
program by about 700 kB for no good reason.

This commit is about replacing the usage of 'vars' pragma
by 'our' in blead where it makes sense. ( leaving 'cpan' directory
outside of the scope )

-- using vars
perl -e 'use vars qw(@ISA $AUTOLOAD $VERSION); print qx{grep RSS /proc/$$/status} '
VmRSS:        2588 kB

-- using our instead
perl -e 'our (@ISA, $AUTOLOAD, $VERSION); print qx{grep RSS /proc/$$/status} '
VmRSS:        1864 kB

4 years agolocale.c: Simplify code in Perl_langinfo()
Karl Williamson [Fri, 10 Nov 2017 02:23:13 +0000 (19:23 -0700)]
locale.c: Simplify code in Perl_langinfo()

Instead of a switch() statement we can use 'foo ? bar : baz;'

4 years agostore AV iterator as mg_len in more cases
Zefram [Sat, 11 Nov 2017 04:06:59 +0000 (04:06 +0000)]
store AV iterator as mg_len in more cases

The iterator of an AV is an IV value attached to the AV via magic.
It may be stored in the space used by mg_len, or it may be stored in
separately allocated space referenced by mg_ptr.  The former is more
efficient, so should be preferred.  The original code for AV iterators
would use mg_len if IV was (the same size as) I32, because mg_len was of
type I32.  Since then mg_len has been increased to type SSize_t, but the
conditional about how AV iterators are stored wasn't updated to match.
As a result, on the now very common 64-bit builds we were missing out on
the opportunity to use the more efficient form of storage.  This commit
updates the condition about how AV iterators are stored, to take account
of the new type.

In principle AV iterators ought to be of type SSize_t, and thus *always*
storable as mg_len.  But Perl_av_iter_p() is in the public API with
its IV* return type, so there is a compatibility issue to address in
changing that.

4 years agoAdd support for --help and --version in perlbug
Todd Rinaldo [Fri, 10 Nov 2017 17:13:09 +0000 (11:13 -0600)]
Add support for --help and --version in perlbug

RT 130032: Thanks to Houston Perl Mongers for contributing to this work at
our monthly meeting!


4 years agoPACKAGING: add patchlevel.h doc entry
Nicolas R [Fri, 10 Nov 2017 20:25:12 +0000 (13:25 -0700)]
PACKAGING: add patchlevel.h doc entry

4 years ago.gitignore: git should also ignore *.bak files
Nicolas R [Fri, 10 Nov 2017 20:27:39 +0000 (13:27 -0700)]
.gitignore: git should also ignore *.bak files

4 years agoHandle Linux containers' use of 0 for PPID with orphaned procs in t/op/getppid.t
Slaven Rezic [Thu, 9 Nov 2017 22:05:00 +0000 (16:05 -0600)]
Handle Linux containers' use of 0 for PPID with orphaned procs in t/op/getppid.t

Bug 130143: Travis-ci has moved to using docker for their testing environments.
However a Docker environment has multiple process trees so therefore orphaned
processes often get a Parent PID of 0 not 1. The previous unit test for this
considered 0 to be a failure. There is now special code to handle this exception
in the unit test for getppid.

4 years agoAdjust travis.yaml configuration for blead merges.
Nicolas R [Thu, 9 Nov 2017 16:46:43 +0000 (09:46 -0700)]
Adjust travis.yaml configuration for blead merges.

- Unset PERL_BUILD_PACKAGING during builds
- Set JOBS to indicate how parallel we want builds to be (4)
- Assure tags are fetched to allow t/porting/cmp_version.t to build.

4 years agoexperimental::lexical_topic is no longer a warning category, it's a fatal compile...
David Cantrell [Fri, 10 Nov 2017 13:06:00 +0000 (13:06 +0000)]
experimental::lexical_topic is no longer a warning category, it's a fatal compile-time error

4 years agoMake VMS::Stdio declare PERL_EXT.
Craig A. Berry [Fri, 10 Nov 2017 13:58:31 +0000 (07:58 -0600)]
Make VMS::Stdio declare PERL_EXT.

We haven't been able to compile this extension since f55ac4a45513
because strBEGINs is not in the API and until now it has not
depended on anything not in the API.  So declare the fact that
it's a core extension and can use core-only macros.

4 years agoUpdate Unicode-Collate to CPAN version 1.21
Chris 'BinGOs' Williams [Fri, 10 Nov 2017 09:34:40 +0000 (09:34 +0000)]
Update Unicode-Collate to CPAN version 1.21


1.21  Sat Nov  4 10:49:19 2017
    - mklocale: [ #121664] . removed from @INC (take 2)
    - DUCET is updated (for Unicode 9.0.0) as Collate/allkeys.txt.
      * Please notice that allkeys.txt will be overwritten if you have had
        other allkeys.txt already.
    - The default UCA_Version is 34.
    - added tangut.t in t.
    - Locale/*.pl and CJK/ are updated.

1.20  Fri Nov  3 11:50:21 2017
    - XS: [ #121664] . removed from @INC
    - U::C::Locale newly supports locales: dsb, lkt.

4 years agoparse yada-yada only as a statement
Zefram [Fri, 10 Nov 2017 02:07:46 +0000 (02:07 +0000)]
parse yada-yada only as a statement

Commit f5727a1c71878a34f6255eb1a506c0b21af7d36f tried to make yada-yada
be parsed consistently as a term expression, but actually things are
more complicated than that.  The tokeniser didn't accept yada-yada in
the right contexts to make it usable as an expression, and changing
that would require decisions on resolving ambiguities between yada-yada
and flip-flop.  It's also documented as being a statement rather than
an expression, though with some incorrect information about ambiguities.

Overall it looks more like the intent was for yada-yada to be a statement.
This commit makes it grammatically treated as such, and also fixes up
the dubious parts of the documentation.  [perl #132150]

4 years agosv.c: Fix typo in comment
Karl Williamson [Fri, 10 Nov 2017 01:46:17 +0000 (18:46 -0700)]
sv.c: Fix typo in comment

4 years agomalloc.c: Fix typo in comment
Karl Williamson [Fri, 10 Nov 2017 01:38:02 +0000 (18:38 -0700)]
malloc.c: Fix typo in comment

4 years agolib/locale.t: Clarify test name
Karl Williamson [Fri, 10 Nov 2017 01:37:30 +0000 (18:37 -0700)]
lib/locale.t: Clarify test name

4 years agohandy.h: Clarify comment
Karl Williamson [Fri, 10 Nov 2017 01:26:43 +0000 (18:26 -0700)]
handy.h: Clarify comment

4 years agolocale.c: strerror_l() not fool proof
Karl Williamson [Tue, 12 Sep 2017 00:57:54 +0000 (18:57 -0600)]
locale.c: strerror_l() not fool proof

Commit 7aaa36b196e5a478a3d1bd32506797db7cebf0b2 changed to use
strerror_l() if available on the platform.  But there is a potential bug
with this on threaded perls.  The code uses strerror_l() when it needs
the answer on a locale that isn't necessarily the current one.  But it
uses plain strerror() when the locale is known to be the current one.
Plain strerror() isn't necessarily thread-safe.  However, on systems
that have strerror_r(), reentr.h has caused our apparent call to plain
strerror() to instead call the thread-safe strerror_r() under the hood.
So there is no bug on unthreaded perls nor on ones that have

This commit fixes the bug on threaded builds which have strerror_l() but
not strerror_r().  It does this by using strerror_l() for everything,
and constructing a locale object that is the current locale to use when
the locale doesn't need to be changed.  This is somewhat more work than
the alternative above does, so that one is used if available.

No changes are made to how it works on systems that don't have

Some systems have deprecated strerror_r().  reentr.h does not use it on
such systems.  The reason for the deprecation, we would hope, may be
that the plain strerror() is implemented thread-safely.  We don't know
that, so we just assume that the plain version is thread-unsafe.

We do have tests that try to find races here, but they haven't shown
any.  It could be that systems that are advanced enough to have
strerror_l() also have strerror_r().

4 years agolocale.c: Move a #define to earlier in the file
Karl Williamson [Thu, 14 Sep 2017 03:05:20 +0000 (21:05 -0600)]
locale.c: Move a #define to earlier in the file

This is in prep for a future commit which needs it earlier

4 years agolocale.c: Add #define's
Karl Williamson [Mon, 11 Sep 2017 17:05:56 +0000 (11:05 -0600)]
locale.c: Add #define's

The previous commit added arrays of locale categories.  This commit
creates compile-time mappings from the category number to the index it
has in the array.  It also changes to use the #define for the index of
LC_ALL in places it is expected to be defined.  This causes bugs in this
logic to be found at compile time on systems that don't have LC_ALL.

4 years agolocale.c: Remove many #if conditionals
Karl Williamson [Tue, 25 Jul 2017 20:23:33 +0000 (14:23 -0600)]
locale.c: Remove many #if conditionals

locale.c is full of compiler conditionals because platforms vary widely
(or have in the past) in what categories they use.  Prior to this
commit, there were many sections of code which had copies of the same
constructs which were #ifdef'd so they'd run only on the categories that
are to be used in this build.

This duplication creates the opportunity for changes to get applied to
only some of the places that they should, and also makes it hard to

This commit adds two parallel arrays that can map a category to/from its
name, and are defined with each element conditionally compiled in based
on the needs of the build.  Doing the conditionals during array
construction means that most of the other conditionals can be replaced
by looping through the arrays.  Thus the duplicated code is eliminated,
as well as almost 200 lines in this file.

Most of these loops get executed only at process initialization, so the
slight performance hit is inconsequential.

4 years agoRevert "perl.h: Use STMT_START { ... } STMT_END"
Lukas Mai [Thu, 9 Nov 2017 13:34:00 +0000 (14:34 +0100)]
Revert "perl.h: Use STMT_START { ... } STMT_END"

This reverts commit 11b2cef65dac01e8723c9a6f6e640665cb752a2c.

DECLARE_STORE_LC_NUMERIC_SET_TO_NEEDED seems to be unused, but the
previous commit made it a syntax error (unmatched '{').

It also doesn't make sense to wrap what is supposed to be a declaration
in a { } block.

4 years agoFix missing close brace before STMT_END
Dagfinn Ilmari Mannsåker [Thu, 9 Nov 2017 13:22:40 +0000 (13:22 +0000)]
Fix missing close brace before STMT_END

The macro isn't actually used anywhere (in core or on CPAN)

4 years agolocale.c: Avoid potential read beyond buffer end
Karl Williamson [Mon, 11 Sep 2017 23:24:00 +0000 (17:24 -0600)]
locale.c: Avoid potential read beyond buffer end

I noticed this flaw by code reading; I doubt that it's exploitable.
foldEQ assumes that both operands are at least as long as its length
parameter.  In this case, it's possible that the codeset returned by
nl_langinfo is shorter than 5, in which case, it would try to access the
extra characters in the heap.  Real codesets tend to be longer than
this, so an attacker would likely have to install a locale with a
made-up codeset whose name is shorter.

Even the C locale is longer: "ANSI_X3.4-1968"

4 years agolocale.c: Clarify some debug statements
Karl Williamson [Wed, 13 Sep 2017 22:03:53 +0000 (16:03 -0600)]
locale.c: Clarify some debug statements

4 years agolocale.c: Slight refactor
Karl Williamson [Tue, 12 Sep 2017 00:56:49 +0000 (18:56 -0600)]
locale.c: Slight refactor

This makes savepv() part of the expressions instead of a separate

4 years agolocale.c: Use REPLACEMENT_CHARACTER as a test
Karl Williamson [Mon, 11 Sep 2017 23:41:57 +0000 (17:41 -0600)]
locale.c: Use REPLACEMENT_CHARACTER as a test

This is trying to determine if the locale is UTF-8.  The easiest way to
tell is if the codeset returned by nl_langinfo says UTF-8, but if that
fails or nl_langinfo() is not present on the system, a fallback method
is to use the libc routines to convert a known byte string to code point
and see if that matches the expected Unicode code point.  Prior to this
patch, the byte string representing HYPHEN was used.  That's probably
good enough, but we can do better with no extra work.  This commit
changes to use the REPLACEMENT CHARACTER instead.  That is a Unicode
concept.  The chances of a non-UTF-8 locale taking the UTF-8 byte string
for the REPLACEMENT and evaluating to REPLACEMENT are vanishingly small.

4 years agolocale.c: Avoid extra call to mbtowc()
Karl Williamson [Mon, 11 Sep 2017 23:32:42 +0000 (17:32 -0600)]
locale.c: Avoid extra call to mbtowc()

This is done only when debugging, but in some locales that have shift
states, the extra call could blow up.  Instead save the result of the
mbtowc() call we care about.

4 years agolocale.c: Add macro
Karl Williamson [Mon, 11 Sep 2017 23:19:05 +0000 (17:19 -0600)]
locale.c: Add macro

This adds STRLENs() where the argument must be a literal string

This may deserve wider applicability, but in case it doesn't, I'm making
it local to just this file.

4 years agolocale.c: Rmv extraneous detail from comment
Karl Williamson [Mon, 11 Sep 2017 22:10:42 +0000 (16:10 -0600)]
locale.c: Rmv extraneous detail from comment

This comment contains a list of code points that are unusual, but it
also included ones that are standard, which made me keep looking to see
why they were unusual, each time realizing in the end that they were

4 years agoembed.fnc: Change fcn from A to X
Karl Williamson [Mon, 28 Aug 2017 23:51:06 +0000 (17:51 -0600)]
embed.fnc: Change fcn from A to X

This function is marked as accessible anywhere, but experimental, and
so is changeable at any time without notice, and its name begins with an
underscore to indicate its private nature.  I didn't know at the time I
wrote it that we have an existing mechanism to deal with functions whose
only use should be a public macro.  This changes to use that mechanism.

4 years agoChange name of internal function
Karl Williamson [Mon, 28 Aug 2017 23:43:29 +0000 (17:43 -0600)]
Change name of internal function

Following on the previous commit, this changes the name of the function
that changes the variable to be in sync with it.

4 years agoChange name of locale per-interpreter variable
Karl Williamson [Mon, 28 Aug 2017 23:21:09 +0000 (17:21 -0600)]
Change name of locale per-interpreter variable

The real purpose of this internal variable is to give the name of the
locale that is the underlying one for the C program.  Various macros
already indicate that.  This furthers the process.

4 years agoPOSIX.xs is PERL_EXT
Karl Williamson [Thu, 9 Nov 2017 03:31:50 +0000 (20:31 -0700)]

Specifying so automatically gets the reentrant versions of various libc
functions in threaded perls, lowering race condition odds.

4 years agoBump version of B/t/OptreeCheck to 0.16
Karl Williamson [Thu, 9 Nov 2017 03:18:10 +0000 (20:18 -0700)]
Bump version of B/t/OptreeCheck to 0.16

4 years agoBump version of B/ to 1.03
Karl Williamson [Thu, 9 Nov 2017 03:16:34 +0000 (20:16 -0700)]
Bump version of B/ to 1.03

4 years agoperl.h: Use STMT_START { ... } STMT_END
Karl Williamson [Mon, 28 Aug 2017 23:16:27 +0000 (17:16 -0600)]
perl.h: Use STMT_START { ... } STMT_END

This should be used in macros that have statements.

4 years agoperl.h: White-space only
Karl Williamson [Mon, 28 Aug 2017 23:11:29 +0000 (17:11 -0600)]
perl.h: White-space only

Indent some nested #defines, remove an extra empty line

4 years agotoke.c: Add comment
Karl Williamson [Thu, 10 Aug 2017 22:03:16 +0000 (16:03 -0600)]
toke.c: Add comment

4 years agoDest buffer needs to be bigger for utf16_to_utf8()
Karl Williamson [Thu, 10 Aug 2017 21:52:35 +0000 (15:52 -0600)]
Dest buffer needs to be bigger for utf16_to_utf8()

These undocumented functions require the destination buffer to have the
worst case size.  However that size (previously listed as 3/2 * input)
is wrong for EBCDIC.  Correct the comments, and the single use of these
in core.

These functions do not have a way to avoid overflowing, which strikes me
as wrong.

4 years ago_byte_dump_string(): Don't output leading space
Karl Williamson [Thu, 10 Aug 2017 20:33:40 +0000 (14:33 -0600)]
_byte_dump_string(): Don't output leading space

This changes this function to not put an initial space character in the
returned string.

4 years agoPOSIX.xs: Move constant tests out of loop
Karl Williamson [Fri, 11 Aug 2017 03:39:06 +0000 (21:39 -0600)]
POSIX.xs: Move constant tests out of loop

Whether or not a locale is in UTF-8 doesn't change in this loop;
calculate it once, prior to the loop

4 years agonumeric.c: Refactor #if #else in Perl_my_aotf
Karl Williamson [Tue, 1 Aug 2017 18:41:12 +0000 (12:41 -0600)]
numeric.c: Refactor #if #else in Perl_my_aotf

This simplifies things, eliminating nested #if's

4 years agonumeric.c: Rename some variables
Karl Williamson [Tue, 1 Aug 2017 18:38:09 +0000 (12:38 -0600)]
numeric.c: Rename some variables

The new names are clearer.

4 years agoPerl_locale(): Refactor for clarity
Karl Williamson [Mon, 24 Jul 2017 04:08:50 +0000 (22:08 -0600)]
Perl_locale(): Refactor for clarity

This code is full of 'if's interrupted by #ifdefs, which makes it hard
to read.  Changing it to a switch() makes it much easier to understand.

4 years agolocale.c:sync_locale(): Add debugging info
Karl Williamson [Mon, 24 Jul 2017 03:53:28 +0000 (21:53 -0600)]
locale.c:sync_locale(): Add debugging info

4 years agolocale.c:sync_locale(): Rmv useless call
Karl Williamson [Mon, 24 Jul 2017 03:39:46 +0000 (21:39 -0600)]
locale.c:sync_locale(): Rmv useless call

This was changing to use the locale's radix, but this is unnecessary for
the later things in this function, and those change things to use dot,
so this call is useless.

4 years agolocale.c: Use new nl_langinfo equivalent
Karl Williamson [Thu, 14 Sep 2017 19:32:58 +0000 (13:32 -0600)]
locale.c: Use new nl_langinfo equivalent

This converts the final plain nl_langinfo() function call in locale.c to
use the new equivalent that is more thread safe, and you don't have to
free the returned memory.  There was an unlikely leak before this, if
the return was somehow "".

4 years agolocale.c: Rmv erroneous complement operator
Karl Williamson [Thu, 14 Sep 2017 03:17:28 +0000 (21:17 -0600)]
locale.c: Rmv erroneous complement operator

The extra '!' that snuck in there caused this code to not work properly.
Fortunately, it doesn't get used except as a last resort, and that
apparently hasn't happened so as to have gotten reported from the field.
A test can't be added because it would only occur on a system that had
bad locales.

4 years agolocale.c: Refactor locale macros
Karl Williamson [Thu, 14 Sep 2017 18:44:40 +0000 (12:44 -0600)]
locale.c: Refactor locale macros

This standardizes things to make things easier to understand and prepare
for future commits

4 years agolocale.c: Convert setlocale() calls to macros
Karl Williamson [Fri, 21 Jul 2017 01:16:55 +0000 (19:16 -0600)]
locale.c: Convert setlocale() calls to macros

This will be useful in future commits

4 years agolocale.c: Change static fcn name
Karl Williamson [Wed, 19 Jul 2017 17:34:08 +0000 (11:34 -0600)]
locale.c: Change static fcn name

The new name more closely reflects what it does

4 years agolocale.c: Refactor static fcn to save work
Karl Williamson [Thu, 20 Jul 2017 22:20:01 +0000 (16:20 -0600)]
locale.c: Refactor static fcn to save work

This adds a parameter to the function that sets the radix character for
floating point numbers.  We know that the radix by default is a dot, so
no need to calculate it in that case.

This code was previously using localeconv() to find the locale's decimal
point.  The just added my_nl_langinfo() fcn does the same with an easier
API, and is more thread safe, and automatically switches to use
localeconv() when n nl_langinfo() isn't available, so revise the
conditional compilation directives that previously were necessary, and
collapse directives that were unnecessarily nested.

And adjust indentation

4 years agolocale.c: Create extended internal Perl_langinfo()
Karl Williamson [Tue, 12 Sep 2017 01:12:56 +0000 (19:12 -0600)]
locale.c: Create extended internal Perl_langinfo()

This extended version allows it to be called so that it uses the current
locale for the LC_NUMERIC, instead of toggling to the underlying one.
(This can be useful when in the middle of things.)

This ability won't be used until the next commit

4 years agolocale.c: Rmv redundant fcn call
Karl Williamson [Thu, 20 Jul 2017 22:24:42 +0000 (16:24 -0600)]
locale.c: Rmv redundant fcn call

This function is called as part of the call made in the line before.  No
need to do it twice.

4 years agolocale.c: White-space, comment, rearrange some #else
Karl Williamson [Sun, 16 Jul 2017 00:19:48 +0000 (18:19 -0600)]
locale.c: White-space, comment, rearrange some #else

This file is full of conditional compilation, due to the fact that
locale support has been highly variable in the OSes Perl has operated
on.  This commit properly indents nested compiler directives, and makes
sure there is a blank line between the directives and real code.  I find
that much easier to read.  It also re-orders some

    #ifdef some_feature
        Many lines of code handling feature
        1 to 3 lines of trivial code to avoid compilation warnings


    #ifndef some_feature
        1 to 3 lines of trivial code to avoid compilation warnings
        Many lines of code handling feature

Otherwise the trivial code may be hundreds of lines from the original
'#if', which makes it hard to grok.

This commit also clarifies and fixes typos in comments, and removes some
obsolete comments.