2 weeks agoregcomp.c: Move #define, make a function always compiled smoke-me/khw-5.21
Karl Williamson [Mon, 6 Oct 2014 22:17:58 +0000]
regcomp.c: Move #define, make a function always compiled

This is in preparation for the next commit.  The function previously was
used only in DEBUGGING builds

2 weeks agoFix EBCDIC-only bug with /[...]/
Karl Williamson [Mon, 6 Oct 2014 22:13:31 +0000]
Fix EBCDIC-only bug with /[...]/

Perl has special handling with ranges in bracketed character classes
when the end points are either both uppercase or both lowercase.  This
used a different test which is incorrect.  The consequences were that a
some Latin1 ranges would be rendered as empty.

2 weeks agoregcomp.c: Fix EBCDIC-only memory leak
Karl Williamson [Mon, 6 Oct 2014 20:55:38 +0000]
regcomp.c: Fix EBCDIC-only memory leak

2 weeks agoregcomp.c: Fix typo in comment
Karl Williamson [Mon, 6 Oct 2014 20:55:00 +0000]
regcomp.c: Fix typo in comment

2 weeks agoAdd restrictions on ranges in (?[...])
Karl Williamson [Fri, 3 Oct 2014 04:51:43 +0000]
Add restrictions on ranges in (?[...])

The experimental feature (?[...]) has more error checking for bracketed
character classes within it than normal ones.  This adds further checks,
forbidding ranges that start or end with an ASCII printable, unless the
range is some subrange of [A-Z], [a-z], or [0-9].  These are the only
ranges that are portable as-is to EBCDIC platforms, and whose meaning is
immediately obvious to non-super-geeks.

2 weeks agoDocument special EBCDIC [...] literal range handling
Karl Williamson [Mon, 6 Oct 2014 18:14:36 +0000]
Document special EBCDIC [...] literal range handling

2 weeks ago\N{...} now treated as literal for EBCDIC qr/[...]/
Karl Williamson [Mon, 6 Oct 2014 18:02:25 +0000]
\N{...} now treated as literal for EBCDIC qr/[...]/

Perl specially handles some ranges in bracketed character classes to
deal with gaps between, for example, "i" and "j".  The next commit will
better document this.  This special handling is only invoked when both
ends of the range are literals.  This commit extends that so that a
\N{...} construct is considered a literal for this purpose.

There really shouldn't be any difference in the handling of "A" vs
"\N{LATIN CAPITAL LETTER A}".  And this commit makes them be handled the
same.

It further makes \N{U+0041} be treated the same.  The programmer here is
effectively saying "A", and invoking the Unicode definition for it, so
it stands to reason that the range s/he wants should also be interpreted
the Unicode way.

2 weeks agore/pat.t: Add some EBCDIC tests
Karl Williamson [Mon, 6 Oct 2014 17:49:00 +0000]
re/pat.t: Add some EBCDIC tests

These test the special handling of ranges in bracketed character classes
where the endpoints are alphanumeric literals, but there is a code point
gap in the range that would otherwise match but shouldn't.

2 weeks agotoke.c: Extract into a named string constant
Karl Williamson [Sat, 4 Oct 2014 17:13:45 +0000]
toke.c: Extract into a named string constant

This moves a literal double-quoted string into a const variable, so that
it only need be written out once, and its  size can be compiler-computed
and used as another const variable.  Hence, mnemonics are used instead
of bare numbers.

2 weeks agotoke.c: Update, clarify comments, fix some indents
Karl Williamson [Sat, 4 Oct 2014 16:09:46 +0000]
toke.c: Update, clarify comments, fix some indents

2 weeks agoreg_mesg.t: Add comments; remove trailing white-space
Karl Williamson [Fri, 3 Oct 2014 04:46:31 +0000]
reg_mesg.t: Add comments; remove trailing white-space

2 weeks agoperlapi: Clarify two entries
Karl Williamson [Thu, 2 Oct 2014 03:00:28 +0000]
perlapi: Clarify two entries

2 weeks agoXXXcharbits
Karl Williamson [Thu, 28 Aug 2014 19:59:01 +0000]
XXXcharbits

2 weeks agoXXX partial perlapi text
Karl Williamson [Wed, 18 Jun 2014 00:49:53 +0000]
XXX partial perlapi text

2 weeks agoXXX Don't push. attempt to tell tries everything at compile time
Karl Williamson [Sun, 18 May 2014 01:37:06 +0000]
XXX Don't push. attempt to tell tries everything at compile time

But, it appears this is thrown away, have to consult with Yves to see if
is worth pursuing

2 weeks ago[perl #122911] regexp.h: Rmv VOL from op_comp sig
Father Chrysostomos [Mon, 6 Oct 2014 13:06:51 +0000]
[perl #122911] regexp.h: Rmv VOL from op_comp sig

It is no longer needed as of 1067df30ae9.

2 weeks agosilence some compiler warnings on VC6
Daniel Dragan [Mon, 6 Oct 2014 08:04:05 +0000]
silence some compiler warnings on VC6

sv.c and toke.c have the following warnings on VC6 but not VC 2003
(and probably newer too), example
..\toke.c(3149) : warning C4761: integral size mismatch in argument;
conversion supplied

find_default_stash (commit 90aeefb473 )& gv_magicalize (commit 71c35c050e )
..\gv.c(1680) : warning C4028: formal parameter 6 different from declaration
..\gv.c(1783) : warning C4028: formal parameter 6 different from declaration

not all VC6 compiler warnings are fixed by this patch

2 weeks agoDeparse with CORE:: to avoid lex sub conflicts
Father Chrysostomos [Mon, 6 Oct 2014 05:32:23 +0000]
Deparse with CORE:: to avoid lex sub conflicts

If a lexical sub with the same name as a keyword is in scope, we need
to deparse the keyword with a CORE:: prefix.

This commit handles most of the cases, but there are a few exceptional
cases remaining.

2 weeks agoDeparse-core.t: Fix ineffective tests
Father Chrysostomos [Mon, 6 Oct 2014 00:30:59 +0000]
Deparse-core.t: Fix ineffective tests

In a958cfbb8, I accidentally changed this to test ‘test::foo()’,
rather than ‘foo()’ deparsing as ‘test::foo()’, which was what I
had intended.

2 weeks agoCorrect ‘"my" variable "&f::b"...’ message
Father Chrysostomos [Mon, 6 Oct 2014 00:25:57 +0000]
Correct ‘"my" variable "&f::b"...’ message

"my" variable &foo::bar can't be in a package at - line 2, near "my sub foo::bar"

It should say ‘subroutine’, not ‘variable’.  When I implemented lexi-
cal subs, I thought I caught all these, must I missed this one.

2 weeks agotoke.c: Add comment for greppability
Father Chrysostomos [Mon, 6 Oct 2014 00:15:43 +0000]
toke.c: Add comment for greppability

2 weeks agoReorder t/lib/croak/toke
Father Chrysostomos [Mon, 6 Oct 2014 00:10:59 +0000]
Reorder t/lib/croak/toke

to put string terminator errors all in one place.

2 weeks agoMake B::Deparse qualify sub calls named after keywords
Father Chrysostomos [Sun, 5 Oct 2014 20:32:20 +0000]
Make B::Deparse qualify sub calls named after keywords

While B::Deparse was correctly applying CORE:: as necessary to dis-
ambiguate between keywords and custom subroutines, it was not doing
likewise for subroutines whose names were keywords.  main::foo()
should be deparsed as main::foo() if ‘foo’ is a keyword.

2 weeks ago[perl #122771] Fix assertion failure with -d and sort
Father Chrysostomos [Sun, 5 Oct 2014 20:30:36 +0000]
[perl #122771] Fix assertion failure with -d and sort

-d was conflicting with sort optimisations added by 932bca295d, which
had assertions that checked for nextstate, but not dbstate ops.

2 weeks agoRemove __SUB__ from Deparse-core.t exception list
Father Chrysostomos [Sun, 5 Oct 2014 20:11:01 +0000]
Remove __SUB__ from Deparse-core.t exception list

This list is for keywords exempt from the checks that make sure all
keywords have been tested.  __SUB__ *is* tested, so it does not
belong here.

2 weeks agoSimplify OP_LEAVESUBLV logic in op.c:op_lvalue
Father Chrysostomos [Sun, 5 Oct 2014 18:01:57 +0000]
Simplify OP_LEAVESUBLV logic in op.c:op_lvalue

If the lvalue type was OP_LEAVESUBLV, then the code for handling
entersub ops would go through extra checking to see whether we
have an lvalue sub available at compile time, before falling
through to the croaking code.  But the croaking code does not croak
if the type is OP_LEAVESUBLV, so the extra checks were for nothing.
We can skip those checks here just as we do for OP_GREPSTART,
OP_ENTERSUB and OP_REFGEN lvalue types.

2 weeks agoop.c:op_lvalue: Remove redundent case OP_RETURN
Father Chrysostomos [Sun, 5 Oct 2014 17:57:31 +0000]
op.c:op_lvalue: Remove redundent case OP_RETURN

The default case does nothing if the type is OP_LEAVESUBLV.  This has
been so since 145b2bbb3.

2 weeks agoDeparse inverted for(;;) cond more correctly
Father Chrysostomos [Sun, 5 Oct 2014 13:58:50 +0000]
Deparse inverted for(;;) cond more correctly

22584011 did not take the looks-like-a-function rule into account.

not ($1 || 2) ** 2 means (not ($1 || 2)) ** 2.

2 weeks agoDeparse.t: Another to-do test for lex subs
Father Chrysostomos [Sun, 5 Oct 2014 13:34:09 +0000]
Deparse.t: Another to-do test for lex subs

2 weeks agoConsistent spaces after dots in perlfunc
Father Chrysostomos [Sat, 4 Oct 2014 12:56:11 +0000]
Consistent spaces after dots in perlfunc

2 weeks agoclarify use VERSION docs
Doug Bell [Fri, 3 Oct 2014 03:52:24 +0000]
clarify use VERSION docs

Anything that C<use VERSION> adds, another C<use VERSION> may take away.
Explicitly doing the C<use strict> and/or C<use feature> means that
C<use VERSION> will not change them. C<use VERSION> will only change
the defaults, or things done by C<use VERSION>.

2 weeks agosilence compiler warnings in utf8_mg_pos_cache_update
Daniel Dragan [Sat, 4 Oct 2014 05:39:36 +0000]
silence compiler warnings in utf8_mg_pos_cache_update

commit 73ecc8cb69 added warnings on VC2003, silence them
..\sv.c(7556) : warning C4244: '=' : conversion from 'STRLEN' to 'float', possible loss of data
..\sv.c(7557) : warning C4244: '=' : conversion from 'const STRLEN' to 'float', possible loss of data
..\sv.c(7560) : warning C4244: '=' : conversion from 'const STRLEN' to 'float', possible loss of data
..\sv.c(7561) : warning C4244: '=' : conversion from 'STRLEN' to 'float', possible loss of data

2 weeks agooptimize SV creation funcs in sv.c
Daniel Dragan [Sat, 4 Oct 2014 06:14:02 +0000]
optimize SV creation funcs in sv.c

In Perl_newSV, the sv_upgrade is redundant, except to protect against a
segv in blindly SV body derefing SvGROW (but not in sv_grow). sv_grow has
always upgraded a non-PV SV to PV. So don't it here. Since a new SV will
never have be a COW, have a SvLEN or a body, all of which SvGROW uses,
just call sv_grow. Less branching, and smaller code that way.

In Perl_newSV_type, give a hint to compiler that if a platform's
symbol visibility allows inlining, and newSV_type's arg is the base type
(currently SVt_NULL, maybe SVt_IV in future (see ML)), to possibly inline
new_SV into the caller and remove the sv_upgrade call. Also don't call
sv_upgrade if it isn't needed (SVt_NULL) in the public symbol version.

The redundant sv_upgrade then sv_grow goes to commit 79072805bf
"perl 5.0 alpha 2". VC 2003 -01 32 bit threaded machine code size in bytes
of 2 functions
Perl_newSV_type before 0x2f after 0x29
Perl_newSV  before 0x48 after 0x28

2 weeks agoregcomp.c: Compiler warning
Father Chrysostomos [Sat, 4 Oct 2014 12:32:50 +0000]
regcomp.c: Compiler warning

Shut up this warning:

regcomp.c:7346:13: warning: format specifies type 'unsigned long' but the
      argument has type 'U32' (aka 'unsigned int') [-Wformat]
            RExC_study_chunk_recursed_count);
            ^~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

by casting to auld lang syne—I mean unsigned long.

2 weeks agoFix assertion failure/hang with / (?{(^{})/
Father Chrysostomos [Sat, 4 Oct 2014 05:40:36 +0000]
Fix assertion failure/hang with / (?{(^{})/

When this invalid construct is parsed, the resulting op tree for the
pattern has a code block with no constant item following it, breaking
the assumptions made by pmruntime.

Fixing this was not so easy.

You can’t just adjust the assertions, because the hang that non-debug-
ging builds exhibited is still there.

You can’t just return NULL from pmruntime when encounting the bad op
tree, because the parser will crash on the null pointer.

You can’t just return the empty pmop, because the wrong pad is
active, and other functions in op.c will try to access nonexistent
pad entries.

You can’t just LEAVE_SCOPE and return the pmop, because then PL_parser
will be null in yyerror.  Changing yyerror to account is not suffi-
cient, because then you get double-freed SVs.  At that point I gave up
with that approach.

The easiest solution turned out to be to fake up the op that we were
expecting to see.

2 weeks agoXSLoader.t fix-up following 8e6aa27cd01.
Craig A. Berry [Sat, 4 Oct 2014 03:25:24 +0000]
XSLoader.t fix-up following 8e6aa27cd01.

The skip count was incorrect as there is only one test, not two.

Also, XSLoader uses forward slashes explicitly, so prepending a
path to what it concocts from the package name must be done in
Unix format regardless of platform.

2 weeks agoAdd linked mods to known_pod_issues
Father Chrysostomos [Fri, 3 Oct 2014 21:40:57 +0000]
Add linked mods to known_pod_issues

2 weeks agoperl5220delta: Mention mods from #122814
Father Chrysostomos [Fri, 3 Oct 2014 21:40:00 +0000]
perl5220delta: Mention mods from #122814

2 weeks agoDeparse inverted for(;;) condition correctly
Father Chrysostomos [Fri, 3 Oct 2014 21:19:59 +0000]
Deparse inverted for(;;) condition correctly

This is wrong:

$ perl -MO=Deparse -e 'for($a;!$b;$c){}'
for ($a; $b; $c) {
    ();
}

-e syntax OK

What happened to the bang?

This was broken in 5.12 by edbe35ea95.

2 weeks agoMake OP_METHOD* to be of new class METHOP
syber [Thu, 4 Sep 2014 18:08:59 +0000]
Make OP_METHOD* to be of new class METHOP

Introduce a new opcode class, METHOP, which will hold class/method related
info needed at runtime to improve performance of class/object method
calls, then change OP_METHOD and OP_METHOD_NAMED from being UNOP/SVOP to
being METHOP.

Note that because OP_METHOD is a UNOP with an op_first, while
OP_METHOD_NAMED is an SVOP, the first field of the METHOP structure
is a union holding either op_first or op_sv. This was seen as less messy
than having to introduce two new op classes.

The new op class's character is '.'

Nothing has changed in functionality and/or performance by this commit.
It just introduces new structure which will be extended with extra
fields and used in later commits.

Added METHOP constructors:
- newMETHOP() for method ops with dynamic method names.
  The only optype for this op is OP_METHOD.
- newMETHOP_named() for method ops with constant method names.
  Optypes for this op are: OP_METHOD_NAMED (currently) and (later)
  OP_METHOD_SUPER, OP_METHOD_REDIR, OP_METHOD_NEXT, OP_METHOD_NEXTCAN,
  OP_METHOD_MAYBENEXT

(This commit includes fixups by davem)

2 weeks agoDo not rely on the precise error wording
Rafael Garcia-Suarez [Fri, 3 Oct 2014 12:03:13 +0000]
Do not rely on the precise error wording

'No such file or directory' is fine on Linux but other UNIXes might
say it differently, for example 'A file or directory in the path name does not exist'.

2 weeks agoperldelta for 8e6aa27cd01d, 30837b2a7d75, de937bde1656
Tony Cook [Fri, 3 Oct 2014 05:40:18 +0000]
perldelta for 8e6aa27cd01d30837b2a7d75de937bde1656

2 weeks ago[perl #122455] fix XSLoader loading other namespaces
Tony Cook [Fri, 3 Oct 2014 05:30:35 +0000]
[perl #122455] fix XSLoader loading other namespaces

2 weeks agobump $XSLoader::VERSION
Tony Cook [Fri, 3 Oct 2014 05:20:45 +0000]
bump $XSLoader::VERSION

2 weeks agoAllow XSLoader to load modules from a different namespace
Graham Knop [Fri, 1 Aug 2014 12:30:42 +0000]
Allow XSLoader to load modules from a different namespace

When trying to locate the binary component of a module, use the caller
package to find the library root directory, not the passed in module
name.  Since the file path it is using is always taken from the caller,
using the passed in package prevents it from finding the library root.
If in the package File::Spec::Unix, and given XSLoader::load("Cwd"), the
library root is three levels up from the filename of the
File::Spec::Unix module, not one.

2 weeks ago[perl #122455] TODO test for XSLoader mishandling of namespaces
Tony Cook [Thu, 7 Aug 2014 01:06:45 +0000]
[perl #122455] TODO test for XSLoader mishandling of namespaces

2 weeks ago[perl #122657] TODO checking the result of recv() on hurd
Tony Cook [Wed, 1 Oct 2014 01:33:19 +0000]
[perl #122657] TODO checking the result of recv() on hurd

2 weeks agoCompare recv return value to peername in socket test
Leon Timmermans [Wed, 24 Sep 2014 21:17:21 +0000]
Compare recv return value to peername in socket test

2 weeks agoDeparse ‘local our’
Father Chrysostomos [Thu, 2 Oct 2014 21:13:20 +0000]
Deparse ‘local our’

Deparse was omitting the ‘our’.

2 weeks agoKeep concise-xs.t happy
Father Chrysostomos [Thu, 2 Oct 2014 21:13:15 +0000]
Keep concise-xs.t happy

2 weeks agoDeparse \(..., (@a), ...) correctly
Father Chrysostomos [Thu, 2 Oct 2014 20:38:12 +0000]
Deparse \(..., (@a), ...) correctly

It is the presence of parentheses immediately around the array (and
possibly local/our/my/+) in refgen context, rather than parentheses
surrounding the argument to \, that causes the array to be flattened.

B::Deparse was deparsing \(@a) correctly, but not \(@a, (@b)), in
which takes a reference to @a and to each of @b’s elements.  It was
omitting the parentheses around @b.

2 weeks agoUpdate comments for OPf_SPECIAL/do
Father Chrysostomos [Thu, 2 Oct 2014 19:54:15 +0000]
Update comments for OPf_SPECIAL/do

‘do subname’ has been removed, so OPf_SPECIAL no longer applies to
OP_ENTERSUB.

2 weeks agoMake list assignment respect foreach aliasing
Father Chrysostomos [Thu, 2 Oct 2014 19:44:19 +0000]
Make list assignment respect foreach aliasing

See ff2a62e0c8 for the explanation.  The bug fix in that commit did
not apply to foreach’s aliasing.

In short, ($a,$b)=($c,$d) needs to account for whether two of those
variable names could be referring to the same variable.

This commit causes the test suite to exercise a code path in scope.c
added by ff2a62e0c8, which turned out to be buggy.  (I forgot to test
it at the time.)

2 weeks agoThe Module-CoreList on CPAN is now 5.20141002
Chris 'BinGOs' Williams [Thu, 2 Oct 2014 11:10:59 +0000]
The Module-CoreList on CPAN is now 5.20141002

2 weeks agoThere's no need to rewrite the Module-CoreList pod now
Chris 'BinGOs' Williams [Thu, 2 Oct 2014 08:11:14 +0000]
There's no need to rewrite the Module-CoreList pod now

2 weeks agoMake the CAVEAT entry in Module-CoreList pod sane
Chris 'BinGOs' Williams [Thu, 2 Oct 2014 08:08:48 +0000]
Make the CAVEAT entry in Module-CoreList pod sane

2 weeks agoUpdate Module-CoreList Changes file for 5.20141002 release
Chris 'BinGOs' Williams [Thu, 2 Oct 2014 08:01:06 +0000]
Update Module-CoreList Changes file for 5.20141002 release

2 weeks agocorelist: import v5.18.3 and v5.18.4 data
Ricardo Signes [Thu, 2 Oct 2014 01:28:44 +0000]
corelist: import v5.18.3 and v5.18.4 data

2 weeks agoperlhist: bring in 5.18.3 and 5.18.4 release dates
Ricardo Signes [Thu, 2 Oct 2014 01:26:20 +0000]
perlhist: bring in 5.18.3 and 5.18.4 release dates

2 weeks agoimport latest epigraphs from maint-5.18
Ricardo Signes [Thu, 2 Oct 2014 01:19:16 +0000]
import latest epigraphs from maint-5.18

2 weeks agoMaintainers.pl: Include all Deparse-*.t files in _PERLLIB
Father Chrysostomos [Wed, 1 Oct 2014 23:21:47 +0000]
Maintainers.pl: Include all Deparse-*.t files in _PERLLIB

2 weeks agoSort MANIFEST properly
Father Chrysostomos [Wed, 1 Oct 2014 23:19:42 +0000]
Sort MANIFEST properly

2 weeks agoCorrect and update sv.c’s string copy comments
Father Chrysostomos [Wed, 1 Oct 2014 23:17:52 +0000]
Correct and update sv.c’s string copy comments

Thanks to Dave Mitchell for pointing out my mistakes.

Whether the rhs is copy-on-write already does not change whether we
do the long-string-and-left-buffer-size check.  The comments (added in
2ac0bcb35) were wrong.

Also, update the comments for e8c6a474e, which added the
big-buffer-on-the-right skip logic.

2 weeks ago[perl #122870] Fix B::Deparse–DDS compatibility
Father Chrysostomos [Wed, 1 Oct 2014 23:07:46 +0000]
[perl #122870] Fix B::Deparse–DDS compatibility

2 weeks agoAdd tests for overriding <> versus rcatline
Rafael Garcia-Suarez [Wed, 1 Oct 2014 07:13:05 +0000]
Add tests for overriding <> versus rcatline

2 weeks agoNew <<>> tests
Rafael Garcia-Suarez [Wed, 1 Oct 2014 07:03:10 +0000]
New <<>> tests

- Modify test to test also that <<>> with empty (false) lines
- Add a test for <<>> used in a rcatline op

2 weeks agoUpstream a patch from pkgsrc for NetBSD hints
Chris 'BinGOs' Williams [Tue, 30 Sep 2014 18:15:05 +0000]
Upstream a patch from pkgsrc for NetBSD hints

2 weeks agoForgot to update SKIP count after last patch
Rafael Garcia-Suarez [Tue, 30 Sep 2014 13:44:44 +0000]
Forgot to update SKIP count after last patch

2 weeks agoAdd a test for <<>> failing on the second file
Rafael Garcia-Suarez [Tue, 30 Sep 2014 13:36:10 +0000]
Add a test for <<>> failing on the second file

3 weeks agoAdd tests for empty strings in @ARGV
Rafael Garcia-Suarez [Mon, 29 Sep 2014 23:19:55 +0000]
Add tests for empty strings in @ARGV

which should be refused, since no file name should be empty.
(Suggested by Richard Soderberg)

3 weeks agoClarify the documentation for <<>>
Rafael Garcia-Suarez [Mon, 29 Sep 2014 22:25:27 +0000]
Clarify the documentation for <<>>

3 weeks agoAdd tests for $ARGV
Rafael Garcia-Suarez [Mon, 29 Sep 2014 22:24:21 +0000]
Add tests for $ARGV

There weren't apparently any. This also tests that $ARGV behaves
correctly both with <> and <<>>.

3 weeks agoAdd tests for the <<>> operator
Rafael Garcia-Suarez [Mon, 29 Sep 2014 20:52:32 +0000]
Add tests for the <<>> operator

3 weeks agoAdded some documentation for while(<<>>)
Peter Martini [Mon, 11 Aug 2014 03:11:20 +0000]
Added some documentation for while(<<>>)

3 weeks agoIntroduce the double-diamond operator <<>>
Rafael Garcia-Suarez [Thu, 24 Jul 2014 15:43:29 +0000]
Introduce the double-diamond operator <<>>

This operator works like <> or <ARGV>, as it reads the list of file
names to open from the command-line arguments. However, it disables
the magic-open feature (that forks to execute piped commands) :

    $ bleadperl -e 'while(<>){print}' 'echo foo |'
    foo
    $ bleadperl -e 'while(<<>>){print}' 'echo foo |'
    Can't open echo foo |: No such file or directory at -e line 1.

3 weeks agoAdded -x option to makerel to produce .xz tarballs
Chris 'BinGOs' Williams [Mon, 29 Sep 2014 19:09:32 +0000]
Added -x option to makerel to produce .xz tarballs

With the default of -6 produced much smaller tarball than
.gz (7z produced) and .bz2

  -rw-r--r--  1 bingos bingos 13601234 Sep 29 20:07 perl-5.21.5.tar.bz2
  -rw-r--r--  1 bingos bingos 15699515 Sep 29 20:07 perl-5.21.5.tar.gz
  -rw-r--r--  1 bingos bingos 10982580 Sep 29 20:08 perl-5.21.5.tar.xz

It's an option if we ever need it.

3 weeks agoTighten uses of regex synthetic start class
Karl Williamson [Mon, 22 Sep 2014 19:59:39 +0000]
Tighten uses of regex synthetic start class

A synthetic start class (SSC) is generated by the regular expression
pattern compiler to give a consolidation of all the possible things that
can match at the beginning of where a pattern can possibly match.
For example
    qr/a?bfoo/;
requires the match to begin with either an 'a' or a 'b'.  There are no
other possibilities.  We can set things up to quickly scan for either of
these in the target string, and only when one of these is found do we
need to look for 'foo'.

There is an overhead associated with using SSCs.  If the number of
possibilities that the SSC excludes is relatively small, it can be
counter-productive to use them.

This patch creates a crude sieve to decide whether to use an SSC or not.
If the SSC doesn't exclude at least half the "likely" possiblities, it
is discarded.  This patch is a starting point, and can be refined if
necessary as we gain experience.

See thread beginning with
http://nntp.perl.org/group/perl.perl5.porters/212644

In many patterns, no SSC is generated; and with the advent of tries,
SSC's have become less important, so whatever we do is not terribly
critical.

3 weeks agoregcomp.c: Move macro definition earlier in file
Karl Williamson [Tue, 23 Sep 2014 22:54:34 +0000]
regcomp.c: Move macro definition earlier in file

This is to prepare it to be used in earlier places than it is now.

3 weeks agoregcomp.c: Use strnEQ instead of series of tests
Karl Williamson [Sat, 20 Sep 2014 16:20:11 +0000]
regcomp.c: Use strnEQ instead of series of tests

At some point it is more efficient and certainly clearer to call a
library function to do a strcmp than to test each individual byte.
Based on irc discussion with the original coder of this, I changed this
sequence of 6 comparisions to a strnEQ.  At the same time, this adds an
buffer overlflow check.  I was unable to cause the previous code to
overflow, but I believe it was possible.  And this changes the magic
number 6 in the code to a mnemonic giving its meaning.

3 weeks agoTick that v5.21.4 got a release in the schedule
Chris 'BinGOs' Williams [Mon, 29 Sep 2014 18:45:44 +0000]
Tick that v5.21.4 got a release in the schedule

3 weeks agoop_reg_common.h: Get blead to build in Jenkins
Karl Williamson [Mon, 29 Sep 2014 18:16:42 +0000]
op_reg_common.h: Get blead to build in Jenkins

I don't understand why this compile error check is failing Jenkins, but
am removing it for now to get things to work.

3 weeks agoEliminate unused BACK regnode
Aaron Crane [Wed, 24 Sep 2014 17:29:36 +0000]
Eliminate unused BACK regnode

3 weeks agoregcomp.c: Properly dereference a ptr
Karl Williamson [Sat, 27 Sep 2014 23:13:42 +0000]
regcomp.c: Properly dereference a ptr

UTF8_IS_INVARIANT takes a byte as its argument, not a ptr.  This bug was
introduced by 62a59291 in 5.21.4.  It doesn't probably cause bugs
because the ptr is always too big to be an invariant, but it slows
things down somewhat by not taking a shortcut it could.

It turns out that there is a discrepency between the APIs of the
UTF8-foo macros.  Some take a byte, and some a string ptr.

3 weeks agoSuppress some Solaris warnings
Karl Williamson [Mon, 22 Sep 2014 04:07:58 +0000]
Suppress some Solaris warnings

We get an integer overflow message when we left shift a 1 into the
highest bit of a word.  This changes the 1's into 1U's to indicate
unsigned.  This is done for all the flag bits in the affected word, as
they could get reorderd by someone in the future, unintentionally
reintroducing this problem again.

3 weeks agoop_reg_common.h: Update comment
Karl Williamson [Wed, 24 Sep 2014 18:51:46 +0000]
op_reg_common.h: Update comment

The PL file previously referred to has been deleted, and replaced by a
different one.

3 weeks agoB/Makefile.PL: Allow constants to be long/unsigned
Karl Williamson [Wed, 24 Sep 2014 18:49:13 +0000]
B/Makefile.PL: Allow constants to be long/unsigned

This looks for numerical constants, but failed to see long and/or
unsigned ones, which have suffixes U and/or L, or lowercase u and/or l.

3 weeks agoDeprecate multiple "x" in "/xx"
Karl Williamson [Mon, 22 Sep 2014 17:56:48 +0000]
Deprecate multiple "x" in "/xx"

 It is planned for a future Perl release to have /xx mean something
 different from just /x.  To prepare for this, this commit raises a
 deprecation warning if someone currently has this usage.  A grep of CPAN
 did not turn up any instances of this, but this is to be safe anyway.

 The added code is more general than actually needed, in case we want to
 do this for another flag.

3 weeks agotoke.c: Clarify comment
Karl Williamson [Mon, 22 Sep 2014 17:54:37 +0000]
toke.c: Clarify comment

3 weeks agoop_reg_common.h: White-space only
Karl Williamson [Wed, 17 Sep 2014 23:59:39 +0000]
op_reg_common.h: White-space only

Align columns vertically

3 weeks agoMake space for /xx flag
Karl Williamson [Wed, 17 Sep 2014 23:55:16 +0000]
Make space for /xx flag

This doesn't actually use the flag yet.
We no longer have to make version-dependent changes to
ext/Devel-Peek/t/Peek.t, (it being in /ext) so this doesn't

3 weeks agoop_reg_common.h: #define in terms of more basic one
Karl Williamson [Wed, 17 Sep 2014 23:57:17 +0000]
op_reg_common.h: #define in terms of more basic one

The mask to copy bits should always include at least the compile-time
bits.  By defining it in terms of the compile-time bits, we make it
easier to change and understand.

3 weeks agoUp regex flags limit for (??{})
Karl Williamson [Wed, 17 Sep 2014 18:16:12 +0000]
Up regex flags limit for (??{})

Previously the regex pattern compilation flags needed for this construct
would fit into an 8-bit byte.  This conveniently fits into the flags
structure element of a regnode.  There are changes coming that require
more than 8 bits, so in preparation, this commit adds an argument to the
node that implements (??{}) (31-bits usable for flags), and moves the
storage to that.

3 weeks agoregcomp.c: Add assertions
Karl Williamson [Tue, 16 Sep 2014 23:19:52 +0000]
regcomp.c: Add assertions

This changes from assuming that certain things are constant to using a
variable instead, and then asserting that the variable matches the
constant.

3 weeks agoregcomp.c: Add a function and use it
Karl Williamson [Tue, 16 Sep 2014 23:16:47 +0000]
regcomp.c: Add a function and use it

This adds a function to allocate a regnode with 2 32-bit arguments, and
uses it, rather than the ad-hoc code that did the same thing previously.
This is in preparation for this code being used in a 2nd place in a
future commit.

3 weeks agoregcomp.sym: ANYOF nodes have an argument
Karl Williamson [Tue, 16 Sep 2014 22:26:36 +0000]
regcomp.sym: ANYOF nodes have an argument

Plus a bitmap, but they always have an argument besides, contrary to
what was specified here.  Future commits rely on this, whereas
heretofore this error was harmless.

3 weeks agoregcomp.h: Add comment
Karl Williamson [Tue, 16 Sep 2014 16:00:32 +0000]
regcomp.h: Add comment

3 weeks agoregcomp.c: Outdent line to align with neighbors
Karl Williamson [Mon, 15 Sep 2014 18:14:17 +0000]
regcomp.c: Outdent line to align with neighbors

3 weeks agoregcomp.h: Remove obsolete #defines
Karl Williamson [Mon, 15 Sep 2014 17:30:25 +0000]
regcomp.h: Remove obsolete #defines

These internal definitions are no longer used.

3 weeks agoregcomp.h: Use existing macro instead of reinventing
Karl Williamson [Mon, 15 Sep 2014 17:29:43 +0000]
regcomp.h: Use existing macro instead of reinventing

3 weeks agoregcomp.c: Extract duplicated code to fcn
Karl Williamson [Mon, 15 Sep 2014 14:46:35 +0000]
regcomp.c: Extract duplicated code to fcn

This causes the nearly-duplicate code of S_reg_node and S_reganode to be
placed into a single function, S_regnode_guts.

There is one place where it might not be obvious that this doesn't
change things.  And that is under DEBUGGING, reg_node() called

    Set_Node_Offset(RExC_emit, RExC_parse + (op == END));

and reganode called

    Set_Cur_Node_Offset;

However Set_Cur_Node_Offset is defined to be

    Set_Node_Offset(RExC_emit, RExC_parse)

and since op will never be END for reganode, the two statements are
equivalent.