This is a live mirror of the Perl 5 development currently hosted at
9 years agoperldelta for 285a3ca13
Tony Cook [Mon, 3 Jun 2013 12:57:28 +0000 (22:57 +1000)]
perldelta for 285a3ca13

9 years ago[perl #118175] avoid making pointers outside of objects
Tony Cook [Mon, 3 Jun 2013 12:28:37 +0000 (22:28 +1000)]
[perl #118175] avoid making pointers outside of objects

In a couple of cases, when strings were allocated above the 2GB line
on 32-bit CPUs, this could cause regexps to act strangely - not matching
or crashing perl.

The final patch in the set prevents pointer creation which the C standard
describes as undefined behaviour, but is typically safe (as long as the
pointer isn't derefed)

9 years ago[perl #118175] avoid making a pointer outside a string
Tony Cook [Sat, 1 Jun 2013 02:33:05 +0000 (12:33 +1000)]
[perl #118175] avoid making a pointer outside a string

Simply adding scan + max causes undefined behaviour per ANSI C if the
result points outside of the object scan points at.

9 years ago[perl #118175] prevent a similar overflow for CANY
Tony Cook [Sat, 1 Jun 2013 01:10:39 +0000 (11:10 +1000)]
[perl #118175] prevent a similar overflow for CANY

9 years ago[perl #118175] prevent a similar overflow for POSIXA
Tony Cook [Sat, 1 Jun 2013 00:54:36 +0000 (10:54 +1000)]
[perl #118175] prevent a similar overflow for POSIXA

9 years ago[perl #118175] avoid overflowing a pointer for repeated EXACT nodes
Tony Cook [Tue, 28 May 2013 10:43:28 +0000 (20:43 +1000)]
[perl #118175] avoid overflowing a pointer for repeated EXACT nodes

9 years agoeliminate an unused variable
Tony Cook [Mon, 3 Jun 2013 11:57:29 +0000 (21:57 +1000)]
eliminate an unused variable

9 years agoperldelta: changed intuit API
David Mitchell [Mon, 3 Jun 2013 10:38:49 +0000 (11:38 +0100)]
perldelta: changed intuit API

9 years ago[MERGE] get rid of (most) regex engine global state
David Mitchell [Sun, 2 Jun 2013 19:59:58 +0000 (20:59 +0100)]
[MERGE] get rid of (most) regex engine global state

Historically, perl's regex engine was based on Henry Spencer's regex code,
which was all contained within a single file and used a bunch of static
variables to maintain the state of the current regex compile or execution.

This was perfectly adequate when only a single thread could execute a
regex, and where the regex engine couldn't be called re-entrantly.

In 5.0, these vars were promoted to be full global vars as perl became
embeddable; then in 5.5 they became part of the perl interpreter struct
when MULTIPLICITY was introduced.

In 5.6, the Perl_save_re_context() function was introduced that did a
whole bunch of SAVEPPTR(PL_bostr) type stuff, and was called in various
places where it was possible that the engine may be re-entered, to avoid
overwriting the global state of the currently executing regex. This was
particularly important now that Unicode had been introduced, and certain
character classes could trigger a call to the perl-level SWASH code, which
could itself execute a regex; and where /(?{ ... })/ code blocks could be
called which could do likewise.

In 5.10, The various PL_foo variables became fields within the new
re_save_state struct, and a new interpreter var, PL_reg_state, was
introduced which was of type struct re_save_state. Thus, all the
individual vars were still global state, but it became easier to save them
en-mass in Perl_save_re_context() by just copying the re_save_state stuct
onto the save stack and marking it with the new SAVEt_RE_STATE type.
Perl_save_re_context() was also expanded to be responsible for saving all
the current $1 values.

Up until now, that is roughly how things have remained, except for bug
fixes such as discovering more places where Perl_save_re_context() needs
to be called.

Note that, philosophically speaking at least, this is broken in two ways.
First, there's no good reason for the internal current state of the
executing regex engine to be stored in a bunch of global vars; and
secondly we're relying on potential callers of the regex engine (like the
magic tie code for example), to be responsible for being aware that they
*might* trigger re-entrancy in the regex engine, and to thus do
Perl_save_re_context() as a precaution. This is error-prone and hard to
prove correct.  (As an example, Perl_save_re_context() is only called in
the tie code if the tie code in question is doing a tied PRINT on STDERR;
clearly an unusual use case that someone spotted was buggy at some point).

The obvious fix, and the one performed by the series of commits in this
merge, is to make all the global state local to the regex engine instead.
Indeed, there is already a struct, regmatch_info, that is allocated as a
local var in regexec(), then passed as an argument to the various
lower-level functions called from regexec(). However, it only had limited
use previously, so here we expand the number of functions where it is
passed as an argument. In particular, it is now also created by
re_intuit_start(), the other main run-time entry point to the regex

However, there is a problem with this, in that various regex vars need
cleaning up on croak (e.g. they point to a malloced buffer). Since the
regmatch_info struct is just a local var on the C stack, it will be lost
by the longjmp done by a croak() before leave_scope() can clear up.

To handle this, some fields that logically should go in regmatch_info,
are instead added to two new structs: regmatch_info_aux and
regmatch_info_aux_eval; the first represents all the normal fields that
need some sort of cleanup handling; the second represents extra fields
(also possibly needing cleanup) that are only only needed if the pattern
contains /(?{})/ code blocks. These two structs are allocated in the next
two free PL_regmatch_state stack slots - since these slots are allocated
in 4K slabs anyway, they are essentially free of charge. A single
destructor function, S_cleanup_regmatch_info_aux() is then used with
SAVEDESTRUCTOR_X() to perform all cleanup at the end of execution.

In addition, all state and cleanup setup has been consolidated into a
single point near the start of regexec(); previously it was spread across
regexec(), regtry() and regmatch(). This used also to result in various
inefficencies, such as PL_regmatch_state stack freeing all higher unused
slabs at the end of each call to regmatch(), which might be called
multiple times by regexec(). Now it just frees once.

As part of this series of fixes it was necessary to change the API of
Perl_re_intuit_start(). This is because the API was broken: unlike
Perl_regexec_flags(), it didn't have a strbeg arg, and would try to guess
it from the SV (if any) passed to it. This could fail on overloaded SVs
for example, or where its called without an SV (not done from core, but
officially supported by the API). Note that this is likely to break
Re::Engine plugins, plus any code which directly calls intuit.

Finally, note that although struct re_save_state and SAVEt_RE_STATE are
gone, Perl_save_re_context() still does something useful: the equivalent
of local($1,$2...). Fixing that properly is a whole separate kettle of
fish, not addressed here.

As far as I'm aware, the only remaining global vars associated with the
regex engine are

    PL_reg_curpm, PL_regmatch_state, PL_regmatch_slab, PL_colors, PL_colorset

None of these are effected by re-entrancy. The state stack is, erm, a stack,
so it can handle re-entrancy quite happily, and the others are safe too.

9 years agodocument fields of regmatch_info struct
David Mitchell [Fri, 31 May 2013 22:44:44 +0000 (23:44 +0100)]
document fields of regmatch_info struct

9 years agotidy up init code in regexec() and intuit_start()
David Mitchell [Fri, 31 May 2013 22:33:45 +0000 (23:33 +0100)]
tidy up init code in regexec() and intuit_start()

Slightly reorganise the set-up code in these two functions,
for example by gathering all 'reginfo->foo =' assignments into a single
block. This is just swapping the order of a few lines, and shouldn't make
any functional difference.

9 years agobetter comment the remaining PL_ regex vars
David Mitchell [Fri, 31 May 2013 22:06:39 +0000 (23:06 +0100)]
better comment the remaining PL_ regex vars

9 years agoeliminate PL_regdummy
David Mitchell [Fri, 31 May 2013 21:57:21 +0000 (22:57 +0100)]
eliminate PL_regdummy

This global (per-interpreter) var is just used during regex compilation as
a placeholder to point RExC_emit at during the first (non-emitting) pass,
to indicate to not to emit anything. There's no need for it to be a global
var: just add it as an extra field in the RExC_state_t struct instead.

9 years agoeliminate PL_reg_state
David Mitchell [Fri, 31 May 2013 21:35:40 +0000 (22:35 +0100)]
eliminate PL_reg_state

This is a struct that holds all the global state of the current regex
The previous set of commits have gradually removed all the fields of this
struct (by making things local rather than global state). Since the struct
is now empty, the PL_reg_state var can be removed, along with the
SAVEt_RE_STATE save type which was used to save and restore those fields
on recursive re-entry to the regex engine.

9 years agoEliminate PL_reg_starttry
David Mitchell [Fri, 31 May 2013 21:24:54 +0000 (22:24 +0100)]
Eliminate PL_reg_starttry

Its only used for printing debugging messages, and its value is already
available as the startpos local var in S_regmatch().

Whoo hoo! This var was the last field within the PL_reg_state global state

9 years agomake PL_reg_curpm global
David Mitchell [Fri, 31 May 2013 20:39:01 +0000 (21:39 +0100)]
make PL_reg_curpm global

Currently PL_reg_curpm is actually #deffed to a field within PL_reg_state;
promote it into a fully autonomous perl-interpreter variable.

PL_reg_curpm points to a fake PMOP that's used to temporarily point
PL_curpm to, that we can hang the current regex off, so that this works:

    "a" =~ /^(.)(?{ print $1 })/ # prints 'a'

It turns out that it doesn't need to be saved and restored when we
recursively enter the regex engine; that is already handled by saving and
restoring which regex is currently attached to PL_reg_curpm.
So we just need a single global (per interpreter) placeholder.

Since we're shortly going to get rid of PL_reg_state, we need to move it
out of that struct.

9 years agobetter document the regex super-linear pos cache
David Mitchell [Fri, 31 May 2013 15:16:46 +0000 (16:16 +0100)]
better document the regex super-linear pos cache

9 years agoeliminate PL_reg_poscache, PL_reg_poscache_size
David Mitchell [Fri, 31 May 2013 14:40:48 +0000 (15:40 +0100)]
eliminate PL_reg_poscache, PL_reg_poscache_size

Eliminate these two global vars (well, fields in the global
PL_reg_state), that hold the regex super-liner cache.

PL_reg_poscache_size gets replaced with a field in the local regmatch_info
struct, while PL_reg_poscache (which needs freeing at end of pattern
execution or on croak()), goes in the regmatch_info_aux struct.

Note that this includes a slight change in behaviour.
Each regex execution now has its own private poscache pointer, initially
null.  If the super-linear behaviour is detected, the cache is malloced,
used for the duration of the pattern match, then freed.

The former behaviour allocated a global poscache on first use, which was
retained between regex executions. Since the poscache could between 0.25
and 2x the size of the string being matched, that could potentially be a
big buffer lying around unused. So we save memory at the expense of a new
malloc/free for every regex that triggers super-linear behaviour.

The old behaviour saved the old pointer on reentrancy, then restored the
old one (and possibly freed the new buffer) at exit. Except it didn't for
(?{}), so /(?{ m{something-that-triggers-super-linear-cache} })/ would
leak each time the inner regex was called. This is now fixed

9 years agouse new cleanup for PL_regmatch_state
David Mitchell [Thu, 30 May 2013 22:44:53 +0000 (23:44 +0100)]
use new cleanup for PL_regmatch_state

The previous commit reorganised state save and cleanup at the end of regex
execution. Use this new mechanism, by recording the original values
of PL_regmatch_slab and PL_regmatch_state in the regmatch_info_aux struct,
and restoring them and freeing higher slabs as part of the general
S_cleanup_regmatch_info_aux() destructor, rather than pushing the old
values directly onto the savestack and using another specific destructor.

Also, make the initial allocating of (up to) 3 PL_regmatch_state slots
more efficient by doing it in a loop.

We also skip the first slot; this may already be in use if we're called

try 1

9 years agounify regmatch_info data
David Mitchell [Thu, 30 May 2013 15:27:09 +0000 (16:27 +0100)]
unify regmatch_info data

Previously the regmatch_info struct was allocated as a local var on the C
stack, while some extra state (only needed for regexes having (?{})) was
malloced (as a regmatch_eval_state struct) as needed - and a destructor set
up to clean it up afterwards. This being because the stuff being cleaned
up couldn't be allocated on the C stack as it needed to hang around after
a croak().

Reorganise this so that:

* regmatch_info is on the C stack as before.

* a new struct, regmatch_info_aux is allocated within the first slot of the
  regmatch_state stack, for fields which must always exist but which need
  cleanup afterwards. This is currently unused, but will be shortly.

* a new struct, regmatch_info_aux_eval (which is just a renamed
  regmatch_eval_state struct), is optionally allocated in the second
  slot of regmatch_state. This is logically part of regmatch_info_aux,
  except that splitting it in two stops it being too large to fit in a
  regmatch_state slot (we can fit it in two instead).

(The second and third structs aren't allocated when we're intuit()
rather than regexec()).

Doing it like this simplifies allocation and cleanup: there's no need for
a malloc(), and we are already going to allocate a slab's worth of
regmatch_state slots, so using an extra one of two of them is effectively
free; and the cleanup just requires calling a single overall destructor.

In the next few commits, more of the regexec() state setup and tear-down
will be integrated into this new regime. And in particular, the new
regmatch_info_aux struct will give us somewhere to hang things like
PL_reg_poscache once it stops being global (it being local state that
needs cleanup).

9 years agomove eval_state init from regtry() to regexec()
David Mitchell [Thu, 30 May 2013 10:46:02 +0000 (11:46 +0100)]
move eval_state init from regtry() to regexec()

regexec() calls regtry() for each match start position until a match is
found. regtry() has some code that says: "if this regex contains (?{})'s,
and if we haven't done so already, set up the extra state needed".

Move the setup one level higher, into regexec(). Here, we just do it once,
and don't have to keep checking whether we've already done it.

This is part of an effort to consolidate all regex state initialisation
into one place.

9 years agomove savestack restore from regmatch to regexec
David Mitchell [Thu, 30 May 2013 10:27:45 +0000 (11:27 +0100)]
move savestack restore from regmatch to regexec

Currently, S_regmatch() has, in its outermost scope:

    oldsave = PL_savestack_ix;
    SAVEDESTRUCTOR_X(S_clear_backtrack_stack, NULL);

    ... rest of function ....

    /* clean up; in particular, free all slabs above current one */

This means that at the end of regmatch(), all slabs in the regmatch_state
stack above where we started, are freed.

Hoist this two levels higher into Perl_regexec_flags().  Now, since
a) the main activity of regexec() is call regmatch() (via regtry()) for
each possible string start position until a match is found;
b) there isn't any other savestack manipulation between the two functions;
the main affect of this change is that higher slabs in the regmatch_state
stack are only freed at the end of all match attempts from all positions,
rather than after each fail at a particular start point. Since the
repeated calls to regmatch() are likely to have a similar pattern of
regmatch_state stack usage, this should usually be an efficiency win.

It is also part of plan to consolidate all the setting up of local match
state in one place.

9 years agoeliminate PL_reg_maxiter, PL_reg_leftiter
David Mitchell [Tue, 21 May 2013 13:49:30 +0000 (14:49 +0100)]
eliminate PL_reg_maxiter, PL_reg_leftiter

Move these two fields of PL_reg_state into the regmatch_info struct, so
they are local to each match.

9 years agoRationalise RX_MATCH_UTF8_set()
David Mitchell [Mon, 20 May 2013 16:04:44 +0000 (17:04 +0100)]
Rationalise RX_MATCH_UTF8_set()

Now that the RXf_MATCH_UTF8 flag on a regex is just used to indicate
whether the captures on a successful match are utf8, only set
this flag at the end of a successful match, rather than at the start of
the match.

This should make no functional difference the way things stand at the
moment, but makes things conceptually cleaner.

9 years agoS_setup_eval_state: save subcoffset, not suboffset
David Mitchell [Mon, 20 May 2013 15:46:59 +0000 (16:46 +0100)]
S_setup_eval_state: save subcoffset, not suboffset

A typo in this function meant that the same value rex->suboffset was
saved to both eval_state->suboffset and eval_state->subcoffset.

However, I can't think of a test case where this will fail, since each
qr// gets its own set of suboffset vars these days. (and thus I wonder
whether there's even any need to save them when calling (?{}).

9 years agoEliminate PL_reg_match_utf8
David Mitchell [Mon, 20 May 2013 15:22:20 +0000 (16:22 +0100)]
Eliminate PL_reg_match_utf8

Earlier commits made the use of this var just local to the current
match, so move it to the local regmatch_info struct instead.

9 years agoregex engine: simplify is_utf8_pat handling
David Mitchell [Mon, 20 May 2013 14:04:11 +0000 (15:04 +0100)]
regex engine: simplify is_utf8_pat handling

Since this value is actually just always equal to cBOOL(RX_UTF8(rx)),
there's no need to save the old value of the local boolean
(as u.eval.saved_utf8_pat) when switching back and forwards between
regexes with (??{}); instead, just re-calculate it whenever we switch,
and update reginfo->is_utf8_pat and its cached value in the is_utf8_pat
local var accordingly.

Also, pass reginfo as an arg to S_setup_EXACTISH_ST_c1_c2() rather than
is_utf8_pat directly; this will allow us to eliminate PL_reg_match_utf8

A new test is included that detects a mistake I made while working up
this change: I recalculated is_utf8_pat, but forgot to update
reginfo->is_utf8_pat too.

9 years agostop callers of rex engine using RX_MATCH_UTF8_set
David Mitchell [Mon, 20 May 2013 13:17:33 +0000 (14:17 +0100)]
stop callers of rex engine using RX_MATCH_UTF8_set

The way that the regex engine knows that the match string is utf8 is
currently a complete mess. It's partially signalled by the utf8 flag of
the passed SV, but also by the RXf_MATCH_UTF8 flag in the regex itself,
and the value of PL_reg_match_utf8.

Currently all the callers of the engine (such as pp_match, pp_split etc)
initially use RX_MATCH_UTF8_set() before calling the engine. This sets both
the RXf_MATCH_UTF8 flag on the regex, and PL_reg_match_utf8.

Then the two entry points to the engine (regexec_flags() and
re_intuit_start()) initially repeat the RX_MATCH_UTF8_set()

Remove the usage of RX_MATCH_UTF8_set() by the callers of the engine,
and instead just rely on the engine to do it.

Also, remove the "secret" setting of PL_reg_match_utf8 by
RX_MATCH_UTF8_set(), and do it explicitly.

This is a prelude to eliminating PL_reg_match_utf8.

9 years agoadd regmatch_eval_state struct
David Mitchell [Sun, 19 May 2013 08:38:23 +0000 (09:38 +0100)]
add regmatch_eval_state struct

Replace several PL_reg* vars with a new struct. This is part of the
goal of removing all global regex state.

These particular vars are used in the case of a regex with (?{}) code
blocks. In this case, when the code in a block is called, various bits of
state (such as $1, pos($_)) are temporarily set up, even though the match
has not yet completed.

This involves updating the current PL_curpm to point to a fake PMOP which
points to the regex currently being executed. That regex has all its
current fields that are associated with captures (such as subbeg)
temporarily saved and overwritten with the current partial match results.
Similarly, $_ is temporarily aliased to the current match string, and any
old pos() position is saved. This saving was formerly done to the various
PL_reg* vars.

When the regex has finished executing (or if the code block croaks),
its fields are restored to the original values. Since this can happen in a
croak, it may be done using SAVEDESTRUCTOR_X() on the save stack. This
precludes just moving the PL_reg* vars into the regmatch_info struct,
since that is just allocated as a local var in regexec_flags(), and would
have already been abandoned and possibly overwritten after the croak and
longjmp, but before the SAVEDESTRUCTOR_X() action is taken.

So instead we put all the vars into new struct, and malloc that on entry to
the regex engine when we know we need to copy the various fields.
We save a pointer to that in the regmatch_info struct, as well as passing
it to SAVEDESTRUCTOR_X(). The destructor may get called up to twice in the
non-croak case: first it's called explicitly at the end of regexec_flags(),
which restores subbeg etc; then again from the savestack, which just
free()s the struct. In the croak case, it's called just once, and does
both the restoring and the freeing.

The vars / PL_reg_state fields this commit eliminates are:


9 years agoS_setup_eval_state(): always set up destructor
David Mitchell [Sat, 18 May 2013 16:44:40 +0000 (17:44 +0100)]
S_setup_eval_state(): always set up destructor

This function only set up a destructor if reginfo->sv existed. If not,
some stuff which was set up wouldn't be restored if the code died within a
(?{}) block.

As it happens, the way the regex engine is called from perl core means we
always pass a valid SV; but in theory someone could call the engine from
XS while passing just a string and no SV.

9 years agoS_regtry(): move eval setup code into separate fn
David Mitchell [Sat, 18 May 2013 16:25:44 +0000 (17:25 +0100)]
S_regtry(): move eval setup code into separate fn

There's a block of code in S_regtry() that looks a bit like:

    if ((prog->extflags & RXf_EVAL_SEEN) && not_yet_done)

Move this block of code out into a separate static function,
S_setup_eval_state(). No functional changes.

Also, rename the corresponding static cleanup/destructor function from
restore_pos() to S_restore_eval_state(), to better reflect what it does
these days (restoring pos() being only a small part of it).

9 years agoremove unused reginfo->bol field
David Mitchell [Sat, 18 May 2013 14:44:03 +0000 (15:44 +0100)]
remove unused reginfo->bol field

9 years agoeliminate PL_bostr
David Mitchell [Sat, 18 May 2013 14:40:47 +0000 (15:40 +0100)]
eliminate PL_bostr

by moving it from the global PL_reg_state struct to the local reginfo

9 years agoadd strbeg argument to Perl_re_intuit_start()
David Mitchell [Sat, 18 May 2013 14:05:57 +0000 (15:05 +0100)]
add strbeg argument to Perl_re_intuit_start()

(note that this is a change both to the perl API and the regex engine
plugin API).

Currently, Perl_re_intuit_start() is passed an SV, plus pointers to:
where in the string to start matching (strpos); and to the end of the
string (strend).

Unlike Perl_regexec_flags(), it doesn't also have a strbeg arg.
Because of this this, it guesses strbeg: based on the passed SV (if its
svPOK()); or just set to strpos otherwise. This latter can happen if for
example the SV is overloaded. Note also that this latter guess is wrong,
and could in theory make /\b.../ fail.

But just to confuse matters, although Perl_re_intuit_start() itself uses
its guesstimate strbeg var, some of the functions it calls use the global
value of PL_bostr instead. To make this work, the *callers* of
Perl_re_intuit_start() currently set PL_bostr first. This is why \b
doesn't actually break.

The fix to this unholy mess is to simply add a strbeg arg to
Perl_re_intuit_start(). It's also the first step to eliminating PL_bostr

9 years agofind_byclass, regrepeat: remove is_utf8_pat arg
David Mitchell [Sat, 18 May 2013 12:25:36 +0000 (13:25 +0100)]
find_byclass, regrepeat: remove is_utf8_pat arg

Remove the is_utf8_pat arg from these two static functions in regexec.c.
Since both these functions are now passed a valid reginfo pointer, this
info is already available as one of the fields in that struct.

9 years agoeliminiate PL_regeol
David Mitchell [Fri, 17 May 2013 16:38:26 +0000 (17:38 +0100)]
eliminiate PL_regeol

This is another global regex state variable (actually a field of
PL_reg_state). Eliminate it by moving it into the regmatch_info struct
instead, which is local to each match. Also, rename it to strend, which is
a less misleading description in these exciting days of multi-line matches.

9 years agomake more use of regmatch_info struct.
David Mitchell [Fri, 17 May 2013 16:38:00 +0000 (17:38 +0100)]
make more use of regmatch_info struct.

regmatch_info is a small struct that is currently directly allocated as a
local var in Perl_regexec_flags(), and has a few fields that maintain part
of the state of the current pattern match. It is passed as an arg to
various functions that regexec_flags() calls, such as regtry().

In some ways its a rival to PL_reg_state, which also maintains state for
the current match, but which is a global variable (whose state needs
saving and restoring whenever the regex engine goes reentrant). It makes
more sense to store state in the regmatch_info struct, and as a first step
in moving more state to there, this commit makes more use of

In particular, it makes Perl_re_intuit_start() also allocate such a
struct, so that now *both* the main execution entry points to the regex
engine make use of it. It's also now passed as an arg to more of the static
functions that these two op-level ones call.

Two changes of special note. First, whether S_find_byclass() got called
with a null reginfo pointer of not indicated whether it had been called
from Perl_regexec_flags() (with a valid reginfo pointer), or from
Perl_re_intuit_start() (null pointer). Since they both pass non-null
reginfo pointers now, instead we add an extra field, reginfo->intuit that
indicates who's the top-level caller.

Secondly, to allow in future for various macros to uniformly refer to
values like reginfo->foo, where the structure is actually allocated as a
local var in Perl_regexec_flags(), we change the reginfo from being the
struct itself to being a pointer to the struct, (so Perl_regexec_flags
itself now uses reginfo->foo too rather than

In summary, all the above is essentially window dressing that makes no
functional changes to the code, but will facilitate future changes.

9 years agoFix crashes after syntax errors in lexical subs
Father Chrysostomos [Sun, 2 Jun 2013 20:25:24 +0000 (13:25 -0700)]
Fix crashes after syntax errors in lexical subs

Peter Martini fixed this in commit 89e006ae4e39db for our subs.
(Thank you, BTW, if you are reading this.)

The warning is expected; the assertion failure is not:

$ ./miniperl -Ilib -Mfeature=:all -e 'state sub a { is ref } a()'
The lexical_subs feature is experimental at -e line 1.
Assertion failed: (hek), function Perl_ck_subr, file op.c, line 10558.
Abort trap: 6
$ ./miniperl -Ilib -Mfeature=:all -e 'my sub a { is ref } a()'
The lexical_subs feature is experimental at -e line 1.
Assertion failed: (SvTYPE(_svmagic) >= SVt_PVMG), function S_mg_findext_flags, file mg.c, line 398.
Abort trap: 6

The prototype CV for a my sub is stored in magic attached to the pad
name.  The.  The code to fetch the prototype CV for a my sub calls
mg_find on the pad name.  If a syntax error occurs when the sub is be
ing compiled, the magic will never be attached, so the pad name (pad
names are currently SVs) will not have been upgraded to SVt_PVMG,
causing an assertion failure in mg_find, which only accepts SVs
thus upgraded.

When a pad entry is created, it is automatically filled with an empty
SV of the appropriate type.  For a subroutine, this is a nameless CV
stub.  CVs can be named in two ways, via GVs for package subs, or via
heks for lexical subs.  This stub has neither and is truly nameless.
Since a lexical sub is never installed if it contains a syntax error,
this stub is visible during subsequent compilation in the same scope.
ck_subr wasn’t prepared to handle a stub with absolutely no name
attached to it, since it is designed for handling sub calls where the
sub is known at compile time, so there must be a GV available to it,
unless the sub is lexical, and all lexical subs have heks.

This commit fixes the assumptions in both places.  Exactly what hap-
pens and what is returned is not so important, as this only hap-
pens after a syntax error, when the op tree is going to be thrown
away anyway.

9 years ago[perl #116735] Honour lexical prototypes when no parens are used
Father Chrysostomos [Sun, 2 Jun 2013 07:54:09 +0000 (00:54 -0700)]
[perl #116735] Honour lexical prototypes when no parens are used

As Peter Martini noted in ticket #116735, lexical subs produce dif-
ferent op trees for ‘foo 1’ and ‘foo(1)’.  foo(1) produces an rv2cv
op with a padcv kid.  The unparenthetical version produces just
a padcv op.

And the difference in op trees caused lexical sub calls to honour
prototypes only in the presence of parentheses, because rv2cv_op_cv
(which searches for the cv in order to check its prototype) was
expecting rv2cv+padcv.

Not realising there was a discrepancy between the two forms, and
noticing that foo() produces *two* newCVREF ops, in commit 279d09bf893
I made newCVREF return just a padcv op for lexical subs.  At the time
I couldn’t figure out why there were two rv2cv ops, and punted on
researching it.

This is how it works for package subs:

When a sub call is compiled, if there are parentheses, an implicit '&'
is fed to the parser.  The token that follows is a WORD token with a
constant op attached to it, containing the name of the subroutine.
When the parser sees '&', it calls newCVREF on the const op to create
an rv2cv op.

For sub calls without parentheses, the token passed to the parser is
already an rv2cv op.

The resulting op tree is the same either way.

For lexical subs, I had the lexer emitting an rv2cv op in both paths,
which was why we got the double rv2cv when newCVREF was returning an
rv2cv for lexical subs.

The real solution is to call newCVREF in the lexer only when there
are no parentheses, since in that case the lexer is not going to call
newCVREF itself.  That avoids a redundant newCVREF call.  Hence, we
can have newCVREF always return an rv2cv op.

The result is that ‘foo(1)’ and ‘foo 1’ produce identical op trees for
a lexical sub.

One more thing needed to change:  The lexer was not looking at the
lexical prototype CV but simply the stub to be autovivified, so it
couldn’t see the parameter prototype attached to the CV (the stub
doesn’t have one).

The lexer needs to see the parameter prototype too, in order to deter-
mine precedence.

The logic for digging through pads to find the CV has been extracted
out of rv2cv_op_cv into a separate (non-API!) routine.

9 years agoName lexical constants
Father Chrysostomos [Sun, 2 Jun 2013 01:39:33 +0000 (18:39 -0700)]
Name lexical constants

$ ./perl -Ilib -Mfeature=:all -e 'my sub a(){44} a()'
The lexical_subs feature is experimental at -e line 1.
Assertion failed: (hek), function Perl_ck_subr, file op.c, line 10558.
Abort trap: 6

The experimental warning is expected.  The assertion failure is not.

When a call checker is invoked, the name of the subroutine is passed
to it.  op.c:ck_subr gets the name from the CV’s cv (CvGV) or, in the
case of lexical subs, from its name hek (CvNAME_HEK).  If neither
exists, ck_subr cannot cope.

Lexical subs never have a GV pointer.  Lexical constants were acci-
dentally having neither a GV pointer nor a hek.  They should have a
hek, like other lexical subs.

9 years agolexsub.t: To-do tests for citing lex subs after errors
Father Chrysostomos [Sat, 1 Jun 2013 13:28:12 +0000 (06:28 -0700)]
lexsub.t: To-do tests for citing lex subs after errors

This currently causes assertion failures on debugging builds.  On
non-debugging builds (untested), it probably crashes:

my sub a { foo ref } # foo must not exist

9 years agoUpdate Pod-Usage to CPAN version 1.63
Chris 'BinGOs' Williams [Sun, 2 Jun 2013 08:22:51 +0000 (09:22 +0100)]
Update Pod-Usage to CPAN version 1.63


1.63 (marekr)
- CPAN#85477: Module version not updated in last release
- CPAN#85478: typo fixes

9 years ago[perl #118237] Fix coreamp.t’s rand test
Father Chrysostomos [Sun, 2 Jun 2013 07:36:33 +0000 (00:36 -0700)]
[perl #118237] Fix coreamp.t’s rand test

when rand returns something really small that does not
begin with 0, such as 2.90736361456823e-05.

9 years agoStop constant inlining from countermanding ‘use subs’
Father Chrysostomos [Sun, 2 Jun 2013 07:31:27 +0000 (00:31 -0700)]
Stop constant inlining from countermanding ‘use subs’

Ever since

commit f7461760003db2ce68155c97ea6c1658e96fcd27
Author: Zefram <>
Date:   Sun Nov 8 15:03:45 2009 +0100

    Bareword sub lookups

this has failed:

$ perl5.10 -le 'use subs "abs";  sub abs() {44}; print abs + abs'
$ perl5.12 -le 'use subs "abs";  sub abs() {44}; print abs + abs'

A GV holding a single constant is a candidate for downgrading after
it uhas been used.  The GV gets downgraded after the first ‘abs’ is
inlined.  In the process, the CV-imported flag, which is stored in the
GV, not the CV, is lost, preventing &abs from overriding the built-in
function on the second mention.

There is a special flag for RVs, namely SVprv_PCS_IMPORTED,
which indicates that, when expanded to GVs, they should have the
GVf_IMPORTED_CV flag set.  But gv_try_downgrade wasn‘t setting
that flag.

9 years agoUpdate Filter-Util-Call to CPAN version 1.49
Chris 'BinGOs' Williams [Sat, 1 Jun 2013 20:58:02 +0000 (21:58 +0100)]
Update Filter-Util-Call to CPAN version 1.49


1.46 2013-03-29 rurban

  * Fix RT #84292 PIPE_PID/waitpid broken in Exec pipe_read since 5.17.6 (rurban)

  * Fix RT #84210 Bad NAME in Makefile.PL (miyagawa)

  * Fix RT #82687 cpansign MANIFEST failure (myra)

  * Work on RT #41285 test failures with non-english locale (reported by srezic)

  * Skip patching the src for newWarnings style, these are the default (rurban)

  * Fix RT #53132 examples/method/ syntax error (kevin ryde)
    and add usage docs.

1.47 2013-03-31 rurban

  * Reproduced and fixed RT #41285 test failures with non-english locale
    (reported by srezic)

1.48 2013-04-01 rurban

  * added META records, such as repository, recommends to Makefile.PL

  * added META and POD tests

1.49 2013-04-02 rurban

  * Better fix for RT #41285 test failures with non-english locale
    (patched by srezic, pull #1)

  * Add t/z_*.t meta tests (now for real), move Try to t/FilterTry,
    add POD to Filter::Util::Call, Filter::Util::Exec and generated

9 years agoUpdate Pod-Parser to CPAN version 1.61
Chris 'BinGOs' Williams [Sat, 1 Jun 2013 20:47:07 +0000 (21:47 +0100)]
Update Pod-Parser to CPAN version 1.61


 01-Jun-2013           Marek Rouchal                        <>
 Version 1.61
 + CPAN#85656 fix typos in comments

9 years agoCorrect three sub call comments in perly.y
Father Chrysostomos [Sat, 1 Jun 2013 03:24:31 +0000 (20:24 -0700)]
Correct three sub call comments in perly.y

NOAMP is only emitted by toke.c when there are no parentheses.  If
there is a parenthesis following a word, the lexer conjures up an '&'
token from nowhere.

9 years agotoke.c: Under -DT, report pending idents more clearly
Father Chrysostomos [Sat, 1 Jun 2013 01:27:19 +0000 (18:27 -0700)]
toke.c: Under -DT, report pending idents more clearly

These are treated as forced tokens of type 'p'.  Indicate what the 'p'
means in the debug output.


### forced token:
### <== 'p'

becomes this:

### forced token:
### <== 'p' (pending identifier)

9 years agoFix ExtUtils::Constant test failure on VMS.
Craig A. Berry [Sat, 1 Jun 2013 01:26:11 +0000 (20:26 -0500)]
Fix ExtUtils::Constant test failure on VMS.

Awaiting upstream application for many months now at:

But it's not at all clear that this module is even maintained as
the only two "maintainers" are former pumpkings who probably had
to become maintainers in order to cut a Perl release.

From the message originally submitted upstream:

It turns out the easiest and most robust way to handle the fact that
filename case may or may not be preserved is simply to do all
filename comparisons in a case blind fashion.  This is safe to do
because there is no practical possibility of distinct filenames that
differ only by case, especially with the short list of well-known
files being considered here.

9 years agoupdate link for DTrace user guide
Ricardo Signes [Fri, 31 May 2013 22:15:57 +0000 (18:15 -0400)]
update link for DTrace user guide

9 years agoUpdate the GSMATCH handling in vms/
Craig A. Berry [Fri, 31 May 2013 21:23:24 +0000 (16:23 -0500)]
Update the GSMATCH handling in vms/

This code (which only runs if you have set PERLSHR_USE_GSMATCH in
the environment) has not been updated in a long time.  It was
assuming that $] had only five digits after the decimal, whereas
it's had six for some time. And it assumed that the Perl5 version
could be represented in 4 bits, which was true up through 5.15
but isn't true anymore.

So get all the digits of the version number, and go wild and spend
5 bits on the value of $Config{PERL_VERSION}, which will get us
through 5.31.  That only leaves three bits in which to encode all
the options that could break binary compatibility, whereas in fact
we need about thirty bits.

So clearly this only works in a situation where the configuration
can be standardized and/or different configurations are packaged

9 years agoiperlipc: s/multithreading/multitasking/
Shlomi Fish [Fri, 31 May 2013 13:48:04 +0000 (14:48 +0100)]
iperlipc: s/multithreading/multitasking/

Replace some occurrences of "multithreading" in perlipc.pod
where they actually refer to multi-processing, with "multitasking".

9 years agocorrect example for turning of experimental warnings
Ricardo Signes [Fri, 31 May 2013 00:05:37 +0000 (20:05 -0400)]
correct example for turning of experimental warnings

Original patch from Thomas Klausner <>, tweaked with a
suggestion by Karen Etheridge <>.

9 years agoUpdate Text-Tabs to CPAN version 2013.0523
Chris 'BinGOs' Williams [Thu, 30 May 2013 16:16:14 +0000 (17:16 +0100)]
Update Text-Tabs to CPAN version 2013.0523


  = 2013/05/23

  Change module 'NAME'

  = 2013/05/22


  = 2013/04/26

  Minor test suite fixes - bug 81698.

  Fixed bug 79766 -- an extraneous "=" in a regex.

  Changed the license to qualify as an "open source" license.

9 years agoCPAN-Meta bugfix exposed an assumption in EUMM tests, fix that.
Chris 'BinGOs' Williams [Thu, 30 May 2013 16:46:22 +0000 (17:46 +0100)]
CPAN-Meta bugfix exposed an assumption in EUMM tests, fix that.

9 years agoCPAN-Meta has changed so regenerate the META.* files
Chris 'BinGOs' Williams [Thu, 30 May 2013 16:32:26 +0000 (17:32 +0100)]
CPAN-Meta has changed so regenerate the META.* files

9 years agoUpdate CPAN-Meta to CPAN version 2.131490
Chris 'BinGOs' Williams [Thu, 30 May 2013 15:43:05 +0000 (16:43 +0100)]
Update CPAN-Meta to CPAN version 2.131490


  2.131490  2013-05-29 14:15:16 America/New_York


  - Downconversion of custom resources was not dropping the leading "x_".
    Now "x_MailingList" will downconvert correctly to "MailingList".


  - Per the Lancaster Consensus, the 'file' subkey of a package listed in
    'provides' must refer to an actual file in the distribution, either the
    .pm file that provides the package or another file (*.PL) that
    generates it

9 years agogit-deltatool: show files changed when tagging new commits
David Golden [Wed, 29 May 2013 20:40:53 +0000 (16:40 -0400)]
git-deltatool: show files changed when tagging new commits

9 years agogit-deltatool: fix problem reading changed commit message
David Golden [Wed, 29 May 2013 19:50:55 +0000 (15:50 -0400)]
git-deltatool: fix problem reading changed commit message

9 years agoCache HvFILL() for larger hashes, and update on insertion/deletion.
Nicholas Clark [Mon, 11 Mar 2013 11:42:32 +0000 (11:42 +0000)]
Cache HvFILL() for larger hashes, and update on insertion/deletion.

This avoids HvFILL() being O(n) for large n on large hashes, but also avoids
storing the value of HvFILL() in smaller hashes (ie a memory overhead on
every single object built using a hash.)

9 years agoUpgrade to threads 1.87
Jerry D. Hedden [Tue, 28 May 2013 15:20:56 +0000 (11:20 -0400)]
Upgrade to threads 1.87

9 years ago[perl #117081] Deparse foreach my $lexical correctly under -p
Father Chrysostomos [Tue, 28 May 2013 16:52:22 +0000 (09:52 -0700)]
[perl #117081] Deparse foreach my $lexical correctly under -p

The lexical topic in foreach is not allowed to have parentheses around
it, but B::Deparse was putting parentheses there when the -p option
was specified.

9 years agoperlthrtut: Shorten/rewrap long lines
Father Chrysostomos [Tue, 28 May 2013 01:18:20 +0000 (18:18 -0700)]
perlthrtut: Shorten/rewrap long lines

9 years agoremove the expectation of a "P" command
Ricardo Signes [Tue, 28 May 2013 13:01:21 +0000 (09:01 -0400)]
remove the expectation of a "P" command

This command was introduced for the ill-fated assertions system,
then *mostly* removed by commit 584420f022.

Reported as [perl #118191] and [perl #118185]

9 years agoMerge in various enhancements to and
Nicholas Clark [Tue, 28 May 2013 07:19:34 +0000 (09:19 +0200)]
Merge in various enhancements to and

9 years agoAdd -q to git clean in
Nicholas Clark [Mon, 27 May 2013 15:19:43 +0000 (17:19 +0200)]
Add -q to git clean in

This makes the output considerably less verbose. In particular, it becomes a
lot easier to spot the "revisions left to test after this" status message
from git bisect.

9 years agoThree Configure fixups so that can build 1997-era 5.004
Nicholas Clark [Tue, 26 Feb 2013 19:52:56 +0000 (20:52 +0100)]
Three Configure fixups so that can build 1997-era 5.004

Specifically, so that it can build revisions near 15f0808c5d67b362.

9 years should match patches with directory 'b' before 'a'.
Nicholas Clark [Tue, 26 Feb 2013 19:50:46 +0000 (20:50 +0100)] should match patches with directory 'b' before 'a'.

The pattern to extract the file for diagnostics should a patch not apply was
failing to match (and generating a legitimate used of uninitialized value
warning) for the case where the patch was specified as --- b/ +++ a/
The pattern was only expecting --- a/ +++ b/

9 years agoAdd a 'none' target to
Nicholas Clark [Wed, 1 Aug 2012 11:55:58 +0000 (13:55 +0200)]
Add a 'none' target to

This runs the user's test case directly against a clean checkout.
Using this gives a couple of features that a plain git bisect run can't
offer - automatic start revision detection, and test case timeouts.

9 years can now optionally timeout the user's test case.
Nicholas Clark [Tue, 31 Jul 2012 16:54:24 +0000 (18:54 +0200)] can now optionally timeout the user's test case.

This permits bisection to locate the cause (or cure) of bugs which cause
programs to hang. When using a timeout, defaults to
running the test case in its own process group, and tries hard to ensure
that all processes in that process group are killed if the timeout fires.

9 years agoAdd an option to to run the user testcase in its own process group.
Nicholas Clark [Tue, 31 Jul 2012 14:05:58 +0000 (16:05 +0200)]
Add an option to to run the user testcase in its own process group.

9 years agoIn, run_report_and_exit() now uses run_with_options().
Nicholas Clark [Tue, 31 Jul 2012 13:17:48 +0000 (15:17 +0200)]
In, run_report_and_exit() now uses run_with_options().

9 years agoIn, extract the Configure running into run_with_options().
Nicholas Clark [Tue, 31 Jul 2012 13:06:33 +0000 (15:06 +0200)]
In, extract the Configure running into run_with_options().

Configure is run using explicit fork, exec and waitpid so that it can be run
with with STDIN from /dev/null, but without going through the shell (to
avoid having to worry about quoting command line arguments). This code will
be useful for adding optional timeouts when running the user test case.

9 years agoIn, invert the first parameter to report_and_exit().
Nicholas Clark [Tue, 31 Jul 2012 12:28:46 +0000 (14:28 +0200)]
In, invert the first parameter to report_and_exit().

A true first parameter now means "good". Previously the first parameter was
assumed to be a return value from system, and hence true meant "bad".

9 years agoIn, refactor the calls to system @ARGV into a function.
Nicholas Clark [Tue, 31 Jul 2012 10:59:42 +0000 (12:59 +0200)]
In, refactor the calls to system @ARGV into a function.

This will permit the addition of timeouts when running the test user's case.

9 years can run in-place if the checkout is totally clean.
Nicholas Clark [Tue, 31 Jul 2012 10:40:33 +0000 (12:40 +0200)] can run in-place if the checkout is totally clean.

Copy to a tempfile, and use that with git bisect run.

9 years agoIf there is no 'blead' branch, now uses a suitable alternative.
Nicholas Clark [Fri, 6 Jul 2012 15:35:08 +0000 (17:35 +0200)]
If there is no 'blead' branch, now uses a suitable alternative.

If HEAD is more recent than the last stable release (ie the latter is
reachable from the former), HEAD is used for the bisect end, otherwise the
last stable tag is used (and that release removed from the list of potential
starts to try).

9 years agoAdd --gold option to for the revision to use for "recent" files.
Nicholas Clark [Fri, 6 Jul 2012 15:00:35 +0000 (17:00 +0200)]
Add --gold option to for the revision to use for "recent" files.

Historically when wanted to check out a known good recent
version of a file (such as makedepend.SH) it would check out the revision
from blead. However, that may not be wise as blead isn't guaranteed always to
be stable and therefore "known good". So default to using the most recent
tagged stable release.

9 years always needs to pass paths gleaned from gcc to Configure.
Nicholas Clark [Thu, 5 Jul 2012 14:00:44 +0000 (16:00 +0200)] always needs to pass paths gleaned from gcc to Configure.

Commits fdbac266ba9ef2a6 and 599ee4f7809ae508 ensure that /usr/local/lib,
/lib and /usr/lib are searched on all platforms for shared libraries, and
that multiarch library locations gleaned from gcc are searched on x86_64.
However, on other Linux architectures it fails to pass the multiarch
locations to Configure. Version (just) prior to 5.14.0 do not contain the
logic to ask gcc, so they fail to build on multiarch setups.

This commit ensures that the correct library locations are available on
all platforms.

9 years agoWhen bisecting, use `git tag -l` to get the list of stable releases.
Nicholas Clark [Wed, 4 Jul 2012 13:34:31 +0000 (14:34 +0100)]
When bisecting, use `git tag -l` to get the list of stable releases.

Previously was using a hard coded list, which (obviously) will
become stale.

Also, note in the docs that we only use .0 stable releases, and why.

9 years needs to probe DB_File.xs before running Configure
Nicholas Clark [Wed, 4 Jul 2012 12:52:19 +0000 (13:52 +0100)] needs to probe DB_File.xs before running Configure

Commit f2f0a0ff7250e0ba (in Nov 2011), consolidated all the code that
patches extensions. As a side effect, it moved all extension patching
after Configure is run. Unfortunately this introduced a bug, because one
test of DB_File.xs was to change the arguments to Configure to skip building
DB_File at all if it's too old. Return this logic to before when Configure
is run, so that can once again build 5.005 and earlier on
machines with the Berkley DB headers installed, by forcibly skipping the
build of DB_File there.

9 years needs another minor fixup to build 5.004_05 on Linux.
Nicholas Clark [Thu, 10 May 2012 15:47:11 +0000 (17:47 +0200)] needs another minor fixup to build 5.004_05 on Linux. already reverts a sequence of commits to doio.c related to
special case handling of union semun on Linux and Solaris, which cause the
build to fail on current Linux. The last of these, 9b599b2a63d2324d is
described as "[win32] merge change#887 from maintbranch". However, it uses
__sun__ and __svr4__ instead of the __sun and __SVR4 of the maint branch
commit 6cdf74fe31f049dc. Hence the code in needs to be
taught about this variation in the maint-5.004 branch, so that it can also
unwind the problematic code in doio.c there.

9 years should fix 5.7.x to export Perl_cxinc on AIX.
Nicholas Clark [Thu, 3 May 2012 12:43:11 +0000 (14:43 +0200)] should fix 5.7.x to export Perl_cxinc on AIX.

Without this, about 60 commits in a key area of history fail to build,
between the upgrade of Scalar-List-Utils to 1.03, and the commit that
amends to export Perl_cxinc, which Utils.xs indirectly started
using (via a macro).

9 years should fix a typo in the Solaris hints file.
Nicholas Clark [Wed, 2 May 2012 09:26:15 +0000 (11:26 +0200)] should fix a typo in the Solaris hints file.

Without this typo fix about 700 revisions from 5.13.10 to 5.14.0-RC1 can't
be built on Solaris with Sun's compiler.

9 years agoTweak to make it clearer what to do if your working space is dirty
Yves Orton [Mon, 16 Apr 2012 18:23:32 +0000 (20:23 +0200)]
Tweak to make it clearer what to do if your working space is dirty

If you try to biect in a directory with .gitignore'd files in it
bisect will refuse to run. Since these files arent shown by status
this can cause some head scratching.

This patch makes it more obvious what is wrong by showing the listed
files and suggesting git clean as a solution. I deliberately did not
document the command to clean up untracked files, so people wouldn't
knee jerk paste it somewhere and lose something important. And by people
I mean me. :-) Thus it just shows the command to wipe ignored files,
which I figure is safe.

9 years agoAdd a --valgrind option to, to run the test program with valgrind.
Nicholas Clark [Fri, 13 Apr 2012 14:49:24 +0000 (16:49 +0200)]
Add a --valgrind option to, to run the test program with valgrind.

Specifically this option prepends valgrind --error-exitcode=124
to the command line, so that git bisect run will treat this revision as a
failure if valgrind finds any problems.

9 years will now invoke with ./perl -Ilib if it sees a #!./perl line
Nicholas Clark [Fri, 13 Apr 2012 14:00:49 +0000 (16:00 +0200)] will now invoke with ./perl -Ilib if it sees a #!./perl line

If the first argument of the test case given to is a readable
file with a #! line of ./perl or ./miniperl (only), with
prepend ./perl -Ilib or ./miniperl -Ilib to the command sent to system.
This increases flexibility somewhat, and will avoid problems with
inconsistencies between directly running system(...), and running
system('valgrind', ...). The former accepts a #!./perl line, the latter sends
it to /bin/sh.

9 years should fix Makefile.SH to remove remove GNU make-isms.
Nicholas Clark [Thu, 12 Apr 2012 19:50:11 +0000 (21:50 +0200)] should fix Makefile.SH to remove remove GNU make-isms.

Commit c7b956bbbaff0c46 inadvertently added a GNU (and BSD) make specific
construction to the *nix Makefile, which other platforms' makes choke on.
It was corrected with commit cfe76a0a8e5b6f21 (and 0961731461727bea), but
those changes are not the simplest way to get things passing again, so use
a simpler custom patch here.

9 years agoAdd --early-fixup and --late-fixup to, for user-controlled patching.
Nicholas Clark [Mon, 9 Apr 2012 13:14:32 +0000 (15:14 +0200)]
Add --early-fixup and --late-fixup to, for user-controlled patching.

These provide a way to run code or to conditionally or unconditionally
apply patches for each revision tested during git bisect. This is very
useful when for the commit range, operating system and configuration options
tested, the behaviour otherwise would be to fail to build for a wide range
of revisions, and hence the bisect would finish without finding culprit
commit due to getting bogged down in 'skipped' revisions.

9 years agoAdd --all-fixups to, to apply all patches and fixups.
Nicholas Clark [Mon, 9 Apr 2012 09:04:37 +0000 (11:04 +0200)]
Add --all-fixups to, to apply all patches and fixups. will minimally patch various files on a platform and
version dependent basis to get the build to complete. Normally it defers
doing this as long as possible - .SH files aren't patched until after
Configure is run, and C and XS code isn't patched until after miniperl is
built. If --all-fixups is specified, all the fixups are done before running

9 years should always exit fatally with 255, to abort the bisect.
Nicholas Clark [Mon, 9 Apr 2012 08:18:34 +0000 (10:18 +0200)] should always exit fatally with 255, to abort the bisect.

Don't use die or croak, as these will exit with the value of $! or $? instead
of 255, and git bisect doesn't treat these as fatal errors, but ploughs on
before inevitably failing messily for some other reason, concealing the true
error message.

9 years agoIn, refactor the system ... and die; into system_or_die().
Nicholas Clark [Mon, 9 Apr 2012 09:31:25 +0000 (11:31 +0200)]
In, refactor the system ... and die; into system_or_die().

9 years agoWhen testing the end version, should treat a 'skip' as fatal.
Nicholas Clark [Mon, 9 Apr 2012 07:25:09 +0000 (09:25 +0200)]
When testing the end version, should treat a 'skip' as fatal.

git bisect uses exit code 125 to signal a skip. Previously would
treat 125 just like every other non-zero exit code, assume that it meant
'fail', and if 'fail' was expected for the end version then it would start
the bisect run as normal. Which isn't useful, as it means that there's a
problem with the user's test case.

9 years should search for lib*.a as well as lib*.so
Nicholas Clark [Mon, 9 Apr 2012 07:14:21 +0000 (09:14 +0200)] should search for lib*.a as well as lib*.so

When forcing the library list on earlier perls to avoid versioned shared
objects, also look for static libraries. Also, ensure
searches additional library paths given to it via -Alibpth

Without this, one can't test build against static libraries in non-standard

9 years should use ".$Config{dlext}" instead of hard-coding ".so".
Nicholas Clark [Mon, 9 Apr 2012 06:38:08 +0000 (08:38 +0200)] should use ".$Config{dlext}" instead of hard-coding ".so".

9 years agoTeach that on HP-UX, _filbuf() is named __filbuf().
Nicholas Clark [Mon, 9 Apr 2012 06:05:16 +0000 (08:05 +0200)]
Teach that on HP-UX, _filbuf() is named __filbuf().

This is all that is needed to build 5.003 and earlier. can validate
all stable versions from blead back to 5.002

9 years needs to know how to identify HP-UX's patch.
Nicholas Clark [Mon, 9 Apr 2012 06:02:38 +0000 (08:02 +0200)] needs to know how to identify HP-UX's patch.

Unlike AIX, HP-UX patch offers no meaningful clue as to its upstream version:

$ patch -v
$Header: patch.c,v 2001/12/03 12:24:52 abhinav Exp $
Patch level: 0

But it ignores unified diffs, so assume the worst and feed it context diffs.

9 years agoOn HP-UX, bisect without any -j option as the system make is "special".
Nicholas Clark [Tue, 10 Apr 2012 13:18:03 +0000 (15:18 +0200)]
On HP-UX, bisect without any -j option as the system make is "special".

HP-UX system make offers parallelism with -P not -j. (But doesn't deliver on
it, so we're not going to attempt to work round its crankiness and failings.)

9 years agoIn bisect{,-runner}.pl, refactor the code for CPU probing and make jobs.
Nicholas Clark [Tue, 10 Apr 2012 08:37:41 +0000 (10:37 +0200)]
In bisect{,-runner}.pl, refactor the code for CPU probing and make jobs.

Move the code that attempts various ways to probe for the number of CPUs
from to Skip the probe entirely if a -j (--jobs)
options is passed to For --jobs=0 (or -j0) entirely skip adding
-j to the make command line. (For heretical versions of make which don't use
-j for parallelism).

Previously the probe code always ran for each call to,
which is completely redundant if is being called for
argument validation or help text, and inefficient even when building, as the
number of CPUs rarely changes during a bisect run. Additionally there was no
way to avoid a -j in the make command line, which isn't going to fly on
systems where the make utility doesn't have a -j option.

9 years agodiag.t, perldiag.pod: Make sure S is used for Perl_warn
Father Chrysostomos [Tue, 28 May 2013 01:02:21 +0000 (18:02 -0700)]
diag.t, perldiag.pod: Make sure S is used for Perl_warn

Perl_warn does not allow a category, and is not used in conjunction
with ckWARN checks (if it is, that is a bug, as such warnings will
be emitted when the category is enabled, but not fatal when the
category is fatal).  So such warnings are mandatory and should be
marked with S.