This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
perlapi: Consolidate sv_catpv-ish entries
[perl5.git] / pod / perlhack.pod
1 =encoding utf8
2
3 =for comment
4 Consistent formatting of this file is achieved with:
5   perl ./Porting/podtidy pod/perlhack.pod
6
7 =head1 NAME
8
9 perlhack - How to hack on Perl
10
11 =head1 DESCRIPTION
12
13 This document explains how Perl development works.  It includes details
14 about the Perl 5 Porters email list, the Perl repository, the Perl
15 bug tracker, patch guidelines, and commentary on Perl development
16 philosophy.
17
18 =head1 SUPER QUICK PATCH GUIDE
19
20 If you just want to submit a single small patch like a pod fix, a test
21 for a bug, comment fixes, etc., it's easy! Here's how:
22
23 =over 4
24
25 =item * Check out the source repository
26
27 The perl source is in a git repository.  You can clone the repository
28 with the following command:
29
30   % git clone https://github.com/Perl/perl5.git perl
31
32 =item * Ensure you're following the latest advice
33
34 In case the advice in this guide has been updated recently, read the
35 latest version directly from the perl source:
36
37   % perldoc pod/perlhack.pod
38
39 =item * Create a branch for your change
40
41 Create a branch based on blead to commit your change to, which will
42 later be used to send it to the Perl issue tracker.
43
44   % git checkout -b mychange
45
46 =item * Make your change
47
48 Hack, hack, hack.  Keep in mind that Perl runs on many different
49 platforms, with different operating systems that have different
50 capabilities, different filesystem organizations, and even different
51 character sets.  L<perlhacktips> gives advice on this.
52
53 =item * Test your change
54
55 You can run all the tests with the following commands:
56
57   % ./Configure -des -Dusedevel
58   % make test
59
60 Keep hacking until the tests pass.
61
62 =item * Commit your change
63
64 Committing your work will save the change I<on your local system>:
65
66   % git commit -a -m 'Commit message goes here'
67
68 Make sure the commit message describes your change in a single
69 sentence.  For example, "Fixed spelling errors in perlhack.pod".
70
71 =item * Send your change to the Perl issue tracker
72
73 The next step is to submit your patch to the Perl core ticket system.
74
75 Create a GitHub fork of the perl5 repository and add it as a remote,
76 if you haven't already, as described in the GitHub documentation at
77 L<https://help.github.com/en/articles/working-with-forks>.
78
79   % git remote add fork git@github.com:MyUser/perl5.git
80
81 For more information, see L<"Connecting to GitHub with SSH"|https://docs.github.com/en/free-pro-team@latest/github/authenticating-to-github/connecting-to-github-with-ssh>.
82
83 If you'd rather use an HTTPS URL for your C<git push> see L<"Cloning with
84 HTTPS URLs"|https://docs.github.com/en/free-pro-team@latest/github/using-git/which-remote-url-should-i-use#cloning-with-https-urls>.
85
86   % git remote add fork https://github.com/MyUser/perl5.git
87
88 Then, push your new branch to your fork.
89
90   % git push -u fork mychange
91
92 Finally, create a Pull Request on GitHub from your branch to blead as
93 described in the GitHub documentation at
94 L<https://help.github.com/en/articles/creating-a-pull-request-from-a-fork>.
95
96 =item * Thank you
97
98 The porters appreciate the time you spent helping to make Perl better.
99 Thank you!
100
101 =item * Acknowledgement
102
103 All contributors are credited (by name and email address) in the
104 AUTHORS file, which is part of the perl distribution, as well as the
105 Git commit history.
106
107 If you don’t want to be included in the AUTHORS file, just let us
108 know. Otherwise we will take your submission of a patch as permission
109 to credit you in the AUTHORS file.
110
111 =item * Next time
112
113 The next time you wish to make a patch, you need to start from the
114 latest perl in a pristine state.  Check you don't have any local changes
115 or added files in your perl check-out which you wish to keep, then run
116 these commands:
117
118   % git checkout blead
119   % git pull
120   % git reset --hard origin/blead
121   % git clean -dxf
122
123 =back
124
125 =head1 BUG REPORTING
126
127 If you want to report a bug in Perl, or browse existing Perl bugs and
128 patches, use the GitHub issue tracker at
129 L<https://github.com/perl/perl5/issues>.
130
131 Please check the archive of the perl5-porters list (see below) and/or
132 the bug tracking system before submitting a bug report.  Often, you'll
133 find that the bug has been reported already.
134
135 You can log in to the bug tracking system and comment on existing bug
136 reports.  If you have additional information regarding an existing bug,
137 please add it.  This will help the porters fix the bug.
138
139 =head1 PERL 5 PORTERS
140
141 The perl5-porters (p5p) mailing list is where the Perl standard
142 distribution is maintained and developed.  The people who maintain Perl
143 are also referred to as the "Perl 5 Porters", "p5p" or just the
144 "porters".
145
146 A searchable archive of the list is available at
147 L<https://markmail.org/search/?q=perl5-porters>.  There is also an archive at
148 L<https://archive.develooper.com/perl5-porters@perl.org/>.
149
150 =head2 perl-changes mailing list
151
152 The perl5-changes mailing list receives a copy of each patch that gets
153 submitted to the maintenance and development branches of the perl
154 repository.  See L<https://lists.perl.org/list/perl5-changes.html> for
155 subscription and archive information.
156
157 =head2 #p5p on IRC
158
159 Many porters are also active on the L<irc://irc.perl.org/#p5p> channel.
160 Feel free to join the channel and ask questions about hacking on the
161 Perl core.
162
163 =head1 GETTING THE PERL SOURCE
164
165 All of Perl's source code is kept centrally in a Git repository at
166 I<github.com>.  The repository contains many Perl revisions
167 from Perl 1 onwards and all the revisions from Perforce, the previous
168 version control system.
169
170 For much more detail on using git with the Perl repository, please see
171 L<perlgit>.
172
173 =head2 Read access via Git
174
175 You will need a copy of Git for your computer.  You can fetch a copy of
176 the repository using the git protocol:
177
178   % git clone git://github.com/Perl/perl5.git perl
179
180 This clones the repository and makes a local copy in the F<perl>
181 directory.
182
183 If you cannot use the git protocol for firewall reasons, you can also
184 clone via http:
185
186   % git clone https://github.com/Perl/perl5.git perl
187
188 =head2 Read access via the web
189
190 You may access the repository over the web.  This allows you to browse
191 the tree, see recent commits, subscribe to repository notifications,
192 search for particular commits and more.  You may access it at
193 L<https://github.com/Perl/perl5>.
194
195 =head2 Read access via rsync
196
197 You can also choose to use rsync to get a copy of the current source
198 tree for the bleadperl branch and all maintenance branches:
199
200   % rsync -avz rsync://perl5.git.perl.org/perl-current .
201   % rsync -avz rsync://perl5.git.perl.org/perl-5.12.x .
202   % rsync -avz rsync://perl5.git.perl.org/perl-5.10.x .
203   % rsync -avz rsync://perl5.git.perl.org/perl-5.8.x .
204   % rsync -avz rsync://perl5.git.perl.org/perl-5.6.x .
205   % rsync -avz rsync://perl5.git.perl.org/perl-5.005xx .
206
207 (Add the C<--delete> option to remove leftover files.)
208
209 To get a full list of the available sync points:
210
211   % rsync perl5.git.perl.org::
212
213 =head2 Write access via git
214
215 If you have a commit bit, please see L<perlgit> for more details on
216 using git.
217
218 =head1 PATCHING PERL
219
220 If you're planning to do more extensive work than a single small fix,
221 we encourage you to read the documentation below.  This will help you
222 focus your work and make your patches easier to incorporate into the
223 Perl source.
224
225 =head2 Submitting patches
226
227 If you have a small patch to submit, please submit it via the GitHub
228 Pull Request workflow.  You may also send patches to the p5p list.
229
230 Patches are reviewed and discussed on GitHub or the p5p list.  Simple,
231 uncontroversial patches will usually be applied without any discussion.
232 When the patch is applied, the ticket will be updated and you will
233 receive email.
234
235 In other cases, the patch will need more work or discussion.
236 You are encouraged to participate in the discussion and advocate for
237 your patch.  Sometimes your patch may get lost in the shuffle.  It's
238 appropriate to send a reminder email to p5p if no action has been taken
239 in a month.  Please remember that the Perl 5 developers are all
240 volunteers, and be polite.
241
242 Changes are always applied directly to the main development branch,
243 called "blead".  Some patches may be backported to a maintenance
244 branch.  If you think your patch is appropriate for the maintenance
245 branch (see L<perlpolicy/MAINTENANCE BRANCHES>), please explain why
246 when you submit it.
247
248 =head2 Getting your patch accepted
249
250 If you are submitting a code patch there are several things that you
251 can do to help the Perl 5 Porters accept your patch.
252
253 =head3 Patch style
254
255 Using the GitHub Pull Request workflow, your patch will automatically
256 be available in a suitable format.  If you wish to submit a patch to
257 the p5p list for review, make sure to create it appropriately.
258
259 If you used git to check out the Perl source, then using C<git
260 format-patch> will produce a patch in a style suitable for Perl.  The
261 C<format-patch> command produces one patch file for each commit you
262 made.  If you prefer to send a single patch for all commits, you can
263 use C<git diff>.
264
265   % git checkout blead
266   % git pull
267   % git diff blead my-branch-name
268
269 This produces a patch based on the difference between blead and your
270 current branch.  It's important to make sure that blead is up to date
271 before producing the diff, that's why we call C<git pull> first.
272
273 We strongly recommend that you use git if possible.  It will make your
274 life easier, and ours as well.
275
276 However, if you're not using git, you can still produce a suitable
277 patch.  You'll need a pristine copy of the Perl source to diff against.
278 The porters prefer unified diffs.  Using GNU C<diff>, you can produce a
279 diff like this:
280
281   % diff -Npurd perl.pristine perl.mine
282
283 Make sure that you C<make realclean> in your copy of Perl to remove any
284 build artifacts, or you may get a confusing result.
285
286 =head3 Commit message
287
288 As you craft each patch you intend to submit to the Perl core, it's
289 important to write a good commit message.  This is especially important
290 if your submission will consist of a series of commits.
291
292 The first line of the commit message should be a short description
293 without a period.  It should be no longer than the subject line of an
294 email, 50 characters being a good rule of thumb.
295
296 A lot of Git tools (Gitweb, GitHub, git log --pretty=oneline, ...) will
297 only display the first line (cut off at 50 characters) when presenting
298 commit summaries.
299
300 The commit message should include a description of the problem that the
301 patch corrects or new functionality that the patch adds.
302
303 As a general rule of thumb, your commit message should help a
304 programmer who knows the Perl core quickly understand what you were
305 trying to do, how you were trying to do it, and why the change matters
306 to Perl.
307
308 =over 4
309
310 =item * Why
311
312 Your commit message should describe why the change you are making is
313 important.  When someone looks at your change in six months or six
314 years, your intent should be clear.
315
316 If you're deprecating a feature with the intent of later simplifying
317 another bit of code, say so.  If you're fixing a performance problem or
318 adding a new feature to support some other bit of the core, mention
319 that.
320
321 =item * What
322
323 Your commit message should describe what part of the Perl core you're
324 changing and what you expect your patch to do.
325
326 =item * How
327
328 While it's not necessary for documentation changes, new tests or
329 trivial patches, it's often worth explaining how your change works.
330 Even if it's clear to you today, it may not be clear to a porter next
331 month or next year.
332
333 =back
334
335 A commit message isn't intended to take the place of comments in your
336 code.  Commit messages should describe the change you made, while code
337 comments should describe the current state of the code.
338
339 If you've just implemented a new feature, complete with doc, tests and
340 well-commented code, a brief commit message will often suffice.  If,
341 however, you've just changed a single character deep in the parser or
342 lexer, you might need to write a small novel to ensure that future
343 readers understand what you did and why you did it.
344
345 =head3 Comments, Comments, Comments
346
347 Be sure to adequately comment your code.  While commenting every line
348 is unnecessary, anything that takes advantage of side effects of
349 operators, that creates changes that will be felt outside of the
350 function being patched, or that others may find confusing should be
351 documented.  If you are going to err, it is better to err on the side
352 of adding too many comments than too few.
353
354 The best comments explain I<why> the code does what it does, not I<what
355 it does>.
356
357 =head3 Style
358
359 In general, please follow the particular style of the code you are
360 patching.
361
362 In particular, follow these general guidelines for patching Perl
363 sources:
364
365 =over 4
366
367 =item *
368
369 4-wide indents for code, 2-wide indents for nested CPP C<#define>s,
370 with 8-wide tabstops.
371
372 =item *
373
374 Use spaces for indentation, not tab characters.
375
376 The codebase is a mixture of tabs and spaces for indentation, and we
377 are moving to spaces only.  Converting lines you're patching from 8-wide
378 tabs to spaces will help this migration.
379
380 =item *
381
382 Try hard not to exceed 79-columns
383
384 =item *
385
386 ANSI C prototypes
387
388 =item *
389
390 Uncuddled elses and "K&R" style for indenting control constructs
391
392 =item *
393
394 No C++ style (//) comments
395
396 =item *
397
398 Mark places that need to be revisited with XXX (and revisit often!)
399
400 =item *
401
402 Opening brace lines up with "if" when conditional spans multiple lines;
403 should be at end-of-line otherwise
404
405 =item *
406
407 In function definitions, name starts in column 0 (return value-type is on
408 previous line)
409
410 =item *
411
412 Single space after keywords that are followed by parens, no space
413 between function name and following paren
414
415 =item *
416
417 Avoid assignments in conditionals, but if they're unavoidable, use
418 extra paren, e.g. "if (a && (b = c)) ..."
419
420 =item *
421
422 "return foo;" rather than "return(foo);"
423
424 =item *
425
426 "if (!foo) ..." rather than "if (foo == FALSE) ..." etc.
427
428 =item *
429
430 Do not declare variables using "register".  It may be counterproductive
431 with modern compilers, and is deprecated in C++, under which the Perl
432 source is regularly compiled.
433
434 =item *
435
436 In-line functions that are in headers that are accessible to XS code
437 need to be able to compile without warnings with commonly used extra
438 compilation flags, such as gcc's C<-Wswitch-default> which warns
439 whenever a switch statement does not have a "default" case.  The use of
440 these extra flags is to catch potential problems in legal C code, and
441 is often used by Perl aggregators, such as Linux distributors.
442
443 =back
444
445 =head3 Test suite
446
447 If your patch changes code (rather than just changing documentation),
448 you should also include one or more test cases which illustrate the bug
449 you're fixing or validate the new functionality you're adding.  In
450 general, you should update an existing test file rather than create a
451 new one.
452
453 Your test suite additions should generally follow these guidelines
454 (courtesy of Gurusamy Sarathy <gsar@activestate.com>):
455
456 =over 4
457
458 =item *
459
460 Know what you're testing.  Read the docs, and the source.
461
462 =item *
463
464 Tend to fail, not succeed.
465
466 =item *
467
468 Interpret results strictly.
469
470 =item *
471
472 Use unrelated features (this will flush out bizarre interactions).
473
474 =item *
475
476 Use non-standard idioms (otherwise you are not testing TIMTOWTDI).
477
478 =item *
479
480 Avoid using hardcoded test numbers whenever possible (the EXPECTED/GOT
481 found in t/op/tie.t is much more maintainable, and gives better failure
482 reports).
483
484 =item *
485
486 Give meaningful error messages when a test fails.
487
488 =item *
489
490 Avoid using qx// and system() unless you are testing for them.  If you
491 do use them, make sure that you cover _all_ perl platforms.
492
493 =item *
494
495 Unlink any temporary files you create.
496
497 =item *
498
499 Promote unforeseen warnings to errors with $SIG{__WARN__}.
500
501 =item *
502
503 Be sure to use the libraries and modules shipped with the version being
504 tested, not those that were already installed.
505
506 =item *
507
508 Add comments to the code explaining what you are testing for.
509
510 =item *
511
512 Make updating the '1..42' string unnecessary.  Or make sure that you
513 update it.
514
515 =item *
516
517 Test _all_ behaviors of a given operator, library, or function.
518
519 Test all optional arguments.
520
521 Test return values in various contexts (boolean, scalar, list, lvalue).
522
523 Use both global and lexical variables.
524
525 Don't forget the exceptional, pathological cases.
526
527 =back
528
529 =head2 Patching a core module
530
531 This works just like patching anything else, with one extra
532 consideration.
533
534 Modules in the F<cpan/> directory of the source tree are maintained
535 outside of the Perl core.  When the author updates the module, the
536 updates are simply copied into the core.  See that module's
537 documentation or its listing on L<https://metacpan.org/> for more
538 information on reporting bugs and submitting patches.
539
540 In most cases, patches to modules in F<cpan/> should be sent upstream
541 and should not be applied to the Perl core individually.  If a patch to
542 a file in F<cpan/> absolutely cannot wait for the fix to be made
543 upstream, released to CPAN and copied to blead, you must add (or
544 update) a C<CUSTOMIZED> entry in the F<"Porting/Maintainers.pl"> file
545 to flag that a local modification has been made.  See
546 F<"Porting/Maintainers.pl"> for more details.
547
548 In contrast, modules in the F<dist/> directory are maintained in the
549 core.
550
551 =head2 Updating perldelta
552
553 For changes significant enough to warrant a F<pod/perldelta.pod> entry,
554 the porters will greatly appreciate it if you submit a delta entry
555 along with your actual change.  Significant changes include, but are
556 not limited to:
557
558 =over 4
559
560 =item *
561
562 Adding, deprecating, or removing core features
563
564 =item *
565
566 Adding, deprecating, removing, or upgrading core or dual-life modules
567
568 =item *
569
570 Adding new core tests
571
572 =item *
573
574 Fixing security issues and user-visible bugs in the core
575
576 =item *
577
578 Changes that might break existing code, either on the perl or C level
579
580 =item *
581
582 Significant performance improvements
583
584 =item *
585
586 Adding, removing, or significantly changing documentation in the
587 F<pod/> directory
588
589 =item *
590
591 Important platform-specific changes
592
593 =back
594
595 Please make sure you add the perldelta entry to the right section
596 within F<pod/perldelta.pod>.  More information on how to write good
597 perldelta entries is available in the C<Style> section of
598 F<Porting/how_to_write_a_perldelta.pod>.
599
600 =head2 What makes for a good patch?
601
602 New features and extensions to the language can be contentious.  There
603 is no specific set of criteria which determine what features get added,
604 but here are some questions to consider when developing a patch:
605
606 =head3 Does the concept match the general goals of Perl?
607
608 Our goals include, but are not limited to:
609
610 =over 4
611
612 =item 1.
613
614 Keep it fast, simple, and useful.
615
616 =item 2.
617
618 Keep features/concepts as orthogonal as possible.
619
620 =item 3.
621
622 No arbitrary limits (platforms, data sizes, cultures).
623
624 =item 4.
625
626 Keep it open and exciting to use/patch/advocate Perl everywhere.
627
628 =item 5.
629
630 Either assimilate new technologies, or build bridges to them.
631
632 =back
633
634 =head3 Where is the implementation?
635
636 All the talk in the world is useless without an implementation.  In
637 almost every case, the person or people who argue for a new feature
638 will be expected to be the ones who implement it.  Porters capable of
639 coding new features have their own agendas, and are not available to
640 implement your (possibly good) idea.
641
642 =head3 Backwards compatibility
643
644 It's a cardinal sin to break existing Perl programs.  New warnings can
645 be contentious--some say that a program that emits warnings is not
646 broken, while others say it is.  Adding keywords has the potential to
647 break programs, changing the meaning of existing token sequences or
648 functions might break programs.
649
650 The Perl 5 core includes mechanisms to help porters make backwards
651 incompatible changes more compatible such as the L<feature> and
652 L<deprecate> modules.  Please use them when appropriate.
653
654 =head3 Could it be a module instead?
655
656 Perl 5 has extension mechanisms, modules and XS, specifically to avoid
657 the need to keep changing the Perl interpreter.  You can write modules
658 that export functions, you can give those functions prototypes so they
659 can be called like built-in functions, you can even write XS code to
660 mess with the runtime data structures of the Perl interpreter if you
661 want to implement really complicated things.
662
663 Whenever possible, new features should be prototyped in a CPAN module
664 before they will be considered for the core.
665
666 =head3 Is the feature generic enough?
667
668 Is this something that only the submitter wants added to the language,
669 or is it broadly useful?  Sometimes, instead of adding a feature with a
670 tight focus, the porters might decide to wait until someone implements
671 the more generalized feature.
672
673 =head3 Does it potentially introduce new bugs?
674
675 Radical rewrites of large chunks of the Perl interpreter have the
676 potential to introduce new bugs.
677
678 =head3 How big is it?
679
680 The smaller and more localized the change, the better.  Similarly, a
681 series of small patches is greatly preferred over a single large patch.
682
683 =head3 Does it preclude other desirable features?
684
685 A patch is likely to be rejected if it closes off future avenues of
686 development.  For instance, a patch that placed a true and final
687 interpretation on prototypes is likely to be rejected because there are
688 still options for the future of prototypes that haven't been addressed.
689
690 =head3 Is the implementation robust?
691
692 Good patches (tight code, complete, correct) stand more chance of going
693 in.  Sloppy or incorrect patches might be placed on the back burner
694 until the pumpking has time to fix, or might be discarded altogether
695 without further notice.
696
697 =head3 Is the implementation generic enough to be portable?
698
699 The worst patches make use of system-specific features.  It's highly
700 unlikely that non-portable additions to the Perl language will be
701 accepted.
702
703 =head3 Is the implementation tested?
704
705 Patches which change behaviour (fixing bugs or introducing new
706 features) must include regression tests to verify that everything works
707 as expected.
708
709 Without tests provided by the original author, how can anyone else
710 changing perl in the future be sure that they haven't unwittingly
711 broken the behaviour the patch implements? And without tests, how can
712 the patch's author be confident that his/her hard work put into the
713 patch won't be accidentally thrown away by someone in the future?
714
715 =head3 Is there enough documentation?
716
717 Patches without documentation are probably ill-thought out or
718 incomplete.  No features can be added or changed without documentation,
719 so submitting a patch for the appropriate pod docs as well as the
720 source code is important.
721
722 =head3 Is there another way to do it?
723
724 Larry said "Although the Perl Slogan is I<There's More Than One Way to
725 Do It>, I hesitate to make 10 ways to do something".  This is a tricky
726 heuristic to navigate, though--one man's essential addition is another
727 man's pointless cruft.
728
729 =head3 Does it create too much work?
730
731 Work for the pumpking, work for Perl programmers, work for module
732 authors, ... Perl is supposed to be easy.
733
734 =head3 Patches speak louder than words
735
736 Working code is always preferred to pie-in-the-sky ideas.  A patch to
737 add a feature stands a much higher chance of making it to the language
738 than does a random feature request, no matter how fervently argued the
739 request might be.  This ties into "Will it be useful?", as the fact
740 that someone took the time to make the patch demonstrates a strong
741 desire for the feature.
742
743 =head1 TESTING
744
745 The core uses the same testing style as the rest of Perl, a simple
746 "ok/not ok" run through Test::Harness, but there are a few special
747 considerations.
748
749 There are three ways to write a test in the core: L<Test::More>,
750 F<t/test.pl> and ad hoc C<print $test ? "ok 42\n" : "not ok 42\n">.
751 The decision of which to use depends on what part of the test suite
752 you're working on.  This is a measure to prevent a high-level failure
753 (such as Config.pm breaking) from causing basic functionality tests to
754 fail.
755
756 The F<t/test.pl> library provides some of the features of
757 L<Test::More>, but avoids loading most modules and uses as few core
758 features as possible.
759
760 If you write your own test, use the L<Test Anything
761 Protocol|https://testanything.org>.
762
763 =over 4
764
765 =item * F<t/base>, F<t/comp> and F<t/opbasic>
766
767 Since we don't know if C<require> works, or even subroutines, use ad hoc
768 tests for these three.  Step carefully to avoid using the feature being
769 tested.  Tests in F<t/opbasic>, for instance, have been placed there
770 rather than in F<t/op> because they test functionality which
771 F<t/test.pl> presumes has already been demonstrated to work.
772
773 =item * All other subdirectories of F<t/>
774
775 Now that basic require() and subroutines are tested, you can use the
776 F<t/test.pl> library.
777
778 You can also use certain libraries like L<Config> conditionally, but be
779 sure to skip the test gracefully if it's not there.
780
781 =item * Test files not found under F<t/>
782
783 This category includes F<.t> files underneath directories such as F<dist>,
784 F<ext> and F<lib>.  Since the core of Perl has now been tested, L<Test::More>
785 can and now should be used.  You can also use the full suite of core modules
786 in the tests.  (As noted in L<"Patching a core module"> above, changes to
787 F<.t> files found under F<cpan/> should be submitted to the upstream
788 maintainers of those modules.)
789
790 =back
791
792 When you say "make test", Perl uses the F<t/TEST> program to run the
793 test suite (except under Win32 where it uses F<t/harness> instead).
794 All tests are run from the F<t/> directory, B<not> the directory which
795 contains the test.  This causes some problems with the tests in
796 F<lib/>, so here's some opportunity for some patching.
797
798 You must be triply conscious of cross-platform concerns.  This usually
799 boils down to using L<File::Spec>, avoiding things like C<fork()>
800 and C<system()> unless absolutely necessary, and not assuming that a
801 given character has a particular ordinal value (code point) or that its
802 UTF-8 representation is composed of particular bytes.
803
804 There are several functions available to specify characters and code
805 points portably in tests.  The always-preloaded functions
806 C<utf8::unicode_to_native()> and its inverse
807 C<utf8::native_to_unicode()> take code points and translate
808 appropriately.  The file F<t/charset_tools.pl> has several functions
809 that can be useful.  It has versions of the previous two functions
810 that take strings as inputs -- not single numeric code points:
811 C<uni_to_native()> and C<native_to_uni()>.  If you must look at the
812 individual bytes comprising a UTF-8 encoded string,
813 C<byte_utf8a_to_utf8n()> takes as input a string of those bytes encoded
814 for an ASCII platform, and returns the equivalent string in the native
815 platform.  For example, C<byte_utf8a_to_utf8n("\xC2\xA0")> returns the
816 byte sequence on the current platform that form the UTF-8 for C<U+00A0>,
817 since C<"\xC2\xA0"> are the UTF-8 bytes on an ASCII platform for that
818 code point.  This function returns C<"\xC2\xA0"> on an ASCII platform, and
819 C<"\x80\x41"> on an EBCDIC 1047 one.
820
821 But easiest is, if the character is specifiable as a literal, like
822 C<"A"> or C<"%">, to use that; if not so specificable, you can use
823 C<\N{}> , if the side effects aren't troublesome.  Simply specify all
824 your characters in hex, using C<\N{U+ZZ}> instead of C<\xZZ>.  C<\N{}>
825 is the Unicode name, and so it
826 always gives you the Unicode character.  C<\N{U+41}> is the character
827 whose Unicode code point is C<0x41>, hence is C<'A'> on all platforms.
828 The side effects are:
829
830 =over 4
831
832 =item *
833
834 These select Unicode rules.  That means that in double-quotish strings,
835 the string is always converted to UTF-8 to force a Unicode
836 interpretation (you can C<utf8::downgrade()> afterwards to convert back
837 to non-UTF8, if possible).  In regular expression patterns, the
838 conversion isn't done, but if the character set modifier would
839 otherwise be C</d>, it is changed to C</u>.
840
841 =item *
842
843 If you use the form C<\N{I<character name>}>, the L<charnames> module
844 gets automatically loaded.  This may not be suitable for the test level
845 you are doing.
846
847 =back
848
849 If you are testing locales (see L<perllocale>), there are helper
850 functions in F<t/loc_tools.pl> to enable you to see what locales there
851 are on the current platform.
852
853 =head2 Special C<make test> targets
854
855 There are various special make targets that can be used to test Perl
856 slightly differently than the standard "test" target.  Not all them are
857 expected to give a 100% success rate.  Many of them have several
858 aliases, and many of them are not available on certain operating
859 systems.
860
861 =over 4
862
863 =item * test_porting
864
865 This runs some basic sanity tests on the source tree and helps catch
866 basic errors before you submit a patch.
867
868 =item * minitest
869
870 Run F<miniperl> on F<t/base>, F<t/comp>, F<t/cmd>, F<t/run>, F<t/io>,
871 F<t/op>, F<t/uni> and F<t/mro> tests.
872
873 F<miniperl> is a minimalistic perl built to bootstrap building
874 extensions, utilties, documentation etc.  It doesn't support dynamic
875 loading and depending on the point in the build process will only have
876 access to a limited set of core modules.  F<miniperl> is not intended
877 for day to day use.
878
879 =item * test.valgrind check.valgrind
880
881 (Only in Linux) Run all the tests using the memory leak + naughty
882 memory access tool "valgrind".  The log files will be named
883 F<testname.valgrind>.
884
885 =item * test_harness
886
887 Run the test suite with the F<t/harness> controlling program, instead
888 of F<t/TEST>.  F<t/harness> is more sophisticated, and uses the
889 L<Test::Harness> module, thus using this test target supposes that perl
890 mostly works.  The main advantage for our purposes is that it prints a
891 detailed summary of failed tests at the end.  Also, unlike F<t/TEST>,
892 it doesn't redirect stderr to stdout.
893
894 Note that under Win32 F<t/harness> is always used instead of F<t/TEST>,
895 so there is no special "test_harness" target.
896
897 Under Win32's "test" target you may use the TEST_SWITCHES and
898 TEST_FILES environment variables to control the behaviour of
899 F<t/harness>.  This means you can say
900
901     nmake test TEST_FILES="op/*.t"
902     nmake test TEST_SWITCHES="-torture" TEST_FILES="op/*.t"
903
904 =item * test-notty test_notty
905
906 Sets PERL_SKIP_TTY_TEST to true before running normal test.
907
908 =back
909
910 =head2 Parallel tests
911
912 The core distribution can now run its regression tests in parallel on
913 Unix-like platforms.  Instead of running C<make test>, set C<TEST_JOBS>
914 in your environment to the number of tests to run in parallel, and run
915 C<make test_harness>.  On a Bourne-like shell, this can be done as
916
917     TEST_JOBS=3 make test_harness  # Run 3 tests in parallel
918
919 An environment variable is used, rather than parallel make itself,
920 because L<TAP::Harness> needs to be able to schedule individual
921 non-conflicting test scripts itself, and there is no standard interface
922 to C<make> utilities to interact with their job schedulers.
923
924 Note that currently some test scripts may fail when run in parallel
925 (most notably F<dist/IO/t/io_dir.t>).  If necessary, run just the
926 failing scripts again sequentially and see if the failures go away.
927
928 =head2 Running tests by hand
929
930 You can run part of the test suite by hand by using one of the
931 following commands from the F<t/> directory:
932
933     ./perl -I../lib TEST list-of-.t-files
934
935 or
936
937     ./perl -I../lib harness list-of-.t-files
938
939 (If you don't specify test scripts, the whole test suite will be run.)
940
941 =head2 Using F<t/harness> for testing
942
943 If you use C<harness> for testing, you have several command line
944 options available to you.  The arguments are as follows, and are in the
945 order that they must appear if used together.
946
947     harness -v -torture -re=pattern LIST OF FILES TO TEST
948     harness -v -torture -re LIST OF PATTERNS TO MATCH
949
950 If C<LIST OF FILES TO TEST> is omitted, the file list is obtained from
951 the manifest.  The file list may include shell wildcards which will be
952 expanded out.
953
954 =over 4
955
956 =item * -v
957
958 Run the tests under verbose mode so you can see what tests were run,
959 and debug output.
960
961 =item * -torture
962
963 Run the torture tests as well as the normal set.
964
965 =item * -re=PATTERN
966
967 Filter the file list so that all the test files run match PATTERN.
968 Note that this form is distinct from the B<-re LIST OF PATTERNS> form
969 below in that it allows the file list to be provided as well.
970
971 =item * -re LIST OF PATTERNS
972
973 Filter the file list so that all the test files run match
974 /(LIST|OF|PATTERNS)/.  Note that with this form the patterns are joined
975 by '|' and you cannot supply a list of files, instead the test files
976 are obtained from the MANIFEST.
977
978 =back
979
980 You can run an individual test by a command similar to
981
982     ./perl -I../lib path/to/foo.t
983
984 except that the harnesses set up some environment variables that may
985 affect the execution of the test:
986
987 =over 4
988
989 =item * PERL_CORE=1
990
991 indicates that we're running this test as part of the perl core test
992 suite.  This is useful for modules that have a dual life on CPAN.
993
994 =item * PERL_DESTRUCT_LEVEL=2
995
996 is set to 2 if it isn't set already (see
997 L<perlhacktips/PERL_DESTRUCT_LEVEL>).
998
999 =item * PERL
1000
1001 (used only by F<t/TEST>) if set, overrides the path to the perl
1002 executable that should be used to run the tests (the default being
1003 F<./perl>).
1004
1005 =item * PERL_SKIP_TTY_TEST
1006
1007 if set, tells to skip the tests that need a terminal.  It's actually
1008 set automatically by the Makefile, but can also be forced artificially
1009 by running 'make test_notty'.
1010
1011 =back
1012
1013 =head3 Other environment variables that may influence tests
1014
1015 =over 4
1016
1017 =item * PERL_TEST_Net_Ping
1018
1019 Setting this variable runs all the Net::Ping modules tests, otherwise
1020 some tests that interact with the outside world are skipped.  See
1021 L<perl58delta>.
1022
1023 =item * PERL_TEST_NOVREXX
1024
1025 Setting this variable skips the vrexx.t tests for OS2::REXX.
1026
1027 =item * PERL_TEST_NUMCONVERTS
1028
1029 This sets a variable in op/numconvert.t.
1030
1031 =item * PERL_TEST_MEMORY
1032
1033 Setting this variable includes the tests in F<t/bigmem/>.  This should
1034 be set to the number of gigabytes of memory available for testing, eg.
1035 C<PERL_TEST_MEMORY=4> indicates that tests that require 4GiB of
1036 available memory can be run safely.
1037
1038 =back
1039
1040 See also the documentation for the Test and Test::Harness modules, for
1041 more environment variables that affect testing.
1042
1043 =head2 Performance testing
1044
1045 The file F<t/perf/benchmarks> contains snippets of perl code which are
1046 intended to be benchmarked across a range of perls by the
1047 F<Porting/bench.pl> tool. If you fix or enhance a performance issue, you
1048 may want to add a representative code sample to the file, then run
1049 F<bench.pl> against the previous and current perls to see what difference
1050 it has made, and whether anything else has slowed down as a consequence.
1051
1052 The file F<t/perf/opcount.t> is designed to test whether a particular
1053 code snippet has been compiled into an optree containing specified
1054 numbers of particular op types. This is good for testing whether
1055 optimisations which alter ops, such as converting an C<aelem> op into an
1056 C<aelemfast> op, are really doing that.
1057
1058 The files F<t/perf/speed.t> and F<t/re/speed.t> are designed to test
1059 things that run thousands of times slower if a particular optimisation
1060 is broken (for example, the utf8 length cache on long utf8 strings).
1061 Add a test that will take a fraction of a second normally, and minutes
1062 otherwise, causing the test file to time out on failure.
1063
1064 =head2 Building perl at older commits
1065
1066 In the course of hacking on the Perl core distribution, you may have occasion
1067 to configure, build and test perl at an old commit.  Sometimes C<make> will
1068 fail during this process.  If that happens, you may be able to salvage the
1069 situation by using the Devel::PatchPerl library from CPAN (not included in the
1070 core) to bring the source code at that commit to a buildable state.
1071
1072 Here's a real world example, taken from work done to resolve
1073 L<perl #10118|https://github.com/Perl/perl5/issues/10118>.
1074 Use of F<Porting/bisect.pl> had identified commit
1075 C<ba77e4cc9d1ceebf472c9c5c18b2377ee47062e6> as the commit in which a bug was
1076 corrected.  To confirm, a P5P developer wanted to configure and build perl at
1077 commit C<ba77e4c^> (presumably "bad") and then at C<ba77e4c> (presumably
1078 "good").  Normal configuration and build was attempted:
1079
1080     $ sh ./Configure -des -Dusedevel
1081     $ make test_prep
1082
1083 C<make>, however, failed with output (excerpted) like this:
1084
1085     cc -fstack-protector -L/usr/local/lib -o miniperl \
1086       gv.o toke.o perly.o pad.o regcomp.o dump.o util.o \
1087       mg.o reentr.o mro.o hv.o av.o run.o pp_hot.o sv.o \
1088       pp.o scope.o pp_ctl.o pp_sys.o doop.o doio.o regexec.o \
1089       utf8.o taint.o deb.o universal.o globals.o perlio.o \
1090       numeric.o mathoms.o locale.o pp_pack.o pp_sort.o  \
1091       miniperlmain.o opmini.o perlmini.o
1092     pp.o: In function `Perl_pp_pow':
1093     pp.c:(.text+0x2db9): undefined reference to `pow'
1094     ...
1095     collect2: error: ld returned 1 exit status
1096     makefile:348: recipe for target 'miniperl' failed
1097     make: *** [miniperl] Error 1
1098
1099 Another P5P contributor recommended installation and use of Devel::PatchPerl
1100 for this situation, first to determine the version of perl at the commit in
1101 question, then to patch the source code at that point to facilitate a build.
1102
1103     $ perl -MDevel::PatchPerl -e \
1104         'print Devel::PatchPerl->determine_version("/path/to/sourcecode"), "\n";'
1105     5.11.1
1106     $ perl -MDevel::PatchPerl -e \
1107         'Devel::PatchPerl->patch_source("5.11.1", "/path/to/sourcecode");'
1108
1109 Once the source was patched, C<./Configure> and C<make test_prep> were called
1110 and completed successfully, enabling confirmation of the findings in RT
1111 #72414.
1112
1113 =head1 MORE READING FOR GUTS HACKERS
1114
1115 To hack on the Perl guts, you'll need to read the following things:
1116
1117 =over 4
1118
1119 =item * L<perlsource>
1120
1121 An overview of the Perl source tree.  This will help you find the files
1122 you're looking for.
1123
1124 =item * L<perlinterp>
1125
1126 An overview of the Perl interpreter source code and some details on how
1127 Perl does what it does.
1128
1129 =item * L<perlhacktut>
1130
1131 This document walks through the creation of a small patch to Perl's C
1132 code.  If you're just getting started with Perl core hacking, this will
1133 help you understand how it works.
1134
1135 =item * L<perlhacktips>
1136
1137 More details on hacking the Perl core.  This document focuses on lower
1138 level details such as how to write tests, compilation issues,
1139 portability, debugging, etc.
1140
1141 If you plan on doing serious C hacking, make sure to read this.
1142
1143 =item * L<perlguts>
1144
1145 This is of paramount importance, since it's the documentation of what
1146 goes where in the Perl source.  Read it over a couple of times and it
1147 might start to make sense - don't worry if it doesn't yet, because the
1148 best way to study it is to read it in conjunction with poking at Perl
1149 source, and we'll do that later on.
1150
1151 Gisle Aas's "illustrated perlguts", also known as I<illguts>, has very
1152 helpful pictures:
1153
1154 L<https://search.cpan.org/dist/illguts/>
1155
1156 =item * L<perlxstut> and L<perlxs>
1157
1158 A working knowledge of XSUB programming is incredibly useful for core
1159 hacking; XSUBs use techniques drawn from the PP code, the portion of
1160 the guts that actually executes a Perl program.  It's a lot gentler to
1161 learn those techniques from simple examples and explanation than from
1162 the core itself.
1163
1164 =item * L<perlapi>
1165
1166 The documentation for the Perl API explains what some of the internal
1167 functions do, as well as the many macros used in the source.
1168
1169 =item * F<Porting/pumpkin.pod>
1170
1171 This is a collection of words of wisdom for a Perl porter; some of it
1172 is only useful to the pumpkin holder, but most of it applies to anyone
1173 wanting to go about Perl development.
1174
1175 =back
1176
1177 =head1 CPAN TESTERS AND PERL SMOKERS
1178
1179 The CPAN testers ( L<http://cpantesters.org/> ) are a group of volunteers
1180 who test CPAN modules on a variety of platforms.
1181
1182 Perl Smokers ( L<https://www.nntp.perl.org/group/perl.daily-build/> and
1183 L<https://www.nntp.perl.org/group/perl.daily-build.reports/> )
1184 automatically test Perl source releases on platforms with various
1185 configurations.
1186
1187 Both efforts welcome volunteers.  In order to get involved in smoke
1188 testing of the perl itself visit
1189 L<https://metacpan.org/release/Test-Smoke>.  In order to start smoke
1190 testing CPAN modules visit
1191 L<https://metacpan.org/release/CPANPLUS-YACSmoke> or
1192 L<https://metacpan.org/release/minismokebox> or
1193 L<https://metacpan.org/release/CPAN-Reporter>.
1194
1195 =head1 WHAT NEXT?
1196
1197 If you've read all the documentation in the document and the ones
1198 listed above, you're more than ready to hack on Perl.
1199
1200 Here's some more recommendations
1201
1202 =over 4
1203
1204 =item *
1205
1206 Subscribe to perl5-porters, follow the patches and try and understand
1207 them; don't be afraid to ask if there's a portion you're not clear on -
1208 who knows, you may unearth a bug in the patch...
1209
1210 =item *
1211
1212 Do read the README associated with your operating system, e.g.
1213 README.aix on the IBM AIX OS.  Don't hesitate to supply patches to that
1214 README if you find anything missing or changed over a new OS release.
1215
1216 =item *
1217
1218 Find an area of Perl that seems interesting to you, and see if you can
1219 work out how it works.  Scan through the source, and step over it in
1220 the debugger.  Play, poke, investigate, fiddle! You'll probably get to
1221 understand not just your chosen area but a much wider range of
1222 F<perl>'s activity as well, and probably sooner than you'd think.
1223
1224 =back
1225
1226 =head2 "The Road goes ever on and on, down from the door where it began."
1227
1228 If you can do these things, you've started on the long road to Perl
1229 porting.  Thanks for wanting to help make Perl better - and happy
1230 hacking!
1231
1232 =head2 Metaphoric Quotations
1233
1234 If you recognized the quote about the Road above, you're in luck.
1235
1236 Most software projects begin each file with a literal description of
1237 each file's purpose.  Perl instead begins each with a literary allusion
1238 to that file's purpose.
1239
1240 Like chapters in many books, all top-level Perl source files (along
1241 with a few others here and there) begin with an epigrammatic
1242 inscription that alludes, indirectly and metaphorically, to the
1243 material you're about to read.
1244
1245 Quotations are taken from writings of J.R.R. Tolkien pertaining to his
1246 Legendarium, almost always from I<The Lord of the Rings>.  Chapters and
1247 page numbers are given using the following editions:
1248
1249 =over 4
1250
1251 =item *
1252
1253 I<The Hobbit>, by J.R.R. Tolkien.  The hardcover, 70th-anniversary
1254 edition of 2007 was used, published in the UK by Harper Collins
1255 Publishers and in the US by the Houghton Mifflin Company.
1256
1257 =item *
1258
1259 I<The Lord of the Rings>, by J.R.R. Tolkien.  The hardcover,
1260 50th-anniversary edition of 2004 was used, published in the UK by
1261 Harper Collins Publishers and in the US by the Houghton Mifflin
1262 Company.
1263
1264 =item *
1265
1266 I<The Lays of Beleriand>, by J.R.R. Tolkien and published posthumously
1267 by his son and literary executor, C.J.R. Tolkien, being the 3rd of the
1268 12 volumes in Christopher's mammoth I<History of Middle Earth>.  Page
1269 numbers derive from the hardcover edition, first published in 1983 by
1270 George Allen & Unwin; no page numbers changed for the special 3-volume
1271 omnibus edition of 2002 or the various trade-paper editions, all again
1272 now by Harper Collins or Houghton Mifflin.
1273
1274 =back
1275
1276 Other JRRT books fair game for quotes would thus include I<The
1277 Adventures of Tom Bombadil>, I<The Silmarillion>, I<Unfinished Tales>,
1278 and I<The Tale of the Children of Hurin>, all but the first
1279 posthumously assembled by CJRT.  But I<The Lord of the Rings> itself is
1280 perfectly fine and probably best to quote from, provided you can find a
1281 suitable quote there.
1282
1283 So if you were to supply a new, complete, top-level source file to add
1284 to Perl, you should conform to this peculiar practice by yourself
1285 selecting an appropriate quotation from Tolkien, retaining the original
1286 spelling and punctuation and using the same format the rest of the
1287 quotes are in.  Indirect and oblique is just fine; remember, it's a
1288 metaphor, so being meta is, after all, what it's for.
1289
1290 =head1 AUTHOR
1291
1292 This document was originally written by Nathan Torkington, and is
1293 maintained by the perl5-porters mailing list.