This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Reapply "docs: clarify effect of $^H, %^H, ${^WARNING_BITS}"
[perl5.git] / pod / perlhack.pod
1 =encoding utf8
2
3 =for comment
4 Consistent formatting of this file is achieved with:
5   perl ./Porting/podtidy pod/perlhack.pod
6
7 =head1 NAME
8
9 perlhack - How to hack on Perl
10
11 =head1 DESCRIPTION
12
13 This document explains how Perl development works.  It includes details
14 about the Perl 5 Porters email list, the Perl repository, the Perl
15 bug tracker, patch guidelines, and commentary on Perl development
16 philosophy.
17
18 =head1 SUPER QUICK PATCH GUIDE
19
20 If you just want to submit a single small patch like a pod fix, a test
21 for a bug, comment fixes, etc., it's easy! Here's how:
22
23 =over 4
24
25 =item * Check out the source repository
26
27 The perl source is in a git repository.  You can clone the repository
28 with the following command:
29
30   % git clone https://github.com/Perl/perl5.git perl
31
32 =item * Ensure you're following the latest advice
33
34 In case the advice in this guide has been updated recently, read the
35 latest version directly from the perl source:
36
37   % perldoc pod/perlhack.pod
38
39 =item * Create a branch for your change
40
41 Create a branch based on blead to commit your change to, which will
42 later be used to send it to the Perl issue tracker.
43
44   % git checkout -b mychange
45
46 =item * Make your change
47
48 Hack, hack, hack.  Keep in mind that Perl runs on many different
49 platforms, with different operating systems that have different
50 capabilities, different filesystem organizations, and even different
51 character sets.  L<perlhacktips> gives advice on this.
52
53 =item * Test your change
54
55 You can run all the tests with the following commands:
56
57   % ./Configure -des -Dusedevel
58   % make test
59
60 Keep hacking until the tests pass.
61
62 =item * Commit your change
63
64 Committing your work will save the change I<on your local system>:
65
66   % git commit -a -m 'Commit message goes here'
67
68 Make sure the commit message describes your change in a single
69 sentence.  For example, "Fixed spelling errors in perlhack.pod".
70
71 =item * Send your change to the Perl issue tracker
72
73 The next step is to submit your patch to the Perl core ticket system.
74
75 Create a GitHub fork of the perl5 repository and add it as a remote,
76 if you haven't already, as described in the GitHub documentation at
77 L<https://help.github.com/en/articles/working-with-forks>.
78
79   % git remote add fork git@github.com:MyUser/perl5.git
80
81 For more information, see L<"Connecting to GitHub with SSH"|https://docs.github.com/en/free-pro-team@latest/github/authenticating-to-github/connecting-to-github-with-ssh>.
82
83 If you'd rather use an HTTPS URL for your C<git push> see L<"Cloning with
84 HTTPS URLs"|https://docs.github.com/en/free-pro-team@latest/github/using-git/which-remote-url-should-i-use#cloning-with-https-urls>.
85
86   % git remote add fork https://github.com/MyUser/perl5.git
87
88 Then, push your new branch to your fork.
89
90   % git push -u fork mychange
91
92 Finally, create a Pull Request on GitHub from your branch to blead as
93 described in the GitHub documentation at
94 L<https://help.github.com/en/articles/creating-a-pull-request-from-a-fork>.
95
96 =item * Thank you
97
98 The porters appreciate the time you spent helping to make Perl better.
99 Thank you!
100
101 =item * Acknowledgement
102
103 All contributors are credited (by name and email address) in the
104 AUTHORS file, which is part of the perl distribution, as well as the
105 Git commit history.
106
107 If you don’t want to be included in the AUTHORS file, just let us
108 know. Otherwise we will take your submission of a patch as permission
109 to credit you in the AUTHORS file.
110
111 =item * Next time
112
113 The next time you wish to make a patch, you need to start from the
114 latest perl in a pristine state.  Check you don't have any local changes
115 or added files in your perl check-out which you wish to keep, then run
116 these commands:
117
118   % git checkout blead
119   % git pull
120   % git reset --hard origin/blead
121   % git clean -dxf
122
123 =back
124
125 =head1 BUG REPORTING
126
127 If you want to report a bug in Perl, or browse existing Perl bugs and
128 patches, use the GitHub issue tracker at
129 L<https://github.com/perl/perl5/issues>.
130
131 Please check the archive of the perl5-porters list (see below) and/or
132 the bug tracking system before submitting a bug report.  Often, you'll
133 find that the bug has been reported already.
134
135 You can log in to the bug tracking system and comment on existing bug
136 reports.  If you have additional information regarding an existing bug,
137 please add it.  This will help the porters fix the bug.
138
139 =head1 PERL 5 PORTERS
140
141 The perl5-porters (p5p) mailing list is where the Perl standard
142 distribution is maintained and developed.  The people who maintain Perl
143 are also referred to as the "Perl 5 Porters", "p5p" or just the
144 "porters".
145
146 A searchable archive of the list is available at
147 L<https://markmail.org/search/?q=perl5-porters>.  There is also an archive at
148 L<https://archive.develooper.com/perl5-porters@perl.org/>.
149
150 =head2 perl-changes mailing list
151
152 The perl5-changes mailing list receives a copy of each patch that gets
153 submitted to the maintenance and development branches of the perl
154 repository.  See L<https://lists.perl.org/list/perl5-changes.html> for
155 subscription and archive information.
156
157 =head2 #p5p on IRC
158
159 Many porters are also active on the L<irc://irc.perl.org/#p5p> channel.
160 Feel free to join the channel and ask questions about hacking on the
161 Perl core.
162
163 =head1 GETTING THE PERL SOURCE
164
165 All of Perl's source code is kept centrally in a Git repository at
166 I<github.com>.  The repository contains many Perl revisions
167 from Perl 1 onwards and all the revisions from Perforce, the previous
168 version control system.
169
170 For much more detail on using git with the Perl repository, please see
171 L<perlgit>.
172
173 =head2 Read access via Git
174
175 You will need a copy of Git for your computer.  You can fetch a copy of
176 the repository using the git protocol:
177
178   % git clone git@github.com:Perl/perl5.git perl
179
180 This clones the repository and makes a local copy in the F<perl>
181 directory.
182
183 If you cannot use the git protocol for firewall reasons, you can also
184 clone via http:
185
186   % git clone https://github.com/Perl/perl5.git perl
187
188 =head2 Read access via the web
189
190 You may access the repository over the web.  This allows you to browse
191 the tree, see recent commits, subscribe to repository notifications,
192 search for particular commits and more.  You may access it at
193 L<https://github.com/Perl/perl5>.
194
195 =head2 Write access via git
196
197 If you have a commit bit, please see L<perlgit> for more details on
198 using git.
199
200 =head1 PATCHING PERL
201
202 If you're planning to do more extensive work than a single small fix,
203 we encourage you to read the documentation below.  This will help you
204 focus your work and make your patches easier to incorporate into the
205 Perl source.
206
207 =head2 Submitting patches
208
209 If you have a small patch to submit, please submit it via the GitHub
210 Pull Request workflow.  You may also send patches to the p5p list.
211
212 Patches are reviewed and discussed on GitHub or the p5p list.  Simple,
213 uncontroversial patches will usually be applied without any discussion.
214 When the patch is applied, the ticket will be updated and you will
215 receive email.
216
217 In other cases, the patch will need more work or discussion.
218 You are encouraged to participate in the discussion and advocate for
219 your patch.  Sometimes your patch may get lost in the shuffle.  It's
220 appropriate to send a reminder email to p5p if no action has been taken
221 in a month.  Please remember that the Perl 5 developers are all
222 volunteers, and be polite.
223
224 Changes are always applied directly to the main development branch,
225 called "blead".  Some patches may be backported to a maintenance
226 branch.  If you think your patch is appropriate for the maintenance
227 branch (see L<perlpolicy/MAINTENANCE BRANCHES>), please explain why
228 when you submit it.
229
230 =head2 Getting your patch accepted
231
232 If you are submitting a code patch there are several things that you
233 can do to help the Perl 5 Porters accept your patch.
234
235 =head3 Patch style
236
237 Using the GitHub Pull Request workflow, your patch will automatically
238 be available in a suitable format.  If you wish to submit a patch to
239 the p5p list for review, make sure to create it appropriately.
240
241 If you used git to check out the Perl source, then using C<git
242 format-patch> will produce a patch in a style suitable for Perl.  The
243 C<format-patch> command produces one patch file for each commit you
244 made.  If you prefer to send a single patch for all commits, you can
245 use C<git diff>.
246
247   % git checkout blead
248   % git pull
249   % git diff blead my-branch-name
250
251 This produces a patch based on the difference between blead and your
252 current branch.  It's important to make sure that blead is up to date
253 before producing the diff, that's why we call C<git pull> first.
254
255 We strongly recommend that you use git if possible.  It will make your
256 life easier, and ours as well.
257
258 However, if you're not using git, you can still produce a suitable
259 patch.  You'll need a pristine copy of the Perl source to diff against.
260 The porters prefer unified diffs.  Using GNU C<diff>, you can produce a
261 diff like this:
262
263   % diff -Npurd perl.pristine perl.mine
264
265 Make sure that you C<make realclean> in your copy of Perl to remove any
266 build artifacts, or you may get a confusing result.
267
268 =head3 Commit message
269
270 As you craft each patch you intend to submit to the Perl core, it's
271 important to write a good commit message.  This is especially important
272 if your submission will consist of a series of commits.
273
274 The first line of the commit message should be a short description
275 without a period.  It should be no longer than the subject line of an
276 email, 50 characters being a good rule of thumb.
277
278 A lot of Git tools (Gitweb, GitHub, git log --pretty=oneline, ...) will
279 only display the first line (cut off at 50 characters) when presenting
280 commit summaries.
281
282 The commit message should include a description of the problem that the
283 patch corrects or new functionality that the patch adds.
284
285 As a general rule of thumb, your commit message should help a
286 programmer who knows the Perl core quickly understand what you were
287 trying to do, how you were trying to do it, and why the change matters
288 to Perl.
289
290 =over 4
291
292 =item * Why
293
294 Your commit message should describe why the change you are making is
295 important.  When someone looks at your change in six months or six
296 years, your intent should be clear.
297
298 If you're deprecating a feature with the intent of later simplifying
299 another bit of code, say so.  If you're fixing a performance problem or
300 adding a new feature to support some other bit of the core, mention
301 that.
302
303 =item * What
304
305 Your commit message should describe what part of the Perl core you're
306 changing and what you expect your patch to do.
307
308 =item * How
309
310 While it's not necessary for documentation changes, new tests or
311 trivial patches, it's often worth explaining how your change works.
312 Even if it's clear to you today, it may not be clear to a porter next
313 month or next year.
314
315 =back
316
317 A commit message isn't intended to take the place of comments in your
318 code.  Commit messages should describe the change you made, while code
319 comments should describe the current state of the code.
320
321 If you've just implemented a new feature, complete with doc, tests and
322 well-commented code, a brief commit message will often suffice.  If,
323 however, you've just changed a single character deep in the parser or
324 lexer, you might need to write a small novel to ensure that future
325 readers understand what you did and why you did it.
326
327 =head3 Comments, Comments, Comments
328
329 Be sure to adequately comment your code.  While commenting every line
330 is unnecessary, anything that takes advantage of side effects of
331 operators, that creates changes that will be felt outside of the
332 function being patched, or that others may find confusing should be
333 documented.  If you are going to err, it is better to err on the side
334 of adding too many comments than too few.
335
336 The best comments explain I<why> the code does what it does, not I<what
337 it does>.
338
339 =head3 Style
340
341 In general, please follow the particular style of the code you are
342 patching.
343
344 In particular, follow these general guidelines for patching Perl
345 sources:
346
347 =over 4
348
349 =item *
350
351 4-wide indents for code, 2-wide indents for nested CPP C<#define>s,
352 with 8-wide tabstops.
353
354 =item *
355
356 Use spaces for indentation, not tab characters.
357
358 The codebase is a mixture of tabs and spaces for indentation, and we
359 are moving to spaces only.  Converting lines you're patching from 8-wide
360 tabs to spaces will help this migration.
361
362 =item *
363
364 Try hard not to exceed 79-columns
365
366 =item *
367
368 ANSI C prototypes
369
370 =item *
371
372 Uncuddled elses and "K&R" style for indenting control constructs
373
374 =item *
375
376 No C++ style (//) comments
377
378 =item *
379
380 Mark places that need to be revisited with XXX (and revisit often!)
381
382 =item *
383
384 Opening brace lines up with "if" when conditional spans multiple lines;
385 should be at end-of-line otherwise
386
387 =item *
388
389 In function definitions, name starts in column 0 (return value-type is on
390 previous line)
391
392 =item *
393
394 Single space after keywords that are followed by parens, no space
395 between function name and following paren
396
397 =item *
398
399 Avoid assignments in conditionals, but if they're unavoidable, use
400 extra paren, e.g. "if (a && (b = c)) ..."
401
402 =item *
403
404 "return foo;" rather than "return(foo);"
405
406 =item *
407
408 "if (!foo) ..." rather than "if (foo == FALSE) ..." etc.
409
410 =item *
411
412 Do not declare variables using "register".  It may be counterproductive
413 with modern compilers, and is deprecated in C++, under which the Perl
414 source is regularly compiled.
415
416 =item *
417
418 In-line functions that are in headers that are accessible to XS code
419 need to be able to compile without warnings with commonly used extra
420 compilation flags, such as gcc's C<-Wswitch-default> which warns
421 whenever a switch statement does not have a "default" case.  The use of
422 these extra flags is to catch potential problems in legal C code, and
423 is often used by Perl aggregators, such as Linux distributors.
424
425 =back
426
427 =head3 Test suite
428
429 If your patch changes code (rather than just changing documentation),
430 you should also include one or more test cases which illustrate the bug
431 you're fixing or validate the new functionality you're adding.  In
432 general, you should update an existing test file rather than create a
433 new one.
434
435 Your test suite additions should generally follow these guidelines
436 (courtesy of Gurusamy Sarathy <gsar@activestate.com>):
437
438 =over 4
439
440 =item *
441
442 Know what you're testing.  Read the docs, and the source.
443
444 =item *
445
446 Tend to fail, not succeed.
447
448 =item *
449
450 Interpret results strictly.
451
452 =item *
453
454 Use unrelated features (this will flush out bizarre interactions).
455
456 =item *
457
458 Use non-standard idioms (otherwise you are not testing TIMTOWTDI).
459
460 =item *
461
462 Avoid using hardcoded test numbers whenever possible (the EXPECTED/GOT
463 found in t/op/tie.t is much more maintainable, and gives better failure
464 reports).
465
466 =item *
467
468 Give meaningful error messages when a test fails.
469
470 =item *
471
472 Avoid using qx// and system() unless you are testing for them.  If you
473 do use them, make sure that you cover _all_ perl platforms.
474
475 =item *
476
477 Unlink any temporary files you create.
478
479 =item *
480
481 Promote unforeseen warnings to errors with $SIG{__WARN__}.
482
483 =item *
484
485 Be sure to use the libraries and modules shipped with the version being
486 tested, not those that were already installed.
487
488 =item *
489
490 Add comments to the code explaining what you are testing for.
491
492 =item *
493
494 Make updating the '1..42' string unnecessary.  Or make sure that you
495 update it.
496
497 =item *
498
499 Test _all_ behaviors of a given operator, library, or function.
500
501 Test all optional arguments.
502
503 Test return values in various contexts (boolean, scalar, list, lvalue).
504
505 Use both global and lexical variables.
506
507 Don't forget the exceptional, pathological cases.
508
509 =back
510
511 =head2 Patching a core module
512
513 This works just like patching anything else, with one extra
514 consideration.
515
516 Modules in the F<cpan/> directory of the source tree are maintained
517 outside of the Perl core.  When the author updates the module, the
518 updates are simply copied into the core.  See that module's
519 documentation or its listing on L<https://metacpan.org/> for more
520 information on reporting bugs and submitting patches.
521
522 In most cases, patches to modules in F<cpan/> should be sent upstream
523 and should not be applied to the Perl core individually.  If a patch to
524 a file in F<cpan/> absolutely cannot wait for the fix to be made
525 upstream, released to CPAN and copied to blead, you must add (or
526 update) a C<CUSTOMIZED> entry in the F<"Porting/Maintainers.pl"> file
527 to flag that a local modification has been made.  See
528 F<"Porting/Maintainers.pl"> for more details.
529
530 In contrast, modules in the F<dist/> directory are maintained in the
531 core.
532
533 =head2 Updating perldelta
534
535 For changes significant enough to warrant a F<pod/perldelta.pod> entry,
536 the porters will greatly appreciate it if you submit a delta entry
537 along with your actual change.  Significant changes include, but are
538 not limited to:
539
540 =over 4
541
542 =item *
543
544 Adding, deprecating, or removing core features
545
546 =item *
547
548 Adding, deprecating, removing, or upgrading core or dual-life modules
549
550 =item *
551
552 Adding new core tests
553
554 =item *
555
556 Fixing security issues and user-visible bugs in the core
557
558 =item *
559
560 Changes that might break existing code, either on the perl or C level
561
562 =item *
563
564 Significant performance improvements
565
566 =item *
567
568 Adding, removing, or significantly changing documentation in the
569 F<pod/> directory
570
571 =item *
572
573 Important platform-specific changes
574
575 =back
576
577 Please make sure you add the perldelta entry to the right section
578 within F<pod/perldelta.pod>.  More information on how to write good
579 perldelta entries is available in the C<Style> section of
580 F<Porting/how_to_write_a_perldelta.pod>.
581
582 =head2 What makes for a good patch?
583
584 New features and extensions to the language can be contentious.  There
585 is no specific set of criteria which determine what features get added,
586 but here are some questions to consider when developing a patch:
587
588 =head3 Does the concept match the general goals of Perl?
589
590 Our goals include, but are not limited to:
591
592 =over 4
593
594 =item 1.
595
596 Keep it fast, simple, and useful.
597
598 =item 2.
599
600 Keep features/concepts as orthogonal as possible.
601
602 =item 3.
603
604 No arbitrary limits (platforms, data sizes, cultures).
605
606 =item 4.
607
608 Keep it open and exciting to use/patch/advocate Perl everywhere.
609
610 =item 5.
611
612 Either assimilate new technologies, or build bridges to them.
613
614 =back
615
616 =head3 Where is the implementation?
617
618 All the talk in the world is useless without an implementation.  In
619 almost every case, the person or people who argue for a new feature
620 will be expected to be the ones who implement it.  Porters capable of
621 coding new features have their own agendas, and are not available to
622 implement your (possibly good) idea.
623
624 =head3 Backwards compatibility
625
626 It's a cardinal sin to break existing Perl programs.  New warnings can
627 be contentious--some say that a program that emits warnings is not
628 broken, while others say it is.  Adding keywords has the potential to
629 break programs, changing the meaning of existing token sequences or
630 functions might break programs.
631
632 The Perl 5 core includes mechanisms to help porters make backwards
633 incompatible changes more compatible such as the L<feature> and
634 L<deprecate> modules.  Please use them when appropriate.
635
636 =head3 Could it be a module instead?
637
638 Perl 5 has extension mechanisms, modules and XS, specifically to avoid
639 the need to keep changing the Perl interpreter.  You can write modules
640 that export functions, you can give those functions prototypes so they
641 can be called like built-in functions, you can even write XS code to
642 mess with the runtime data structures of the Perl interpreter if you
643 want to implement really complicated things.
644
645 Whenever possible, new features should be prototyped in a CPAN module
646 before they will be considered for the core.
647
648 =head3 Is the feature generic enough?
649
650 Is this something that only the submitter wants added to the language,
651 or is it broadly useful?  Sometimes, instead of adding a feature with a
652 tight focus, the porters might decide to wait until someone implements
653 the more generalized feature.
654
655 =head3 Does it potentially introduce new bugs?
656
657 Radical rewrites of large chunks of the Perl interpreter have the
658 potential to introduce new bugs.
659
660 =head3 How big is it?
661
662 The smaller and more localized the change, the better.  Similarly, a
663 series of small patches is greatly preferred over a single large patch.
664
665 =head3 Does it preclude other desirable features?
666
667 A patch is likely to be rejected if it closes off future avenues of
668 development.  For instance, a patch that placed a true and final
669 interpretation on prototypes is likely to be rejected because there are
670 still options for the future of prototypes that haven't been addressed.
671
672 =head3 Is the implementation robust?
673
674 Good patches (tight code, complete, correct) stand more chance of going
675 in.  Sloppy or incorrect patches might be placed on the back burner
676 until fixes can be made, or they might be discarded altogether
677 without further notice.
678
679 =head3 Is the implementation generic enough to be portable?
680
681 The worst patches make use of system-specific features.  It's highly
682 unlikely that non-portable additions to the Perl language will be
683 accepted.
684
685 =head3 Is the implementation tested?
686
687 Patches which change behaviour (fixing bugs or introducing new
688 features) must include regression tests to verify that everything works
689 as expected.
690
691 Without tests provided by the original author, how can anyone else
692 changing perl in the future be sure that they haven't unwittingly
693 broken the behaviour the patch implements? And without tests, how can
694 the patch's author be confident that his/her hard work put into the
695 patch won't be accidentally thrown away by someone in the future?
696
697 =head3 Is there enough documentation?
698
699 Patches without documentation are probably ill-thought out or
700 incomplete.  No features can be added or changed without documentation,
701 so submitting a patch for the appropriate pod docs as well as the
702 source code is important.
703
704 =head3 Is there another way to do it?
705
706 Larry said "Although the Perl Slogan is I<There's More Than One Way to
707 Do It>, I hesitate to make 10 ways to do something".  This is a tricky
708 heuristic to navigate, though--one man's essential addition is another
709 man's pointless cruft.
710
711 =head3 Does it create too much work?
712
713 Work for the committers, work for Perl programmers, work for module
714 authors, ... Perl is supposed to be easy.
715
716 =head3 Patches speak louder than words
717
718 Working code is always preferred to pie-in-the-sky ideas.  A patch to
719 add a feature stands a much higher chance of making it to the language
720 than does a random feature request, no matter how fervently argued the
721 request might be.  This ties into "Will it be useful?", as the fact
722 that someone took the time to make the patch demonstrates a strong
723 desire for the feature.
724
725 =head1 TESTING
726
727 The core uses the same testing style as the rest of Perl, a simple
728 "ok/not ok" run through Test::Harness, but there are a few special
729 considerations.
730
731 There are three ways to write a test in the core: L<Test::More>,
732 F<t/test.pl> and ad hoc C<print $test ? "ok 42\n" : "not ok 42\n">.
733 The decision of which to use depends on what part of the test suite
734 you're working on.  This is a measure to prevent a high-level failure
735 (such as Config.pm breaking) from causing basic functionality tests to
736 fail.
737
738 The F<t/test.pl> library provides some of the features of
739 L<Test::More>, but avoids loading most modules and uses as few core
740 features as possible.
741
742 If you write your own test, use the L<Test Anything
743 Protocol|https://testanything.org>.
744
745 =over 4
746
747 =item * F<t/base>, F<t/comp> and F<t/opbasic>
748
749 Since we don't know if C<require> works, or even subroutines, use ad hoc
750 tests for these three.  Step carefully to avoid using the feature being
751 tested.  Tests in F<t/opbasic>, for instance, have been placed there
752 rather than in F<t/op> because they test functionality which
753 F<t/test.pl> presumes has already been demonstrated to work.
754
755 =item * All other subdirectories of F<t/>
756
757 Now that basic require() and subroutines are tested, you can use the
758 F<t/test.pl> library.
759
760 You can also use certain libraries like L<Config> conditionally, but be
761 sure to skip the test gracefully if it's not there.
762
763 =item * Test files not found under F<t/>
764
765 This category includes F<.t> files underneath directories such as F<dist>,
766 F<ext> and F<lib>.  Since the core of Perl has now been tested, L<Test::More>
767 can and now should be used.  You can also use the full suite of core modules
768 in the tests.  (As noted in L<"Patching a core module"> above, changes to
769 F<.t> files found under F<cpan/> should be submitted to the upstream
770 maintainers of those modules.)
771
772 =back
773
774 When you say "make test", Perl uses the F<t/TEST> program to run the
775 test suite (except under Win32 where it uses F<t/harness> instead).
776 All tests are run from the F<t/> directory, B<not> the directory which
777 contains the test.  This causes some problems with the tests in
778 F<lib/>, so here's some opportunity for some patching.
779
780 You must be triply conscious of cross-platform concerns.  This usually
781 boils down to using L<File::Spec>, avoiding things like C<fork()>
782 and C<system()> unless absolutely necessary, and not assuming that a
783 given character has a particular ordinal value (code point) or that its
784 UTF-8 representation is composed of particular bytes.
785
786 There are several functions available to specify characters and code
787 points portably in tests.  The always-preloaded functions
788 C<utf8::unicode_to_native()> and its inverse
789 C<utf8::native_to_unicode()> take code points and translate
790 appropriately.  The file F<t/charset_tools.pl> has several functions
791 that can be useful.  It has versions of the previous two functions
792 that take strings as inputs -- not single numeric code points:
793 C<uni_to_native()> and C<native_to_uni()>.  If you must look at the
794 individual bytes comprising a UTF-8 encoded string,
795 C<byte_utf8a_to_utf8n()> takes as input a string of those bytes encoded
796 for an ASCII platform, and returns the equivalent string in the native
797 platform.  For example, C<byte_utf8a_to_utf8n("\xC2\xA0")> returns the
798 byte sequence on the current platform that form the UTF-8 for C<U+00A0>,
799 since C<"\xC2\xA0"> are the UTF-8 bytes on an ASCII platform for that
800 code point.  This function returns C<"\xC2\xA0"> on an ASCII platform, and
801 C<"\x80\x41"> on an EBCDIC 1047 one.
802
803 But easiest is, if the character is specifiable as a literal, like
804 C<"A"> or C<"%">, to use that; if not so specificable, you can use
805 C<\N{}> , if the side effects aren't troublesome.  Simply specify all
806 your characters in hex, using C<\N{U+ZZ}> instead of C<\xZZ>.  C<\N{}>
807 is the Unicode name, and so it
808 always gives you the Unicode character.  C<\N{U+41}> is the character
809 whose Unicode code point is C<0x41>, hence is C<'A'> on all platforms.
810 The side effects are:
811
812 =over 4
813
814 =item *
815
816 These select Unicode rules.  That means that in double-quotish strings,
817 the string is always converted to UTF-8 to force a Unicode
818 interpretation (you can C<utf8::downgrade()> afterwards to convert back
819 to non-UTF8, if possible).  In regular expression patterns, the
820 conversion isn't done, but if the character set modifier would
821 otherwise be C</d>, it is changed to C</u>.
822
823 =item *
824
825 If you use the form C<\N{I<character name>}>, the L<charnames> module
826 gets automatically loaded.  This may not be suitable for the test level
827 you are doing.
828
829 =back
830
831 If you are testing locales (see L<perllocale>), there are helper
832 functions in F<t/loc_tools.pl> to enable you to see what locales there
833 are on the current platform.
834
835 =head2 Special C<make test> targets
836
837 There are various special make targets that can be used to test Perl
838 slightly differently than the standard "test" target.  Not all them are
839 expected to give a 100% success rate.  Many of them have several
840 aliases, and many of them are not available on certain operating
841 systems.
842
843 =over 4
844
845 =item * test_porting
846
847 This runs some basic sanity tests on the source tree and helps catch
848 basic errors before you submit a patch.
849
850 =item * minitest
851
852 Run F<miniperl> on F<t/base>, F<t/comp>, F<t/cmd>, F<t/run>, F<t/io>,
853 F<t/op>, F<t/uni> and F<t/mro> tests.
854
855 F<miniperl> is a minimalistic perl built to bootstrap building
856 extensions, utilties, documentation etc.  It doesn't support dynamic
857 loading and depending on the point in the build process will only have
858 access to a limited set of core modules.  F<miniperl> is not intended
859 for day to day use.
860
861 =item * test.valgrind check.valgrind
862
863 (Only in Linux) Run all the tests using the memory leak + naughty
864 memory access tool "valgrind".  The log files will be named
865 F<testname.valgrind>.
866
867 =item * test_harness
868
869 Run the test suite with the F<t/harness> controlling program, instead
870 of F<t/TEST>.  F<t/harness> is more sophisticated, and uses the
871 L<Test::Harness> module, thus using this test target supposes that perl
872 mostly works.  The main advantage for our purposes is that it prints a
873 detailed summary of failed tests at the end.  Also, unlike F<t/TEST>,
874 it doesn't redirect stderr to stdout.
875
876 Note that under Win32 F<t/harness> is always used instead of F<t/TEST>,
877 so there is no special "test_harness" target.
878
879 Under Win32's "test" target you may use the TEST_SWITCHES and
880 TEST_FILES environment variables to control the behaviour of
881 F<t/harness>.  This means you can say
882
883     nmake test TEST_FILES="op/*.t"
884     nmake test TEST_SWITCHES="-torture" TEST_FILES="op/*.t"
885
886 =item * test-notty test_notty
887
888 Sets PERL_SKIP_TTY_TEST to true before running normal test.
889
890 =back
891
892 =head2 Parallel tests
893
894 The core distribution can now run its regression tests in parallel on
895 Unix-like and Windows platforms.  On Unix, instead of running C<make
896 test>, set C<TEST_JOBS> in your environment to the number of tests to
897 run in parallel, and run C<make test_harness>.  On a Bourne-like shell,
898 this can be done as
899
900     TEST_JOBS=3 make test_harness  # Run 3 tests in parallel
901
902 An environment variable is used, rather than parallel make itself,
903 because L<TAP::Harness> needs to be able to schedule individual
904 non-conflicting test scripts itself, and there is no standard interface
905 to C<make> utilities to interact with their job schedulers.
906
907 Tests are normally run in a logical order, with the sanity tests first,
908 then the main tests of the Perl core functionality, then the tests for
909 the non-core modules.  On many-core systems, this may not use the
910 hardware as effectively as possible.  By also specifying
911
912  TEST_JOBS=19 PERL_TEST_HARNESS_ASAP=1 make -j19 test_harness
913
914 you signal that you want the tests to finish in wall-clock time as short
915 as possible.  After the sanity tests are completed, this causes the
916 remaining ones to be packed into the available cores as tightly as
917 we know how.  This has its greatest effect on slower, many-core systems.
918 Throughput was sped up by 20% on an outmoded 24-core system; less on
919 more recent faster ones with fewer cores.
920
921 Note that the command line above added a C<-j> parameter to make, so as
922 to cause parallel compilation.  This may or may not work on your
923 platform.
924
925 =head2 Running tests by hand
926
927 You can run part of the test suite by hand by using one of the
928 following commands from the F<t/> directory:
929
930     ./perl -I../lib TEST list-of-.t-files
931
932 or
933
934     ./perl -I../lib harness list-of-.t-files
935
936 (If you don't specify test scripts, the whole test suite will be run.)
937
938 =head2 Using F<t/harness> for testing
939
940 If you use C<harness> for testing, you have several command line
941 options available to you.  The arguments are as follows, and are in the
942 order that they must appear if used together.
943
944     harness -v -torture -re=pattern LIST OF FILES TO TEST
945     harness -v -torture -re LIST OF PATTERNS TO MATCH
946
947 If C<LIST OF FILES TO TEST> is omitted, the file list is obtained from
948 the manifest.  The file list may include shell wildcards which will be
949 expanded out.
950
951 =over 4
952
953 =item * -v
954
955 Run the tests under verbose mode so you can see what tests were run,
956 and debug output.
957
958 =item * -torture
959
960 Run the torture tests as well as the normal set.
961
962 =item * -re=PATTERN
963
964 Filter the file list so that all the test files run match PATTERN.
965 Note that this form is distinct from the B<-re LIST OF PATTERNS> form
966 below in that it allows the file list to be provided as well.
967
968 =item * -re LIST OF PATTERNS
969
970 Filter the file list so that all the test files run match
971 /(LIST|OF|PATTERNS)/.  Note that with this form the patterns are joined
972 by '|' and you cannot supply a list of files, instead the test files
973 are obtained from the MANIFEST.
974
975 =back
976
977 You can run an individual test by a command similar to
978
979     ./perl -I../lib path/to/foo.t
980
981 except that the harnesses set up some environment variables that may
982 affect the execution of the test:
983
984 =over 4
985
986 =item * PERL_CORE=1
987
988 indicates that we're running this test as part of the perl core test
989 suite.  This is useful for modules that have a dual life on CPAN.
990
991 =item * PERL_DESTRUCT_LEVEL=2
992
993 is set to 2 if it isn't set already (see
994 L<perlhacktips/PERL_DESTRUCT_LEVEL>).
995
996 =item * PERL
997
998 (used only by F<t/TEST>) if set, overrides the path to the perl
999 executable that should be used to run the tests (the default being
1000 F<./perl>).
1001
1002 =item * PERL_SKIP_TTY_TEST
1003
1004 if set, tells to skip the tests that need a terminal.  It's actually
1005 set automatically by the Makefile, but can also be forced artificially
1006 by running 'make test_notty'.
1007
1008 =back
1009
1010 =head3 Other environment variables that may influence tests
1011
1012 =over 4
1013
1014 =item * PERL_TEST_Net_Ping
1015
1016 Setting this variable runs all the Net::Ping modules tests, otherwise
1017 some tests that interact with the outside world are skipped.  See
1018 L<perl58delta>.
1019
1020 =item * PERL_TEST_NOVREXX
1021
1022 Setting this variable skips the vrexx.t tests for OS2::REXX.
1023
1024 =item * PERL_TEST_NUMCONVERTS
1025
1026 This sets a variable in op/numconvert.t.
1027
1028 =item * PERL_TEST_MEMORY
1029
1030 Setting this variable includes the tests in F<t/bigmem/>.  This should
1031 be set to the number of gigabytes of memory available for testing, eg.
1032 C<PERL_TEST_MEMORY=4> indicates that tests that require 4GiB of
1033 available memory can be run safely.
1034
1035 =back
1036
1037 See also the documentation for the Test and Test::Harness modules, for
1038 more environment variables that affect testing.
1039
1040 =head2 Performance testing
1041
1042 The file F<t/perf/benchmarks> contains snippets of perl code which are
1043 intended to be benchmarked across a range of perls by the
1044 F<Porting/bench.pl> tool. If you fix or enhance a performance issue, you
1045 may want to add a representative code sample to the file, then run
1046 F<bench.pl> against the previous and current perls to see what difference
1047 it has made, and whether anything else has slowed down as a consequence.
1048
1049 The file F<t/perf/opcount.t> is designed to test whether a particular
1050 code snippet has been compiled into an optree containing specified
1051 numbers of particular op types. This is good for testing whether
1052 optimisations which alter ops, such as converting an C<aelem> op into an
1053 C<aelemfast> op, are really doing that.
1054
1055 The files F<t/perf/speed.t> and F<t/re/speed.t> are designed to test
1056 things that run thousands of times slower if a particular optimisation
1057 is broken (for example, the utf8 length cache on long utf8 strings).
1058 Add a test that will take a fraction of a second normally, and minutes
1059 otherwise, causing the test file to time out on failure.
1060
1061 =head2 Building perl at older commits
1062
1063 In the course of hacking on the Perl core distribution, you may have occasion
1064 to configure, build and test perl at an old commit.  Sometimes C<make> will
1065 fail during this process.  If that happens, you may be able to salvage the
1066 situation by using the Devel::PatchPerl library from CPAN (not included in the
1067 core) to bring the source code at that commit to a buildable state.
1068
1069 Here's a real world example, taken from work done to resolve
1070 L<perl #10118|https://github.com/Perl/perl5/issues/10118>.
1071 Use of F<Porting/bisect.pl> had identified commit
1072 C<ba77e4cc9d1ceebf472c9c5c18b2377ee47062e6> as the commit in which a bug was
1073 corrected.  To confirm, a P5P developer wanted to configure and build perl at
1074 commit C<ba77e4c^> (presumably "bad") and then at C<ba77e4c> (presumably
1075 "good").  Normal configuration and build was attempted:
1076
1077     $ sh ./Configure -des -Dusedevel
1078     $ make test_prep
1079
1080 C<make>, however, failed with output (excerpted) like this:
1081
1082     cc -fstack-protector -L/usr/local/lib -o miniperl \
1083       gv.o toke.o perly.o pad.o regcomp.o dump.o util.o \
1084       mg.o reentr.o mro.o hv.o av.o run.o pp_hot.o sv.o \
1085       pp.o scope.o pp_ctl.o pp_sys.o doop.o doio.o regexec.o \
1086       utf8.o taint.o deb.o universal.o globals.o perlio.o \
1087       numeric.o mathoms.o locale.o pp_pack.o pp_sort.o  \
1088       miniperlmain.o opmini.o perlmini.o
1089     pp.o: In function `Perl_pp_pow':
1090     pp.c:(.text+0x2db9): undefined reference to `pow'
1091     ...
1092     collect2: error: ld returned 1 exit status
1093     makefile:348: recipe for target 'miniperl' failed
1094     make: *** [miniperl] Error 1
1095
1096 Another P5P contributor recommended installation and use of Devel::PatchPerl
1097 for this situation, first to determine the version of perl at the commit in
1098 question, then to patch the source code at that point to facilitate a build.
1099
1100     $ perl -MDevel::PatchPerl -e \
1101         'print Devel::PatchPerl->determine_version("/path/to/sourcecode"), "\n";'
1102     5.11.1
1103     $ perl -MDevel::PatchPerl -e \
1104         'Devel::PatchPerl->patch_source("5.11.1", "/path/to/sourcecode");'
1105
1106 Once the source was patched, C<./Configure> and C<make test_prep> were called
1107 and completed successfully, enabling confirmation of the findings in RT
1108 #72414.
1109
1110 =head1 MORE READING FOR GUTS HACKERS
1111
1112 To hack on the Perl guts, you'll need to read the following things:
1113
1114 =over 4
1115
1116 =item * L<perlsource>
1117
1118 An overview of the Perl source tree.  This will help you find the files
1119 you're looking for.
1120
1121 =item * L<perlinterp>
1122
1123 An overview of the Perl interpreter source code and some details on how
1124 Perl does what it does.
1125
1126 =item * L<perlhacktut>
1127
1128 This document walks through the creation of a small patch to Perl's C
1129 code.  If you're just getting started with Perl core hacking, this will
1130 help you understand how it works.
1131
1132 =item * L<perlhacktips>
1133
1134 More details on hacking the Perl core.  This document focuses on lower
1135 level details such as how to write tests, compilation issues,
1136 portability, debugging, etc.
1137
1138 If you plan on doing serious C hacking, make sure to read this.
1139
1140 =item * L<perlguts>
1141
1142 This is of paramount importance, since it's the documentation of what
1143 goes where in the Perl source.  Read it over a couple of times and it
1144 might start to make sense - don't worry if it doesn't yet, because the
1145 best way to study it is to read it in conjunction with poking at Perl
1146 source, and we'll do that later on.
1147
1148 Gisle Aas's "illustrated perlguts", also known as I<illguts>, has very
1149 helpful pictures:
1150
1151 L<https://metacpan.org/release/RURBAN/illguts-0.49>
1152
1153 =item * L<perlxstut> and L<perlxs>
1154
1155 A working knowledge of XSUB programming is incredibly useful for core
1156 hacking; XSUBs use techniques drawn from the PP code, the portion of
1157 the guts that actually executes a Perl program.  It's a lot gentler to
1158 learn those techniques from simple examples and explanation than from
1159 the core itself.
1160
1161 =item * L<perlapi>
1162
1163 The documentation for the Perl API explains what some of the internal
1164 functions do, as well as the many macros used in the source.
1165
1166 =item * F<Porting/pumpkin.pod>
1167
1168 This is a collection of words of wisdom for a Perl porter; some of it
1169 is only useful to the pumpkin holders, but most of it applies to anyone
1170 wanting to go about Perl development.
1171
1172 =back
1173
1174 =head1 CPAN TESTERS AND PERL SMOKERS
1175
1176 The CPAN testers ( L<http://cpantesters.org/> ) are a group of volunteers
1177 who test CPAN modules on a variety of platforms.
1178
1179 Perl Smokers ( L<https://www.nntp.perl.org/group/perl.daily-build/> and
1180 L<https://www.nntp.perl.org/group/perl.daily-build.reports/> )
1181 automatically test Perl source releases on platforms with various
1182 configurations.
1183
1184 Both efforts welcome volunteers.  In order to get involved in smoke
1185 testing of the perl itself visit
1186 L<https://metacpan.org/release/Test-Smoke>.  In order to start smoke
1187 testing CPAN modules visit
1188 L<https://metacpan.org/release/CPANPLUS-YACSmoke> or
1189 L<https://metacpan.org/release/minismokebox> or
1190 L<https://metacpan.org/release/CPAN-Reporter>.
1191
1192 =head1 WHAT NEXT?
1193
1194 If you've read all the documentation in the document and the ones
1195 listed above, you're more than ready to hack on Perl.
1196
1197 Here's some more recommendations
1198
1199 =over 4
1200
1201 =item *
1202
1203 Subscribe to perl5-porters, follow the patches and try and understand
1204 them; don't be afraid to ask if there's a portion you're not clear on -
1205 who knows, you may unearth a bug in the patch...
1206
1207 =item *
1208
1209 Do read the README associated with your operating system, e.g.
1210 README.aix on the IBM AIX OS.  Don't hesitate to supply patches to that
1211 README if you find anything missing or changed over a new OS release.
1212
1213 =item *
1214
1215 Find an area of Perl that seems interesting to you, and see if you can
1216 work out how it works.  Scan through the source, and step over it in
1217 the debugger.  Play, poke, investigate, fiddle! You'll probably get to
1218 understand not just your chosen area but a much wider range of
1219 F<perl>'s activity as well, and probably sooner than you'd think.
1220
1221 =back
1222
1223 =head2 "The Road goes ever on and on, down from the door where it began."
1224
1225 If you can do these things, you've started on the long road to Perl
1226 porting.  Thanks for wanting to help make Perl better - and happy
1227 hacking!
1228
1229 =head2 Metaphoric Quotations
1230
1231 If you recognized the quote about the Road above, you're in luck.
1232
1233 Most software projects begin each file with a literal description of
1234 each file's purpose.  Perl instead begins each with a literary allusion
1235 to that file's purpose.
1236
1237 Like chapters in many books, all top-level Perl source files (along
1238 with a few others here and there) begin with an epigrammatic
1239 inscription that alludes, indirectly and metaphorically, to the
1240 material you're about to read.
1241
1242 Quotations are taken from writings of J.R.R. Tolkien pertaining to his
1243 Legendarium, almost always from I<The Lord of the Rings>.  Chapters and
1244 page numbers are given using the following editions:
1245
1246 =over 4
1247
1248 =item *
1249
1250 I<The Hobbit>, by J.R.R. Tolkien.  The hardcover, 70th-anniversary
1251 edition of 2007 was used, published in the UK by Harper Collins
1252 Publishers and in the US by the Houghton Mifflin Company.
1253
1254 =item *
1255
1256 I<The Lord of the Rings>, by J.R.R. Tolkien.  The hardcover,
1257 50th-anniversary edition of 2004 was used, published in the UK by
1258 Harper Collins Publishers and in the US by the Houghton Mifflin
1259 Company.
1260
1261 =item *
1262
1263 I<The Lays of Beleriand>, by J.R.R. Tolkien and published posthumously
1264 by his son and literary executor, C.J.R. Tolkien, being the 3rd of the
1265 12 volumes in Christopher's mammoth I<History of Middle Earth>.  Page
1266 numbers derive from the hardcover edition, first published in 1983 by
1267 George Allen & Unwin; no page numbers changed for the special 3-volume
1268 omnibus edition of 2002 or the various trade-paper editions, all again
1269 now by Harper Collins or Houghton Mifflin.
1270
1271 =back
1272
1273 Other JRRT books fair game for quotes would thus include I<The
1274 Adventures of Tom Bombadil>, I<The Silmarillion>, I<Unfinished Tales>,
1275 and I<The Tale of the Children of Hurin>, all but the first
1276 posthumously assembled by CJRT.  But I<The Lord of the Rings> itself is
1277 perfectly fine and probably best to quote from, provided you can find a
1278 suitable quote there.
1279
1280 So if you were to supply a new, complete, top-level source file to add
1281 to Perl, you should conform to this peculiar practice by yourself
1282 selecting an appropriate quotation from Tolkien, retaining the original
1283 spelling and punctuation and using the same format the rest of the
1284 quotes are in.  Indirect and oblique is just fine; remember, it's a
1285 metaphor, so being meta is, after all, what it's for.
1286
1287 =head1 AUTHOR
1288
1289 This document was originally written by Nathan Torkington, and is
1290 maintained by the perl5-porters mailing list.