This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Add the URL for annotated svn of S03.
[perl5.git] / pod / pod2man.PL
1 #!/usr/local/bin/perl
2
3 use Config;
4 use File::Basename qw(&basename &dirname);
5 use Cwd;
6
7 # List explicitly here the variables you want Configure to
8 # generate.  Metaconfig only looks for shell variables, so you
9 # have to mention them as if they were shell variables, not
10 # %Config entries.  Thus you write
11 #  $startperl
12 # to ensure Configure will look for $Config{startperl}.
13
14 # This forces PL files to create target in same directory as PL file.
15 # This is so that make depend always knows where to find PL derivatives.
16 $origdir = cwd;
17 chdir dirname($0);
18 $file = basename($0, '.PL');
19 $file .= '.com' if $^O eq 'VMS';
20
21 open OUT,">$file" or die "Can't create $file: $!";
22
23 print "Extracting $file (with variable substitutions)\n";
24
25 # In this section, perl variables will be expanded during extraction.
26 # You can use $Config{...} to use Configure variables.
27
28 print OUT <<"!GROK!THIS!";
29 $Config{startperl}
30     eval 'exec $Config{perlpath} -S \$0 \${1+"\$@"}'
31         if \$running_under_some_shell;
32 !GROK!THIS!
33
34 # In the following, perl variables are not expanded during extraction.
35
36 print OUT <<'!NO!SUBS!';
37
38 # pod2man -- Convert POD data to formatted *roff input.
39 #
40 # Copyright 1999, 2000, 2001, 2004, 2006, 2008 Russ Allbery <rra@stanford.edu>
41 #
42 # This program is free software; you may redistribute it and/or modify it
43 # under the same terms as Perl itself.
44
45 require 5.004;
46
47 use Getopt::Long qw(GetOptions);
48 use Pod::Man ();
49 use Pod::Usage qw(pod2usage);
50
51 use strict;
52
53 # Silence -w warnings.
54 use vars qw($running_under_some_shell);
55
56 # Insert -- into @ARGV before any single dash argument to hide it from
57 # Getopt::Long; we want to interpret it as meaning stdin.
58 my $stdin;
59 @ARGV = map { $_ eq '-' && !$stdin++ ? ('--', $_) : $_ } @ARGV;
60
61 # Parse our options, trying to retain backwards compatibility with pod2man but
62 # allowing short forms as well.  --lax is currently ignored.
63 my %options;
64 Getopt::Long::config ('bundling_override');
65 GetOptions (\%options, 'section|s=s', 'release|r:s', 'center|c=s',
66             'date|d=s', 'fixed=s', 'fixedbold=s', 'fixeditalic=s',
67             'fixedbolditalic=s', 'name|n=s', 'official|o', 'quotes|q=s',
68             'lax|l', 'help|h', 'verbose|v', 'utf8|u') or exit 1;
69 pod2usage (0) if $options{help};
70
71 # Official sets --center, but don't override things explicitly set.
72 if ($options{official} && !defined $options{center}) {
73     $options{center} = 'Perl Programmers Reference Guide';
74 }
75
76 # Verbose is only our flag, not a Pod::Man flag.
77 my $verbose = $options{verbose};
78 delete $options{verbose};
79
80 # This isn't a valid Pod::Man option and is only accepted for backwards
81 # compatibility.
82 delete $options{lax};
83
84 # Initialize and run the formatter, pulling a pair of input and output off at
85 # a time.
86 my $parser = Pod::Man->new (%options);
87 my @files;
88 do {
89     @files = splice (@ARGV, 0, 2);
90     print "  $files[1]\n" if $verbose;
91     $parser->parse_from_file (@files);
92 } while (@ARGV);
93
94 __END__
95
96 =head1 NAME
97
98 pod2man - Convert POD data to formatted *roff input
99
100 =for stopwords
101 en em --utf8 UTF-8 overdo markup MT-LEVEL Allbery
102
103 =head1 SYNOPSIS
104
105 pod2man [B<--section>=I<manext>] [B<--release>[=I<version>]]
106     [B<--center>=I<string>] [B<--date>=I<string>] [B<--fixed>=I<font>]
107     [B<--fixedbold>=I<font>] [B<--fixeditalic>=I<font>]
108     [B<--fixedbolditalic>=I<font>] [B<--name>=I<name>] [B<--official>]
109     [B<--lax>] [B<--quotes>=I<quotes>] [B<--verbose>]
110     [I<input> [I<output>] ...]
111
112 pod2man B<--help>
113
114 =head1 DESCRIPTION
115
116 B<pod2man> is a front-end for Pod::Man, using it to generate *roff input
117 from POD source.  The resulting *roff code is suitable for display on a
118 terminal using nroff(1), normally via man(1), or printing using troff(1).
119
120 I<input> is the file to read for POD source (the POD can be embedded in
121 code).  If I<input> isn't given, it defaults to C<STDIN>.  I<output>, if
122 given, is the file to which to write the formatted output.  If I<output>
123 isn't given, the formatted output is written to C<STDOUT>.  Several POD
124 files can be processed in the same B<pod2man> invocation (saving module
125 load and compile times) by providing multiple pairs of I<input> and
126 I<output> files on the command line.
127
128 B<--section>, B<--release>, B<--center>, B<--date>, and B<--official> can be
129 used to set the headers and footers to use; if not given, Pod::Man will
130 assume various defaults.  See below or L<Pod::Man> for details.
131
132 B<pod2man> assumes that your *roff formatters have a fixed-width font
133 named C<CW>.  If yours is called something else (like C<CR>), use
134 B<--fixed> to specify it.  This generally only matters for troff output
135 for printing.  Similarly, you can set the fonts used for bold, italic, and
136 bold italic fixed-width output.
137
138 Besides the obvious pod conversions, Pod::Man, and therefore pod2man also
139 takes care of formatting func(), func(n), and simple variable references
140 like $foo or @bar so you don't have to use code escapes for them; complex
141 expressions like C<$fred{'stuff'}> will still need to be escaped, though.
142 It also translates dashes that aren't used as hyphens into en dashes, makes
143 long dashes--like this--into proper em dashes, fixes "paired quotes," and
144 takes care of several other troff-specific tweaks.  See L<Pod::Man> for
145 complete information.
146
147 =head1 OPTIONS
148
149 =over 4
150
151 =item B<-c> I<string>, B<--center>=I<string>
152
153 Sets the centered page header to I<string>.  The default is "User
154 Contributed Perl Documentation", but also see B<--official> below.
155
156 =item B<-d> I<string>, B<--date>=I<string>
157
158 Set the left-hand footer string to this value.  By default, the modification
159 date of the input file will be used, or the current date if input comes from
160 C<STDIN>.
161
162 =item B<--fixed>=I<font>
163
164 The fixed-width font to use for verbatim text and code.  Defaults to
165 C<CW>.  Some systems may want C<CR> instead.  Only matters for troff(1)
166 output.
167
168 =item B<--fixedbold>=I<font>
169
170 Bold version of the fixed-width font.  Defaults to C<CB>.  Only matters
171 for troff(1) output.
172
173 =item B<--fixeditalic>=I<font>
174
175 Italic version of the fixed-width font (actually, something of a misnomer,
176 since most fixed-width fonts only have an oblique version, not an italic
177 version).  Defaults to C<CI>.  Only matters for troff(1) output.
178
179 =item B<--fixedbolditalic>=I<font>
180
181 Bold italic (probably actually oblique) version of the fixed-width font.
182 Pod::Man doesn't assume you have this, and defaults to C<CB>.  Some
183 systems (such as Solaris) have this font available as C<CX>.  Only matters
184 for troff(1) output.
185
186 =item B<-h>, B<--help>
187
188 Print out usage information.
189
190 =item B<-l>, B<--lax>
191
192 No longer used.  B<pod2man> used to check its input for validity as a manual
193 page, but this should now be done by L<podchecker(1)> instead.  Accepted for
194 backwards compatibility; this option no longer does anything.
195
196 =item B<-n> I<name>, B<--name>=I<name>
197
198 Set the name of the manual page to I<name>.  Without this option, the manual
199 name is set to the uppercased base name of the file being converted unless
200 the manual section is 3, in which case the path is parsed to see if it is a
201 Perl module path.  If it is, a path like C<.../lib/Pod/Man.pm> is converted
202 into a name like C<Pod::Man>.  This option, if given, overrides any
203 automatic determination of the name.
204
205 Note that this option is probably not useful when converting multiple POD
206 files at once.  The convention for Unix man pages for commands is for the
207 man page title to be in all-uppercase even if the command isn't.
208
209 =item B<-o>, B<--official>
210
211 Set the default header to indicate that this page is part of the standard
212 Perl release, if B<--center> is not also given.
213
214 =item B<-q> I<quotes>, B<--quotes>=I<quotes>
215
216 Sets the quote marks used to surround CE<lt>> text to I<quotes>.  If
217 I<quotes> is a single character, it is used as both the left and right
218 quote; if I<quotes> is two characters, the first character is used as the
219 left quote and the second as the right quoted; and if I<quotes> is four
220 characters, the first two are used as the left quote and the second two as
221 the right quote.
222
223 I<quotes> may also be set to the special value C<none>, in which case no
224 quote marks are added around CE<lt>> text (but the font is still changed for
225 troff output).
226
227 =item B<-r>, B<--release>
228
229 Set the centered footer.  By default, this is the version of Perl you run
230 B<pod2man> under.  Note that some system an macro sets assume that the
231 centered footer will be a modification date and will prepend something like
232 "Last modified: "; if this is the case, you may want to set B<--release> to
233 the last modified date and B<--date> to the version number.
234
235 =item B<-s>, B<--section>
236
237 Set the section for the C<.TH> macro.  The standard section numbering
238 convention is to use 1 for user commands, 2 for system calls, 3 for
239 functions, 4 for devices, 5 for file formats, 6 for games, 7 for
240 miscellaneous information, and 8 for administrator commands.  There is a lot
241 of variation here, however; some systems (like Solaris) use 4 for file
242 formats, 5 for miscellaneous information, and 7 for devices.  Still others
243 use 1m instead of 8, or some mix of both.  About the only section numbers
244 that are reliably consistent are 1, 2, and 3.
245
246 By default, section 1 will be used unless the file ends in C<.pm>, in
247 which case section 3 will be selected.
248
249 =item B<-u>, B<--utf8>
250
251 By default, B<pod2man> produces the most conservative possible *roff
252 output to try to ensure that it will work with as many different *roff
253 implementations as possible.  Many *roff implementations cannot handle
254 non-ASCII characters, so this means all non-ASCII characters are converted
255 either to a *roff escape sequence that tries to create a properly accented
256 character (at least for troff output) or to C<X>.
257
258 This option says to instead output literal UTF-8 characters.  If your
259 *roff implementation can handle it, this is the best output format to use
260 and avoids corruption of documents containing non-ASCII characters.
261 However, be warned that *roff source with literal UTF-8 characters is not
262 supported by many implementations and may even result in segfaults and
263 other bad behavior.
264
265 =item B<-v>, B<--verbose>
266
267 Print out the name of each output file as it is being generated.
268
269 =back
270
271 =head1 DIAGNOSTICS
272
273 If B<pod2man> fails with errors, see L<Pod::Man> and L<Pod::Simple> for
274 information about what those errors might mean.
275
276 =head1 EXAMPLES
277
278     pod2man program > program.1
279     pod2man SomeModule.pm /usr/perl/man/man3/SomeModule.3
280     pod2man --section=7 note.pod > note.7
281
282 If you would like to print out a lot of man page continuously, you probably
283 want to set the C and D registers to set contiguous page numbering and
284 even/odd paging, at least on some versions of man(7).
285
286     troff -man -rC1 -rD1 perl.1 perldata.1 perlsyn.1 ...
287
288 To get index entries on C<STDERR>, turn on the F register, as in:
289
290     troff -man -rF1 perl.1
291
292 The indexing merely outputs messages via C<.tm> for each major page,
293 section, subsection, item, and any C<XE<lt>E<gt>> directives.  See
294 L<Pod::Man> for more details.
295
296 =head1 BUGS
297
298 Lots of this documentation is duplicated from L<Pod::Man>.
299
300 =head1 NOTES
301
302 For those not sure of the proper layout of a man page, here are some notes
303 on writing a proper man page.
304
305 The name of the program being documented is conventionally written in bold
306 (using BE<lt>E<gt>) wherever it occurs, as are all program options.
307 Arguments should be written in italics (IE<lt>E<gt>).  Functions are
308 traditionally written in italics; if you write a function as function(),
309 Pod::Man will take care of this for you.  Literal code or commands should
310 be in CE<lt>E<gt>.  References to other man pages should be in the form
311 C<manpage(section)>, and Pod::Man will automatically format those
312 appropriately.  As an exception, it's traditional not to use this form when
313 referring to module documentation; use C<LE<lt>Module::NameE<gt>> instead.
314
315 References to other programs or functions are normally in the form of man
316 page references so that cross-referencing tools can provide the user with
317 links and the like.  It's possible to overdo this, though, so be careful not
318 to clutter your documentation with too much markup.
319
320 The major headers should be set out using a C<=head1> directive, and are
321 historically written in the rather startling ALL UPPER CASE format, although
322 this is not mandatory.  Minor headers may be included using C<=head2>, and
323 are typically in mixed case.
324
325 The standard sections of a manual page are:
326
327 =over 4
328
329 =item NAME
330
331 Mandatory section; should be a comma-separated list of programs or functions
332 documented by this POD page, such as:
333
334     foo, bar - programs to do something
335
336 Manual page indexers are often extremely picky about the format of this
337 section, so don't put anything in it except this line.  A single dash, and
338 only a single dash, should separate the list of programs or functions from
339 the description.  Functions should not be qualified with C<()> or the like.
340 The description should ideally fit on a single line, even if a man program
341 replaces the dash with a few tabs.
342
343 =item SYNOPSIS
344
345 A short usage summary for programs and functions.  This section is mandatory
346 for section 3 pages.
347
348 =item DESCRIPTION
349
350 Extended description and discussion of the program or functions, or the body
351 of the documentation for man pages that document something else.  If
352 particularly long, it's a good idea to break this up into subsections
353 C<=head2> directives like:
354
355     =head2 Normal Usage
356
357     =head2 Advanced Features
358
359     =head2 Writing Configuration Files
360
361 or whatever is appropriate for your documentation.
362
363 =item OPTIONS
364
365 Detailed description of each of the command-line options taken by the
366 program.  This should be separate from the description for the use of things
367 like L<Pod::Usage|Pod::Usage>.  This is normally presented as a list, with
368 each option as a separate C<=item>.  The specific option string should be
369 enclosed in BE<lt>E<gt>.  Any values that the option takes should be
370 enclosed in IE<lt>E<gt>.  For example, the section for the option
371 B<--section>=I<manext> would be introduced with:
372
373     =item B<--section>=I<manext>
374
375 Synonymous options (like both the short and long forms) are separated by a
376 comma and a space on the same C<=item> line, or optionally listed as their
377 own item with a reference to the canonical name.  For example, since
378 B<--section> can also be written as B<-s>, the above would be:
379
380     =item B<-s> I<manext>, B<--section>=I<manext>
381
382 (Writing the short option first is arguably easier to read, since the long
383 option is long enough to draw the eye to it anyway and the short option can
384 otherwise get lost in visual noise.)
385
386 =item RETURN VALUE
387
388 What the program or function returns, if successful.  This section can be
389 omitted for programs whose precise exit codes aren't important, provided
390 they return 0 on success as is standard.  It should always be present for
391 functions.
392
393 =item ERRORS
394
395 Exceptions, error return codes, exit statuses, and errno settings.
396 Typically used for function documentation; program documentation uses
397 DIAGNOSTICS instead.  The general rule of thumb is that errors printed to
398 C<STDOUT> or C<STDERR> and intended for the end user are documented in
399 DIAGNOSTICS while errors passed internal to the calling program and
400 intended for other programmers are documented in ERRORS.  When documenting
401 a function that sets errno, a full list of the possible errno values
402 should be given here.
403
404 =item DIAGNOSTICS
405
406 All possible messages the program can print out--and what they mean.  You
407 may wish to follow the same documentation style as the Perl documentation;
408 see perldiag(1) for more details (and look at the POD source as well).
409
410 If applicable, please include details on what the user should do to correct
411 the error; documenting an error as indicating "the input buffer is too
412 small" without telling the user how to increase the size of the input buffer
413 (or at least telling them that it isn't possible) aren't very useful.
414
415 =item EXAMPLES
416
417 Give some example uses of the program or function.  Don't skimp; users often
418 find this the most useful part of the documentation.  The examples are
419 generally given as verbatim paragraphs.
420
421 Don't just present an example without explaining what it does.  Adding a
422 short paragraph saying what the example will do can increase the value of
423 the example immensely.
424
425 =item ENVIRONMENT
426
427 Environment variables that the program cares about, normally presented as a
428 list using C<=over>, C<=item>, and C<=back>.  For example:
429
430     =over 6
431
432     =item HOME
433
434     Used to determine the user's home directory.  F<.foorc> in this
435     directory is read for configuration details, if it exists.
436
437     =back
438
439 Since environment variables are normally in all uppercase, no additional
440 special formatting is generally needed; they're glaring enough as it is.
441
442 =item FILES
443
444 All files used by the program or function, normally presented as a list, and
445 what it uses them for.  File names should be enclosed in FE<lt>E<gt>.  It's
446 particularly important to document files that will be potentially modified.
447
448 =item CAVEATS
449
450 Things to take special care with, sometimes called WARNINGS.
451
452 =item BUGS
453
454 Things that are broken or just don't work quite right.
455
456 =item RESTRICTIONS
457
458 Bugs you don't plan to fix.  :-)
459
460 =item NOTES
461
462 Miscellaneous commentary.
463
464 =item AUTHOR
465
466 Who wrote it (use AUTHORS for multiple people).  Including your current
467 e-mail address (or some e-mail address to which bug reports should be sent)
468 so that users have a way of contacting you is a good idea.  Remember that
469 program documentation tends to roam the wild for far longer than you expect
470 and pick an e-mail address that's likely to last if possible.
471
472 =item HISTORY
473
474 Programs derived from other sources sometimes have this, or you might keep
475 a modification log here.  If the log gets overly long or detailed,
476 consider maintaining it in a separate file, though.
477
478 =item COPYRIGHT AND LICENSE
479
480 For copyright
481
482     Copyright YEAR(s) by YOUR NAME(s)
483
484 (No, (C) is not needed.  No, "all rights reserved" is not needed.)
485
486 For licensing the easiest way is to use the same licensing as Perl itself:
487
488     This library is free software; you may redistribute it and/or modify
489     it under the same terms as Perl itself.
490
491 This makes it easy for people to use your module with Perl.  Note that
492 this licensing is neither an endorsement or a requirement, you are of
493 course free to choose any licensing.
494
495 =item SEE ALSO
496
497 Other man pages to check out, like man(1), man(7), makewhatis(8), or
498 catman(8).  Normally a simple list of man pages separated by commas, or a
499 paragraph giving the name of a reference work.  Man page references, if they
500 use the standard C<name(section)> form, don't have to be enclosed in
501 LE<lt>E<gt> (although it's recommended), but other things in this section
502 probably should be when appropriate.
503
504 If the package has a mailing list, include a URL or subscription
505 instructions here.
506
507 If the package has a web site, include a URL here.
508
509 =back
510
511 In addition, some systems use CONFORMING TO to note conformance to relevant
512 standards and MT-LEVEL to note safeness for use in threaded programs or
513 signal handlers.  These headings are primarily useful when documenting parts
514 of a C library.  Documentation of object-oriented libraries or modules may
515 use CONSTRUCTORS and METHODS sections for detailed documentation of the
516 parts of the library and save the DESCRIPTION section for an overview; other
517 large modules may use FUNCTIONS for similar reasons.  Some people use
518 OVERVIEW to summarize the description if it's quite long.
519
520 Section ordering varies, although NAME should I<always> be the first section
521 (you'll break some man page systems otherwise), and NAME, SYNOPSIS,
522 DESCRIPTION, and OPTIONS generally always occur first and in that order if
523 present.  In general, SEE ALSO, AUTHOR, and similar material should be left
524 for last.  Some systems also move WARNINGS and NOTES to last.  The order
525 given above should be reasonable for most purposes.
526
527 Finally, as a general note, try not to use an excessive amount of markup.
528 As documented here and in L<Pod::Man>, you can safely leave Perl variables,
529 function names, man page references, and the like unadorned by markup and
530 the POD translators will figure it out for you.  This makes it much easier
531 to later edit the documentation.  Note that many existing translators
532 (including this one currently) will do the wrong thing with e-mail addresses
533 when wrapped in LE<lt>E<gt>, so don't do that.
534
535 For additional information that may be more accurate for your specific
536 system, see either L<man(5)> or L<man(7)> depending on your system manual
537 section numbering conventions.
538
539 =head1 SEE ALSO
540
541 L<Pod::Man>, L<Pod::Simple>, L<man(1)>, L<nroff(1)>, L<podchecker(1)>,
542 L<troff(1)>, L<man(7)>
543
544 The man page documenting the an macro set may be L<man(5)> instead of
545 L<man(7)> on your system.
546
547 The current version of this script is always available from its web site at
548 L<http://www.eyrie.org/~eagle/software/podlators/>.  It is also part of the
549 Perl core distribution as of 5.6.0.
550
551 =head1 AUTHOR
552
553 Russ Allbery <rra@stanford.edu>, based I<very> heavily on the original
554 B<pod2man> by Larry Wall and Tom Christiansen.  Large portions of this
555 documentation, particularly the sections on the anatomy of a proper man
556 page, are taken from the B<pod2man> documentation by Tom.
557
558 =head1 COPYRIGHT AND LICENSE
559
560 Copyright 1999, 2000, 2001, 2004, 2006, 2008 Russ Allbery
561 <rra@stanford.edu>.
562
563 This program is free software; you may redistribute it and/or modify it
564 under the same terms as Perl itself.
565
566 =cut
567 !NO!SUBS!
568 #'# (cperl-mode)
569
570 close OUT or die "Can't close $file: $!";
571 chmod 0755, $file or die "Can't reset permissions for $file: $!\n";
572 exec("$Config{'eunicefix'} $file") if $Config{'eunicefix'} ne ':';
573 chdir $origdir;