This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
make op/write.t work better under stdio by running the subtests
[perl5.git] / lib / Digest.pm
1 package Digest;
2
3 use strict;
4 use vars qw($VERSION %MMAP $AUTOLOAD);
5
6 $VERSION = "1.05";
7
8 %MMAP = (
9   "SHA-1"      => ["Digest::SHA1", ["Digest::SHA", 1], ["Digest::SHA2", 1]],
10   "SHA-256"    => [["Digest::SHA", 256], ["Digest::SHA2", 256]],
11   "SHA-384"    => [["Digest::SHA", 384], ["Digest::SHA2", 384]],
12   "SHA-512"    => [["Digest::SHA", 512], ["Digest::SHA2", 512]],
13   "HMAC-MD5"   => "Digest::HMAC_MD5",
14   "HMAC-SHA-1" => "Digest::HMAC_SHA1",
15 );
16
17 sub new
18 {
19     shift;  # class ignored
20     my $algorithm = shift;
21     my $impl = $MMAP{$algorithm} || do {
22         $algorithm =~ s/\W+//;
23         "Digest::$algorithm";
24     };
25     $impl = [$impl] unless ref($impl);
26     my $err;
27     for  (@$impl) {
28         my $class = $_;
29         my @args;
30         ($class, @args) = @$class if ref($class);
31         no strict 'refs';
32         unless (exists ${"$class\::"}{"VERSION"}) {
33             eval "require $class";
34             if ($@) {
35                 $err ||= $@;
36                 next;
37             }
38         }
39         return $class->new(@args, @_);
40     }
41     die $err;
42 }
43
44 sub AUTOLOAD
45 {
46     my $class = shift;
47     my $algorithm = substr($AUTOLOAD, rindex($AUTOLOAD, '::')+2);
48     $class->new($algorithm, @_);
49 }
50
51 1;
52
53 __END__
54
55 =head1 NAME
56
57 Digest - Modules that calculate message digests
58
59 =head1 SYNOPSIS
60
61   $md5  = Digest->new("MD5");
62   $sha1 = Digest->new("SHA-1");
63   $sha256 = Digest->new("SHA-256");
64   $sha384 = Digest->new("SHA-384");
65   $sha512 = Digest->new("SHA-512");
66
67   $hmac = Digest->HMAC_MD5($key);
68
69 =head1 DESCRIPTION
70
71 The C<Digest::> modules calculate digests, also called "fingerprints"
72 or "hashes", of some data, called a message.  The digest is (usually)
73 some small/fixed size string.  The actual size of the digest depend of
74 the algorithm used.  The message is simply a sequence of arbitrary
75 bytes or bits.
76
77 An important property of the digest algorithms is that the digest is
78 I<likely> to change if the message change in some way.  Another
79 property is that digest functions are one-way functions, i.e. it
80 should be I<hard> to find a message that correspond to some given
81 digest.  Algorithms differ in how "likely" and how "hard", as well as
82 how efficient they are to compute.
83
84 All C<Digest::> modules provide the same programming interface.  A
85 functional interface for simple use, as well as an object oriented
86 interface that can handle messages of arbitrary length and which can
87 read files directly.
88
89 The digest can be delivered in three formats:
90
91 =over 8
92
93 =item I<binary>
94
95 This is the most compact form, but it is not well suited for printing
96 or embedding in places that can't handle arbitrary data.
97
98 =item I<hex>
99
100 A twice as long string of lowercase hexadecimal digits.
101
102 =item I<base64>
103
104 A string of portable printable characters.  This is the base64 encoded
105 representation of the digest with any trailing padding removed.  The
106 string will be about 30% longer than the binary version.
107 L<MIME::Base64> tells you more about this encoding.
108
109 =back
110
111
112 The functional interface is simply importable functions with the same
113 name as the algorithm.  The functions take the message as argument and
114 return the digest.  Example:
115
116   use Digest::MD5 qw(md5);
117   $digest = md5($message);
118
119 There are also versions of the functions with "_hex" or "_base64"
120 appended to the name, which returns the digest in the indicated form.
121
122 =head1 OO INTERFACE
123
124 The following methods are available for all C<Digest::> modules:
125
126 =over 4
127
128 =item $ctx = Digest->XXX($arg,...)
129
130 =item $ctx = Digest->new(XXX => $arg,...)
131
132 =item $ctx = Digest::XXX->new($arg,...)
133
134 The constructor returns some object that encapsulate the state of the
135 message-digest algorithm.  You can add data to the object and finally
136 ask for the digest.  The "XXX" should of course be replaced by the proper
137 name of the digest algorithm you want to use.
138
139 The two first forms are simply syntactic sugar which automatically
140 load the right module on first use.  The second form allow you to use
141 algorithm names which contains letters which are not legal perl
142 identifiers, e.g. "SHA-1".
143
144 If new() is called as an instance method (i.e. $ctx->new) it will just
145 reset the state the object to the state of a newly created object.  No
146 new object is created in this case, and the return value is the
147 reference to the object (i.e. $ctx).
148
149 =item $other_ctx = $ctx->clone
150
151 The clone method creates a copy of the digest state object and returns
152 a reference to the copy.
153
154 =item $ctx->reset
155
156 This is just an alias for $ctx->new.
157
158 =item $ctx->add( $data, ... )
159
160 The $data provided as argument are appended to the message we
161 calculate the digest for.  The return value is the $ctx object itself.
162
163 =item $ctx->addfile( $io_handle )
164
165 The $io_handle is read until EOF and the content is appended to the
166 message we calculate the digest for.  The return value is the $ctx
167 object itself.
168
169 =item $ctx->add_bits( $data, $nbits )
170
171 =item $ctx->add_bits( $bitstring )
172
173 The bits provided are appended to the message we calculate the digest
174 for.  The return value is the $ctx object itself.
175
176 The two argument form of add_bits() will add the first $nbits bits
177 from data.  For the last potentially partial byte only the high order
178 C<< $nbits % 8 >> bits are used.  If $nbits is greater than C<<
179 length($data) * 8 >>, then this method would do the same as C<<
180 $ctx->add($data) >>, i.e. $nbits is silently ignored.
181
182 The one argument form of add_bits() takes a $bitstring of "1" and "0"
183 chars as argument.  It's a shorthand for C<< $ctx->add_bits(pack("B*",
184 $bitstring), length($bitstring)) >>.
185
186 This example shows two calls that should have the same effect:
187
188    $ctx->add_bits("111100001010");
189    $ctx->add_bits("\xF0\xA0", 12);
190
191 Most digest algorithms are byte based.  For those it is not possible
192 to add bits that are not a multiple of 8, and the add_bits() method
193 will croak if you try.
194
195 =item $ctx->digest
196
197 Return the binary digest for the message.
198
199 Note that the C<digest> operation is effectively a destructive,
200 read-once operation. Once it has been performed, the $ctx object is
201 automatically C<reset> and can be used to calculate another digest
202 value.  Call $ctx->clone->digest if you want to calculate the digest
203 without reseting the digest state.
204
205 =item $ctx->hexdigest
206
207 Same as $ctx->digest, but will return the digest in hexadecimal form.
208
209 =item $ctx->b64digest
210
211 Same as $ctx->digest, but will return the digest as a base64 encoded
212 string.
213
214 =back
215
216 =head1 Digest speed
217
218 This table should give some indication on the relative speed of
219 different algorithms.  It is sorted by throughput based on a benchmark
220 done with of some implementations of this API:
221
222  Algorithm      Size    Implementation                  MB/s
223
224  MD4            128     Digest::MD4 v1.1                24.9
225  MD5            128     Digest::MD5 v2.30               18.7
226  Haval-256      256     Digest::Haval256 v1.0.4         17.0
227  SHA-1          160     Digest::SHA1 v2.06              15.3
228  SHA-1          160     Digest::SHA v4.0.0              10.1
229  SHA-256        256     Digest::SHA2 v1.0.0              7.6
230  SHA-256        256     Digest::SHA v4.0.0               6.5
231  SHA-384        384     Digest::SHA2 v1.0.0              2.7
232  SHA-384        384     Digest::SHA v4.0.0               2.7
233  SHA-512        512     Digest::SHA2 v1.0.0              2.7
234  SHA-512        512     Digest::SHA v4.0.0               2.7
235  Whirlpool      512     Digest::Whirlpool v1.0.2         1.4
236  MD2            128     Digest::MD2 v2.03                1.1
237
238  Adler-32        32     Digest::Adler32 v0.03            0.2
239  MD5            128     Digest::Perl::MD5 v1.5           0.1
240
241 These numbers was achieved Nov 2003 with ActivePerl-5.8.1 running
242 under Linux on a P-II 350 MHz CPU.  The last 2 entries differ by being
243 pure perl implementations of the algorithms, which explains why they
244 are so slow.
245
246 =head1 SEE ALSO
247
248 L<Digest::Adler32>, L<Digest::Haval256>, L<Digest::HMAC>, L<Digest::MD2>, L<Digest::MD4>, L<Digest::MD5>, L<Digest::SHA>, L<Digest::SHA1>, L<Digest::SHA2>, L<Digest::Whirlpool>
249
250 New digest implementations should consider subclassing from L<Digest::base>.
251
252 L<MIME::Base64>
253
254 =head1 AUTHOR
255
256 Gisle Aas <gisle@aas.no>
257
258 The C<Digest::> interface is based on the interface originally
259 developed by Neil Winton for his C<MD5> module.
260
261 This library is free software; you can redistribute it and/or
262 modify it under the same terms as Perl itself.
263
264     Copyright 1998-2001,2003 Gisle Aas.
265     Copyright 1995-1996 Neil Winton.
266
267 =cut