ff6d3eb5f28f941f60a41341f600a5b478b148a8
[perl.git] / cpan / Unicode-Collate / Changes
1 Revision history for Perl module Unicode::Collate.
2
3 0.64  Sun Oct 31 14:17:29 2010
4     - U::C::Locale newly supports locale: ja.
5     - added Unicode::Collate::CJK::JISX0208 for ja.
6     - a subroutine specified in 'overrideCJK' or 'overrideHangul' is allowed
7       to return an integer or undef value.
8     - fix: Ideographs Ext.A are assigned since UCA Version 9 (Unicode 3.1).
9            This fix should affect only the case of (UCA_Version => 8).
10
11 0.63  Sun Oct 10 22:13:21 2010
12     - supported suppress contractions (see 'suppress' in POD).
13     - internal for hangul_terminator in getSortKey().
14     - U::C::Locale newly supports locales: be, bg, kk, mk, ru, sr.
15     - added tailoring with U+0340 or U+0341 instead of U+0300 or U+0301.
16         (affected locales: hr, is, pl, se, to, wo)
17
18 0.62  Wed Oct  6 21:35:54 2010
19     - U::C::Locale newly supports locales: ar, hu, hy, se, to, uk.
20     - Vietnamese (vi): added tailoring for U+0340 and U+0341.
21
22 0.61  Sat Oct  2 11:41:29 2010
23     - U::C::Locale newly supports locales: hr, ig, sq.
24     - precomposites of e-dot-below, o-dot-below, o-tilde are tailored as well.
25         (affected locales: et, yo)
26     - Vietnamese (vi): added contractions for non-blocked decompositions
27       * base + dot-below + mark such as a\x{323}\x{306}, \x{1EA1}\x{306} etc.
28       * base + tone + horn such as o\x{309}\x{31B}, \x{1ECF}\x{31B} etc.
29
30 0.60  Thu Sep 23 21:37:36 2010
31     - bug fix: index() [and its friends including gmatch()] didn't remove
32       ignorable characters in the substring correctly.
33       Thanks for the bug report:
34   http://www.xray.mpe.mpg.de/mailing-lists/perl-unicode/2010-09/msg00014.html
35
36     - U::C::Locale newly supports locales: de__phonebook, nso, om, tn, vi.
37     - precomposites of a-breve, a-circ, e-circ, o-circ are tailored as well.
38         (affected locales: ro, sk, sv)
39
40 0.59  Sun Sep  5 17:03:52 2010
41     - U::C::Locale newly supports locales: az, fil, ha, lt, mt, tr, wo, yo.
42     - precomposites of a-uml, o-uml, and u-uml are tailored as well.
43         (affected locales: da, et, fi, fo, is, kl, nb, nn, sk, sv)
44
45 0.58  Sun Aug 29 19:56:50 2010
46     - U::C::Locale newly supports locales: af, cy, da, fo, haw, is, kl, sw.
47
48 0.57  Sun Aug 22 22:39:58 2010
49     - U::C::Locale newly supports locales: ca, et, fi, lv, sk, sl.
50
51 0.56  Sun Aug  8 20:24:03 2010
52     - Unicode::Collate::Locale newly supports locales: eo, nb, ro, sv.
53     ! renamed t/locale_{xy}.t to t/loc_{xy}.t (for safer 8.3 names)
54
55 0.55  Sun Aug  1 21:21:23 2010
56     - incorporated Unicode::Collate::Locale with some changes. see:
57   http://www.xray.mpe.mpg.de/mailing-lists/perl-unicode/2004-03/msg00030.html
58     - supported locales: cs, es, es__traditional, fr, nn, pl.
59     ! added t/locale*.t that uses DUCET.
60
61 0.54  Sun Jul 25 21:37:04 2010
62     - Now UCA Revision 20 (based on Unicode 5.2.0).
63     - DUCET is also updated (for Unicode 5.2.0) as Collate/allkeys.txt,
64       which *is required* to test this module.
65     ! Please notice that allkeys.txt will be overwritten if you have had
66       other allkeys.txt already.
67     - U+9FC4..U+9FCB and U+2A700..U+2B734 are new CJK Unified Ideographs.
68     - Many hangul jamo are assigned (affecting hangul_terminator).
69
70     ! DUCET will be compiled when XS is used. Explicit saying
71       <table => 'allkeys.txt'> (or using another table) will prevent
72       this module from using the compiled DUCET.
73
74     ! added t/default.t that uses DUCET.
75
76 0.53  Sun Feb 14 20:46:27 2010
77     - Now UCA Revision 18 (based on Unicode 5.1.0).
78     - DUCET is also updated (for Unicode 5.1.0) as Collate/allkeys.txt,
79       which is not required to test this module.
80     ! Please notice that allkeys.txt will be overwritten if you have had
81       other allkeys.txt already.
82     - U+9FBC..U+9FC3 are new CJK Unified Ideographs.
83
84 0.52  Thu Oct 13 21:51:09 2005
85     - The Unicode::Collate->new method does not destroy user's $_ any longer.
86       (thanks to Jon Warbrick for bug report)
87
88 0.51  Sun May 29 20:21:19 2005
89     - Added the latest DUCET (for Unicode 4.1.0) as Collate/allkeys.txt,
90       which is not required to test this module.
91     ! Please notice that allkeys.txt will be overwritten if you have had
92       other allkeys.txt already.
93     - Added INSTALL section in POD.
94
95 0.50  Sun May  8 20:26:39 2005
96     - Now UCA Revision 14 (based on Unicode 4.1.0).
97     - Some tests are modified.
98     - Added cjkrange.t, ignor.t, override.t.
99     - Added META.yml.
100
101 0.40  Sat Apr 24 06:54:40 2004
102     - Now a table file is searched in @INC.
103
104 0.33  Sat Dec 13 14:07:27 2003
105     - documentation improvement: in "entry", "overrideHangul", etc.
106
107 0.32  Wed Dec  3 23:38:18 2003
108     - A matching part from index(), match() etc. will include illegal
109       code points (as well as ignorable characters) following a grapheme.
110     - Contraction with illegal code point will be invalid.
111     - Added view.t.
112     - Added some tests in illegal.t.
113     - Some tests are separated from test.t into altern.t and rearrang.t.
114     - modified XSUB internals.
115
116 0.31  Sun Nov 16 15:40:15 2003
117     - Illegal code points (surrogate and noncharacter; they are definitely
118       ignorable) will be distinguished from NULL ("\0");
119       but porting is not successful in the case of ((Pure Perl) and
120       (Perl 5.7.3 or before)). If perl 5.6.X is used, XSUB may help it
121       in place of broken CORE::unpack('U*') in older perl.
122     - added illegal.t and illegalp.t.
123     - added XSUB (EXPERIMENTAL!) where some functions are implemented
124       in XSUB. Pure Perl is also supported.
125
126 0.30  Mon Oct 13 21:26:37 2003
127     - fix: Completely ignorable in table should be able to be overrided
128       by non-ignorable in entry.
129     - fix: Maximum length for contraction must not be shortened
130       by a shorter contraction following in table and/or entry.
131     - added normal.t.
132     - some doc fixes
133
134 0.29  Mon Oct 13 12:18:23 2003
135     - now UCA Version 11 (but no functionality is different from Version 9).
136     - supported hangul_terminator.
137     - fix: Base_Unicode_Version falsely returns Perl's Unicode version.
138       C4 in UTS #10 requires UTS's Unicode version.
139     - For variable weighting, 'variable' is recommended
140       and 'alternate' is deprecated.
141     - added version() method.
142     - added hangtype.t, trailwt.t, variable.t, and version.t.
143
144 0.28  Sat Sep 06 20:16:01 2003
145     - Fixed another inconsistency under (normalization => undef):
146       Non-contiguous contraction is always neglected.
147     - Fixed: according to S2.1 in UTS #10, a blocked combining character
148       should not be contracted. One test in test.t was wrong, then removed.
149     - Added contract.t.
150     - (normalization => "prenormalized") is able to be used.
151
152 0.27  Sun Aug 31 22:23:17 2003
153       some improvements:
154     - The maximum length of contracted CE was not checked (v0.22 to v0.26).
155       Collation of a large string including a first letter of a contraction
156       that is not a part of that contraction (say, 'c' of 'ca'
157       where 'ch' is defined) was too slow, inefficient.
158     - A form name for 'normalization', no longer restricted to
159       /^(?:NF)?K?[CD]\z/, will be allowed as long as
160       Unicode::Normalize::normalize() accepts it, since Unicode::Normalize
161       or UAX #15 may be changed/enhanced in future.
162     - When Hangul syllables are decomposed under <normalization => undef>,
163       contraction among jamo (LV, VT, LVT) derived from the same
164       Hangul syllable is allowed.  Added hangul.t.
165
166 0.26  Sun Aug 03 22:23:17 2003
167     - fix: an expansion in which a CE is level 3 ignorable and others are not
168       was wrongly made level 3 ignorable as a whole entry.
169       (In DUCET, some precomposites in Musical Symbols are so)
170
171 0.25  Mon Jun 06 23:20:17 2003
172     - fix Makefile.PL.
173     - internal tweak (again): pack_U() and unpack_U().
174
175 0.24  Thu Apr 02 23:12:54 2003
176     - internal tweak for (?un)pack 'U'.
177
178 0.23  Wed Sep 04 19:25:20 2002
179     - fix: scalar match() no longer returns an lvalue substr ref.
180     - fix: "Ignorable after variable" should be made level 3 ignorable
181            even if alternate => 'blanked'.
182     - Now a grapheme may contain trailing level 2, level 3,
183       and completely ignorable characters.
184
185 0.22  Mon Sep 02 23:15:14 2002
186     - New File: index.t.
187       (The new test.t excludes tests for index.)
188     - tweak on index(). POSITION is supported.
189     - add match, gmatch, subst, gsubst methods.
190     - fix: ignorable after variable in 'shift'-variable weight.
191
192 0.21  Sat Aug 03 10:24:00 2002
193     - upgrade keys.txt and t/test.t for UCA Version 9.
194
195 0.20  Fri Jul 26 02:15:25 2002
196     - now UCA Version 9.
197     - U+FDD0..U+FDEF are new non-characters.
198     - fix: whitespace characters before @backwards etc. in a table file.
199     - now values for 'alternate', 'backwards', etc.,
200       which are explicitly specified via new(),
201       are preferred to those specified in a table file.
202
203 0.12  Sun May 05 09:43:10 2002
204     - add new methods, ->UCA_Version and ->Base_Unicode_Version.
205     - test fix: removed the needless requirement of Unicode::Normalize.
206       [reported by David Hand]
207
208 0.11  Fri May 03 02:28:10 2002
209     - fix: now derived collation elements can be used for Hangul Jamo
210       when their weights are not defined.
211       [reported by Andreas J. Koenig]
212     - fix: rearrangements had not worked.
213     - mentioned pleblem on index() in BUGS.
214     - more documents, more tests.
215     - tag names for 'alternate' are case-insensitive (i.e. 'SHIFTed' etc.).
216     - The <undef> value for the keys "overrideCJK", "overrideHangul",
217       "rearrange" has a special behavior (different from default).
218
219 0.10  Tue Dec 11 23:26:42 2001
220     - now you are allowed to use no table file.
221     - fix: fetching CE with two or more combining characters.
222
223 0.09  Sun Nov 11 17:02:40:18 2001
224     - add the following methods: eq, ne, lt, le, gt, le.
225     - relies on &Unicode::Normalize::getCombinClass()
226       in place of %Unicode::Normalize::Combin
227       (the hash is not defined in the XS version of Unicode::Normalize).
228       then you should install Unicode::Normalize 0.10 or later.
229     - now independent of Lingua::KO::Hangul::Util
230       (this module does decomposition of Hangul syllables for itself)
231
232 0.08  Mon Aug 20 22:40:18 2001
233     - add the index method.
234
235 0.07  Thu Aug 16 23:42:02 2001
236     - rename the module name to Unicode::Collate.
237
238 0.06  Thu Aug 16 23:18:36 2001
239     - add description of the getSortKey method.
240
241 0.05  Mon Aug 13 22:23:11 2001
242     - bug fix: on the things of 4.2.1, UTR #10
243     - getSortKey returns a string, but not an arrayref.
244
245 0.04  Mon Aug 13 22:23:11 2001
246     - some bugs are fixed.
247     - some tailoring parameters are added.
248
249 0.03  Mon Aug 06 06:26:35 2001
250     - modify README
251
252 0.02  Sun Aug 05 20:20:01 2001
253     - some fix
254
255 0.01  Sun Jul 29 16:16:15 2001
256     - original version; created by h2xs 1.21
257       with options -A -X -n Sort::UCA