This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
Use new Unicode 6.2 beta
[perl5.git] / lib / unicore / CompositionExclusions.txt
index 3e45de2..cd19f42 100644 (file)
@@ -1,5 +1,5 @@
-# CompositionExclusions-5.2.0.txt
-# Date: 2009-05-22, 12:52:00 PDT [KW]
+# CompositionExclusions-6.2.0.txt
+# Date: 2012-05-15, 22:21:00 GMT [KW, LI]
 #
 # This file lists the characters for the Composition Exclusion Table
 # defined in UAX #15, Unicode Normalization Forms.
@@ -7,11 +7,11 @@
 # This file is a normative contributory data file in the
 # Unicode Character Database.
 #
-# Copyright (c) 1991-2009 Unicode, Inc.
+# Copyright (c) 1991-2012 Unicode, Inc.
 # For terms of use, see http://www.unicode.org/terms_of_use.html
 #
 # For more information, see
-# http://www.unicode.org/unicode/reports/tr15/#Primary Exclusion List Table
+# http://www.unicode.org/unicode/reports/tr15/#Primary_Exclusion_List_Table
 #
 # For a full derivation of composition exclusions, see the derived property
 # Full_Composition_Exclusion in DerivedNormalizationProps.txt
@@ -126,8 +126,8 @@ FB4E    #  HEBREW LETTER PE WITH RAFE
 # (3) Singleton Decompositions
 #
 # These characters can be derived from the UnicodeData.txt file
-# by including all characters whose canonical decomposition
-# consists of a single character.
+# by including all canonically decomposable characters whose
+# canonical decomposition consists of a single character.
 #
 # These characters are simply quoted here for reference.
 # See also Full_Composition_Exclusion in DerivedNormalizationProps.txt
@@ -169,20 +169,28 @@ FB4E    #  HEBREW LETTER PE WITH RAFE
 # FA20                 CJK COMPATIBILITY IDEOGRAPH-FA20
 # FA22                 CJK COMPATIBILITY IDEOGRAPH-FA22
 # FA25..FA26       [2] CJK COMPATIBILITY IDEOGRAPH-FA25..CJK COMPATIBILITY IDEOGRAPH-FA26
-# FA2A..FA2D       [4] CJK COMPATIBILITY IDEOGRAPH-FA2A..CJK COMPATIBILITY IDEOGRAPH-FA2D
-# FA30..FA6D      [62] CJK COMPATIBILITY IDEOGRAPH-FA30..CJK COMPATIBILITY IDEOGRAPH-FA6D
+# FA2A..FA6D      [68] CJK COMPATIBILITY IDEOGRAPH-FA2A..CJK COMPATIBILITY IDEOGRAPH-FA6D
 # FA70..FAD9     [106] CJK COMPATIBILITY IDEOGRAPH-FA70..CJK COMPATIBILITY IDEOGRAPH-FAD9
 # 2F800..2FA1D   [542] CJK COMPATIBILITY IDEOGRAPH-2F800..CJK COMPATIBILITY IDEOGRAPH-2FA1D
 
-# Total code points: 1033
+# Total code points: 1035
 
 # ================================================
 # (4) Non-Starter Decompositions
 #
-# These characters can be derived from the UnicodeData file
-# by including all characters whose canonical decomposition consists
-# of a sequence of characters, the first of which has a non-zero
-# combining class.
+# These characters can be derived from the UnicodeData.txt file
+# by including each expanding canonical decomposition
+# (i.e., those which canonically decompose to a sequence
+# of characters instead of a single character), such that:
+#
+# A. The character is not a Starter.
+#
+# OR (inclusive)
+#
+# B. The character's canonical decomposition begins
+# with a character that is not a Starter.
+#
+# Note that a "Starter" is any character with a zero combining class.
 #
 # These characters are simply quoted here for reference.
 # See also Full_Composition_Exclusion in DerivedNormalizationProps.txt
@@ -195,3 +203,4 @@ FB4E    #  HEBREW LETTER PE WITH RAFE
 
 # Total code points: 4
 
+# EOF