This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
File::CheckTree hates @'s
[perl5.git] / lib / unicore / ArabicShaping.txt
1 # ArabicShaping-3.2.0.txt
2 #
3 # This file is a normative contributory data file in the
4 # Unicode Character Database.
5 #
6 # This file defines the shaping classes for Arabic and Syriac
7 # positional shaping, repeating in machine readable form the
8 # information printed in Tables 8-6, 8-7, 8-8, 8-10, 8-11, and
9 # 8-13 of The Unicode Standard, Version 3.0, plus additions
10 # for Unicode 3.1 and Unicode 3.2.
11 #
12 # See sections 8.2 and 8.3 of The Unicode Standard, Version 3.0
13 # for more information.
14 #
15 # Each line contains four fields, separated by a semicolon.
16 #
17 # The first field gives the code point, in 4-digit hexadecimal
18 #   form, of an Arabic or Syriac character.
19 # The second field gives a short schematic name for that character,
20 #   abbreviated from the normative Unicode character name.
21 # The third field defines the joining type: R right-joining, 
22 #   D dual-joining, U non-joining
23 # The fourth field defines the joining group.
24 #
25 #
26 # Note: Characters of joining type T and most characters of 
27 # joining type U are not explicitly listed in this file.
28 #
29 # Characters of joining type T can derived by the following formula:
30 #   T = Mn + Cf - ZWNJ - ZWJ
31 # where Mn and Cf are the general category values. In other words,
32 # any non-spacing mark or any format control character, except
33 # U+200C ZERO WIDTH NON-JOINER (joining type U) and U+200D ZERO WIDTH
34 # JOINER (joining type C).
35 #
36 # For an explicit listing of characters of joining type T, see
37 # the derived property file DerivedJoiningType.txt.
38 #
39 # There are currently no characters of type L defined in Unicode.
40 #
41 # Joining type U includes all characters which are neither joining
42 # type T, nor explicitly marked in this file as types R, L, D, or C.
43 #
44 # #############################################################
45  
46 # Unicode; Schematic Name; Joining Type; Joining Group
47
48 # Arabic characters
49
50 0621; HAMZA; U; <no shaping>
51 0622; MADDA ON ALEF; R; ALEF
52 0623; HAMZA ON ALEF; R; ALEF
53 0624; HAMZA ON WAW; R; WAW
54 0625; HAMZA UNDER ALEF; R; ALEF
55 0626; HAMZA ON YEH; D; YEH
56 0627; ALEF; R; ALEF
57 0628; BEH; D; BEH
58 0629; TEH MARBUTA; R; TEH MARBUTA
59 062A; TEH; D; BEH
60 062B; THEH; D; BEH
61 062C; JEEM; D; HAH
62 062D; HAH; D; HAH
63 062E; KHAH; D; HAH
64 062F; DAL; R; DAL
65 0630; THAL; R; DAL
66 0631; REH; R; REH
67 0632; ZAIN; R; REH
68 0633; SEEN; D; SEEN
69 0634; SHEEN; D; SEEN
70 0635; SAD; D; SAD
71 0636; DAD; D; SAD
72 0637; TAH; D; TAH
73 0638; ZAH; D; TAH
74 0639; AIN; D; AIN
75 063A; GHAIN; D; AIN
76 0640; TATWEEL; C; <no shaping>
77 0641; FEH; D; FEH
78 0642; QAF; D; QAF
79 0643; KAF; D; KAF
80 0644; LAM; D; LAM
81 0645; MEEM; D; MEEM
82 0646; NOON; D; NOON
83 0647; HEH; D; HEH
84 0648; WAW; R; WAW
85 0649; ALEF MAKSURA; D; YEH
86 064A; YEH; D; YEH
87 066E; DOTLESS BEH; D; BEH
88 066F; DOTLESS QAF; D; QAF
89 0671; HAMZAT WASL ON ALEF; R; ALEF
90 0672; WAVY HAMZA ON ALEF; R; ALEF
91 0673; WAVY HAMZA UNDER ALEF; R; ALEF
92 0674; HIGH HAMZA; U; <no shaping>
93 0675; HIGH HAMZA ALEF; R; ALEF
94 0676; HIGH HAMZA WAW; R; WAW
95 0677; HIGH HAMZA WAW WITH DAMMA; R; WAW
96 0678; HIGH HAMZA YEH; D; YEH
97 0679; TEH WITH SMALL TAH; D; BEH
98 067A; TEH WITH 2 DOTS VERTICAL ABOVE; D; BEH
99 067B; BEH WITH 2 DOTS VERTICAL BELOW; D; BEH
100 067C; TEH WITH RING; D; BEH
101 067D; TEH WITH 3 DOTS ABOVE DOWNWARD; D; BEH
102 067E; TEH WITH 3 DOTS BELOW; D; BEH
103 067F; TEH WITH 4 DOTS ABOVE; D; BEH
104 0680; BEH WITH 4 DOTS BELOW; D; BEH
105 0681; HAMZA ON HAH; D; HAH
106 0682; HAH WITH 2 DOTS VERTICAL ABOVE; D; HAH
107 0683; HAH WITH MIDDLE 2 DOTS; D; HAH
108 0684; HAH WITH MIDDLE 2 DOTS VERTICAL; D; HAH
109 0685; HAH WITH 3 DOTS ABOVE; D; HAH
110 0686; HAH WITH MIDDLE 3 DOTS DOWNWARD; D; HAH
111 0687; HAH WITH MIDDLE 4 DOTS; D; HAH
112 0688; DAL WITH SMALL TAH; R; DAL
113 0689; DAL WITH RING; R; DAL
114 068A; DAL WITH DOT BELOW; R; DAL
115 068B; DAL WITH DOT BELOW AND SMALL TAH; R; DAL
116 068C; DAL WITH 2 DOTS ABOVE; R; DAL
117 068D; DAL WITH 2 DOTS BELOW; R; DAL
118 068E; DAL WITH 3 DOTS ABOVE; R; DAL
119 068F; DAL WITH 3 DOTS ABOVE DOWNWARD; R; DAL
120 0690; DAL WITH 4 DOTS ABOVE; R; DAL
121 0691; REH WITH SMALL TAH; R; REH
122 0692; REH WITH SMALL V; R; REH
123 0693; REH WITH RING; R; REH
124 0694; REH WITH DOT BELOW; R; REH
125 0695; REH WITH SMALL V BELOW; R; REH
126 0696; REH WITH DOT BELOW AND DOT ABOVE; R; REH
127 0697; REH WITH 2 DOTS ABOVE; R; REH
128 0698; REH WITH 3 DOTS ABOVE; R; REH
129 0699; REH WITH 4 DOTS ABOVE; R; REH
130 069A; SEEN WITH DOT BELOW AND DOT ABOVE; D; SEEN
131 069B; SEEN WITH 3 DOTS BELOW; D; SEEN
132 069C; SEEN WITH 3 DOTS BELOW AND 3 DOTS ABOVE; D; SEEN
133 069D; SAD WITH 2 DOTS BELOW; D; SAD
134 069E; SAD WITH 3 DOTS ABOVE; D; SAD
135 069F; TAH WITH 3 DOTS ABOVE; D; TAH
136 06A0; AIN WITH 3 DOTS ABOVE; D; AIN
137 06A1; DOTLESS FEH; D; FEH
138 06A2; FEH WITH DOT MOVED BELOW; D; FEH
139 06A3; FEH WITH DOT BELOW; D; FEH
140 06A4; FEH WITH 3 DOTS ABOVE; D; FEH
141 06A5; FEH WITH 3 DOTS BELOW; D; FEH
142 06A6; FEH WITH 4 DOTS ABOVE; D; FEH
143 06A7; QAF WITH DOT ABOVE; D; QAF
144 06A8; QAF WITH 3 DOTS ABOVE; D; QAF
145 06A9; OPEN KAF; D; GAF
146 06AA; SWASH KAF; D; SWASH KAF
147 06AB; KAF WITH RING; D; GAF
148 06AC; KAF WITH DOT ABOVE; D; KAF
149 06AD; KAF WITH 3 DOTS ABOVE; D; KAF
150 06AE; KAF WITH 3 DOTS BELOW; D; KAF
151 06AF; GAF; D; GAF
152 06B0; GAF WITH RING; D; GAF
153 06B1; GAF WITH 2 DOTS ABOVE; D; GAF
154 06B2; GAF WITH 2 DOTS BELOW; D; GAF
155 06B3; GAF WITH 2 DOTS VERTICAL BELOW; D; GAF
156 06B4; GAF WITH 3 DOTS ABOVE; D; GAF
157 06B5; LAM WITH SMALL V; D; LAM
158 06B6; LAM WITH DOT ABOVE; D; LAM
159 06B7; LAM WITH 3 DOTS ABOVE; D; LAM
160 06B8; LAM WITH 3 DOTS BELOW; D; LAM
161 06B9; NOON WITH DOT BELOW; D; NOON
162 06BA; DOTLESS NOON; D; NOON
163 06BB; DOTLESS NOON WITH SMALL TAH; D; NOON
164 06BC; NOON WITH RING; D; NOON
165 06BD; NOON WITH 3 DOTS ABOVE; D; NOON
166 06BE; KNOTTED HEH; D; KNOTTED HEH
167 06BF; HAH WITH MIDDLE 3 DOTS DOWNWARD AND DOT ABOVE; D; HAH
168 06C0; HAMZA ON HEH; R; TEH MARBUTA
169 06C1; HEH GOAL; D; HEH GOAL
170 06C2; HAMZA ON HEH GOAL; R; HAMZA ON HEH GOAL
171 06C3; TEH MARBUTA GOAL; R; HAMZA ON HEH GOAL
172 06C4; WAW WITH RING; R; WAW
173 06C5; WAW WITH BAR; R; WAW
174 06C6; WAW WITH SMALL V; R; WAW
175 06C7; WAW WITH DAMMA; R; WAW
176 06C8; WAW WITH ALEF ABOVE; R; WAW
177 06C9; WAW WITH INVERTED SMALL V; R; WAW
178 06CA; WAW WITH 2 DOTS ABOVE; R; WAW
179 06CB; WAW WITH 3 DOTS ABOVE; R; WAW
180 06CC; DOTLESS YEH; D; YEH
181 06CD; YEH WITH TAIL; R; YEH WITH TAIL
182 06CE; YEH WITH SMALL V; D; YEH
183 06CF; WAW WITH DOT ABOVE; R; WAW
184 06D0; YEH WITH 2 DOTS VERTICAL BELOW; D; YEH
185 06D1; YEH WITH 3 DOTS BELOW; D; YEH
186 06D2; YEH BARREE; R; YEH BARREE
187 06D3; HAMZA ON YEH BARREE; R; YEH BARREE
188 06D5; AE; R; TEH MARBUTA
189 06FA; SEEN WITH DOT BELOW AND 3 DOTS ABOVE; D; SEEN
190 06FB; DAD WITH DOT BELOW; D; SAD
191 06FC; GHAIN WITH DOT BELOW; D; AIN
192
193 # Syriac characters
194
195 0710; ALAPH; R; ALAPH
196 0712; BETH; D; BETH
197 0713; GAMAL; D; GAMAL
198 0714; GAMAL GARSHUNI; D; GAMAL
199 0715; DALATH; R; DALATH RISH
200 0716; DOTLESS DALATH RISH; R; DALATH RISH
201 0717; HE; R; HE
202 0718; WAW; R; SYRIAC WAW
203 0719; ZAIN; R; ZAIN
204 071A; HETH; D; HETH
205 071B; TETH; D; TETH
206 071C; TETH GARSHUNI; D; TETH
207 071D; YUDH; D; YUDH
208 071E; YUDH HE; R; YUDH HE
209 071F; KAPH; D; KAPH
210 0720; LAMADH; D; LAMADH
211 0721; MIM; D; MIM
212 0722; NUN; D; NUN
213 0723; SEMKATH; D; SEMKATH
214 0724; FINAL SEMKATH; D; FINAL SEMKATH
215 0725; E; D; E
216 0726; PE; D; PE
217 0727; REVERSED PE; D; REVERSED PE
218 0728; SADHE; R; SADHE
219 0729; QAPH; D; QAPH
220 072A; RISH; R; DALATH RISH
221 072B; SHIN; D; SHIN
222 072C; TAW; R; TAW
223
224 # Other
225
226 200D; ZERO WIDTH JOINER; C; <no shaping>