This is a live mirror of the Perl 5 development currently hosted at https://github.com/perl/perl5
mktables: Generate file for NameAlias property
[perl5.git] / lib / unicore / ArabicShaping.txt
1 # ArabicShaping-6.0.0.txt
2 # Date: 2010-04-30, 13:47:00 PDT [KW]
3 #
4 # This file is a normative contributory data file in the
5 # Unicode Character Database.
6 #
7 # Copyright (c) 1991-2010 Unicode, Inc.
8 # For terms of use, see http://www.unicode.org/terms_of_use.html
9 #
10 # This file defines the shaping classes for Arabic, Syriac, and N'Ko
11 # positional shaping, repeating in machine readable form the
12 # information exemplified in Tables 8-3, 8-7, 8-8, 8-11, 8-12,
13 # 8-13, and 13-5 of The Unicode Standard, Version 6.0.
14 #
15 # See sections 8.2, 8.3, and 13.5 of The Unicode Standard, Version 6.0
16 # for more information.
17 #
18 # Each line contains four fields, separated by a semicolon.
19 #
20 # Field 0: the code point, in 4-digit hexadecimal
21 #   form, of an Arabic, Syriac, or N'Ko character.
22 #
23 # Field 1: gives a short schematic name for that character,
24 #   abbreviated from the normative Unicode character name.
25 #   Note that this schematic name is considered a comment,
26 #   and does not constitute a formal property value.
27 #
28 # Field 2: defines the joining type (property name: Joining_Type)
29 #   R Right_Joining
30 #   L Left_Joining
31 #   D Dual_Joining
32 #   C Join_Causing
33 #   U Non_Joining
34 #   T Transparent
35 #     See Section 8.2, Arabic for more information on these types.
36 #
37 # Field 3: defines the joining group (property name: Joining_Group)
38 #
39 # The values of the joining group are based schematically on character
40 # names. Where a schematic character name consists of two or more parts separated
41 # by spaces, the formal Joining_Group property value, as specified in
42 # PropertyValueAliases.txt, consists of the same name parts joined by
43 # underscores. Hence, the entry:
44 #
45 #   0629; TEH MARBUTA; R; TEH MARBUTA
46 #
47 # corresponds to [Joining_Group = Teh_Marbuta].
48 #
49 # Note: The property value now designated [Joining_Group = Teh_Marbuta_Goal] 
50 #   used to apply to both of the following characters
51 #   in earlier versions of the standard:
52 #
53 #   U+06C2 ARABIC LETTER HEH GOAL WITH HAMZA ABOVE
54 #   U+06C3 ARABIC LETTER TEH MARBUTA GOAL
55 #
56 #   However, it currently applies only to U+06C3, and *not* to U+06C2.
57 #   To avoid destabilizing existing Joining_Group property aliases, the
58 #   prior Joining_Group value for U+06C3 (Hamza_On_Heh_Goal) has been
59 #   retained as a property value alias, despite the fact that it
60 #   no longer applies to its namesake character, U+06C2.
61 #   See PropertyValueAliases.txt.
62 #
63 # When other cursive scripts are added to the Unicode Standard in
64 # the future, the joining group value of all its letters will default
65 # to jg=No_Joining_Group in this data file. Other, more specific
66 # joining group values will be defined only if an explicit proposal
67 # to define those values exactly has been approved by the UTC. This
68 # is the convention exemplified by the N'Ko script. Only the Arabic
69 # and Syriac scripts currently have explicit joining group values defined.
70 #
71 # Note: Code points that are not explicitly listed in this file are
72 # either of joining type T or U:
73 #
74 # - Those that not explicitly listed that are of General Category Mn, Me, or Cf
75 #   have joining type T.
76 # - All others not explicitly listed have joining type U.
77 #
78 # For an explicit listing of characters of joining type T, see
79 # the derived property file DerivedJoiningType.txt.
80 #
81 # There are currently no characters of joining type L defined in Unicode.
82 #
83 # #############################################################
84  
85 # Unicode; Schematic Name; Joining Type; Joining Group
86
87 # Arabic characters
88
89 0600; ARABIC NUMBER SIGN; U; No_Joining_Group
90 0601; ARABIC SIGN SANAH; U; No_Joining_Group
91 0602; ARABIC FOOTNOTE MARKER; U; No_Joining_Group
92 0603; ARABIC SIGN SAFHA; U; No_Joining_Group
93 0608; ARABIC RAY; U; No_Joining_Group
94 060B; AFGHANI SIGN; U; No_Joining_Group
95 0620; YEH WITH RING; D; YEH
96 0621; HAMZA; U; No_Joining_Group
97 0622; MADDA ON ALEF; R; ALEF
98 0623; HAMZA ON ALEF; R; ALEF
99 0624; HAMZA ON WAW; R; WAW
100 0625; HAMZA UNDER ALEF; R; ALEF
101 0626; HAMZA ON YEH; D; YEH
102 0627; ALEF; R; ALEF
103 0628; BEH; D; BEH
104 0629; TEH MARBUTA; R; TEH MARBUTA
105 062A; TEH; D; BEH
106 062B; THEH; D; BEH
107 062C; JEEM; D; HAH
108 062D; HAH; D; HAH
109 062E; KHAH; D; HAH
110 062F; DAL; R; DAL
111 0630; THAL; R; DAL
112 0631; REH; R; REH
113 0632; ZAIN; R; REH
114 0633; SEEN; D; SEEN
115 0634; SHEEN; D; SEEN
116 0635; SAD; D; SAD
117 0636; DAD; D; SAD
118 0637; TAH; D; TAH
119 0638; ZAH; D; TAH
120 0639; AIN; D; AIN
121 063A; GHAIN; D; AIN
122 063B; KEHEH WITH 2 DOTS ABOVE; D; GAF
123 063C; KEHEH WITH 3 DOTS BELOW; D; GAF 
124 063D; FARSI YEH WITH INVERTED V; D; FARSI YEH
125 063E; FARSI YEH WITH 2 DOTS ABOVE; D; FARSI YEH
126 063F; FARSI YEH WITH 3 DOTS ABOVE; D; FARSI YEH
127 0640; TATWEEL; C; No_Joining_Group
128 0641; FEH; D; FEH
129 0642; QAF; D; QAF
130 0643; KAF; D; KAF
131 0644; LAM; D; LAM
132 0645; MEEM; D; MEEM
133 0646; NOON; D; NOON
134 0647; HEH; D; HEH
135 0648; WAW; R; WAW
136 0649; ALEF MAKSURA; D; YEH
137 064A; YEH; D; YEH
138 066E; DOTLESS BEH; D; BEH
139 066F; DOTLESS QAF; D; QAF
140 0671; HAMZAT WASL ON ALEF; R; ALEF
141 0672; WAVY HAMZA ON ALEF; R; ALEF
142 0673; WAVY HAMZA UNDER ALEF; R; ALEF
143 0674; HIGH HAMZA; U; No_Joining_Group
144 0675; HIGH HAMZA ALEF; R; ALEF
145 0676; HIGH HAMZA WAW; R; WAW
146 0677; HIGH HAMZA WAW WITH DAMMA; R; WAW
147 0678; HIGH HAMZA YEH; D; YEH
148 0679; TEH WITH SMALL TAH; D; BEH
149 067A; TEH WITH 2 DOTS VERTICAL ABOVE; D; BEH
150 067B; BEH WITH 2 DOTS VERTICAL BELOW; D; BEH
151 067C; TEH WITH RING; D; BEH
152 067D; TEH WITH 3 DOTS ABOVE DOWNWARD; D; BEH
153 067E; TEH WITH 3 DOTS BELOW; D; BEH
154 067F; TEH WITH 4 DOTS ABOVE; D; BEH
155 0680; BEH WITH 4 DOTS BELOW; D; BEH
156 0681; HAMZA ON HAH; D; HAH
157 0682; HAH WITH 2 DOTS VERTICAL ABOVE; D; HAH
158 0683; HAH WITH MIDDLE 2 DOTS; D; HAH
159 0684; HAH WITH MIDDLE 2 DOTS VERTICAL; D; HAH
160 0685; HAH WITH 3 DOTS ABOVE; D; HAH
161 0686; HAH WITH MIDDLE 3 DOTS DOWNWARD; D; HAH
162 0687; HAH WITH MIDDLE 4 DOTS; D; HAH
163 0688; DAL WITH SMALL TAH; R; DAL
164 0689; DAL WITH RING; R; DAL
165 068A; DAL WITH DOT BELOW; R; DAL
166 068B; DAL WITH DOT BELOW AND SMALL TAH; R; DAL
167 068C; DAL WITH 2 DOTS ABOVE; R; DAL
168 068D; DAL WITH 2 DOTS BELOW; R; DAL
169 068E; DAL WITH 3 DOTS ABOVE; R; DAL
170 068F; DAL WITH 3 DOTS ABOVE DOWNWARD; R; DAL
171 0690; DAL WITH 4 DOTS ABOVE; R; DAL
172 0691; REH WITH SMALL TAH; R; REH
173 0692; REH WITH SMALL V; R; REH
174 0693; REH WITH RING; R; REH
175 0694; REH WITH DOT BELOW; R; REH
176 0695; REH WITH SMALL V BELOW; R; REH
177 0696; REH WITH DOT BELOW AND DOT ABOVE; R; REH
178 0697; REH WITH 2 DOTS ABOVE; R; REH
179 0698; REH WITH 3 DOTS ABOVE; R; REH
180 0699; REH WITH 4 DOTS ABOVE; R; REH
181 069A; SEEN WITH DOT BELOW AND DOT ABOVE; D; SEEN
182 069B; SEEN WITH 3 DOTS BELOW; D; SEEN
183 069C; SEEN WITH 3 DOTS BELOW AND 3 DOTS ABOVE; D; SEEN
184 069D; SAD WITH 2 DOTS BELOW; D; SAD
185 069E; SAD WITH 3 DOTS ABOVE; D; SAD
186 069F; TAH WITH 3 DOTS ABOVE; D; TAH
187 06A0; AIN WITH 3 DOTS ABOVE; D; AIN
188 06A1; DOTLESS FEH; D; FEH
189 06A2; FEH WITH DOT MOVED BELOW; D; FEH
190 06A3; FEH WITH DOT BELOW; D; FEH
191 06A4; FEH WITH 3 DOTS ABOVE; D; FEH
192 06A5; FEH WITH 3 DOTS BELOW; D; FEH
193 06A6; FEH WITH 4 DOTS ABOVE; D; FEH
194 06A7; QAF WITH DOT ABOVE; D; QAF
195 06A8; QAF WITH 3 DOTS ABOVE; D; QAF
196 06A9; KEHEH; D; GAF
197 06AA; SWASH KAF; D; SWASH KAF
198 06AB; KAF WITH RING; D; GAF
199 06AC; KAF WITH DOT ABOVE; D; KAF
200 06AD; KAF WITH 3 DOTS ABOVE; D; KAF
201 06AE; KAF WITH 3 DOTS BELOW; D; KAF
202 06AF; GAF; D; GAF
203 06B0; GAF WITH RING; D; GAF
204 06B1; GAF WITH 2 DOTS ABOVE; D; GAF
205 06B2; GAF WITH 2 DOTS BELOW; D; GAF
206 06B3; GAF WITH 2 DOTS VERTICAL BELOW; D; GAF
207 06B4; GAF WITH 3 DOTS ABOVE; D; GAF
208 06B5; LAM WITH SMALL V; D; LAM
209 06B6; LAM WITH DOT ABOVE; D; LAM
210 06B7; LAM WITH 3 DOTS ABOVE; D; LAM
211 06B8; LAM WITH 3 DOTS BELOW; D; LAM
212 06B9; NOON WITH DOT BELOW; D; NOON
213 06BA; DOTLESS NOON; D; NOON
214 06BB; DOTLESS NOON WITH SMALL TAH; D; NOON
215 06BC; NOON WITH RING; D; NOON
216 06BD; NYA; D; NYA
217 06BE; KNOTTED HEH; D; KNOTTED HEH
218 06BF; HAH WITH MIDDLE 3 DOTS DOWNWARD AND DOT ABOVE; D; HAH
219 06C0; HAMZA ON HEH; R; TEH MARBUTA
220 06C1; HEH GOAL; D; HEH GOAL
221 06C2; HAMZA ON HEH GOAL; D; HEH GOAL
222 06C3; TEH MARBUTA GOAL; R; TEH MARBUTA GOAL
223 06C4; WAW WITH RING; R; WAW
224 06C5; WAW WITH BAR; R; WAW
225 06C6; WAW WITH SMALL V; R; WAW
226 06C7; WAW WITH DAMMA; R; WAW
227 06C8; WAW WITH ALEF ABOVE; R; WAW
228 06C9; WAW WITH INVERTED SMALL V; R; WAW
229 06CA; WAW WITH 2 DOTS ABOVE; R; WAW
230 06CB; WAW WITH 3 DOTS ABOVE; R; WAW
231 06CC; FARSI YEH; D; FARSI YEH
232 06CD; YEH WITH TAIL; R; YEH WITH TAIL
233 06CE; FARSI YEH WITH SMALL V; D; FARSI YEH
234 06CF; WAW WITH DOT ABOVE; R; WAW
235 06D0; YEH WITH 2 DOTS VERTICAL BELOW; D; YEH
236 06D1; YEH WITH 3 DOTS BELOW; D; YEH
237 06D2; YEH BARREE; R; YEH BARREE
238 06D3; HAMZA ON YEH BARREE; R; YEH BARREE
239 06D5; AE; R; TEH MARBUTA
240 06DD; ARABIC END OF AYAH; U; No_Joining_Group
241 06EE; DAL WITH INVERTED V; R; DAL
242 06EF; REH WITH INVERTED V; R; REH
243 06FA; SEEN WITH DOT BELOW AND 3 DOTS ABOVE; D; SEEN
244 06FB; DAD WITH DOT BELOW; D; SAD
245 06FC; GHAIN WITH DOT BELOW; D; AIN
246 06FF; HEH WITH INVERTED V; D; KNOTTED HEH
247
248 # Syriac characters
249
250 0710; ALAPH; R; ALAPH
251 0712; BETH; D; BETH
252 0713; GAMAL; D; GAMAL
253 0714; GAMAL GARSHUNI; D; GAMAL
254 0715; DALATH; R; DALATH RISH
255 0716; DOTLESS DALATH RISH; R; DALATH RISH
256 0717; HE; R; HE
257 0718; WAW; R; SYRIAC WAW
258 0719; ZAIN; R; ZAIN
259 071A; HETH; D; HETH
260 071B; TETH; D; TETH
261 071C; TETH GARSHUNI; D; TETH
262 071D; YUDH; D; YUDH
263 071E; YUDH HE; R; YUDH HE
264 071F; KAPH; D; KAPH
265 0720; LAMADH; D; LAMADH
266 0721; MIM; D; MIM
267 0722; NUN; D; NUN
268 0723; SEMKATH; D; SEMKATH
269 0724; FINAL SEMKATH; D; FINAL SEMKATH
270 0725; E; D; E
271 0726; PE; D; PE
272 0727; REVERSED PE; D; REVERSED PE
273 0728; SADHE; R; SADHE
274 0729; QAPH; D; QAPH
275 072A; RISH; R; DALATH RISH
276 072B; SHIN; D; SHIN
277 072C; TAW; R; TAW
278 072D; PERSIAN BHETH; D; BETH
279 072E; PERSIAN GHAMAL; D; GAMAL
280 072F; PERSIAN DHALATH; R; DALATH RISH
281 074D; SOGDIAN ZHAIN; R; ZHAIN
282 074E; SOGDIAN KHAPH; D; KHAPH
283 074F; SOGDIAN FE; D; FE
284
285 # Arabic supplement characters
286
287 0750; BEH WITH 3 DOTS HORIZONTALLY BELOW; D; BEH
288 0751; BEH WITH DOT BELOW AND 3 DOTS ABOVE; D; BEH
289 0752; BEH WITH 3 DOTS POINTING UPWARDS BELOW; D; BEH
290 0753; BEH WITH 3 DOTS POINTING UPWARDS BELOW AND 2 DOTS ABOVE; D; BEH
291 0754; BEH WITH 2 DOTS BELOW AND DOT ABOVE; D; BEH
292 0755; BEH WITH INVERTED SMALL V BELOW; D; BEH
293 0756; BEH WITH SMALL V; D; BEH
294 0757; HAH WITH 2 DOTS ABOVE; D; HAH
295 0758; HAH WITH 3 DOTS POINTING UPWARDS BELOW; D; HAH
296 0759; DAL WITH 2 DOTS VERTICALLY BELOW AND SMALL TAH; R; DAL
297 075A; DAL WITH INVERTED SMALL V BELOW; R; DAL
298 075B; REH WITH STROKE; R; REH
299 075C; SEEN WITH 4 DOTS ABOVE; D; SEEN
300 075D; AIN WITH 2 DOTS ABOVE; D; AIN
301 075E; AIN WITH 3 DOTS POINTING DOWNWARDS ABOVE; D; AIN
302 075F; AIN WITH 2 DOTS VERTICALLY ABOVE; D; AIN
303 0760; FEH WITH 2 DOTS BELOW; D; FEH
304 0761; FEH WITH 3 DOTS POINTING UPWARDS BELOW; D; FEH
305 0762; KEHEH WITH DOT ABOVE; D; GAF
306 0763; KEHEH WITH 3 DOTS ABOVE; D; GAF
307 0764; KEHEH WITH 3 DOTS POINTING UPWARDS BELOW; D; GAF
308 0765; MEEM WITH DOT ABOVE; D; MEEM
309 0766; MEEM WITH DOT BELOW; D; MEEM
310 0767; NOON WITH 2 DOTS BELOW; D; NOON
311 0768; NOON WITH SMALL TAH; D; NOON
312 0769; NOON WITH SMALL V; D; NOON
313 076A; LAM WITH BAR; D; LAM
314 076B; REH WITH 2 DOTS VERTICALLY ABOVE; R; REH
315 076C; REH WITH HAMZA ABOVE; R; REH
316 076D; SEEN WITH 2 DOTS VERTICALLY ABOVE; D; SEEN
317 076E; HAH WITH SMALL TAH BELOW; D; HAH
318 076F; HAH WITH SMALL TAH AND 2 DOTS; D; HAH
319 0770; SEEN WITH SMALL TAH AND 2 DOTS; D; SEEN
320 0771; REH WITH SMALL TAH AND 2 DOTS; R; REH
321 0772; HAH WITH SMALL TAH ABOVE; D; HAH
322 0773; ALEF WITH DIGIT TWO ABOVE; R; ALEF
323 0774; ALEF WITH DIGIT THREE ABOVE; R; ALEF
324 0775; FARSI YEH WITH DIGIT TWO ABOVE; D; FARSI YEH
325 0776; FARSI YEH WITH DIGIT THREE ABOVE; D; FARSI YEH
326 0777; YEH WITH DIGIT FOUR BELOW; D; YEH
327 0778; WAW WITH DIGIT TWO ABOVE; R; WAW
328 0779; WAW WITH DIGIT THREE ABOVE; R; WAW
329 077A; YEH BARREE WITH DIGIT TWO ABOVE; D; BURUSHASKI YEH BARREE
330 077B; YEH BARREE WITH DIGIT THREE ABOVE; D; BURUSHASKI YEH BARREE
331 077C; HAH WITH DIGIT FOUR BELOW; D; HAH
332 077D; SEEN WITH DIGIT FOUR ABOVE; D; SEEN
333 077E; SEEN WITH INVERTED V; D; SEEN
334 077F; KAF WITH 2 DOTS ABOVE; D; KAF
335
336 # N'Ko Characters
337
338 07CA; NKO A; D; No_Joining_Group
339 07CB; NKO EE; D; No_Joining_Group
340 07CC; NKO I; D; No_Joining_Group
341 07CD; NKO E; D; No_Joining_Group
342 07CE; NKO U; D; No_Joining_Group
343 07CF; NKO OO; D; No_Joining_Group
344 07D0; NKO O; D; No_Joining_Group
345 07D1; NKO DAGBASINNA; D; No_Joining_Group
346 07D2; NKO N; D; No_Joining_Group
347 07D3; NKO BA; D; No_Joining_Group
348 07D4; NKO PA; D; No_Joining_Group
349 07D5; NKO TA; D; No_Joining_Group
350 07D6; NKO JA; D; No_Joining_Group
351 07D7; NKO CHA; D; No_Joining_Group
352 07D8; NKO DA; D; No_Joining_Group
353 07D9; NKO RA; D; No_Joining_Group
354 07DA; NKO RRA; D; No_Joining_Group
355 07DB; NKO SA; D; No_Joining_Group
356 07DC; NKO GBA; D; No_Joining_Group
357 07DD; NKO FA; D; No_Joining_Group
358 07DE; NKO KA; D; No_Joining_Group
359 07DF; NKO LA; D; No_Joining_Group
360 07E0; NKO NA WOLOSO; D; No_Joining_Group
361 07E1; NKO MA; D; No_Joining_Group
362 07E2; NKO NYA; D; No_Joining_Group
363 07E3; NKO NA; D; No_Joining_Group
364 07E4; NKO HA; D; No_Joining_Group
365 07E5; NKO WA; D; No_Joining_Group
366 07E6; NKO YA; D; No_Joining_Group
367 07E7; NKO NYA WOLOSO; D; No_Joining_Group
368 07E8; NKO JONA JA; D; No_Joining_Group
369 07E9; NKO JONA CHA; D; No_Joining_Group
370 07EA; NKO JONA RA; D; No_Joining_Group
371 07FA; NKO LAJANYALAN; C; No_Joining_Group
372
373 # Other
374
375 200C; ZERO WIDTH NON-JOINER; U; No_Joining_Group
376 200D; ZERO WIDTH JOINER; C; No_Joining_Group
377
378 # EOF