Как пишется арабский текст

  • Арабская письменность
  • Буквы
  • Звуки
  • Знаки
  • Задания
  • Дополнительно

⊗ В этом уроке вы узнаете об арабской письменности, о количестве букв в арабском алфавите, о том как выглядят буквы и на какие категории они подразделяются. Также вы узнаете о том, что такое транскрипция и какие виды транскрипций бывают. Вы узнаете какие виды звуков есть в арабской речи, а также сколько и какие начертания бывают у букв. Вы ознакомитесь о специальными знаками в арабской письменности.

§1. Об арабском алфавите. Арабы пишут и читают справа налево. В араб­ском ал­фа­ви­те все­го 28 букв. На письме отображаются согласные и три долгих гласных. Короткие гласные зву­ки, а их три, пе­ре­да­ют­ся пу­тем спе­ци­аль­ных знач­ков, так на­зы­ва­е­мыми «ог­ла­сов­ка­ми», ко­то­рые ста­вят­ся над или под бук­вой,  (см. урок 2. Ог­ла­сов­ки).

Посмотрите как вы выглядит и звучит арабский алфавит.

ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي

Каждая буква алфавита имеет несколько начертаний, в зависимости от их местоположения в слове. В письме не бывает заглавных букв и в нем существует несколько видов почерков. Одним из распространенных почерков является ʾан-насх̮. Внизу показан пример написания выражения «Во имя Аллаха Милостивого Милосердного» этим почерком.

§2. Как читать тексты без огласовок. В араб­ских из­да­ни­ях и в СМИ тек­с­ты не сопровождаются огласовками, за исключением учебной и религиозной литературы. Ара­бы пре­крас­но чи­та­ют и по­ни­ма­ют тек­с­ты без ог­ла­со­вок. Срав­ни­мо это с тем, ког­да мы читаем текст на рус­ском язы­ке где есть буква Ё без то­чек. Поэтому устанавливать и воспроизводить гласные в процессе чтения нужно самому читателю. Уверенное владение лексико-грамматическим материалом языка позволяет справится с этой задачей.


Далее переходите на вкладку БУКВЫ.

§1. Арабские буквы. Транскрипция. В арабском языке между системой изображения слов на письме и их звучанием есть разница, поэтому для практичности принято использовать транскрипцию. Транскрипция — это условные знаки или буквы латиницы либо кириллицы, путем которых на письме передаются те или иные звуки, при необходимости они снабжаются специальными значками.

Транскрипция делится на два вида, фонетическая и фонематическая. Фонетическая транскрипция показывает передачу реального произношения, произношение фонем с их оттенками и видами. Фонематическая транскрипция  показывает упрощенную передачу лишь фонем того или иного слова, без учета вариантов фонем и их оттенков. При чтении фонематической транскрипции ученику самому придется произносить звуки правильно, основываясь на произношение звуков, услышанных им через аудио прослушивание.

В этом курсе мы будем использовать фонематическую транскрипцию,  в качестве вспомогательного механизма для быстрого перехода к чтению текстов.

Ниже приведена таблица арабского алфавита, с указанием названий букв и их аудио звучаний.

— Порядковый номер; A — В конце слова; B — В середине слова; C — В начале слова; D — В обособленном виде; E — Название буквы; F — Транскрипция; G — Аудио звучание.

А B C D E F G
1 ـا ا أَلِف‎

’алиф

2 ـب ـبـ بـ ب بَاء‎

ба̄’

б
3 ـت ـتـ تـ ت تَاء‎

та̄’

т
4 ـث ـثـ ثـ ث ثَاء‎

с̱а̄’

с̱
5 ـج ـجـ جـ ج جِيم‎

джӣм

дж
6 ـح ـحـ حـ ح حَاء‎

х̣а̄’

х̣
7 ـخ ـخـ خـ خ خَاء‎

х̮а̄’

х̮
8 ـد د دَال‎

да̄ль

д
9 ـذ ذ ذَال‎

з̱а̄ль

з̱
10 ـر ر رَاء‎

ра̄’

р
11 ـز ز زَاى

за̄й

з
12 ـس ـسـ سـ س سِين‎

сӣн

с
13 ـش ـشـ شـ ش شِين‎

шӣн

ш
14 ـص ـصـ صـ ص صَاد‎

с̣а̄д

с̣
15 ـض ـضـ ضـ ض ضَاد‎

д̣а̄д

д̣
16 ـط ـطـ طـ ط طَاء‎

т̣а̄’

т̣
17 ـظ ـظـ ظـ ظ ظَاء‎

з̣а̄’

з̣
18 ـع ـعـ عـ ع عَيْن‎

‘айн

19 ـغ ـغـ غـ غ غَيْن‎

гайн

г

20 ـف ـفـ فـ ف فَاء‎

фа̄’

ф
21 ـق ـقـ قـ ق قَاف‎

к̣а̄ф

к̣
22 ـك ـكـ كـ ك كَاف‎

ка̄ф

к
23 ـل ـلـ لـ ل لاَم‎

ля̄м

ль
24 ـم ـمـ مـ م مِيم‎

мӣм

м
25 ـن ـنـ نـ ن نُون‎

нӯн

н
26 ـه ـهـ هـ ه هَاء‎

ха̄’

х
27 ـو و وَاو‎

ва̄в

в
28 ـي ـيـ يـ ي يَاء‎

йа̄’

й

§2. Группы и категории букв и их начертания. Арабский алфавит, с точки зрения правописания, делится на две основные группы.

Первая группа — буквы, которые схожи между собой по форме и правописанию, но имеют отличия в дополнительных значках (точках)

ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ

Вторая группа — буквы, которые не имеют себе подобных

Большинство букв алфавита в зависимости от местоположения в слове имеют разные варианты написания, то есть имеют особые начертания в обособленном порядке, в начале, в середине и в конце слов, как показано в таблице. Исходя из этого, буквы можно разделить на две категории:

  1. Буквы, которые имеют все четыре начертания. Их двадцать две (см. таблицу алфавита). Буквы этой категории могут соединяться с обеих сторон с другими буквами при письме.
  2. Буквы, которые имеют только два вида начертаний (в таблице показаны на розовом фоне) :1- обособленное — начальное;  2- серединное — конечное. Их шесть. Буквы этой категории могут соединятся только спереди идущими буквами из первой категории, но после себя не дают возможности к без отрывному соединению.

Арабские буквы соединяются между собой соединительной линией ( _ ).  Например:

фанискусство ف + ـ + ن = فَــــن

Слова оканчиваются на конечное начертание буквы. При этом есть буквы, которые полностью находятся над строчкой и есть буквы, половина которых может опускаться ниже строки.

С 4 -го по 12 -ый уроки этого курса мы разберем эти буквы отдельно.

Далее переходите на вкладку ЗВУКИ.

§1. Звуки. В арабском алфавите все 28 букв являются согласными. Однако говорить на арабском, как и на любом языке, не представляется возможным без гласных звуков. Роль гласных звуков выполняют специальные символы, которые называются огласовками, выступающие в качестве кратких гласных. Более подробнее об огласовках во 2-ом уроке курса.

Посмотрите примеры:

Арабский язык отличается сложной фонетической формой. В нем могут встречаться звуки, которые редки в других языках.

Например:

х̣а̄сӯб
компьютер
حَــاسُوبٌ ح
‘алам
флаг
عَــلَمٌ ع

Широко используются и горловые звуки.

Например:

’усра
семья
أُسْرَةٌ أ
ха̄тиф
телефон
هَــاتِفٌ ه

В примере выше показан знак хамза на букве  ’алиф أ , он похож на лежачую цифру четыре ء . Этот знак выражает звук который  производится коротким сокращением диафрагмы при произношении звука [а]. Данный звук можно услышать в слове «соавтор». Подробнее об этом звуке мы разберем в 17 уроке этого курса.

В арабской речи также встречаются эмфатические звуки, или как их еще называют «сложные». Эти звуки не встречаются ни в каких языках мира.

Произносятся эмфатические звуки гораздо напряженнее и интенсивнее, чем их соответствующие согласные звуки как сӣн س , да̄ль د , та̄’ ت , з̱а̄ль  ذ . Посмотрите примеры:

с̣а̄д ص
д̣а̄д ض
т̣а̄’ ط
з̣а̄’ ظ

Есть также в речи и межзубные звуки:

с̱ауб
одежда
ثَــوْبٌ ث
з̱уба̄ба
муха
ذُبَابَةٌ ذ

Внимание! алиф ا не несет в себе самостоятельного звучания, он служит для обозначения долготы гласного звука а̄, а также служит подставкой для танвӣн (см. 14 урок курса) и знака хамза ء (см. 17 урок курса) .

Далее переходите на вкладку ЗНАКИ

§1. Знаки, не вошедшие в алфавит. Помимо 28 букв алфавита в арабском языке используются еще три специальных знака, которые по сути являются подобием букв. Некоторые из них несут смысловую нагрузку, а некоторые только выражают особый звук.

Каждый знак мы разберем в этом курсе по отдельности.

— Порядковый номер; A — В конце слова; B — В середине слова; C — В начале слова; D — В обособленном виде; E — Название знака; F — Транскрипция.

А B C D E F
1 ء هَمْزَة
хамза
ـأ أ
ـإ إ
ـؤ ؤ
ـئ ـئـ ئـ ئ
2 ـة ة تَاء مَرْبُوطَة
та̄’ марбӯт̣а
3 ـى ى أَلِفُ مَقصورة
’алиф мак̣с̣ӯра
а̄

Итак,  этом уроке Вы узнали об арабской письменности, о количестве букв в арабском алфавите, о том как выглядят буквы и на какие категории они подразделяются. Также Вы узнали о том, что такое транскрипция и какие виды транскрипций бывают. Вы узнали какие виды звуков есть в арабской речи, а также сколько и какие начертания бывают у букв. Также вы узнали что помимо букв в арабском языке используются букваподобные знаки.

Для закрепления пройденного материала переходите на вкладку ЗАДАНИЯ и выполните все упражнения.

≈1. Внимательно прослушайте каждую букву. Заучите алфавит.

ث ت ب ا
د خ ح ج
س ز ر ذ
ط ض ص ش
ف غ ع ظ
م ل ك ق
ي و ه ن

ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي

Во вкладке ДОПОЛНИТЕЛЬНО распечатайте алфавит для наглядности.

≈2. Переместите букву на ее идентичный сектор.

≈3. Переместите букву к ее правильному названию.

≈4. Переместите букву на ее правильное аудио звучание.

≈5. Выстройте буквы в алфавитном порядке.

≈6. Пройдите ТЕСТ.


Внимание! Если Вы полностью освоили этот урок и выполнили все задания и тесты нажмите кнопку ОТМЕТИТЬ КАК ЗАВЕРШЕННЫЙ и переходите к изучению следующего урока.

Если у Вас возникли вопросы пишите в комментариях.

К какой языковой семье относится арабский язык?

Между учеными существует единое мнение относительно того, что арабский язык относится к группе языков семитского происхождения, однако они имеют разногласия в том, как это выглядит на самом деле. Группу эту они называют «хамито-семитской группой».

Такие народности как арамейские, финикйские, еврейские, арабские, йеменские, вавилоно-ассирийские имеют общее название как «семитские народности».

Семитские языки в основе своей делятся на «западные» и «восточные». «Восточные» в свою очередь делятся на «северные» и «южные».

Что касается «северной» группы семитских языков, то к ней относятся «канаанейские» и «арамейские» языки. Одной из самых известных диалектов канаанейского языка является еврейский язык.

Что касается «южной» группы, то к ней относятся два больших арабских языка, (южный арабский язык) и (северный арабский язык).

Южный арабский язык называют как «йеменский древний» либо «кахтанейский».

Что касается арабского языка, которое имеет самое широкое распространение сегодня, то он имеет прямое отношение к одному из говоров «северной арабской языковой среды».


Скачайте материалы урока ⇓

Текст

К началу курса: Арабский Алфавит

From Wikipedia, the free encyclopedia

For the Arabic script as it is used specifically to write Arabic, see Arabic alphabet.

Arabic script
Arabic-script.png
Script type

Abjad primarily

Alphabet in some adaptations

Time period

400–present
Direction right-to-left script Edit this on Wikidata
Official script

18 sovereign states

  •  Afghanistan
  •  Algeria
  •  Bahrain
  •  Egypt
  •  Iran
  •  Iraq
  •  Jordan
  •  Kuwait
  •  Lebanon
  •  Mauritania
  •  Morocco
  •  Libya
  •  Oman
  •  Qatar
  •  Saudi Arabia
  •  Syria
  •  Tunisia
  •  United Arab Emirates
  •  Yemen

Co-official script in:

10 sovereign states

  •  Brunei
  •  Comoros
  •  Chad
  •  Djibouti
  •  Eritrea
  •  Palestine
  •  Pakistan
  •  Somalia
    •  Somaliland
  •  Sudan
  •  United Nations
Languages See below
Related scripts

Parent systems

Egyptian hieroglyphs

  • Phoenician
    • Aramaic
      • Nabataean
        • Arabic script

Child systems

N’Ko
Hanifi script
ISO 15924
ISO 15924 Arab (160), ​Arabic
Unicode

Unicode alias

Arabic

Unicode range

  • U+0600–U+06FF Arabic
  • U+0750–U+077F Arabic Supplement
  • U+08A0–U+08FF Arabic Extended-A
  • U+0870–U+089F Arabic Extended-B
  • U+10EC0–U+10EFF Arabic Extended-C
  • U+FB50–U+FDFF Arabic Pres. Forms-A
  • U+FE70–U+FEFF Arabic Pres. Forms-B
  • U+1EE00–U+1EEFF Arabic Mathematical…
  • U+1EC70–U+1ECBF Indic Siyaq Numbers
  • U+1ED00–U+1ED4F Ottoman Siyaq Numbers
  • U+10E60–U+10E7F Rumi Numeral Symbols
 This article contains phonetic transcriptions in the International Phonetic Alphabet (IPA). For an introductory guide on IPA symbols, see Help:IPA. For the distinction between [ ], / / and ⟨ ⟩, see IPA § Brackets and transcription delimiters.

The Arabic script is the writing system used for Arabic and several other languages of Asia and Africa. It is the second-most widely used writing system in the world by number of countries using it or a script directly derived from it, and the third-most by number of users (after the Latin and Chinese scripts).[1]

The script was first used to write texts in Arabic, most notably the Quran, the holy book of Islam. With the religion’s spread, it came to be used as the primary script for many language families, leading to the addition of new letters and other symbols. Such languages still using it are: Persian (Farsi/Dari), Malay (Jawi), Uyghur, Kurdish, Punjabi (Shahmukhi), Sindhi, Balti, Balochi, Pashto, Lurish, Urdu, Kashmiri, Rohingya, Somali and Mandinka, Mooré among others.[2] Until the 16th century, it was also used for some Spanish texts, and—prior to the language reform in 1928—it was the writing system of Turkish.[3]

The script is written from right to left in a cursive style, in which most of the letters are written in slightly different forms according to whether they stand alone or are joined to a following or preceding letter. However, the basic letter form remains unchanged. The script does not have capital letters.[4] In most cases, the letters transcribe consonants, or consonants and a few vowels, so most Arabic alphabets are abjads, with the versions used for some languages, such as Sorani, Uyghur, Mandarin, and Serbo-Croatian, being alphabets. It is also the basis for the tradition of Arabic calligraphy.

Worldwide use of the Arabic and Perso-Arabic script

Arabic alphabet world distribution

Countries where the Arabic script is:
 →  the sole official script
 →  official alongside other scripts
 →  official at a provincial level (China, India, Tanzania) or a recognized second script of the official language (Malaysia, Tajikistan)

History[edit]

The Arabic alphabet is derived either from the Nabataean alphabet[5][6] or (less widely believed) directly from the Syriac alphabet,[7] which are both derived from the Aramaic alphabet (which also gave rise to the Hebrew alphabet), which, in turn, descended from the Phoenician alphabet. In addition to the Aramaic script (and, therefore, the Arabic and Hebrew scripts), the Phoenician script also gave rise to the Greek alphabet (and, therefore, both the Cyrillic alphabet and the Latin alphabet used to write this article).

Origins[edit]

In the 6th and 5th centuries BCE, northern Arab tribes emigrated and founded a kingdom centred around Petra, Jordan. These people (now named Nabataeans from the name of one of the tribes, Nabatu) spoke Nabataean Arabic, a dialect of the Arabic language. In the 2nd or 1st centuries BCE,[8][9] the first known records of the Nabataean alphabet were written in the Aramaic language (which was the language of communication and trade), but included some Arabic language features: the Nabataeans did not write the language which they spoke. They wrote in a form of the Aramaic alphabet, which continued to evolve; it separated into two forms: one intended for inscriptions (known as «monumental Nabataean») and the other, more cursive and hurriedly written and with joined letters, for writing on papyrus.[10] This cursive form influenced the monumental form more and more and gradually changed into the Arabic alphabet.

Overview[edit]

the Arabic alphabet

خ ح ج ث ت ب ا
khā’ ḥā’ jīm tha’ tā’ bā’ alif
ص ش س ز ر ذ د
ṣād shīn sīn zāy /
zayn
rā’ dhāl dāl
ق ف غ ع ظ ط ض
qāf fā’ ghayn ‘ayn ẓā’ ṭā’ ḍād
ي و ه ن م ل ك
yā’ wāw hā’ nūn mīm lām kāf
(see below for other alphabets)

The Arabic script has been adapted for use in a wide variety of languages besides Arabic, including Persian, Malay and Urdu, which are not Semitic. Such adaptations may feature altered or new characters to represent phonemes that do not appear in Arabic phonology. For example, the Arabic language lacks a voiceless bilabial plosive (the [p] sound), therefore many languages add their own letter to represent [p] in the script, though the specific letter used varies from language to language. These modifications tend to fall into groups: Indian and Turkic languages written in the Arabic script tend to use the Persian modified letters, whereas the languages of Indonesia tend to imitate those of Jawi. The modified version of the Arabic script originally devised for use with Persian is known as the Perso-Arabic script by scholars.[citation needed]

When the Arabic script is used to write Serbo-Croatian, Sorani, Kashmiri, Mandarin Chinese, or Uyghur, vowels are mandatory. The Arabic script can, therefore, be used as a true alphabet as well as an abjad, although it is often strongly, if erroneously, connected to the latter due to it being originally used only for Arabic.[citation needed]

Use of the Arabic script in West African languages, especially in the Sahel, developed with the spread of Islam. To a certain degree the style and usage tends to follow those of the Maghreb (for instance the position of the dots in the letters fāʼ and qāf).[11][12] Additional diacritics have come into use to facilitate the writing of sounds not represented in the Arabic language. The term ʻAjamī, which comes from the Arabic root for «foreign,» has been applied to Arabic-based orthographies of African languages.[citation needed]

Wikipedia in Arabic script of five languages

Table of writing styles[edit]

Script or style Alphabet(s) Language(s) Region Derived from Comment
Naskh Arabic
& others
Arabic
& others
Every region where Arabic scripts are used Sometimes refers to a very specific calligraphic style, but sometimes used to refer more broadly to almost every font that is not Kufic or Nastaliq.
Nastaliq Urdu,
Persian,
& others
Urdu,
Persian,
& others
Southern and Western Asia Taliq Used for almost all modern Urdu text, but only occasionally used for Persian. (The term «Nastaliq» is sometimes used by Urdu speakers to refer to all Perso-Arabic scripts.)
Taliq Persian Persian A predecessor of Nastaliq.
Kufic Arabic Arabic Middle East and parts of North Africa
Rasm Restricted Arabic alphabet Arabic Mainly historical Omits all diacritics including i’jam. Digital replication usually requires some special characters. See: ٮ ڡ ٯ‎ (links to Wiktionary).

Table of alphabets[edit]

Alphabet Letters Additional
Characters
Script or Style Languages Region Derived from:
(or related to)
Note
Arabic 28 ^(see above) Naskh, Kufi, Rasm, & others Arabic North Africa, West Asia Aramaic,
Syriac,
Nabataean
Ajami script 33 ٻ تٜ تٰٜ Naskh Hausa, Yoruba, Swahili West Africa Arabic Abjad
Aljamiado 28 Naskh Old Spanish, Mozarabic, Ladino, Aragonese, Old Galician-Portuguese Southwest Europe Arabic 8th-13th centuries for Mozarabic, 14th-16th centuries for the other languages
Arebica 30 ڄ ە اٖى ي ڵ ںٛ ۉ ۆ Naskh Serbo-Croatian Southeastern Europe Perso-Arabic Latest stage has full vowel marking
Arwi alphabet 41 ڊ ڍ ڔ صٜ ۻ ࢳ ڣ ࢴ ڹ ݧ Naskh Tamil Southern India, Sri Lanka Perso-Arabic
Belarusian Arabic alphabet 32 ࢮ ࢯ Naskh Belarusian Eastern Europe Perso-Arabic 15th / 16th century
Balochi Standard Alphabet(s) 29 ٹ ڈ ۏ ݔ ے Naskh and Nastaliq Balochi South-West Asia Perso-Arabic, also borrows multiple glyphs from Urdu This standardization is based on the previous orthography. For more information, see Balochi writing.
Berber Arabic alphabet(s) 33 چ ژ ڞ ݣ ء Various Berber languages North Africa Arabic
Burushaski 53 ݳ ݴ ݼ څ ڎ ݽ ڞ ݣ ݸ ݹ ݶ ݷ ݺ ݻ
(see note)
Nastaliq Burushaski South-West Asia (Pakistan) Urdu Also uses the additional letters shown for Urdu.(see below) Sometimes written with just the Urdu alphabet, or with the Latin alphabet.
Chagatai alphabet 32 ݣ Nastaliq and Naskh Chagatai Central Asia Perso-Arabic ݣ is interchangeable with نگ and ڭ.
Galal 32 Naskh Somali Horn of Africa Arabic
Jawi 36 ڠ ڤ ݢ ڽ ۏ ى Naskh Malay Peninsular Malaysia, Sumatra and part of Borneo Perso-Arabic Since 1303 AD (Trengganu Stone)
Kashmiri 44 ۆ ۄ ؠ ێ Nastaliq Kashmiri South Asia Urdu This orthography is fully voweled. 3 out of the 4 (ۆ, ۄ, ێ) additional glyphs are actually vowels. Not all vowels are listed here since they are not separate letters. For further information, see Kashmiri writing.
Kazakh Arabic alphabet 35 ٵ ٶ ﯗ ٷ ﯞ ۆ ە ھ ﻯ ٸ ي Naskh Kazakh Central Asia, China Chagatai In use since 11th century, reformed in the early 20th century, now official only in China
Khowar 45 ݯ ݮ څ ځ ݱ ݰ ڵ Nastaliq Khowar South Asia Urdu, however, borrows multiple glyphs from Pashto
Kyrgyz Arabic alphabet 33 ۅ ﯗ ۉ ﯞ ە ﻯ ي Naskh Kyrgyz Central Asia Chagatai In use since 11th century, reformed in the early 20th century, now official only in China
Pashto 45 ټ څ ځ ډ ړ ږ ښ ګ ڼ ۀ ي ې ۍ ئ Naskh and occasionally, Nastaliq Pashto South-West Asia, Afghanistan and Pakistan Perso-Arabic ګ is interchangeable with گ. Also, the glyphs ی and ې are often replaced with ے in Pakistan.
Pegon script 35 ڎ ڟ ڠ ڤ ڮ ۑ Naskh Javanese, Sundanese South-East Asia (Indonesia) Perso-Arabic
Persian 32 پ چ ژ گ Naskh and Nastaliq Persian (Farsi) West Asia (Iran etc. ) Arabic Also known as
Perso-Arabic.
Saraiki 45 ٻ ڄ ݙ ڳ Nastaliq Saraiki South-West Asia (Pakistan) Shahmukhi
Shahmukhi 41+
(see note)
ࣇ ݨ Nastaliq Punjabi South-West Asia (Pakistan) Urdu Similar to Urdu; 58[citation needed] letters including digraphs for aspirated consonants.
Sindhi 64 ڪ ڳ ڱ گ ک
پ ڀ ٻ ٽ ٿ ٺ
ڻ ڦ ڇ چ ڄ ڃ
ھ ڙ ڌ ڏ ڎ ڍ ڊ
Naskh Sindhi South-West Asia (Pakistan) Perso-Arabic
Sorabe 28 Naskh Malagasy Madagascar Arabic
Soranî 33 ڕ ڤ ڵ ۆ ێ Naskh, and occasionally, Nastaliq Central Kurdish Middle-East Perso-Arabic Vowels are mandatory, i.e. alphabet
Swahili Arabic script 28 Naskh Swahili Western and Southern Africa Arabic
İske imlâ 35 Naskh Tatar Volga region Chagatai Used prior to 1920.
Ottoman Turkish 32 Ottoman Turkish Ottoman Empire Chagatai Official until 1928
Urdu 39+
(see notes)
ٹ ڈ ڑ ں ہ ھ ے
(see notes)
Nastaliq Urdu South Asia Perso-Arabic 58[citation needed] letters including digraphs representing aspirated consonants.
بھ پھ تھ ٹھ جھ چھ دھ ڈھ کھ گھ
Uyghur 32 ئا ئە ھ ئو ئۇ ئۆ ئۈ ۋ ئې ئى Naskh Uyghur China, Central Asia Chagatai Reform of older Arabic-script Uyghur orthography that was used prior the 1950s. Vowels are mandatory, i.e. alphabet
Wolofal 33 ݖ گ ݧ ݝ ݒ Naskh Wolof West Africa Arabic, however, borrows at least one glyph from Perso-Arabic
Xiao’erjing 36 ٿ س﮲ ڞ ي Naskh Sinitic languages China, Central Asia Chagatai Used to write Chinese languages by Muslims living in China such as the Hui people.
Yaña imlâ 29 ئا ئە ئی ئو ئۇ ئ ھ Naskh Tatar Volga region İske imlâ alphabet 1920–1927 replaced with Cyrillic

Current use[edit]

Today Iran, Afghanistan, Pakistan, India, and China are the main non-Arabic speaking states using the Arabic alphabet to write one or more official national languages, including Azerbaijani, Baluchi, Brahui, Persian, Pashto, Central Kurdish, Urdu, Sindhi, Kashmiri, Punjabi and Uyghur.[citation needed]

An Arabic alphabet is currently used for the following languages:[citation needed]

Middle East and Central Asia[edit]

  • Arabic
  • Garshuni (or Karshuni) originated in the 7th century, when Arabic became the dominant spoken language in the Fertile Crescent, but Arabic script was not yet fully developed or widely read, and so the Syriac alphabet was used. There is evidence that writing Arabic in this other set of letters (known as Garshuni) influenced the style of modern Arabic script. After this initial period, Garshuni writing has continued to the present day among some Syriac Christian communities in the Arabic-speaking regions of the Levant and Mesopotamia.
  • Kazakh in Kazakhstan, China, Iran and Afghanistan
  • Kurdish in Northern Iraq and Northwest Iran. (In Turkey and Syria the Latin script is used for Kurdish)
  • Kyrgyz by its 150,000 speakers in the Xinjiang Uyghur Autonomous Region in northwestern China, Pakistan, Kyrgyzstan and Afghanistan
  • Turkmen in Turkmenistan,[verification needed] Afghanistan and Iran
  • Uzbek in Uzbekistan[verification needed] and Afghanistan
  • Persian in Iranian Persian and Dari in Afghanistan. It had former use in Tajikistan but is no longer used in Standard Tajik
  • Baluchi in Iran, in Pakistan’s Balochistan region, Afghanistan and Oman[13]
  • Southwestern Iranian languages as Lori dialects and Bakhtiari language[14][15]
  • Pashto in Afghanistan and Pakistan, and Tajikistan
  • Uyghur changed to Latin script in 1969 and back to a simplified, fully voweled Arabic script in 1983
  • Judeo-Arabic languages
    • Judeo-Tunisian Arabic[16]
  • Azerbaijani language in Iran
  • Talysh language in Iran
  • Mazanderani language in Iran
  • Shughni language in Afghanistan

East Asia[edit]

  • The Chinese language is written by some Hui in the Arabic-derived Xiao’erjing alphabet (see also Sini (script))
  • The Turkic Salar language is written by some Salar in the Arabic alphabet
  • Uyghur alphabet

South Asia[edit]

  • Balochi in Pakistan and Iran
  • Dari in Afghanistan
  • Kashmiri in India and Pakistan (also written in Sharada and Devanagari although Kashmiri is more commonly written in Perso-Arabic Script)
  • Pashto in Afghanistan and Pakistan
  • Khowar in Northern Pakistan, also uses the Latin script
  • Punjabi (Shahmukhi) in Pakistan, also written in the Brahmic script known as Gurmukhi in India
  • Saraiki, written with a modified Arabic script — that has 45 letters
  • Sindhi, a British commissioner in Sindh on August 29, 1857, ordered to change Arabic script[vague],[17] also written in Devanagari in India
  • Aer language[18]
  • Bhadrawahi language[19]
  • Ladakhi (India), although it is more commonly written using the Tibetan script
  • Balti (a Sino-Tibetan language), also rarely written in the Tibetan script
  • Brahui language in Pakistan and Afghanistan[20]
  • Burushaski or Burusho language, a language isolated to Pakistan.
  • Urdu in Pakistan (and historically several other Hindustani languages). Urdu is one of several official languages in the states of Jammu and Kashmir, Delhi, Uttar Pradesh, Bihar, Jharkhand, West Bengal and Telangana.
  • Dogri, spoken by about five million people in India and Pakistan, chiefly in the Jammu region of Jammu and Kashmir and in Himachal Pradesh, but also in northern Punjab, although Dogri is more commonly written in Devanagari
  • Arwi language (a mixture of Arabic and Tamil) uses the Arabic script together with the addition of 13 letters. It is mainly used in Sri Lanka and the South Indian state of Tamil Nadu for religious purposes. Arwi language is the language of Tamil Muslims
  • Arabi Malayalam is Malayalam written in the Arabic script. The script has particular letters to represent the peculiar sounds of Malayalam. This script is mainly used in madrasas of the South Indian state of Kerala and of Lakshadweep.
  • Rohingya language (Ruáingga) is a language spoken by the Rohingya people of Rakhine State, formerly known as Arakan (Rakhine), Burma (Myanmar). It is similar to Chittagonian language in neighboring Bangladesh[21] and sometimes written using the Roman script, or an Arabic-derived script known as Hanifi
  • Ishkashimi language (Ishkashimi) in Afghanistan

Southeast Asia[edit]

  • Malay in the Arabic script known as Jawi. In some cases it can be seen in the signboards of shops and market stalls. Particularly in Brunei, Jawi is used in terms of writing or reading for Islamic religious educational programs in primary school, secondary school, college, or even higher educational institutes such as universities. In addition, some television programming uses Jawi, such as announcements, advertisements, news, social programs or Islamic programs
    • co-official in Brunei
    • Malaysia but co-official in Kelantan and Kedah, Islamic states in Malaysia
    • Indonesia, Jawi script is co-used with Latin in provinces of Aceh, Riau, Riau Islands and Jambi. The Javanese, Madurese and Sundanese also use another Arabic variant, the Pegon in Islamic writings and pesantren community.
    • Southern Thailand
    • Predominantly Muslim areas of the Philippines (especially Tausug language)
    • Ida’an language (also Idahan) a Malayo-Polynesian language spoken by the Ida’an people of Sabah, Malaysia[22]
  • Cham language in Cambodia besides Western Cham script.

Africa[edit]

  • North Africa
    • Arabic
    • Berber languages have often been written in an adaptation of the Arabic alphabet. The use of the Arabic alphabet, as well as the competing Latin and Tifinagh scripts, has political connotations
    • Tuareg language, (sometimes called Tamasheq) which is also a Berber language
    • Coptic language of Egyptians as Coptic text written in Arabic letters[23]
  • Northeast Africa
    • Bedawi or Beja, mainly in northeastern Sudan
    • Wadaad writing, used in Somalia
    • Nubian languages
      • Dongolawi language or Andaandi language of Nubia, in the Nile Vale of northern Sudan
      • Nobiin language, the largest Nubian language (previously known by the geographic terms Mahas and Fadicca/Fiadicca) is not yet standardized, being written variously in both Latinized and Arabic scripts; also, there have been recent efforts to revive the Old Nubian alphabet.[24][25]
    • Fur language of Darfur, Sudan
  • Southeast Africa
    • Comorian, in the Comoros, currently side by side with the Latin alphabet (neither is official)
    • Swahili, was originally written in Arabic alphabet, Swahili orthography is now based on the Latin alphabet that was introduced by Christian missionaries and colonial administrators
  • West Africa
    • Zarma language of the Songhay family. It is the language of the southwestern lobe of the West African nation of Niger, and it is the second leading language of Niger, after Hausa, which is spoken in south central Niger[26]
    • Tadaksahak is a Songhay language spoken by the pastoralist Idaksahak of the Ménaka area of Mali[27]
    • Hausa language uses an adaptation of the Arabic script known as Ajami, for many purposes, especially religious, but including newspapers, mass mobilization posters and public information[28]
    • Dyula language is a Mandé language spoken in Burkina Faso, Côte d’Ivoire and Mali.[29]
    • Jola-Fonyi language of the Casamance region of Senegal[30]
    • Balanta language a Bak language of west Africa spoken by the Balanta people and Balanta-Ganja dialect in Senegal
    • Mandinka, widely but unofficially (known as Ajami), (another non-Latin script used is the N’Ko script)
    • Fula, especially the Pular of Guinea (known as Ajami)
    • Wolof (at zaouia schools), known as Wolofal.
  • Arabic script outside Africa
    • In writings of African American slaves
      • Writings of by Omar Ibn Said (1770–1864) of Senegal[31]
      • The Bilali Document also known as Bilali Muhammad Document is a handwritten, Arabic manuscript[32] on West African Islamic law. It was written by Bilali Mohammet in the 19th century. The document is currently housed in the library at the University of Georgia
      • Letter written by Ayuba Suleiman Diallo (1701–1773)
      • Arabic Text From 1768[33]
      • Letter written by Abdul Rahman Ibrahima Sori (1762–1829)

Former use[edit]

With the establishment of Muslim rule in the subcontinent, one or more forms of the Arabic script were incorporated among the assortment of scripts used for writing native languages.[34] In the 20th century, the Arabic script was generally replaced by the Latin alphabet in the Balkans,[dubious – discuss] parts of Sub-Saharan Africa, and Southeast Asia, while in the Soviet Union, after a brief period of Latinisation,[35] use of Cyrillic was mandated. Turkey changed to the Latin alphabet in 1928 as part of an internal Westernizing revolution. After the collapse of the Soviet Union in 1991, many of the Turkic languages of the ex-USSR attempted to follow Turkey’s lead and convert to a Turkish-style Latin alphabet. However, renewed use of the Arabic alphabet has occurred to a limited extent in Tajikistan, whose language’s close resemblance to Persian allows direct use of publications from Afghanistan and Iran.[36]

Africa[edit]

  • Afrikaans (as it was first written among the «Cape Malays», see Arabic Afrikaans)
  • Berber in North Africa, particularly Shilha in Morocco (still being considered, along with Tifinagh and Latin, for Central Atlas Tamazight)
  • French by the Arabs and Berbers in Algeria and other parts of North Africa during the French colonial period
  • Harari, by the Harari people of the Harari Region in Ethiopia. Now uses the Geʻez and Latin alphabets
  • For the West African languages—Hausa, Fula, Mandinka, Wolof and some more—the Latin alphabet has officially replaced Arabic transcriptions for use in literacy and education
  • Kinyarwanda in Rwanda
  • Kirundi in Burundi
  • Malagasy in Madagascar (script known as Sorabe)
  • Nubian
  • Shona in Zimbabwe
  • Somali (see wadaad Arabic) has mostly used the Latin alphabet since 1972
  • Songhay in West Africa, particularly in Timbuktu
  • Swahili (has used the Latin alphabet since the 19th century)
  • Yoruba in West Africa (this was probably limited, but still notable)

Europe[edit]

  • Albanian called Elifbaja shqip
  • Aljamiado (Mozarabic, Berber, Aragonese, Portuguese[citation needed], Ladino, and Spanish, during and residually after the Muslim rule in the Iberian peninsula)
  • Belarusian (among ethnic Tatars; see Belarusian Arabic alphabet)
  • Bosnian (only for literary purposes; currently written in the Latin alphabet; Text example: مۉلٖىمۉ سه ته‌بٖى بۉژه‎ = Molimo se tebi, Bože (We pray to you, O God); see Arebica)
  • Crimean Tatar
  • Greek in certain areas in Greece and Anatolia. In particular, Cappadocian Greek written in Perso-Arabic
  • Polish (among ethnic Lipka Tatars)

Central Asia and Caucasus[edit]

  • Adyghe language also known as West Circassian, is an official languages of the Republic of Adygea in the Russian Federation. It used Arabic alphabet before 1927
  • Avar as well as other languages of Daghestan: Nogai, Kumyk, Lezgian, Lak and Dargwa
  • Azeri in Azerbaijan (now written in the Latin alphabet and Cyrillic script in Azerbaijan)
  • Bashkir (officially for some years from the October Revolution of 1917 until 1928, changed to Latin, now uses the Cyrillic script)
  • Chaghatay across Central Asia
  • Chechen (sporadically from the adoption of Islam; officially from 1917 until 1928)[37]
  • Circassian and some other members of the Abkhaz–Adyghe family in the western Caucasus and sporadically – in the countries of Middle East, like Syria
  • Ingush
  • Karachay-Balkar in the central Caucasus
  • Karakalpak
  • Kazakh in Kazakhstan (until the 1930s, changed to Latin, currently using Cyrillic, phasing in Latin)
  • Kyrgyz in Kyrgyzstan (until the 1930s, changed to Latin, now uses the Cyrillic script)
  • Mandarin Chinese and Dungan, among the Hui people (script known as Xiao’erjing)
  • Ottoman Turkish
  • Tat in South-Eastern Caucasus
  • Tatar before 1928 (changed to Latin Yañalif), reformed in the 1880s (İske imlâ), 1918 (Yaña imlâ – with the omission of some letters)
  • Turkmen in Turkmenistan (changed to Latin in 1929, then to the Cyrillic script, then back to Latin in 1991)
  • Uzbek in Uzbekistan (changed to Latin, then to the Cyrillic script, then back to Latin in 1991)
  • Some Northeast Caucasian languages of the Muslim peoples of the USSR between 1918 and 1928 (many also earlier), including Chechen, Lak, etc. After 1928, their script became Latin, then later[when?] Cyrillic[citation needed]

South and Southeast Asia[edit]

  • Acehnese in Sumatra, Indonesia
  • Banjarese in Kalimantan, Indonesia
  • Bengali in Bengal, Arabic scripts have been used historically in places like Chittagong and West Bengal among other places. See Dobhashi for further information.
  • Maguindanaon in the Philippines
  • Malay in Malaysia, Singapore and Indonesia. Although Malay speakers in Brunei and Southern Thailand still use the script on a daily basis
  • Minangkabau in Sumatra, Indonesia
  • Pegon script of Javanese, Madurese and Sundanese in Indonesia, used only in Islamic schools and institutions
  • Tausug in the Philippines, Malaysia, and Indonesia it can be used in Islamic schools in the Philippines
  • Maranao in the Philippines
  • Rakhine in Burma and Bangladesh
  • Mongolian in Afghanistan There is also a language in the Mongolic family that spoken in the Afghanistan it is called Mogholi language
  • Tagalog in the Philippines
  • Yakan in Basilan
  • Aslian in Malaysia
  • Ternate in Indonesia by the Muslims
  • Tidore in Indonesia
  • Meitei in Bangladesh
  • Shughni in Afghanistan
  • Thai in Malaysia
  • Sylheti in Arakan, Bengal, Chittagong, and Tripura
  • Kedah Malay in Myanmar, Malaysia, and Thailand
  • Uab Meto in Indonesia
  • Molbog in Sabah used by the Muslims even though in Palawan
  • Bonggi in Sabah by the Muslims
  • Kadazan in Malaysia is a Muslim language
  • Dusun used in Brunei, and Malaysia
  • Sama used in Philippines, Malaysia, and Indonesia
  • Bajau is in Philippines, Malaysia, and Indonesia
  • Sarawak Bisaya used in Malaysia, and Brunei
  • Sabah Bisaya is used in Sabah
  • Lotud spoken in Malaysia only
  • Lun Bawang in Sarawak, Sabah, Temburong and Kalimantan
  • Tiruray in the Bangsamoro
  • Chavacano in Cotabato, Zamboanga Peninsula, Sulu, Basilan, Tawi-Tawi, Sabah, and Kalimantan
  • Maranao has Arabic script in Lanao del Sur,Lanao del Norte, and Sabah
  • Iranun used in Islamic schools in Mindanao,and Malaysia

Middle East[edit]

  • Hebrew was written in Arabic letters in a number of places in the past[38][39]
  • Northern Kurdish in Turkey and Syria was written in Arabic script until 1932, when a modified Kurdish Latin alphabet was introduced by Jaladat Ali Badirkhan in Syria
  • Turkish in the Ottoman Empire was written in Arabic script until Mustafa Kemal Atatürk declared the change to Latin script in 1928. This form of Turkish is now known as Ottoman Turkish and is held by many to be a different language, due to its much higher percentage of Persian and Arabic loanwords (Ottoman Turkish alphabet)

Unicode[edit]

As of Unicode 15.0, the following ranges encode Arabic characters:

  • Arabic (0600–06FF)
  • Arabic Supplement (0750–077F)
  • Arabic Extended-A (08A0–08FF)
  • Arabic Extended-B (0870–089F)
  • Arabic Extended-C (10EC0–10EFF)
  • Arabic Presentation Forms-A (FB50–FDFF)
  • Arabic Presentation Forms-B (FE70–FEFF)
  • Arabic Mathematical Alphabetic Symbols (1EE00–1EEFF)
  • Rumi Numeral Symbols (10E60–10E7F)
  • Indic Siyaq Numbers (1EC70–1ECBF)
  • Ottoman Siyaq Numbers (1ED00–1ED4F)

Additional letters used in other languages[edit]

Assignment of phonemes to graphemes[edit]

∅ = phoneme absent from language

Language family Austron. Dravid Turkic Indic Iranian Germanic Arabic
Language/script Jawi Pegon Arwi Ottoman Uyghur Tatars Sindhi Punjabi Urdu Persian Balochi Kurdish Pashto Afrikaans Moroccan Tunisian Algerian Egyptian Najdi Hejazi Levantine Iraqi Gulf
/p/ ڤ ڣ پ پ‎ / ب
/g/ ݢ ؼ گ ګ گ ڭ‎ / گ ڨ‎ / ڧـ ـڧـ ـٯ‎ / ق ج ق ك‎ / ج گ‎ / ك ق / گ
/t͡ʃ/ چ چ ڜ تش چ
/v/ ۏ ف و ۋ و ڤ ڤ ڥ‎ / ڢ‎ / ف ڤ‎ / ف
/ʒ/ ژ ژ ج چ‎ / ج ج
/ŋ/ ڠ ڭ ڱ ن٘ ڠ
/ɳ/ ڹ ڻ ݨ ن ڼ
/ɲ/ ڽ ۑ ݧ ڃ نج
Table of additional letters in other languages

Letter or Digraph [A] Use & Pronunciation Unicode i’jam & other additions Shape Similar Arabic Letter(s)
U+ [B] [C] above below
پ پـ ـپـ ـپ Pe, used to represent the phoneme /p/ in Persian, Pashto, Punjabi, Khowar, Sindhi, Urdu, Kurdish, Kashmiri; it is can be used in Arabic to describe the phoneme /p/ otherwise it is normalized to /b/ ب e.g. پول Paul also written بول U+067E none 3 dots ٮ ب
ݐ ݐـ ـݐـ ـݐ used to represent the equivalent of the Latin letter Ƴ (palatalized glottal stop /ʔʲ/) in some African languages such as Fulfulde. U+0750   ﮳﮳﮳ ‎  none 3 dots
(horizontal)
ٮ ب
ٻ ٻـ ـٻـ ـٻ B̤ē, used to represent a voiced bilabial implosive /ɓ/ in Hausa, Sindhi and Saraiki. U+067B none 2 dots
(vertically)
ٮ ب
ڀ ڀـ ـڀـ ـڀ represents an aspirated voiced bilabial plosive /bʱ/ in Sindhi. U+0680 none 4 dots ٮ ب
ٺ ٺـ ـٺـ ـٺ Ṭhē, represents the aspirated voiceless retroflex plosive /ʈʰ/ in Sindhi. U+067A 2 dots
(vertically)
none ٮ ت
ټ ټـ ـټـ ـټ Ṭē, used to represent the phoneme /ʈ/ in Pashto. U+067C ﮿ 2 dots ring ٮ ت
ٽ ٽـ ـٽـ ـٽ Ṭe, used to represent the phoneme (a voiceless retroflex plosive /ʈ/) in Sindhi U+067D 3 dots
(inverted)
none ٮ ت
ٹـ ـٹـ ـٹ Ṭe, used to represent Ṭ (a voiceless retroflex plosive /ʈ/) in Punjabi, Kashmiri, Urdu. U+0679 ◌ؕ small
ط
none ٮ ت
ٿ ٿـ ـٿـ ـٿ Teheh, used in Sindhi and Rajasthani (when written in Sindhi alphabet); used to represent the phoneme /t͡ɕʰ/ (pinyin q) in Chinese Xiao’erjing. U+067F 4 dots none ٮ ت
ڄ ڄـ ـڄـ ـڄ represents the «c» voiceless dental affricate /t͡s/ phoneme in Bosnian. U+0684 none 2 dots
(vertically)
ح ج
ڃ ڃـ ـڃـ ـڃ represents the «ć» voiceless alveolo-palatal affricate /t͡ɕ/ phoneme in Bosnian. U+0683 none 2 dots ح ح ج
چ چـ ـچـ ـچ Che, used to represent /t͡ʃ/ («ch»). It is used in Persian, Pashto, Punjabi, Urdu, Kashmiri and Kurdish. /ʒ/ in Egypt. U+0686 none 3 dots ح ج
څ څـ ـڅـ ـڅ Ce, used to represent the phoneme /t͡s/ in Pashto. U+0685 3 dots none ح ج خ ح
ݗ ݗـ ـݗـ ـݗ represents the «đ» voiced alveolo-palatal affricate /d͡ʑ/ phoneme in Bosnian. U+0757 2 dots none ح ح
ځ ځـ ـځـ ـځ Źim, used to represent the phoneme /d͡z/ in Pashto. U+0681 ◌ٔ Hamza none ح ج خ ح
ݙ ݙ ـݙ used in Saraiki to represent a Voiced alveolar implosive /ɗ̢/. U+0759 small
ط
2 dots
(vertically)
د د
ڊ ڊ ـڊ used in Saraiki to represent a voiced retroflex implosive /ᶑ/. U+068A none 1 dot د د
ڈ ڈ ـڈ Ḍal, used to represent a Ḍ (a voiced retroflex plosive /ɖ/) in Punjabi, Kashmiri and Urdu. U+0688 ◌ؕ small ط none د د
ڌ ڌ ـڌ Dhal, used to represent the phoneme /d̪ʱ/ in Sindhi U+068C 2 dots none د د
ډ ډ ـډ Ḍal, used to represent the phoneme /ɖ/ in Pashto. U+0689 ﮿ none ring د د
ڑ ڑ ـڑ Ṛe, represents a retroflex flap /ɽ/ in Punjabi and Urdu. U+0691 ◌ؕ small ط none ر ر
ړ ړ ـړ Ṛe, used to represent a retroflex lateral flap in Pashto. U+0693 ﮿ none ring ر ر
ݫ ݫ ـݫ used in Ormuri to represent a voiced alveolo-palatal fricative /ʑ/, as well as in Torwali. U+076B 2 dots
(vertically)
none ر ر
ژ ژ ـژ Že / zhe, used to represent the voiced postalveolar fricative /ʒ/ in, Persian, Pashto, Kurdish, Urdu, Punjabi and Uyghur. U+0698 3 dots none ر ز
ږ ږ ـږ Ǵe / ẓ̌e, used to represent the phoneme /ʐ/ /ɡ/ /ʝ/ in Pashto. U+0696 1 dot 1 dot ر ز
ڕ ڕ ـڕ used in Kurdish to represent rr /r/ in Soranî dialect. U+0695 ٚ none V pointing down ر ر
ݭ ݭـ ـݭـ ـݭ used in Kalami to represent a voiceless retroflex fricative /ʂ/, and in Ormuri to represent a voiceless alveolo-palatal fricative /ɕ/. U+076D 2 dots vertically none س س
ݜ ݜـ ـݜـ ـݜ used in Shina to represent a voiceless retroflex fricative /ʂ/. U+075C 4 dots none س ش س
ښ ښـ ـښـ ـښ X̌īn / ṣ̌īn, used to represent the phoneme /x/ /ʂ/ /ç/ in Pashto. U+069A 1 dot 1 dot س ش س
ڜ ڜـ ـڜـ ـڜ Unofficially used to represent Spanish words with /t͡ʃ/ in Morocco. U+069C 3 dots 3 dots س ش س
ڨ ڨـ ـڨـ ـڨ Ga, used to represent the voiced velar plosive /ɡ/ in Algerian and Tunisian. U+06A8 3 dots none ٯ ق
گ گـ ـگـ ـگ Gaf, represents a voiced velar plosive /ɡ/ in Persian, Pashto, Punjabi, Kyrgyz, Kazakh, Kurdish, Uyghur, Mesopotamian, Urdu and Ottoman Turkish. U+06AF line horizontal line none گ ك
ګ ګـ ـګـ ـګ Gaf, used to represent the phoneme /ɡ/ in Pashto. U+06AB ﮿ ring none ک ك
ݢ ݢـ ـݢـ ـݢ Gaf, represents a voiced velar plosive /ɡ/ in the Jawi script of Malay. U+0762 1 dot none ک ك
ڬ ڬـ ـڬـ ـڬ U+06AC 1 dot none ك ك
ؼ ؼـ ـؼـ ـؼ Gaf, represents a voiced velar plosive /ɡ/ in the Pegon script of Indonesian. U+08B4 none 1 dot ك ك
ڭ ڭـ ـڭـ ـڭ Ng, used to represent the /ŋ/ phone in Ottoman Turkish, Kazakh, Kyrgyz, and Uyghur, and to unofficially represent the /ɡ/ in Morocco and in many dialects of Algerian. U+06AD 3 dots none ك ك
أي أيـ ـأيـ ـأي Ee, used to represent the phoneme /eː/ in Somali. U+0623 U+064A ◌ٔ Hamza 2 dots اى أ + ي
ئ ئـ ـئـ ـئ E, used to represent the phoneme /e/ in Somali. U+0626 ◌ٔ Hamza none ى ي ی
ىٓ ىٓـ ـىٓـ ـىٓ Ii, used to represent the phoneme /iː/ in Somali and Saraiki. U+0649 U+0653 ◌ٓ Madda none ى ي
ؤ ؤ ـؤ O, used to represent the phoneme /o/ in Somali. U+0624 ◌ٔ Hamza none و ؤ
ۅ ۅ ـۅ Ö, used to represent the phoneme /ø/ in Kyrgyz. U+0624 ◌̵ Strikethrough[D] none و و
ې ېـ ـېـ ـې Pasta Ye, used to represent the phoneme /e/ in Pashto and Uyghur. U+06D0 none 2 dots vertical ى ي
ی یـ ـیـ ـی Nārīna Ye, used to represent the phoneme [ɑj] and phoneme /j/ in Pashto. U+06CC 2 dots
(start + mid)
none ى ي
ۍ ـۍ end
only
X̌əźīna ye Ye, used to represent the phoneme [əi] in Pashto. U+06CD line horizontal
line
none ى ي
ئ ئـ ـئـ ـئ Fāiliya Ye, used to represent the phoneme [əi] and /j/ in Pashto, Punjabi, Saraiki and Urdu U+0626 ◌ٔ Hamza none ى ي ى
أو أو ـأو Oo, used to represent the phoneme /oː/ in Somali. U+0623 U+0648 ◌ٔ Hamza none او أ + و
ﻭٓ ﻭٓ ـﻭٓ Uu, used to represent the phoneme /uː/ in Somali. ‎ + ◌ٓ‎ U+0648 U+0653 ◌ٓ Madda none و + ◌ٓ
ڳ ڳـ ـڳـ ـڳ represents a voiced velar implosive /ɠ/ in Sindhi and Saraiki U+06B1 horizontal
line
2 dots گ ك
ڱ ڱـ ـڱـ ـڱ represents the Velar nasal /ŋ/ phoneme in Sindhi. U+06B1 2 dots + horizontal
line
none گ ك
ک کـ ـکـ ـک Khē, represents /kʰ/ in Sindhi. U+06A9 none none none ک ك
ڪ ڪـ ـڪـ ـڪ «Swash kāf» is a stylistic variant of ك ‎ in Arabic, but represents un- aspirated /k/ in Sindhi. U+06AA none none none ڪ ك or ڪ
ݣ ݣـ ـݣـ ـݣ used to represent the phoneme /ŋ/ (pinyin ng) in Chinese. U+0763 none 3 dots ک ك
ڼ ڼـ ـڼـ ـڼ represents the retroflex nasal /ɳ/ phoneme in Pashto. U+06BC ں ﮿ 1 dot ring ن
ڻ ڻـ ـڻـ ـڻ represents the retroflex nasal /ɳ/ phoneme in Sindhi. U+06BB ◌ؕ small ط none ں ن
ݨ ݨـ ـݨـ ـݨ used in Punjabi to represent /ɳ/ and Saraiki to represent /ɲ/. U+0768 1 dot + small ط none ں ن
ڽ ڽـ ـڽـ ـڽ Nya /ɲ/ in the Jawi script. U+06BD 3 dots none ں ن
ۑ ۑـ ـۑـ ـۑ Nya /ɲ/ in the Pegon script. U+06D1 none 3 dots ى ى
ڠ ڠـ ـڠـ ـڠ Nga /ŋ/ in the Jawi script and Pegon script. U+06A0 3 dots none ع غ
ݪ ݪـ ـݪـ ـݪ used in Marwari to represent a retroflex lateral flap /ɺ̢/, and in Kalami to represent a voiceless lateral fricative /ɬ/. U+076A line horizontal
line
none ل ل
ࣇ‍ ‍ࣇ‍ ‍ࣇ — or alternately typeset as لؕ ‎ — is used in Punjabi to represent voiced retroflex lateral approximant /ɭ/[40] U+08C7 ◌ؕ small ط none ل ل
لؕ لؕـ ـلؕـ ـلؕ U+0644 U+0615
ڥ ڥـ ـڥـ ـڥ Vi, used in Algerian Arabic and Tunisian Arabic when written in Arabic script to represent the sound /v/ (unofficial). U+06A5 none 3 dots ڡ ف
ڤ ڤـ ـڤـ ـڤ Ve, used in by some Arabic speakers to represent the phoneme /v/ in loanwords, and in the Kurdish language when written in Arabic script to represent the sound /v/. Also used as pa /p/ in the Jawi script and Pegon script. U+06A4 3 dots none ڡ ف
ۏ ۏ ـۏ Va in the Jawi script. U+06CF 1 dot none و و
ۋ ۋ ـۋ represents a voiced labiodental fricative /v/ in Kyrgyz, Uyghur, and Old Tatar; and /w, ʊw, ʉw/ in Kazakh; also formerly used in Nogai. U+06CB 3 dots none و و
ۆ ۆ ـۆ represents «O» /o/ in Kurdish, and in Uyghur it represents the sound similar to the French eu and œu /ø/ sound. It represents the «у» close back rounded vowel /u/ phoneme in Bosnian. U+06C6 ◌ٚ V pointing down none و و
ۇ ۇ ـۇ U, used to represents the Close back rounded vowel /u/ phoneme in Azerbaijani, Kazakh, Kyrgyz and Uyghur. U+06C7 ◌ُ Damma[E] none و و
ێ ێـ ـێـ ـێ represents Ê or É /e/ in Kurdish. U+06CE ◌ٚ V pointing down 2 dots
(start + mid)
ى ي
ھ
ھ
ھـ ـھـ ـھ
ھھھ
Do-chashmi he (two-eyed hāʼ), used in digraphs for aspiration /ʰ/ and breathy voice /ʱ/ in Punjabi and Urdu. Also used to represent /h/ in Kazakh, Sorani and Uyghur.[F] U+06BE none none none ھ ه
ە ە ـە Ae, used represent /æ/ and /ɛ/ in Kazakh, Sorani and Uyghur. U+06D5 none none none ھ إ
ے ـے end
only
Baṛī ye (‘big yāʼ’), is a stylistic variant of ي in Arabic, but represents «ai» or «e» /ɛː/, /eː/ in Urdu and Punjabi. U+06D2 none none none ے ي
ڞ ڞـ ـڞـ ـڞ used to represent the phoneme /tsʰ/ (pinyin c) in Chinese. U+069E 3 dots none ص ص ض
ط طـ ـطـ ـط used to represent the phoneme /t͡s/ (pinyin z) in Chinese. U+0637 ط ط
ۉ ۉ ـۉ represents the «o» open-mid back rounded vowel /ɔ/ phoneme in Bosnian. U+06C9 ◌ٛ V pointing up none و و
ݩ ݩـ ـݩـ ـݩ represents the «nj» palatal nasal /ɲ/ phoneme in Bosnian. U+0769 ◌ٚ 1 dot
V pointing down
none ں ن
ڵ ڵـ ـڵـ ـڵ used in Kurdish to represent ll /ɫ/ in Soranî dialect. U+06B5 ◌ٚ V pointing down none ل ل
ڵ ڵـ ـڵـ ـڵ represents the «lj» palatal lateral approximant /ʎ/ phoneme in Bosnian. U+06B5 ◌ٚ V pointing down none ل ل
اٖى اٖىـ ـاٖىـ ـاٖى represents the «i» close front unrounded vowel /i/ phoneme in Bosnian. U+0627 U+0656 U+0649 ◌ٖ Alef none اى اٖ  +  ى
Footnotes:
  1. ^ From right: start, middle, end, and isolated forms.
  2. ^ Joined to the letter, closest to the letter, on the first letter, or above.
  3. ^ Further away from the letter, or on the second letter, or below.
  4. ^ A variant that end up with loop also exists.
  5. ^ Although the letter also known as Waw with Damma, some publications and fonts features filled Damma that looks similar to comma.
  6. ^ Shown in Naskh (top) and Nastaliq (bottom) styles. The Nastaliq version of the connected forms are connected to each other, because the tatweel character U+0640 used to show the other forms does not work in many Nastaliq fonts.

Letter construction[edit]

Most languages that use alphabets based on the Arabic alphabet use the same base shapes. Most additional letters in languages that use alphabets based on the Arabic alphabet are built by adding (or removing) diacritics to existing Arabic letters. Some stylistic variants in Arabic have distinct meanings in other languages. For example, variant forms of kāf ك ک ڪ ‎ are used in some languages and sometimes have specific usages. In Urdu and some neighbouring languages, the letter Hā has diverged into two forms ھ dō-čašmī hē and ہ ہـ ـہـ ـہ gōl hē.[41] While a variant form of ي referred to as baṛī yē ے ‎ is used at the end of some words.[41]

Table of Letter Components[edit]

See also[edit]

  • Arabic (Unicode block)
  • Eastern Arabic numerals (digit shapes commonly used with Arabic script)
  • History of the Arabic alphabet
  • Transliteration of Arabic
  • Xiao’erjing

References[edit]

  1. ^ «Arabic Alphabet». Encyclopædia Britannica online. Archived from the original on 26 April 2015. Retrieved 2015-05-16.
  2. ^ Mahinnaz Mirdehghan. 2010. Persian, Urdu, and Pashto: A comparative orthographic analysis. Writing Systems Research Vol. 2, No. 1, 9–23.
  3. ^ «Exposición Virtual. Biblioteca Nacional de España». Bne.es. Archived from the original on 2012-02-18. Retrieved 2012-04-06.
  4. ^ Ahmad, Syed Barakat. (11 January 2013). Introduction to Qur’anic script. ISBN 978-1-136-11138-9. OCLC 1124340016.
  5. ^ Gruendler, Beatrice (1993). The Development of the Arabic Scripts: From the Nabatean Era to the First Islamic Century According to Dated Texts. Scholars Press. p. 1. ISBN 9781555407100.
  6. ^ Healey, John F.; Smith, G. Rex (2012-02-13). «II — The Origin of the Arabic Alphabet». A Brief Introduction to The Arabic Alphabet. Saqi. ISBN 9780863568817.
  7. ^ Senner, Wayne M. (1991). The Origins of Writing. U of Nebraska Press. p. 100. ISBN 0803291671.
  8. ^ «Nabataean abjad». www.omniglot.com. Retrieved 2017-03-08.
  9. ^ Naveh, Joseph. «Nabatean Language, Script and Inscriptions» (PDF).
  10. ^ Taylor, Jane (2001). Petra and the Lost Kingdom of the Nabataeans. I.B.Tauris. p. 152. ISBN 9781860645082.
  11. ^ «Zribi, I., Boujelbane, R., Masmoudi, A., Ellouze, M., Belguith, L., & Habash, N. (2014). A Conventional Orthography for Tunisian Arabic. In Proceedings of the Language Resources and Evaluation Conference (LREC), Reykjavík, Iceland».
  12. ^ Brustad, K. (2000). The syntax of spoken Arabic: A comparative study of Moroccan, Egyptian, Syrian, and Kuwaiti dialects. Georgetown University Press.
  13. ^ «Sayad Zahoor Shah Hashmii». baask.com.
  14. ^ Sarlak, Riz̤ā (2002). «Dictionary of the Bakhtiari dialect of Chahar-lang». google.com.eg.
  15. ^ Iran, Mojdeh (5 February 2011). «Bakhtiari Language Video (bak) بختياري ها! خبری مهم» – via Vimeo.
  16. ^ «Ethnologue». Retrieved Feb 1, 2020.
  17. ^ «Pakistan should mind all of its languages!». tribune.com.pk. June 2011.
  18. ^ «Ethnologue». Retrieved Feb 1, 2020.
  19. ^ «Ethnologue». Retrieved Feb 1, 2020.
  20. ^ «The Bible in Brahui». Worldscriptures.org. Archived from the original on October 30, 2016. Retrieved August 5, 2013.
  21. ^ «Rohingya Language Book A-Z». Scribd.
  22. ^ «Ida’an». scriptsource.org.
  23. ^ «The Coptic Studies’ Corner». stshenouda.com. Archived from the original on 2012-04-19. Retrieved 2012-04-17.
  24. ^ «—The Cradle of Nubian Civilisation—«. thenubian.net.
  25. ^ «2 » AlNuba egypt». 19 July 2012. Archived from the original on 19 July 2012.
  26. ^ «Zarma». scriptsource.org.
  27. ^ «Tadaksahak». scriptsource.org.
  28. ^ «Lost Language — Bostonia Summer 2009». bu.edu.
  29. ^ «Dyula». scriptsource.org.
  30. ^ «Jola-Fonyi». scriptsource.org.
  31. ^ «Ibn Sayyid manuscript». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
  32. ^ «Muhammad Arabic letter». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
  33. ^ «Charno Letter». Muslims In America. Archived from the original on May 20, 2013. Retrieved August 5, 2013.
  34. ^ Asani, Ali S. (2002). Ecstasy and enlightenment : the Ismaili devotional literature of South Asia. Institute of Ismaili Studies. London: I.B. Tauris. p. 124. ISBN 1-86064-758-8. OCLC 48193876.
  35. ^ Alphabet Transitions – The Latin Script: A New Chronology – Symbol of a New Azerbaijan Archived 2007-04-03 at the Wayback Machine, by Tamam Bayatly
  36. ^ Sukhail Siddikzoda. «Tajik Language: Farsi or Not Farsi?» (PDF). Archived from the original (PDF) on June 13, 2006.
  37. ^ «Brief history of writing in Chechen». Archived from the original on December 23, 2008.
  38. ^ p. 20, Samuel Noel Kramer. 1986. In the World of Sumer: An Autobiography. Detroit: Wayne State University Press.
  39. ^ J. Blau. 2000. Hebrew written in Arabic characters: An instance of radical change in tradition. (In Hebrew, with English summary). In Heritage and Innovation in Judaeo-Arabic Culture: Proceedings of the Sixth Conference of the Society For Judaeo-Arabic Studies, p. 27-31. Ramat Gan.
  40. ^ Lorna Priest Evans; M. G. Abbas Malik. «Proposal to encode ARABIC LETTER LAM WITH SMALL ARABIC LETTER TAH ABOVE in the UCS» (PDF). www.unicode.org. Retrieved 10 May 2020.
  41. ^ a b «Urdu Alphabet». www.user.uni-hannover.de. Archived from the original on 11 September 2019. Retrieved 4 May 2020.

External links[edit]

  • Unicode collation charts—including Arabic letters, sorted by shape
  • Why the right side of your brain doesn’t like Arabic
  • Arabic fonts by SIL’s Non-Roman Script Initiative
  • Alexis Neme and Sébastien Paumier (2019), «Restoring Arabic vowels through omission-tolerant dictionary lookup», Lang Resources & Evaluation, Vol. 53, pp. 1–65. arXiv:1905.04051; doi:10.1007/s10579-019-09464-6

From Wikipedia, the free encyclopedia

For the Arabic script as it is used specifically to write Arabic, see Arabic alphabet.

Arabic script
Arabic-script.png
Script type

Abjad primarily

Alphabet in some adaptations

Time period

400–present
Direction right-to-left script Edit this on Wikidata
Official script

18 sovereign states

  •  Afghanistan
  •  Algeria
  •  Bahrain
  •  Egypt
  •  Iran
  •  Iraq
  •  Jordan
  •  Kuwait
  •  Lebanon
  •  Mauritania
  •  Morocco
  •  Libya
  •  Oman
  •  Qatar
  •  Saudi Arabia
  •  Syria
  •  Tunisia
  •  United Arab Emirates
  •  Yemen

Co-official script in:

10 sovereign states

  •  Brunei
  •  Comoros
  •  Chad
  •  Djibouti
  •  Eritrea
  •  Palestine
  •  Pakistan
  •  Somalia
    •  Somaliland
  •  Sudan
  •  United Nations
Languages See below
Related scripts

Parent systems

Egyptian hieroglyphs

  • Phoenician
    • Aramaic
      • Nabataean
        • Arabic script

Child systems

N’Ko
Hanifi script
ISO 15924
ISO 15924 Arab (160), ​Arabic
Unicode

Unicode alias

Arabic

Unicode range

  • U+0600–U+06FF Arabic
  • U+0750–U+077F Arabic Supplement
  • U+08A0–U+08FF Arabic Extended-A
  • U+0870–U+089F Arabic Extended-B
  • U+10EC0–U+10EFF Arabic Extended-C
  • U+FB50–U+FDFF Arabic Pres. Forms-A
  • U+FE70–U+FEFF Arabic Pres. Forms-B
  • U+1EE00–U+1EEFF Arabic Mathematical…
  • U+1EC70–U+1ECBF Indic Siyaq Numbers
  • U+1ED00–U+1ED4F Ottoman Siyaq Numbers
  • U+10E60–U+10E7F Rumi Numeral Symbols
 This article contains phonetic transcriptions in the International Phonetic Alphabet (IPA). For an introductory guide on IPA symbols, see Help:IPA. For the distinction between [ ], / / and ⟨ ⟩, see IPA § Brackets and transcription delimiters.

The Arabic script is the writing system used for Arabic and several other languages of Asia and Africa. It is the second-most widely used writing system in the world by number of countries using it or a script directly derived from it, and the third-most by number of users (after the Latin and Chinese scripts).[1]

The script was first used to write texts in Arabic, most notably the Quran, the holy book of Islam. With the religion’s spread, it came to be used as the primary script for many language families, leading to the addition of new letters and other symbols. Such languages still using it are: Persian (Farsi/Dari), Malay (Jawi), Uyghur, Kurdish, Punjabi (Shahmukhi), Sindhi, Balti, Balochi, Pashto, Lurish, Urdu, Kashmiri, Rohingya, Somali and Mandinka, Mooré among others.[2] Until the 16th century, it was also used for some Spanish texts, and—prior to the language reform in 1928—it was the writing system of Turkish.[3]

The script is written from right to left in a cursive style, in which most of the letters are written in slightly different forms according to whether they stand alone or are joined to a following or preceding letter. However, the basic letter form remains unchanged. The script does not have capital letters.[4] In most cases, the letters transcribe consonants, or consonants and a few vowels, so most Arabic alphabets are abjads, with the versions used for some languages, such as Sorani, Uyghur, Mandarin, and Serbo-Croatian, being alphabets. It is also the basis for the tradition of Arabic calligraphy.

Worldwide use of the Arabic and Perso-Arabic script

Arabic alphabet world distribution

Countries where the Arabic script is:
 →  the sole official script
 →  official alongside other scripts
 →  official at a provincial level (China, India, Tanzania) or a recognized second script of the official language (Malaysia, Tajikistan)

History[edit]

The Arabic alphabet is derived either from the Nabataean alphabet[5][6] or (less widely believed) directly from the Syriac alphabet,[7] which are both derived from the Aramaic alphabet (which also gave rise to the Hebrew alphabet), which, in turn, descended from the Phoenician alphabet. In addition to the Aramaic script (and, therefore, the Arabic and Hebrew scripts), the Phoenician script also gave rise to the Greek alphabet (and, therefore, both the Cyrillic alphabet and the Latin alphabet used to write this article).

Origins[edit]

In the 6th and 5th centuries BCE, northern Arab tribes emigrated and founded a kingdom centred around Petra, Jordan. These people (now named Nabataeans from the name of one of the tribes, Nabatu) spoke Nabataean Arabic, a dialect of the Arabic language. In the 2nd or 1st centuries BCE,[8][9] the first known records of the Nabataean alphabet were written in the Aramaic language (which was the language of communication and trade), but included some Arabic language features: the Nabataeans did not write the language which they spoke. They wrote in a form of the Aramaic alphabet, which continued to evolve; it separated into two forms: one intended for inscriptions (known as «monumental Nabataean») and the other, more cursive and hurriedly written and with joined letters, for writing on papyrus.[10] This cursive form influenced the monumental form more and more and gradually changed into the Arabic alphabet.

Overview[edit]

the Arabic alphabet

خ ح ج ث ت ب ا
khā’ ḥā’ jīm tha’ tā’ bā’ alif
ص ش س ز ر ذ د
ṣād shīn sīn zāy /
zayn
rā’ dhāl dāl
ق ف غ ع ظ ط ض
qāf fā’ ghayn ‘ayn ẓā’ ṭā’ ḍād
ي و ه ن م ل ك
yā’ wāw hā’ nūn mīm lām kāf
(see below for other alphabets)

The Arabic script has been adapted for use in a wide variety of languages besides Arabic, including Persian, Malay and Urdu, which are not Semitic. Such adaptations may feature altered or new characters to represent phonemes that do not appear in Arabic phonology. For example, the Arabic language lacks a voiceless bilabial plosive (the [p] sound), therefore many languages add their own letter to represent [p] in the script, though the specific letter used varies from language to language. These modifications tend to fall into groups: Indian and Turkic languages written in the Arabic script tend to use the Persian modified letters, whereas the languages of Indonesia tend to imitate those of Jawi. The modified version of the Arabic script originally devised for use with Persian is known as the Perso-Arabic script by scholars.[citation needed]

When the Arabic script is used to write Serbo-Croatian, Sorani, Kashmiri, Mandarin Chinese, or Uyghur, vowels are mandatory. The Arabic script can, therefore, be used as a true alphabet as well as an abjad, although it is often strongly, if erroneously, connected to the latter due to it being originally used only for Arabic.[citation needed]

Use of the Arabic script in West African languages, especially in the Sahel, developed with the spread of Islam. To a certain degree the style and usage tends to follow those of the Maghreb (for instance the position of the dots in the letters fāʼ and qāf).[11][12] Additional diacritics have come into use to facilitate the writing of sounds not represented in the Arabic language. The term ʻAjamī, which comes from the Arabic root for «foreign,» has been applied to Arabic-based orthographies of African languages.[citation needed]

Wikipedia in Arabic script of five languages

Table of writing styles[edit]

Script or style Alphabet(s) Language(s) Region Derived from Comment
Naskh Arabic
& others
Arabic
& others
Every region where Arabic scripts are used Sometimes refers to a very specific calligraphic style, but sometimes used to refer more broadly to almost every font that is not Kufic or Nastaliq.
Nastaliq Urdu,
Persian,
& others
Urdu,
Persian,
& others
Southern and Western Asia Taliq Used for almost all modern Urdu text, but only occasionally used for Persian. (The term «Nastaliq» is sometimes used by Urdu speakers to refer to all Perso-Arabic scripts.)
Taliq Persian Persian A predecessor of Nastaliq.
Kufic Arabic Arabic Middle East and parts of North Africa
Rasm Restricted Arabic alphabet Arabic Mainly historical Omits all diacritics including i’jam. Digital replication usually requires some special characters. See: ٮ ڡ ٯ‎ (links to Wiktionary).

Table of alphabets[edit]

Alphabet Letters Additional
Characters
Script or Style Languages Region Derived from:
(or related to)
Note
Arabic 28 ^(see above) Naskh, Kufi, Rasm, & others Arabic North Africa, West Asia Aramaic,
Syriac,
Nabataean
Ajami script 33 ٻ تٜ تٰٜ Naskh Hausa, Yoruba, Swahili West Africa Arabic Abjad
Aljamiado 28 Naskh Old Spanish, Mozarabic, Ladino, Aragonese, Old Galician-Portuguese Southwest Europe Arabic 8th-13th centuries for Mozarabic, 14th-16th centuries for the other languages
Arebica 30 ڄ ە اٖى ي ڵ ںٛ ۉ ۆ Naskh Serbo-Croatian Southeastern Europe Perso-Arabic Latest stage has full vowel marking
Arwi alphabet 41 ڊ ڍ ڔ صٜ ۻ ࢳ ڣ ࢴ ڹ ݧ Naskh Tamil Southern India, Sri Lanka Perso-Arabic
Belarusian Arabic alphabet 32 ࢮ ࢯ Naskh Belarusian Eastern Europe Perso-Arabic 15th / 16th century
Balochi Standard Alphabet(s) 29 ٹ ڈ ۏ ݔ ے Naskh and Nastaliq Balochi South-West Asia Perso-Arabic, also borrows multiple glyphs from Urdu This standardization is based on the previous orthography. For more information, see Balochi writing.
Berber Arabic alphabet(s) 33 چ ژ ڞ ݣ ء Various Berber languages North Africa Arabic
Burushaski 53 ݳ ݴ ݼ څ ڎ ݽ ڞ ݣ ݸ ݹ ݶ ݷ ݺ ݻ
(see note)
Nastaliq Burushaski South-West Asia (Pakistan) Urdu Also uses the additional letters shown for Urdu.(see below) Sometimes written with just the Urdu alphabet, or with the Latin alphabet.
Chagatai alphabet 32 ݣ Nastaliq and Naskh Chagatai Central Asia Perso-Arabic ݣ is interchangeable with نگ and ڭ.
Galal 32 Naskh Somali Horn of Africa Arabic
Jawi 36 ڠ ڤ ݢ ڽ ۏ ى Naskh Malay Peninsular Malaysia, Sumatra and part of Borneo Perso-Arabic Since 1303 AD (Trengganu Stone)
Kashmiri 44 ۆ ۄ ؠ ێ Nastaliq Kashmiri South Asia Urdu This orthography is fully voweled. 3 out of the 4 (ۆ, ۄ, ێ) additional glyphs are actually vowels. Not all vowels are listed here since they are not separate letters. For further information, see Kashmiri writing.
Kazakh Arabic alphabet 35 ٵ ٶ ﯗ ٷ ﯞ ۆ ە ھ ﻯ ٸ ي Naskh Kazakh Central Asia, China Chagatai In use since 11th century, reformed in the early 20th century, now official only in China
Khowar 45 ݯ ݮ څ ځ ݱ ݰ ڵ Nastaliq Khowar South Asia Urdu, however, borrows multiple glyphs from Pashto
Kyrgyz Arabic alphabet 33 ۅ ﯗ ۉ ﯞ ە ﻯ ي Naskh Kyrgyz Central Asia Chagatai In use since 11th century, reformed in the early 20th century, now official only in China
Pashto 45 ټ څ ځ ډ ړ ږ ښ ګ ڼ ۀ ي ې ۍ ئ Naskh and occasionally, Nastaliq Pashto South-West Asia, Afghanistan and Pakistan Perso-Arabic ګ is interchangeable with گ. Also, the glyphs ی and ې are often replaced with ے in Pakistan.
Pegon script 35 ڎ ڟ ڠ ڤ ڮ ۑ Naskh Javanese, Sundanese South-East Asia (Indonesia) Perso-Arabic
Persian 32 پ چ ژ گ Naskh and Nastaliq Persian (Farsi) West Asia (Iran etc. ) Arabic Also known as
Perso-Arabic.
Saraiki 45 ٻ ڄ ݙ ڳ Nastaliq Saraiki South-West Asia (Pakistan) Shahmukhi
Shahmukhi 41+
(see note)
ࣇ ݨ Nastaliq Punjabi South-West Asia (Pakistan) Urdu Similar to Urdu; 58[citation needed] letters including digraphs for aspirated consonants.
Sindhi 64 ڪ ڳ ڱ گ ک
پ ڀ ٻ ٽ ٿ ٺ
ڻ ڦ ڇ چ ڄ ڃ
ھ ڙ ڌ ڏ ڎ ڍ ڊ
Naskh Sindhi South-West Asia (Pakistan) Perso-Arabic
Sorabe 28 Naskh Malagasy Madagascar Arabic
Soranî 33 ڕ ڤ ڵ ۆ ێ Naskh, and occasionally, Nastaliq Central Kurdish Middle-East Perso-Arabic Vowels are mandatory, i.e. alphabet
Swahili Arabic script 28 Naskh Swahili Western and Southern Africa Arabic
İske imlâ 35 Naskh Tatar Volga region Chagatai Used prior to 1920.
Ottoman Turkish 32 Ottoman Turkish Ottoman Empire Chagatai Official until 1928
Urdu 39+
(see notes)
ٹ ڈ ڑ ں ہ ھ ے
(see notes)
Nastaliq Urdu South Asia Perso-Arabic 58[citation needed] letters including digraphs representing aspirated consonants.
بھ پھ تھ ٹھ جھ چھ دھ ڈھ کھ گھ
Uyghur 32 ئا ئە ھ ئو ئۇ ئۆ ئۈ ۋ ئې ئى Naskh Uyghur China, Central Asia Chagatai Reform of older Arabic-script Uyghur orthography that was used prior the 1950s. Vowels are mandatory, i.e. alphabet
Wolofal 33 ݖ گ ݧ ݝ ݒ Naskh Wolof West Africa Arabic, however, borrows at least one glyph from Perso-Arabic
Xiao’erjing 36 ٿ س﮲ ڞ ي Naskh Sinitic languages China, Central Asia Chagatai Used to write Chinese languages by Muslims living in China such as the Hui people.
Yaña imlâ 29 ئا ئە ئی ئو ئۇ ئ ھ Naskh Tatar Volga region İske imlâ alphabet 1920–1927 replaced with Cyrillic

Current use[edit]

Today Iran, Afghanistan, Pakistan, India, and China are the main non-Arabic speaking states using the Arabic alphabet to write one or more official national languages, including Azerbaijani, Baluchi, Brahui, Persian, Pashto, Central Kurdish, Urdu, Sindhi, Kashmiri, Punjabi and Uyghur.[citation needed]

An Arabic alphabet is currently used for the following languages:[citation needed]

Middle East and Central Asia[edit]

  • Arabic
  • Garshuni (or Karshuni) originated in the 7th century, when Arabic became the dominant spoken language in the Fertile Crescent, but Arabic script was not yet fully developed or widely read, and so the Syriac alphabet was used. There is evidence that writing Arabic in this other set of letters (known as Garshuni) influenced the style of modern Arabic script. After this initial period, Garshuni writing has continued to the present day among some Syriac Christian communities in the Arabic-speaking regions of the Levant and Mesopotamia.
  • Kazakh in Kazakhstan, China, Iran and Afghanistan
  • Kurdish in Northern Iraq and Northwest Iran. (In Turkey and Syria the Latin script is used for Kurdish)
  • Kyrgyz by its 150,000 speakers in the Xinjiang Uyghur Autonomous Region in northwestern China, Pakistan, Kyrgyzstan and Afghanistan
  • Turkmen in Turkmenistan,[verification needed] Afghanistan and Iran
  • Uzbek in Uzbekistan[verification needed] and Afghanistan
  • Persian in Iranian Persian and Dari in Afghanistan. It had former use in Tajikistan but is no longer used in Standard Tajik
  • Baluchi in Iran, in Pakistan’s Balochistan region, Afghanistan and Oman[13]
  • Southwestern Iranian languages as Lori dialects and Bakhtiari language[14][15]
  • Pashto in Afghanistan and Pakistan, and Tajikistan
  • Uyghur changed to Latin script in 1969 and back to a simplified, fully voweled Arabic script in 1983
  • Judeo-Arabic languages
    • Judeo-Tunisian Arabic[16]
  • Azerbaijani language in Iran
  • Talysh language in Iran
  • Mazanderani language in Iran
  • Shughni language in Afghanistan

East Asia[edit]

  • The Chinese language is written by some Hui in the Arabic-derived Xiao’erjing alphabet (see also Sini (script))
  • The Turkic Salar language is written by some Salar in the Arabic alphabet
  • Uyghur alphabet

South Asia[edit]

  • Balochi in Pakistan and Iran
  • Dari in Afghanistan
  • Kashmiri in India and Pakistan (also written in Sharada and Devanagari although Kashmiri is more commonly written in Perso-Arabic Script)
  • Pashto in Afghanistan and Pakistan
  • Khowar in Northern Pakistan, also uses the Latin script
  • Punjabi (Shahmukhi) in Pakistan, also written in the Brahmic script known as Gurmukhi in India
  • Saraiki, written with a modified Arabic script — that has 45 letters
  • Sindhi, a British commissioner in Sindh on August 29, 1857, ordered to change Arabic script[vague],[17] also written in Devanagari in India
  • Aer language[18]
  • Bhadrawahi language[19]
  • Ladakhi (India), although it is more commonly written using the Tibetan script
  • Balti (a Sino-Tibetan language), also rarely written in the Tibetan script
  • Brahui language in Pakistan and Afghanistan[20]
  • Burushaski or Burusho language, a language isolated to Pakistan.
  • Urdu in Pakistan (and historically several other Hindustani languages). Urdu is one of several official languages in the states of Jammu and Kashmir, Delhi, Uttar Pradesh, Bihar, Jharkhand, West Bengal and Telangana.
  • Dogri, spoken by about five million people in India and Pakistan, chiefly in the Jammu region of Jammu and Kashmir and in Himachal Pradesh, but also in northern Punjab, although Dogri is more commonly written in Devanagari
  • Arwi language (a mixture of Arabic and Tamil) uses the Arabic script together with the addition of 13 letters. It is mainly used in Sri Lanka and the South Indian state of Tamil Nadu for religious purposes. Arwi language is the language of Tamil Muslims
  • Arabi Malayalam is Malayalam written in the Arabic script. The script has particular letters to represent the peculiar sounds of Malayalam. This script is mainly used in madrasas of the South Indian state of Kerala and of Lakshadweep.
  • Rohingya language (Ruáingga) is a language spoken by the Rohingya people of Rakhine State, formerly known as Arakan (Rakhine), Burma (Myanmar). It is similar to Chittagonian language in neighboring Bangladesh[21] and sometimes written using the Roman script, or an Arabic-derived script known as Hanifi
  • Ishkashimi language (Ishkashimi) in Afghanistan

Southeast Asia[edit]

  • Malay in the Arabic script known as Jawi. In some cases it can be seen in the signboards of shops and market stalls. Particularly in Brunei, Jawi is used in terms of writing or reading for Islamic religious educational programs in primary school, secondary school, college, or even higher educational institutes such as universities. In addition, some television programming uses Jawi, such as announcements, advertisements, news, social programs or Islamic programs
    • co-official in Brunei
    • Malaysia but co-official in Kelantan and Kedah, Islamic states in Malaysia
    • Indonesia, Jawi script is co-used with Latin in provinces of Aceh, Riau, Riau Islands and Jambi. The Javanese, Madurese and Sundanese also use another Arabic variant, the Pegon in Islamic writings and pesantren community.
    • Southern Thailand
    • Predominantly Muslim areas of the Philippines (especially Tausug language)
    • Ida’an language (also Idahan) a Malayo-Polynesian language spoken by the Ida’an people of Sabah, Malaysia[22]
  • Cham language in Cambodia besides Western Cham script.

Africa[edit]

  • North Africa
    • Arabic
    • Berber languages have often been written in an adaptation of the Arabic alphabet. The use of the Arabic alphabet, as well as the competing Latin and Tifinagh scripts, has political connotations
    • Tuareg language, (sometimes called Tamasheq) which is also a Berber language
    • Coptic language of Egyptians as Coptic text written in Arabic letters[23]
  • Northeast Africa
    • Bedawi or Beja, mainly in northeastern Sudan
    • Wadaad writing, used in Somalia
    • Nubian languages
      • Dongolawi language or Andaandi language of Nubia, in the Nile Vale of northern Sudan
      • Nobiin language, the largest Nubian language (previously known by the geographic terms Mahas and Fadicca/Fiadicca) is not yet standardized, being written variously in both Latinized and Arabic scripts; also, there have been recent efforts to revive the Old Nubian alphabet.[24][25]
    • Fur language of Darfur, Sudan
  • Southeast Africa
    • Comorian, in the Comoros, currently side by side with the Latin alphabet (neither is official)
    • Swahili, was originally written in Arabic alphabet, Swahili orthography is now based on the Latin alphabet that was introduced by Christian missionaries and colonial administrators
  • West Africa
    • Zarma language of the Songhay family. It is the language of the southwestern lobe of the West African nation of Niger, and it is the second leading language of Niger, after Hausa, which is spoken in south central Niger[26]
    • Tadaksahak is a Songhay language spoken by the pastoralist Idaksahak of the Ménaka area of Mali[27]
    • Hausa language uses an adaptation of the Arabic script known as Ajami, for many purposes, especially religious, but including newspapers, mass mobilization posters and public information[28]
    • Dyula language is a Mandé language spoken in Burkina Faso, Côte d’Ivoire and Mali.[29]
    • Jola-Fonyi language of the Casamance region of Senegal[30]
    • Balanta language a Bak language of west Africa spoken by the Balanta people and Balanta-Ganja dialect in Senegal
    • Mandinka, widely but unofficially (known as Ajami), (another non-Latin script used is the N’Ko script)
    • Fula, especially the Pular of Guinea (known as Ajami)
    • Wolof (at zaouia schools), known as Wolofal.
  • Arabic script outside Africa
    • In writings of African American slaves
      • Writings of by Omar Ibn Said (1770–1864) of Senegal[31]
      • The Bilali Document also known as Bilali Muhammad Document is a handwritten, Arabic manuscript[32] on West African Islamic law. It was written by Bilali Mohammet in the 19th century. The document is currently housed in the library at the University of Georgia
      • Letter written by Ayuba Suleiman Diallo (1701–1773)
      • Arabic Text From 1768[33]
      • Letter written by Abdul Rahman Ibrahima Sori (1762–1829)

Former use[edit]

With the establishment of Muslim rule in the subcontinent, one or more forms of the Arabic script were incorporated among the assortment of scripts used for writing native languages.[34] In the 20th century, the Arabic script was generally replaced by the Latin alphabet in the Balkans,[dubious – discuss] parts of Sub-Saharan Africa, and Southeast Asia, while in the Soviet Union, after a brief period of Latinisation,[35] use of Cyrillic was mandated. Turkey changed to the Latin alphabet in 1928 as part of an internal Westernizing revolution. After the collapse of the Soviet Union in 1991, many of the Turkic languages of the ex-USSR attempted to follow Turkey’s lead and convert to a Turkish-style Latin alphabet. However, renewed use of the Arabic alphabet has occurred to a limited extent in Tajikistan, whose language’s close resemblance to Persian allows direct use of publications from Afghanistan and Iran.[36]

Africa[edit]

  • Afrikaans (as it was first written among the «Cape Malays», see Arabic Afrikaans)
  • Berber in North Africa, particularly Shilha in Morocco (still being considered, along with Tifinagh and Latin, for Central Atlas Tamazight)
  • French by the Arabs and Berbers in Algeria and other parts of North Africa during the French colonial period
  • Harari, by the Harari people of the Harari Region in Ethiopia. Now uses the Geʻez and Latin alphabets
  • For the West African languages—Hausa, Fula, Mandinka, Wolof and some more—the Latin alphabet has officially replaced Arabic transcriptions for use in literacy and education
  • Kinyarwanda in Rwanda
  • Kirundi in Burundi
  • Malagasy in Madagascar (script known as Sorabe)
  • Nubian
  • Shona in Zimbabwe
  • Somali (see wadaad Arabic) has mostly used the Latin alphabet since 1972
  • Songhay in West Africa, particularly in Timbuktu
  • Swahili (has used the Latin alphabet since the 19th century)
  • Yoruba in West Africa (this was probably limited, but still notable)

Europe[edit]

  • Albanian called Elifbaja shqip
  • Aljamiado (Mozarabic, Berber, Aragonese, Portuguese[citation needed], Ladino, and Spanish, during and residually after the Muslim rule in the Iberian peninsula)
  • Belarusian (among ethnic Tatars; see Belarusian Arabic alphabet)
  • Bosnian (only for literary purposes; currently written in the Latin alphabet; Text example: مۉلٖىمۉ سه ته‌بٖى بۉژه‎ = Molimo se tebi, Bože (We pray to you, O God); see Arebica)
  • Crimean Tatar
  • Greek in certain areas in Greece and Anatolia. In particular, Cappadocian Greek written in Perso-Arabic
  • Polish (among ethnic Lipka Tatars)

Central Asia and Caucasus[edit]

  • Adyghe language also known as West Circassian, is an official languages of the Republic of Adygea in the Russian Federation. It used Arabic alphabet before 1927
  • Avar as well as other languages of Daghestan: Nogai, Kumyk, Lezgian, Lak and Dargwa
  • Azeri in Azerbaijan (now written in the Latin alphabet and Cyrillic script in Azerbaijan)
  • Bashkir (officially for some years from the October Revolution of 1917 until 1928, changed to Latin, now uses the Cyrillic script)
  • Chaghatay across Central Asia
  • Chechen (sporadically from the adoption of Islam; officially from 1917 until 1928)[37]
  • Circassian and some other members of the Abkhaz–Adyghe family in the western Caucasus and sporadically – in the countries of Middle East, like Syria
  • Ingush
  • Karachay-Balkar in the central Caucasus
  • Karakalpak
  • Kazakh in Kazakhstan (until the 1930s, changed to Latin, currently using Cyrillic, phasing in Latin)
  • Kyrgyz in Kyrgyzstan (until the 1930s, changed to Latin, now uses the Cyrillic script)
  • Mandarin Chinese and Dungan, among the Hui people (script known as Xiao’erjing)
  • Ottoman Turkish
  • Tat in South-Eastern Caucasus
  • Tatar before 1928 (changed to Latin Yañalif), reformed in the 1880s (İske imlâ), 1918 (Yaña imlâ – with the omission of some letters)
  • Turkmen in Turkmenistan (changed to Latin in 1929, then to the Cyrillic script, then back to Latin in 1991)
  • Uzbek in Uzbekistan (changed to Latin, then to the Cyrillic script, then back to Latin in 1991)
  • Some Northeast Caucasian languages of the Muslim peoples of the USSR between 1918 and 1928 (many also earlier), including Chechen, Lak, etc. After 1928, their script became Latin, then later[when?] Cyrillic[citation needed]

South and Southeast Asia[edit]

  • Acehnese in Sumatra, Indonesia
  • Banjarese in Kalimantan, Indonesia
  • Bengali in Bengal, Arabic scripts have been used historically in places like Chittagong and West Bengal among other places. See Dobhashi for further information.
  • Maguindanaon in the Philippines
  • Malay in Malaysia, Singapore and Indonesia. Although Malay speakers in Brunei and Southern Thailand still use the script on a daily basis
  • Minangkabau in Sumatra, Indonesia
  • Pegon script of Javanese, Madurese and Sundanese in Indonesia, used only in Islamic schools and institutions
  • Tausug in the Philippines, Malaysia, and Indonesia it can be used in Islamic schools in the Philippines
  • Maranao in the Philippines
  • Rakhine in Burma and Bangladesh
  • Mongolian in Afghanistan There is also a language in the Mongolic family that spoken in the Afghanistan it is called Mogholi language
  • Tagalog in the Philippines
  • Yakan in Basilan
  • Aslian in Malaysia
  • Ternate in Indonesia by the Muslims
  • Tidore in Indonesia
  • Meitei in Bangladesh
  • Shughni in Afghanistan
  • Thai in Malaysia
  • Sylheti in Arakan, Bengal, Chittagong, and Tripura
  • Kedah Malay in Myanmar, Malaysia, and Thailand
  • Uab Meto in Indonesia
  • Molbog in Sabah used by the Muslims even though in Palawan
  • Bonggi in Sabah by the Muslims
  • Kadazan in Malaysia is a Muslim language
  • Dusun used in Brunei, and Malaysia
  • Sama used in Philippines, Malaysia, and Indonesia
  • Bajau is in Philippines, Malaysia, and Indonesia
  • Sarawak Bisaya used in Malaysia, and Brunei
  • Sabah Bisaya is used in Sabah
  • Lotud spoken in Malaysia only
  • Lun Bawang in Sarawak, Sabah, Temburong and Kalimantan
  • Tiruray in the Bangsamoro
  • Chavacano in Cotabato, Zamboanga Peninsula, Sulu, Basilan, Tawi-Tawi, Sabah, and Kalimantan
  • Maranao has Arabic script in Lanao del Sur,Lanao del Norte, and Sabah
  • Iranun used in Islamic schools in Mindanao,and Malaysia

Middle East[edit]

  • Hebrew was written in Arabic letters in a number of places in the past[38][39]
  • Northern Kurdish in Turkey and Syria was written in Arabic script until 1932, when a modified Kurdish Latin alphabet was introduced by Jaladat Ali Badirkhan in Syria
  • Turkish in the Ottoman Empire was written in Arabic script until Mustafa Kemal Atatürk declared the change to Latin script in 1928. This form of Turkish is now known as Ottoman Turkish and is held by many to be a different language, due to its much higher percentage of Persian and Arabic loanwords (Ottoman Turkish alphabet)

Unicode[edit]

As of Unicode 15.0, the following ranges encode Arabic characters:

  • Arabic (0600–06FF)
  • Arabic Supplement (0750–077F)
  • Arabic Extended-A (08A0–08FF)
  • Arabic Extended-B (0870–089F)
  • Arabic Extended-C (10EC0–10EFF)
  • Arabic Presentation Forms-A (FB50–FDFF)
  • Arabic Presentation Forms-B (FE70–FEFF)
  • Arabic Mathematical Alphabetic Symbols (1EE00–1EEFF)
  • Rumi Numeral Symbols (10E60–10E7F)
  • Indic Siyaq Numbers (1EC70–1ECBF)
  • Ottoman Siyaq Numbers (1ED00–1ED4F)

Additional letters used in other languages[edit]

Assignment of phonemes to graphemes[edit]

∅ = phoneme absent from language

Language family Austron. Dravid Turkic Indic Iranian Germanic Arabic
Language/script Jawi Pegon Arwi Ottoman Uyghur Tatars Sindhi Punjabi Urdu Persian Balochi Kurdish Pashto Afrikaans Moroccan Tunisian Algerian Egyptian Najdi Hejazi Levantine Iraqi Gulf
/p/ ڤ ڣ پ پ‎ / ب
/g/ ݢ ؼ گ ګ گ ڭ‎ / گ ڨ‎ / ڧـ ـڧـ ـٯ‎ / ق ج ق ك‎ / ج گ‎ / ك ق / گ
/t͡ʃ/ چ چ ڜ تش چ
/v/ ۏ ف و ۋ و ڤ ڤ ڥ‎ / ڢ‎ / ف ڤ‎ / ف
/ʒ/ ژ ژ ج چ‎ / ج ج
/ŋ/ ڠ ڭ ڱ ن٘ ڠ
/ɳ/ ڹ ڻ ݨ ن ڼ
/ɲ/ ڽ ۑ ݧ ڃ نج
Table of additional letters in other languages

Letter or Digraph [A] Use & Pronunciation Unicode i’jam & other additions Shape Similar Arabic Letter(s)
U+ [B] [C] above below
پ پـ ـپـ ـپ Pe, used to represent the phoneme /p/ in Persian, Pashto, Punjabi, Khowar, Sindhi, Urdu, Kurdish, Kashmiri; it is can be used in Arabic to describe the phoneme /p/ otherwise it is normalized to /b/ ب e.g. پول Paul also written بول U+067E none 3 dots ٮ ب
ݐ ݐـ ـݐـ ـݐ used to represent the equivalent of the Latin letter Ƴ (palatalized glottal stop /ʔʲ/) in some African languages such as Fulfulde. U+0750   ﮳﮳﮳ ‎  none 3 dots
(horizontal)
ٮ ب
ٻ ٻـ ـٻـ ـٻ B̤ē, used to represent a voiced bilabial implosive /ɓ/ in Hausa, Sindhi and Saraiki. U+067B none 2 dots
(vertically)
ٮ ب
ڀ ڀـ ـڀـ ـڀ represents an aspirated voiced bilabial plosive /bʱ/ in Sindhi. U+0680 none 4 dots ٮ ب
ٺ ٺـ ـٺـ ـٺ Ṭhē, represents the aspirated voiceless retroflex plosive /ʈʰ/ in Sindhi. U+067A 2 dots
(vertically)
none ٮ ت
ټ ټـ ـټـ ـټ Ṭē, used to represent the phoneme /ʈ/ in Pashto. U+067C ﮿ 2 dots ring ٮ ت
ٽ ٽـ ـٽـ ـٽ Ṭe, used to represent the phoneme (a voiceless retroflex plosive /ʈ/) in Sindhi U+067D 3 dots
(inverted)
none ٮ ت
ٹـ ـٹـ ـٹ Ṭe, used to represent Ṭ (a voiceless retroflex plosive /ʈ/) in Punjabi, Kashmiri, Urdu. U+0679 ◌ؕ small
ط
none ٮ ت
ٿ ٿـ ـٿـ ـٿ Teheh, used in Sindhi and Rajasthani (when written in Sindhi alphabet); used to represent the phoneme /t͡ɕʰ/ (pinyin q) in Chinese Xiao’erjing. U+067F 4 dots none ٮ ت
ڄ ڄـ ـڄـ ـڄ represents the «c» voiceless dental affricate /t͡s/ phoneme in Bosnian. U+0684 none 2 dots
(vertically)
ح ج
ڃ ڃـ ـڃـ ـڃ represents the «ć» voiceless alveolo-palatal affricate /t͡ɕ/ phoneme in Bosnian. U+0683 none 2 dots ح ح ج
چ چـ ـچـ ـچ Che, used to represent /t͡ʃ/ («ch»). It is used in Persian, Pashto, Punjabi, Urdu, Kashmiri and Kurdish. /ʒ/ in Egypt. U+0686 none 3 dots ح ج
څ څـ ـڅـ ـڅ Ce, used to represent the phoneme /t͡s/ in Pashto. U+0685 3 dots none ح ج خ ح
ݗ ݗـ ـݗـ ـݗ represents the «đ» voiced alveolo-palatal affricate /d͡ʑ/ phoneme in Bosnian. U+0757 2 dots none ح ح
ځ ځـ ـځـ ـځ Źim, used to represent the phoneme /d͡z/ in Pashto. U+0681 ◌ٔ Hamza none ح ج خ ح
ݙ ݙ ـݙ used in Saraiki to represent a Voiced alveolar implosive /ɗ̢/. U+0759 small
ط
2 dots
(vertically)
د د
ڊ ڊ ـڊ used in Saraiki to represent a voiced retroflex implosive /ᶑ/. U+068A none 1 dot د د
ڈ ڈ ـڈ Ḍal, used to represent a Ḍ (a voiced retroflex plosive /ɖ/) in Punjabi, Kashmiri and Urdu. U+0688 ◌ؕ small ط none د د
ڌ ڌ ـڌ Dhal, used to represent the phoneme /d̪ʱ/ in Sindhi U+068C 2 dots none د د
ډ ډ ـډ Ḍal, used to represent the phoneme /ɖ/ in Pashto. U+0689 ﮿ none ring د د
ڑ ڑ ـڑ Ṛe, represents a retroflex flap /ɽ/ in Punjabi and Urdu. U+0691 ◌ؕ small ط none ر ر
ړ ړ ـړ Ṛe, used to represent a retroflex lateral flap in Pashto. U+0693 ﮿ none ring ر ر
ݫ ݫ ـݫ used in Ormuri to represent a voiced alveolo-palatal fricative /ʑ/, as well as in Torwali. U+076B 2 dots
(vertically)
none ر ر
ژ ژ ـژ Že / zhe, used to represent the voiced postalveolar fricative /ʒ/ in, Persian, Pashto, Kurdish, Urdu, Punjabi and Uyghur. U+0698 3 dots none ر ز
ږ ږ ـږ Ǵe / ẓ̌e, used to represent the phoneme /ʐ/ /ɡ/ /ʝ/ in Pashto. U+0696 1 dot 1 dot ر ز
ڕ ڕ ـڕ used in Kurdish to represent rr /r/ in Soranî dialect. U+0695 ٚ none V pointing down ر ر
ݭ ݭـ ـݭـ ـݭ used in Kalami to represent a voiceless retroflex fricative /ʂ/, and in Ormuri to represent a voiceless alveolo-palatal fricative /ɕ/. U+076D 2 dots vertically none س س
ݜ ݜـ ـݜـ ـݜ used in Shina to represent a voiceless retroflex fricative /ʂ/. U+075C 4 dots none س ش س
ښ ښـ ـښـ ـښ X̌īn / ṣ̌īn, used to represent the phoneme /x/ /ʂ/ /ç/ in Pashto. U+069A 1 dot 1 dot س ش س
ڜ ڜـ ـڜـ ـڜ Unofficially used to represent Spanish words with /t͡ʃ/ in Morocco. U+069C 3 dots 3 dots س ش س
ڨ ڨـ ـڨـ ـڨ Ga, used to represent the voiced velar plosive /ɡ/ in Algerian and Tunisian. U+06A8 3 dots none ٯ ق
گ گـ ـگـ ـگ Gaf, represents a voiced velar plosive /ɡ/ in Persian, Pashto, Punjabi, Kyrgyz, Kazakh, Kurdish, Uyghur, Mesopotamian, Urdu and Ottoman Turkish. U+06AF line horizontal line none گ ك
ګ ګـ ـګـ ـګ Gaf, used to represent the phoneme /ɡ/ in Pashto. U+06AB ﮿ ring none ک ك
ݢ ݢـ ـݢـ ـݢ Gaf, represents a voiced velar plosive /ɡ/ in the Jawi script of Malay. U+0762 1 dot none ک ك
ڬ ڬـ ـڬـ ـڬ U+06AC 1 dot none ك ك
ؼ ؼـ ـؼـ ـؼ Gaf, represents a voiced velar plosive /ɡ/ in the Pegon script of Indonesian. U+08B4 none 1 dot ك ك
ڭ ڭـ ـڭـ ـڭ Ng, used to represent the /ŋ/ phone in Ottoman Turkish, Kazakh, Kyrgyz, and Uyghur, and to unofficially represent the /ɡ/ in Morocco and in many dialects of Algerian. U+06AD 3 dots none ك ك
أي أيـ ـأيـ ـأي Ee, used to represent the phoneme /eː/ in Somali. U+0623 U+064A ◌ٔ Hamza 2 dots اى أ + ي
ئ ئـ ـئـ ـئ E, used to represent the phoneme /e/ in Somali. U+0626 ◌ٔ Hamza none ى ي ی
ىٓ ىٓـ ـىٓـ ـىٓ Ii, used to represent the phoneme /iː/ in Somali and Saraiki. U+0649 U+0653 ◌ٓ Madda none ى ي
ؤ ؤ ـؤ O, used to represent the phoneme /o/ in Somali. U+0624 ◌ٔ Hamza none و ؤ
ۅ ۅ ـۅ Ö, used to represent the phoneme /ø/ in Kyrgyz. U+0624 ◌̵ Strikethrough[D] none و و
ې ېـ ـېـ ـې Pasta Ye, used to represent the phoneme /e/ in Pashto and Uyghur. U+06D0 none 2 dots vertical ى ي
ی یـ ـیـ ـی Nārīna Ye, used to represent the phoneme [ɑj] and phoneme /j/ in Pashto. U+06CC 2 dots
(start + mid)
none ى ي
ۍ ـۍ end
only
X̌əźīna ye Ye, used to represent the phoneme [əi] in Pashto. U+06CD line horizontal
line
none ى ي
ئ ئـ ـئـ ـئ Fāiliya Ye, used to represent the phoneme [əi] and /j/ in Pashto, Punjabi, Saraiki and Urdu U+0626 ◌ٔ Hamza none ى ي ى
أو أو ـأو Oo, used to represent the phoneme /oː/ in Somali. U+0623 U+0648 ◌ٔ Hamza none او أ + و
ﻭٓ ﻭٓ ـﻭٓ Uu, used to represent the phoneme /uː/ in Somali. ‎ + ◌ٓ‎ U+0648 U+0653 ◌ٓ Madda none و + ◌ٓ
ڳ ڳـ ـڳـ ـڳ represents a voiced velar implosive /ɠ/ in Sindhi and Saraiki U+06B1 horizontal
line
2 dots گ ك
ڱ ڱـ ـڱـ ـڱ represents the Velar nasal /ŋ/ phoneme in Sindhi. U+06B1 2 dots + horizontal
line
none گ ك
ک کـ ـکـ ـک Khē, represents /kʰ/ in Sindhi. U+06A9 none none none ک ك
ڪ ڪـ ـڪـ ـڪ «Swash kāf» is a stylistic variant of ك ‎ in Arabic, but represents un- aspirated /k/ in Sindhi. U+06AA none none none ڪ ك or ڪ
ݣ ݣـ ـݣـ ـݣ used to represent the phoneme /ŋ/ (pinyin ng) in Chinese. U+0763 none 3 dots ک ك
ڼ ڼـ ـڼـ ـڼ represents the retroflex nasal /ɳ/ phoneme in Pashto. U+06BC ں ﮿ 1 dot ring ن
ڻ ڻـ ـڻـ ـڻ represents the retroflex nasal /ɳ/ phoneme in Sindhi. U+06BB ◌ؕ small ط none ں ن
ݨ ݨـ ـݨـ ـݨ used in Punjabi to represent /ɳ/ and Saraiki to represent /ɲ/. U+0768 1 dot + small ط none ں ن
ڽ ڽـ ـڽـ ـڽ Nya /ɲ/ in the Jawi script. U+06BD 3 dots none ں ن
ۑ ۑـ ـۑـ ـۑ Nya /ɲ/ in the Pegon script. U+06D1 none 3 dots ى ى
ڠ ڠـ ـڠـ ـڠ Nga /ŋ/ in the Jawi script and Pegon script. U+06A0 3 dots none ع غ
ݪ ݪـ ـݪـ ـݪ used in Marwari to represent a retroflex lateral flap /ɺ̢/, and in Kalami to represent a voiceless lateral fricative /ɬ/. U+076A line horizontal
line
none ل ل
ࣇ‍ ‍ࣇ‍ ‍ࣇ — or alternately typeset as لؕ ‎ — is used in Punjabi to represent voiced retroflex lateral approximant /ɭ/[40] U+08C7 ◌ؕ small ط none ل ل
لؕ لؕـ ـلؕـ ـلؕ U+0644 U+0615
ڥ ڥـ ـڥـ ـڥ Vi, used in Algerian Arabic and Tunisian Arabic when written in Arabic script to represent the sound /v/ (unofficial). U+06A5 none 3 dots ڡ ف
ڤ ڤـ ـڤـ ـڤ Ve, used in by some Arabic speakers to represent the phoneme /v/ in loanwords, and in the Kurdish language when written in Arabic script to represent the sound /v/. Also used as pa /p/ in the Jawi script and Pegon script. U+06A4 3 dots none ڡ ف
ۏ ۏ ـۏ Va in the Jawi script. U+06CF 1 dot none و و
ۋ ۋ ـۋ represents a voiced labiodental fricative /v/ in Kyrgyz, Uyghur, and Old Tatar; and /w, ʊw, ʉw/ in Kazakh; also formerly used in Nogai. U+06CB 3 dots none و و
ۆ ۆ ـۆ represents «O» /o/ in Kurdish, and in Uyghur it represents the sound similar to the French eu and œu /ø/ sound. It represents the «у» close back rounded vowel /u/ phoneme in Bosnian. U+06C6 ◌ٚ V pointing down none و و
ۇ ۇ ـۇ U, used to represents the Close back rounded vowel /u/ phoneme in Azerbaijani, Kazakh, Kyrgyz and Uyghur. U+06C7 ◌ُ Damma[E] none و و
ێ ێـ ـێـ ـێ represents Ê or É /e/ in Kurdish. U+06CE ◌ٚ V pointing down 2 dots
(start + mid)
ى ي
ھ
ھ
ھـ ـھـ ـھ
ھھھ
Do-chashmi he (two-eyed hāʼ), used in digraphs for aspiration /ʰ/ and breathy voice /ʱ/ in Punjabi and Urdu. Also used to represent /h/ in Kazakh, Sorani and Uyghur.[F] U+06BE none none none ھ ه
ە ە ـە Ae, used represent /æ/ and /ɛ/ in Kazakh, Sorani and Uyghur. U+06D5 none none none ھ إ
ے ـے end
only
Baṛī ye (‘big yāʼ’), is a stylistic variant of ي in Arabic, but represents «ai» or «e» /ɛː/, /eː/ in Urdu and Punjabi. U+06D2 none none none ے ي
ڞ ڞـ ـڞـ ـڞ used to represent the phoneme /tsʰ/ (pinyin c) in Chinese. U+069E 3 dots none ص ص ض
ط طـ ـطـ ـط used to represent the phoneme /t͡s/ (pinyin z) in Chinese. U+0637 ط ط
ۉ ۉ ـۉ represents the «o» open-mid back rounded vowel /ɔ/ phoneme in Bosnian. U+06C9 ◌ٛ V pointing up none و و
ݩ ݩـ ـݩـ ـݩ represents the «nj» palatal nasal /ɲ/ phoneme in Bosnian. U+0769 ◌ٚ 1 dot
V pointing down
none ں ن
ڵ ڵـ ـڵـ ـڵ used in Kurdish to represent ll /ɫ/ in Soranî dialect. U+06B5 ◌ٚ V pointing down none ل ل
ڵ ڵـ ـڵـ ـڵ represents the «lj» palatal lateral approximant /ʎ/ phoneme in Bosnian. U+06B5 ◌ٚ V pointing down none ل ل
اٖى اٖىـ ـاٖىـ ـاٖى represents the «i» close front unrounded vowel /i/ phoneme in Bosnian. U+0627 U+0656 U+0649 ◌ٖ Alef none اى اٖ  +  ى
Footnotes:
  1. ^ From right: start, middle, end, and isolated forms.
  2. ^ Joined to the letter, closest to the letter, on the first letter, or above.
  3. ^ Further away from the letter, or on the second letter, or below.
  4. ^ A variant that end up with loop also exists.
  5. ^ Although the letter also known as Waw with Damma, some publications and fonts features filled Damma that looks similar to comma.
  6. ^ Shown in Naskh (top) and Nastaliq (bottom) styles. The Nastaliq version of the connected forms are connected to each other, because the tatweel character U+0640 used to show the other forms does not work in many Nastaliq fonts.

Letter construction[edit]

Most languages that use alphabets based on the Arabic alphabet use the same base shapes. Most additional letters in languages that use alphabets based on the Arabic alphabet are built by adding (or removing) diacritics to existing Arabic letters. Some stylistic variants in Arabic have distinct meanings in other languages. For example, variant forms of kāf ك ک ڪ ‎ are used in some languages and sometimes have specific usages. In Urdu and some neighbouring languages, the letter Hā has diverged into two forms ھ dō-čašmī hē and ہ ہـ ـہـ ـہ gōl hē.[41] While a variant form of ي referred to as baṛī yē ے ‎ is used at the end of some words.[41]

Table of Letter Components[edit]

See also[edit]

  • Arabic (Unicode block)
  • Eastern Arabic numerals (digit shapes commonly used with Arabic script)
  • History of the Arabic alphabet
  • Transliteration of Arabic
  • Xiao’erjing

References[edit]

  1. ^ «Arabic Alphabet». Encyclopædia Britannica online. Archived from the original on 26 April 2015. Retrieved 2015-05-16.
  2. ^ Mahinnaz Mirdehghan. 2010. Persian, Urdu, and Pashto: A comparative orthographic analysis. Writing Systems Research Vol. 2, No. 1, 9–23.
  3. ^ «Exposición Virtual. Biblioteca Nacional de España». Bne.es. Archived from the original on 2012-02-18. Retrieved 2012-04-06.
  4. ^ Ahmad, Syed Barakat. (11 January 2013). Introduction to Qur’anic script. ISBN 978-1-136-11138-9. OCLC 1124340016.
  5. ^ Gruendler, Beatrice (1993). The Development of the Arabic Scripts: From the Nabatean Era to the First Islamic Century According to Dated Texts. Scholars Press. p. 1. ISBN 9781555407100.
  6. ^ Healey, John F.; Smith, G. Rex (2012-02-13). «II — The Origin of the Arabic Alphabet». A Brief Introduction to The Arabic Alphabet. Saqi. ISBN 9780863568817.
  7. ^ Senner, Wayne M. (1991). The Origins of Writing. U of Nebraska Press. p. 100. ISBN 0803291671.
  8. ^ «Nabataean abjad». www.omniglot.com. Retrieved 2017-03-08.
  9. ^ Naveh, Joseph. «Nabatean Language, Script and Inscriptions» (PDF).
  10. ^ Taylor, Jane (2001). Petra and the Lost Kingdom of the Nabataeans. I.B.Tauris. p. 152. ISBN 9781860645082.
  11. ^ «Zribi, I., Boujelbane, R., Masmoudi, A., Ellouze, M., Belguith, L., & Habash, N. (2014). A Conventional Orthography for Tunisian Arabic. In Proceedings of the Language Resources and Evaluation Conference (LREC), Reykjavík, Iceland».
  12. ^ Brustad, K. (2000). The syntax of spoken Arabic: A comparative study of Moroccan, Egyptian, Syrian, and Kuwaiti dialects. Georgetown University Press.
  13. ^ «Sayad Zahoor Shah Hashmii». baask.com.
  14. ^ Sarlak, Riz̤ā (2002). «Dictionary of the Bakhtiari dialect of Chahar-lang». google.com.eg.
  15. ^ Iran, Mojdeh (5 February 2011). «Bakhtiari Language Video (bak) بختياري ها! خبری مهم» – via Vimeo.
  16. ^ «Ethnologue». Retrieved Feb 1, 2020.
  17. ^ «Pakistan should mind all of its languages!». tribune.com.pk. June 2011.
  18. ^ «Ethnologue». Retrieved Feb 1, 2020.
  19. ^ «Ethnologue». Retrieved Feb 1, 2020.
  20. ^ «The Bible in Brahui». Worldscriptures.org. Archived from the original on October 30, 2016. Retrieved August 5, 2013.
  21. ^ «Rohingya Language Book A-Z». Scribd.
  22. ^ «Ida’an». scriptsource.org.
  23. ^ «The Coptic Studies’ Corner». stshenouda.com. Archived from the original on 2012-04-19. Retrieved 2012-04-17.
  24. ^ «—The Cradle of Nubian Civilisation—«. thenubian.net.
  25. ^ «2 » AlNuba egypt». 19 July 2012. Archived from the original on 19 July 2012.
  26. ^ «Zarma». scriptsource.org.
  27. ^ «Tadaksahak». scriptsource.org.
  28. ^ «Lost Language — Bostonia Summer 2009». bu.edu.
  29. ^ «Dyula». scriptsource.org.
  30. ^ «Jola-Fonyi». scriptsource.org.
  31. ^ «Ibn Sayyid manuscript». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
  32. ^ «Muhammad Arabic letter». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
  33. ^ «Charno Letter». Muslims In America. Archived from the original on May 20, 2013. Retrieved August 5, 2013.
  34. ^ Asani, Ali S. (2002). Ecstasy and enlightenment : the Ismaili devotional literature of South Asia. Institute of Ismaili Studies. London: I.B. Tauris. p. 124. ISBN 1-86064-758-8. OCLC 48193876.
  35. ^ Alphabet Transitions – The Latin Script: A New Chronology – Symbol of a New Azerbaijan Archived 2007-04-03 at the Wayback Machine, by Tamam Bayatly
  36. ^ Sukhail Siddikzoda. «Tajik Language: Farsi or Not Farsi?» (PDF). Archived from the original (PDF) on June 13, 2006.
  37. ^ «Brief history of writing in Chechen». Archived from the original on December 23, 2008.
  38. ^ p. 20, Samuel Noel Kramer. 1986. In the World of Sumer: An Autobiography. Detroit: Wayne State University Press.
  39. ^ J. Blau. 2000. Hebrew written in Arabic characters: An instance of radical change in tradition. (In Hebrew, with English summary). In Heritage and Innovation in Judaeo-Arabic Culture: Proceedings of the Sixth Conference of the Society For Judaeo-Arabic Studies, p. 27-31. Ramat Gan.
  40. ^ Lorna Priest Evans; M. G. Abbas Malik. «Proposal to encode ARABIC LETTER LAM WITH SMALL ARABIC LETTER TAH ABOVE in the UCS» (PDF). www.unicode.org. Retrieved 10 May 2020.
  41. ^ a b «Urdu Alphabet». www.user.uni-hannover.de. Archived from the original on 11 September 2019. Retrieved 4 May 2020.

External links[edit]

  • Unicode collation charts—including Arabic letters, sorted by shape
  • Why the right side of your brain doesn’t like Arabic
  • Arabic fonts by SIL’s Non-Roman Script Initiative
  • Alexis Neme and Sébastien Paumier (2019), «Restoring Arabic vowels through omission-tolerant dictionary lookup», Lang Resources & Evaluation, Vol. 53, pp. 1–65. arXiv:1905.04051; doi:10.1007/s10579-019-09464-6

Арабский алфавит

Арабский алфавит, арабское письмо, арабица — алфавит, используемый для записи арабского языка и (чаще всего в модифицированном виде) некоторых других языков, в частности фарси, пушту, урду и некоторых тюркских языков. Состоит из 28 букв и используется для письма справа налево. По-арабски называется хуруф (حُرُوف [ḥurūf]— мн.ч. от حَرْف [ḥar̊f]).

Каждая из 28 букв, кроме буквы алиф, обозначает один согласный. Буквы алиф, вав и йа также используются для обозначения долгих гласных: алиф — для обозначения долгого «а», вав — для обозначения долгого «у», йа — для обозначения долгого «и». Начертание букв меняется в зависимости от расположения внутри слова (в начале, в конце или в середине). Заглавных букв нет. Все буквы одного слова пишутся слитно, за исключением шести букв (алиф, даль, заль, ра, зайн, вав), которые не соединяются со следующей буквой.

# в конце в середине в начале отдельно название транскрипция числовое значение
1 ـا ا أَلِف‎

[ạảlif‎]

алиф

[ạ]

1
2 ـب ـبـ بـ ب بَاء‎

[bāʾ‎]

ба

[b]

2
3 ـت ـتـ تـ ت تَاء‎

[tāʾ‎]

та

[t]

400
4 ـث ـثـ ثـ ث ثَاء‎

[tẖāʾ‎]

са

[tẖ]

500
5 ـج ـجـ جـ ج جِيم‎

[jīm‎]

джим

[j]

3
6 ـح ـحـ حـ ح حَاء‎

[ḥāʾ‎]

ха

[ḥ]

8
7 ـخ ـخـ خـ خ خَاء‎

[kẖāʾ‎]

ха

[kẖ]

600
8 ـد د دَال‎

[dāl‎]

даль

[d]

4
9 ـذ ذ ذَال‎

[dẖāl‎]

заль

[dẖ]

700
10 ـر ر رَاء‎

[rāʾ‎]

ра

[r]

200
11 ـز ز زَاى

[zāy̱]

зайн

[z]

7
12 ـس ـسـ سـ س سِين‎

[sīn‎]

син

[s]

60
13 ـش ـشـ شـ ش شِين‎

[sẖīn‎]

шин

[sẖ]

300
14 ـص ـصـ صـ ص صَاد‎

[ṣād‎]

сад

[ṣ]

90
15 ـض ـضـ ضـ ض ضَاد‎

[ḍād‎]

дад

[ḍ]

800
16 ـط ـطـ طـ ط طَاء‎

[ṭāʾ‎]

та

[ṭ]

9
17 ـظ ـظـ ظـ ظ ظَاء‎

[ẓāʾ‎]

за

[ẓ]

900
18 ـع ـعـ عـ ع عَيْن‎

[ʿaẙn‎]

ʿайн

[ʿ]

70
19 ـغ ـغـ غـ غ غَيْن‎

[gẖaẙn‎]

гайн

[gẖ]

1000
20 ـف ـفـ فـ ف فَاء‎

[fāʾ‎]

фа

[f]

80
21 ـق ـقـ قـ ق قَاف‎

[qāf‎]

каф

[q]

100
22 ـك ـكـ كـ ك كَاف‎

[kāf‎]

кяф

[k]

20
23 ـل ـلـ لـ ل لاَم‎

[lạam‎]

лям

[l]

30
24 ـم ـمـ مـ م مِيم‎

[mīm‎]

мим

[m]

40
25 ـن ـنـ نـ ن نُون‎

[nūn‎]

нун

[n]

50
26 ـه ـهـ هـ ه هَاء‎

[hāʾ‎]

ха

[h]

5
27 ـو و وَاو‎

[wāw‎]

вав

[w]

6
28 ـي ـيـ يـ ي يَاء‎

[yāʾ‎]

йа

[y]

10

Абджад

До перехода к индийским цифрам для обозначения чисел использовались буквы, и до сих пор они могут использоваться в качестве цифр при нумерации абзацев или параграфов текста. Счетный алфавит, в котором буквы следуют в порядке возрастания числового значения, называется абджад или абджадийа (أَبْجَدِيَّة [ạảb̊jadīãẗ]) — по первому слову мнемической фразы для запоминания порядка следования букв.

Дополнительные знаки

Кроме этих 28 букв в арабском письме используются еще три дополнительных знака, не являющихся самостоятельными буквами:

# в конце в середине в начале отдельно название транскрипция
1 هَمْزَة‎

[ham̊zaẗ‎]

хамза

[ʾ]

[ạ̉]

[ạ̹]

ـﺆ

[w̉]

ـﺌـ

[ỷ]

2 تَاء مَرْبُوطَة

[tāʾ mar̊būṭaẗ]

та марбута

[ẗ] / [h]

3 أَلِف مَقْصُورَة‎

[ạảlif maq̊ṣūraẗ‎]

алиф максура

[y̱] / [a]

  1. Хамза (гортанная смычка) может писаться как отдельная буква, либо на букве-«подставке» (алиф, вав или йа). Способ написания хамзы определяется её контекстом в соответствии с рядом орфографических правил. Вне зависимости от способа написания, хамза всегда обозначает одинаковый звук.
  2. Та-марбута («завязанная та») является формой буквы та, хотя графически является буквой ха с двумя точками сверху. Служит для обозначения женского рода. Она пишется только в конце слова и только после огласовки фатха. Когда у буквы та-марбута нет огласовки (например, в конце фразы), она читается как буква ха, в остальных случаях — как т. Обычная форма буквы та называется та мафтуха (تاء مفتوحة‎‎, «открытая та»).
  3. Алиф-максура («укороченный алиф») является формой буквы алиф. Она пишется только в конце слова и сокращается до краткого звука а перед алиф-васла следующего слова (в частности, перед приставкой «аль»). Обычная форма буквы алиф называется алиф мамдуда (ألف ممدودة, «удлиненный алиф»).

Огласовки

Огласовки, харака, харакат (حَرَكَات [ḥarakāt] — мн.ч. от حَرَكَة [ḥarakaẗ‎‎]) — система надстрочных и подстрочных диакритических знаков, используемых в арабском письме для обозначения кратких гласных звуков и других особенностей произношения слова, не отображаемых буквами. Обычно в текстах огласовки не проставляются. Исключением являются Коран, случаи, когда это необходимо для различения смысла, детские и учебные книги, словари и т. д.

Гласные

Когда за согласным звуком следует гласный (краткий или долгий), над/под согласным ставится знак-огласовка, соответствующая следующему гласному. Если этот гласный долгий, то он дополнительно обозначается буквой алиф, вав или йа (т.н. харф мад — буква удлинения). Если после согласного звука нет гласного (перед следующим согласным либо в конце слова), то над ним ставится огласовка сукун.

  • Фатха (فَتْحَة [fat̊ḥaẗ]) — черта над буквой, условно обозначает звук «а»: َ
  • Дамма (ضَمَّة [ḍamãẗ]) — крючок над буквой, условно обозначает звук «у»: ُ
  • Кясра (كَسْرَة [kas̊raẗ]) — черта под буквой, условно обозначает звук «и»: ِ
  • Сукун (سُكُون [sukūn]) — кружок над буквой, обозначает отсутствие гласной: ْ

Русские обозначения звуков «а, и, у» условны, т.к. соответствующие огласовки могут также обозначать звуки «э», «о», или «ы».

Шадда

ّ — шадда (شَدَّة [sẖadãẗ]), или ташдид, представляет собой W-образный знак над буквой и обозначает удвоение буквы. Она ставится в двух случаях: для обозначения удвоенного согласного (то есть сочетания вида X-сукун-X), либо в сочетаниях из долгой гласной и согласной, обозначаемых одной и той же буквой (таких сочетаний два: ӣй и ӯв). Огласовка удвоенного согласного фатхой или даммой изображается над шаддой, кясрой — под буквой или под шаддой

Мадда

ٓ — мадда (مَدَّة [madãẗ]), представляет собой волнистую линию над буквой алиф и обозначает комбинацию хамза-алиф либо хамза-хамза, когда по правилам написания хамзы она пишется с подставкой алиф. Правила арабской орфографии запрещают следование в одном слове двух букв алиф подряд, поэтому в случаях, когда возникает такая комбинация букв, она заменяется буквой алиф-мадда.

Васла

Васла (وَصْلَة [waṣ̊laẗ]) представляет собой знак, похожий на букву сад. Ставится над алифом в начале слова (ٱ) и обозначает, что этот алиф не произносится, если предыдущее слово заканчивалось на гласный звук. Буква алиф-васла встречается в небольшом количестве слов, а также в приставке «аль» (ال).

Танвин

Танвин (تَنْوِين [tan̊wīn]) — удвоение в конце слова одной из трёх огласовок: ً    или ٌ    или ٍ   . Образует падежное окончание, обозначающее неопределённое состояние.

Надстрочный алиф

ٰ — знак в форме буквы алиф над текстом, обозначает долгий звук а̄ в словах, где обычный алиф не пишется по орфографической традиции. Сюда относятся в основном имена собственные, а также несколько указательных местоимений. При полной огласовке надстрочный алиф ставится также над буквой алиф-максура, чтобы показать, что она читается как долгий а̄. Надстрочный алиф — очень редкий знак, и кроме как в Коране, он обычно не употребляется. В Коране же надстрочный алиф встречается иногда даже в тех словах, в которых по правилам пишется обычный алиф.

Цифры

В большинстве арабских стран используются индо-арабские цифры, которые сильно отличаются от известных нам арабских цифр. При этом цифры в числе пишутся, как и у нас, слева направо.

Арабские цифры 0 1 2 3 4 5 6 7 8 9
Индо-арабские цифры ٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩

Арабский язык

Арабский язык является в настоящее время наиболее распространенным из группы семитических языков и принадлежит к южной ее ветви. Пика своего совершенства арабский язык достиг с ниспосланием заключительного Божественного Писания, Священного Корана, перед красотой и величием которого преклонялись многие знатоки слова того времени. Всевышний Господь оповещает:

«Мы низвели его Кораном на арабском языке, в котором нет ни малейшего изъяна. Быть может, в сердцах людей пробудится набожность пред Богом» (см.: Св. Коран, 39:28).

Современный литературный арабский язык, ставший результатом постепенного развития классического арабского языка, распространен во многих странах мира, общая численность населения которых превышает 100 млн. человек.

Наряду с литературным арабским языком, являющимся единым и общим государственным языком во всех арабских странах, существуют также местные арабские диалекты. В противоположность литературному языку, объединяющему не только всех арабов, но и образованных мусульман мира, диалекты и говоры имеют узкоместное, территориальное значение.

В фонетическом отношении литературный арабский язык характеризуется обширной системой согласных фонем, в особенности гортанных, эмфатических и межзубных. Гласных фонем в нем шесть: три кратких и три долгих.

В грамматическом отношении арабский язык, как и другие семитические языки, характеризуется значительным развитием флективности и относится к группе флективных языков. В основе каждой грамматической формы лежит трехсогласный (реже четырехсогласный) корень. Формообразование слов происходит в основном за счет внутреннего структурного изменения слова.

Арабское письмо

Арабский алфавит состоит из 28 букв, отображающих на письме только согласные звуки. Специальных букв для написания гласных звуков в арабском письме нет. Но ввиду того что в арабском языке различаются краткие и долгие гласные, некоторые буквы, служащие для начертания согласных звуков, используются для передачи на письме долгих гласных. Краткие гласные передаются на письме с помощью огласовок.

Таким образом, система арабского письма основана на письменном изображении лишь согласных звуков, а гласные, входящие в состав слова, восполняются читающим в процессе чтения в зависимости от значения слова и его роли в предложении.

Буквы арабского алфавита характеризуются тем, что каждая из них имеет, в зависимости от её позиции в слове, несколько начертаний: самостоятельное, начальное, срединное и конечное. Характер написания буквы зависит от того, соединяется ли она с обеих сторон с частями данного слова или только справа.

Из 28 букв алфавита 22 соединяются с обеих сторон и имеют четыре формы написания, а 6 остальных – только справа, имея при этом лишь две формы написания.

По характеру написания основных элементов большинство букв арабского алфавита можно объединить в несколько групп. Буквы одной и той же группы имеют одинаковый начертательный «скелет» и отличаются друг от друга лишь наличием и местоположением так называемых диакритических точек. Буквы либо не имеют точек вообще, либо имеют одну, две или три точки, которые могут стоять над буквой или под ней. Между собой буквы связываются с помощью соединительных черточек.

Печатное и письменное начертания букв арабского алфавита принципиально не отличаются. В арабском алфавите нет прописных букв.

Огласовки

Система арабского письма предусматривает передачу лишь согласных и долгих гласных звуков. Краткие гласные на письме не изображаются. Однако для уточнения характера кратких гласных в определенных случаях, например, в Священном Коране, пророческих преданиях, учебных пособиях, они обозначаются с помощью специальных подстрочных или надстрочных знаков, называемых огласовками.

Огласовка ставится над или под буквой, обозначающей согласный звук. В арабском языке имеются три огласовки:

− «Фатха»

Огласовка «фатха» ставится над буквой в форме наклонной черточки َ_ и передает краткий гласный звук [а]. Например: بَ [ба], شَ [ша].

− «Кясра»

Огласовка «кясра» ставится под буквой в форме наклонной черточки ـِ и передает краткий гласный [и]. Например: بِ [би], شِ [ши].

− «Дамма»

Огласовка «дамма» ставится над буквой в форме запятой ـُ и передает краткий гласный [у]. Например: بُ [бу], شُ [шу].

− «Сукун»

Отсутствие гласного звука после согласного обозначается значком, именуемым «сукуном». «Сукун» пишется виде ـْ и ставится над буквой. Например: بَتْ [бат], بِتْ [бит], بُتْ [бут].

К дополнительным значкам в арабском языке относится знак «шадда», обозначающий удвоение согласного звука. «Шадда» пишется в виде русской прописной буквы «ш». Например: بَبَّ [бабба],  بَتِّ [батти]

Транскрипция

Ввиду того что в арабском языке между системой изображения слов на письме и их звуковым составом имеется существенная разница, в практических целях прибегают к так называемой транскрипции. Транскрипция – это передача звуков языка с помощью принятых условных знаков или букв того же или другого языка, снабженных, в случае необходимости, дополнительными значками.

В настоящем учебнике в качестве знаков транскрипции арабских звуков принят русский язык. Для изображения тех звуков, которых нет в русском языке, некоторые русские буквы снабжены дополнительными значками: черточкой и точкой под буквой. Черточка указывает на межзубный согласный звук, а точка – на твердый звук.

Арабское письмо
Тип:

консонантное

Языки:

Арабский, персидский, курдский, и др.

Территория:

Аравийский полуостров, Ближний Восток, Средняя Азия, Северная Африка.

Период:

с V века

Статус:

В пользовании

Направление письма:

справа налево

Знаков:

28

Происхождение:

Ханаанейское письмо

Финикийское

Арамейское

Сирийское

Арабское
Диапазон Юникода:

U+0600 — U+06FF
U+0750 — U+077F
U+FB50 — U+FDFF
U+FE70 — U+FEFF

ISO 15924:

Arab (#160)

Пример текста
Пример

См. также: Проект:Лингвистика

Современная арабская каллиграфия

Ара́бский алфави́т, арабское письмо, ара́бица — алфавит, используемый для записи арабского языка и (чаще всего в модифицированном виде) некоторых других языков, в частности персидского, пашто, урду и некоторых тюркских языков (См. персидская письменность). Состоит из 28 букв и используется для письма справа налево.

Ход написания слов такой: 1) пишут основные части букв, не требующие отрыва пера от бумаги; 2) добавляют те части, которые требуют отрыва пера: отвесную черту букв ط и ظ, верхнюю наклонную черту буквы ك и точки, присущие многим буквам; 3) если нужно, расставляют вспомогательные значки (то есть огласовки (харакаты))[1].

Арабское письмо произошло от набатейского письма, развившегося из арамейского письма, которое в свою очередь восходит к финикийскому письму. Арабский алфавит включил в себя все буквы арамейского и добавил к ним буквы, отражающие специфически арабские звуки. Это буквы — са, ха, заль, дад, за, гайн.

Содержание

  • 1 Обозначение согласных
  • 2 Обозначение гласных
  • 3 Дополнительные знаки
  • 4 Дополнительные знаки: местные варианты
  • 5 Транслитерация
  • 6 Лигатуры
  • 7 Выравнивание
  • 8 Каллиграфия
  • 9 Каллиграфические стили
  • 10 Арабские цифры
  • 11 История
    • 11.1 Абджад
    • 11.2 Использование в разных языках
    • 11.3 Арабский алфавит на основе латиницы
  • 12 Юникод
  • 13 Клавиатура
  • 14 См. также
  • 15 Примечания
  • 16 Литература
  • 17 Ссылки

Обозначение согласных

Каждая из 28 букв, кроме буквы алиф, обозначает один согласный. Начертание букв меняется в зависимости от расположения внутри слова (в начале, в конце или в середине, с учётом того, что слова пишутся справа налево). Все буквы одного слова пишутся слитно, за исключением шести букв (алиф, даль, заль, ра, зайн, вав), которые не соединяются со следующей буквой.

№ п-п в конце слова в середине слова в начале слова отдельно стоящие название кириллическая транслитерация транскрипция МФА стандартная латинская транслитерация
1 أَلِف’алиф
2 بَاءба̄’ б [b] b
3 تَاءта̄’ т [t] t
4 ثَاءс̱а̄’ с̱ [θ]
5 جِيمджӣм дж/г [ʤ], [ɡ] ǧ
6 حَاءх̣а̄’ х̣ [ħ]
7 خَاءх̮а̄’ х̮ [x]
8 دَالда̄ль д [d] d
9 ذَالз̱а̄ль з̱ [ð]
10 رَاءра̄’ р [r] r
11 زَايза̄й (зайн) з [z] z
12 سِينсӣн с [s] s
13 شِينшӣн ш [ʃ] š
14 صَادс̣а̄д с̣ [sˁ]
15 ﺿ ضَادд̣а̄д д̣ [dˁ], [ðˤ]
16 طَاءт̣а̄’ т̣ [tˁ]
17 ظَاءз̣а̄’ з̣ [zˁ], [ðˁ]
18 عَيْن‘айн [ʕ] ʕ/ʿ
19 غَيْنгайн г/г̣ [ɣ] ġ
20 فَاءфа̄’ ф [f] f
21 قَافк̣а̄ф к̣ [q] q
22 كَافка̄ф к [k] k
23 لاَمля̄м ль [l] l
24 مِيمмӣм м [m] m
25 نُونнӯн н [n] n
26 هَاءха̄’ х [h] h
27 وَاوва̄в (уау) в [w] w
28 يَاءйа̄’ й [j] y

Алиф — единственная буква арабского алфавита, не обозначающая никакой согласный звук. В зависимости от контекста, она может использоваться для обозначения долгого гласного а̄ (см. ниже), либо как вспомогательный орфографический знак, не имеющий собственного звукового значения.

В персидском алфавите (и производных от него) порядок букв несколько иной — сначала идёт ва̄в, затем ха̄’. Также в персидской и пакистанской версиях арабского алфавита отличается начертание буквы ка̄ф — она пишется всегда как в начальной или срединной позиции.

Обозначение гласных

Три долгих гласных звука арабского языка (а̄, ӯ, ӣ) обозначаются буквами алиф, уау, йа соответственно. Краткие гласные на письме, как правило, не передаются. В случаях, когда необходимо передать точное звучание слова (например, в Коране и в словарях), для обозначения гласных звуков используются надстрочные и подстрочные огласовки (харакат). Если после буквы следует звук «а», над ней ставится наклонная чёрточка, которая называется «фатха». Если после буквы следует звук «и», чёрточка ставится под буквой, и называется «касра». Звук «у» обозначается надстрочным значком «дамма», похожим на маленькую запятую. Если после буквы нет гласного звука, то над ней ставится «сукун» — маленький кружок.

В неарабских языках, где используются алфавиты на основе арабского, гласные передаются либо методом матрес лекционис (в персидском передаются только долгие гласные — через «алиф», «йа» и «уау»), либо путём ввода дополнительных знаков (как в уйгурском языке). Отсутствие средств передачи гласных в арабском языке, для которого это было естественным явлением (в семитских языках гласные не входят в состав основы слова, и чередуются при словообразовании и словоизменении), привело в ХХ в. в ряде мусульманских стран (Турция, Средняя Азия, Индонезия, Малайзия и др.) к вытеснению арабского алфавита иными алфавитами, располагавшими средствами последовательной передачи гласных (латиницей, кириллицей и др.). В классическом арабском языке отсутствуют звуки «г» и «п».

Дополнительные знаки

28 букв, приведённых выше, называются хуруф (араб. حروف‎‎, ед.ч. حرفхарф). Кроме них, в арабском письме используется ещё три дополнительных знака, не являющихся самостоятельными буквами алфавита.

в конце слова в середине слова в начале слова отдельно стоящие название транслитерация транскрипция
هَمْزَةхамза [ʔ]
 — تَاء مَرْبُوطَةта̄’ марбӯт̣а [h] / [t]
 — أَلِف مَقْصُورَة’алиф мак̣с̣ӯра а̄ [aː] / [a]
  1. Хамза (гортанная смычка) может писаться как отдельная буква, либо на букве-«подставке» (алиф, вав или йа). Способ написания хамзы определяется её контекстом в соответствии с рядом орфографических правил. Вне зависимости от способа написания, хамза всегда обозначает одинаковый звук.
  2. Та-марбута («завязанная та») является формой буквы та. Она пишется только в конце слова и только после огласовки фатха. Когда у буквы та-марбута нет огласовки (например, в конце фразы), она читается как буква ха. Обычная форма буквы та называется та̄’ мафтӯх̣а (араб. تاء مفتوحة‎‎, «открытая та»).
  3. Алиф-максура («укороченный алиф») является формой буквы алиф. Она пишется только в конце слова и сокращается до краткого звука а перед алиф-васла следующего слова (в частности, перед приставкой аль-). Обычная форма буквы алиф называется ’алиф мамдӯда (араб. ألف ممدودة‎‎, «удлинённый алиф»).

Дополнительные знаки: местные варианты

В местных вариантах арабского алфавита, а также в разновидностях арабского алфавита для неарабских языков используются другие дополнительные знаки.

В персидском языке конечная форма буквы «йа» пишется без двух подстрочных точек, то есть совпадает с «алиф максура»; в свою очередь, «алиф максура» в персидском не используется и заменяется обычным конечным алифом. Конечная «каф» совпадает по написанию со срединной (арабский вариант конечной «каф» считается устаревшим). Помимо этого, в персидском имеются свои знаки для звуков «г» («каф» с надстрочной чертой), «ж» («ра» с тремя надстрочными точками), «п» («ба» с тремя подстрочными точками вместо одной), «ч» («джим» с тремя точками вместо одной).

Свои дополнительные знаки существуют в алфавитах для языков урду, уйгурского, магрибских диалектов арабского и др.

Транслитерация

Приведена таблица соответствия между стандартными системами кириллической и латинской транслитерации арабского письма, а также нестрогой системой латинской транслитерации, распространённой в Интернете.

согласные гласные
ء ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي ة ا و ي ى арабские буквы
б т с̱ дж х̣ х̮ д з̱ р з с ш с̣ д̣ т̣ з̣ г ф к̣ к л м н х в й а̄ ӯ ӣ ā кириллизация
ʾ b t ǧ d r z s š ʿ ġ f q k l m n h w y ā ū ī станд. латинизация
th j/g 7 kh dh sh 9 6 dh ` gh 8/9 ah oo ee a нестр.
2 5 ch 4 9 6’/8 3 3′ g eh aa ou/uu ii y

Система латинизации арабского письма определена в международном стандарте ISO 233.

Лигатуры

Лигатура Мухаммед

В арабском письме есть большое количество способов слитного написания нескольких букв (лигатур). Одна лигатура — лям-алиф — является стандартной, и написание этой пары букв иначе, чем при помощи лигатуры, не допускается. Остальные лигатуры необязательны, и их использование зависит от выбранного каллиграфического стиля.

В Юникоде зарегистрировано более трёх сотен двухбуквенных лигатур, более сотни — трёхбуквенных, несколько — словных: например, для слов «Аллах», «акбар», «Мухаммед», «расул» (пророк), «риял» (денежная единица Ирана). Кроме этого, в Юникоде есть символ, состоящий из четырёх словных лигатур, и обозначающий целую фразу — «Солля Ллаху алейхи ва саллям».

Выравнивание

Упражнение каллиграфа: выделены две формы буквы каф, обычная (сверху) и куфическая

В отличие от неслитного письма, в котором для выравнивания ширины строк применяется разрядка слов и межсловных пробелов, арабская вязь позволяет растягивать строки за счёт удлинения связок между буквами. Удлинённая связка называется кашида (перс. كشيده‎) или татвиль (араб. تطويل‎‎). Символ кашиды определён в Юникоде как U+0640, и его можно вставлять в текст для указания предпочтительных мест удлинения связки — подобно «мягкому переносу» в текстах на европейских языках. Средства разметки текста (например, CSS) позволяют указывать, в каких пропорциях удлинение строк должно происходить за счёт кашиды по сравнению с расширением межсловных пробелов. [1]

В каллиграфии для растяжения строк используется также особая форма буквы каф, называемая «каф росчерком» или «куфическим каф». Несмотря на то, что это графическая форма обычного каф, она закодирована в Юникоде отдельным символом (U+06AA). Подобно межбуквенным связкам, эта форма буквы каф может растягиваться до любой ширины.

Каллиграфия

Важное место в арабской культуре письма занимает искусство каллиграфии. В основном по причине религиозного запрета на изображение живых существ (аниконизма) каллиграфия стала одним из основных видов сакрального искусства в мусульманском мире. Имеется несколько стилей каллиграфического письма.

Каллиграфические стили

Пара дорожных указателей в Иерусалиме. Верхняя надпись جبل صهيون‎ «гора Сион» сделана куфическим почерком, нижняя — насхом

Один из самых древних стилей арабского письма — это куфи, или куфический (араб. كوفي‎‎, от названия города Куфа).

Шрифт, ставший стандартным средством записи для арабского языка — это насх (араб. نسخ‎‎ «копирование»).

Некоторые каллиграфические стили использовались только в декоративных целях, то есть для каллиграмм — художественных произведений каллиграфов. Таков шрифт су́люс (араб. ثلث‎‎ «треть») с его широкими, свободными росчерками.

Арабские цифры

С VIII века для записи чисел используется позиционная десятичная система счисления, с модифицированными индийскими цифрами. Цифры в числе пишутся слева направо.

европейские стандартные арабские восточноарабские
0 ٠ ۰
1 ١ ۱
2 ٢ ۲
3 ٣ ۳
4 ٤ ۴
5 ٥ ۵
6 ٦ ۶
7 ٧ ۷
8 ۸ ٨
9 ٩ ۹

История

Абджад

Исторически буквы арабского алфавита располагались в том же порядке, что и в финикийском алфавите, от которого происходит арабский. При этом 6 букв, не имевших соответствия в финикийском алфавите, помещены в конец:

أ ب ج د و ﻩ ز ح ط ي ك ل م ن س ع ف ص ق ر ش ت ث خ ذ ض ظ غ

Этот порядок называется «абджад», по четырём первым буквам: алиф, ба, джим, даль. До перехода к индийским («арабским») цифрам, приведённым выше, для обозначения чисел использовались буквы, и их числовое значение соответствовало их порядку в абджаде. Вскоре после перехода к индийским цифрам порядок алфавита был изменён на современный. Однако арабское слово, обозначающее «алфавит» — أبجديةабджадия, — до сих пор напоминает о старом порядке.

Использование в разных языках

Распространение арабского алфавита шло параллельно с распространением ислама. Со временем арабский алфавит стал восприниматься как «истинно исламский», и многие языки Азии и Африки стали использовать его на письме (в том числе и те, которые ранее использовали другие системы письма — например, персидский или яванский). В регионах, где преобладали другие языки, группы населения, исповедующие ислам, стремились сохранить арабский алфавит несмотря на принятие нового языка, пример — белорусский арабский алфавит. При этом арабский алфавит пополнялся дополнительными буквами для обозначения звуков, отсутствовавших в арабском языке.

В Юникоде зарегистрировано 135 букв (не считая позиционных форм), отсутствующих в арабском алфавите, но используемых в различных системах письма на основе арабской. Ряд букв этого «расширенного арабского алфавита» используются и в арабских текстах для транслитерации звуков, отсутствующих в классическом арабском языке — например таких, как русские звуки в, г, п, ц, ч.

В Индонезии и Малайзии в настоящее время используется латиница, но некоторое количество религиозной литературы продолжает издаваться с использованием арабской графики.

Среди народов бывшего СССР арабский алфавит перестал использоваться в конце 1920-х, в связи с латинизацией (татарский, башкирский, крымскотатарский, языки Средней Азии и Кавказа). Примерно в это же время от арабского алфавита отказалась Турция.

В настоящий момент письмо на основе арабского алфавита используется, кроме названных языков, для урду, пушту, дари, кашмири, пенджаби, синдхи, хауса, фула, а также иногда для курдского (в Иране и Сирии) и уйгурского языков. Кроме того, за пределами бывшего СССР арабское письмо используется для азербайджанского, казахского, киргизского, туркменского, узбекского, татарского (в странах, где эти языки являются государственными, для них используется кириллица или латиница).

Арабский алфавит на основе латиницы

В начале 1930-х годов в СССР был разработан и утверждён проект латинизированного алфавита для арабов Средней Азии[2]. Однако он практически не использовался.

A a B в C c Ç ç D d E e F f G g
Ƣ ƣ H h Ħ ħ I i J j K k L l M m
N n O o P p Q q R r S s Ş ş T t
Ѣ ѣ U u V v X x Y y Z z

Юникод

До приобретения популярности Юникодом существовало более 20 различных систем кодирования знаков арабского письма. Первой кодировкой, позволяющей работать с арабским текстом, была семибитная кодировка CUDAR-U (1981). Годом позже появилась другая семибитная кодировка ASMO-449, принятая в 1987 г. как международный стандарт ISO-9036. Основанная на ней восьмибитная кодовая страница, нижняя половина которой совпадала с ASCII, — ASMO-708 (1986), была принята в 1987 г. как ISO 8859-6 и стала первым стандартом де-факто на представление арабского текста в компьютерных системах. Однако ввиду того, что стандарт ISO 8859-6 регламентировал лишь около половины позиций кодовой страницы, появились и использовались многочисленные «односторонне совместимые» со стандартом кодировки. Такие модификации ISO 8859-6, несовместимые одна с другой, использовались в операционных системах DOS и Macintosh. Также в числе расширений стандарта ISO есть кодировка ASMO-449+, нижняя половина которой совпадает с ASCII, а верхняя — с ASMO-449. В частности, все знаки пунктуации присутствуют в ней в двух вариантах: для письма слева направо (в нижней части) и для письма справа налево (в верхней).

Наиболее распространённая арабская кодовая страница, несовместимая со стандартом ISO, — это CP-1256, используемая в ОС Microsoft Windows. Она содержит в своей верхней половине, вдобавок к символам арабского письма, буквы расширенной латиницы, что позволяет сочетать в одном тексте французский и арабский языки.

В Юникоде буквы арабского алфавита, арабские цифры, знаки пунктуации и другие вспомогательные знаки арабского письма находятся в диапазоне от U+0600 до U+077F, исключая поддиапазон U+0700—U+074F. Большую часть представленных здесь символов составляют знаки «расширенного арабского алфавита» для систем письма на основе арабского алфавита. Арабские формы представления (лигатуры и позиционные варианты написания букв) находятся в диапазоне от U+FB50 до U+FEFF, исключая поддиапазон U+FE00—U+FE70. В общей сложности, символами арабского письма в Юникоде занята 1001 кодовая позиция в 4 блоках.

Ниже сведены в таблицу символы основного арабского блока.

    0 1 2 3 4 5 6 7 8 9 A B C D E F
0600   ؀ ؁ ؂ ؃ ؋ ، ؍ ؎ ؏
0610   ؐ ؑ ؒ ؓ ؔ ؕ ؛ ؞ ؟
0620   ء آ أ ؤ إ ئ ا ب ة ت ث ج ح خ د
0630   ذ ر ز س ش ص ض ط ظ ع غ
0640   ـ ف ق ك ل م ن ه و ى ي ً ٌ ٍ َ ُ
0650   ِ ّ ْ ٓ ٔ ٕ ٖ ٗ ٘ ٙ ٚ ٛ ٜ ٝ ٞ
0660   ٠ ١ ٢ ٣ ٤ ٥ ٦ ٧ ٨ ٩ ٪ ٫ ٬ ٭ ٮ ٯ
0670   ٰ ٱ ٲ ٳ ٴ ٵ ٶ ٷ ٸ ٹ ٺ ٻ ټ ٽ پ ٿ
0680   ڀ ځ ڂ ڃ ڄ څ چ ڇ ڈ ډ ڊ ڋ ڌ ڍ ڎ ڏ
0690   ڐ ڑ ڒ ړ ڔ ڕ ږ ڗ ژ ڙ ښ ڛ ڜ ڝ ڞ ڟ
06A0   ڠ ڡ ڢ ڣ ڤ ڥ ڦ ڧ ڨ ک ڪ ګ ڬ ڭ ڮ گ
06B0   ڰ ڱ ڲ ڳ ڴ ڵ ڶ ڷ ڸ ڹ ں ڻ ڼ ڽ ھ ڿ
06C0   ۀ ہ ۂ ۃ ۄ ۅ ۆ ۇ ۈ ۉ ۊ ۋ ی ۍ ێ ۏ
06D0   ې ۑ ے ۓ ۔ ە ۖ ۗ ۘ ۙ ۚ ۛ ۜ ۝ ۞ ۟
06E0   ۠ ۡ ۢ ۣ ۤ ۥ ۦ ۧ ۨ ۩ ۪ ۫ ۬ ۭ ۮ ۯ
06F0   ۰ ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۺ ۻ ۼ ۽ ۾ ۿ

Клавиатура

Раскладка в системах семейства Windows

С арабскими раскладками клавиатуры ситуация такая же несогласованная, как и с кодировками: хотя с 1987 г. существует стандартная раскладка ASMO-663 [2], используются многочисленные нестандартные раскладки. Наиболее популярна сейчас раскладка, используемая в IBM OS/2 и Microsoft Windows. Различные несовместимые с ней и друг с другом раскладки использовались в компьютерах MSX, в арабской версии MS-DOS, в системах на основе Linux. Для «ноутбука за 100 долларов» также разрабатывается новая раскладка клавиатуры, несовместимая с уже существующими.

Арабская печатная машинка

Арабская клавиатура, очевидно, должна быть двуязычной (латиница/арабский), чтобы возможно было вводить в компьютер пути файловой системы и веб-адреса. Здесь также возникает неоднозначность: обычно латинская часть арабской клавиатуры размечается как QWERTY, но в странах Магриба, где среди языков, пользующихся латиницей, доминирует французский, латинская часть клавиатуры размечается в соответствии с французской раскладкой AZERTY.

См. также

  • Арабская каллиграфия
  • Арабский язык
  • Передача арабского письма латиницей
  • Арабско-русская практическая транскрипция
  • Диакритические знаки в арабском письме
  • Каллиграфия
  • Консонантное письмо
  • Персидская письменность
  • Белорусский арабский алфавит

Примечания

  1. Юшманов, 1928, с. 28
  2. Культура и письменность Востока. 1931, № 10.

Литература

  • Ковалев А. А., Шарбатов Г. Ш. Учебник арабского языка. — М.: Издательская фирма «Восточная литература» РАН, 1999.
  • Сегаль В. С. Начальный курс арабского языка. — М.: Изд. ИМО, 1962.
  • Халидов Б. З. Учебник арабского языка. — Ташкент: Изд. «Укитувчи», 1977.
  • Юшманов Н. В. Грамматика литературного арабского языка. — Л., 1928.
  • مصطفى الغلاييني جامع الدروس العربية المكتبة العصرية 2000 م
  • Pihan, A. P. Notice sur les divers genres d’écriture ancienne et moderne des Arabes, des Persans et des Turcs. — Paris, 1856.

Ссылки

  • Арабский алфавит и каллиграфия (англ.)
  • Арабский алфавит на сайте Omniglot  (англ.)
  • Арабский алфавит и каллиграфия (англ.)
  • Таблица разных систем транслитераций (англ.)
  • Арабский алфавит с русской транскрипцией
  • Арабская транслитерация с возможностью собственных настроек
  • Ибн Манзур, Язык арабов, источник (ар.)
  • Курс «Алиф Бейт»
  • Арабская онлайн-клавиатура доступна на сайтах www.isa-sari.com и www.corluihl.com (с персидскими буквами «п», «ч» и «ж»).
  • Ещё одна очень удобная онлайн-клавиатура находится здесь www.babil.info
 Просмотр этого шаблона Арабский язык · العربية
Обзоры Язык · Алфавит · История · Романизация · Нумерология · Арабизм Arabic script
Алфавит Арабские цифры · Восточные цифры · Диакритики · Хамза · Та марбута
Буквы ʾAlif · Bāʾ · Tāʾ · Ṯāʾ · Ǧīm · Ḥāʾ · Ḫāʾ · Dāl · Ḏāl · Rāʾ · Zayn · Sīn · Šīn · Ṣād · Ḍād · Ṭāʾ · Ẓāʾ · ʿAyn · Ġayn · Fāʾ · Qāf · Kāf · Lām · Mīm · Nūn · Hāʾ · Wāw · Yāʾ
Эры Древне-северноаравийский · Классический · Современный
Известные
разновидности
Стандартизованный: Современный арабский, Региональные: Египетский · Иракский · Ливанский · Магрибский · Суданский · Аравийский · Еврейско-арабские
Академический Литература · Имена
Каллиграфия
и шрифты
Насх · Kufic · Сулюс · Дивани · Мухаккак · Maghrebi · Hejazi · Mashq · Насталик · Джави · Пегон · Сини · Сяоэрцзин
Лингвистика Фонология · Солнечные и лунные буквы · Грамматика · Трёхбуквенный корень · Матрес лекционис · IPA · Quranic Arabic Corpus

Письменности мира

История • Глиф • Графема • Дешифровка • Палеография • Список языков по системам письма • Создатели

Консонантное письмо

Арамейское • Арабское Джави • Древнеливийское • Еврейское • Набатейское • Пахлави • Самаритянское • Сирийское • Согдийское • Угаритское • Финикийское • Южноаравийское

Абугиды /
Индийское письмо

Балийское • Батак • Бенгальское • Бирманское • Брахми • Бухидское • Варанг-кшити • Восточное нагари • Грантха • Гуджарати • Гупта • Гурмукхи • Деванагари • Кадамба • Кайтхи • Калинга • Каннада • Кхмерское • Ланна • Лаосское • Лепча • Лимбу • Лонтара • Малаялам • Манипури • Митхилакшар • Моди • Мон • Монгольское • Нагари • Непальское • Ория • Паллава • Ранджана • Реджангское • Саураштра • Сиддхаматрика • Сингальское • Соёмбо • Суданское • Тагальское • Тагбанва • Такри • Тамильское • Телугу • Тайское • Тибетское • Тохарское • Хануноо • Хуннское • Шарада • Яванское

Абугиды /
Другие

Скоропись Бойда • Канадское слоговое • Кхароштхи • Мероитское • Скоропись Питмана • Письмо Полларда • Соранг Сомпенг • Тана • Скоропись Томаса • Эфиопское

Линейные алфавиты

Авестийский • Агванский • Армянский • Басса • Бютхакукия • Вагиндра • Венгерские руны • Глаголица • Готский • Скоропись Грегга • Греко-иберский • Греческий • Грузинский • Гьирокастро • Дезеретский • Древнепермский • Древнетюркский • Кириллица • Коптский • Латиница • Мандейский • Малоазийские • Международный фонетический • Маньчжурский • Нко • Обэри-Окаимэ • Огамический • Ол-чики • Руны • Северноэтрусские • Старонубийский • Сомалийский • Старомонгольский • Древнеливийский (Тифинаг) • Фрейзера • Эльбасанский • Этрусский • Хангыль

Нелинейные алфавиты

Шрифт Брайля • Азбука Морзе • Шрифт Муна • Оптический телеграф • Семафорная азбука • Международный свод сигналов • Тюремная азбука

Идео- и пиктограммы

Астекские • Дунба • Месоамериканские • Микмак • Миштекские • Нсибиди • Токапу

Логографическое
письмо

Китайское: Традиционное • Упрощённое • Тьы-ном • Кандзи • Ханча
Производные от китайского: Киданьское • Чжуанское • Чжурчжэньское
Лого-силлабическое: Анатолийское • И • Клинопись • Майя • Тангутское
Лого-консонантное: Египетское письмо (иероглифика, иератика, демотика)

Слоговое письмо

Афака • Ваи • Геба • Древнеперсидское • И • Катакана • Кикакуи • Кипрское • Кпелле • Линейное письмо Б • Манъёгана • Нюй-шу • Хирагана • Чероки • Югтун

Переходные слого-алфавитные

Палеоиспанское • Чжуинь

Узелковые системы

Кипу • Узелковое письмо в Китае

Нерасшифрованные

Библское • Винча • Древнеханаанейское • Иссыкское • Кипро-минойское • Критские иероглифы • Линейное письмо А • Миштекское • Долины Инда • Цзяху • Полей погребальных урн • Протоэламское • Ронго-ронго • Рукопись Войнича • Протосинайское • Табличка из Диспилио • Фестский диск • Эламское линейное

Дохристианская письменность у славян • Кирт • Сарати • Тенгвар

См. также

Мнемоника • Стенография • Носители: Бумага • Глиняные таблички • Папирус • Пергамент (Палимпсест)

Для арабского письма, которое используется специально для арабского письма, см. Арабский алфавит.

«Персо-арабский шрифт» перенаправляется сюда. Чтобы узнать о сценарии, который используется для написания персидского языка, см. Персидский алфавит.

Арабский шрифт
Arabic-script.png
Тип

Абджад (Abugida или же истинный алфавит в некоторых адаптациях)

Языки Смотри ниже

Временной период

400 г. н.э. по настоящее время

Родительские системы

Прото-синайский

  • Финикийский
    • арамейский
      • Набатейский
        • Сирийский
          • Арабский шрифт

Дочерние системы

Вдохновил Нко алфавит и Скрипт ханифи
Направление Справа налево
ISO 15924 Арабская, 160

Псевдоним Unicode

арабский

Диапазон Unicode

  • U + 0600 – U + 06FF арабский
  • U + 0750 – U + 077F Дополнение на арабском языке
  • U + 08A0 – U + 08FF Арабский расширенный-A
  • U + FB50 – U + FDFF Арабский Pres. Форма-А
  • U + FE70 – U + FEFF Арабский Pres. Формы-B
  • U + 1EE00 – U + 1EEFF Арабский математический …
  • U + 1EC70 – U + 1ECBF Индийские числа сияк
  • U + 1ED00 – U + 1ED4F Османские числа Siyaq
  • U + 10E60 – U + 10E7F Цифровые символы Руми
Эта статья содержит IPA фонетические символы. Без надлежащего оказание поддержкивы можете увидеть вопросительные знаки, квадраты или другие символы вместо Unicode символы. Вводное руководство по символам IPA см. Справка: IPA.

В Арабский шрифт это система письма используется для письма арабский и несколько других языков Азии и Африки, таких как Персидский (фарси /Дари ), Уйгурский, Курдский, Пенджаби, Синдхи, Белуджи, Пушту, Lurish, Урду, Кашмири, Рохинджа, Сомалийский и Мандинка, среди прочего.[1] До 16 века на нем также писали некоторые тексты на испанский. Кроме того, до языковой реформы в 1928 году это была система письма. турецкий.[2] Это второй-наиболее широко используемая система письма в мире по количеству использующих его стран и третье место по количеству пользователей после латинский и Китайские письма.[3]

Арабское письмо пишется справа налево в курсив стиль, в котором большинство букв написано в несколько разных формах в зависимости от того, стоят ли они отдельно или присоединены к следующей или предыдущей букве. Основная форма письма остается неизменной. В большинстве случаев буквы транскрибируют согласные или согласные и несколько гласных, поэтому большинство арабских алфавитов Abjads. В нем нет заглавных букв.[4]

Сценарий впервые был использован для написания текстов на арабском языке, в первую очередь Коран, священная книга ислам. С распространением ислама он стал использоваться в качестве основного письма для многих языковых семей, что привело к добавлению новых букв и других символов с некоторыми версиями, такими как Курдский, Уйгурский и старый Боснийский существование Abugidas или правда алфавиты. Это также основа традиции Арабская каллиграфия.

Китайская каллиграфия времен династии Тан
Каллиграфия
  • арабский
  • Китайский
  • Грузинский
  • Индийский
  • Исламский
  • Японский
  • Корейский
  • Монгольский
  • Персидский
  • тибетский
  • вьетнамский
  • Западный
Использование арабского письма во всем мире

Распространение арабского алфавита в мире

Страны, где используется арабская графика:
 →  это единственный официальный сценарий
 →  является единственным официальным письмом, но другие сценарии распознаются для национальных или региональных языков
 →  является официальным наряду с другими скриптами
 →  является официальным на субнациональном уровне (Китай, Индия) или признанным альтернативным письмом (Малайзия)

Языки, написанные арабским шрифтом

Эта секция нужны дополнительные цитаты для проверка. Пожалуйста помоги улучшить эту статью к добавление цитат в надежные источники. Материал, не полученный от источника, может быть оспорен и удален. (Март 2018 г.) (Узнайте, как и когда удалить этот шаблон сообщения)

Обзор

арабский алфавит

خ ح ج ث ت ب ا
ḫā ’/
khā ’
ḥā ’ Джим ṯā ’/
тха
tā ’’ bā ’ ‘Алиф
ص ش س ز ر ذ د
грустный šīn /
шин
син zāy /
Зейн
ра ‘ āl /
дхал
dāl
ق ف غ ع ظ ط ض
каф фа ‘ Чайн /
Ghayn
‘Ayn ẓā ’ ṭā ’ папа
ي و ه ن م ل ك
я wāw ха ‘ нун мим Лам каф
(другие алфавиты см. ниже)

Арабский шрифт был адаптирован для использования на большом количестве языков, помимо арабского, включая Персидский, малайский и Урду, которые не Семитский. Такие адаптации могут включать измененных или новых персонажей для представления фонемы которые не появляются на арабском фонология. Например, в арабском языке отсутствует глухой двугубный взрывной (в [п] звук), поэтому многие языки добавляют свою букву для обозначения [п] в сценарии, хотя конкретная используемая буква варьируется от языка к языку. Эти модификации обычно делятся на группы: Индийский и Тюркские языки написанные арабским шрифтом, как правило, используют Персидские модифицированные буквы, тогда как языки Индонезии склонны подражать тем из Джави. Модифицированная версия арабского письма, первоначально разработанная для использования с персидским языком, известна как Персидско-арабский шрифт учеными.[нужна цитата ]

В случаях Боснийский, Курдский, Кашмири и Уйгурский письменности, гласные обязательны. Таким образом, арабский шрифт может использоваться как в Abugida и Абджад формы, хотя он часто сильно, хотя и ошибочно, связан с последним, поскольку изначально использовался только для арабского языка.[нужна цитата ]

Использование арабской графики в Западноафриканский языков, особенно в Сахель, разработанная с распространением ислам. В определенной степени стиль и использование имеют тенденцию повторять Магриб (например, положение точек в буквах fāʼ и каф ). Дополнительный диакритические знаки стали использоваться для облегчения написания звуков, не представленных в арабском языке. Период, термин ʻAjamī, происходящее от арабского корня «иностранный», применялось к основанной на арабском орфографии африканских языков.[нужна цитата ]

Википедия на арабском алфавите пяти языков

Таблица стилей письма

Скрипт или стиль Алфавит (ы) Язык (и) Область, край Происходит от Комментарий
Насх арабский
и другие
арабский
и другие
Каждый регион, где используются персидско-арабские шрифты. Иногда относится к очень особый каллиграфический стиль, но иногда используется для более широкого обозначения почти всех шрифтов, Куфический или же Насталик.
Насталик Урду,
Персидский,
и другие
Урду,
Персидский,
и другие
Южная и Западная Азия Талик Используется почти для всего современного текста на урду, но лишь изредка используется для персидского. (Термин «насталик» иногда используется носителями урду для обозначения всех персидско-арабских сценариев.)
Талик Персидский Персидский Предшественник Насталик.
Куфический арабский арабский Ближний Восток и часть Северной Африки
Расм Ограниченный Арабский алфавит арабский В основном исторический Пропускает все диакритические знаки, включая я джам. Для цифровой репликации обычно требуются специальные символы. Видеть: ٮ  ڡ  ٯ (ссылки на Викисловарь).

Таблица алфавитов

Алфавит Буквы Дополнительный
Символы
Скрипт или стиль Языки Область, край Происходит от:
(или связанный с)
Примечание
арабский 28 ^ (см. выше) Насх, Куфи, Расм, и другие арабский Северная Африка, Западная Азия арамейский,
Сирийский,
Набатейский
Сценарий Аджами 33 Хауса, суахили Западная Африка арабский Абджад
Альхамиадо 28 Старый испанский, Мосарабский, Ладино, Арагонский, Старогалисийско-португальский Юго-Западная Европа арабский VIII-XIII вв. Для мосарабского, 14-16 вв. Для других языков.
Arebica 30 Боснийский Юго-Восточная Европа Персидско-арабский Последний этап с полной маркировкой гласных
Арви алфавит 41 Тамильский Южная Индия, Шри-Ланка Персидско-арабский
Белорусский арабский алфавит 32 Белорусский Восточная Европа Персидско-арабский 15/16 века
Берберский арабский алфавит (s) Разные Берберские языки Северная Африка арабский
Бурушаски 53 ݳ ݴ څ ݼ ڎ ݽ ڞ ݣ ݸ ݹ ݶ ݷ ݺ ݻ
(смотрите примечание)
Бурушаски Юго-Западная Азия (Пакистан) Урду Также используются дополнительные буквы, указанные для урду.(Смотри ниже) Иногда пишется только алфавитом урду или Латинский алфавит.
Чагатайский алфавит (s) 32 Чагатай Центральная Азия Персидско-арабский
Galal 32 Сомалийский Африканский рог арабский
Джави 36 ݘ ڠ ڤ ݢ ڽ ۏ малайский Полуостров малайский Персидско-арабский С 1303 года нашей эры (Камень Тренгану)
Кашмири 44 أ ٲ إٳ وٗۆۄےٚؠ Насталик Кашмири Южная Азия Персидско-арабский
Казахский арабский алфавит 35 Казахский Центральная Азия, Китай Персидско-арабский
/ Чагатай
С 11 века, теперь официально только в Китае
Ховар 60 Ховар Южная Азия Персидско-арабский
Кыргызский арабский алфавит 33 Кыргызский Центральная Азия Персидско-арабский Теперь официально только в Китае
Курьянский алфавит 44 Корейский Восточная Азия, Южная Корея Персидско-арабский Изобретен корейским мусульманином в 2000-х годах.
Пушту 45 Пушту Юго-Западная Азия, Афганистан и Пакистан Персидско-арабский
Сценарий Pegon 35 Яванский, Суданский Юго-Восточная Азия (Индонезия) Персидско-арабский
Персидский 32 پ ݘ ژ گ Насталик или же Насх Персидский (Фарси) Западная Азия (Иран и др.) арабский
Сараики 45 Сараики Юго-Западная Азия (Пакистан) Персидско-арабский
Шахмухи 41+
(смотрите примечание)
Обычно Насталик Пенджаби Юго-Западная Азия (Пакистан) Персидско-арабский Подобно урду; 58[нужна цитата ] буквы, включая диграфы для придыхательных согласных.
Синдхи 64 ڪ ڳ ڱ گ ک
پ ڀ ٻ ٽ ٿ ٺ
ڻ ڦ ڇ چ ڄ ڃ
ھ ڙ ڌ ڏ ڎ ڍ ڊ
Насх -подобно Синдхи Юго-Западная Азия (Пакистан) Персидско-арабский
Сорабе 33 Малагасийский Мадагаскар арабский
Сорани 33 Центральнокурдский Средний Восток Персидско-арабский Гласные являются обязательными, то есть abugida
суахили
İske imlâ 35 Татарский Чагатай / Персидско-арабский До 1920 г.
Османский Турецкий 32 Османский Турецкий Османская империя Персидско-арабский Официально до 1928 г.
Урду 39+
(см. примечания)
پ ژ ݘ
ٹ ڈ ڑ ں ہ ھ ے

(см. примечания)
Насталик Урду Южная Азия Персидско-арабский 58[нужна цитата ] буквы, включая диграфы, представляющие придыхательные согласные.
بھ پھ تھ ٹھ جھ چھ دھ ڈھ کھ گھ
Уйгурский 32 Уйгурский Китай, Центральная Азия Персидско-арабский
/ Чагатай
Гласные являются обязательными, то есть abugida
Волофал 28 Волоф Западная Африка арабский
Сяо’эрцзин 36 Китайские языки Китай, Центральная Азия Персидско-арабский
Yaña imlâ 29 Татарский Россия Персидско-арабский
/ Чагатай
1920–1927 заменен кириллицей

Текущее использование

Сегодня Иран, Афганистан, Пакистан, Индия и Китай являются основными неарабоязычными государствами, использующими арабский алфавит для написания одного или нескольких официальных национальных языков, включая Азербайджанский, Белуджи, Брахуи, Персидский, Пушту, Центральнокурдский, Урду, Синдхи, Кашмири, Пенджаби и Уйгурский.[нужна цитата ]

В настоящее время арабский алфавит используется для следующих языков:[нужна цитата ]

Ближний Восток и Центральная Азия

  • арабский
  • Гаршуни (или Каршуни) возникла в 7 веке, когда арабский язык стал доминирующим разговорным языком в Плодородный Полумесяц, но арабское письмо еще не было полностью развито и широко не читалось, поэтому Сирийский алфавит использовался. Есть свидетельства того, что написание арабского этого другого набора букв (известного как Гаршуни) повлияло на стиль современного арабского письма. После этого начального периода письмо Гаршуни продолжается до наших дней среди некоторых Сирийский Христианские общины в арабоязычных регионах Левант и Месопотамия.
  • Казахский в Казахстане, Китае, Иран и Афганистан
  • Курдский в Северной Ирак и Северо-Запад Иран. (В индюк и Сирия то Латинский шрифт используется для курдского)
  • Кыргызский его 150 000 спикеров в Синьцзян-Уйгурский автономный район на северо-западе Китай, Пакистан, Кыргызстан и Афганистан
  • туркменский в Туркменистане,[нужна цитата ] Афганистан и Иран
  • Узбекский в узбекистане[нужна цитата ] и Афганистан
  • Официальный Персидский в Иране и его диалектах, например Дари в Афганистане и Таджики в Таджикистане
  • Белуджи в Иране, Пакистане, Белуджистане, Афганистане и Омане[5] В 2009 году в Иране была создана Академия защиты языка белуджи.[6]
  • Юго-западные иранские языки в качестве Лорийские диалекты и Бахтиарский язык[7][8]
  • Пушту в Афганистане и Пакистане
  • Уйгурский изменен на латинский алфавит в 1969 году и обратно на упрощенный, полностью гласный арабский шрифт в 1983 году.
  • Иудео-арабские языки
    • Иудео-тунисский арабский[9]
  • Азербайджанский язык в Иране
  • Талышский язык в Иране

Восточная Азия

  • В китайский язык написано некоторыми Хуэй в арабском Сяо’эрцзин алфавит (см. также Сини (сценарий) )
  • Тюркский Язык салар написано некоторыми Салар в арабском алфавите
  • Уйгурский алфавит

Южная Азия

  • Белуджи в Пакистан и Иран
  • Дари в Афганистан
  • Кашмири в Индия и Пакистан (также написано в Шарада и Деванагари хотя Кашмири чаще пишется персидско-арабским письмом)
  • Пушту в Афганистане и Пакистане
  • Ховар в Северном Пакистане также использует латиницу
  • Пенджаби (Шахмухи ) в Пакистане, также написано в Брахмический сценарий, известный как Гурмукхи в Индии
  • Сараики, написано модифицированным арабским шрифтом — 45 букв
  • Синдхи, британский комиссар в Синд 29 августа 1857 г. приказано изменить арабскую графику,[10] также написано в Деванагари в Индии
  • Язык Aer[11]
  • Язык бхадравахи[12]
  • Ладакхи (Индия ), хотя чаще его пишут с помощью Тибетское письмо
  • Бельцы[13] (а Сино-тибетский язык ), также редко пишется тибетским письмом
  • Язык брахуи в Пакистане и Афганистане[14]
  • Бурушаски или язык бурушо, язык, изолированный от Пакистана[15]
  • Урду в Пакистане (и исторически ряд других Языки хиндустани ). Урду — один из нескольких официальных языков в штатах Джамму и Кашмир, Дели, Уттар-Прадеш, Бихар, Джаркханд, Западная Бенгалия и Телангана.
  • Догри, на котором говорят около пяти миллионов человек в Индии и Пакистане, в основном в районе Джамму в штатах Джамму и Кашмир и в Химачал-Прадеш, но также и в северном Пенджабе, хотя догри чаще пишут на деванагари
  • Язык арви (смесь арабского и тамильского языков) использует арабское письмо с добавлением 13 букв. Он в основном используется в Шри-Ланка и южноиндийский штат Тамил Наду в религиозных целях. Язык арви это язык тамильских мусульман
  • Малаялам написанная арабским шрифтом, известна как Араби малаялам. В сценарии есть особые буквы, обозначающие специфические звуки малаялама. Этот скрипт в основном используется в медресе южноиндийского штата Керала и из Лакшадвип учить малаялам. В повседневной жизни малаялам пишется с Скрипт малаялам
  • Читтагонский язык, на котором говорят жители Читтагонга, Бангладеш,[16] хотя это гораздо чаще пишется на Бенгальский сценарий
  • Язык рохинджа (Руаингга) — это язык, на котором говорят люди рохинджа из Штат Ракхайн, ранее известный как Аракан (Ракхайн), Бирма (Мьянма). Это похоже на Читтагонский язык в соседнем Бангладеш[17] и иногда написано с использованием латинского алфавита или арабского алфавита, известного как Ханифи

Юго-Восточная Азия

  • малайский в арабском письме, известном как Джави. В некоторых случаях его можно увидеть на вывесках магазинов и рыночных прилавков. В частности, в Брунее язык джави используется для письма или чтения в программах исламского религиозного образования в начальной школе, средней школе, колледже или даже в высших учебных заведениях, таких как университеты. Кроме того, в некоторых телевизионных программах используется язык Jawi, например в объявлениях, рекламе, новостях, социальных программах или исламских программах.
    • со-чиновник в Бруней
    • Малайзия но со-чиновник в Келантан, исламское государство в Малайзии
    • Индонезия, Скрипт Jawi используется совместно с латинский в провинциях Ачех, Риау, Острова Риау и Джамби. В Яванский, Мадурский и Суданский также используйте другой арабский вариант, Пегон в исламских писаниях и песантрен сообщество.
    • Южный Таиланд
    • Сингапур
    • Преимущественно мусульманские районы Филиппины (особенно Таусугский язык )
    • Язык идаан (также Idahan) малайско-полинезийский язык, на котором говорят люди Ida’an Сабах, Малайзия[18]
  • Язык чам в Камбодже[19] Помимо Западный чамский сценарий.

Африка

  • Северная Африка
    • арабский
    • Магрибский арабский использует модифицированный арабский шрифт с дополнительными буквами, чтобы поддерживать / g / (ڨ / ڭ), / v / (ڥ) и / p / (پ) вместе с более старыми / f / (ڢ) и / q / (ڧ)[20][21]
    • Берберские языки часто были написаны на адаптация арабского алфавита. Использование арабского алфавита, а также конкурирующих латинский и Тифинаг сценарии, имеет политический подтекст
    • Туарегский язык, (иногда называемый тамашек), который также является берберским языком
    • Коптский язык египетских коптов как коптский текст, написанный арабскими буквами[22]
  • Северо-Восточная Африка
    • Бедави или Бежа, в основном на северо-востоке Судан
    • Письмо Wadaad, используется в Сомали
    • Нубийские языки
      • Донголавский язык или язык андаанди в Нубии, в долине Нила на севере Судана
      • Nobiin язык, самый крупный нубийский язык (ранее известный под географическими терминами Махас и Фадикка / Фиадикка) еще не стандартизирован, поскольку на обоих языках пишется по-разному. Латинизированный и арабские шрифты; Кроме того, недавно были предприняты попытки возродить старонубийский алфавит.[23][24]
    • Меховой язык Дарфура, Судан
  • Юго-Восточная Африка
    • Коморский, в Коморские острова, в настоящее время бок о бок с Латинский алфавит (ни то, ни другое не является официальным)
    • суахили, изначально был написан арабским алфавитом, орфография суахили теперь основана на латинском алфавите, который был введен христианскими миссионерами и колониальными администраторами.
  • Западная Африка
    • Язык зарма из Семья Сонгхай. Это язык юго-западной части западноафриканской страны Нигер, и это второй ведущий язык Нигера после хауса, на котором говорят в южной части центрального Нигера.[25]
    • Тадаксахак это язык сонгай, на котором говорит скотовод Идаксахак из области Менака в Мали[26]
    • Язык хауса использует адаптацию арабского письма, известную как Аджами, для многих целей, особенно религиозных, но включая газеты, плакаты массовой мобилизации и общественную информацию[27]
    • Дьюла язык это Язык манде говорят в Буркина-Фасо, Кот-д’Ивуаре и Мали.[28]
    • Язык Jola-Fonyi из Casamance регион Сенегал[29]
    • Язык баланта Бакский язык в Западной Африке, на котором говорят люди Баланта и Баланта-Гянджа диалект в Сенегале
    • Мандинка, широко, но неофициально (известный как Аджами) (другой используемый нелатинский шрифт — это N’Ko сценарий )
    • Фула, особенно Гвинейский Пулар (известный как Аджами)
    • Волоф (в Зауйя школы), известный как Волофал.
  • Арабская графика за пределами Африки
    • В трудах афроамериканских рабов
      • Сочинения Омар Ибн Саид (1770–1864) Сенегала[30]
      • В Билали документ также известный как Билали Мухаммед Документ представляет собой рукописную рукопись на арабском языке.[31] по исламскому праву Западной Африки. Он был написан Билали Мохамметом в 19 веке. В настоящее время документ хранится в библиотеке Университета Джорджии.
      • Письмо написано Аюба Сулейман Диалло (1701–1773)
      • Арабский текст 1768 г.[32]
      • Письмо написано Абдулрахман Ибрагим Ибн Сори (1762–1829)

Бывшее использование

В 20-м веке арабский шрифт был заменен Латинский алфавит в Балканы,[сомнительный – обсуждать] части К югу от Сахары, и Юго-Восточная Азия, а в Советский союз, после короткого периода Латинизация,[33] использование Кириллица было поручено. индюк перешел на латинский алфавит в 1928 году в рамках внутренней вестернизации революции. После распада Советского Союза в 1991 году многие тюркские языки бывшего СССР попытались последовать примеру Турции и перейти на латинский алфавит в турецком стиле. Однако возобновление использования арабского алфавита в ограниченной степени произошло в Таджикистан, чей язык очень похож на Персидский позволяет напрямую использовать публикации из Афганистана и Ирана.[34]

Большинство языков Иранские языки семья продолжает использовать арабскую графику, а также Индоарийские языки Пакистана и мусульманского населения в Индия. Тем не менее Бенгальский язык Индии и Бангладеш никогда не писались арабским шрифтом, который был написан в Бенгальский алфавит с момента создания.[35]

Африка

  • африкаанс (как впервые было написано среди «Мыс Малайзия «, видеть Арабский африкаанс )
  • берберский в Северной Африке, особенно Шилха в Марокко (все еще рассматривается вместе с Тифинаг и латынь, для Центральный Атлас Тамазайт )
  • Французский посредством Арабов и Берберы в Алжире и других частях Северной Африки во время французского колониального периода
  • Харари, посредством Люди харари из Регион Харари в Эфиопия. Теперь использует Geʻez и Латинские алфавиты
  • Для языков Западной Африки -Хауса, Фула, Мандинка, Волоф и многое другое — латинский алфавит официально заменил арабские транскрипции для использования в обучении грамоте и образовании.
  • Киньяруанда в Руанда
  • Кирунди в Бурунди
  • Малагасийский в Мадагаскар (сценарий известен как Сорабе )
  • Нубийский
  • Шона в Зимбабве
  • Сомалийский (видеть вадаад арабский ) в основном использовал Латинский алфавит с 1972 г.
  • Сонгхай в Западной Африке, особенно в Тимбукту
  • суахили (использовал Латинский алфавит с 19 века)
  • Йоруба в Западной Африке (это, вероятно, было ограничено, но все же заметно)

Европа

  • албанский называется Элифбаджа Шкип
  • Альхамиадо (Мосарабский, берберский, Арагонский, португальский[нужна цитата ], Ладино, и испанский, во время и после мусульманского правления на Пиренейском полуострове)
  • Белорусский (среди этнических Татары; видеть Белорусский арабский алфавит )
  • Боснийский (только для литературных целей; в настоящее время написано в Латинский алфавит; Пример текста: مۉلٖىمۉ سه ته‌بٖى بۉژه‎ = Molimo se tebi, Боже (Мы молимся Тебе, Боже); видеть Arebica )
  • Крымскотатарский
  • Греческий в определенных областях в Греция и Анатолия. Особенно, Каппадокийский греческий написано в Персидско-арабский
  • Польский (среди этнических Липкинские татары )

Центральная Азия и Кавказ

  • Адыгский язык также известный как западно-черкесский, является официальным языком Республики Адыгея в РФ. До 1927 года здесь использовался арабский алфавит.
  • Аварский а также другие языки Дагестан: Ногайский, Кумыкский, Лезгинский, Лак и Даргва
  • Азербайджанский в Азербайджан (теперь написано в Латинский алфавит и Кириллица в Азербайджан )
  • Башкирский (официально в течение нескольких лет с Октябрьская революция с 1917 по 1928 год, изменен на латиницу, теперь используется кириллица)
  • Чагатай через Центральная Азия
  • Чеченский (периодически с момента принятия ислама; официально с 1917 по 1928 год)[36]
  • черкесский и некоторые другие члены Абхазо-адыгская семья на западе Кавказ и спорадически — в странах Ближнего Востока, например в Сирии
  • Ингуш
  • Карачаево-Балкарский на Центральном Кавказе
  • Каракалпак
  • Казахский в Казахстан (до 1930-х гг. изменен на латиницу, в настоящее время используется кириллица, поэтапно на латыни)
  • Кыргызский в Кыргызстан (до 1930-х гг. изменен на латиницу, теперь используется кириллица)
  • Мандаринский китайский и Дунганский, среди Хуэй люди (сценарий известен как Сяо’эрцзин )
  • Османский Турецкий
  • Tat на Юго-Восточном Кавказе
  • Татарский до 1928 г. (изменен на латынь Yañalif ), реформированный в 1880-х (İske imlâ ), 1918 (Yaña imlâ — с пропуском некоторых букв)
  • туркменский в Туркменистан (изменено на латиницу в 1929 году, затем на кириллицу, затем снова на латиницу в 1991 году)
  • Узбекский в Узбекистан (изменено на латиницу, затем на кириллицу, затем снова на латиницу в 1991 году)
  • Немного Северо-восточные кавказские языки мусульманских народов СССР между 1918 и 1928 годами (многие также раньше), в том числе Чеченский, Лак и т. д. После 1928 года их сценарий стал латинским, затем[когда? ] Кириллица[нужна цитата ]

Юго-Восточная Азия

  • Acehnese в Суматра, Индонезия
  • Банджарский в Калимантан, Индонезия
  • Магинданаон в Филиппины
  • малайский в Малайзия, Сингапур и Индонезия. Хотя носители малайского языка в Бруней и Южный Таиланд по-прежнему использовать скрипт ежедневно
  • Минангкабау на Суматре, Индонезия
  • Сценарий Pegon из Яванский, Мадурский и Суданский в Индонезии используется только в исламских школах и учреждениях
  • Таусуг в Филиппины
  • Маранао в Филиппины

Средний Восток

  • иврит был написан арабскими буквами в ряде мест в прошлом[37][38]
  • Северокурдский в Турции и Сирии писали арабским шрифтом до 1932 г., когда Курдский латинский алфавит был представлен Джаладат Али Бадирхан в Сирии
  • турецкий в Османская империя был написан арабским шрифтом, пока Мустафа Кемаль Ататюрк объявил об изменении Латинский шрифт в 1928 году. Эта форма турецкого языка теперь известна как Османский Турецкий и многие считают его другим языком из-за гораздо более высокого процента персидского и арабского языков. заимствования (Османский турецкий алфавит )

Unicode

Начиная с Unicode 13.0, следующие диапазоны кодируют арабские символы:

  • арабский (0600–06FF)
  • Дополнение на арабском языке (0750–077F)
  • Арабский расширенный-A (08A0–08FF)
  • Формы представления на арабском языке-A (FB50 – FDFF)
  • Формы представления на арабском языке-B (FE70 – FEFF)
  • Арабские математические алфавитные символы (1EE00–1EEFF)
  • Цифровые символы Руми (10E60–10E7F)
  • Индийские числа сияк (1EC70–1ECBF)
  • Османские числа Siyaq (1ED00–1ED4F)

Дополнительные буквы, используемые в других языках

Присвоение фонемы к графемы

Ø = фонема отсутствует в языке

Языковая семья Austron. Дравид Тюркский Индийский (Индоевропейский) Иранский (Индоевропейский) арабский (Семитский)
Язык / сценарий Джави Пегон Арви Уйгурский Синдхи Пенджаби Урду Персидский Белуджи Курдский Пушту Марокканский Тунисский Алжирский Хиджази Najdi Египтянин Израильский Левантийский Иракский залив
/п / ڤ ڣ پ پ‎ / ب
/грамм / ݢ گ ګ ڭ‎ / گ ڨ‎ / ڧـ ـڧـ ـٯ‎ / ق ق ج چ‎ / ج ك‎ / ج گ‎ / ك ق / گ
/t͡ʃ / چ Ø چ ڜ تش چ
/v / ۏ ف و ۋ و Ø ڤ Ø ڥ‎ / ڢ‎ / ف ڤ‎ / ف
/ʒ / Ø ژ Ø ژ ج Ø چ‎ / ج ج Ø
/ŋ / ڠ ڭ ڱ ن٘ Ø Ø
/ɳ / Ø Ø ڹ Ø ڻ ݨ ن Ø ڼ Ø
/ɲ / ڽ ۑ ݧ Ø ڃ نج Ø Ø
Таблица дополнительных букв на других языках

Письмо или Диграф [A] Использование и произношение Unicode я джам и другие дополнения Форма Подобные арабские буквы
U + [B] [C] над ниже
پ پـ ـپـ ـپ Пе, используется для обозначения фонемы /п / в Персидский, Пушту, Пенджаби, Ховар, Синдхи, Урду, Курдский; он не используется в большинстве арабских разновидностей (кроме Месопотамии и Персидского залива) и нормализован как /б/; например., пепси > бибси. U + 067E никто 3 точки ٮ ب
ݐ ݐـ ـݐـ ـݐ используется для обозначения эквивалента латинской буквы Ƴ (палатализированный гортанная смычка / ʔʲ /) на некоторых африканских языках, таких как Фулфульде. U + 0750   ﮳﮳﮳ ‎  никто 3 точки
(по горизонтали)
ٮ ب
ٻ ٻـ ـٻـ ـٻ B̤ē, используемый для обозначения звонкий двугубный имплозивный /ɓ / в Хауса, Синдхи и Сараики. U + 067B никто 2 точки
(вертикально)
ٮ ب
ڀ ڀـ ـڀـ ـڀ представляет собой безнаддувный звонкий двугубный взрывной /bʱ / в Синдхи. U + 0680 никто 4 точки ٮ ب
ٺ ٺـ ـٺـ ـٺ Ṭhē, представляет собой атмосферный глухой ретрофлекс взрывной /ʈʰ / в Синдхи. U + 067A 2 точки
(вертикально)
никто ٮ ت
ټ ټـ ـټـ ـټ ṭē, используется для обозначения фонемы /ʈ / в Пушту. U + 067C ﮿ 2 точки звенеть ٮ ت
ٽ ٽـ ـٽـ ـٽ Ṭe, используется для обозначения фонемы ( глухой ретрофлекс взрывной /ʈ /) в Синдхи U + 067D 3 точки
(перевернутый)
никто ٮ ت
ٹـ ـٹـ ـٹ Ṭe, используется для обозначения Ṭ (a глухой ретрофлекс взрывной /ʈ /) в Пенджаби, Урду. U + 0679 ◌ؕ маленький
ط
никто ٮ ت
ٿ ٿـ ـٿـ ـٿ Техех, используется в синдхи и раджастхани (когда написано на языке синдхи); используется для обозначения фонемы /t͡ɕʰ / (пиньинь q) на китайском Сяо’эрцзин. U + 067F 4 точки никто ٮ ت
ڄ ڄـ ـڄـ ـڄ представляет собой «ц» глухой стоматологический аффрикат /это / фонема в Боснийский. U + 0684 никто 2 точки
(вертикально)
ح ج
ڃ ڃـ ـڃـ ـڃ представляет собой «ћ» глухой альвеоло-небный аффрикат /t͡ɕ / фонема в Боснийский. U + 0683 никто 2 точки ح ح ج
چ چـ ـچـ ـچ Че, используется для представления /t͡ʃ / («ч»). Он используется в Персидский, Пушту, Пенджаби, Урду и Курдский. /ʒ / в Египте. U + 0686 никто 3 точки ح ج
څ څـ ـڅـ ـڅ Ce, используется для обозначения фонемы /это / в Пушту. U + 0685 3 точки никто ح ج خ ح
ݗ ݗـ ـݗـ ـݗ представляет собой «ђ» звонкий альвеоло-небный аффрикат /d͡ʑ / фонема в Боснийский. U + 0757 2 точки никто ح ح
ځ ځـ ـځـ ـځ im, используется для обозначения фонемы /dz / в Пушту. U + 0681 ◌ٔ Хамза никто ح ج خ ح
ݙ ݙ ـݙ используется в Сараики представлять Звонкий альвеолярный имплозивный / ɗ̢ /. U + 0759 маленький
ط
2 точки
(вертикально)
د د
ڊ ڊ ـڊ используется в Сараики представлять звонкий ретрофлекс имплозивный /ᶑ /. U + 068A никто 1 точка د د
ڈ ڈ ـڈ Ḍal, используется для обозначения (a звонкий ретрофлексный взрывной /ɖ /) в Пенджаби и Урду. U + 0688 ◌ؕ маленький ط никто د د
ڌ ڌ ـڌ Дхал используется для обозначения фонемы /d̪ʱ / в Синдхи U + 068C 2 точки никто د د
ډ ډ ـډ Al, используется для обозначения фонемы /ɖ / в Пушту. U + 0689 ﮿ никто звенеть د د
ڑ ڑ ـڑ Ṛe, представляет собой ретрофлексный лоскут /ɽ / в Пенджаби и Урду. U + 0691 ◌ؕ маленький ط никто ر ر
ړ ړ ـړ «ṛe» представляет собой ретрофлексный боковой лоскут в Пушту. U + 0693 ﮿ никто звенеть ر _
ݫ ݫ ـݫ используется в Ормури представлять звонкий альвеоло-небный щелевой /ʑ /, а также в Торвали. U + 076B 2 точки
(вертикально)
никто ر _
ژ ژ ـژ Že / zhe, используется для представления звонкий постальвеолярный щелевой /ʒ / в, Персидский, Пушту, Курдский, Урду, Пенджаби и Уйгурский. U + 0698 3 точки никто ر ز
ږ ږ ـږ ǵe / ẓ̌e, используется для обозначения фонемы /ʐ / /ɡ / /ʝ / в Пушту. U + 0696 1 точка 1 точка ر ز
ڕ ڕ ـڕ используется в Курдский представлять rr /р / в Диалект сорани. U + 0695 ٚ никто V указывает вниз ر ر
ݭ ݭـ ـݭـ ـݭ используется в Калами представлять глухой ретрофлекс фрикативный /ʂ /, И в Ормури представлять глухой альвеоло-небный фрикативный звук /ɕ /. U + 076D 2 точки вертикально никто س س
ݜ ݜـ ـݜـ ـݜ используется в Шина представлять глухой ретрофлекс фрикативный /ʂ /. U + 075C 4 точки никто س ش س
ښ ښـ ـښـ ـښ x̌īn / īn, используется для обозначения фонемы /Икс / /ʂ / /ç / в Пушту. U + 069A 1 точка 1 точка س ش س
ڜ ڜـ ـڜـ ـڜ используется для обозначения испанских слов с /t͡ʃ / в Морокко. U + 069C 3 точки 3 точки س ش س
ڨ ڨـ ـڨـ ـڨ Ga, используется для представления звонкий велярный взрывной /ɡ / в Алжирский и Тунисский. U + 06A8 3 точки никто ٯ ق
گ گـ ـگـ ـگ Gaf, представляет собой звонкий велярный взрывной /ɡ / в Персидский, Пушту, Пенджаби, Кыргызский, Казахский, Курдский, Уйгурский, Месопотамский, Урду и Османский Турецкий. U + 06AF линия горизонтальная линия никто گ ك
ګ ګـ ـګـ ـګ Gaf, используется для обозначения фонемы /ɡ / в Пушту. U + 06AB ﮿ звенеть никто ک ك
ݢ ݢـ ـݢـ ـݢ Gaf, представляет собой звонкий велярный взрывной /ɡ / в Сценарий Jawi из малайский. U + 0762 1 точка никто ک ك
ڬ ڬـ ـڬـ ـڬ U + 06AC 1 точка никто ك ك
ࢴـ ـࢴـ ـࢴ Gaf, представляет собой звонкий велярный взрывной /ɡ / в Сценарий Pegon из индонезийский. U + 08B4 никто 1 точка ك ك
ڭ ڭـ ـڭـ ـڭ Ng, используемый для представления /ŋ / телефон в Османский Турецкий, Казахский, Кыргызский, и Уйгурский, и представлять /ɡ / в Марокко и во многих диалектах Алжирский. U + 06AD 3 точки никто ك ك
أي أيـ ـأيـ ـأي Ee, используется для обозначения фонемы /eː / в Сомалийский. U + 0623 U + 064A ◌ٔ Хамза 2 точки اى أ + ي
ئ ئـ ـئـ ـئ E, используется для обозначения фонемы /е / в Сомалийский. U + 0626 ◌ٔ Хамза никто ى ي ی
ىٓ ىٓـ ـىٓـ ـىٓ II, используется для обозначения фонемы /я / в Сомалийский и Сараики. U + 0649 U + 0653 ◌ٓ Мадда никто ى ي
ؤ ؤ ـؤ О, используется для обозначения фонемы /о / в Сомалийский. U + 0624 ◌ٔ Хамза никто و ؤ
ې ېـ ـېـ ـې Паста Йе, используется для обозначения фонемы /е / в Пушту и Уйгурский. U + 06D0 никто 2 точки вертикальный ى ي
ی یـ ـیـ ـی Нарина Е, используется для обозначения фонемы [ɑj] и фонемы /j / в Пушту. U + 06CC 2 точки
(начало + середина)
никто ى ي
ۍ ـۍ конец
Только
x̌əźīna ye Ye, используется для обозначения фонемы [əi] в Пушту. U + 06CD линия горизонтальный
линия
никто ى ي
ئ ئـ ـئـ ـئ FāiliyaYe, используется для обозначения фонемы [əi] и /j / в Пушту, Пенджаби, Сараики и Урду U + 0626 ◌ٔ Хамза никто ى ي ى
أو أو ـأو Оо, используется для обозначения фонемы /oː / в Сомалийский. U + 0623 U + 0648 ◌ٔ Хамза никто او أ + و
ﻭٓ ﻭٓ ـﻭٓ Уу, используется для обозначения фонемы /u / в Сомалийский. ‎ + ◌ٓ‎ U + 0648 U + 0653 ◌ٓ Мадда никто و + ◌ٓ
ڳ ڳـ ـڳـ ـڳ представляет звонкий велярный имплозивный / ɠ / в Синдхи и Сараики U + 06B1 горизонтальный
линия
2 точки گ ك
ڱ ڱـ ـڱـ ـڱ представляет Велар назальный / ŋ / фонема в Синдхи. U + 06B1 2 точки + горизонтальный
линия
никто گ ك
ک کـ ـکـ ـک Хе, представляет /kʰ / в Синдхи. U + 06A9 никто никто никто ک ك
ڪ ڪـ ـڪـ ـڪ «Swash kāf» — стилистический вариант ك на арабском, но представляет не- с придыханием /k / в Синдхи. U + 06AA никто никто никто ڪ ك или же ڪ
ݣ ݣـ ـݣـ ـݣ используется для обозначения фонемы /ŋ / (пиньинь нг) в Китайский. U + 0763 никто 3 точки ک ك
ڼ ڼـ ـڼـ ـڼ представляет ретрофлексный носовой / ɳ / фонема в Пушту. U + 06BC ں ﮿ 1 точка звенеть ن
ڻ ڻـ ـڻـ ـڻ представляет ретрофлексный носовой / ɳ / фонема в Синдхи. U + 06BB ◌ؕ маленький ط никто ں ن
ݨ ݨـ ـݨـ ـݨ используется в Пенджаби представлять /ɳ / и Сараики представлять /ɲ /. U + 0768 1 точка + малая ط никто ں ن
ڽ ڽـ ـڽـ ـڽ Ня /ɲ / в Сценарий Jawi. U + 06BD 3 точки никто ں ن
ۑ ۑـ ـۑـ ـۑ Ня /ɲ / в Сценарий Pegon. U + 06D1 никто 3 точки ى _
ڠ ڠـ ـڠـ ـڠ Нга /ŋ / в Сценарий Jawi и Сценарий Pegon. U + 06A0 3 точки никто ع غ
ݪ ݪـ ـݪـ ـݪ используется в Марвари представлять ретрофлексный боковой лоскут /ɺ̢ /, И в Калами представлять глухой боковой щелевой /ɬ /. U + 076A линия горизонтальный
линия
никто ل ل
ࣇ‍ ‍ࣇ‍ ‍ࣇ — или в качестве альтернативы набирать لؕ — используется в Пенджаби представлять звонкий ретрофлекс латеральный аппроксимант /ɭ /[39] U + 08C7 ◌ؕ маленький ط никто ل ل
لؕ لؕـ ـلؕـ ـلؕ U + 0644 U + 0615
ڥ ڥـ ـڥـ ـڥ Vi, используется в Алжирский и Тунисский когда написано арабским шрифтом для обозначения звука /v /. U + 06A5 никто 3 точки ڡ ف
ڤ ڤـ ـڤـ ـڤ Ve, используется некоторыми арабский спикеры для представления фонемы / v / в заимствованных словах, а в Курдский язык когда написано арабским шрифтом для обозначения звука /v /. Также используется как па /п / в Сценарий Jawi и Сценарий Pegon. U + 06A4 3 точки никто ڡ ف
ۏ ۏ ـۏ Ва в Сценарий Jawi. U + 06CF 1 точка никто و و
ۋ ۋ ـۋ представляет звонкий губно-зубной щелевой /v / в Кыргызский, Уйгурский и древнетатарский; и / ш, ʊw, ʉw / в Казахский; также ранее использовался в Ногайский. U + 06CB 3 точки никто و و
ۆ ۆ ـۆ представляет собой «О» /о / в Курдский, И в Уйгурский он представляет собой звук, похожий на французский Европа иœu /ø / звук. Он представляет собой «у» закругленная гласная /ты / фонема в Боснийский. U + 06C6 ◌ٚ V указывает вниз никто و و
ێ ێـ ـێـ ـێ представляет Ê или É /е / в Курдский. U + 06CE ◌ٚ V указывает вниз 2 точки
(начало + середина)
ى ي
ھ
ھ
ھـ ـھـ ـھ
ھھھ
До-чашми он (двуглазый хах), используется в диграфах для устремления /ʰ / и хриплый голос /ʱ / в Пенджаби и Урду. [D] U + 06BE никто никто никто ھ ه
ے ـے конец
Только
Baī ye (‘большой yā ‘), представляет собой «ai» или «e» в Урду /ɛː /, /eː / и Пенджаби. U + 06D2 никто никто никто ے ي
ڞ ڞـ ـڞـ ـڞ используется для обозначения фонемы /tsʰ / (пиньинь c) в Китайский. U + 069E 3 точки никто ص ص ض
ط طـ ـطـ ـط используется для обозначения фонемы /это / (пиньинь z) в Китайский. U + 0637 ط ط
ۉ ۉ ـۉ представляет собой «о» закругленная гласная с открытой серединой спины /ɔ / фонема в Боснийский. U + 06C9 ◌ٛ V указывает вверх никто و و
ݩ ݩـ ـݩـ ـݩ представляет собой «њ» небный носовой /ɲ / фонема в Боснийский. U + 0769 ◌ٚ 1 точка
V указывает вниз
никто ں ن
ڵ ڵـ ـڵـ ـڵ используется в Курдский представлять все /ɫ / в Диалект сорани. U + 06B5 ◌ٚ V указывает вниз никто ل ل
ڵ ڵـ ـڵـ ـڵ представляет собой «љ» небный боковой аппроксимант /ʎ / фонема в Боснийский. U + 06B5 ◌ٚ V указывает вниз никто ل ل
اٖى اٖىـ ـاٖىـ ـاٖى представляет собой «и» закрытый передний неокругленный гласный /я / фонема в Боснийский. U + 0627 U + 0656 U + 0649 ◌ٖ Алеф никто اى اٖ + ى
Сноски:
  1. ^ Справа: начало, середина, конец и изолированные формы.
  2. ^ Присоединяется к букве, ближайшей к букве, по первой букве или выше.
  3. ^ Дальше от буквы, или по второй букве, или ниже.
  4. ^ Показано в Насх (вверху) и Насталик (внизу) стили. В версии Насталик связанные формы связаны друг с другом, потому что символ татвил U + используется для отображения других форм не работает во многих Насталик шрифты.

Построение букв

Большинство языков, использующих алфавиты на основе арабского алфавита, используют одни и те же базовые формы. Большинство дополнительных букв в языках, использующих алфавиты на основе арабского алфавита, создаются путем добавления (или удаления) диакритических знаков к существующим арабским буквам. Некоторые стилистические варианты на арабском языке имеют разные значения на других языках. Например, вариантные формы каф ك ک ڪ используются в некоторых языках и иногда имеют особые значения. В урду и некоторых соседних языках буква Hā распалась на две формы. ھ dō-čašmī hē и ہ ہـ ـہـ ـہ gōl hē.[40] в то время как вариантная форма ي я упоминается как baī yē ے используется в конце некоторых слов.[40]

Таблица компонентов письма

сокращения, используемые ниже

А = Буква используется для большинства языков и диалектов с системами письма, основанными на арабском языке.

MSA = Буквы, используемые в Современный стандартный арабский.

CA = Буквы, используемые в Классический арабский.

ОБЪЯВЛЕНИЕ = Буквы используются в некоторых региональных Арабские диалекты.

«Арабский» = Буквы, используемые в классическом арабском, современном стандартном арабском языке и большинстве региональных диалектов.

«Фарси» = Буквы, используемые в современном персидском языке.

FW = Иностранные слова: буква иногда используется для написания иностранных слов.

SV = Стилистический вариант: буква используется взаимозаменяемо как минимум с одной другой буквой в зависимости от каллиграфический стиль.

AW = Арабские слова: буква используется в дополнительных языках для написания арабских слов.

Стол

Без дополнений
Формы линий букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
позиционные формы изолированные ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
Начните ء ا никто ىـ (YNB) ٮـ حـ سـ صـ طـ عـ ڡـ (QF) ٯـ ڪـ كـ کـ گـ لـ مـ د ر و ھـ ہـ هـ لا
середина ء ـا никто ـىـ (YNB) ـٮـ ـحـ ـسـ ـصـ ـطـ ـعـ ـڡـ (QF) ـٯـ ـڪـ ـكـ ـکـ ـگـ لـ ـمـ ـد ـر ـو ـھـ ـہـ ـهـ ـلا
конец ء ـا ـے ـى ـں ـٮ ـح ـس ـص ـط ـع ـڡ ـٯ ـڪ ـك ـک ـگ ـل ـم ـد ـر ـو ـھ ـہ ـه ـلا
изображение форм изолированные
Начните
середина
конец
ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
Unicode для выше U + 0621 U + 0627 U + 06D2 U + 0649 U + 06BA U + 066E U + 062D U + 0633 U + 0635 U + 0637 U + 0639 U + 06A1 U + 066F U + 06AA U + 0643 U + 06A9 U + 06AF U + 0644 U + 0645 U + 062F U + 0631 U + 0648 U + 06BE U + 06C1 U + 0647 ا + ل
Языки которые используют форму буквы с или без я джам арабский арабский Урду арабский арабский арабский арабский арабский арабский арабский арабский арабский арабский Синдхи, арабский SV арабский фарси, Урду, арабский SV фарси, Урду арабский арабский арабский арабский арабский Урду, арабский SV Урду, арабский SV арабский, фарси арабский
диакритические знаки (я) изолированные ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
никто Начните
середина
конец
ء ـا ا  ـــے ے   ىـ
ـىـ
ـى
ـں ں ٮـ
ـٮـ
ـٮ
حـ
ـحـ
ـح
سـ
ـسـ
ـس
صـ
ـصـ
ـص
طـ
ـطـ
ـط
عـ
ـعـ
ـع
ڡـ
ـڡـ
ـڡ
ٯـ
ـٯـ
ـٯ
ڪــ
ـڪــ
ـڪ
كـ
ـكـ
ـك
کـ
ـکـ
ـک
گـ
ـگـ
ـگ
لـ
لـ
ـل
مـ
ـمـ
ـم
ـد د ـر ر ـو و ھـ
ـھـ
ـھ
ہـ
ـہـ
ـہ
هـ
ـهـ
ـه
ـلا لا
Языки используя голую форму без добавлений арабский арабский, фарси, Урду Урду MSA Урду, Арабский SV Арабский SV Расм арабский, фарси, Урду арабский, фарси, Урду арабский, фарси, Урду арабский, фарси, Урду арабский, фарси, Урду Арабский SV в Расм Арабский SV в Расм Синдхи, арабский SV арабский фарси, Урду, Арабский SV фарси, Урду арабский, фарси, Урду арабский, фарси, Урду арабский, фарси, Урду арабский, фарси, Урду арабский, фарси, Урду Урду, Арабский SV Урду, Арабский SV арабский, фарси MSA
Unicode для выше U + 0621 U + 0627 U + 06D2 U + 0649 U + 06BA U + 066E U + 062D U + 0633 U + 0635 U + 0637 U + 0639 U + 06A1 U + 066F U + 06AA U + 0643 U + 06A9 U + 06AF U + 0644 U + 0645 U + 062F U + 0631 U + 0648 U + 06BE U + 06C1 U + 0647 ل + ا
Голая линия только в изолированной и конечной формах изолированные ء ا ے ی ٮ ح س ص ط ع ڪ ك ک گ ل م د ر و ھ ہ ه لا
Начните
середина
конец
یـ
ـیـ
ـی
ࢽـ
ـࢽـ
ـࢽ
ࢻـ
ـࢻـ
ـࢻ
ࢼـ
ـࢼـ
ـࢼ
изображение
Языки
Unicode U + 08BD U + 08BB U + 08BC
точки
1
Диакритики (я) Формы букв:
(ii)
ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
1 точка ниже   ◌࣭   ◌ٜ   ــٜـ    ﮳   изолированные ء ا ے ى ں ب ج س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
связаны بـ ـبـ ـب جـ ـجـ ـج
изображение
Языки
U + FBB3 U + 065C Unicode U + 0628 U + 062C
1 точка вверху + 1 точка внизу  ﮲﮳  изолированные ء ا ے ى ڹ ٮ ح ښ ۻ ط ۼ ڣ ٯ ڪ ك ک گ ل م د ږ و ھ ہ ه لا
связаны
изображение
Языки
Unicode
1 точка выше ◌࣪   изолированные ء ا ے ى ن ٮ خ س ض ظ غ ف ڧ ڪ ك ک گ ل م ذ ز و ھ ہ ه لا
связаны
изображение
Языки
U + FBB2 Unicode U + 0646 U + 062E U + 0636 U + 0638 U + 063A U + 0641 U + 06A7 U + 0630 U + 0632
2
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
2 точки ниже
начало и середина (iii)
изолированная форма ء ا ے یـ ـیـ ـی ی ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки фарси, Урду, AD
U + FBB5 U + FBB5 Unicode U + 06CC
2 точки ниже
все позиции
изолированная форма ء ا ے يـ ـيـ ـي ي ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки арабский (iv)
U + FBB5 U + FBB5 Unicode U + 064A
2 вертикальные точки внизу       изолированная форма ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
U + FBBE Unicode
2 вертикальные точки вверху       изолированная форма ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
U + FBBD Unicode
2 горизонтальных
точки выше
изолированная форма ء ا ے ى ں ت ح س ص ط ع ڡ ق ڪ ك ک گ ل م د ر و ھ ـۃ ـة لا
изображение
Языки
FBB4 Unicode U + 062A U + 0642 U + 06C3 U + 0629
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
вверху: 2 точки
внизу: 2 точки
вверху: 2 точки
(вертикально)
внизу: 2 точки
(вертикально)
U + 08EB (2283) ◌࣫ ДВЕ ТОЧКИ ВЫШЕ
U + 08EE (2286) ◌࣮ ДВЕ ТОЧКИ НИЖЕ
3
ث پ چ ژ ش Арабский и персидский
ݑ ڥ ڤ ڨ ڠ ڟ ڞ ۺ ڜ ڛ څ ۋ ڮ ڴ ڷ ڸ другое указание
ݤ ڏ ݓ ݒ ݡ ݘ ݞ перевернутый
3 точки внизу (по горизонтали)

 ﮳ ﮳ ﮳ 

персонаж ء ا ے ى ں ݐ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки Фула
Unicode U + 0750
3 точки внизу (перевернутые)    персонаж ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
U + FBB7 Unicode
3 точки ниже    изолированная форма ء ا ے ى ں پ چ س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
U + FBB9 Unicode U + 067E U + 0686
3 точки выше
+ 3 точки ниже
   изолированная форма ء ا ے ى ں ٮ ح ڜ ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
U + FBB6 + U + FBB9 Unicode
3 точки выше    изолированная форма ث ش ژ
изображение
Языки
U + FBB6 Unicode U + 062B U + 0634 U + 0698
3 точки вверху (перевернутые)    персонаж ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
U + FBB8 Языки
Unicode
4
4 точки ниже      изолированная форма ء ا ے ى ں ڀ ڇ س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
U + FBBB Unicode
4 точки выше      изолированная форма ء ا ے ى ں ٿ ح ݜ ص ط ع ڦ ٯ ڪ ك ک گ ل م ڐ ڙ و ھ ہ ه لا
изображение
Языки Шина, Торвали Синдхи, Шина, Торвали
U + FBBA Unicode U + 067F U + 075C U + 0690 U + 0699
разные точки сверху и снизу
  • ݓ U + 0753, ݓ АРАБСКАЯ БУКВА BEH С ТРЕМЯ ТОЧКАМИ, УКАЗАННЫМИ ВВЕРХ НИЖЕ, И ДВУМЯ ТОЧКАМИ ВЫШЕ. Хауса https://en.wiktionary.org/wiki/%DD%93
  • ݑ U + 0751, ݑ АРАБСКАЯ БУКВА BEH С ТОЧКОЙ НИЖЕ И ТРЕМЯ ТОЧКАМИ ВЫШЕ. Волоф https://en.wiktionary.org/wiki/%DD%91
смешанные точки
выше + ниже
изолированная форма ء ا ے ى ں ٮ ڿ ۺ ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
Unicode
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
палец
маленький tōē
ниже
изолированная форма ء ا ے ى ں ٮ ݮ س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
связная форма (ы) ݮـ ـݮـ ـݮ
изображение U + 076E Насх style.svg
Unicode U + 076E
Языки Ховар
маленький tōē
над
ـــؕــ     ◌ؕ изолированная форма ء ا ے ى ڻ ٹ ح س ص ط ع ڡ ٯ ڪ ك ک گ   لؕ م ڈ ڑ و ھ ہ ه لا
связная форма (ы)
изображение
Урду Пенджаби Языки Пенджаби Урду Пенджаби [39] Урду Урду
U + 0615 U + FBC0 Unicode U + 06BB U + 0679 U + 0688 U + 0691
маленький tōē + точка (и) изолированная форма ء ا ے ى ݨ ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
связная форма (ы)
изображение
Языки Пенджаби, Сераики, Шина
Unicode
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
звенеть
звенеть       изолированная форма ء ا ے ؠ ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ګ گ ل م ډ ړ ۄ ھ ہ ه لا
изображение
Языки
FBBF Unicode
кольцо и точки изолированная форма ء ا ے ى ڼ ټ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Языки
Unicode
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
линия
горизонтальная линия изолированная форма ء ا ے ۍ ـۍ ں ٮ ح س ص ط ع ڡ ؈ ڪ ك گ ݪ م د ݛ ۅ ھ ہ ه لا
изображение
Языки Пенджаби, Марвари, Калами Киргиз[нужна цитата ]
Unicode U + 075B
несколько строк        изолированная форма ۽ ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ۾ د ر و ھ ہ ه لا
изображение
Языки
U + FBBC Unicode U + 08A6
вертикальная линия изолированная форма ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر

ۈ

ھ ہ ه لا
изображение
Языки
Unicode
цифра
  • Бурушаски ݸ
  • Бурушаски ݹ
  • Бурушаски ݳ
  • Бурушаски ݴ
  • Бурушаски ݶ
  • Бурушаски ݷ
  • Бурушаски ݻ

https://hisamullahbeg.blogspot.com/2010/04/burushaski-primer.html

диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ك ڪ ک گ ل م د ر و ھ ہ ه لا
Персидская цифра 2 сверху ٢ ٢ изолированная форма ء ا ݺ ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر ݸ ھ ہ ه لا
изображение
Бурушаски Языки Бурушаски Бурушаски
Unicode U + 077A
Персидская цифра 3 сверху ٣ ٣ изолированная форма ء ا ݻ ݶ ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Бурушаски Языки Бурушаски
Unicode U + 077B
Персидская цифра 4 сверху ۴ ۴ изолированная форма ء ا ے ى ں ٮ ح ݽ ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Бурушаски Языки Бурушаски
Unicode U + 077D
Персидская цифра 4 внизу ۴ ۴ изолированная форма ء ا ے ݷ ں ٮ ݼ س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Бурушаски Языки Бурушаски
Unicode U + 077C
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
стрелки
V ниже   ٚ     ٛ   изолированная форма ء ا ے ى ں ݕ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ڕ و ھ ہ ه لا
изображение
Языки Волоф
U + 065B U + 065A Unicode
маленький V наверху ــٚـ ◌ٚ изолированная форма ء ا ے ێ ں ݖ ح س ص ط ع ڡ ٯ ڪ ك ک گ ڵ م د ڒ ۆ ھ ہ ه لا
изображение
Языки Волоф
U + 065A Unicode U + 0756
перевернутая буква V выше ــٛـ ◌ٛ изолированная форма ء ا ے ؽ ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م ۮ ۯ ۉ ۿ ہ ه لا
изображение
U + 065B Unicode
Языки
стрелка и точки изолированная форма ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Unicode
Языки
Хамза
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
Хамза ниже ــٕـ ◌ٕ изолированная форма ء إ ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لإ
изображение
иногда опускается в контекстах, где опускаются диакритические знаки коротких гласных Языки
U + 0655 Unicode U + 0625 U + 0644
+ U + 0625
Хамза над ــٔـ ◌ٔ изолированная форма ء أ ۓ ئ ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر ؤ ھ ۂ ۀ لأ
изображение
иногда опускается в контекстах, где опускаются диакритические знаки коротких гласных Языки
U + 0674 U + 0654 Unicode U + 0623 U + 06D3 U + 0626 U + 0624 U + 06C2 U + 06C0 U + 0644
+ U + 0623
Хамза и точки изолированная форма ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
изображение
Unicode
Языки
другие полуобязательные гласные
мадда над ــۤـ ــٓـ ◌ٓ ◌ۤ изолированная форма ء آ ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لآ
изображение
строго не считается я джам, но используется во многих ситуациях, когда не учитываются другие диакритические знаки. Языки арабский, Урду
U + 06E4 U + 0653 Unicode U + 0622
Васала над изолированная форма ء ٱ ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا

Васала на экране 20200507.png

изображение

Алеф Васала on screen 20200507w.png

Языки CA
никто
(v)
Unicode U + 0671
диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ڪ ك ک گ ل م د ر و ھ ہ ه لا
конец стола

|-|}[требуется разъяснение ]

пустая строка для новых записей

диакритические знаки (я) Формы букв (ii) ء ا ے ى ں ٮ ح س ص ط ع ڡ ٯ ك ڪ ک گ ل م د ر و ھ ہ ه لا

Рекомендации

  • [41]
  • [42]

сноски

^ я. В я джам диакритические знаки носят исключительно иллюстративный характер, в большинстве наборов используются комбинированные символы в середине таблицы. Символы, используемые для обозначения согласных диакритических знаков, взяты из Unicode набор «Арабские педагогические символы».[43] «Арабский Tatweel Буква-модификатор » U + 0640 символ, используемый для отображения позиционных форм, не работает в некоторых Насталик шрифты.

^ II. Для большинства букв отображается изолированная форма, для выбранных букв показаны все формы (изолированные, начальная, средняя и конечная).

^ iii. Урду Choti Yē имеет 2 точки внизу только в начальной и средней позиции. В стандартный арабский версия ي يـ ـيـ ـي всегда имеет 2 точки внизу.

^ iv. Эти символы используются в большинстве языков, использующих системы письма на основе арабского языка, хотя иногда только в иностранных словах.

^ v. Был предложен диакритический символ Unicode васала, но он еще не выпущен.[нужна цитата ]

Смотрите также

  • История арабского алфавита
  • Восточные арабские цифры (формы цифр, обычно используемые в арабском письме)
  • Арабский (блок Unicode)
  • Транслитерация арабского языка
  • Сяо’эрцзин

Рекомендации

  1. ^ Махинназ Мирдехган. 2010. Персидский, урду и пушту: сравнительный орфографический анализ. Исследование систем письма Vol. 2, № 1, 9–23.
  2. ^ «Exposición Virtual. Biblioteca Nacional de España». Bne.es. Архивировано из оригинал на 2012-02-18. Получено 2012-04-06.
  3. ^ «Арабский алфавит». Британская энциклопедия онлайн. В архиве из оригинала 26 апреля 2015 г.. Получено 2015-05-16.
  4. ^ Ахмад, Сайед Баракат. (11 января 2013 г.). Введение в кораническое письмо. ISBN  978-1-136-11138-9. OCLC  1124340016.
  5. ^ «Саяд Захур Шах Хашмий». baask.com.
  6. ^ | Академия защиты белуджского языка
  7. ^ Сарлак, Ризня (2002). «Словарь бахтиарского диалекта чахар-ланг». google.com.eg.
  8. ^ Иран, Модждех (5 февраля 2011 г.). «Видео на бахтиарском языке (bak) بختياري ها! خبری مهم» — через Vimeo.
  9. ^ «Этнолог». Получено 1 февраля, 2020.
  10. ^ «Пакистан должен помнить обо всех своих языках!». tribune.com.pk.
  11. ^ «Этнолог». Получено 1 февраля, 2020.
  12. ^ «Этнолог». Получено 1 февраля, 2020.
  13. ^ Хадим. «Бельцы на английский». khadimskardu1.blogspot.com.
  14. ^ «Библия на Брахуе». Worldscriptures.org. Архивировано из оригинал 30 октября 2016 г.. Получено 5 августа, 2013.
  15. ^ «ХУНЗИНСКИЙ ФОРУМ РАЗВИТИЯ». hisamullahbeg.blogspot.com.
  16. ^ «Читтагонский». scriptsource.org.
  17. ^ «Книга на языке рохинджа от А до Я». Scribd.
  18. ^ «Ида’ан». scriptsource.org.
  19. ^ urangCam. «Bông S». naipaleikaohkabuak.blogspot.com.
  20. ^ «Зриби, И., Бужельбан, Р., Масмуди, А., Эллуз, М., Белгит, Л., и Хабаш, Н. (2014). Обычная орфография для тунисского арабского языка. In Proceedings of the Language Resources and Evaluation Конференция (LREC), Рейкьявик, Исландия «.
  21. ^ Брустад, К. (2000). Синтаксис разговорного арабского языка: сравнительное исследование марокканских, египетских, сирийских и кувейтских диалектов. Издательство Джорджтаунского университета.
  22. ^ «Уголок коптских исследований». stshenouda.com. Архивировано из оригинал на 2012-04-19. Получено 2012-04-17.
  23. ^ «- Колыбель нубийской цивилизации -«. thenubian.net.
  24. ^ «2» Ал-Нуба египет ». 19 июля 2012 г. Архивировано с оригинал 19 июля 2012 г.
  25. ^ «Зарма». scriptsource.org.
  26. ^ «Тадаксахак». scriptsource.org.
  27. ^ «Потерянный язык — Бостония, лето 2009». bu.edu.
  28. ^ «Дюла». scriptsource.org.
  29. ^ «Жола-Фоньи». scriptsource.org.
  30. ^ «Рукопись Ибн Сайида». Архивировано из оригинал на 2015-09-08. Получено 2018-09-27.
  31. ^ «Арабское письмо Мухаммеда». Архивировано из оригинал на 2015-09-08. Получено 2018-09-27.
  32. ^ «Чарнское письмо». Мусульмане в Америке. Архивировано из оригинал 20 мая 2013 г.. Получено 5 августа, 2013.
  33. ^ Алфавитные переходы — латинский шрифт: новая хронология — символ нового Азербайджана, Тамам Баятлы
  34. ^ Сухай Сиддикзода. «Таджикский язык: фарси или не фарси?» (PDF). Архивировано из оригинал (PDF) 13 июня 2006 г.
  35. ^ Эскудеро Паскуаль Альберто (23 октября 2005 г.). «Системы письма / Скрипты» (PDF). Учебник по локализации программного обеспечения. it46.se. Архивировано из оригинал (PDF) 19 марта 2009 г.. Получено 20 ноября 2006.
  36. ^ «Краткая история письма на чеченском языке». Архивировано из оригинал 23 декабря 2008 г.
  37. ^ п. 20, Сэмюэл Ноэль Крамер. 1986. В мире Шумера: автобиография. Детройт: Издательство государственного университета Уэйна.
  38. ^ J. Blau. 2000. Иврит, написанный арабскими буквами: пример радикального изменения традиции. (На иврите с резюме на английском языке). В Наследие и инновации в иудео-арабской культуре: материалы шестой конференции Общества иудео-арабских исследований, п. 27-31. Рамат-Ган.
  39. ^ а б Лорна Прист Эванс; М. Г. Аббас Малик. «Предложение закодировать арабскую букву LAM МАЛЕНЬКОЙ АРАБСКОЙ БУКВОЙ TAH ВЫШЕ в UCS» (PDF). www.unicode.org. Получено 10 мая 2020.
  40. ^ а б «Алфавит урду». www.user.uni-hannover.de. Получено 4 мая 2020.
  41. ^ «Расширенное арабское письмо». unicode.org. Получено 7 мая 1920.
  42. ^ «На основе ISO 8859-6». unicode.org. Получено 7 мая 1920.
  43. ^ «Утилиты Unicode: UnicodeSet арабские педагогические символы». unicode.org. Получено 20 марта 2020.

внешняя ссылка

СМИ, связанные с Арабский шрифт в Wikimedia Commons

  • Диаграммы сопоставления Unicode —Включая арабские буквы, отсортированные по форме
  • Почему правое полушарие вашего мозга не любит арабский
  • Арабские шрифты от SIL’s Non-Roman Script Initiative
  • Алексис Нем и Себастьян Помье (2019), Восстановление арабских гласных с помощью поиска в словаре, допускающем пропуски, Lang Resources & Evaluation, Том 53, 1–65 страниц

Понравилась статья? Поделить с друзьями:
  • Как пишется арабская буква уау
  • Как пишется арабская буква син
  • Как пишется арабо израильский
  • Как пишется арабеск на французском
  • Как пишется араб на английском