From Wikipedia, the free encyclopedia
For the Arabic script as it is used specifically to write Arabic, see Arabic alphabet.
Arabic script | |
---|---|
Script type |
Abjad primarily Alphabet in some adaptations |
Time period |
400–present |
Direction | right-to-left script |
Official script |
18 sovereign states
Co-official script in: 10 sovereign states
|
Languages | See below |
Related scripts | |
Parent systems |
Egyptian hieroglyphs
|
Child systems |
N’Ko Hanifi script |
ISO 15924 | |
ISO 15924 | Arab (160), Arabic |
Unicode | |
Unicode alias |
Arabic |
Unicode range |
|
This article contains phonetic transcriptions in the International Phonetic Alphabet (IPA). For an introductory guide on IPA symbols, see Help:IPA. For the distinction between [ ], / / and ⟨ ⟩, see IPA § Brackets and transcription delimiters. |
The Arabic script is the writing system used for Arabic and several other languages of Asia and Africa. It is the second-most widely used writing system in the world by number of countries using it or a script directly derived from it, and the third-most by number of users (after the Latin and Chinese scripts).[1]
The script was first used to write texts in Arabic, most notably the Quran, the holy book of Islam. With the religion’s spread, it came to be used as the primary script for many language families, leading to the addition of new letters and other symbols. Such languages still using it are: Persian (Farsi/Dari), Malay (Jawi), Uyghur, Kurdish, Punjabi (Shahmukhi), Sindhi, Balti, Balochi, Pashto, Lurish, Urdu, Kashmiri, Rohingya, Somali and Mandinka, Mooré among others.[2] Until the 16th century, it was also used for some Spanish texts, and—prior to the language reform in 1928—it was the writing system of Turkish.[3]
The script is written from right to left in a cursive style, in which most of the letters are written in slightly different forms according to whether they stand alone or are joined to a following or preceding letter. However, the basic letter form remains unchanged. The script does not have capital letters.[4] In most cases, the letters transcribe consonants, or consonants and a few vowels, so most Arabic alphabets are abjads, with the versions used for some languages, such as Sorani, Uyghur, Mandarin, and Serbo-Croatian, being alphabets. It is also the basis for the tradition of Arabic calligraphy.
Worldwide use of the Arabic and Perso-Arabic script | ||
---|---|---|
|
||
Countries where the Arabic script is: | ||
→ | the sole official script | |
→ | official alongside other scripts | |
→ | official at a provincial level (China, India, Tanzania) or a recognized second script of the official language (Malaysia, Tajikistan) |
History[edit]
The Arabic alphabet is derived either from the Nabataean alphabet[5][6] or (less widely believed) directly from the Syriac alphabet,[7] which are both derived from the Aramaic alphabet (which also gave rise to the Hebrew alphabet), which, in turn, descended from the Phoenician alphabet. In addition to the Aramaic script (and, therefore, the Arabic and Hebrew scripts), the Phoenician script also gave rise to the Greek alphabet (and, therefore, both the Cyrillic alphabet and the Latin alphabet used to write this article).
Origins[edit]
In the 6th and 5th centuries BCE, northern Arab tribes emigrated and founded a kingdom centred around Petra, Jordan. These people (now named Nabataeans from the name of one of the tribes, Nabatu) spoke Nabataean Arabic, a dialect of the Arabic language. In the 2nd or 1st centuries BCE,[8][9] the first known records of the Nabataean alphabet were written in the Aramaic language (which was the language of communication and trade), but included some Arabic language features: the Nabataeans did not write the language which they spoke. They wrote in a form of the Aramaic alphabet, which continued to evolve; it separated into two forms: one intended for inscriptions (known as «monumental Nabataean») and the other, more cursive and hurriedly written and with joined letters, for writing on papyrus.[10] This cursive form influenced the monumental form more and more and gradually changed into the Arabic alphabet.
Overview[edit]
خ | ح | ج | ث | ت | ب | ا |
khā’ | ḥā’ | jīm | tha’ | tā’ | bā’ | alif |
ص | ش | س | ز | ر | ذ | د |
ṣād | shīn | sīn | zāy / zayn |
rā’ | dhāl | dāl |
ق | ف | غ | ع | ظ | ط | ض |
qāf | fā’ | ghayn | ‘ayn | ẓā’ | ṭā’ | ḍād |
ي | و | ه | ن | م | ل | ك |
yā’ | wāw | hā’ | nūn | mīm | lām | kāf |
(see below for other alphabets) |
The Arabic script has been adapted for use in a wide variety of languages besides Arabic, including Persian, Malay and Urdu, which are not Semitic. Such adaptations may feature altered or new characters to represent phonemes that do not appear in Arabic phonology. For example, the Arabic language lacks a voiceless bilabial plosive (the [p] sound), therefore many languages add their own letter to represent [p] in the script, though the specific letter used varies from language to language. These modifications tend to fall into groups: Indian and Turkic languages written in the Arabic script tend to use the Persian modified letters, whereas the languages of Indonesia tend to imitate those of Jawi. The modified version of the Arabic script originally devised for use with Persian is known as the Perso-Arabic script by scholars.[citation needed]
When the Arabic script is used to write Serbo-Croatian, Sorani, Kashmiri, Mandarin Chinese, or Uyghur, vowels are mandatory. The Arabic script can, therefore, be used as a true alphabet as well as an abjad, although it is often strongly, if erroneously, connected to the latter due to it being originally used only for Arabic.[citation needed]
Use of the Arabic script in West African languages, especially in the Sahel, developed with the spread of Islam. To a certain degree the style and usage tends to follow those of the Maghreb (for instance the position of the dots in the letters fāʼ and qāf).[11][12] Additional diacritics have come into use to facilitate the writing of sounds not represented in the Arabic language. The term ʻAjamī, which comes from the Arabic root for «foreign,» has been applied to Arabic-based orthographies of African languages.[citation needed]
Wikipedia in Arabic script of five languages
Table of writing styles[edit]
Script or style | Alphabet(s) | Language(s) | Region | Derived from | Comment |
---|---|---|---|---|---|
Naskh | Arabic & others |
Arabic & others |
Every region where Arabic scripts are used | Sometimes refers to a very specific calligraphic style, but sometimes used to refer more broadly to almost every font that is not Kufic or Nastaliq. | |
Nastaliq | Urdu, Persian, & others |
Urdu, Persian, & others |
Southern and Western Asia | Taliq | Used for almost all modern Urdu text, but only occasionally used for Persian. (The term «Nastaliq» is sometimes used by Urdu speakers to refer to all Perso-Arabic scripts.) |
Taliq | Persian | Persian | A predecessor of Nastaliq. | ||
Kufic | Arabic | Arabic | Middle East and parts of North Africa | ||
Rasm | Restricted Arabic alphabet | Arabic | Mainly historical | Omits all diacritics including i’jam. Digital replication usually requires some special characters. See: ٮ ڡ ٯ (links to Wiktionary). |
Table of alphabets[edit]
Alphabet | Letters | Additional Characters |
Script or Style | Languages | Region | Derived from: (or related to) |
Note |
---|---|---|---|---|---|---|---|
Arabic | 28 | ^(see above) | Naskh, Kufi, Rasm, & others | Arabic | North Africa, West Asia | Aramaic, Syriac, Nabataean |
|
Ajami script | 33 | ٻ تٜ تٰٜ | Naskh | Hausa, Yoruba, Swahili | West Africa | Arabic | Abjad |
Aljamiado | 28 | Naskh | Old Spanish, Mozarabic, Ladino, Aragonese, Old Galician-Portuguese | Southwest Europe | Arabic | 8th-13th centuries for Mozarabic, 14th-16th centuries for the other languages | |
Arebica | 30 | ڄ ە اٖى ي ڵ ںٛ ۉ ۆ | Naskh | Serbo-Croatian | Southeastern Europe | Perso-Arabic | Latest stage has full vowel marking |
Arwi alphabet | 41 | ڊ ڍ ڔ صٜ ۻ ࢳ ڣ ࢴ ڹ ݧ | Naskh | Tamil | Southern India, Sri Lanka | Perso-Arabic | |
Belarusian Arabic alphabet | 32 | ࢮ ࢯ | Naskh | Belarusian | Eastern Europe | Perso-Arabic | 15th / 16th century |
Balochi Standard Alphabet(s) | 29 | ٹ ڈ ۏ ݔ ے | Naskh and Nastaliq | Balochi | South-West Asia | Perso-Arabic, also borrows multiple glyphs from Urdu | This standardization is based on the previous orthography. For more information, see Balochi writing. |
Berber Arabic alphabet(s) | 33 | چ ژ ڞ ݣ ء | Various Berber languages | North Africa | Arabic | ||
Burushaski | 53 | ݳ ݴ ݼ څ ڎ ݽ ڞ ݣ ݸ ݹ ݶ ݷ ݺ ݻ (see note) |
Nastaliq | Burushaski | South-West Asia (Pakistan) | Urdu | Also uses the additional letters shown for Urdu.(see below) Sometimes written with just the Urdu alphabet, or with the Latin alphabet. |
Chagatai alphabet | 32 | ݣ | Nastaliq and Naskh | Chagatai | Central Asia | Perso-Arabic | ݣ is interchangeable with نگ and ڭ. |
Galal | 32 | Naskh | Somali | Horn of Africa | Arabic | ||
Jawi | 36 | ڠ ڤ ݢ ڽ ۏ ى | Naskh | Malay | Peninsular Malaysia, Sumatra and part of Borneo | Perso-Arabic | Since 1303 AD (Trengganu Stone) |
Kashmiri | 44 | ۆ ۄ ؠ ێ | Nastaliq | Kashmiri | South Asia | Urdu | This orthography is fully voweled. 3 out of the 4 (ۆ, ۄ, ێ) additional glyphs are actually vowels. Not all vowels are listed here since they are not separate letters. For further information, see Kashmiri writing. |
Kazakh Arabic alphabet | 35 | ٵ ٶ ﯗ ٷ ﯞ ۆ ە ھ ﻯ ٸ ي | Naskh | Kazakh | Central Asia, China | Chagatai | In use since 11th century, reformed in the early 20th century, now official only in China |
Khowar | 45 | ݯ ݮ څ ځ ݱ ݰ ڵ | Nastaliq | Khowar | South Asia | Urdu, however, borrows multiple glyphs from Pashto | |
Kyrgyz Arabic alphabet | 33 | ۅ ﯗ ۉ ﯞ ە ﻯ ي | Naskh | Kyrgyz | Central Asia | Chagatai | In use since 11th century, reformed in the early 20th century, now official only in China |
Pashto | 45 | ټ څ ځ ډ ړ ږ ښ ګ ڼ ۀ ي ې ۍ ئ | Naskh and occasionally, Nastaliq | Pashto | South-West Asia, Afghanistan and Pakistan | Perso-Arabic | ګ is interchangeable with گ. Also, the glyphs ی and ې are often replaced with ے in Pakistan. |
Pegon script | 35 | ڎ ڟ ڠ ڤ ڮ ۑ | Naskh | Javanese, Sundanese | South-East Asia (Indonesia) | Perso-Arabic | |
Persian | 32 | پ چ ژ گ | Naskh and Nastaliq | Persian (Farsi) | West Asia (Iran etc. ) | Arabic | Also known as Perso-Arabic. |
Saraiki | 45 | ٻ ڄ ݙ ڳ | Nastaliq | Saraiki | South-West Asia (Pakistan) | Shahmukhi | |
Shahmukhi | 41+ (see note) |
ࣇ ݨ | Nastaliq | Punjabi | South-West Asia (Pakistan) | Urdu | Similar to Urdu; 58[citation needed] letters including digraphs for aspirated consonants. |
Sindhi | 64 | ڪ ڳ ڱ گ ک پ ڀ ٻ ٽ ٿ ٺ ڻ ڦ ڇ چ ڄ ڃ ھ ڙ ڌ ڏ ڎ ڍ ڊ |
Naskh | Sindhi | South-West Asia (Pakistan) | Perso-Arabic | |
Sorabe | 28 | Naskh | Malagasy | Madagascar | Arabic | ||
Soranî | 33 | ڕ ڤ ڵ ۆ ێ | Naskh, and occasionally, Nastaliq | Central Kurdish | Middle-East | Perso-Arabic | Vowels are mandatory, i.e. alphabet |
Swahili Arabic script | 28 | Naskh | Swahili | Western and Southern Africa | Arabic | ||
İske imlâ | 35 | ﯞ | Naskh | Tatar | Volga region | Chagatai | Used prior to 1920. |
Ottoman Turkish | 32 | Ottoman Turkish | Ottoman Empire | Chagatai | Official until 1928 | ||
Urdu | 39+ (see notes) |
ٹ ڈ ڑ ں ہ ھ ے (see notes) |
Nastaliq | Urdu | South Asia | Perso-Arabic | 58[citation needed] letters including digraphs representing aspirated consonants. بھ پھ تھ ٹھ جھ چھ دھ ڈھ کھ گھ |
Uyghur | 32 | ئا ئە ھ ئو ئۇ ئۆ ئۈ ۋ ئې ئى | Naskh | Uyghur | China, Central Asia | Chagatai | Reform of older Arabic-script Uyghur orthography that was used prior the 1950s. Vowels are mandatory, i.e. alphabet |
Wolofal | 33 | ݖ گ ݧ ݝ ݒ | Naskh | Wolof | West Africa | Arabic, however, borrows at least one glyph from Perso-Arabic | |
Xiao’erjing | 36 | ٿ س﮲ ڞ ي | Naskh | Sinitic languages | China, Central Asia | Chagatai | Used to write Chinese languages by Muslims living in China such as the Hui people. |
Yaña imlâ | 29 | ئا ئە ئی ئو ئۇ ئ ھ | Naskh | Tatar | Volga region | İske imlâ alphabet | 1920–1927 replaced with Cyrillic |
Current use[edit]
Today Iran, Afghanistan, Pakistan, India, and China are the main non-Arabic speaking states using the Arabic alphabet to write one or more official national languages, including Azerbaijani, Baluchi, Brahui, Persian, Pashto, Central Kurdish, Urdu, Sindhi, Kashmiri, Punjabi and Uyghur.[citation needed]
An Arabic alphabet is currently used for the following languages:[citation needed]
Middle East and Central Asia[edit]
- Arabic
- Garshuni (or Karshuni) originated in the 7th century, when Arabic became the dominant spoken language in the Fertile Crescent, but Arabic script was not yet fully developed or widely read, and so the Syriac alphabet was used. There is evidence that writing Arabic in this other set of letters (known as Garshuni) influenced the style of modern Arabic script. After this initial period, Garshuni writing has continued to the present day among some Syriac Christian communities in the Arabic-speaking regions of the Levant and Mesopotamia.
- Kazakh in Kazakhstan, China, Iran and Afghanistan
- Kurdish in Northern Iraq and Northwest Iran. (In Turkey and Syria the Latin script is used for Kurdish)
- Kyrgyz by its 150,000 speakers in the Xinjiang Uyghur Autonomous Region in northwestern China, Pakistan, Kyrgyzstan and Afghanistan
- Turkmen in Turkmenistan,[verification needed] Afghanistan and Iran
- Uzbek in Uzbekistan[verification needed] and Afghanistan
- Persian in Iranian Persian and Dari in Afghanistan. It had former use in Tajikistan but is no longer used in Standard Tajik
- Baluchi in Iran, in Pakistan’s Balochistan region, Afghanistan and Oman[13]
- Southwestern Iranian languages as Lori dialects and Bakhtiari language[14][15]
- Pashto in Afghanistan and Pakistan, and Tajikistan
- Uyghur changed to Latin script in 1969 and back to a simplified, fully voweled Arabic script in 1983
- Judeo-Arabic languages
- Judeo-Tunisian Arabic[16]
- Azerbaijani language in Iran
- Talysh language in Iran
- Mazanderani language in Iran
- Shughni language in Afghanistan
East Asia[edit]
- The Chinese language is written by some Hui in the Arabic-derived Xiao’erjing alphabet (see also Sini (script))
- The Turkic Salar language is written by some Salar in the Arabic alphabet
- Uyghur alphabet
South Asia[edit]
- Balochi in Pakistan and Iran
- Dari in Afghanistan
- Kashmiri in India and Pakistan (also written in Sharada and Devanagari although Kashmiri is more commonly written in Perso-Arabic Script)
- Pashto in Afghanistan and Pakistan
- Khowar in Northern Pakistan, also uses the Latin script
- Punjabi (Shahmukhi) in Pakistan, also written in the Brahmic script known as Gurmukhi in India
- Saraiki, written with a modified Arabic script — that has 45 letters
- Sindhi, a British commissioner in Sindh on August 29, 1857, ordered to change Arabic script[vague],[17] also written in Devanagari in India
- Aer language[18]
- Bhadrawahi language[19]
- Ladakhi (India), although it is more commonly written using the Tibetan script
- Balti (a Sino-Tibetan language), also rarely written in the Tibetan script
- Brahui language in Pakistan and Afghanistan[20]
- Burushaski or Burusho language, a language isolated to Pakistan.
- Urdu in Pakistan (and historically several other Hindustani languages). Urdu is one of several official languages in the states of Jammu and Kashmir, Delhi, Uttar Pradesh, Bihar, Jharkhand, West Bengal and Telangana.
- Dogri, spoken by about five million people in India and Pakistan, chiefly in the Jammu region of Jammu and Kashmir and in Himachal Pradesh, but also in northern Punjab, although Dogri is more commonly written in Devanagari
- Arwi language (a mixture of Arabic and Tamil) uses the Arabic script together with the addition of 13 letters. It is mainly used in Sri Lanka and the South Indian state of Tamil Nadu for religious purposes. Arwi language is the language of Tamil Muslims
- Arabi Malayalam is Malayalam written in the Arabic script. The script has particular letters to represent the peculiar sounds of Malayalam. This script is mainly used in madrasas of the South Indian state of Kerala and of Lakshadweep.
- Rohingya language (Ruáingga) is a language spoken by the Rohingya people of Rakhine State, formerly known as Arakan (Rakhine), Burma (Myanmar). It is similar to Chittagonian language in neighboring Bangladesh[21] and sometimes written using the Roman script, or an Arabic-derived script known as Hanifi
- Ishkashimi language (Ishkashimi) in Afghanistan
Southeast Asia[edit]
- Malay in the Arabic script known as Jawi. In some cases it can be seen in the signboards of shops and market stalls. Particularly in Brunei, Jawi is used in terms of writing or reading for Islamic religious educational programs in primary school, secondary school, college, or even higher educational institutes such as universities. In addition, some television programming uses Jawi, such as announcements, advertisements, news, social programs or Islamic programs
- co-official in Brunei
- Malaysia but co-official in Kelantan and Kedah, Islamic states in Malaysia
- Indonesia, Jawi script is co-used with Latin in provinces of Aceh, Riau, Riau Islands and Jambi. The Javanese, Madurese and Sundanese also use another Arabic variant, the Pegon in Islamic writings and pesantren community.
- Southern Thailand
- Predominantly Muslim areas of the Philippines (especially Tausug language)
- Ida’an language (also Idahan) a Malayo-Polynesian language spoken by the Ida’an people of Sabah, Malaysia[22]
- Cham language in Cambodia besides Western Cham script.
Africa[edit]
- North Africa
- Arabic
- Berber languages have often been written in an adaptation of the Arabic alphabet. The use of the Arabic alphabet, as well as the competing Latin and Tifinagh scripts, has political connotations
- Tuareg language, (sometimes called Tamasheq) which is also a Berber language
- Coptic language of Egyptians as Coptic text written in Arabic letters[23]
- Northeast Africa
- Bedawi or Beja, mainly in northeastern Sudan
- Wadaad writing, used in Somalia
- Nubian languages
- Dongolawi language or Andaandi language of Nubia, in the Nile Vale of northern Sudan
- Nobiin language, the largest Nubian language (previously known by the geographic terms Mahas and Fadicca/Fiadicca) is not yet standardized, being written variously in both Latinized and Arabic scripts; also, there have been recent efforts to revive the Old Nubian alphabet.[24][25]
- Fur language of Darfur, Sudan
- Southeast Africa
- Comorian, in the Comoros, currently side by side with the Latin alphabet (neither is official)
- Swahili, was originally written in Arabic alphabet, Swahili orthography is now based on the Latin alphabet that was introduced by Christian missionaries and colonial administrators
- West Africa
- Zarma language of the Songhay family. It is the language of the southwestern lobe of the West African nation of Niger, and it is the second leading language of Niger, after Hausa, which is spoken in south central Niger[26]
- Tadaksahak is a Songhay language spoken by the pastoralist Idaksahak of the Ménaka area of Mali[27]
- Hausa language uses an adaptation of the Arabic script known as Ajami, for many purposes, especially religious, but including newspapers, mass mobilization posters and public information[28]
- Dyula language is a Mandé language spoken in Burkina Faso, Côte d’Ivoire and Mali.[29]
- Jola-Fonyi language of the Casamance region of Senegal[30]
- Balanta language a Bak language of west Africa spoken by the Balanta people and Balanta-Ganja dialect in Senegal
- Mandinka, widely but unofficially (known as Ajami), (another non-Latin script used is the N’Ko script)
- Fula, especially the Pular of Guinea (known as Ajami)
- Wolof (at zaouia schools), known as Wolofal.
- Arabic script outside Africa
- In writings of African American slaves
- Writings of by Omar Ibn Said (1770–1864) of Senegal[31]
- The Bilali Document also known as Bilali Muhammad Document is a handwritten, Arabic manuscript[32] on West African Islamic law. It was written by Bilali Mohammet in the 19th century. The document is currently housed in the library at the University of Georgia
- Letter written by Ayuba Suleiman Diallo (1701–1773)
- Arabic Text From 1768[33]
- Letter written by Abdul Rahman Ibrahima Sori (1762–1829)
- In writings of African American slaves
Former use[edit]
With the establishment of Muslim rule in the subcontinent, one or more forms of the Arabic script were incorporated among the assortment of scripts used for writing native languages.[34] In the 20th century, the Arabic script was generally replaced by the Latin alphabet in the Balkans,[dubious – discuss] parts of Sub-Saharan Africa, and Southeast Asia, while in the Soviet Union, after a brief period of Latinisation,[35] use of Cyrillic was mandated. Turkey changed to the Latin alphabet in 1928 as part of an internal Westernizing revolution. After the collapse of the Soviet Union in 1991, many of the Turkic languages of the ex-USSR attempted to follow Turkey’s lead and convert to a Turkish-style Latin alphabet. However, renewed use of the Arabic alphabet has occurred to a limited extent in Tajikistan, whose language’s close resemblance to Persian allows direct use of publications from Afghanistan and Iran.[36]
Africa[edit]
- Afrikaans (as it was first written among the «Cape Malays», see Arabic Afrikaans)
- Berber in North Africa, particularly Shilha in Morocco (still being considered, along with Tifinagh and Latin, for Central Atlas Tamazight)
- French by the Arabs and Berbers in Algeria and other parts of North Africa during the French colonial period
- Harari, by the Harari people of the Harari Region in Ethiopia. Now uses the Geʻez and Latin alphabets
- For the West African languages—Hausa, Fula, Mandinka, Wolof and some more—the Latin alphabet has officially replaced Arabic transcriptions for use in literacy and education
- Kinyarwanda in Rwanda
- Kirundi in Burundi
- Malagasy in Madagascar (script known as Sorabe)
- Nubian
- Shona in Zimbabwe
- Somali (see wadaad Arabic) has mostly used the Latin alphabet since 1972
- Songhay in West Africa, particularly in Timbuktu
- Swahili (has used the Latin alphabet since the 19th century)
- Yoruba in West Africa (this was probably limited, but still notable)
Europe[edit]
- Albanian called Elifbaja shqip
- Aljamiado (Mozarabic, Berber, Aragonese, Portuguese[citation needed], Ladino, and Spanish, during and residually after the Muslim rule in the Iberian peninsula)
- Belarusian (among ethnic Tatars; see Belarusian Arabic alphabet)
- Bosnian (only for literary purposes; currently written in the Latin alphabet; Text example: مۉلٖىمۉ سه تهبٖى بۉژه = Molimo se tebi, Bože (We pray to you, O God); see Arebica)
- Crimean Tatar
- Greek in certain areas in Greece and Anatolia. In particular, Cappadocian Greek written in Perso-Arabic
- Polish (among ethnic Lipka Tatars)
Central Asia and Caucasus[edit]
- Adyghe language also known as West Circassian, is an official languages of the Republic of Adygea in the Russian Federation. It used Arabic alphabet before 1927
- Avar as well as other languages of Daghestan: Nogai, Kumyk, Lezgian, Lak and Dargwa
- Azeri in Azerbaijan (now written in the Latin alphabet and Cyrillic script in Azerbaijan)
- Bashkir (officially for some years from the October Revolution of 1917 until 1928, changed to Latin, now uses the Cyrillic script)
- Chaghatay across Central Asia
- Chechen (sporadically from the adoption of Islam; officially from 1917 until 1928)[37]
- Circassian and some other members of the Abkhaz–Adyghe family in the western Caucasus and sporadically – in the countries of Middle East, like Syria
- Ingush
- Karachay-Balkar in the central Caucasus
- Karakalpak
- Kazakh in Kazakhstan (until the 1930s, changed to Latin, currently using Cyrillic, phasing in Latin)
- Kyrgyz in Kyrgyzstan (until the 1930s, changed to Latin, now uses the Cyrillic script)
- Mandarin Chinese and Dungan, among the Hui people (script known as Xiao’erjing)
- Ottoman Turkish
- Tat in South-Eastern Caucasus
- Tatar before 1928 (changed to Latin Yañalif), reformed in the 1880s (İske imlâ), 1918 (Yaña imlâ – with the omission of some letters)
- Turkmen in Turkmenistan (changed to Latin in 1929, then to the Cyrillic script, then back to Latin in 1991)
- Uzbek in Uzbekistan (changed to Latin, then to the Cyrillic script, then back to Latin in 1991)
- Some Northeast Caucasian languages of the Muslim peoples of the USSR between 1918 and 1928 (many also earlier), including Chechen, Lak, etc. After 1928, their script became Latin, then later[when?] Cyrillic[citation needed]
South and Southeast Asia[edit]
- Acehnese in Sumatra, Indonesia
- Banjarese in Kalimantan, Indonesia
- Bengali in Bengal, Arabic scripts have been used historically in places like Chittagong and West Bengal among other places. See Dobhashi for further information.
- Maguindanaon in the Philippines
- Malay in Malaysia, Singapore and Indonesia. Although Malay speakers in Brunei and Southern Thailand still use the script on a daily basis
- Minangkabau in Sumatra, Indonesia
- Pegon script of Javanese, Madurese and Sundanese in Indonesia, used only in Islamic schools and institutions
- Tausug in the Philippines, Malaysia, and Indonesia it can be used in Islamic schools in the Philippines
- Maranao in the Philippines
- Rakhine in Burma and Bangladesh
- Mongolian in Afghanistan There is also a language in the Mongolic family that spoken in the Afghanistan it is called Mogholi language
- Tagalog in the Philippines
- Yakan in Basilan
- Aslian in Malaysia
- Ternate in Indonesia by the Muslims
- Tidore in Indonesia
- Meitei in Bangladesh
- Shughni in Afghanistan
- Thai in Malaysia
- Sylheti in Arakan, Bengal, Chittagong, and Tripura
- Kedah Malay in Myanmar, Malaysia, and Thailand
- Uab Meto in Indonesia
- Molbog in Sabah used by the Muslims even though in Palawan
- Bonggi in Sabah by the Muslims
- Kadazan in Malaysia is a Muslim language
- Dusun used in Brunei, and Malaysia
- Sama used in Philippines, Malaysia, and Indonesia
- Bajau is in Philippines, Malaysia, and Indonesia
- Sarawak Bisaya used in Malaysia, and Brunei
- Sabah Bisaya is used in Sabah
- Lotud spoken in Malaysia only
- Lun Bawang in Sarawak, Sabah, Temburong and Kalimantan
- Tiruray in the Bangsamoro
- Chavacano in Cotabato, Zamboanga Peninsula, Sulu, Basilan, Tawi-Tawi, Sabah, and Kalimantan
- Maranao has Arabic script in Lanao del Sur,Lanao del Norte, and Sabah
- Iranun used in Islamic schools in Mindanao,and Malaysia
Middle East[edit]
- Hebrew was written in Arabic letters in a number of places in the past[38][39]
- Northern Kurdish in Turkey and Syria was written in Arabic script until 1932, when a modified Kurdish Latin alphabet was introduced by Jaladat Ali Badirkhan in Syria
- Turkish in the Ottoman Empire was written in Arabic script until Mustafa Kemal Atatürk declared the change to Latin script in 1928. This form of Turkish is now known as Ottoman Turkish and is held by many to be a different language, due to its much higher percentage of Persian and Arabic loanwords (Ottoman Turkish alphabet)
Unicode[edit]
As of Unicode 15.0, the following ranges encode Arabic characters:
- Arabic (0600–06FF)
- Arabic Supplement (0750–077F)
- Arabic Extended-A (08A0–08FF)
- Arabic Extended-B (0870–089F)
- Arabic Extended-C (10EC0–10EFF)
- Arabic Presentation Forms-A (FB50–FDFF)
- Arabic Presentation Forms-B (FE70–FEFF)
- Arabic Mathematical Alphabetic Symbols (1EE00–1EEFF)
- Rumi Numeral Symbols (10E60–10E7F)
- Indic Siyaq Numbers (1EC70–1ECBF)
- Ottoman Siyaq Numbers (1ED00–1ED4F)
Additional letters used in other languages[edit]
Assignment of phonemes to graphemes[edit]
Language family | Austron. | Dravid | Turkic | Indic | Iranian | Germanic | Arabic | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Language/script | Jawi | Pegon | Arwi | Ottoman | Uyghur | Tatars | Sindhi | Punjabi | Urdu | Persian | Balochi | Kurdish | Pashto | Afrikaans | Moroccan | Tunisian | Algerian | Egyptian | Najdi | Hejazi | Levantine | Iraqi | Gulf |
/p/ | ڤ | ڣ | پ | پ / ب | |||||||||||||||||||
/g/ | ݢ | ؼ | گ | ګ | گ | ڭ / گ | ڨ / ڧـ ـڧـ ـٯ / ق | ج | ق | ك / ج | گ / ك | ق / گ | |||||||||||
/t͡ʃ/ | چ | ∅ | چ | ڜ | تش | چ | |||||||||||||||||
/v/ | ۏ | ف | و | ۋ | و | ∅ | ڤ | ∅ | ڤ | ڥ / ڢ / ف | ڤ / ف | ||||||||||||
/ʒ/ | ∅ | ژ | ∅ | ژ | ج | ∅ | چ / ج | ∅ | ج | ∅ | |||||||||||||
/ŋ/ | ڠ | ࢳ | ڭ | ڱ | ن٘ | ∅ | ڠ | ∅ | |||||||||||||||
/ɳ/ | ∅ | ∅ | ڹ | ∅ | ڻ | ݨ | ن | ∅ | ڼ | ∅ | ∅ | ||||||||||||
/ɲ/ | ڽ | ۑ | ݧ | ∅ | ڃ | نج | ∅ | ∅ |
Letter or Digraph [A] | Use & Pronunciation | Unicode | i’jam & other additions | Shape | Similar Arabic Letter(s) | ||||
---|---|---|---|---|---|---|---|---|---|
U+ | [B] | [C] | above | below | |||||
پ | پـ ـپـ ـپ | Pe, used to represent the phoneme /p/ in Persian, Pashto, Punjabi, Khowar, Sindhi, Urdu, Kurdish, Kashmiri; it is can be used in Arabic to describe the phoneme /p/ otherwise it is normalized to /b/ ب e.g. پول Paul also written بول | U+067E | ﮹ | none | 3 dots | ٮ | ب | |
ݐ | ݐـ ـݐـ ـݐ | used to represent the equivalent of the Latin letter Ƴ (palatalized glottal stop /ʔʲ/) in some African languages such as Fulfulde. | U+0750 | ﮳﮳﮳ | none | 3 dots (horizontal) |
ٮ | ب | |
ٻ | ٻـ ـٻـ ـٻ | B̤ē, used to represent a voiced bilabial implosive /ɓ/ in Hausa, Sindhi and Saraiki. | U+067B | ﮾ | none | 2 dots (vertically) |
ٮ | ب | |
ڀ | ڀـ ـڀـ ـڀ | represents an aspirated voiced bilabial plosive /bʱ/ in Sindhi. | U+0680 | ﮻ | none | 4 dots | ٮ | ب | |
ٺ | ٺـ ـٺـ ـٺ | Ṭhē, represents the aspirated voiceless retroflex plosive /ʈʰ/ in Sindhi. | U+067A | ﮽ | 2 dots (vertically) |
none | ٮ | ت | |
ټ | ټـ ـټـ ـټ | Ṭē, used to represent the phoneme /ʈ/ in Pashto. | U+067C | ﮿ | ﮴ | 2 dots | ring | ٮ | ت |
ٽ | ٽـ ـٽـ ـٽ | Ṭe, used to represent the phoneme (a voiceless retroflex plosive /ʈ/) in Sindhi | U+067D | ﮸ | 3 dots (inverted) |
none | ٮ | ت | |
ﭦ | ٹـ ـٹـ ـٹ | Ṭe, used to represent Ṭ (a voiceless retroflex plosive /ʈ/) in Punjabi, Kashmiri, Urdu. | U+0679 | ◌ؕ | small ط |
none | ٮ | ت | |
ٿ | ٿـ ـٿـ ـٿ | Teheh, used in Sindhi and Rajasthani (when written in Sindhi alphabet); used to represent the phoneme /t͡ɕʰ/ (pinyin q) in Chinese Xiao’erjing. | U+067F | ﮺ | 4 dots | none | ٮ | ت | |
ڄ | ڄـ ـڄـ ـڄ | represents the «c» voiceless dental affricate /t͡s/ phoneme in Bosnian. | U+0684 | ﮾ | none | 2 dots (vertically) |
ح | ج | |
ڃ | ڃـ ـڃـ ـڃ | represents the «ć» voiceless alveolo-palatal affricate /t͡ɕ/ phoneme in Bosnian. | U+0683 | ﮵ | none | 2 dots | ح | ح ج | |
چ | چـ ـچـ ـچ | Che, used to represent /t͡ʃ/ («ch»). It is used in Persian, Pashto, Punjabi, Urdu, Kashmiri and Kurdish. /ʒ/ in Egypt. | U+0686 | ﮹ | none | 3 dots | ح | ج | |
څ | څـ ـڅـ ـڅ | Ce, used to represent the phoneme /t͡s/ in Pashto. | U+0685 | ﮶ | 3 dots | none | ح | ج خ ح | |
ݗ | ݗـ ـݗـ ـݗ | represents the «đ» voiced alveolo-palatal affricate /d͡ʑ/ phoneme in Bosnian. | U+0757 | ﮴ | 2 dots | none | ح | ح | |
ځ | ځـ ـځـ ـځ | Źim, used to represent the phoneme /d͡z/ in Pashto. | U+0681 | ◌ٔ | Hamza | none | ح | ج خ ح | |
ݙ | ݙ ـݙ | used in Saraiki to represent a Voiced alveolar implosive /ɗ̢/. | U+0759 | ﯀ | ﮾ | small ط |
2 dots (vertically) |
د | د |
ڊ | ڊ ـڊ | used in Saraiki to represent a voiced retroflex implosive /ᶑ/. | U+068A | ﮳ | none | 1 dot | د | د | |
ڈ | ڈ ـڈ | Ḍal, used to represent a Ḍ (a voiced retroflex plosive /ɖ/) in Punjabi, Kashmiri and Urdu. | U+0688 | ◌ؕ | small ط | none | د | د | |
ڌ | ڌ ـڌ | Dhal, used to represent the phoneme /d̪ʱ/ in Sindhi | U+068C | ﮴ | 2 dots | none | د | د | |
ډ | ډ ـډ | Ḍal, used to represent the phoneme /ɖ/ in Pashto. | U+0689 | ﮿ | none | ring | د | د | |
ڑ | ڑ ـڑ | Ṛe, represents a retroflex flap /ɽ/ in Punjabi and Urdu. | U+0691 | ◌ؕ | small ط | none | ر | ر | |
ړ | ړ ـړ | Ṛe, used to represent a retroflex lateral flap in Pashto. | U+0693 | ﮿ | none | ring | ر | ر | |
ݫ | ݫ ـݫ | used in Ormuri to represent a voiced alveolo-palatal fricative /ʑ/, as well as in Torwali. | U+076B | ﮽ | 2 dots (vertically) |
none | ر | ر | |
ژ | ژ ـژ | Že / zhe, used to represent the voiced postalveolar fricative /ʒ/ in, Persian, Pashto, Kurdish, Urdu, Punjabi and Uyghur. | U+0698 | ﮶ | 3 dots | none | ر | ز | |
ږ | ږ ـږ | Ǵe / ẓ̌e, used to represent the phoneme /ʐ/ /ɡ/ /ʝ/ in Pashto. | U+0696 | ﮲ | ﮳ | 1 dot | 1 dot | ر | ز |
ڕ | ڕ ـڕ | used in Kurdish to represent rr /r/ in Soranî dialect. | U+0695 | ٚ | none | V pointing down | ر | ر | |
ݭ | ݭـ ـݭـ ـݭ | used in Kalami to represent a voiceless retroflex fricative /ʂ/, and in Ormuri to represent a voiceless alveolo-palatal fricative /ɕ/. | U+076D | ﮽ | 2 dots vertically | none | س | س | |
ݜ | ݜـ ـݜـ ـݜ | used in Shina to represent a voiceless retroflex fricative /ʂ/. | U+075C | ﮺ | 4 dots | none | س | ش س | |
ښ | ښـ ـښـ ـښ | X̌īn / ṣ̌īn, used to represent the phoneme /x/ /ʂ/ /ç/ in Pashto. | U+069A | ﮲ | ﮳ | 1 dot | 1 dot | س | ش س |
ڜ | ڜـ ـڜـ ـڜ | Unofficially used to represent Spanish words with /t͡ʃ/ in Morocco. | U+069C | ﮶ | ﮹ | 3 dots | 3 dots | س | ش س |
ڨ | ڨـ ـڨـ ـڨ | Ga, used to represent the voiced velar plosive /ɡ/ in Algerian and Tunisian. | U+06A8 | ﮶ | 3 dots | none | ٯ | ق | |
گ | گـ ـگـ ـگ | Gaf, represents a voiced velar plosive /ɡ/ in Persian, Pashto, Punjabi, Kyrgyz, Kazakh, Kurdish, Uyghur, Mesopotamian, Urdu and Ottoman Turkish. | U+06AF | line | horizontal line | none | گ | ك | |
ګ | ګـ ـګـ ـګ | Gaf, used to represent the phoneme /ɡ/ in Pashto. | U+06AB | ﮿ | ring | none | ک | ك | |
ݢ | ݢـ ـݢـ ـݢ | Gaf, represents a voiced velar plosive /ɡ/ in the Jawi script of Malay. | U+0762 | ﮲ | 1 dot | none | ک | ك | |
ڬ | ڬـ ـڬـ ـڬ | U+06AC | ﮲ | 1 dot | none | ك | ك | ||
ؼ | ؼـ ـؼـ ـؼ | Gaf, represents a voiced velar plosive /ɡ/ in the Pegon script of Indonesian. | U+08B4 | ﮳ | none | 1 dot | ك | ك | |
ڭ | ڭـ ـڭـ ـڭ | Ng, used to represent the /ŋ/ phone in Ottoman Turkish, Kazakh, Kyrgyz, and Uyghur, and to unofficially represent the /ɡ/ in Morocco and in many dialects of Algerian. | U+06AD | ﮶ | 3 dots | none | ك | ك | |
أي | أيـ ـأيـ ـأي | Ee, used to represent the phoneme /eː/ in Somali. | U+0623 U+064A | ◌ٔ | ﮵ | Hamza | 2 dots | اى | أ + ي |
ئ | ئـ ـئـ ـئ | E, used to represent the phoneme /e/ in Somali. | U+0626 | ◌ٔ | Hamza | none | ى | ي ی | |
ىٓ | ىٓـ ـىٓـ ـىٓ | Ii, used to represent the phoneme /iː/ in Somali and Saraiki. | U+0649 U+0653 | ◌ٓ | Madda | none | ى | ي | |
ؤ | ؤ ـؤ | O, used to represent the phoneme /o/ in Somali. | U+0624 | ◌ٔ | Hamza | none | و | ؤ | |
ۅ | ۅ ـۅ | Ö, used to represent the phoneme /ø/ in Kyrgyz. | U+0624 | ◌̵ | Strikethrough[D] | none | و | و | |
ې | ېـ ـېـ ـې | Pasta Ye, used to represent the phoneme /e/ in Pashto and Uyghur. | U+06D0 | ﮾ | none | 2 dots vertical | ى | ي | |
ی | یـ ـیـ ـی | Nārīna Ye, used to represent the phoneme [ɑj] and phoneme /j/ in Pashto. | U+06CC | ﮵ | 2 dots (start + mid) |
none | ى | ي | |
ۍ | ـۍ | end only |
X̌əźīna ye Ye, used to represent the phoneme [əi] in Pashto. | U+06CD | line | horizontal line |
none | ى | ي |
ئ | ئـ ـئـ ـئ | Fāiliya Ye, used to represent the phoneme [əi] and /j/ in Pashto, Punjabi, Saraiki and Urdu | U+0626 | ◌ٔ | Hamza | none | ى | ي ى | |
أو | أو ـأو | Oo, used to represent the phoneme /oː/ in Somali. | U+0623 U+0648 | ◌ٔ | Hamza | none | او | أ + و | |
ﻭٓ | ﻭٓ ـﻭٓ | Uu, used to represent the phoneme /uː/ in Somali. | ﻭ + ◌ٓ U+0648 U+0653 | ◌ٓ | Madda | none | و | ﻭ + ◌ٓ | |
ڳ | ڳـ ـڳـ ـڳ | represents a voiced velar implosive /ɠ/ in Sindhi and Saraiki | U+06B1 | ﮾ | horizontal line |
2 dots | گ | ك | |
ڱ | ڱـ ـڱـ ـڱ | represents the Velar nasal /ŋ/ phoneme in Sindhi. | U+06B1 | ﮴ | 2 dots + horizontal line |
none | گ | ك | |
ک | کـ ـکـ ـک | Khē, represents /kʰ/ in Sindhi. | U+06A9 | none | none | none | ک | ك | |
ڪ | ڪـ ـڪـ ـڪ | «Swash kāf» is a stylistic variant of ك in Arabic, but represents un- aspirated /k/ in Sindhi. | U+06AA | none | none | none | ڪ | ك or ڪ | |
ݣ | ݣـ ـݣـ ـݣ | used to represent the phoneme /ŋ/ (pinyin ng) in Chinese. | U+0763 | ﮹ | none | 3 dots | ک | ك | |
ڼ | ڼـ ـڼـ ـڼ | represents the retroflex nasal /ɳ/ phoneme in Pashto. | U+06BC | ں | ﮿ | ﮲ | 1 dot | ring | ن |
ڻ | ڻـ ـڻـ ـڻ | represents the retroflex nasal /ɳ/ phoneme in Sindhi. | U+06BB | ◌ؕ | small ط | none | ں | ن | |
ݨ | ݨـ ـݨـ ـݨ | used in Punjabi to represent /ɳ/ and Saraiki to represent /ɲ/. | U+0768 | ﮲ | ﯀ | 1 dot + small ط | none | ں | ن |
ڽ | ڽـ ـڽـ ـڽ | Nya /ɲ/ in the Jawi script. | U+06BD | ﮶ | 3 dots | none | ں | ن | |
ۑ | ۑـ ـۑـ ـۑ | Nya /ɲ/ in the Pegon script. | U+06D1 | ﮹ | none | 3 dots | ى | ى | |
ڠ | ڠـ ـڠـ ـڠ | Nga /ŋ/ in the Jawi script and Pegon script. | U+06A0 | ﮶ | 3 dots | none | ع | غ | |
ݪ | ݪـ ـݪـ ـݪ | used in Marwari to represent a retroflex lateral flap /ɺ̢/, and in Kalami to represent a voiceless lateral fricative /ɬ/. | U+076A | line | horizontal line |
none | ل | ل | |
ࣇ | ࣇ ࣇ ࣇ | ࣇ — or alternately typeset as لؕ — is used in Punjabi to represent voiced retroflex lateral approximant /ɭ/[40] | U+08C7 | ◌ؕ | small ط | none | ل | ل | |
لؕ | لؕـ ـلؕـ ـلؕ | U+0644 U+0615 | |||||||
ڥ | ڥـ ـڥـ ـڥ | Vi, used in Algerian Arabic and Tunisian Arabic when written in Arabic script to represent the sound /v/ (unofficial). | U+06A5 | ﮹ | none | 3 dots | ڡ | ف | |
ڤ | ڤـ ـڤـ ـڤ | Ve, used in by some Arabic speakers to represent the phoneme /v/ in loanwords, and in the Kurdish language when written in Arabic script to represent the sound /v/. Also used as pa /p/ in the Jawi script and Pegon script. | U+06A4 | ﮶ | 3 dots | none | ڡ | ف | |
ۏ | ۏ ـۏ | Va in the Jawi script. | U+06CF | ﮲ | 1 dot | none | و | و | |
ۋ | ۋ ـۋ | represents a voiced labiodental fricative /v/ in Kyrgyz, Uyghur, and Old Tatar; and /w, ʊw, ʉw/ in Kazakh; also formerly used in Nogai. | U+06CB | ﮶ | 3 dots | none | و | و | |
ۆ | ۆ ـۆ | represents «O» /o/ in Kurdish, and in Uyghur it represents the sound similar to the French eu and œu /ø/ sound. It represents the «у» close back rounded vowel /u/ phoneme in Bosnian. | U+06C6 | ◌ٚ | V pointing down | none | و | و | |
ۇ | ۇ ـۇ | U, used to represents the Close back rounded vowel /u/ phoneme in Azerbaijani, Kazakh, Kyrgyz and Uyghur. | U+06C7 | ◌ُ | Damma[E] | none | و | و | |
ێ | ێـ ـێـ ـێ | represents Ê or É /e/ in Kurdish. | U+06CE | ◌ٚ | V pointing down | 2 dots (start + mid) |
ى | ي | |
ھ ھ |
ھـ ـھـ ـھ ھھھ |
Do-chashmi he (two-eyed hāʼ), used in digraphs for aspiration /ʰ/ and breathy voice /ʱ/ in Punjabi and Urdu. Also used to represent /h/ in Kazakh, Sorani and Uyghur.[F] | U+06BE | none | none | none | ھ | ه | |
ە | ە ـە | Ae, used represent /æ/ and /ɛ/ in Kazakh, Sorani and Uyghur. | U+06D5 | none | none | none | ھ | إ | |
ے | ـے | end only |
Baṛī ye (‘big yāʼ’), is a stylistic variant of ي in Arabic, but represents «ai» or «e» /ɛː/, /eː/ in Urdu and Punjabi. | U+06D2 | none | none | none | ے | ي |
ڞ | ڞـ ـڞـ ـڞ | used to represent the phoneme /tsʰ/ (pinyin c) in Chinese. | U+069E | ﮶ | 3 dots | none | ص | ص ض | |
ط | طـ ـطـ ـط | used to represent the phoneme /t͡s/ (pinyin z) in Chinese. | U+0637 | ط | ط | ||||
ۉ | ۉ ـۉ | represents the «o» open-mid back rounded vowel /ɔ/ phoneme in Bosnian. | U+06C9 | ◌ٛ | V pointing up | none | و | و | |
ݩ | ݩـ ـݩـ ـݩ | represents the «nj» palatal nasal /ɲ/ phoneme in Bosnian. | U+0769 | ﮲ | ◌ٚ | 1 dot V pointing down |
none | ں | ن |
ڵ | ڵـ ـڵـ ـڵ | used in Kurdish to represent ll /ɫ/ in Soranî dialect. | U+06B5 | ◌ٚ | V pointing down | none | ل | ل | |
ڵ | ڵـ ـڵـ ـڵ | represents the «lj» palatal lateral approximant /ʎ/ phoneme in Bosnian. | U+06B5 | ◌ٚ | V pointing down | none | ل | ل | |
اٖى | اٖىـ ـاٖىـ ـاٖى | represents the «i» close front unrounded vowel /i/ phoneme in Bosnian. | U+0627 U+0656 U+0649 | ◌ٖ | Alef | none | اى | اٖ + ى |
- Footnotes:
- ^ From right: start, middle, end, and isolated forms.
- ^ Joined to the letter, closest to the letter, on the first letter, or above.
- ^ Further away from the letter, or on the second letter, or below.
- ^ A variant that end up with loop also exists.
- ^ Although the letter also known as Waw with Damma, some publications and fonts features filled Damma that looks similar to comma.
- ^ Shown in Naskh (top) and Nastaliq (bottom) styles. The Nastaliq version of the connected forms are connected to each other, because the tatweel character U+0640 used to show the other forms does not work in many Nastaliq fonts.
Letter construction[edit]
Most languages that use alphabets based on the Arabic alphabet use the same base shapes. Most additional letters in languages that use alphabets based on the Arabic alphabet are built by adding (or removing) diacritics to existing Arabic letters. Some stylistic variants in Arabic have distinct meanings in other languages. For example, variant forms of kāf ك ک ڪ are used in some languages and sometimes have specific usages. In Urdu and some neighbouring languages, the letter Hā has diverged into two forms ھ dō-čašmī hē and ہ ہـ ـہـ ـہ gōl hē.[41] While a variant form of ي yā referred to as baṛī yē ے is used at the end of some words.[41]
Table of Letter Components[edit]
See also[edit]
- Arabic (Unicode block)
- Eastern Arabic numerals (digit shapes commonly used with Arabic script)
- History of the Arabic alphabet
- Transliteration of Arabic
- Xiao’erjing
References[edit]
- ^ «Arabic Alphabet». Encyclopædia Britannica online. Archived from the original on 26 April 2015. Retrieved 2015-05-16.
- ^ Mahinnaz Mirdehghan. 2010. Persian, Urdu, and Pashto: A comparative orthographic analysis. Writing Systems Research Vol. 2, No. 1, 9–23.
- ^ «Exposición Virtual. Biblioteca Nacional de España». Bne.es. Archived from the original on 2012-02-18. Retrieved 2012-04-06.
- ^ Ahmad, Syed Barakat. (11 January 2013). Introduction to Qur’anic script. ISBN 978-1-136-11138-9. OCLC 1124340016.
- ^ Gruendler, Beatrice (1993). The Development of the Arabic Scripts: From the Nabatean Era to the First Islamic Century According to Dated Texts. Scholars Press. p. 1. ISBN 9781555407100.
- ^ Healey, John F.; Smith, G. Rex (2012-02-13). «II — The Origin of the Arabic Alphabet». A Brief Introduction to The Arabic Alphabet. Saqi. ISBN 9780863568817.
- ^ Senner, Wayne M. (1991). The Origins of Writing. U of Nebraska Press. p. 100. ISBN 0803291671.
- ^ «Nabataean abjad». www.omniglot.com. Retrieved 2017-03-08.
- ^ Naveh, Joseph. «Nabatean Language, Script and Inscriptions» (PDF).
- ^ Taylor, Jane (2001). Petra and the Lost Kingdom of the Nabataeans. I.B.Tauris. p. 152. ISBN 9781860645082.
- ^ «Zribi, I., Boujelbane, R., Masmoudi, A., Ellouze, M., Belguith, L., & Habash, N. (2014). A Conventional Orthography for Tunisian Arabic. In Proceedings of the Language Resources and Evaluation Conference (LREC), Reykjavík, Iceland».
- ^ Brustad, K. (2000). The syntax of spoken Arabic: A comparative study of Moroccan, Egyptian, Syrian, and Kuwaiti dialects. Georgetown University Press.
- ^ «Sayad Zahoor Shah Hashmii». baask.com.
- ^ Sarlak, Riz̤ā (2002). «Dictionary of the Bakhtiari dialect of Chahar-lang». google.com.eg.
- ^ Iran, Mojdeh (5 February 2011). «Bakhtiari Language Video (bak) بختياري ها! خبری مهم» – via Vimeo.
- ^ «Ethnologue». Retrieved Feb 1, 2020.
- ^ «Pakistan should mind all of its languages!». tribune.com.pk. June 2011.
- ^ «Ethnologue». Retrieved Feb 1, 2020.
- ^ «Ethnologue». Retrieved Feb 1, 2020.
- ^ «The Bible in Brahui». Worldscriptures.org. Archived from the original on October 30, 2016. Retrieved August 5, 2013.
- ^ «Rohingya Language Book A-Z». Scribd.
- ^ «Ida’an». scriptsource.org.
- ^ «The Coptic Studies’ Corner». stshenouda.com. Archived from the original on 2012-04-19. Retrieved 2012-04-17.
- ^ «—The Cradle of Nubian Civilisation—«. thenubian.net.
- ^ «2 » AlNuba egypt». 19 July 2012. Archived from the original on 19 July 2012.
- ^ «Zarma». scriptsource.org.
- ^ «Tadaksahak». scriptsource.org.
- ^ «Lost Language — Bostonia Summer 2009». bu.edu.
- ^ «Dyula». scriptsource.org.
- ^ «Jola-Fonyi». scriptsource.org.
- ^ «Ibn Sayyid manuscript». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
- ^ «Muhammad Arabic letter». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
- ^ «Charno Letter». Muslims In America. Archived from the original on May 20, 2013. Retrieved August 5, 2013.
- ^ Asani, Ali S. (2002). Ecstasy and enlightenment : the Ismaili devotional literature of South Asia. Institute of Ismaili Studies. London: I.B. Tauris. p. 124. ISBN 1-86064-758-8. OCLC 48193876.
- ^ Alphabet Transitions – The Latin Script: A New Chronology – Symbol of a New Azerbaijan Archived 2007-04-03 at the Wayback Machine, by Tamam Bayatly
- ^ Sukhail Siddikzoda. «Tajik Language: Farsi or Not Farsi?» (PDF). Archived from the original (PDF) on June 13, 2006.
- ^ «Brief history of writing in Chechen». Archived from the original on December 23, 2008.
- ^ p. 20, Samuel Noel Kramer. 1986. In the World of Sumer: An Autobiography. Detroit: Wayne State University Press.
- ^ J. Blau. 2000. Hebrew written in Arabic characters: An instance of radical change in tradition. (In Hebrew, with English summary). In Heritage and Innovation in Judaeo-Arabic Culture: Proceedings of the Sixth Conference of the Society For Judaeo-Arabic Studies, p. 27-31. Ramat Gan.
- ^ Lorna Priest Evans; M. G. Abbas Malik. «Proposal to encode ARABIC LETTER LAM WITH SMALL ARABIC LETTER TAH ABOVE in the UCS» (PDF). www.unicode.org. Retrieved 10 May 2020.
- ^ a b «Urdu Alphabet». www.user.uni-hannover.de. Archived from the original on 11 September 2019. Retrieved 4 May 2020.
External links[edit]
- Unicode collation charts—including Arabic letters, sorted by shape
- Why the right side of your brain doesn’t like Arabic
- Arabic fonts by SIL’s Non-Roman Script Initiative
- Alexis Neme and Sébastien Paumier (2019), «Restoring Arabic vowels through omission-tolerant dictionary lookup», Lang Resources & Evaluation, Vol. 53, pp. 1–65. arXiv:1905.04051; doi:10.1007/s10579-019-09464-6
From Wikipedia, the free encyclopedia
For the Arabic script as it is used specifically to write Arabic, see Arabic alphabet.
Arabic script | |
---|---|
Script type |
Abjad primarily Alphabet in some adaptations |
Time period |
400–present |
Direction | right-to-left script |
Official script |
18 sovereign states
Co-official script in: 10 sovereign states
|
Languages | See below |
Related scripts | |
Parent systems |
Egyptian hieroglyphs
|
Child systems |
N’Ko Hanifi script |
ISO 15924 | |
ISO 15924 | Arab (160), Arabic |
Unicode | |
Unicode alias |
Arabic |
Unicode range |
|
This article contains phonetic transcriptions in the International Phonetic Alphabet (IPA). For an introductory guide on IPA symbols, see Help:IPA. For the distinction between [ ], / / and ⟨ ⟩, see IPA § Brackets and transcription delimiters. |
The Arabic script is the writing system used for Arabic and several other languages of Asia and Africa. It is the second-most widely used writing system in the world by number of countries using it or a script directly derived from it, and the third-most by number of users (after the Latin and Chinese scripts).[1]
The script was first used to write texts in Arabic, most notably the Quran, the holy book of Islam. With the religion’s spread, it came to be used as the primary script for many language families, leading to the addition of new letters and other symbols. Such languages still using it are: Persian (Farsi/Dari), Malay (Jawi), Uyghur, Kurdish, Punjabi (Shahmukhi), Sindhi, Balti, Balochi, Pashto, Lurish, Urdu, Kashmiri, Rohingya, Somali and Mandinka, Mooré among others.[2] Until the 16th century, it was also used for some Spanish texts, and—prior to the language reform in 1928—it was the writing system of Turkish.[3]
The script is written from right to left in a cursive style, in which most of the letters are written in slightly different forms according to whether they stand alone or are joined to a following or preceding letter. However, the basic letter form remains unchanged. The script does not have capital letters.[4] In most cases, the letters transcribe consonants, or consonants and a few vowels, so most Arabic alphabets are abjads, with the versions used for some languages, such as Sorani, Uyghur, Mandarin, and Serbo-Croatian, being alphabets. It is also the basis for the tradition of Arabic calligraphy.
Worldwide use of the Arabic and Perso-Arabic script | ||
---|---|---|
|
||
Countries where the Arabic script is: | ||
→ | the sole official script | |
→ | official alongside other scripts | |
→ | official at a provincial level (China, India, Tanzania) or a recognized second script of the official language (Malaysia, Tajikistan) |
History[edit]
The Arabic alphabet is derived either from the Nabataean alphabet[5][6] or (less widely believed) directly from the Syriac alphabet,[7] which are both derived from the Aramaic alphabet (which also gave rise to the Hebrew alphabet), which, in turn, descended from the Phoenician alphabet. In addition to the Aramaic script (and, therefore, the Arabic and Hebrew scripts), the Phoenician script also gave rise to the Greek alphabet (and, therefore, both the Cyrillic alphabet and the Latin alphabet used to write this article).
Origins[edit]
In the 6th and 5th centuries BCE, northern Arab tribes emigrated and founded a kingdom centred around Petra, Jordan. These people (now named Nabataeans from the name of one of the tribes, Nabatu) spoke Nabataean Arabic, a dialect of the Arabic language. In the 2nd or 1st centuries BCE,[8][9] the first known records of the Nabataean alphabet were written in the Aramaic language (which was the language of communication and trade), but included some Arabic language features: the Nabataeans did not write the language which they spoke. They wrote in a form of the Aramaic alphabet, which continued to evolve; it separated into two forms: one intended for inscriptions (known as «monumental Nabataean») and the other, more cursive and hurriedly written and with joined letters, for writing on papyrus.[10] This cursive form influenced the monumental form more and more and gradually changed into the Arabic alphabet.
Overview[edit]
خ | ح | ج | ث | ت | ب | ا |
khā’ | ḥā’ | jīm | tha’ | tā’ | bā’ | alif |
ص | ش | س | ز | ر | ذ | د |
ṣād | shīn | sīn | zāy / zayn |
rā’ | dhāl | dāl |
ق | ف | غ | ع | ظ | ط | ض |
qāf | fā’ | ghayn | ‘ayn | ẓā’ | ṭā’ | ḍād |
ي | و | ه | ن | م | ل | ك |
yā’ | wāw | hā’ | nūn | mīm | lām | kāf |
(see below for other alphabets) |
The Arabic script has been adapted for use in a wide variety of languages besides Arabic, including Persian, Malay and Urdu, which are not Semitic. Such adaptations may feature altered or new characters to represent phonemes that do not appear in Arabic phonology. For example, the Arabic language lacks a voiceless bilabial plosive (the [p] sound), therefore many languages add their own letter to represent [p] in the script, though the specific letter used varies from language to language. These modifications tend to fall into groups: Indian and Turkic languages written in the Arabic script tend to use the Persian modified letters, whereas the languages of Indonesia tend to imitate those of Jawi. The modified version of the Arabic script originally devised for use with Persian is known as the Perso-Arabic script by scholars.[citation needed]
When the Arabic script is used to write Serbo-Croatian, Sorani, Kashmiri, Mandarin Chinese, or Uyghur, vowels are mandatory. The Arabic script can, therefore, be used as a true alphabet as well as an abjad, although it is often strongly, if erroneously, connected to the latter due to it being originally used only for Arabic.[citation needed]
Use of the Arabic script in West African languages, especially in the Sahel, developed with the spread of Islam. To a certain degree the style and usage tends to follow those of the Maghreb (for instance the position of the dots in the letters fāʼ and qāf).[11][12] Additional diacritics have come into use to facilitate the writing of sounds not represented in the Arabic language. The term ʻAjamī, which comes from the Arabic root for «foreign,» has been applied to Arabic-based orthographies of African languages.[citation needed]
Wikipedia in Arabic script of five languages
Table of writing styles[edit]
Script or style | Alphabet(s) | Language(s) | Region | Derived from | Comment |
---|---|---|---|---|---|
Naskh | Arabic & others |
Arabic & others |
Every region where Arabic scripts are used | Sometimes refers to a very specific calligraphic style, but sometimes used to refer more broadly to almost every font that is not Kufic or Nastaliq. | |
Nastaliq | Urdu, Persian, & others |
Urdu, Persian, & others |
Southern and Western Asia | Taliq | Used for almost all modern Urdu text, but only occasionally used for Persian. (The term «Nastaliq» is sometimes used by Urdu speakers to refer to all Perso-Arabic scripts.) |
Taliq | Persian | Persian | A predecessor of Nastaliq. | ||
Kufic | Arabic | Arabic | Middle East and parts of North Africa | ||
Rasm | Restricted Arabic alphabet | Arabic | Mainly historical | Omits all diacritics including i’jam. Digital replication usually requires some special characters. See: ٮ ڡ ٯ (links to Wiktionary). |
Table of alphabets[edit]
Alphabet | Letters | Additional Characters |
Script or Style | Languages | Region | Derived from: (or related to) |
Note |
---|---|---|---|---|---|---|---|
Arabic | 28 | ^(see above) | Naskh, Kufi, Rasm, & others | Arabic | North Africa, West Asia | Aramaic, Syriac, Nabataean |
|
Ajami script | 33 | ٻ تٜ تٰٜ | Naskh | Hausa, Yoruba, Swahili | West Africa | Arabic | Abjad |
Aljamiado | 28 | Naskh | Old Spanish, Mozarabic, Ladino, Aragonese, Old Galician-Portuguese | Southwest Europe | Arabic | 8th-13th centuries for Mozarabic, 14th-16th centuries for the other languages | |
Arebica | 30 | ڄ ە اٖى ي ڵ ںٛ ۉ ۆ | Naskh | Serbo-Croatian | Southeastern Europe | Perso-Arabic | Latest stage has full vowel marking |
Arwi alphabet | 41 | ڊ ڍ ڔ صٜ ۻ ࢳ ڣ ࢴ ڹ ݧ | Naskh | Tamil | Southern India, Sri Lanka | Perso-Arabic | |
Belarusian Arabic alphabet | 32 | ࢮ ࢯ | Naskh | Belarusian | Eastern Europe | Perso-Arabic | 15th / 16th century |
Balochi Standard Alphabet(s) | 29 | ٹ ڈ ۏ ݔ ے | Naskh and Nastaliq | Balochi | South-West Asia | Perso-Arabic, also borrows multiple glyphs from Urdu | This standardization is based on the previous orthography. For more information, see Balochi writing. |
Berber Arabic alphabet(s) | 33 | چ ژ ڞ ݣ ء | Various Berber languages | North Africa | Arabic | ||
Burushaski | 53 | ݳ ݴ ݼ څ ڎ ݽ ڞ ݣ ݸ ݹ ݶ ݷ ݺ ݻ (see note) |
Nastaliq | Burushaski | South-West Asia (Pakistan) | Urdu | Also uses the additional letters shown for Urdu.(see below) Sometimes written with just the Urdu alphabet, or with the Latin alphabet. |
Chagatai alphabet | 32 | ݣ | Nastaliq and Naskh | Chagatai | Central Asia | Perso-Arabic | ݣ is interchangeable with نگ and ڭ. |
Galal | 32 | Naskh | Somali | Horn of Africa | Arabic | ||
Jawi | 36 | ڠ ڤ ݢ ڽ ۏ ى | Naskh | Malay | Peninsular Malaysia, Sumatra and part of Borneo | Perso-Arabic | Since 1303 AD (Trengganu Stone) |
Kashmiri | 44 | ۆ ۄ ؠ ێ | Nastaliq | Kashmiri | South Asia | Urdu | This orthography is fully voweled. 3 out of the 4 (ۆ, ۄ, ێ) additional glyphs are actually vowels. Not all vowels are listed here since they are not separate letters. For further information, see Kashmiri writing. |
Kazakh Arabic alphabet | 35 | ٵ ٶ ﯗ ٷ ﯞ ۆ ە ھ ﻯ ٸ ي | Naskh | Kazakh | Central Asia, China | Chagatai | In use since 11th century, reformed in the early 20th century, now official only in China |
Khowar | 45 | ݯ ݮ څ ځ ݱ ݰ ڵ | Nastaliq | Khowar | South Asia | Urdu, however, borrows multiple glyphs from Pashto | |
Kyrgyz Arabic alphabet | 33 | ۅ ﯗ ۉ ﯞ ە ﻯ ي | Naskh | Kyrgyz | Central Asia | Chagatai | In use since 11th century, reformed in the early 20th century, now official only in China |
Pashto | 45 | ټ څ ځ ډ ړ ږ ښ ګ ڼ ۀ ي ې ۍ ئ | Naskh and occasionally, Nastaliq | Pashto | South-West Asia, Afghanistan and Pakistan | Perso-Arabic | ګ is interchangeable with گ. Also, the glyphs ی and ې are often replaced with ے in Pakistan. |
Pegon script | 35 | ڎ ڟ ڠ ڤ ڮ ۑ | Naskh | Javanese, Sundanese | South-East Asia (Indonesia) | Perso-Arabic | |
Persian | 32 | پ چ ژ گ | Naskh and Nastaliq | Persian (Farsi) | West Asia (Iran etc. ) | Arabic | Also known as Perso-Arabic. |
Saraiki | 45 | ٻ ڄ ݙ ڳ | Nastaliq | Saraiki | South-West Asia (Pakistan) | Shahmukhi | |
Shahmukhi | 41+ (see note) |
ࣇ ݨ | Nastaliq | Punjabi | South-West Asia (Pakistan) | Urdu | Similar to Urdu; 58[citation needed] letters including digraphs for aspirated consonants. |
Sindhi | 64 | ڪ ڳ ڱ گ ک پ ڀ ٻ ٽ ٿ ٺ ڻ ڦ ڇ چ ڄ ڃ ھ ڙ ڌ ڏ ڎ ڍ ڊ |
Naskh | Sindhi | South-West Asia (Pakistan) | Perso-Arabic | |
Sorabe | 28 | Naskh | Malagasy | Madagascar | Arabic | ||
Soranî | 33 | ڕ ڤ ڵ ۆ ێ | Naskh, and occasionally, Nastaliq | Central Kurdish | Middle-East | Perso-Arabic | Vowels are mandatory, i.e. alphabet |
Swahili Arabic script | 28 | Naskh | Swahili | Western and Southern Africa | Arabic | ||
İske imlâ | 35 | ﯞ | Naskh | Tatar | Volga region | Chagatai | Used prior to 1920. |
Ottoman Turkish | 32 | Ottoman Turkish | Ottoman Empire | Chagatai | Official until 1928 | ||
Urdu | 39+ (see notes) |
ٹ ڈ ڑ ں ہ ھ ے (see notes) |
Nastaliq | Urdu | South Asia | Perso-Arabic | 58[citation needed] letters including digraphs representing aspirated consonants. بھ پھ تھ ٹھ جھ چھ دھ ڈھ کھ گھ |
Uyghur | 32 | ئا ئە ھ ئو ئۇ ئۆ ئۈ ۋ ئې ئى | Naskh | Uyghur | China, Central Asia | Chagatai | Reform of older Arabic-script Uyghur orthography that was used prior the 1950s. Vowels are mandatory, i.e. alphabet |
Wolofal | 33 | ݖ گ ݧ ݝ ݒ | Naskh | Wolof | West Africa | Arabic, however, borrows at least one glyph from Perso-Arabic | |
Xiao’erjing | 36 | ٿ س﮲ ڞ ي | Naskh | Sinitic languages | China, Central Asia | Chagatai | Used to write Chinese languages by Muslims living in China such as the Hui people. |
Yaña imlâ | 29 | ئا ئە ئی ئو ئۇ ئ ھ | Naskh | Tatar | Volga region | İske imlâ alphabet | 1920–1927 replaced with Cyrillic |
Current use[edit]
Today Iran, Afghanistan, Pakistan, India, and China are the main non-Arabic speaking states using the Arabic alphabet to write one or more official national languages, including Azerbaijani, Baluchi, Brahui, Persian, Pashto, Central Kurdish, Urdu, Sindhi, Kashmiri, Punjabi and Uyghur.[citation needed]
An Arabic alphabet is currently used for the following languages:[citation needed]
Middle East and Central Asia[edit]
- Arabic
- Garshuni (or Karshuni) originated in the 7th century, when Arabic became the dominant spoken language in the Fertile Crescent, but Arabic script was not yet fully developed or widely read, and so the Syriac alphabet was used. There is evidence that writing Arabic in this other set of letters (known as Garshuni) influenced the style of modern Arabic script. After this initial period, Garshuni writing has continued to the present day among some Syriac Christian communities in the Arabic-speaking regions of the Levant and Mesopotamia.
- Kazakh in Kazakhstan, China, Iran and Afghanistan
- Kurdish in Northern Iraq and Northwest Iran. (In Turkey and Syria the Latin script is used for Kurdish)
- Kyrgyz by its 150,000 speakers in the Xinjiang Uyghur Autonomous Region in northwestern China, Pakistan, Kyrgyzstan and Afghanistan
- Turkmen in Turkmenistan,[verification needed] Afghanistan and Iran
- Uzbek in Uzbekistan[verification needed] and Afghanistan
- Persian in Iranian Persian and Dari in Afghanistan. It had former use in Tajikistan but is no longer used in Standard Tajik
- Baluchi in Iran, in Pakistan’s Balochistan region, Afghanistan and Oman[13]
- Southwestern Iranian languages as Lori dialects and Bakhtiari language[14][15]
- Pashto in Afghanistan and Pakistan, and Tajikistan
- Uyghur changed to Latin script in 1969 and back to a simplified, fully voweled Arabic script in 1983
- Judeo-Arabic languages
- Judeo-Tunisian Arabic[16]
- Azerbaijani language in Iran
- Talysh language in Iran
- Mazanderani language in Iran
- Shughni language in Afghanistan
East Asia[edit]
- The Chinese language is written by some Hui in the Arabic-derived Xiao’erjing alphabet (see also Sini (script))
- The Turkic Salar language is written by some Salar in the Arabic alphabet
- Uyghur alphabet
South Asia[edit]
- Balochi in Pakistan and Iran
- Dari in Afghanistan
- Kashmiri in India and Pakistan (also written in Sharada and Devanagari although Kashmiri is more commonly written in Perso-Arabic Script)
- Pashto in Afghanistan and Pakistan
- Khowar in Northern Pakistan, also uses the Latin script
- Punjabi (Shahmukhi) in Pakistan, also written in the Brahmic script known as Gurmukhi in India
- Saraiki, written with a modified Arabic script — that has 45 letters
- Sindhi, a British commissioner in Sindh on August 29, 1857, ordered to change Arabic script[vague],[17] also written in Devanagari in India
- Aer language[18]
- Bhadrawahi language[19]
- Ladakhi (India), although it is more commonly written using the Tibetan script
- Balti (a Sino-Tibetan language), also rarely written in the Tibetan script
- Brahui language in Pakistan and Afghanistan[20]
- Burushaski or Burusho language, a language isolated to Pakistan.
- Urdu in Pakistan (and historically several other Hindustani languages). Urdu is one of several official languages in the states of Jammu and Kashmir, Delhi, Uttar Pradesh, Bihar, Jharkhand, West Bengal and Telangana.
- Dogri, spoken by about five million people in India and Pakistan, chiefly in the Jammu region of Jammu and Kashmir and in Himachal Pradesh, but also in northern Punjab, although Dogri is more commonly written in Devanagari
- Arwi language (a mixture of Arabic and Tamil) uses the Arabic script together with the addition of 13 letters. It is mainly used in Sri Lanka and the South Indian state of Tamil Nadu for religious purposes. Arwi language is the language of Tamil Muslims
- Arabi Malayalam is Malayalam written in the Arabic script. The script has particular letters to represent the peculiar sounds of Malayalam. This script is mainly used in madrasas of the South Indian state of Kerala and of Lakshadweep.
- Rohingya language (Ruáingga) is a language spoken by the Rohingya people of Rakhine State, formerly known as Arakan (Rakhine), Burma (Myanmar). It is similar to Chittagonian language in neighboring Bangladesh[21] and sometimes written using the Roman script, or an Arabic-derived script known as Hanifi
- Ishkashimi language (Ishkashimi) in Afghanistan
Southeast Asia[edit]
- Malay in the Arabic script known as Jawi. In some cases it can be seen in the signboards of shops and market stalls. Particularly in Brunei, Jawi is used in terms of writing or reading for Islamic religious educational programs in primary school, secondary school, college, or even higher educational institutes such as universities. In addition, some television programming uses Jawi, such as announcements, advertisements, news, social programs or Islamic programs
- co-official in Brunei
- Malaysia but co-official in Kelantan and Kedah, Islamic states in Malaysia
- Indonesia, Jawi script is co-used with Latin in provinces of Aceh, Riau, Riau Islands and Jambi. The Javanese, Madurese and Sundanese also use another Arabic variant, the Pegon in Islamic writings and pesantren community.
- Southern Thailand
- Predominantly Muslim areas of the Philippines (especially Tausug language)
- Ida’an language (also Idahan) a Malayo-Polynesian language spoken by the Ida’an people of Sabah, Malaysia[22]
- Cham language in Cambodia besides Western Cham script.
Africa[edit]
- North Africa
- Arabic
- Berber languages have often been written in an adaptation of the Arabic alphabet. The use of the Arabic alphabet, as well as the competing Latin and Tifinagh scripts, has political connotations
- Tuareg language, (sometimes called Tamasheq) which is also a Berber language
- Coptic language of Egyptians as Coptic text written in Arabic letters[23]
- Northeast Africa
- Bedawi or Beja, mainly in northeastern Sudan
- Wadaad writing, used in Somalia
- Nubian languages
- Dongolawi language or Andaandi language of Nubia, in the Nile Vale of northern Sudan
- Nobiin language, the largest Nubian language (previously known by the geographic terms Mahas and Fadicca/Fiadicca) is not yet standardized, being written variously in both Latinized and Arabic scripts; also, there have been recent efforts to revive the Old Nubian alphabet.[24][25]
- Fur language of Darfur, Sudan
- Southeast Africa
- Comorian, in the Comoros, currently side by side with the Latin alphabet (neither is official)
- Swahili, was originally written in Arabic alphabet, Swahili orthography is now based on the Latin alphabet that was introduced by Christian missionaries and colonial administrators
- West Africa
- Zarma language of the Songhay family. It is the language of the southwestern lobe of the West African nation of Niger, and it is the second leading language of Niger, after Hausa, which is spoken in south central Niger[26]
- Tadaksahak is a Songhay language spoken by the pastoralist Idaksahak of the Ménaka area of Mali[27]
- Hausa language uses an adaptation of the Arabic script known as Ajami, for many purposes, especially religious, but including newspapers, mass mobilization posters and public information[28]
- Dyula language is a Mandé language spoken in Burkina Faso, Côte d’Ivoire and Mali.[29]
- Jola-Fonyi language of the Casamance region of Senegal[30]
- Balanta language a Bak language of west Africa spoken by the Balanta people and Balanta-Ganja dialect in Senegal
- Mandinka, widely but unofficially (known as Ajami), (another non-Latin script used is the N’Ko script)
- Fula, especially the Pular of Guinea (known as Ajami)
- Wolof (at zaouia schools), known as Wolofal.
- Arabic script outside Africa
- In writings of African American slaves
- Writings of by Omar Ibn Said (1770–1864) of Senegal[31]
- The Bilali Document also known as Bilali Muhammad Document is a handwritten, Arabic manuscript[32] on West African Islamic law. It was written by Bilali Mohammet in the 19th century. The document is currently housed in the library at the University of Georgia
- Letter written by Ayuba Suleiman Diallo (1701–1773)
- Arabic Text From 1768[33]
- Letter written by Abdul Rahman Ibrahima Sori (1762–1829)
- In writings of African American slaves
Former use[edit]
With the establishment of Muslim rule in the subcontinent, one or more forms of the Arabic script were incorporated among the assortment of scripts used for writing native languages.[34] In the 20th century, the Arabic script was generally replaced by the Latin alphabet in the Balkans,[dubious – discuss] parts of Sub-Saharan Africa, and Southeast Asia, while in the Soviet Union, after a brief period of Latinisation,[35] use of Cyrillic was mandated. Turkey changed to the Latin alphabet in 1928 as part of an internal Westernizing revolution. After the collapse of the Soviet Union in 1991, many of the Turkic languages of the ex-USSR attempted to follow Turkey’s lead and convert to a Turkish-style Latin alphabet. However, renewed use of the Arabic alphabet has occurred to a limited extent in Tajikistan, whose language’s close resemblance to Persian allows direct use of publications from Afghanistan and Iran.[36]
Africa[edit]
- Afrikaans (as it was first written among the «Cape Malays», see Arabic Afrikaans)
- Berber in North Africa, particularly Shilha in Morocco (still being considered, along with Tifinagh and Latin, for Central Atlas Tamazight)
- French by the Arabs and Berbers in Algeria and other parts of North Africa during the French colonial period
- Harari, by the Harari people of the Harari Region in Ethiopia. Now uses the Geʻez and Latin alphabets
- For the West African languages—Hausa, Fula, Mandinka, Wolof and some more—the Latin alphabet has officially replaced Arabic transcriptions for use in literacy and education
- Kinyarwanda in Rwanda
- Kirundi in Burundi
- Malagasy in Madagascar (script known as Sorabe)
- Nubian
- Shona in Zimbabwe
- Somali (see wadaad Arabic) has mostly used the Latin alphabet since 1972
- Songhay in West Africa, particularly in Timbuktu
- Swahili (has used the Latin alphabet since the 19th century)
- Yoruba in West Africa (this was probably limited, but still notable)
Europe[edit]
- Albanian called Elifbaja shqip
- Aljamiado (Mozarabic, Berber, Aragonese, Portuguese[citation needed], Ladino, and Spanish, during and residually after the Muslim rule in the Iberian peninsula)
- Belarusian (among ethnic Tatars; see Belarusian Arabic alphabet)
- Bosnian (only for literary purposes; currently written in the Latin alphabet; Text example: مۉلٖىمۉ سه تهبٖى بۉژه = Molimo se tebi, Bože (We pray to you, O God); see Arebica)
- Crimean Tatar
- Greek in certain areas in Greece and Anatolia. In particular, Cappadocian Greek written in Perso-Arabic
- Polish (among ethnic Lipka Tatars)
Central Asia and Caucasus[edit]
- Adyghe language also known as West Circassian, is an official languages of the Republic of Adygea in the Russian Federation. It used Arabic alphabet before 1927
- Avar as well as other languages of Daghestan: Nogai, Kumyk, Lezgian, Lak and Dargwa
- Azeri in Azerbaijan (now written in the Latin alphabet and Cyrillic script in Azerbaijan)
- Bashkir (officially for some years from the October Revolution of 1917 until 1928, changed to Latin, now uses the Cyrillic script)
- Chaghatay across Central Asia
- Chechen (sporadically from the adoption of Islam; officially from 1917 until 1928)[37]
- Circassian and some other members of the Abkhaz–Adyghe family in the western Caucasus and sporadically – in the countries of Middle East, like Syria
- Ingush
- Karachay-Balkar in the central Caucasus
- Karakalpak
- Kazakh in Kazakhstan (until the 1930s, changed to Latin, currently using Cyrillic, phasing in Latin)
- Kyrgyz in Kyrgyzstan (until the 1930s, changed to Latin, now uses the Cyrillic script)
- Mandarin Chinese and Dungan, among the Hui people (script known as Xiao’erjing)
- Ottoman Turkish
- Tat in South-Eastern Caucasus
- Tatar before 1928 (changed to Latin Yañalif), reformed in the 1880s (İske imlâ), 1918 (Yaña imlâ – with the omission of some letters)
- Turkmen in Turkmenistan (changed to Latin in 1929, then to the Cyrillic script, then back to Latin in 1991)
- Uzbek in Uzbekistan (changed to Latin, then to the Cyrillic script, then back to Latin in 1991)
- Some Northeast Caucasian languages of the Muslim peoples of the USSR between 1918 and 1928 (many also earlier), including Chechen, Lak, etc. After 1928, their script became Latin, then later[when?] Cyrillic[citation needed]
South and Southeast Asia[edit]
- Acehnese in Sumatra, Indonesia
- Banjarese in Kalimantan, Indonesia
- Bengali in Bengal, Arabic scripts have been used historically in places like Chittagong and West Bengal among other places. See Dobhashi for further information.
- Maguindanaon in the Philippines
- Malay in Malaysia, Singapore and Indonesia. Although Malay speakers in Brunei and Southern Thailand still use the script on a daily basis
- Minangkabau in Sumatra, Indonesia
- Pegon script of Javanese, Madurese and Sundanese in Indonesia, used only in Islamic schools and institutions
- Tausug in the Philippines, Malaysia, and Indonesia it can be used in Islamic schools in the Philippines
- Maranao in the Philippines
- Rakhine in Burma and Bangladesh
- Mongolian in Afghanistan There is also a language in the Mongolic family that spoken in the Afghanistan it is called Mogholi language
- Tagalog in the Philippines
- Yakan in Basilan
- Aslian in Malaysia
- Ternate in Indonesia by the Muslims
- Tidore in Indonesia
- Meitei in Bangladesh
- Shughni in Afghanistan
- Thai in Malaysia
- Sylheti in Arakan, Bengal, Chittagong, and Tripura
- Kedah Malay in Myanmar, Malaysia, and Thailand
- Uab Meto in Indonesia
- Molbog in Sabah used by the Muslims even though in Palawan
- Bonggi in Sabah by the Muslims
- Kadazan in Malaysia is a Muslim language
- Dusun used in Brunei, and Malaysia
- Sama used in Philippines, Malaysia, and Indonesia
- Bajau is in Philippines, Malaysia, and Indonesia
- Sarawak Bisaya used in Malaysia, and Brunei
- Sabah Bisaya is used in Sabah
- Lotud spoken in Malaysia only
- Lun Bawang in Sarawak, Sabah, Temburong and Kalimantan
- Tiruray in the Bangsamoro
- Chavacano in Cotabato, Zamboanga Peninsula, Sulu, Basilan, Tawi-Tawi, Sabah, and Kalimantan
- Maranao has Arabic script in Lanao del Sur,Lanao del Norte, and Sabah
- Iranun used in Islamic schools in Mindanao,and Malaysia
Middle East[edit]
- Hebrew was written in Arabic letters in a number of places in the past[38][39]
- Northern Kurdish in Turkey and Syria was written in Arabic script until 1932, when a modified Kurdish Latin alphabet was introduced by Jaladat Ali Badirkhan in Syria
- Turkish in the Ottoman Empire was written in Arabic script until Mustafa Kemal Atatürk declared the change to Latin script in 1928. This form of Turkish is now known as Ottoman Turkish and is held by many to be a different language, due to its much higher percentage of Persian and Arabic loanwords (Ottoman Turkish alphabet)
Unicode[edit]
As of Unicode 15.0, the following ranges encode Arabic characters:
- Arabic (0600–06FF)
- Arabic Supplement (0750–077F)
- Arabic Extended-A (08A0–08FF)
- Arabic Extended-B (0870–089F)
- Arabic Extended-C (10EC0–10EFF)
- Arabic Presentation Forms-A (FB50–FDFF)
- Arabic Presentation Forms-B (FE70–FEFF)
- Arabic Mathematical Alphabetic Symbols (1EE00–1EEFF)
- Rumi Numeral Symbols (10E60–10E7F)
- Indic Siyaq Numbers (1EC70–1ECBF)
- Ottoman Siyaq Numbers (1ED00–1ED4F)
Additional letters used in other languages[edit]
Assignment of phonemes to graphemes[edit]
Language family | Austron. | Dravid | Turkic | Indic | Iranian | Germanic | Arabic | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Language/script | Jawi | Pegon | Arwi | Ottoman | Uyghur | Tatars | Sindhi | Punjabi | Urdu | Persian | Balochi | Kurdish | Pashto | Afrikaans | Moroccan | Tunisian | Algerian | Egyptian | Najdi | Hejazi | Levantine | Iraqi | Gulf |
/p/ | ڤ | ڣ | پ | پ / ب | |||||||||||||||||||
/g/ | ݢ | ؼ | گ | ګ | گ | ڭ / گ | ڨ / ڧـ ـڧـ ـٯ / ق | ج | ق | ك / ج | گ / ك | ق / گ | |||||||||||
/t͡ʃ/ | چ | ∅ | چ | ڜ | تش | چ | |||||||||||||||||
/v/ | ۏ | ف | و | ۋ | و | ∅ | ڤ | ∅ | ڤ | ڥ / ڢ / ف | ڤ / ف | ||||||||||||
/ʒ/ | ∅ | ژ | ∅ | ژ | ج | ∅ | چ / ج | ∅ | ج | ∅ | |||||||||||||
/ŋ/ | ڠ | ࢳ | ڭ | ڱ | ن٘ | ∅ | ڠ | ∅ | |||||||||||||||
/ɳ/ | ∅ | ∅ | ڹ | ∅ | ڻ | ݨ | ن | ∅ | ڼ | ∅ | ∅ | ||||||||||||
/ɲ/ | ڽ | ۑ | ݧ | ∅ | ڃ | نج | ∅ | ∅ |
Letter or Digraph [A] | Use & Pronunciation | Unicode | i’jam & other additions | Shape | Similar Arabic Letter(s) | ||||
---|---|---|---|---|---|---|---|---|---|
U+ | [B] | [C] | above | below | |||||
پ | پـ ـپـ ـپ | Pe, used to represent the phoneme /p/ in Persian, Pashto, Punjabi, Khowar, Sindhi, Urdu, Kurdish, Kashmiri; it is can be used in Arabic to describe the phoneme /p/ otherwise it is normalized to /b/ ب e.g. پول Paul also written بول | U+067E | ﮹ | none | 3 dots | ٮ | ب | |
ݐ | ݐـ ـݐـ ـݐ | used to represent the equivalent of the Latin letter Ƴ (palatalized glottal stop /ʔʲ/) in some African languages such as Fulfulde. | U+0750 | ﮳﮳﮳ | none | 3 dots (horizontal) |
ٮ | ب | |
ٻ | ٻـ ـٻـ ـٻ | B̤ē, used to represent a voiced bilabial implosive /ɓ/ in Hausa, Sindhi and Saraiki. | U+067B | ﮾ | none | 2 dots (vertically) |
ٮ | ب | |
ڀ | ڀـ ـڀـ ـڀ | represents an aspirated voiced bilabial plosive /bʱ/ in Sindhi. | U+0680 | ﮻ | none | 4 dots | ٮ | ب | |
ٺ | ٺـ ـٺـ ـٺ | Ṭhē, represents the aspirated voiceless retroflex plosive /ʈʰ/ in Sindhi. | U+067A | ﮽ | 2 dots (vertically) |
none | ٮ | ت | |
ټ | ټـ ـټـ ـټ | Ṭē, used to represent the phoneme /ʈ/ in Pashto. | U+067C | ﮿ | ﮴ | 2 dots | ring | ٮ | ت |
ٽ | ٽـ ـٽـ ـٽ | Ṭe, used to represent the phoneme (a voiceless retroflex plosive /ʈ/) in Sindhi | U+067D | ﮸ | 3 dots (inverted) |
none | ٮ | ت | |
ﭦ | ٹـ ـٹـ ـٹ | Ṭe, used to represent Ṭ (a voiceless retroflex plosive /ʈ/) in Punjabi, Kashmiri, Urdu. | U+0679 | ◌ؕ | small ط |
none | ٮ | ت | |
ٿ | ٿـ ـٿـ ـٿ | Teheh, used in Sindhi and Rajasthani (when written in Sindhi alphabet); used to represent the phoneme /t͡ɕʰ/ (pinyin q) in Chinese Xiao’erjing. | U+067F | ﮺ | 4 dots | none | ٮ | ت | |
ڄ | ڄـ ـڄـ ـڄ | represents the «c» voiceless dental affricate /t͡s/ phoneme in Bosnian. | U+0684 | ﮾ | none | 2 dots (vertically) |
ح | ج | |
ڃ | ڃـ ـڃـ ـڃ | represents the «ć» voiceless alveolo-palatal affricate /t͡ɕ/ phoneme in Bosnian. | U+0683 | ﮵ | none | 2 dots | ح | ح ج | |
چ | چـ ـچـ ـچ | Che, used to represent /t͡ʃ/ («ch»). It is used in Persian, Pashto, Punjabi, Urdu, Kashmiri and Kurdish. /ʒ/ in Egypt. | U+0686 | ﮹ | none | 3 dots | ح | ج | |
څ | څـ ـڅـ ـڅ | Ce, used to represent the phoneme /t͡s/ in Pashto. | U+0685 | ﮶ | 3 dots | none | ح | ج خ ح | |
ݗ | ݗـ ـݗـ ـݗ | represents the «đ» voiced alveolo-palatal affricate /d͡ʑ/ phoneme in Bosnian. | U+0757 | ﮴ | 2 dots | none | ح | ح | |
ځ | ځـ ـځـ ـځ | Źim, used to represent the phoneme /d͡z/ in Pashto. | U+0681 | ◌ٔ | Hamza | none | ح | ج خ ح | |
ݙ | ݙ ـݙ | used in Saraiki to represent a Voiced alveolar implosive /ɗ̢/. | U+0759 | ﯀ | ﮾ | small ط |
2 dots (vertically) |
د | د |
ڊ | ڊ ـڊ | used in Saraiki to represent a voiced retroflex implosive /ᶑ/. | U+068A | ﮳ | none | 1 dot | د | د | |
ڈ | ڈ ـڈ | Ḍal, used to represent a Ḍ (a voiced retroflex plosive /ɖ/) in Punjabi, Kashmiri and Urdu. | U+0688 | ◌ؕ | small ط | none | د | د | |
ڌ | ڌ ـڌ | Dhal, used to represent the phoneme /d̪ʱ/ in Sindhi | U+068C | ﮴ | 2 dots | none | د | د | |
ډ | ډ ـډ | Ḍal, used to represent the phoneme /ɖ/ in Pashto. | U+0689 | ﮿ | none | ring | د | د | |
ڑ | ڑ ـڑ | Ṛe, represents a retroflex flap /ɽ/ in Punjabi and Urdu. | U+0691 | ◌ؕ | small ط | none | ر | ر | |
ړ | ړ ـړ | Ṛe, used to represent a retroflex lateral flap in Pashto. | U+0693 | ﮿ | none | ring | ر | ر | |
ݫ | ݫ ـݫ | used in Ormuri to represent a voiced alveolo-palatal fricative /ʑ/, as well as in Torwali. | U+076B | ﮽ | 2 dots (vertically) |
none | ر | ر | |
ژ | ژ ـژ | Že / zhe, used to represent the voiced postalveolar fricative /ʒ/ in, Persian, Pashto, Kurdish, Urdu, Punjabi and Uyghur. | U+0698 | ﮶ | 3 dots | none | ر | ز | |
ږ | ږ ـږ | Ǵe / ẓ̌e, used to represent the phoneme /ʐ/ /ɡ/ /ʝ/ in Pashto. | U+0696 | ﮲ | ﮳ | 1 dot | 1 dot | ر | ز |
ڕ | ڕ ـڕ | used in Kurdish to represent rr /r/ in Soranî dialect. | U+0695 | ٚ | none | V pointing down | ر | ر | |
ݭ | ݭـ ـݭـ ـݭ | used in Kalami to represent a voiceless retroflex fricative /ʂ/, and in Ormuri to represent a voiceless alveolo-palatal fricative /ɕ/. | U+076D | ﮽ | 2 dots vertically | none | س | س | |
ݜ | ݜـ ـݜـ ـݜ | used in Shina to represent a voiceless retroflex fricative /ʂ/. | U+075C | ﮺ | 4 dots | none | س | ش س | |
ښ | ښـ ـښـ ـښ | X̌īn / ṣ̌īn, used to represent the phoneme /x/ /ʂ/ /ç/ in Pashto. | U+069A | ﮲ | ﮳ | 1 dot | 1 dot | س | ش س |
ڜ | ڜـ ـڜـ ـڜ | Unofficially used to represent Spanish words with /t͡ʃ/ in Morocco. | U+069C | ﮶ | ﮹ | 3 dots | 3 dots | س | ش س |
ڨ | ڨـ ـڨـ ـڨ | Ga, used to represent the voiced velar plosive /ɡ/ in Algerian and Tunisian. | U+06A8 | ﮶ | 3 dots | none | ٯ | ق | |
گ | گـ ـگـ ـگ | Gaf, represents a voiced velar plosive /ɡ/ in Persian, Pashto, Punjabi, Kyrgyz, Kazakh, Kurdish, Uyghur, Mesopotamian, Urdu and Ottoman Turkish. | U+06AF | line | horizontal line | none | گ | ك | |
ګ | ګـ ـګـ ـګ | Gaf, used to represent the phoneme /ɡ/ in Pashto. | U+06AB | ﮿ | ring | none | ک | ك | |
ݢ | ݢـ ـݢـ ـݢ | Gaf, represents a voiced velar plosive /ɡ/ in the Jawi script of Malay. | U+0762 | ﮲ | 1 dot | none | ک | ك | |
ڬ | ڬـ ـڬـ ـڬ | U+06AC | ﮲ | 1 dot | none | ك | ك | ||
ؼ | ؼـ ـؼـ ـؼ | Gaf, represents a voiced velar plosive /ɡ/ in the Pegon script of Indonesian. | U+08B4 | ﮳ | none | 1 dot | ك | ك | |
ڭ | ڭـ ـڭـ ـڭ | Ng, used to represent the /ŋ/ phone in Ottoman Turkish, Kazakh, Kyrgyz, and Uyghur, and to unofficially represent the /ɡ/ in Morocco and in many dialects of Algerian. | U+06AD | ﮶ | 3 dots | none | ك | ك | |
أي | أيـ ـأيـ ـأي | Ee, used to represent the phoneme /eː/ in Somali. | U+0623 U+064A | ◌ٔ | ﮵ | Hamza | 2 dots | اى | أ + ي |
ئ | ئـ ـئـ ـئ | E, used to represent the phoneme /e/ in Somali. | U+0626 | ◌ٔ | Hamza | none | ى | ي ی | |
ىٓ | ىٓـ ـىٓـ ـىٓ | Ii, used to represent the phoneme /iː/ in Somali and Saraiki. | U+0649 U+0653 | ◌ٓ | Madda | none | ى | ي | |
ؤ | ؤ ـؤ | O, used to represent the phoneme /o/ in Somali. | U+0624 | ◌ٔ | Hamza | none | و | ؤ | |
ۅ | ۅ ـۅ | Ö, used to represent the phoneme /ø/ in Kyrgyz. | U+0624 | ◌̵ | Strikethrough[D] | none | و | و | |
ې | ېـ ـېـ ـې | Pasta Ye, used to represent the phoneme /e/ in Pashto and Uyghur. | U+06D0 | ﮾ | none | 2 dots vertical | ى | ي | |
ی | یـ ـیـ ـی | Nārīna Ye, used to represent the phoneme [ɑj] and phoneme /j/ in Pashto. | U+06CC | ﮵ | 2 dots (start + mid) |
none | ى | ي | |
ۍ | ـۍ | end only |
X̌əźīna ye Ye, used to represent the phoneme [əi] in Pashto. | U+06CD | line | horizontal line |
none | ى | ي |
ئ | ئـ ـئـ ـئ | Fāiliya Ye, used to represent the phoneme [əi] and /j/ in Pashto, Punjabi, Saraiki and Urdu | U+0626 | ◌ٔ | Hamza | none | ى | ي ى | |
أو | أو ـأو | Oo, used to represent the phoneme /oː/ in Somali. | U+0623 U+0648 | ◌ٔ | Hamza | none | او | أ + و | |
ﻭٓ | ﻭٓ ـﻭٓ | Uu, used to represent the phoneme /uː/ in Somali. | ﻭ + ◌ٓ U+0648 U+0653 | ◌ٓ | Madda | none | و | ﻭ + ◌ٓ | |
ڳ | ڳـ ـڳـ ـڳ | represents a voiced velar implosive /ɠ/ in Sindhi and Saraiki | U+06B1 | ﮾ | horizontal line |
2 dots | گ | ك | |
ڱ | ڱـ ـڱـ ـڱ | represents the Velar nasal /ŋ/ phoneme in Sindhi. | U+06B1 | ﮴ | 2 dots + horizontal line |
none | گ | ك | |
ک | کـ ـکـ ـک | Khē, represents /kʰ/ in Sindhi. | U+06A9 | none | none | none | ک | ك | |
ڪ | ڪـ ـڪـ ـڪ | «Swash kāf» is a stylistic variant of ك in Arabic, but represents un- aspirated /k/ in Sindhi. | U+06AA | none | none | none | ڪ | ك or ڪ | |
ݣ | ݣـ ـݣـ ـݣ | used to represent the phoneme /ŋ/ (pinyin ng) in Chinese. | U+0763 | ﮹ | none | 3 dots | ک | ك | |
ڼ | ڼـ ـڼـ ـڼ | represents the retroflex nasal /ɳ/ phoneme in Pashto. | U+06BC | ں | ﮿ | ﮲ | 1 dot | ring | ن |
ڻ | ڻـ ـڻـ ـڻ | represents the retroflex nasal /ɳ/ phoneme in Sindhi. | U+06BB | ◌ؕ | small ط | none | ں | ن | |
ݨ | ݨـ ـݨـ ـݨ | used in Punjabi to represent /ɳ/ and Saraiki to represent /ɲ/. | U+0768 | ﮲ | ﯀ | 1 dot + small ط | none | ں | ن |
ڽ | ڽـ ـڽـ ـڽ | Nya /ɲ/ in the Jawi script. | U+06BD | ﮶ | 3 dots | none | ں | ن | |
ۑ | ۑـ ـۑـ ـۑ | Nya /ɲ/ in the Pegon script. | U+06D1 | ﮹ | none | 3 dots | ى | ى | |
ڠ | ڠـ ـڠـ ـڠ | Nga /ŋ/ in the Jawi script and Pegon script. | U+06A0 | ﮶ | 3 dots | none | ع | غ | |
ݪ | ݪـ ـݪـ ـݪ | used in Marwari to represent a retroflex lateral flap /ɺ̢/, and in Kalami to represent a voiceless lateral fricative /ɬ/. | U+076A | line | horizontal line |
none | ل | ل | |
ࣇ | ࣇ ࣇ ࣇ | ࣇ — or alternately typeset as لؕ — is used in Punjabi to represent voiced retroflex lateral approximant /ɭ/[40] | U+08C7 | ◌ؕ | small ط | none | ل | ل | |
لؕ | لؕـ ـلؕـ ـلؕ | U+0644 U+0615 | |||||||
ڥ | ڥـ ـڥـ ـڥ | Vi, used in Algerian Arabic and Tunisian Arabic when written in Arabic script to represent the sound /v/ (unofficial). | U+06A5 | ﮹ | none | 3 dots | ڡ | ف | |
ڤ | ڤـ ـڤـ ـڤ | Ve, used in by some Arabic speakers to represent the phoneme /v/ in loanwords, and in the Kurdish language when written in Arabic script to represent the sound /v/. Also used as pa /p/ in the Jawi script and Pegon script. | U+06A4 | ﮶ | 3 dots | none | ڡ | ف | |
ۏ | ۏ ـۏ | Va in the Jawi script. | U+06CF | ﮲ | 1 dot | none | و | و | |
ۋ | ۋ ـۋ | represents a voiced labiodental fricative /v/ in Kyrgyz, Uyghur, and Old Tatar; and /w, ʊw, ʉw/ in Kazakh; also formerly used in Nogai. | U+06CB | ﮶ | 3 dots | none | و | و | |
ۆ | ۆ ـۆ | represents «O» /o/ in Kurdish, and in Uyghur it represents the sound similar to the French eu and œu /ø/ sound. It represents the «у» close back rounded vowel /u/ phoneme in Bosnian. | U+06C6 | ◌ٚ | V pointing down | none | و | و | |
ۇ | ۇ ـۇ | U, used to represents the Close back rounded vowel /u/ phoneme in Azerbaijani, Kazakh, Kyrgyz and Uyghur. | U+06C7 | ◌ُ | Damma[E] | none | و | و | |
ێ | ێـ ـێـ ـێ | represents Ê or É /e/ in Kurdish. | U+06CE | ◌ٚ | V pointing down | 2 dots (start + mid) |
ى | ي | |
ھ ھ |
ھـ ـھـ ـھ ھھھ |
Do-chashmi he (two-eyed hāʼ), used in digraphs for aspiration /ʰ/ and breathy voice /ʱ/ in Punjabi and Urdu. Also used to represent /h/ in Kazakh, Sorani and Uyghur.[F] | U+06BE | none | none | none | ھ | ه | |
ە | ە ـە | Ae, used represent /æ/ and /ɛ/ in Kazakh, Sorani and Uyghur. | U+06D5 | none | none | none | ھ | إ | |
ے | ـے | end only |
Baṛī ye (‘big yāʼ’), is a stylistic variant of ي in Arabic, but represents «ai» or «e» /ɛː/, /eː/ in Urdu and Punjabi. | U+06D2 | none | none | none | ے | ي |
ڞ | ڞـ ـڞـ ـڞ | used to represent the phoneme /tsʰ/ (pinyin c) in Chinese. | U+069E | ﮶ | 3 dots | none | ص | ص ض | |
ط | طـ ـطـ ـط | used to represent the phoneme /t͡s/ (pinyin z) in Chinese. | U+0637 | ط | ط | ||||
ۉ | ۉ ـۉ | represents the «o» open-mid back rounded vowel /ɔ/ phoneme in Bosnian. | U+06C9 | ◌ٛ | V pointing up | none | و | و | |
ݩ | ݩـ ـݩـ ـݩ | represents the «nj» palatal nasal /ɲ/ phoneme in Bosnian. | U+0769 | ﮲ | ◌ٚ | 1 dot V pointing down |
none | ں | ن |
ڵ | ڵـ ـڵـ ـڵ | used in Kurdish to represent ll /ɫ/ in Soranî dialect. | U+06B5 | ◌ٚ | V pointing down | none | ل | ل | |
ڵ | ڵـ ـڵـ ـڵ | represents the «lj» palatal lateral approximant /ʎ/ phoneme in Bosnian. | U+06B5 | ◌ٚ | V pointing down | none | ل | ل | |
اٖى | اٖىـ ـاٖىـ ـاٖى | represents the «i» close front unrounded vowel /i/ phoneme in Bosnian. | U+0627 U+0656 U+0649 | ◌ٖ | Alef | none | اى | اٖ + ى |
- Footnotes:
- ^ From right: start, middle, end, and isolated forms.
- ^ Joined to the letter, closest to the letter, on the first letter, or above.
- ^ Further away from the letter, or on the second letter, or below.
- ^ A variant that end up with loop also exists.
- ^ Although the letter also known as Waw with Damma, some publications and fonts features filled Damma that looks similar to comma.
- ^ Shown in Naskh (top) and Nastaliq (bottom) styles. The Nastaliq version of the connected forms are connected to each other, because the tatweel character U+0640 used to show the other forms does not work in many Nastaliq fonts.
Letter construction[edit]
Most languages that use alphabets based on the Arabic alphabet use the same base shapes. Most additional letters in languages that use alphabets based on the Arabic alphabet are built by adding (or removing) diacritics to existing Arabic letters. Some stylistic variants in Arabic have distinct meanings in other languages. For example, variant forms of kāf ك ک ڪ are used in some languages and sometimes have specific usages. In Urdu and some neighbouring languages, the letter Hā has diverged into two forms ھ dō-čašmī hē and ہ ہـ ـہـ ـہ gōl hē.[41] While a variant form of ي yā referred to as baṛī yē ے is used at the end of some words.[41]
Table of Letter Components[edit]
See also[edit]
- Arabic (Unicode block)
- Eastern Arabic numerals (digit shapes commonly used with Arabic script)
- History of the Arabic alphabet
- Transliteration of Arabic
- Xiao’erjing
References[edit]
- ^ «Arabic Alphabet». Encyclopædia Britannica online. Archived from the original on 26 April 2015. Retrieved 2015-05-16.
- ^ Mahinnaz Mirdehghan. 2010. Persian, Urdu, and Pashto: A comparative orthographic analysis. Writing Systems Research Vol. 2, No. 1, 9–23.
- ^ «Exposición Virtual. Biblioteca Nacional de España». Bne.es. Archived from the original on 2012-02-18. Retrieved 2012-04-06.
- ^ Ahmad, Syed Barakat. (11 January 2013). Introduction to Qur’anic script. ISBN 978-1-136-11138-9. OCLC 1124340016.
- ^ Gruendler, Beatrice (1993). The Development of the Arabic Scripts: From the Nabatean Era to the First Islamic Century According to Dated Texts. Scholars Press. p. 1. ISBN 9781555407100.
- ^ Healey, John F.; Smith, G. Rex (2012-02-13). «II — The Origin of the Arabic Alphabet». A Brief Introduction to The Arabic Alphabet. Saqi. ISBN 9780863568817.
- ^ Senner, Wayne M. (1991). The Origins of Writing. U of Nebraska Press. p. 100. ISBN 0803291671.
- ^ «Nabataean abjad». www.omniglot.com. Retrieved 2017-03-08.
- ^ Naveh, Joseph. «Nabatean Language, Script and Inscriptions» (PDF).
- ^ Taylor, Jane (2001). Petra and the Lost Kingdom of the Nabataeans. I.B.Tauris. p. 152. ISBN 9781860645082.
- ^ «Zribi, I., Boujelbane, R., Masmoudi, A., Ellouze, M., Belguith, L., & Habash, N. (2014). A Conventional Orthography for Tunisian Arabic. In Proceedings of the Language Resources and Evaluation Conference (LREC), Reykjavík, Iceland».
- ^ Brustad, K. (2000). The syntax of spoken Arabic: A comparative study of Moroccan, Egyptian, Syrian, and Kuwaiti dialects. Georgetown University Press.
- ^ «Sayad Zahoor Shah Hashmii». baask.com.
- ^ Sarlak, Riz̤ā (2002). «Dictionary of the Bakhtiari dialect of Chahar-lang». google.com.eg.
- ^ Iran, Mojdeh (5 February 2011). «Bakhtiari Language Video (bak) بختياري ها! خبری مهم» – via Vimeo.
- ^ «Ethnologue». Retrieved Feb 1, 2020.
- ^ «Pakistan should mind all of its languages!». tribune.com.pk. June 2011.
- ^ «Ethnologue». Retrieved Feb 1, 2020.
- ^ «Ethnologue». Retrieved Feb 1, 2020.
- ^ «The Bible in Brahui». Worldscriptures.org. Archived from the original on October 30, 2016. Retrieved August 5, 2013.
- ^ «Rohingya Language Book A-Z». Scribd.
- ^ «Ida’an». scriptsource.org.
- ^ «The Coptic Studies’ Corner». stshenouda.com. Archived from the original on 2012-04-19. Retrieved 2012-04-17.
- ^ «—The Cradle of Nubian Civilisation—«. thenubian.net.
- ^ «2 » AlNuba egypt». 19 July 2012. Archived from the original on 19 July 2012.
- ^ «Zarma». scriptsource.org.
- ^ «Tadaksahak». scriptsource.org.
- ^ «Lost Language — Bostonia Summer 2009». bu.edu.
- ^ «Dyula». scriptsource.org.
- ^ «Jola-Fonyi». scriptsource.org.
- ^ «Ibn Sayyid manuscript». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
- ^ «Muhammad Arabic letter». Archived from the original on 2015-09-08. Retrieved 2018-09-27.
- ^ «Charno Letter». Muslims In America. Archived from the original on May 20, 2013. Retrieved August 5, 2013.
- ^ Asani, Ali S. (2002). Ecstasy and enlightenment : the Ismaili devotional literature of South Asia. Institute of Ismaili Studies. London: I.B. Tauris. p. 124. ISBN 1-86064-758-8. OCLC 48193876.
- ^ Alphabet Transitions – The Latin Script: A New Chronology – Symbol of a New Azerbaijan Archived 2007-04-03 at the Wayback Machine, by Tamam Bayatly
- ^ Sukhail Siddikzoda. «Tajik Language: Farsi or Not Farsi?» (PDF). Archived from the original (PDF) on June 13, 2006.
- ^ «Brief history of writing in Chechen». Archived from the original on December 23, 2008.
- ^ p. 20, Samuel Noel Kramer. 1986. In the World of Sumer: An Autobiography. Detroit: Wayne State University Press.
- ^ J. Blau. 2000. Hebrew written in Arabic characters: An instance of radical change in tradition. (In Hebrew, with English summary). In Heritage and Innovation in Judaeo-Arabic Culture: Proceedings of the Sixth Conference of the Society For Judaeo-Arabic Studies, p. 27-31. Ramat Gan.
- ^ Lorna Priest Evans; M. G. Abbas Malik. «Proposal to encode ARABIC LETTER LAM WITH SMALL ARABIC LETTER TAH ABOVE in the UCS» (PDF). www.unicode.org. Retrieved 10 May 2020.
- ^ a b «Urdu Alphabet». www.user.uni-hannover.de. Archived from the original on 11 September 2019. Retrieved 4 May 2020.
External links[edit]
- Unicode collation charts—including Arabic letters, sorted by shape
- Why the right side of your brain doesn’t like Arabic
- Arabic fonts by SIL’s Non-Roman Script Initiative
- Alexis Neme and Sébastien Paumier (2019), «Restoring Arabic vowels through omission-tolerant dictionary lookup», Lang Resources & Evaluation, Vol. 53, pp. 1–65. arXiv:1905.04051; doi:10.1007/s10579-019-09464-6
- Арабская письменность
- Буквы
- Звуки
- Знаки
- Задания
- Дополнительно
⊗ В этом уроке вы узнаете об арабской письменности, о количестве букв в арабском алфавите, о том как выглядят буквы и на какие категории они подразделяются. Также вы узнаете о том, что такое транскрипция и какие виды транскрипций бывают. Вы узнаете какие виды звуков есть в арабской речи, а также сколько и какие начертания бывают у букв. Вы ознакомитесь о специальными знаками в арабской письменности.
§1. Об арабском алфавите. Арабы пишут и читают справа налево. В арабском алфавите всего 28 букв. На письме отображаются согласные и три долгих гласных. Короткие гласные звуки, а их три, передаются путем специальных значков, так называемыми «огласовками», которые ставятся над или под буквой, (см. урок 2. Огласовки).
Посмотрите как вы выглядит и звучит арабский алфавит.
ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي
Каждая буква алфавита имеет несколько начертаний, в зависимости от их местоположения в слове. В письме не бывает заглавных букв и в нем существует несколько видов почерков. Одним из распространенных почерков является ʾан-насх̮. Внизу показан пример написания выражения «Во имя Аллаха Милостивого Милосердного» этим почерком.
§2. Как читать тексты без огласовок. В арабских изданиях и в СМИ тексты не сопровождаются огласовками, за исключением учебной и религиозной литературы. Арабы прекрасно читают и понимают тексты без огласовок. Сравнимо это с тем, когда мы читаем текст на русском языке где есть буква Ё без точек. Поэтому устанавливать и воспроизводить гласные в процессе чтения нужно самому читателю. Уверенное владение лексико-грамматическим материалом языка позволяет справится с этой задачей.
Далее переходите на вкладку БУКВЫ.
§1. Арабские буквы. Транскрипция. В арабском языке между системой изображения слов на письме и их звучанием есть разница, поэтому для практичности принято использовать транскрипцию. Транскрипция — это условные знаки или буквы латиницы либо кириллицы, путем которых на письме передаются те или иные звуки, при необходимости они снабжаются специальными значками.
Транскрипция делится на два вида, фонетическая и фонематическая. Фонетическая транскрипция показывает передачу реального произношения, произношение фонем с их оттенками и видами. Фонематическая транскрипция показывает упрощенную передачу лишь фонем того или иного слова, без учета вариантов фонем и их оттенков. При чтении фонематической транскрипции ученику самому придется произносить звуки правильно, основываясь на произношение звуков, услышанных им через аудио прослушивание.
В этом курсе мы будем использовать фонематическую транскрипцию, в качестве вспомогательного механизма для быстрого перехода к чтению текстов.
Ниже приведена таблица арабского алфавита, с указанием названий букв и их аудио звучаний.
№ — Порядковый номер; A — В конце слова; B — В середине слова; C — В начале слова; D — В обособленном виде; E — Название буквы; F — Транскрипция; G — Аудио звучание.
№ | А | B | C | D | E | F | G |
1 | ـا | ا | أَلِف
’алиф |
— | |||
2 | ـب | ـبـ | بـ | ب | بَاء
ба̄’ |
б | |
3 | ـت | ـتـ | تـ | ت | تَاء
та̄’ |
т | |
4 | ـث | ـثـ | ثـ | ث | ثَاء
с̱а̄’ |
с̱ | |
5 | ـج | ـجـ | جـ | ج | جِيم
джӣм |
дж | |
6 | ـح | ـحـ | حـ | ح | حَاء
х̣а̄’ |
х̣ | |
7 | ـخ | ـخـ | خـ | خ | خَاء
х̮а̄’ |
х̮ | |
8 | ـد | د | دَال
да̄ль |
д | |||
9 | ـذ | ذ | ذَال
з̱а̄ль |
з̱ | |||
10 | ـر | ر | رَاء
ра̄’ |
р | |||
11 | ـز | ز | زَاى
за̄й |
з | |||
12 | ـس | ـسـ | سـ | س | سِين
сӣн |
с | |
13 | ـش | ـشـ | شـ | ش | شِين
шӣн |
ш | |
14 | ـص | ـصـ | صـ | ص | صَاد
с̣а̄д |
с̣ | |
15 | ـض | ـضـ | ضـ | ض | ضَاد
д̣а̄д |
д̣ | |
16 | ـط | ـطـ | طـ | ط | طَاء
т̣а̄’ |
т̣ | |
17 | ـظ | ـظـ | ظـ | ظ | ظَاء
з̣а̄’ |
з̣ | |
18 | ـع | ـعـ | عـ | ع | عَيْن
‘айн |
‘ | |
19 | ـغ | ـغـ | غـ | غ | غَيْن
гайн |
г |
|
20 | ـف | ـفـ | فـ | ف | فَاء
фа̄’ |
ф | |
21 | ـق | ـقـ | قـ | ق | قَاف
к̣а̄ф |
к̣ | |
22 | ـك | ـكـ | كـ | ك | كَاف
ка̄ф |
к | |
23 | ـل | ـلـ | لـ | ل | لاَم
ля̄м |
ль | |
24 | ـم | ـمـ | مـ | م | مِيم
мӣм |
м | |
25 | ـن | ـنـ | نـ | ن | نُون
нӯн |
н | |
26 | ـه | ـهـ | هـ | ه | هَاء
ха̄’ |
х | |
27 | ـو | و | وَاو
ва̄в |
в | |||
28 | ـي | ـيـ | يـ | ي | يَاء
йа̄’ |
й |
§2. Группы и категории букв и их начертания. Арабский алфавит, с точки зрения правописания, делится на две основные группы.
Первая группа — буквы, которые схожи между собой по форме и правописанию, но имеют отличия в дополнительных значках (точках)
ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ
Вторая группа — буквы, которые не имеют себе подобных
Большинство букв алфавита в зависимости от местоположения в слове имеют разные варианты написания, то есть имеют особые начертания в обособленном порядке, в начале, в середине и в конце слов, как показано в таблице. Исходя из этого, буквы можно разделить на две категории:
- Буквы, которые имеют все четыре начертания. Их двадцать две (см. таблицу алфавита). Буквы этой категории могут соединяться с обеих сторон с другими буквами при письме.
- Буквы, которые имеют только два вида начертаний (в таблице показаны на розовом фоне) :1- обособленное — начальное; 2- серединное — конечное. Их шесть. Буквы этой категории могут соединятся только спереди идущими буквами из первой категории, но после себя не дают возможности к без отрывному соединению.
Арабские буквы соединяются между собой соединительной линией ( _ ). Например:
фан — искусство | ف + ـ + ن = فَــــن |
Слова оканчиваются на конечное начертание буквы. При этом есть буквы, которые полностью находятся над строчкой и есть буквы, половина которых может опускаться ниже строки.
С 4 -го по 12 -ый уроки этого курса мы разберем эти буквы отдельно.
Далее переходите на вкладку ЗВУКИ.
§1. Звуки. В арабском алфавите все 28 букв являются согласными. Однако говорить на арабском, как и на любом языке, не представляется возможным без гласных звуков. Роль гласных звуков выполняют специальные символы, которые называются огласовками, выступающие в качестве кратких гласных. Более подробнее об огласовках во 2-ом уроке курса.
Посмотрите примеры:
Арабский язык отличается сложной фонетической формой. В нем могут встречаться звуки, которые редки в других языках.
Например:
х̣а̄сӯб компьютер |
حَــاسُوبٌ | ح | |
‘алам флаг |
عَــلَمٌ | ع |
Широко используются и горловые звуки.
Например:
’усра семья |
أُسْرَةٌ | أ | |
ха̄тиф телефон |
هَــاتِفٌ | ه |
В примере выше показан знак хамза на букве ’алиф أ , он похож на лежачую цифру четыре ء . Этот знак выражает звук который производится коротким сокращением диафрагмы при произношении звука [а]. Данный звук можно услышать в слове «соавтор». Подробнее об этом звуке мы разберем в 17 уроке этого курса.
В арабской речи также встречаются эмфатические звуки, или как их еще называют «сложные». Эти звуки не встречаются ни в каких языках мира.
Произносятся эмфатические звуки гораздо напряженнее и интенсивнее, чем их соответствующие согласные звуки как сӣн س , да̄ль د , та̄’ ت , з̱а̄ль ذ . Посмотрите примеры:
с̣а̄д | ص | |
д̣а̄д | ض | |
т̣а̄’ | ط | |
з̣а̄’ | ظ |
Есть также в речи и межзубные звуки:
с̱ауб одежда |
ثَــوْبٌ | ث | |
з̱уба̄ба муха |
ذُبَابَةٌ | ذ |
Внимание! алиф ا не несет в себе самостоятельного звучания, он служит для обозначения долготы гласного звука а̄, а также служит подставкой для танвӣн (см. 14 урок курса) и знака хамза ء (см. 17 урок курса) .
Далее переходите на вкладку ЗНАКИ
§1. Знаки, не вошедшие в алфавит. Помимо 28 букв алфавита в арабском языке используются еще три специальных знака, которые по сути являются подобием букв. Некоторые из них несут смысловую нагрузку, а некоторые только выражают особый звук.
Каждый знак мы разберем в этом курсе по отдельности.
№ — Порядковый номер; A — В конце слова; B — В середине слова; C — В начале слова; D — В обособленном виде; E — Название знака; F — Транскрипция.
№ | А | B | C | D | E | F |
1 | ء | هَمْزَة хамза |
’ | |||
ـأ | أ | |||||
ـإ | إ | |||||
ـؤ | ؤ | |||||
ـئ | ـئـ | ئـ | ئ | |||
2 | ـة | — | ة | تَاء مَرْبُوطَة та̄’ марбӯт̣а |
— | |
3 | ـى | — | ى | أَلِفُ مَقصورة ’алиф мак̣с̣ӯра |
а̄ |
Итак, этом уроке Вы узнали об арабской письменности, о количестве букв в арабском алфавите, о том как выглядят буквы и на какие категории они подразделяются. Также Вы узнали о том, что такое транскрипция и какие виды транскрипций бывают. Вы узнали какие виды звуков есть в арабской речи, а также сколько и какие начертания бывают у букв. Также вы узнали что помимо букв в арабском языке используются букваподобные знаки.
Для закрепления пройденного материала переходите на вкладку ЗАДАНИЯ и выполните все упражнения.
≈1. Внимательно прослушайте каждую букву. Заучите алфавит.
ث | ت | ب | ا |
د | خ | ح | ج |
س | ز | ر | ذ |
ط | ض | ص | ش |
ف | غ | ع | ظ |
م | ل | ك | ق |
ي | و | ه | ن |
ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ك ل م ن ه و ي
Во вкладке ДОПОЛНИТЕЛЬНО распечатайте алфавит для наглядности.
≈2. Переместите букву на ее идентичный сектор.
≈3. Переместите букву к ее правильному названию.
≈4. Переместите букву на ее правильное аудио звучание.
≈5. Выстройте буквы в алфавитном порядке.
≈6. Пройдите ТЕСТ.
Внимание! Если Вы полностью освоили этот урок и выполнили все задания и тесты нажмите кнопку ОТМЕТИТЬ КАК ЗАВЕРШЕННЫЙ и переходите к изучению следующего урока.
Если у Вас возникли вопросы пишите в комментариях.
К какой языковой семье относится арабский язык?
Между учеными существует единое мнение относительно того, что арабский язык относится к группе языков семитского происхождения, однако они имеют разногласия в том, как это выглядит на самом деле. Группу эту они называют «хамито-семитской группой».
Такие народности как арамейские, финикйские, еврейские, арабские, йеменские, вавилоно-ассирийские имеют общее название как «семитские народности».
Семитские языки в основе своей делятся на «западные» и «восточные». «Восточные» в свою очередь делятся на «северные» и «южные».
Что касается «северной» группы семитских языков, то к ней относятся «канаанейские» и «арамейские» языки. Одной из самых известных диалектов канаанейского языка является еврейский язык.
Что касается «южной» группы, то к ней относятся два больших арабских языка, (южный арабский язык) и (северный арабский язык).
Южный арабский язык называют как «йеменский древний» либо «кахтанейский».
Что касается арабского языка, которое имеет самое широкое распространение сегодня, то он имеет прямое отношение к одному из говоров «северной арабской языковой среды».
Скачайте материалы урока ⇓
Текст |
К началу курса: Арабский Алфавит
Почему в арабском языке и иврите письмо идет справа налево?
В подавляющем большинстве языков письмо идет слева направо. Но только не в случае арабского и иврита. Правила этих языков ставят в тупик любого.
На самом деле ответ на этот вопрос не знают даже ученые-лингвисты. Однако у них есть правдоподобная теория.
Известно, что современные языки переняли стили письма от более древних языков, от которых они произошли. Например, греческий и латынь являются основой западных языков. В обоих этих языках слова пишутся слева направо, поэтому западная цивилизация тоже пишет тексты слева направо.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Почему арабский язык пишется справа налево?
С другой стороны, такие языки, как арабский, иврит и персидский, переняли другой стиль письма, потому что они основаны на протоханаанском языке. Это предок финикийского алфавита, в котором буквы писались справа налево. Ученые не знают точно, почему протоханаанское письмо пишется справа налево, тогда как греческое и латинское пишутся слева направо. Правдоподобная теория всего одна.
Согласно первой, направление, в котором тексты пишутся (и читаются), может быть связано с материалом, на котором эти тексты были написаны. До 1050 г. до н.э., когда сформировался протоханаанский язык, люди писали только на камне. Поскольку большинство людей правши, было естественно писать справа налево. В левой руке у них было долото, а в правой молоток. Однако около 900 г. до н.э. сформировался греческий язык и появились другие материалы для написания текста, такие как высушенные шкуры животных (пергамент) и папирус.
Но здесь есть большое «но». Понимание — это одно, а подтверждение теории доказательствами — совсем другое. Историкам еще предстоит найти убедительные исторические доказательства этой гипотезы.
И есть ли в арабском гласные?
Арабский язык – сокровище мировой цивилизации: язык Священного Корана, важный для последователей исламской религии; латынь Востока, ведь благодаря переводам с арабского до нас дошли труды античных ученых; один из четырех языков в мире, породивших автохтонную, то есть собственную лингвистическую традицию наряду с китайским, санскритом и греческим.
В мире больше 300 миллионов носителей арабского, он обладает статусом официального языка в 24 государствах Азии и Африки.
Давайте узнаем про арабский чуть больше.
Наш проводник – Татьяна Сергеевна Савватеева, старший преподаватель кафедры арабской филологии Института стран Азии и Африки МГУ, представляющая известную российскую арабистическую школу.
Какое у арабского языка происхождение? Почему пишут справа налево?
– Арабский в системе языков – где он?
– Входит в афразийскую макросемью, ее семитскую ветвь. Одного родственника арабского многие знают – это современный иврит, который сложился на основе древнееврейского языка. Другие близкородственные языки: амхарский, официальный язык Эфиопии, и ассирийский, язык изолированных этнических групп Ближнего Востока.
У арабского много мертвых родственных языков: арамейский (язык позднейших книг Библии), финикийский, геэз (культовый язык Эфиопии), древнеегипетский, коптский (культовый язык христианской церкви Египта).
– Какое у арабского письма происхождение?
– Важно уточнить, что в контексте языка у людей часто возникает интерес к письменности, потому что ее можно представить материально. Письменные памятники вещественны. Но язык в первую очередь существует в устной форме, и есть огромное количество бесписьменных языков – отсутствие письменности не лишает их статуса языка.
Считается, что арабская письменность возникла в результате развития набатейского письма. Набатейцы – выходцы с Аравийского полуострова, примерно к 500 году до н.э. обосновавшиеся в северо-восточной части Синайского полуострова. Здесь они познакомились с арамейской письменностью, а она, в свою очередь, была заимствована у финикийцев. На этой основе набатейцы создали свою письменность, и она спустя века оформилась в арабское письмо. Важнейшая веха в истории становления арабского языка – период письменной фиксации Корана с середины VII века.
– На арабском пишут справа налево. Этому есть объяснение?
– Давно известная гипотеза: направление может быть обусловлено материалом и инструментами для письма.
Разумеется, говорим не про арабский, а про протописьменность – алфавит, предшествовавший арабскому. У предков, от которых возникли алфавиты тех или иных языков, были конкретные материал и инструменты. Конечно, когда возникло арабское письмо, уже был пергамент, впоследствии папирус и бумага. Но во времена алфавитов, предшествующих арабскому письму, ситуация могла быть другой.
Гипотеза такова: предками арабского письма были клинописные системы письма, и в качестве материалов чаще всего использовались либо глиняные/каменные таблички, либо сам камень. Текст высекался молотом или зубилом. Так как большинство людей – правши, было удобнее держать молот в правой руке и не закрывать написанное. Ученые продолжают трудиться над этим вопросом.
– Правда ли, что в арабском языке нет гласных?
– Арабское письмо состоит из системы 28 знаков или графем, которые обозначают только согласные. Краткие гласные на письме не передаются в основном ряду графем, а обозначаются специальными значками – огласовками. Их три: «а» (обозначение – небольшая диагональная черта над графемой), «у» (запятая над графемой), «и» (небольшая диагональная черта под графемой).
Но есть и долгие гласные, для их обозначения на письме используются три графемы из алфавита. Если после краткого «у» имеем графему «уау», это будет долгий «у». Если после краткого «и» графема «йа» – долгий «и». Если после краткого гласного «а» графема «алиф» – долгий «а».
Допустим, слово «книга» – «китааб»: первый гласный – краткий, второй гласный – долгий. И «он написал» – «катаб» : оба гласных краткие. Для арабского важна оппозиция кратких и долгих гласных.
Эта оппозиция используется и в грамматике: «преподаватель» – «мударрисун», «преподаватели» – «мударрисуун», благодаря оппозиции появляется множественное число.
В арабском существуют так называемые глайды, способные передавать и согласный, и долгий гласный, все зависит от положения в слове. Пример с графемой «уау»: «мальчик» – «валад», в начале слова идет согласный звук с кратким гласным – «ва». «Тутовник» – «туут», здесь графема «уау» уже после краткого гласного, получается долгий гласный «уу».
Третья графема «алиф», обеспечивающая долгий «а», не используется в качестве согласного, но нужна в начале слов для орфографической подставки для хамзы.
Хамза – это еще одна отличительная черта арабского языка. Дело в том, что слова, которые для русского уха воспринимаются начинающимися с гласного, для арабского начинаются с гортанной смычки. Допустим, ваше имя Артем – в русском слово начинается с гласной. У арабского другая ритмика. Проводился даже фонетический эксперимент: если записать долгое «а-а-а», пленку порезать в каком-то месте и дать послушать арабу не с начала, он все равно слышит согласный компонент. Это гортанная смычка, когда связки смыкаются и размыкаются. Даже в случае Артема – сначала смыкаются связки, потом уже реализация гласной «а».
Вот эта смычка фиксируется на письме и называется хамзой.
– Субъективно, но европейцы иногда называют арабский агрессивным по звучанию. Почему?
– Да, все верно. Носителям русского и других индоевропейских языков, изучающим арабский, непривычно, что задействован весь речевой аппарат, от нижних отделов (очень глубокие гортанные звуки: ларингальные, фарингальные, увулярные) до самого кончика языка (межзубные), есть эмфатические (произносятся с напряжением).
– Про арабский часто говорят, что у некоторых слов бесконечное число синонимов. Например, более 500 для верблюда. Правда?
– Арабский богат на синонимы, обычно всегда вспоминают про верблюда, меч и льва. Чем это обусловлено: зачастую это не полные синонимы, а выделенный признак, характеризующий объект. У бедуинов специфические названия для разных видов верблюдов, для верблюдов в разных состояниях.
Или 99 имен Аллаха – это ведь признаки, эпитеты Аллаха, являющиеся синонимами.
Вступает в силу гипотеза Сепира-Уорфа – гипотеза лингвистической относительности. Как носители определенного языка, мы не просто воспринимаем мир через призму языка, но и навязываем миру картину восприятия через язык – это двустороннее воздействие. Например, у эскимосов много слов в языке, обозначающих оттенки белого. У арабов так с верблюдами.
И второй момент: ритмическая обоснованность двух-трех слов с дублирующим значением. Через повтор достигается художественная выразительность для усиления значения.
– «Аль» постоянно мелькает в фамилиях арабов. В этом смысле выделяется состав Саудовской Аравии – 19 «Аль» на 26 игроков в заявке. В чем феномен?
«Аль» или «ал» – определенный артикль. Могут быть варианты «Ас», «Ар», «Ан» – зависит от того, с какого согласного начинается следующее слово. Все арабские согласные делятся пополам: 14 уподобляют себе «ль» – это процесс ассимиляции, другие 14 не уподобляют.
Как правило, этот артикль имеется в фамилии, если фамилия по своему происхождению означает либо принадлежность к какому-то региону, либо прозвище.
– У марокканцев проскакивает «Эн». Это тоже артикль?
– Да, еще один вариант написания этого же артикля.
Есть разные транслитерации – можно сравнить с тем, как в русском транслитерируется имя Мухаммад. Даже по-русски несколько вариантов транскрипции: и с одной «м» в середине, и через «о», и еще много всего.
– Арабский считается сложным для изучения. Почему?
– Да, так говорят, но я бы хотела опровергнуть, арабский делает подарок изучающему: если научиться верно слышать арабские звуки и верно их произносить, вы точно запишите услышанное без ошибок, даже фразу из незнакомых слов. Полное соответствие между услышанным и записанным. Мы даже со студентами практикуем это: чтобы правильно слышать, учимся записывать незнакомые слова.
И у меня дипломатичная позиция лингвиста: абстрактно сложных языков вообще не бывает. У каждого языка есть и особенности, которые облегчают изучение, и особенности, которые в чем-то сложны. И все сводится к субъективности – какой человек изучает язык? Носитель фарси легко поймет арабское письмо, он пишет аналогично, только другим почерком, а носители русского должны освоить арабскую вязь. Но и тут все относительно: при нагрузке в восемь пар в неделю наши студенты осваивают арабскую письменность за месяц-полтора интенсивной работы. В китайском, например, пока не накоплена определенная база иероглифов, ничего не запишешь.
На начальных этапах сложна фонетика из-за ее непривычности для большинства изучающих и задействования всего речевого аппарата. И грамматика литературного арабского языка, касающаяся глагольного спряжения.
Существует литературный и разговорный арабский, и разговорный везде различается
– Литературный и разговорный арабский – не одно и то же. Расскажете?
– Это вторая сложность арабского, что литературный арабский – не тот же самый язык, на котором говорят на улицах в арабских странах, и даже не язык бытового общения. В отличие от литературного арабского языка, диалекты как живые разговорные языки свободно развивались. Со временем расхождения только углублялись, что привело к двуязычию или диглоссии.
– Что такое диглоссия?
– Понятие из социолингвистики для характеристики ситуаций, когда два языка сосуществуют в разных сферах, при этом один отвечает статусу низкого языка, а второй – высокого. Не стоит путать с билингвизмом – при диглоссии в сознании говорящих один из языков имеет возвышенный статус.
– И как это устроено в арабских странах?
– Высокий статус литературного арабского языка обусловлен статусом сакрального языка Корана. Литературный язык обслуживает официальную сферу общения – это язык СМИ, переговоров, выступлений политиков. Разговорный язык обслуживает повседневную сферу, используется в быту, это язык улиц. При этом разговорный язык варьируется по стилю: более низкий с торговцами на рынке или таксистами, более высокий с преподавателями в университете. Разговорный язык – материнский язык, который ребенок усваивает в семье, и только в школе учит литературный.
Долгое время литературные произведения публиковались только на литературном языке, и лишь в начале XX века начали появляться драматические произведения на диалектах, где с их помощью авторы добавляли реалистичности в изображении народной среды.
– Диалектов разговорного арабского очень много. Какие есть?
– Делятся регионально в соответствии с делением всего арабского мира: аравийские, диалекты Персидского залива, сиро-палестинские (Сирия, Ливан, Палестина, к ним близок иорданский диалект), египетский диалект, диалекты Магриба.
Египетский диалект – связующее звено между двумя частями арабского мира, между Машриком (восточнее Египта) и Магрибом (западнее). В марокканском диалекте, входящем в группу диалектов Магриба, силен берберский субстрат, то есть местный берберский говор (берберы – коренной народ Северной Африки, принявший ислам в VII веке – Sports.ru), и есть французское влияние колониальной эпохи, многим марокканцам естественнее говорить на французском.
– Как эти диалекты различаются?
В иракском диалекте есть звук «ч», которого больше нигде нет – очевидна близость с регионами за пределами арабского мира. В египетском диалекте графема «джим» (читается «дж») произносится как «г», и это даже считается вариантом литературной нормы, дикторы по телевидению могут произносить «г» вместо «дж». Опять же – влияние французского на диалекты Магриба – и в фонетике, и в лексике. Некоторые французские слова могут быть изменены по принципу строя арабского слова, но исконный корень остается французским. И есть отдельные пласты лексики, характерные только для конкретного диалекта.
Наиболее близкий к литературному арабскому диалект – палестинский. Египетский диалект тоже комфортен после освоения литературного языка. И надо сказать, что арабы из Северной Африки, взаимодействуя с представителями другой части арабского мира, говорят на усредненном диалекте, очень близком к египетскому. Много исторических причин. А еще, например, это связано с тем, что с середины XX века египетский диалект усилил позиции благодаря египетскому кинематографу, через сериалы и фильмы к нему привыкли арабы из других стран.
На испанском говорят в шести странах ЧМ, но иногда не понимают друг друга. В чем хитрость языка?
Фото: unsplash.com/Syed Hussaini, waad salman3, Ayesha Firdaus, Jude Al-Safadi; en.wikipedia.org; pexels.com/Abene Sebei
Арабский алфавит
- Происхождение арабского алфавита
- Обозначение согласных
- Арабские цифры
- Обозначение гласных звуков
- Огласовки букв
- Буквы арабского алфавита и их произношение
- Дополнительные знаки в арабском языке
- Дополнительные символы в письме
- Лигатуры в арабском алфавите
- Арабская каллиграфия
- Арабское письмо в других мировых языках
Арабский алфавит или арабица, арабское письмо – так называют алфавит, который используют для записи арабского языка, а также это письмо используется некоторыми другими языками – такими, как персидский, урду, пушту и другие. В арабском языке всего двадцать восемь букв, также некоторые ученые-лингвисты считают, что в арабском языке 29 букв, включительно букву хамза, которая является как составной частью буквы алиф, так и играет роль отдельной буквы. Арабское письмо организовано справа налево.
Для арабского алфавита характерен следующий ход написания: сначала пишут те основные части букв, для написания которых не требуется отрывать от бумаги перо, затем к написанным буквам добавляют те части, для написания которых требуется оторвать перо, к таким элементам относятся отвесная черта букв ط, ظ, а также наклонная черта для буквы ك. Также к таким элементам относятся точки, которые используются в написании многих букв, и вспомогательные значки, огласовки или харакаты, которые расставляются по мере необходимости.
Происхождение арабского алфавита
Арабский алфавит уходит своими корнями в набатейское письмо, которое получило свое развитие из письма арамейского, а арамейское письмо уходит своими основами в финикийскую письменность. В арабский алфавит не только включены все буквы арамейского письма, но и добавлены такие буквы, которые отражают звуки, специфические для арабского языка – «гайн», «дад», «за», «ха», «заль» и «са».
Обозначение согласных
В арабском алфавите 28 букв, каждая из которых обозначает один звук согласный, кроме буквы, которая называется «алиф».
Написание букв может меняться – при изучении правил написания надо учитывать, что это зависит от того, как расположены буквы внутри слова, и позиция буквы в начале слова, в конце и середине рассматривается с позиции того, что слова в арабской письменности пишутся справа налево.
В арабской письменности внутри слова все буквы пишутся слитно, но это не касается букв, которые со следующей буквы не соединяются на письме. Таких букв шесть: «алиф», «ра», «даль», «зайн», «заль» и «вав».
Буква «алиф» — это буква, которая не обозначает согласного звука. Она может обозначать как долгий гласный звук «а̄», так и орфографический знак вспомогательного характера, который своего звукового выражения не имеет – выбор правильного написания будет зависеть от контекста.
Так исторически сложилось, что в арабском алфавите буквы изначально располагались в таком же порядке, в каком располагались буквы в финикийском алфавите, который стал основой для этого языка. Те же буквы, которых в финикийском алфавите не было, в арабском были поставлены в самый конец. Такой порядок получил название «абджад» — это название произошло от наименований первых четырех букв: алиф-ба-джим-даль.
Возможно вам будет интересно узнать о курсах арабского языка для начинающих и тех, кто уже владеет азами грамматики.
Арабские цифры
До того, как произошел переход к арабским или «индийским» цифрам, числа обозначались при помощи букв, и числовое значение каждой цифры соответствовало той позиции, которую эта буква занимала в порядке абджада.
Когда же произошел переход к цифрам индийским, которые стали впоследствии называть арабскими, порядок алфавита изменили на тот, который используется в современности. И только слово «абджадия», которое в переводе на русский язык означает «алфавит», напоминает о том порядке, который существовал ранее.
Обозначение гласных звуков
В арабском языке есть три долгих гласных звука. Это звуки «а̄», «ӣ» и «ӯ», которые обозначаются на письме буквами:
«а̄» — алиф,
«ӣ» — йа,
«ӯ» — уау
Огласовки букв
Огласовками или харакятами называют систему подстрочных и надстрочных диакритических знаков, которые используются для того, чтобы обозначить краткие гласные звуки в арабской письменности, а также обозначить некоторые иные особенности произношения слова, которые нельзя обозначить буквами. Огласовки в текстах в каждодневной практике не проставляются, но если возникает необходимость передать звучание слова точно, как это делают в словарях или в Священной Книге Аллаха Коране, то используются огласовки:
ـــَــ фатха – когда над буквой ставится наклонная черта, если после этой буквы идет звук «а»;
ـــِــ кясра – когда под буквой ставится наклонна черточка, если после этой буквы идет звук «и»;
ـــُــ дамма – когда ставится надстрочный знак, напоминающий маленькую запятую, чтобы обозначить звук «у»;
ـــْــ сукун – когда ставится маленький кружок над буквой, чтобы обозначить, что после этой буквы не следует гласный звук.
Тот факт, что в арабском языке нет средств для передачи гласных, и это для арабской письменности было явлением естественным, поскольку гласные звуки в основу слова в большинстве семитских языков не входят, а при словоизменении и словообразовании чередуются, в двадцатом веке некоторые мусульманские страны Средней Азии, Малайзия, Турция и Индонезия отказались от использования арабского алфавита: его вытеснили другие алфавиты, в которых была возможность последовательно обозначать гласные на письме – такие алфавиты, как латиница или кириллица, которая используется в русском языке. Классический арабский язык не располагает средствами для обозначения звуков «п» и «г».
Буквы арабского алфавита с произношением
Арабский алфавит для начинающих изучать его может показаться сложным, поэтому правильным будет начать обучение арабскому языку с самых основ – букв. Ниже представлена таблица с арабскими буквами, с названием буквы арабского алфавита на русской языке и транскрипцией звука, также вы можете прослушать и скачать в аудио mp3 формате правильное произношение букв арабского алфавита:
Написание буквы на арабском языке | Название буквы на арабском языке | Транскрипция звука | Правильное произношение буквы на арабском языке |
ا | алиф | [ạ] | |
ب | ба | [b] | |
ت | та | [t] | |
ث | cа | [tẖ] | |
ج | джим | [j] | |
ح | ха | [ḥ] | |
خ | ха | [kẖ] | |
د | даль | [d] | |
ذ | заль | [dẖ] | |
ر | ра | [r] | |
ز | зайн | [z] | |
س | син | [s] | |
ش | шин | [sẖ] | |
ص | сад | [ṣ] | |
ض | дад | [ḍ] | |
ط | та | [ṭ] | |
ظ | за | [ẓ] | |
ع | ʿайн | [ʿ] | |
غ | гайн | [gẖ] | |
ف | фа | [f] | |
ق | каф | [q] | |
ك | кяф | [k] | |
ل | лям | [l] | |
م | мим | [m] | |
ن | нун | [n] | |
ه | ха | [h] | |
و | вав | [w] | |
ي | йа | [y] |
Для начинающих очень важно изучить и правильно произносить арабские буквы, особенно при заучивании и чтении Священного Корана, так как неправильное произношение буквы в слове может поменять смысл аятов Корана.
Особенностью арабской письменности является то, что арабские буквы при написании в начале, середине или конце слова могут поменять свою форму, оставив только основу буквы, поэтому при заучивании арабского алфавита необходимо учить букву в четырех вариациях написания: отдельно, в начале, в середине и в конце слова. Ниже на фотографии арабского алфавита приведены написания букв при расположении в разных частях слова.
Дополнительные знаки в арабском языке
Двадцать восемь букв арабского алфавита по-арабски называются «хуруф». Помимо этих двадцати восьми знаков в арабской письменности также используются три дополнительных знака, которые самостоятельными буквами не являются.
Это такие знаки, как:
1) Диактрический знак хамза — ء используется на письме для передачи согласного звука — гортанной смычки. Читается так:
Хамза на письме может обозначаться как отдельный символ, но чаще пишется на букве-подставке, к которым относятся «вав» (و), «алиф» (ا) и «йа» (ى), в сочетании с хамзой буква йа в качестве подставки пишется без диакритических точек снизу. Написание хамзы зависит от контекста и соответствует определенным правилам правописания, но хамза всегда, каким бы ни было ее написание, обозначает один и тот же звук.
2) та-марабута, что в переводе на русский язык означает «завязанная та» — это такая форма буквы «та» которая ставится только в конце слова после фатха-огласовки. Если же огласовки у этого знака нет (это может быть в конце фразы), то читается этот знак как буква «ха». В своей обычной форме буква «та» носит название «та-мафтуха», что в переводе с арабского означает «открытая та».
3) алиф-максура, что можно перевести на русский язык как «укороченный алиф» — это такая форма буквы «алиф», которую пишут только в конце слов, она сокращается до краткого «а» в положении перед приставкой «аль-» в следующем слове. «Алиф» в своей обычной форме носит название «алиф мамдуда», что означает в переводе на русский «удлиненный алиф».
Существует масса местных вариантов арабского языка, и в большинстве из них используются свои собственные дополнительные знаки помимо основных.
Дополнительные символы в письме
В Священном Коране и в арабской письменности можно также встретить дополнительные символы, уточняющие звучание буквы.
ــــّـــ К разряду дополнительных знаков, которые помогают уточнить произношение текста на письме, относится шадда, которую также называют «ташдид». Это знак в виде буквы W, который ставят над арабской буквой для того, чтобы обозначить ее удвоение. Есть два случая, в которых используется этот знак:
- для того, чтобы обозначить удвоенный согласный;
- для того, чтобы обозначить сочетание согласной и долгой гласной, которые обозначаются одной и той же буквой.
~ еще один знак, который называется мадда. Это волнистая линия, которую ставят над буквой алиф, обозначающая комбинации хамза-хамза или хамза-алиф. По арабскому правописанию и орфографии в одном слове не могут писаться рядом две буквы алиф, и если такая комбинация все-таки возникает, то используется сочетание алиф-мадда. Она используется для удлинения гласного звука.
Также используются такие знаки, как:
- васла — знак похожий на букву сад (ٱ), который ставят в начале слова над буквой алиф – он показывает, что буква алиф в этом случае не произносится, поскольку предыдущее слово оканчивается на гласный;
- танвин, который указывает на падежное окончание со значением неопределенного состояния и представляет собой удвоение одной из трех огласовок в конце слова, бывает трех видов и читается как «ан» (танвин фатха ـً с двумя фатхами над буквой, к примеру: مَدْرَسَةً — мадрасатан), «ин» (танвин кясра ـٍ с двумя кясрами под буквой, к примеру: مَدْرَسَةٍ — мадрасатин) или «ун» (танвин дамма ـٌ с двумя даммами над буквой, может иметь написание в двух вариациях, к примеру: بَيْتٌ — байтун);
- надстрочный алиф, который ставится над текстом и имеет форму буквы алиф – он указывает на долгий звук «а» в таких словах, в которых обычно традиционно не пишется алиф. Обычно это встречается в собственных именах или в указательных местоимениях. В текстах Корана можно встретить надстрочный алиф и в тех местах, где может быть употреблён обычный алиф.
Возможно вам будет интересно прочитать о рекомендациях по изучению арабского языка.
Лигатуры в арабском алфавите
Арабский язык имеет ряд способов для того, чтобы писать слитно несколько букв – такие способы называются лигатурами.
Стандартной является лигатура «лям-алиф» — لا. Написание этих двух букв вместе другими способами, кроме как с помощью этой лигатуры, в арабском языке недопустимо. Это правило действует даже тогда, когда алифу сопутствует хамза или мадда: (لأ لإ لآ). В середине и в конце слова лигатура выглядит так: ﻶ (здесь с маддой). Читать данную лигатуру на русском языке следует как звук «Ля». Лигатура «лям-алиф» часто употребляется в арабском письме и используется даже на шахаде.
Помимо этой лигатуры «лям-алиф», все остальные лигатуры в арабском языке обязательными не являются, и использовать их или нет – воля того, кто выбирает для написания определенный каллиграфический стиль.
Арабская каллиграфия
Искусство каллиграфии неотделимо от арабского алфавита и письма, занимая в арабской культуре важное место. Связано это с тем, что существует религиозный запрет на то, чтобы изображать живых существ, и каллиграфии было суждено занять место одного из видов сакрального искусства мусульман. Каллиграфия арабского языка подразделяется на несколько стилей каллиграфического письма.
Древнейшим стилем каллиграфического письма из ныне существующих является стиль куфи или куфический стиль, который обязан своим названием городу Куфа.
Еще одним распространенным стилем в каллиграфическом письме является стиль насх, название которого в переводе с арабского языка на русский означает «копирование».
Ряд каллиграфических стилей применялись только в целях декоративных для так называемых «каллиграмм». Каллиграммами называли художественные произведения, созданные каллиграфами. К таким каллиграфическим шрифтам относится сулюс, название которого в переводе с арабского на русский означает «треть»: для этого стиля характерны широкие свободные росчерки.
Арабское письмо в других мировых языках
Арабский алфавит уже давно распространился на другие мировые языки по мере того, как по миру распространялась религия ислама. По мере того, как ислам распространялся на свете, арабский язык и алфавит стали воспринимать как неотъемлемую часть ислама, и не только арабы, но и многие исламские страны стали использовать арабский алфавит на письме. В число таких стран вошли и те, что раньше использовали другие письменные системы.
Если же в определённых регионах мира государство принимало новый язык, мусульманское население стремилось к сохранению арабского алфавита.
В современном мире арабская графика используется во многих странах мира при издании религиозной исламской литературы – в Малайзии и Индонезии.
В современном мире существует ряд языков, которые используют арабский алфавит и их письмо строится на его основе. К таким языкам относятся фула, пенджаби, урду, дари, синдхи, пушту, хауса, кашмири, курдские и уйгурские языки в некоторых странах. Арабский алфавит используют для записи азербайджанский, казахский, киргизский, туркменский, узбекский и татарский языки.
Арабский алфавит
Арабский алфавит состоит из 28 букв, которые имеют разную форму в зависимости от того, стоят ли они в начале, в середине или в конце слова, или написаны отдельно. Арабский алфавит вы сможете понять только после того, как изучите каждую его букву и звук по отдельности в течение 20 уроков (ради любопытства можно на него посмотреть). В данном уроке вы изучите 4 буквы и 6 звуков. Приступим.
Арабское письмо
Буквы ا и د, звук [д]
Арабы пишут справа налево, и арабская книга начинается там, где русская кончается. Поэтому тетрадь надо начать с «последней» страницы.
Арабские буквы различны по высоте и по расположению относительно линии строки. Мы будем соразмерять их с первой буквой арабского алфавита – алифом*, которая представляет собой вертикальную черту. Для начальных упражнений целесообразно принять высоту алифа в 8—9 мм, то есть несколько больше, чем в обычных арабских почерках.
* Буква алиф сама по себе никакого звука не обозначает. Ее назначение в арабском письме будет разъяснено в следующем уроке.
Упражнение 1. Перепишите справа налево, соблюдая размеры буквы алиф:
ا ا ا ا ا ا ا ا ا ا
Буква د (даль), обозначающая согласный звук [д], близкий по звучанию к соответствующему русскому, по высоте превышает половину алифа, пишется сверху вниз. Ее нижнее закругление лежит на линии строки.
Упражнение 2. Перепишите справа налево, чередуя даль с алифом:
ا د ا د ا د ا د ا د
Твердые, мягкие и средние согласные
Важной особенностью русского произношения является наличие так называемых твердых и мягких согласных. Если сравнить, например, произношение слогов ДА и ДЯ [дьа], мы заметим, что кончик языка в обоих случаях занимает одно и то же положение — у верхних зубов. Окраска же согласного (в первом случае — твердая, а во втором — мягкая) зависит от положения остальных частей языка: если средняя часть языка приподнята и приближена к твердому нёбу (средняя часть нёба), то получается мягкий согласный; если же приподнята задняя часть языка к мягкому нёбу (задняя часть нёба), то получается твердый согласный. Это различие в положении языка можно проследить, прочувствовать, если протяжно (слитно) произносить некоторые русские согласные, попеременно меняя их окраску:
[в – вь – в – вь – в – вь – в – вь]
[з – зь – з – зь – з – зь – з – зь]
[л – ль – л – ль – л – ль – л – ль]
[н – нь – н – нь – н – нь – н – нь]
[с – сь – с – сь – с – сь – с – сь]
При этом можно заметить, что твердые согласные имеют ы-образный оттенок, а мягкие – и-образный, поскольку средняя и задняя части языка в этих случаях занимают примерно те же положения, что и при произношении, соответственно [ы] и [и].
Арабский согласный د занимает промежуточное положение между русским твердым [д] и русским мягким [дь].
Такие согласные мы будем называть средними. Продолжая наше сравнение с гласными, мы можем сказать, что средние согласные имеют э-образный оттенок.
Краткие гласные и огласовки
Гласных букв в арабском алфавите нет. Для обозначения кратких гласных звуков служат значки, которые пишутся над или под теми согласными буквами, после которых идут эти гласные звуки. Эти значки называют огласовками.
Краткий гласный [а] обозначается маленькой наклонной черточкой над буквой. Например, слог [да] изображается так: دَ
Чтобы правильно произнести арабское [а], установите рот так, как если бы вы собирались сказать [э] в слове эти, и, не меняя положения языка, постарайтесь произнести [а].
Произношение арабского слога دَ можно уточнить путем сравнения с русскими слогами [да] и [дя]:
Твердое [д] + заднее русское [а] | [да] |
Среднее арабское [д] + краткое э-образное арабское [а] | دَ |
Мягкое [дь] + переднее русское [а] | [дя] |
Из этого сравнения мы видим, что арабский слог دَ как по оттенку согласного, так и гласного занимает среднее, промежуточное положение между русскими слогами [да] и [дя].
Упражнение 3. Прочтите справа налево, правильно произнося краткий слог دَ и перепишите.
دَ دَ دَ دَ دَ دَ دَ دَ دَ دَ
Краткий гласный [и] обозначается на письме такой же черточкой под буквой, например, دِ [ди].
Арабский краткий гласный [и] занимает среднее, промежуточное положение между русскими [ы] и [и]. Согласный [д] перед ним не смягчается, сравним произношение арабского دِ с русскими [ды] и [ди].
Твердое [д] + заднее русское [ы] | [ды] |
Среднее арабское [д] + среднее [и] | دِ |
Мягкое [дь] + переднее русское [и] | [ди] |
Упражнение 4. Прочтите справа налево, правильно произнося краткий слог دِ, обращая особое внимание на отсутствие смягчения د. Перепишите слоги.
دِ دِ دِ دِ دِ دِ دِ دِ دِ دِ
Упражнение 5. Прочтите справа налево, правильно произнося краткие слоги دَ и دِ, перепишите их.
دَ دِ دَ دِ دَ دِ دَ دَ دِ دَ دِ دِ دَ دِ
Краткий гласный [у] на письме обозначается надбуквенным значком, наподобие запятой с несколько увеличенной головкой, например, دُ [ду]. По своему звучанию он близок к русскому [у].
Упражнение 6. Прочтите справа налево, обращая внимание на «среднее» произношение د и на краткость гласного [у]. Перепишите слоги.
دُ دُ دُ دُ دُ دُ دُ دُ دُ دُ
Упражнение 7. Прочтите справа налево, правильно произнося согласный د и гласные [а], [и], [у], и перепишите их.
دَ دِ دُ دِ دُ دَ دُ دَ دِ دُ دِ دَ دَ دُ دِ دِ دَ دُ
Если после согласного звука нет никакого гласного, то над этой буквой пишется специальный значок отсутствия гласного в виде маленького кружка, так называемый сукун, например:
Арабские звонкие согласные в конце слога, в отличие от русских, сохраняют звонкость (не оглушаются). За этим необходимо всегда тщательно следить, не допуская произношения [дут] вместо [дуд] и т. п.
Буква ر и звук [р]
Буква ر (ра) представляет собой дужку, которая пишется справа-вниз-налево и пересекает линию строки. Верхняя ее часть слегка наклонена влево и возвышается над линией строки приблизительно на 2 мм; нижняя, подстрочная часть довольно круто поворачивает влево, опускаясь на 2-3 мм ниже линии строки. Вот буква ра рядом с алифом и далем:
ادر
Упражнение 8. Перепишите справа налево.
ادر ادر ادر ادر ادر ادر ر ر ر ر ر ر ر ر ر ر
Буква ра обозначает твердый согласный [р], похожий на соответствующий русский, но произносимый несколько энергичнее. Этот звук в арабском языке никогда не смягчается, даже перед [и]. Гласный [а] после [р] приобретает «задний» оттенок, как в русском слове клал.
Упражнение 9. Прочтите справа налево, энергично произнося ر, не смягчая его перед [и] и правильно произнося [а]. Перепишите.
Аудио для رَرُرِ:
Упражнение 10. Прочтите справа налево, правильно произнося гласный [а] после د и после ر.
دَرَ دِرُ رَدْ رِدْ دَرْ رُدْ
Упражнение 11. Прочтите, соблюдая правила произношения (ударение везде на первом слоге). Перепишите, располагая огласовки приблизитесьно на одной горизонтали, не очень близко к буквам.
دِرُدَ
دَرِرْ
دَرِدُ
رُدْ
رُدِرَ
دَرُرْ
دُرِدَ
دُرْ
Транскрипция
Транскрипцией называется условная запись звуков языка с той или иной степенью точности. Мы будем пользоваться транскрипцией на основе русского алфавита с несколькими добавочными значками. Эта транскрипция не передает некоторых оттенков арабских звуков, однако вполне пригодна для изучения звуко-буквенного состава арабского слова и как вспомогательное средство для освоения системы арабского письма.
Транскрипция передает как согласные, так и гласные звуки. Так, звукосочетание دَرُرْ транскрибируется как [дарур].
Упражнение 12. Запишите в транскрипции (протранскрибируйте) звукосочетания упражнения 11.
Упражнение 13. Запишите (в тетради) арабскими буквами следующие звукосочетания:
[рид, дарара, руд, дур, дирур]
Буква ز и звук [з]
Буква ز (зайн) пишется точно так же, как ра, но в отличие от нее имеет сверху различительную точку.
Буква зайн обозначает средний согласный звук [з], близкий к соответствующему русскому, но не смягчающийся перед [и], и не «твердеющий» перед [а] и [у].
Гласный [а] после ز произносится так же, как и после د, т. е. э-образно.
Упражнение 14. Прочтите, не смягчая ز перед [и] и правильно произнося [а]. Перепишите, ставя различительные точки и огласовки не очень близко к буквам.
زَزَزَ زُزُزُ زِزِزِ زَزِزُ زِزُزَ زَزْ زِزْ زُزْ
Аудио для زَزُزِزْ:
Упражнение 15. Прочтите, соблюдая правила произношения (ударение везде на первом слоге). Перепишите столбиком, рядом запишите данные звукосочетания в транскрипции.
رَزَدَ
دِزُرَ
زَرْدُ
دَرِزْ
دَرْدَ
زَرْدَ
دِزَرُ
زُرِدَ
زُرْدِ
رَدِزُ
دَرَرْ
رِزِدُ
Упражнение 16. Перепишите столбиком следующие звукосочетания в транскрипции и рядом напишите их арабскими буквами с огласовками.
[дар, дур, рад, зид, зур, раз, зар, дарар, дируза, зурида, дазиру, ризада, дарза, разда, дарда]
Присоединяйтесь к телеграм-каналу @lingust и: