Как пишется знак пробел

Пробел — это расстояние между буквами, разделяющее слова.

Первые письменности были пиктографическими и идеографическими. Каждый символ обозначал слово, и разделять их не требовалось. С переходом на алфавитные системы, читать слитный текст стало очень неудобно. Тогда и появились значки разделяющие слова. Стандартный ныне символ пробела придумали далеко не сразу. В латинских и греческих текстах он применяется около тысячи лет, хотя встречался и ранее. В кириллических — прижился только в XVII веке, а в арабице в XX веке.

Кроме особого символа, указать разделение слов можно и другими способами. Например, с помощью специальных форм букв для конца или начала слова. В арабском алфавите, ряд букв существует в четырёх вариантах начертания (для начала, конца, середины, отдельно стоящей). Хотя, арабы применяют пробел, буквы по-прежнему имеют разный вид. Ещё одна альтернатива — линия над буквами. Сами слова идут без пробелов, а линия прерывается. В некоторых письменностях, разделяться могут не слова, а предложения, словосочетания или слоги. Настоящий пробел употребляется почти во всех современных системах письма. Тайцы разделяют пробелом только предложения.

В Юникоде несколько видов пробела. Есть, например, неразрывный пробел. Также, несколько символов пробела лежат в разделе

знаки пунктуации2000–206F

.

Другие символы для разделения слов:

· Интерпункт. Латинский. Применялся до 600-800 годов.

𐎟 Угаритский клинописный.

𐏐 Персидский клинописный.

𒑰 Ассирийский клинописный.

Эфиопский.

Огамический.

𐤟 Финикийский.

Самаритянский.

Символ «Пробел» был утвержден как часть Юникода версии 1.1 в 1993 г.

From Wikipedia, the free encyclopedia

 

Space

U+0020   SPACE (Note: Representations here of a regular space are replaced with a no-break space)
See also
U+00A0   NO-BREAK SPACE ( ,  )
Other types of spaces

In writing, a space ( ) is a blank area that separates words, sentences, syllables (in syllabification) and other written or printed glyphs (characters). Conventions for spacing vary among languages, and in some languages the spacing rules are complex.[citation needed] Inter-word spaces ease the reader’s task of identifying words, and avoid outright ambiguities such as «now here» vs. «nowhere». They also provide convenient guides for where a human or program may start new lines.

Typesetting can use spaces of varying widths, just as it can use graphic characters of varying widths. Unlike graphic characters, typeset spaces are commonly stretched in order to align text. The typewriter, on the other hand, typically has only one width for all characters, including spaces. Following widespread acceptance of the typewriter, some typewriter conventions influenced typography and the design of printed works.[citation needed]

Computer representation of text facilitates getting around mechanical and physical limitations such as character widths in at least two ways:

  • Character encodings such as Unicode provide spaces of several widths, which are encoded using distinct numeric code points. For example, Unicode U+20 is the «normal» space character, but U+A0 adds the meaning that a new line should not be started there, while U+2003 represents a space with a fixed width of one em. Collectively, such characters are called Whitespace characters.
  • Formatting and drawing languages and software commonly provide much more flexibility in spacing. For example, SVG, PostScript, and countless other languages enable drawing characters at specific (x,y) coordinates on a screen or page. By drawing each word at a specific starting coordinate, such programs need not «draw» spaces at all (this can lead to difficulties in extracting the correct text back out). Similarly, word processors can «fully justify» text, stretching inter-word spaces to make all lines the same length (as can mechanical Linotype machines). Precision is limited by physical capabilities of output devices.

Use in natural languages[edit]

Between words[edit]

Modern English uses a space to separate words, but not all languages follow this practice. Spaces were not used to separate words in Latin until roughly 600–800 AD. Ancient Hebrew and Arabic did use spaces partly to compensate in clarity for the lack of vowels.[1] The earliest Greek script also used interpuncts to divide words rather than spacing, although this practice was soon displaced by the scriptura continua.

Word spacing was later used by Irish and Anglo-Saxon scribes, beginning after the creation of the Carolingian minuscule by Alcuin of York and the scribes’ adoption of it. The modern space originated here and then spread to the rest of the world. Indeed, the actions of these Irish and Anglo-Saxon scribes marked the dramatic shift for reading between antiquity and the modern period. Spacing would become standard in Renaissance Italy and France, and then Byzantium by the end of the 16th century; then entering into the Slavic languages in Cyrillic in the 17th century, and only in modern times entering modern Sanskrit.[2]

CJK languages do not use spaces when dealing with text containing mostly Chinese characters and kana. In Japanese, spaces may occasionally be used to separate people’s family names from given names, to denote omitted particles (especially the topic particle wa), and for certain literary or artistic effects. Modern Korean, however, has spaces as an essential part of its writing system (because of Western influence), given the phonetic nature of the hangul script that requires word dividers to avoid ambiguity, as opposed to Chinese characters which are mostly very distinguishable from each other. In Korean, spaces are used to separate chunks of nouns, nouns and particles, adjectives, and verbs; for certain compounds or phrases, spaces may be used or not, for example the phrase for «Republic of Korea» is usually spelled without spaces as 대한민국 rather than with a space as 대한 민국.

Runic texts use either an interpunct-like or a colon-like punctuation mark to separate words. There are two Unicode characters dedicated for this: U+16EB RUNIC SINGLE PUNCTUATION and U+16EC RUNIC MULTIPLE PUNCTUATION.

Between sentences[edit]

Languages with a Latin-derived alphabet have used various methods of sentence spacing since the advent of movable type in the 15th century.

  • One space (some times called French spacing, q.v.). This is a common convention in most countries that use the ISO basic Latin alphabet for published and final written work, as well as digital (World Wide Web) media.[3] Web browsers usually do not differentiate between single and multiple spaces in source code when displaying text, unless the text is given a «white-space» CSS attribute. Without this being set, collapsing strings of spaces to a single space allow HTML source code to be spaced in a more machine-readable way, at the expense of control over the spacing of the rendered page.[4]
  • Double space (English spacing). It is sometimes claimed that this convention stems from the use of the monospaced font on typewriters.[5] However, instructions to use more spacing between sentences than words date back centuries, and two spaces on a typewriter was the closest approximation to typesetters’ previous rules aimed at improving readability.[6] Wider spacing continued to be used by both typesetters and typists until the Second World War, after which typesetters gradually transitioned to word spacing between sentences in published print, while typists continued the practice of using two spaces.[7][8][9][10][11][12][13][14][15][16][17]
  • One widened space, typically one-and-a-third to slightly less than twice as wide as a word space. This spacing was sometimes used in typesetting before the 19th century. It has also been used in other non-typewriter typesetting systems such as the Linotype machine[18] and the TeX system.[19] Modern computer-based digital fonts can adjust the spacing after terminal punctuation as well, creating a space slightly wider than a standard word space.[20]

There has been some controversy regarding the proper amount of sentence spacing in typeset material. The Elements of Typographic Style states that only a single word space is required for sentence spacing.[21] Psychological studies suggest «readers benefit from having two spaces after periods.»[22]

Unit symbols and numbers[edit]

The International System of Units (SI) prescribes inserting a space between a number and a unit of measurement (the space being regarded as an implied multiplication sign) but never between a prefix and a base unit; a space (or a multiplication dot) should also be used between units in compound units.[23]

5.0 cm, not 5.0cm or 5.0 c m or 5.0 cms
45 kg, not 45kg or 45 k g or 45 kgs
32 °C, not 32°C or 32° C
20 kN m or 20 kN⋅m, not 20 kNm or 20 k Nm
π/2 rad, not π/2rad or π / 2 rad
50 %, not 50% or 50 percent (Note: % is not an SI unit, and many style guides do not follow this recommendation; note that 50% is used as adjective, e.g. to express concentration as in 50% acetic acid.)

The only exception to this rule is the traditional symbolic notation of angles: degree (e.g., 30°), minute of arc (e.g., 22′), and second of arc (e.g., 8″).

The SI also prescribes the use of a space[24] (often typographically a thin space) as a thousands separator where required. Both the point and the comma are reserved as decimal markers.

1 000 000 000 000 (thin space) or 1000000 not 1,000,000 or 1.000.000
1 000 000 000 000 (regular space which is significantly wider)

Sometimes a narrow non-breaking space or non-breaking space, respectively, is recommended (as in, for example, IEEE Standards[25] and IEC standards[26]) to avoid the separation of units and values or parts of compounds units, due to automatic line wrap and word wrap.

Encoding[edit]

Character information

Preview  
Unicode name SPACE
Encodings decimal hex
Unicode 32 U+0020
UTF-8 32 20
Numeric character reference

Note: The above representation of a regular space is replaced with a non-breaking space for visibility.

In URLs, spaces are percent encoded with its ASCII/UTF-8 representation %20.

Types of spaces[edit]

  • Figure space
  • Non-breaking space
  • Paren space
  • Thin space
  • Visible space
  • Whitespace character § Hair spaces around dashes
  • Zero-width space

See also[edit]

  • Em (typography)
  • En (typography)
  • Halfwidth and fullwidth forms
  • Internal field separator
  • Sentence spacing in digital media
  • Underscore
  • Whitespace character

References[edit]

  1. ^ Saenger 2000, p. 10: «the Semitic languages (Hebrew, Aramaic, Arabic, and Syriac), when written without vowels, were virtually always written with word separation in antiquity and continued to be so transcribed into modern times»
  2. ^ Saenger, Paul. Space Between Words: The Origins of Silent Reading. Stanford University Press, 1997, 9–14.
  3. ^
    Einsohn, Amy (2006). «Punctuation, Eyeballing every mark». The Copyeditor’s Handbook: A Guide for Book Publishing and Corporate Communications (2nd ed.). Berkeley, Los Angeles, London: University of California Press. p. 113. ISBN 9780520246881. Retrieved 2010-04-25. If you are working on documents that will be printed without any intervention from a compositor (e.g., documents produced on the office laser printer), you will have to carefully scrutinize every piece of punctuation to be sure that the document contains the correct character (see table 5). You should also delete any extra wordspacing before and after punctuation marks. The conventions are: One space follows sentence-ending punctuation mark (period, question mark, or exclamation point). One space follows comma, colon, or semicolon …
  4. ^ Thomas A. Fine. «How many spaces at the end of a sentence? One or two?».
  5. ^ Farhad Manjoo (2011-01-13). «Space Invaders: Why you should never, ever use two spaces after a period». Slate. Retrieved 2011-03-29.
  6. ^ Heraclitus (1 November 2011). «Why two spaces after a period isn’t wrong».
  7. ^
    Felici, James (2003). The Complete Manual of Typography: A Guide to Setting Perfect Type. Berkeley, CA: Peachpit Press. p. 80. ISBN 0321127307.;
  8. ^ David Spencer (24 May 2011). «The Curious Misconception Surrounding Sentence Spacing». Type Desk. Matador. Retrieved 27 May 2011.
  9. ^ Bringhurst, Robert (2004). The Elements of Typographic Style (3 ed.). Washington and Vancouver: Hartley & Marks. p. 28. ISBN 0881792063. 2.1.4 Use a single word space between sentences. In the nineteenth century, which was a dark and inflationary age in typography and type design, many compositors were encouraged to stuff extra space between sentences. Generations of twentieth century typists were then taught to do the same, by hitting the spacebar twice after every period [full stop]. Your typing as well as your typesetting will benefit from unlearning this quaint Victorian habit. As a general rule, no more than a single space is required after a period, colon, or any other mark of punctuation
  10. ^ Schriver, Karen (1997). Dynamics in Document Design: Creating Text for Readers (1 ed.). New York: Wiley. p. 502. ISBN 9780471306368. Use one space (not two) after these punctuation marks [sc. period, question mark, exclamation point, or colon], as the practice of using two spaces is just another holdover from using a typewriter.
  11. ^ Strauss, Jane (2007). «Spacing with Punctuation». The Blue Book of Grammar and Punctuation: An Easy-to-Use Guide with Clear Rules, Real-World Examples, and Reproducible Quizzes (10 ed.). Jossey-Bass. p. 176. ISBN 9780470222683. Retrieved 2010-04-25. Rule 1. With a computer, use only one space following periods, commas, semicolons, colons, exclamation points, question marks, and quotation marks. The space needed after these punctuation marks is proportioned automatically. With some typewriters and word processors, follow ending punctuation with two spaces when using a fixed-pitch font.
  12. ^ «2.49 Leading and spacing». The GPO Style Manual (30 ed.). Washington: The U.S. Government Printing Office. 2008. p. 469. ISBN 9780160818127. Archived from the original (PDF) on 2008-08-31. Retrieved 2010-04-25. A single justified word space will be used between sentences. This applies to all types of composition.
  13. ^ «FAQ: How many spaces should I leave after a period or other concluding mark of punctuation?». MLA Handbook for Writers of Research Papers (7 ed.). Modern Language Association. 2009. p. 292. ISBN 978-0-87352-297-7. Retrieved 2010-04-25. Publications in the United States today usually have the same spacing after a punctuation mark as between words on the same line. Since word processors make available the same fonts used by typesetters for printed works, many writers, influenced by the look of typeset publications, now leave only one space after a concluding punctuation mark. In addition, most publishers’ guidelines for preparing electronic manuscripts ask authors to type only the spaces that are to appear in print.
  14. ^ «FAQ: How many spaces should I leave after a period or other concluding mark of punctuation?». The Chicago Manual of Style (7 ed.). University of Chicago Press. 2009. p. 292. ISBN 9780873522977. Retrieved 2010-04-25. Publications in the United States today usually have the same spacing after a punctuation mark as between words on the same line. Since word processors make available the same fonts used by typesetters for printed works, many writers, influenced by the look of typeset publications, now leave only one space after a concluding punctuation mark. In addition, most publishers’ guidelines for preparing electronic manuscripts ask authors to type only the spaces that are to appear in print.
  15. ^ «The Chicago Manual of Style Online (Q&A: One Space or Two?)». University of Chicago Press. 2003. Retrieved 2010-04-25. The view at CMOS is that there is no reason for two spaces after a period in published work. Some people, however—my colleagues included—prefer it, relegating this preference to their personal correspondence and notes. I’ve noticed in old American books printed in the few decades before and after the turn of the twentieth century (ca. 1870–1930 at least) that there seemed to be a trend in publishing to use extra space (sometimes quite a bit of it) after periods. And many people were taught to use that extra space in typing class (I was). But introducing two spaces after the period causes problems: (1) it is inefficient, requiring an extra keystroke for every sentence; (2) even if a program is set to automatically put an extra space after a period, such automation is never foolproof; (3) there is no proof that an extra space actually improves readability—as your comment suggests, it’s probably just a matter of familiarity (Who knows? perhaps it’s actually more efficient to read with less regard for sentences as individual units of thought—many centuries ago, for example in ancient Greece, there were no spaces even between words, and no punctuation); (4) two spaces are harder to control for than one in electronic documents (I find that the earmark of a document that imposes a two-space rule is a smattering of instances of both three spaces and one space after a period, and two spaces in the middle of sentences); and (5) two spaces can cause problems with line breaks in certain programs. So, in our efficient, modern world, I think there is no room for two spaces after a period. In the opinion of this particular copyeditor, this is a good thing.
  16. ^ «Chapter 5. Manuscript Preparation and Sample Papers to be Submitted for Publication». Publication Manual of the American Psychological Association (aka APA Style) (5 ed.). Washington: American Psychological Association. 2001. pp. 439. ISBN 9781557987907. Retrieved 2010-04-25. 5.11 Spacing and Punctuation: Space once after all punctuation as follows: after commas, colons, and semicolons; after punctuation marks at the end of sentences; after periods that separate parts of a reference citation; and after the periods of the initials in personal names (e.g., J. R. Zhang). Exception: Do not use space after internal periods in abbreviations (e.g., a.m, i.e., U.S.)
  17. ^ Style Manual: for Authors, Editors and Printers (aka AGPS Style) (6 ed.). Stafford, Australia: Wiley Australia, The Commonwealth Government of Australia Printing Office. 2002. p. 117. ISBN 978-0-7016-3647-0. Retrieved 2010-04-25. In typewritten (as distinct from typeset) material, it was customary to place two spaces after a colon, semicolon, full stop or other sentence closing punctuation. Programs for word processing and desktop publishing offer more sophisticated, variable spacing, so this practice of double spacing is now avoided because it can create distracting gaps on a page.
  18. ^ Mergenthaler Linotype Company (1940). Linotype Keyboard Operation: Methods of Study and Procedures for Setting Various Kinds of Composition on the Linotype. Mergenthaler Linotype Company. cited in Mark Simonson (5 March 2004). «Double-spacing after Periods». Typophile. Typophile. Retrieved 5 April 2010.
  19. ^ Eijkhout, Victor (2008), TeX by Topic, A TeXnician’s Reference (PDF), Lulu, pp. 185–188
  20. ^ Felici, James (2003). The Complete Manual of Typography: A Guide to Setting Perfect Type. Berkeley, CA: Peachpit Press. p. 80. ISBN 0-321-12730-7.; Fogarty, Mignon (2008). Grammar Girl’s Quick and Dirty Tips for Better Writing (Quick and Dirty Tips). New York: Holt Paperbacks. p. 85. ISBN 978-0-8050-8831-1.; Straus, Jane (2009). The Blue Book of Grammar and Punctuation: An Easy-to-Use Guide with Clear Rules, Real-World Examples, and Reproducible Quizzes (10th ed.). San Francisco, CA: Jossey-Bass. p. 52. ISBN 978-0-470-22268-3.
  21. ^ Bringhurst, Robert (2004). The Elements of Typographic Style (3.0 ed.). Washington and Vancouver: Hartley & Marks. pp. 28, 30. ISBN 0-88179-206-3.
  22. ^ Hamblin, James (11 May 2018). «The Scientific Case for Two Spaces After a Period». The Atlantic. Retrieved 14 May 2018.
  23. ^ International Bureau of Weights and Measures (2019). The International System of Units (SI) (9th ed.). p. 149..
  24. ^ The International System of Units (PDF) (9th ed.). International Bureau of Weights and Measures. 2019. p. 150. ISBN 978-92-822-2272-0.
  25. ^ https://standards.ieee.org/content/dam/ieee-standards/standards/web/governance/revcom/scc14.pdf[bare URL PDF]
  26. ^ «Writing and formatting | IEC». International Electrotechnical Commission. 2022-07-18. Archived from the original on 2022-07-18. Retrieved 2022-07-18.

Further reading[edit]

  • Saenger, Paul (1997). Space Between Words: The Origin of Silent Reading. Stanford, Calif: Stanford University Press. ISBN 9780804726535. OCLC 35548786.

From Wikipedia, the free encyclopedia

 

Space

U+0020   SPACE (Note: Representations here of a regular space are replaced with a no-break space)
See also
U+00A0   NO-BREAK SPACE ( ,  )
Other types of spaces

In writing, a space ( ) is a blank area that separates words, sentences, syllables (in syllabification) and other written or printed glyphs (characters). Conventions for spacing vary among languages, and in some languages the spacing rules are complex.[citation needed] Inter-word spaces ease the reader’s task of identifying words, and avoid outright ambiguities such as «now here» vs. «nowhere». They also provide convenient guides for where a human or program may start new lines.

Typesetting can use spaces of varying widths, just as it can use graphic characters of varying widths. Unlike graphic characters, typeset spaces are commonly stretched in order to align text. The typewriter, on the other hand, typically has only one width for all characters, including spaces. Following widespread acceptance of the typewriter, some typewriter conventions influenced typography and the design of printed works.[citation needed]

Computer representation of text facilitates getting around mechanical and physical limitations such as character widths in at least two ways:

  • Character encodings such as Unicode provide spaces of several widths, which are encoded using distinct numeric code points. For example, Unicode U+20 is the «normal» space character, but U+A0 adds the meaning that a new line should not be started there, while U+2003 represents a space with a fixed width of one em. Collectively, such characters are called Whitespace characters.
  • Formatting and drawing languages and software commonly provide much more flexibility in spacing. For example, SVG, PostScript, and countless other languages enable drawing characters at specific (x,y) coordinates on a screen or page. By drawing each word at a specific starting coordinate, such programs need not «draw» spaces at all (this can lead to difficulties in extracting the correct text back out). Similarly, word processors can «fully justify» text, stretching inter-word spaces to make all lines the same length (as can mechanical Linotype machines). Precision is limited by physical capabilities of output devices.

Use in natural languages[edit]

Between words[edit]

Modern English uses a space to separate words, but not all languages follow this practice. Spaces were not used to separate words in Latin until roughly 600–800 AD. Ancient Hebrew and Arabic did use spaces partly to compensate in clarity for the lack of vowels.[1] The earliest Greek script also used interpuncts to divide words rather than spacing, although this practice was soon displaced by the scriptura continua.

Word spacing was later used by Irish and Anglo-Saxon scribes, beginning after the creation of the Carolingian minuscule by Alcuin of York and the scribes’ adoption of it. The modern space originated here and then spread to the rest of the world. Indeed, the actions of these Irish and Anglo-Saxon scribes marked the dramatic shift for reading between antiquity and the modern period. Spacing would become standard in Renaissance Italy and France, and then Byzantium by the end of the 16th century; then entering into the Slavic languages in Cyrillic in the 17th century, and only in modern times entering modern Sanskrit.[2]

CJK languages do not use spaces when dealing with text containing mostly Chinese characters and kana. In Japanese, spaces may occasionally be used to separate people’s family names from given names, to denote omitted particles (especially the topic particle wa), and for certain literary or artistic effects. Modern Korean, however, has spaces as an essential part of its writing system (because of Western influence), given the phonetic nature of the hangul script that requires word dividers to avoid ambiguity, as opposed to Chinese characters which are mostly very distinguishable from each other. In Korean, spaces are used to separate chunks of nouns, nouns and particles, adjectives, and verbs; for certain compounds or phrases, spaces may be used or not, for example the phrase for «Republic of Korea» is usually spelled without spaces as 대한민국 rather than with a space as 대한 민국.

Runic texts use either an interpunct-like or a colon-like punctuation mark to separate words. There are two Unicode characters dedicated for this: U+16EB RUNIC SINGLE PUNCTUATION and U+16EC RUNIC MULTIPLE PUNCTUATION.

Between sentences[edit]

Languages with a Latin-derived alphabet have used various methods of sentence spacing since the advent of movable type in the 15th century.

  • One space (some times called French spacing, q.v.). This is a common convention in most countries that use the ISO basic Latin alphabet for published and final written work, as well as digital (World Wide Web) media.[3] Web browsers usually do not differentiate between single and multiple spaces in source code when displaying text, unless the text is given a «white-space» CSS attribute. Without this being set, collapsing strings of spaces to a single space allow HTML source code to be spaced in a more machine-readable way, at the expense of control over the spacing of the rendered page.[4]
  • Double space (English spacing). It is sometimes claimed that this convention stems from the use of the monospaced font on typewriters.[5] However, instructions to use more spacing between sentences than words date back centuries, and two spaces on a typewriter was the closest approximation to typesetters’ previous rules aimed at improving readability.[6] Wider spacing continued to be used by both typesetters and typists until the Second World War, after which typesetters gradually transitioned to word spacing between sentences in published print, while typists continued the practice of using two spaces.[7][8][9][10][11][12][13][14][15][16][17]
  • One widened space, typically one-and-a-third to slightly less than twice as wide as a word space. This spacing was sometimes used in typesetting before the 19th century. It has also been used in other non-typewriter typesetting systems such as the Linotype machine[18] and the TeX system.[19] Modern computer-based digital fonts can adjust the spacing after terminal punctuation as well, creating a space slightly wider than a standard word space.[20]

There has been some controversy regarding the proper amount of sentence spacing in typeset material. The Elements of Typographic Style states that only a single word space is required for sentence spacing.[21] Psychological studies suggest «readers benefit from having two spaces after periods.»[22]

Unit symbols and numbers[edit]

The International System of Units (SI) prescribes inserting a space between a number and a unit of measurement (the space being regarded as an implied multiplication sign) but never between a prefix and a base unit; a space (or a multiplication dot) should also be used between units in compound units.[23]

5.0 cm, not 5.0cm or 5.0 c m or 5.0 cms
45 kg, not 45kg or 45 k g or 45 kgs
32 °C, not 32°C or 32° C
20 kN m or 20 kN⋅m, not 20 kNm or 20 k Nm
π/2 rad, not π/2rad or π / 2 rad
50 %, not 50% or 50 percent (Note: % is not an SI unit, and many style guides do not follow this recommendation; note that 50% is used as adjective, e.g. to express concentration as in 50% acetic acid.)

The only exception to this rule is the traditional symbolic notation of angles: degree (e.g., 30°), minute of arc (e.g., 22′), and second of arc (e.g., 8″).

The SI also prescribes the use of a space[24] (often typographically a thin space) as a thousands separator where required. Both the point and the comma are reserved as decimal markers.

1 000 000 000 000 (thin space) or 1000000 not 1,000,000 or 1.000.000
1 000 000 000 000 (regular space which is significantly wider)

Sometimes a narrow non-breaking space or non-breaking space, respectively, is recommended (as in, for example, IEEE Standards[25] and IEC standards[26]) to avoid the separation of units and values or parts of compounds units, due to automatic line wrap and word wrap.

Encoding[edit]

Character information

Preview  
Unicode name SPACE
Encodings decimal hex
Unicode 32 U+0020
UTF-8 32 20
Numeric character reference

Note: The above representation of a regular space is replaced with a non-breaking space for visibility.

In URLs, spaces are percent encoded with its ASCII/UTF-8 representation %20.

Types of spaces[edit]

  • Figure space
  • Non-breaking space
  • Paren space
  • Thin space
  • Visible space
  • Whitespace character § Hair spaces around dashes
  • Zero-width space

See also[edit]

  • Em (typography)
  • En (typography)
  • Halfwidth and fullwidth forms
  • Internal field separator
  • Sentence spacing in digital media
  • Underscore
  • Whitespace character

References[edit]

  1. ^ Saenger 2000, p. 10: «the Semitic languages (Hebrew, Aramaic, Arabic, and Syriac), when written without vowels, were virtually always written with word separation in antiquity and continued to be so transcribed into modern times»
  2. ^ Saenger, Paul. Space Between Words: The Origins of Silent Reading. Stanford University Press, 1997, 9–14.
  3. ^
    Einsohn, Amy (2006). «Punctuation, Eyeballing every mark». The Copyeditor’s Handbook: A Guide for Book Publishing and Corporate Communications (2nd ed.). Berkeley, Los Angeles, London: University of California Press. p. 113. ISBN 9780520246881. Retrieved 2010-04-25. If you are working on documents that will be printed without any intervention from a compositor (e.g., documents produced on the office laser printer), you will have to carefully scrutinize every piece of punctuation to be sure that the document contains the correct character (see table 5). You should also delete any extra wordspacing before and after punctuation marks. The conventions are: One space follows sentence-ending punctuation mark (period, question mark, or exclamation point). One space follows comma, colon, or semicolon …
  4. ^ Thomas A. Fine. «How many spaces at the end of a sentence? One or two?».
  5. ^ Farhad Manjoo (2011-01-13). «Space Invaders: Why you should never, ever use two spaces after a period». Slate. Retrieved 2011-03-29.
  6. ^ Heraclitus (1 November 2011). «Why two spaces after a period isn’t wrong».
  7. ^
    Felici, James (2003). The Complete Manual of Typography: A Guide to Setting Perfect Type. Berkeley, CA: Peachpit Press. p. 80. ISBN 0321127307.;
  8. ^ David Spencer (24 May 2011). «The Curious Misconception Surrounding Sentence Spacing». Type Desk. Matador. Retrieved 27 May 2011.
  9. ^ Bringhurst, Robert (2004). The Elements of Typographic Style (3 ed.). Washington and Vancouver: Hartley & Marks. p. 28. ISBN 0881792063. 2.1.4 Use a single word space between sentences. In the nineteenth century, which was a dark and inflationary age in typography and type design, many compositors were encouraged to stuff extra space between sentences. Generations of twentieth century typists were then taught to do the same, by hitting the spacebar twice after every period [full stop]. Your typing as well as your typesetting will benefit from unlearning this quaint Victorian habit. As a general rule, no more than a single space is required after a period, colon, or any other mark of punctuation
  10. ^ Schriver, Karen (1997). Dynamics in Document Design: Creating Text for Readers (1 ed.). New York: Wiley. p. 502. ISBN 9780471306368. Use one space (not two) after these punctuation marks [sc. period, question mark, exclamation point, or colon], as the practice of using two spaces is just another holdover from using a typewriter.
  11. ^ Strauss, Jane (2007). «Spacing with Punctuation». The Blue Book of Grammar and Punctuation: An Easy-to-Use Guide with Clear Rules, Real-World Examples, and Reproducible Quizzes (10 ed.). Jossey-Bass. p. 176. ISBN 9780470222683. Retrieved 2010-04-25. Rule 1. With a computer, use only one space following periods, commas, semicolons, colons, exclamation points, question marks, and quotation marks. The space needed after these punctuation marks is proportioned automatically. With some typewriters and word processors, follow ending punctuation with two spaces when using a fixed-pitch font.
  12. ^ «2.49 Leading and spacing». The GPO Style Manual (30 ed.). Washington: The U.S. Government Printing Office. 2008. p. 469. ISBN 9780160818127. Archived from the original (PDF) on 2008-08-31. Retrieved 2010-04-25. A single justified word space will be used between sentences. This applies to all types of composition.
  13. ^ «FAQ: How many spaces should I leave after a period or other concluding mark of punctuation?». MLA Handbook for Writers of Research Papers (7 ed.). Modern Language Association. 2009. p. 292. ISBN 978-0-87352-297-7. Retrieved 2010-04-25. Publications in the United States today usually have the same spacing after a punctuation mark as between words on the same line. Since word processors make available the same fonts used by typesetters for printed works, many writers, influenced by the look of typeset publications, now leave only one space after a concluding punctuation mark. In addition, most publishers’ guidelines for preparing electronic manuscripts ask authors to type only the spaces that are to appear in print.
  14. ^ «FAQ: How many spaces should I leave after a period or other concluding mark of punctuation?». The Chicago Manual of Style (7 ed.). University of Chicago Press. 2009. p. 292. ISBN 9780873522977. Retrieved 2010-04-25. Publications in the United States today usually have the same spacing after a punctuation mark as between words on the same line. Since word processors make available the same fonts used by typesetters for printed works, many writers, influenced by the look of typeset publications, now leave only one space after a concluding punctuation mark. In addition, most publishers’ guidelines for preparing electronic manuscripts ask authors to type only the spaces that are to appear in print.
  15. ^ «The Chicago Manual of Style Online (Q&A: One Space or Two?)». University of Chicago Press. 2003. Retrieved 2010-04-25. The view at CMOS is that there is no reason for two spaces after a period in published work. Some people, however—my colleagues included—prefer it, relegating this preference to their personal correspondence and notes. I’ve noticed in old American books printed in the few decades before and after the turn of the twentieth century (ca. 1870–1930 at least) that there seemed to be a trend in publishing to use extra space (sometimes quite a bit of it) after periods. And many people were taught to use that extra space in typing class (I was). But introducing two spaces after the period causes problems: (1) it is inefficient, requiring an extra keystroke for every sentence; (2) even if a program is set to automatically put an extra space after a period, such automation is never foolproof; (3) there is no proof that an extra space actually improves readability—as your comment suggests, it’s probably just a matter of familiarity (Who knows? perhaps it’s actually more efficient to read with less regard for sentences as individual units of thought—many centuries ago, for example in ancient Greece, there were no spaces even between words, and no punctuation); (4) two spaces are harder to control for than one in electronic documents (I find that the earmark of a document that imposes a two-space rule is a smattering of instances of both three spaces and one space after a period, and two spaces in the middle of sentences); and (5) two spaces can cause problems with line breaks in certain programs. So, in our efficient, modern world, I think there is no room for two spaces after a period. In the opinion of this particular copyeditor, this is a good thing.
  16. ^ «Chapter 5. Manuscript Preparation and Sample Papers to be Submitted for Publication». Publication Manual of the American Psychological Association (aka APA Style) (5 ed.). Washington: American Psychological Association. 2001. pp. 439. ISBN 9781557987907. Retrieved 2010-04-25. 5.11 Spacing and Punctuation: Space once after all punctuation as follows: after commas, colons, and semicolons; after punctuation marks at the end of sentences; after periods that separate parts of a reference citation; and after the periods of the initials in personal names (e.g., J. R. Zhang). Exception: Do not use space after internal periods in abbreviations (e.g., a.m, i.e., U.S.)
  17. ^ Style Manual: for Authors, Editors and Printers (aka AGPS Style) (6 ed.). Stafford, Australia: Wiley Australia, The Commonwealth Government of Australia Printing Office. 2002. p. 117. ISBN 978-0-7016-3647-0. Retrieved 2010-04-25. In typewritten (as distinct from typeset) material, it was customary to place two spaces after a colon, semicolon, full stop or other sentence closing punctuation. Programs for word processing and desktop publishing offer more sophisticated, variable spacing, so this practice of double spacing is now avoided because it can create distracting gaps on a page.
  18. ^ Mergenthaler Linotype Company (1940). Linotype Keyboard Operation: Methods of Study and Procedures for Setting Various Kinds of Composition on the Linotype. Mergenthaler Linotype Company. cited in Mark Simonson (5 March 2004). «Double-spacing after Periods». Typophile. Typophile. Retrieved 5 April 2010.
  19. ^ Eijkhout, Victor (2008), TeX by Topic, A TeXnician’s Reference (PDF), Lulu, pp. 185–188
  20. ^ Felici, James (2003). The Complete Manual of Typography: A Guide to Setting Perfect Type. Berkeley, CA: Peachpit Press. p. 80. ISBN 0-321-12730-7.; Fogarty, Mignon (2008). Grammar Girl’s Quick and Dirty Tips for Better Writing (Quick and Dirty Tips). New York: Holt Paperbacks. p. 85. ISBN 978-0-8050-8831-1.; Straus, Jane (2009). The Blue Book of Grammar and Punctuation: An Easy-to-Use Guide with Clear Rules, Real-World Examples, and Reproducible Quizzes (10th ed.). San Francisco, CA: Jossey-Bass. p. 52. ISBN 978-0-470-22268-3.
  21. ^ Bringhurst, Robert (2004). The Elements of Typographic Style (3.0 ed.). Washington and Vancouver: Hartley & Marks. pp. 28, 30. ISBN 0-88179-206-3.
  22. ^ Hamblin, James (11 May 2018). «The Scientific Case for Two Spaces After a Period». The Atlantic. Retrieved 14 May 2018.
  23. ^ International Bureau of Weights and Measures (2019). The International System of Units (SI) (9th ed.). p. 149..
  24. ^ The International System of Units (PDF) (9th ed.). International Bureau of Weights and Measures. 2019. p. 150. ISBN 978-92-822-2272-0.
  25. ^ https://standards.ieee.org/content/dam/ieee-standards/standards/web/governance/revcom/scc14.pdf[bare URL PDF]
  26. ^ «Writing and formatting | IEC». International Electrotechnical Commission. 2022-07-18. Archived from the original on 2022-07-18. Retrieved 2022-07-18.

Further reading[edit]

  • Saenger, Paul (1997). Space Between Words: The Origin of Silent Reading. Stanford, Calif: Stanford University Press. ISBN 9780804726535. OCLC 35548786.

Всё (или почти всё) о пробеле

Время на прочтение
13 мин

Количество просмотров 126K

Как следует из заголовка, речь в статье пойдёт о неотъемлемой части любого русскоязычного (и не только) текста — о пробеле. Мы затронем историю пробела, виды пробелов, вопросы употребления пробела в веб-типографике.

Вообще говоря, пробел — это любое пустое место в рукописном, печатном или отображаемом на любом другом носителе тексте. Так что пробелы бывают разные:

  • спусковые (большие вертикальные пропуски в первой полосе издания) и концевые пробелы полосы,
  • абзацные отступы и концевые пробелы абзаца,
  • межстрочные пробелы (между строками текста),
  • межсловные пробелы (между словами в одной строке),
  • межбуквенные пробелы (между буквами в слове).

Далее речь пойдёт о межсловных пробелах, разделяющих слова, и функционально принадлежащих к знакам препинания.

История межсловного пробела

Межсловный пробел — сравнительно позднее изобретении в истории человеческой мысли. Глубоко история пробела изложена в книге Пола Санджера (Paul Saenger) «Space between Words: The Origins of Silent Reading», а также, несколько менее глубоко, в книге Иоганнеса Фридриха «История письма».

Также есть неплохая статья Антона Бизяева о пробелах и об их истории «В начале пробелов не было», которая была опубликована в 1997 году в журнале «Publish».

Вкратце, пробел появился достаточно поздно, в тех письменностях, где отсутствие разграничения слов приводило к сложности чтения (так называемое консонантное письмо, где записываются только согласные звуки). Однако в греческом и латыни, в которых записывали и гласные звуки, использование пробела было утеряно. Пол Санджер связывает это с тем, что чтение производилось вслух, что упрощало разграничение слов при восприятии текста.

Вновь пробел начал использоваться приблизительно в VII—IX вв. н. э., и эта традиция пришла из Ирландии, где у писцов и чтецов родным языком являлся древнеирландский, а религиозная литература записывалась на латыни. По-видимому, по этой причине монахи испытывали трудности с чтением вслух. Считается, что появление пробела плотно связано с постепенным переходом от чтения вслух к чтению про себя. Примерами книг на латыни с межсловными пробелами являются памятники британской литературы: Евангелие из Дарроу (VII в.) и Келлская книга (VIII—IX вв.).

В глаголице и кириллице пробел также отсутствовал, и в привычном нам смысле используется только с XVII века.

До того, как человечество изобрело наборный шрифт, никакой особенной классификации межсловных пробелов не было — ставили писцы пробелы на глазок и ставили. Напомню (мы писали об этом в статье «Выключка по ширине»), что рукопись и ксиллография относятся к способам создания текстов без подвижности литер. Естественно, пробелы могли получаться различной ширины, так как пропуски делались вручную.

Пробелы в ручном наборе

Когда подвижность литер появилась (а произошло это с появлением наборных шрифтов), появились соответственно и вопросы — а как же ставить пробелы, чтобы соблюдалась выключка по ширине?

Технология ручного набора такова, что набранная строка полностью зажимается в верстатке и в гранке, и, соответственно, должна иметь ширину, практически точно равную ширине полосы (подробнее с технологией ручного набора можно познакомиться в одноимённой книге М. В. Шульмейстера).

Строка при ручном наборе набиралась из литер (брусков, на торце которых делались выпуклые зеркальные копии букв, отпечатывающиеся на бумаге), а межсловные пробелы создавались с помощью так называемых шпаций — брусков различной толщины, у которых на торце нет печатающей поверхности. Выглядит это примерно вот так. Шпации для каждого кегля шрифта, естественно, выпускались свои, и имели различную ширину. Например, для шрифта кегля 10 пунктов (стандартный кегль для большинства текстовых изданий) выпускались шпации шириной 10, 5, 4, 3, 2 и 1 пункт.

Шпации шириной в кегль назывались кегельными или круглыми. Шпации в половину кегельной назывались полукегельными или полукруглыми. Также существует название «тонкая шпация», под которой понимают шпации толщиной 1—2 пункта для шрифта кегля 8—12 пунктов. То есть, для шрифта кегля 10 пунктов тонкая шпация обычно составляет 2 пункта (соответственно, 1⁄5 кегельной). Однако, в связи с отсутствием точного определения тонкой шпации, в руководствах издателя, редактора и верстальщика обычно говорят не об отбивке на тонкую шпацию, а об отбивке на столько-то пунктов (считая, что кегль шрифта равен 10 пунктам).

Таким образом, нужно понимать, что в зависимости от кегля шрифта доля круглой шпации (треть, четверть и т. п.) может иметь разную ширину в пунктах, и наоборот.

Традиционная ширина межсловного пробела

Итак, разобравшись с тем, что такое круглая и полукруглая шпации, перейдём к принятой в российском наборе ширине собственно межсловного пробела.

Шульмейстер пишет (стр. 94), что при наборе строки между словами ставится полукруглая. Когда строка набрана до конца, в большинстве случаев её ширина оказывается либо меньше, либо больше ширины полосы набора. Поэтому верстальщику приходится изменять ширину пробелов, уменьшая её минимум до 1⁄4 круглой и увеличивая максимум до 3⁄4 круглой (соответственно, при наборе кеглем 10 пунктов межсловные пробелы могут варьироваться от 3 до 7 пунктов). Естественно, бывают нюансы, зависящие от формата издания, но мы их касаться не будем.

Однако, Шульмейстер оговаривается, что сам по себе межсловный пробел в полукруглую великоват, и использование стандартного пробела в 1⁄3 круглой является как более экономичным с точки зрения расхода бумаги, так зачастую и более красивым. Также использование межсловного пробела в полукруглую не рекомендуется для узких шрифтов.

С появлением строкоотливных машин пробелы стали делаться равномерными по ширине в пределах одной строки, а ширина межсловного пробела стала варьироваться около 1⁄3 круглой.

Компьютерный набор и веб-типографика

В настоящее время мы ограничены возможностями используемых шрифтов, и, естественно, набором символов в Unicode. Нужно помнить, что далеко не все шрифты содержат большинство пробельных Unicode-символов.

При переходе к компьютерным системам вёрстки был совершён переход от указания ширины шпаций в пунктах к указанию ширины шпаций в долях круглой, так как шрифты стали легко масштабироваться до любого кегля, а пробельные элементы должны были оставаться пропорциональными кеглю шрифта.

Символы пробела в Unicode

В Unicode предусмотрены следующие символы для пробелов западной типографики.

  • Межсловный пробел, U+0020,  — ширина от 1⁄5 до 1⁄2 круглой в зависимости от шрифта. Для средних шрифтов межсловный пробел имеет ширину порядка 1⁄4 круглой (например, Times New Roman имеет именно такой пробел), для широких — порядка 1⁄3 круглой (Microsoft Verdana — 0,35 круглой, Microsoft Tahoma — 0,31 круглой).
  • Неразрывный межсловный пробел, U+00A0,   — имеет ту же ширину, что и обычный межсловный пробел, но в месте неразрывного пробела запрещён разрыв строки.

Обычный и неразрывный межсловный пробелы входят в любой шрифт и правильно отображаются всеми агентами, если не считать отсутствия увеличения и уменьшения неразрывного пробела при выключке по ширине в некоторых текстовых процессорах и браузерах (что является нарушением рекомендаций). Например, FireFox правильно масштабирует неразрывные пробелы, а MSIE 7.0 не масштабирует их вовсе.

Все остальные пробельные символы имеют фиксированную ширину и не растягиваются при выключке строк по ширине. Вместе с тем, согласно алгоритму разрыва строк в Unicode, все они должны обрабатываться как точка разрыва строки.

  • Круглая шпация, U+2003,   — как было сказано, имеет ширину, равную размеру кегля. Также называется Em Space, возможно, потому что буква «M» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что Em Space всегда имеет ширину буквы «M» — заблуждение.
  • Полукруглая шпация, U+2002,   — половина круглой. Также называется En Space, возможно, потому что буква «N» в каких-либо старых шрифтах имела такую ширину. Вместе с тем, сейчас это выполняется далеко не везде, и поэтому утверждение, что En Space всегда имеет ширину буквы «N» — заблуждение.
  • Третная шпация, U+2004,   — треть круглой. По-английски называется Three-per-Em Space.
  • Четвертная шпация, U+2005,   — четверть круглой. По-английски называется Four-per-Em Space.
  • Одна шестая круглой, U+2006,  . По-английски называется Six-per-Em Space.
  • Тонкая шпация, U+2009,   — обычно имеет ширину в 1⁄5 круглой (реже — 1⁄6). Вообще говоря, её ширина зависит от языка набора и производителя шрифта, и в кириллических шрифтах тонкая шпация обычно имеет ширину в 1⁄5 круглой. Эта шпация по пропорциям в точности соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов. По-английски называется Thin Space.
  • Волосяная шпация, U+200A,   — самая узкая шпация, шириной около 1⁄10—1⁄16 круглой. Такая шпация по пропорциям примерно соответствует однопунктовой шпации при наборе кеглем в 10 пунктов или выглядит даже у́же.

Использование различных пробелов

Поскольку ширина межсловного пробела фиксирована в шрифте и изменяется автоматически при выключке по ширине, использование других пробельных символов в качестве межсловных оправдано только при наборе печатных изданий, и только при наличии глубокого понимания, для чего это делается.

В обычной вёрстке для веба для разделения слов достаточно пользоваться обычными и неразрывными межсловными пробелами.

Вместе  тем, по правилам русскоязычной типографики в ряде мест должна использоваться тонкая шпация (точнее, в справочниках написано о двухпунктовой шпации, но мы будем употреблять термин «тонкая шпация» как наиболее соответствующий и с точки зрения устоявшейся терминологии, и с точки зрения внешнего вида строки при наборе).

Основные правила использования пробелов будут описаны ниже, но в целом мы рекомендуем следующий принцип для использования при вёрстке для веба.

При подготовке документов в формате HTML для публикации в Интернете в качестве пробельных элементов должны использоваться только пробел, неразрывный пробел   и тонкая шпация  . В том случае, если автор предполагает, что страница должна просматриваться с помощью агентов, некорректно обрабатывающих символ  , то вместо тонкой шпации должен использоваться обычный или неразрывный пробел.

Использование только тонкой шпации из всего разнообразия пробельных элементов позволяет, во-первых, сохранить гармоничный вид набранного текста, а во-вторых, не перегружать автора публикации разнообразными правилами употребления шпаций различной дробной ширины.

Обработка пробелов браузерами и поисковиками

При подготовке материала статьи мы провели своеобразный эксперимент на специально подготовленной странице. Яндекс и Google справляются с нестандартными символами хорошо, заменяя при поиске все нестандартные пробельные элементы на обычные (мы считаем, что это — правильное поведение). То есть, они не делают разницы между текстами «два слова», «два  слова», «два  слова» и т. п.

Как выяснилось, рендеринг нестандартных пробельных элементов работает в браузерах из рук вон плохо. Нормально справляются с задачей только Firefox 3.0 в Windows XP и *nix, MSIE 7.0 и Safari в Windows XP. Об MSIE 8.0 данных нет, но скорее всего, у него тоже всё в порядке.

  • Firefox до версии 3.0 вообще не разрывает строку в местах нестандартных пробелов. При этом ширина пробелов отображается правильно.
  • Opera 9.26 и 9.50, FireFox 3.0 под Mac, Safari под Mac строку переносят, но зато все пробелы оказываются одной ширины.
  • MSIE 5.5 и 6.0 под Windows 2000 вместо пробелов ставят квадратики (возможно, соответствующие символы просто отсутствуют в системном шрифте).

Не вполне понятно, с чем связана одинаковая ширина всех пробельных элементов во всех браузерах под Mac. Вероятно, со встроенными шрифтами.

Основные правила употребления пробелов

Итак, ещё раз подчеркнём, что во всех правилах, перечисленных ниже, тонкая шпация   используется только в том случае, когда автор отметает риск использования посетителем сайта браузеров, неверно отображающих тонкую шпацию. К ним относятся некоторые браузеры в *nix (возможно, это связано со встроенными шрифтами), MSIE версии 6.0 и раньше, браузеры для Mac (ими можно пренебречь, так как ошибка рендеринга заключается только в ширине шпации), возможно — некоторые браузеры для мобильных телефонов и КПК.

В том случае, если использование таких браузеров вероятно, мы рекомендуем использовать вместо тонкой шпации обычный или неразрывный межсловный пробелы.

Как было описано выше, согласно рекомендациям Unicode тонкая шпация является таким пробелом, где возможен разрыв строки. В тех случаях, когда правила требуют постановки тонкой шпации и запрета разрыва строки (например, между разрядами при наборе числа), необходимо использовать конструкцию типа <span style="white-space: nowrap;">250&thinsp;000</span>. HTML-элемент nobr является проприетарным и к использованию запрещён.

Далее мы опишем те правила расстановки пробелов, которые чаще всего, по нашим наблюдениям, нарушаются при вёрстке текстов. Более подробную информацию о правилах набора текстов можно почерпнуть, например, в «Справочнике издателя и автора» А. Э. Мильчина и Л. К. Чельцовой.

Сокращения и символы

  1. В сокращениях «и так далее», «и тому подобное», «так как», «то есть», «и другие», «до нашей эры», «южной широты» и подобных все элементы сокращения отделяются неразрывным пробелом.
    и т. д. — и&nbsp; т.&nbsp; д.
    и т. п. — и&nbsp; т.&nbsp; п.
    т. к. — т.&nbsp; к.
    т. е. — т.&nbsp; е.
    и др. — и&nbsp; др.
    до н. э. — до&nbsp; н.&nbsp; э.
    ю. ш. — ю.&nbsp; ш.
  2. Инициалы отбиваются друг от друга и от фамилии неразрывным пробелом.
    А. С. Пушкин — А.&nbsp; С.&nbsp; Пушкин
    Дж. Р. Р. Толкиен — Дж.&nbsp; Р.&nbsp; Р.&nbsp; Толкиен

    Допустима также отбивка инициалов друг от друга и от следующей за ним фамилии тонкой шпацией, однако перенос инициалов либо фамилии на следующую строку запрещён. Независимо от выбора стиля отбивки инициалов необходимо придерживаться единства стиля в рамках всего документа или сайта.
    В. В. Путин — В.&thinsp; В.&thinsp; Путин
    В. Путин — В.&thinsp; Путин
    Путин В. В. — Путин&nbsp; В.&thinsp; В.
    Путин В. — Путин&nbsp; В.
  3. Сокращённое слово отбивается от имени собственного неразрывным пробелом.
    ул. Щорса — ул.&nbsp; Щорса
    г. Москва — г.&nbsp; Москва
    метрополитен им. Ленина — метрополитен им.&nbsp; Ленина
  4. Число и соответствующее ему счётное слово отбиваются неразрывным пробелом.
    12 млрд рублей — 12&nbsp; млрд рублей
    гл. IV — гл.&nbsp;IV
    пп. 3—6 — пп.&nbsp;3—6
    рис. 42 — рис.&nbsp;42
    XX в. — XX&nbsp; в.
    1941—1945 гг. — 1941—1945&nbsp; гг.
    палата № 6 — палата №&nbsp;6
    § 22 — §&nbsp;22
    25 % — 25&nbsp;%
    97,5 ? — 97,5&nbsp;?
    16 ¢ — 16&nbsp;¢
    .
  5. Число и соответствующая ему единица измерения (кроме знаков градуса, минуты и секунды) отбиваются тонкой шпацией, разрыв строки запрещён.
    400 м — 400&thinsp; м
    100 т — 100&thinsp; т
    451 °F — 451&thinsp;°F

    но 59°, 57′, 00″.
  6. Знаки градуса, минуты и секунды отбиваются тонкой шпацией от последующих цифр.
    59° 57′ 00″ — 59°&thinsp;57′&thinsp;00″

Нужно учесть, что по поводу отбивки знаков процента и валют в среде типографов нет полностью устоявшегося правила, так что набор знака процента и символов валют вплотную к числу не является ошибкой, если такое употребление проводится единообразно на всём сайте. Однако, мы считаем, что использование пробела в данном случае улучшает читаемость текста.

Числа и интервалы

  1. Дробная и целая части числа не отбиваются пробелом от запятой: 0,62, 345,5.
  2. Разряды числа отбиваются друг от друга тонкой шпацией, кроме дат, номеров (например, документов), обозначений машин и механизмов.
    25 563,42 — 25&thinsp;563,42
    1 652 — 1&thinsp;652
    1 298 300 — 1&thinsp;298&thinsp;300

    но 1999 год, ГОСТ 20283, вх. № 982364
  3. При численном обозначении интервалов тире не отбивается от границ интервала.
    50—100 м — 50—100&thinsp; м
    1 500—2 000 — 1&thinsp;500—2&thinsp;000
    1,5—2 тыс. — 1,5—2&nbsp; тыс.
    15—20 % — 15—20&nbsp;%
  4. Унарные знаки плюс, минус и плюс-минус не отбиваются от следующего за ним числа: +20 °C, −42, ±0,1.
  5. Бинарные знаки математических операций и соотношений отбиваются с обеих сторон на тонкую шпацию.
    2 + 3 = 5 — 2&thinsp;+&thinsp;3&thinsp;=&thinsp;5

Знаки препинания

  1. Точка, запятая, двоеточие, вопросительный и восклицательный знаки, точка с запятой не отбиваются пробелом от предшествующего слова, и отбиваются пробелом от последующего: Ха, ха. Ха? Ха!
  2. Многоточие не отбивается от предшествующего слова, если оно стоит в конце предложения или части предложения, и от последующего — если оно стоит в начале предложения: Ого… Что? …Ничего.
  3. Кавычки не отбиваются пробелами от заключённого в них текста: броненосец «Потёмкин».
  4. Скобки не отбиваются пробелами от заключённого в них текста, и отбиваются пробелами снаружи (кроме того случая, когда закрывающая скобка соседствует с знаком препинания справа): Текст в&nbsp; скобках никому не&nbsp; интересен (обычно).
  5. Тире отбивается от предыдущего слова неразрывным пробелом, а от следующего — обычным пробелом (в том числе и в случае, если интервал указан в словесной, а не цифровой форме).
    Витенька&nbsp;— молодец!
    нам подойдёт только огурец длиной пятнадцать&nbsp;— двадцать сантиметров
    пакт Молотова&nbsp;— Риббентропа
    .
  6. Если два числа в словесной форме не образуют интервал, а означают «то ли одно число, то ли другое», то между ними ставится дефис, который не отбивается пробелами: выпил рюмки две-три.

Существует рекомендация отбивать тире на тонкую шпацию или не отбивать вообще от точки, запятой или кавычки. Это может быть оправдано при наборе печатного текста конкретным шрифтом, так как увеличивает однородность пробелов. В то же время, при просмотре текста для веба шрифты у пользователя могут быть совершенно разнообразными, из-за чего левый от тире пробел постоянно становится уже, чем правый.

Нежелательные переносы

  1. Короткие слова и союзы (а, и, но, я, ты, и так далее) лучше отбивать от последующего слова неразрывным пробелом, так как висящее на конце строки короткое слово ухудшает читаемость. В том числе очень желательно не допускать переноса строки между частицей не и следующим за ней глаголом.
  2. Частицы же, бы, ли желательно отбивать от предыдущего слова неразрывным пробелом: то&nbsp; же, сказал&nbsp; бы, думал&nbsp; ли я.
  3. Желательно не отрывать предлоги в начале предложения от следующих за ними слов. (даже более длинные, чем одно- и двухбуквенные)
Пробел
Пунктуация
апостроф (’ ‘)
скобки ([ ], ( ), { }, ⟨ ⟩)
двоеточие (:)
запятая (,)
тире (, –, —, ―)
многоточие (…, …, . . .)
восклицательный знак (!)
точка (.)
дефис ()
дефис-минус ()
вопросительный знак (?)
кавычки (“ ”, ‘ ’, « », ‹ ›)
точка с запятой (;)
косая черта (слеш, дробь) (/,  ⁄ )
Словоразделители
пробел ( ) ( ) ( )
интерпункт (·)
Основная типографика
амперсанд (&)
коммерческое at (@)
звёздочка (астериск) (*)
обратная косая черта ()
маркер списка (буллит) ()
циркумфлекс (^)
крестик (†, ‡)
градус (°)
перевёрнутый восклицательный знак (¡)
перевёрнутый вопросительный знак (¿)
октоторп (решётка, хеш) (#)
знак номера ()
знак деления (÷)
порядковый индикатор (º, ª)
процент, промилле, миллионная доля (%, ‰, )
абзац ()
штрих (′, ″, ‴)
знак параграфа (§)
тильда (~)
подчёркивание (_)
вертикальная черта (¦, |)
Интеллектуальная собственность
знак охраны авторского права (©)
знак охраны смежных прав (®)
символ знака обслуживания ()
знак охраны смежных прав
для фонограммы
()
товарный знак ()
Знаки Валют
знак валюты (общий) (¤)
знаки валют (конкретные)
(₳ ฿ ₵ ¢ ₡ ₢ ₠ $ ₫ ৳ ₯ € ƒ ₣ ₲ ₴ ₭ ℳ ₥ ₦ ₧ ₱ ₰ £ ₹ ₨ ₪ ₸ ₮ ₩ ¥ ៛)
Редкая типографика
астеризм ()
интерробанг ()
иронический знак (؟)
Другое
Диакритические знаки
Шпация
В других письменностях
Армянская пунктуация
Китайская пунктуация

Пробе́л — интервал между буквами, обозначающий границы слов во многих системах письменности. Функционально пробел принадлежит к знакам препинания.

Пробел — сравнительно позднее изобретение. В финикийском и первоначальных вариантах древнееврейского и арамейского пробел не использовался. В греческом письме он используется более тысячи лет. В латинском пробел иногда встречался в древности, потом исчезал и вернулся тоже около тысячи лет назад. В древнейших славянских памятниках пробел также отсутствует (как в глаголице, так и в кириллице); регулярно и в нынешнем смысле используется в кириллице только с XVII века. В арабском письме практически не использовался до XX века. В современном китайском и японском языках пробел также может не использоваться.

Для указания словораздела в письменностях, не имеющих или редко использующих пробелы, применялись и применяются различные приемы, например:

  • особые формы букв для начала и (или) конца слова;
  • использование диакритических знаков, ставящихся при первой и (или) последней букве слов, либо добавление к началу (концу) слова особых непроизносимых букв;
  • разделение слов вместо пробелов другими знаками (чаще всего точкой или двоеточием, иногда вертикальной чертой и т. п.);
  • слитное начертание знаков, входящих в одно слово, либо обозначение принадлежности знаков к слову графически (например, чертой).

В старинных письменностях пробелами (или иным способом разделения) могли отделяться не отдельные слова, а более крупные единицы текста (словосочетания) или более мелкие (слоги). Слитное и раздельное написание сочетаний полнозначных слов со служебными элементами (предлогами, частицами и т. п.) представляет собой одну из самых сложных для учащихся и нестабильную часть орфографии многих языков, в том числе и русского.

ГОСТ[1] определяет пробел как «литера, воспроизводимая отсутствием начертания».

Содержание

  • 1 Обычный пробел
    • 1.1 Правила постановки пробела рядом со знаками препинания
    • 1.2 Применение в типографике других стран
  • 2 Неразрывный пробел
    • 2.1 Применение в компьютерной типографике
  • 3 Другие пробелы в юникоде
  • 4 Пробел при типографском наборе
  • 5 Примечания
  • 6 Литература
  • 7 См. также
  • 8 Ссылки

Обычный пробел

Название в Юникоде Код в Юникоде (шестнадцатеричный) Код в Юникоде (десятичный) Выглядит Мнемокод в HTML 4
SPACE 0020 0032 « »

Правила постановки пробела рядом со знаками препинания

1. В русскоязычном наборе пробел ставится:

  • после запятой, точки (в том числе и обозначающей сокращения и инициалы), точки с запятой, двоеточия, вопросительного и восклицательного знака, многоточия (кроме многоточий, начинающих предложение);
  • перед многоточием, стоящим в начале предложения;
  • с внешней стороны скобок и кавычек;
  • с обеих сторон тире, за исключением тире между цифровыми обозначениями неотрицательных целых чисел (по типографским правилам вокруг тире ставятся не обычные пробелы, а укороченные (двухпунктовые), но из-за ограничений компьютерного набора часто ставят полные пробелы: неразрывный слева и обычный справа).

2. Однако пробел не ставится:

  • перед запятой, точкой, точкой с запятой, двоеточием, вопросительным и восклицательным знаками, многоточием (кроме многоточия, стоящего в начале предложения);
  • после многоточия, стоящего в начале предложения;
  • с внутренней стороны скобок и кавычек;
  • с обеих сторон дефиса (за исключением односторонних дефисов, то есть случаев вроде «одно- и двухэтажный») и апострофа.

3. В случае одновременной применимости пунктов 1 и 2 (например, если точка стоит перед закрывающей скобкой, или перед запятой) пробел не ставится.

В некоторых руководствах по типографскому набору также указывается, что пробел не ставится, если тире идёт после точки или запятой, но при работе с большинством современных шрифтов этот совет скорее вреден.

Применение в типографике других стран

В американской типографике (в отличие от британской и австралийской) пробел не ставится до и после длинного тире. («It indicates a sudden break in thought—a parenthetical statement like this one—or an open range.»)

Во французской типографике после открывающей кавычки и перед закрывающей ставится ¼ М-пробела. (« Son explication n’est qu’un mensonge », s’indigna le député.)

Неразрывный пробел

Неразры́вный пробел — элемент компьютерной кодировки текстов, отображающийся внутри строки подобно обычному пробелу[2], но не позволяющий программам отображения и печати разорвать в этом месте строку. Используется для автоматизации вёрстки, правила которой предписывают избегать разрыва строк в известных случаях (большей частью для удобочитаемости).

В Microsoft Word и OpenOffice.org Writer горячие клавиши постановки неразрывного пробела: «CTRL+SHIFT+ПРОБЕЛ», и типографской раскладке клавиатуры Ильи Бирмана[3] (для Microsoft Windows) — «ALTGR+ПРОБЕЛ».

Название в юникоде Код в юникоде (шестнадцатеричный) Код в юникоде (десятичный) Выглядит Мнемокод в HTML 4 Пояснения
NO-BREAK SPACE 00A0 0160 « » &nbsp; non-breaking space

Применение в компьютерной типографике

  • между двумя инициалами и между инициалами и фамилией («А. С. Пушкин»);
  • между сокращёнными обращениями и фамилией («г-н Иванов») а также после географических сокращений («г. Москва», «о-ва Кука»);
  • между знаками номера и параграфа и относящихся к ним цифрам («№ 8», «§ 104»);
  • внутри сокращений и им подобных («и т. д.», «т. е.»);
  • между числами и относящимися к ним единицами измерения или счетными словами («12 кг», «1981 г.», «гл. IV»);
  • перед тире в середине предложения («Восемнадцать — это совсем не мало»): типографские правила требуют ставить здесь укороченный пробел[источник не указан 526 дней], но часто из-за ограничений компьютерного набора[каких?] ставят полный;
  • между группами цифр в многозначных числах, по три цифры справа налево, начиная с четырёх[4]— или пятизначных[5] чисел («2 132 128 байт»): типографские правила требуют ставить здесь укороченный пробел, но часто из-за ограничений компьютерного набора ставят полный;
  • перед номерами версий программных продуктов и частями их названий, состоящими из цифр или сокращений («Windows XP», «GNOME 2.8»);
  • после предлогов и союзов (особенно однобуквенных или начинающих предложение), прежде всего в заголовках («Стремиться к совершенству»); после частицы «не», перед частицами «бы», «ли», «же».

Другие пробелы в юникоде

Название в юникоде Код в юникоде (шестнадцатеричный) Код в юникоде (десятичный) Выглядит Мнемокод в HTML 4 Пояснения
EN QUAD 2000 8192 « »
EM QUAD 2001 8193 « »
EN SPACE 2002 8194 « » &ensp; равен половине кегля шрифта (исторически происходит от ширины заглавной буквы «N»)
EM SPACE 2003 8195 « » &emsp; равен кеглю шрифта (исторически происходит от ширины заглавной буквы «M»)
THREE-PER-EM SPACE 2004 8196 « » ближе всех к обычному пробелу, втрое меньше, чем EM-SPACE
FOUR-PER-EM SPACE 2005 8197 « » в четыре раза меньше, чем EM-SPACE
SIX-PER-EM SPACE 2006 8198 « » в шесть раз меньше, чем EM-SPACE
FIGURE SPACE 2007 8199 « » имеет такую же ширину, что и цифра, и предназначен для набора таблиц. Неразрывный.
PUNCTUATION SPACE 2008 8200 « » ширина равна ширине точки
THIN SPACE 2009 8201 « » &thinsp; обычно имеет ширину в 15 круглой (реже — 16). По пропорциям соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов.
HAIR SPACE 200A 8202 « » самый тонкий пробел, соответствует самой тонкой шпации в кассе наборщика
ZERO-WIDTH SPACE 200B 8203 «​» показывает места, в которых можно разрывать строку, не добавляя знак переноса; ширина его нулевая. Применяется в языках, в которых пробелов нет. При выравнивании текста по ширине может расширяться, как и любой другой пробел.
NARROW NO-BREAK SPACE 202F 8239 « » узкий неразрывный пробел
MEDIUM MATHEMATICAL SPACE 205F 8237 «‭» узкий пробел, применяемый в математических формулах
WORD JOINER 2060 8288 «⁠» аналогичен ZERO-WIDTH SPACE, но неразрывный
IDEOGRAPHIC SPACE 3000 12288 « » используется в восточных языках, равняется ширине одного иероглифа. См. CJK

Пробел при типографском наборе

Question book-4.svg

В этом разделе не хватает ссылок на источники информации.

Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена.
Вы можете отредактировать эту статью, добавив ссылки на авторитетные источники.
Эта отметка установлена 12 мая 2011.

При типографском наборе пробелы между словами не имели фиксированной ширины. Для книжных изданий традиционно применяются следующие правила.

Без шпаций набираются такие комбинации:

  • знак препинания и предшествующий текст;
  • многоточие в начале предложения и последующий текст;
  • тире после точки или запятой;
  • тире между числами;
  • точка или запятая перед знаком сноски;
  • кавычки или скобки и заключенный в них текст;
  • кавычки или скобки и знаки препинания;
  • двойные знаки номера и параграфа;
  • число перед знаком процента или промилле;
  • число перед знаком градуса, минуты, секунды или терции;
  • дефис и смежные элементы;
  • буквенно-цифровые обозначения.

С 2-пунктовыми шпациями набираются такие комбинации:

  • тире и смежные элементы (кроме случаев, указанных выше);
  • слово перед знаком сноски;
  • знак градуса, минуты, секунды или терции перед числом или буквой, обозначающей шкалу, за исключением изолированного употребления (0 °C, но °C);
  • классы цифр в многозначных числах.

С 3-пунктовыми шпациями набираются такие комбинации:

  • числа после знака номера или параграфа, если они разделены запятыми;
  • части сокращения с точкой (и т. д.).

С полукегельными шпациями такие комбинации:

  • знак номера или параграфа перед числом;
  • числа после знака номера или параграфа, если они не разделены запятыми;
  • число и относящееся к нему слово;
  • части сокращения без точки (и т. д.);
  • инициалы и фамилия.

Запрещается перенос таких комбинаций:

  • диапазон (числа, соединенные тире);
  • сокращения, подобные и т. д.;
  • фамилия и инициалы;
  • число и относящееся к нему слово;
  • знак номера или параграфа и число;
  • обозначение пункта списка и последующий текст.

В связи с ограниченностью возможностей компьютерных программ[6] и стандартной клавиатуры и различиями в традициях типографского набора разных стран в компьютерном наборе de facto используются упрощённые правила. При этом для предотвращения переноса текста зачастую используется «неразры́вный» пробел[7].

Примечания

  1. ГОСТ 19781-90. Единая система программной документации. Обеспечение систем обработки информации программное.
  2. Во многих программах неразрывный пробел отличается от обычного также тем, что не изменяет размер при разгоне строки по ширине.
  3. Типографская раскладка Ильи Бирмана
  4. А. Э. Мильчин, Л. К. Чельцова. Справочник издателя и автора. Редакционно-издательское оформление издания. 2-е издание, исправленное и дополненное. М.: ОЛМА-Пресс, 2003. — 800 с. П. 6.1.3. ISBN 5-224-04565-7
  5. Наборные и фотонаборные процессы. М., 1983. П. 2.3.9
  6. В настоящее время практически все издательские и офисные программы имеют поддержку Unicode, за счет которой ограничения снимаются.
  7. Современные издательские программы имеют встроенные средства автоматизации, и на их основе существуют готовые решения, позволяющие без существенных затрат труда и времени расставлять в наборе пробелы, предусмотренные полной версией правил.

Литература

  • А. Э. Мильчин, Л. К. Чельцова. Справочник издателя и автора. Редакционно-издательское оформление издания. 2-е издание, исправленное и дополненное. М.: ОЛМА-Пресс, 2003. — 800 с. П. 6.1.3. ISBN 5-224-04565-7
  • О. А. Добиаш-Рождественская, История письма в средние века, М.: Книга, 1987. (Книга о латинской палеографии.)
  • И. Фридрих, История письма, М.: Наука, 1979.
  • И. В. Ягич, Глаголическое письмо // Энциклопедия славянской филологии, вып. 3, Спб., 1911, стр. 51—262 и 36 листов снимков. [Существуют как минимум два современных репринта.]
  • B. A. van Groningen, Greek Palaeography, Leyden: A. W. Sijthoff’s Uitgeversmaatschappij N. V., 1955.

См. также

  • Trim (программирование)
  • Десятичный разделитель
  • Непечатаемые символы  (англ.)

Ссылки

  • Ростислав Чебыкин. Неразрывные участки текста
  • Всё (или почти всё) о пробеле (архив)
  Компьютерная клавиатура IBM/Windows (раскладка QWERTY / ЙЦУКЕН)  п·о·р 
Esc F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 F11 F12 PrtSc
SysRq
Scroll
Lock
Pause
Break

KB Eng-Rus QWERTY(ЙЦУКЕН).svg

Ins Home PgUp NumLk / *
Del End PgDn 7 8 9 +
4 5 6
1 2 3 Ent
0 ,

Любой символ в типографике, представляющий пробел

В компьютерном программировании, пробел — это любой символ или последовательность символов, которые представляют горизонтальный или вертикальный пробел в типографии. При визуализации пробельный символ не соответствует видимой метке, но обычно занимает область на странице. Например, общий символ пробела U + 0020 SPACE (также ASCII 32) представляет собой пробел знак пунктуации в тексте, используемый в качестве разделителя слов в западном языке. скрипты.

Содержание

  • 1 Обзор
  • 2 Определение и неоднозначность
    • 2.1 Unicode
      • 2.1.1 Заменители
      • 2.1.2 Непробельные пробелы
  • 3 Пробелы и цифровая типографика
    • 3.1 Экранное меню
    • 3.2 Универсальное пространство переменной ширины
    • 3.3 Волосы вокруг тире
    • 3.4 Форматирование значений величин
  • 4 Вычислительные приложения
    • 4.1 Языки программирования
    • 4.2 Пользовательские интерфейсы командной строки
    • 4.3 Языки разметки
    • 4.4 Имена файлов
  • 5 См. Также
  • 6 Ссылки
  • 7 Внешние ссылки

Обзор

Относительная ширина различных пробелов в Unicode

Во многих раскладках клавиатуры горизонтальный пробельный символ можно ввести с помощью пробела. Горизонтальный пробел также можно ввести на многих клавиатурах с помощью клавиши Tab ↹, хотя длина пробела может варьироваться. Вертикальные пробелы немного более разнообразны в том, как они кодируются, но наиболее очевидным при вводе является результат ↵ Enter, который создает последовательность кода «новой строки» в прикладных программах. Старые клавиатуры вместо этого могли бы сказать Return, сокращая клавиатуру пишущей машинки, означающую «возврат каретки», которая генерировала электромеханический возврат к левому упору (код CR в ASCII- hex 0D;) перевод строки или переход к следующей строке (код LF в шестнадцатеричном формате ASCII 0A;); в некоторых приложениях они независимо использовались для рисования дисплеев на основе текстовых ячеек на мониторах или для печати на управляемых трактором принтерах, которые также могли содержать последовательности кодов обратного движения / позиционирования, позволяющие устройствам вывода на основе текста обеспечивать более сложный вывод. Многие ранние компьютерные игры использовали такие коды для рисования экрана (например, Kingdom of Kroz ), а программное обеспечение для обработки текстов использовало бы их для создания печатных эффектов, таких как полужирный шрифт, подчеркивание и зачеркивание.

Термин «пробел» основан на появлении на обычной бумаге. Однако они закодированы внутри приложения, пробелы могут обрабатываться так же, как и любой другой код символа, и программы могут выполнять правильные действия, определенные для контекста, в котором они возникают.

Определение и неоднозначность

Наиболее распространенные символы пробела можно ввести с помощью клавиши пробела или клавиши табуляции. В зависимости от контекста разрыв строки, сгенерированный клавишей возврата или ввода, также может считаться пробелом.

Unicode

В таблице ниже перечислены двадцать пять символов, определенных как символы пробела («WSpace = Y», «WS») в базе данных символов Unicode. Семнадцать используют определение пробелов, согласованное с алгоритмом для двунаправленной записи («Тип двунаправленного символа = WS»), и известны как символы «Bidi-WS». Остальные символы также могут быть использованы, но они не относятся к типу «Bidi».

Примечание. В зависимости от браузера и шрифтов, используемых для просмотра следующей таблицы, не все пробелы могут отображаться правильно.

  • v
  • t

Символы Юникода со свойством White_Space

Имя Кодовая точка Ширина поля Может нарушаться ? В. IDN ? Скрипт Блок Общие. категория Примечания
табуляция символов U + 0009 9 Да Нет Обычная Базовая Latin Other,. control HT, Horizontal Tab. HTML / XML именованный объект : , LaTeX : ‘ tab’
перевод строки U + 000A 10 Является разрывом строки Обычная Базовая латиница Другое,. control LF, Перевод строки. Именованный объект HTML / XML:
табуляция строк U + 000B 11 Разрыв строки Обычная Базовая латиница Другое,. управление VT, Вертикальная табуляция
подача формы U + 000C 12 Есть перенос строки Обычный Basic Latin Other,. control FF, Form Feed
возврат каретки U + 000D 13 Разрыв строки Обычная Базовая латиница Другое,. control CR, Возврат каретки
пробел U + 0020 32 Да Нет Обычная Базовая латиница Разделитель,. пробел Самый распространенный (нормальный пробел ASCII)
следующая строка U + 0085 133 Это разрыв строки Обычный Латинский 1. Дополнение Другое,. control NEL, Следующая строка
без перерыва U + 00A0 160 No Нет Common Latin-1. Дополнение Разделитель,. пробел Не- Разрыв пробела : идентично U + 0020, но не точка, в которой линия может быть разорвана. Именованный объект HTML / XML: , LaTeX: »
огамовый пробел U + 1680 5760 Да Нет Огам Огам Разделитель,. пробел Используется для разделения слов в Огам текст. Обычно это вертикальная линия в вертикальном тексте или горизонтальная линия в горизонтальном тексте, но также может быть пустым пространством в шрифтах без основы. Требуется шрифт Oham.
en quad U + 2000 8192 Да Нет Обычный Общий. Пунктуация Разделитель,. пробел Ширина единицы en. U + 2002 канонически эквивалентен этому персонажу; U + 2002 предпочтительнее.
em quad U + 2001 8193 Да Нет Обычное Общее. Пунктуация Разделитель,. пробел Также известен как «баранья четверка». Ширина один em. U + 2003 канонически эквивалентен этому персонажу; U + 2003 предпочтительнее.
en пробел U + 2002 8194 Да Нет Обычное Общее. Пунктуация Разделитель,. пробел Также известен как «орех». Ширина одного en. U + 2000 En Quad канонически эквивалентен этому персонажу; U + 2002 предпочтительнее. Именованный объект HTML / XML: , LaTeX: ‘ enspace’
em пробел U + 2003 8195 Да Нет Обычное Общее. Пунктуация Разделитель,. пробел Также известен как «баранина». Ширина один em. U + 2001 Em Quad канонически эквивалентен этому персонажу; U + 2003 предпочтительнее. Именованная сущность HTML / XML: , LaTeX: ‘ quad’
пробел из трех символов U + 2004 8196 Да Нет Обычное Общее. Пунктуация Разделитель,. пробел Также известен как «толстое пространство». Одна треть em шириной. Именованный объект HTML / XML:
пробел с четырьмя точками U + 2005 8197 Да Нет Обычный Общий. Пунктуация Разделитель,. пробел Также известен как «средний промежуток». Одна четверть em шириной. Именованная сущность HTML / XML:
пробел из шести символов U + 2006 8198 Да Нет Обычный Общий. Пунктуация Разделитель,. пробел Ширина в одну шестую em. В компьютерной типографике иногда приравнивается к U + 2009.
расстояние между цифрами U + 2007 8199 No Нет Обычное Общее. Пунктуация Разделитель,. пробел Пробел. В шрифтах с моноширинными цифрами, равными ширине одной цифры. Именованный объект HTML / XML:
пробел U + 2008 8200 Да Нет Обычный Общие. Пунктуация Разделитель,. пробел По ширине, равной узкой пунктуации в шрифте, т. Е. Продвинутой ширине точки или запятой. Именованный объект HTML / XML:
тонкий пробел U + 2009 8201 Да Нет Обычный Общие. Пунктуация Разделитель,. пробел Тонкий пробел ; одна пятая (иногда одна шестая) ширины em. Рекомендуется использовать в качестве разделителя тысяч для измерений, выполненных с использованием единиц СИ. В отличие от U + 2002 — U + 2008, его ширина может регулироваться при наборе. Именованный объект HTML / XML: ; LaTeX: ‘,’
пространство для волос U + 200A 8202 Да Нет Обычное Общие. Пунктуация Разделитель,. пробел Тоньше, чем тонкий пробел. Именованный объект HTML / XML: (не работает во всех браузерах)
разделитель строк U + 2028 8232 Это строка -break Common General. Знаки пунктуации Разделитель,. строка
разделитель абзацев U + 2029 8233 Является разрывом строки Обычное Общее. Пунктуация Разделитель,. абзац
узкий нет- пробел U + 202F 8239 No Нет Обычный Общий. Пунктуация Разделитель,. пробел Узкий непрерывный пробел. По функциям аналогичен U + 00A0 No-Break Space. При использовании с монгольским языком его ширина обычно составляет треть нормального пространства; в другом контексте его ширина иногда напоминает ширину тонкого пространства (U + 2009).
средний математический интервал U + 205F 8287 Да Нет Обычный Общий. Пунктуация Разделитель,. пробел MMSP. Используется в математических формулах. Четыре восемнадцатые эм. В математической типографике ширина пробелов обычно указывается в целых числах, кратных восемнадцатой em, и 4/18 em может использоваться в нескольких ситуациях, например между a и + и между + и b в выражении a + b . Именованный объект HTML / XML:
идеографическое пространство U + 3000 12288 Да Нет Обычное Символы CJK. и. Пунктуация Разделитель,. пробел По ширине, равной символьной ячейке CJK (полная ширина ). Используется, например, в tai tou.
  • v
  • t

Связанные символы Unicode без свойства White_Space

Имя Кодовая точка Поле ширины Может нарушать ? В. IDN ? Скрипт Блок Общие. категория Примечания
монгольский разделитель гласных U + 180E 6158 Да Нет Монгольский Монгольский Другой,. Формат MVS. Символ с узким пространством, используемый в монгольском языке, чтобы последние два символа слова принимали разные формы. Он больше не классифицируется как пробел (то есть в категории Zs) в Unicode 6.3.0, хотя это было в предыдущих версиях стандарта.
пробел нулевой ширины U + 200B 8203 Да Нет ? Общее. Пунктуация Другое,. Формат ZWSP, пробел нулевой ширины. Используется для обозначения границ слов для систем обработки текста при использовании скриптов, не использующих явный интервал. Он похож на мягкий дефис , с той разницей, что последний используется для обозначения границ слога и должен отображать видимый дефис, когда на нем прерывается строка. HTML / XML именованный объект :
без объединения с нулевой шириной U + 200C 8204 Да Контекстно-зависимый ? Общий. Пунктуация Другой,. Формат ZWNJ, без объединения. При размещении между двумя символами, которые в противном случае были бы связаны, ZWNJ заставляет их печатать в их окончательной и исходной формах соответственно. Именованный объект HTML / XML:
объединитель нулевой ширины U + 200D 8205 Да Контекстно-зависимый ? Общие. Пунктуация Другое,. Формат ZWJ, объединитель нулевой ширины. При размещении между двумя символами, которые в противном случае не были бы связаны, ZWJ заставляет их печатать в связанных формах. Также может использоваться для изолированного отображения объединяемых форм. В зависимости от того, ожидается ли по умолчанию лигатура или конъюнкт, может либо вызвать (как в эмодзи и в сингальском ) или подавить (как в Деванагари ) замену с помощью одиночный глиф, при этом разрешая использование индивидуальных форм соединения (в отличие от ZWNJ). Именованный объект HTML / XML:
объединитель слов U + 2060 8288 No Нет ? Общее. Пунктуация Другое,. Формат WJ, объединитель слов. Подобно U + 200B, но не точка, в которой линия может быть прервана. Именованный объект HTML / XML:
неразрывный пробел нулевой ширины U + FEFF 65279  No Нет ? Арабский. Презентация. Forms-B Другое,. Формат Неразрывный пробел нулевой ширины. Используется в основном как метка порядка байтов. Использование в качестве индикатора неразрывности считается устаревшим с Unicode 3.2; см. вместо этого U + 2060.

Заменители

Unicode также предоставляет некоторые видимые символы, которые могут использоваться для представления различных пробельных символов в контекстах, где должен отображаться видимый символ:

Символы Unicode, иллюстрирующие пробелы (видимые)

Код Десятичный Имя Блок Дисплей Описание
U+00B7 183 Средний точка Приложение Latin-1 · Interpunct. Именованный объект: ·
U+21A1 8609 Две головы вниз стрелка Стрелки ECMA-17 / ISO 2047 символ для подачи страницы (разрыв страницы)
U + 2261 8810 Идентичен математическим. операторам Среди прочего, символ ECMA-17 / ISO 2047 для перевода строки
U + 237D 9085 Открытая коробка с заплечиком Разное техническое Используется для обозначения NBSP
U+23CE 9166 Символ возврата Разное Техническое Символ для клавиши возврата, которая вводит все перерыв
U+2409 9225 Символ для горизонтальной табуляции Контрольные изображения Заменяет символ табуляции
U + 240A 9226 Символ перевода строки Контрольные изображения Заменяет перевод строки
U+240B 9227 Символ для вертикальной табуляции Контрольные изображения Заменяет вертикальную табуляцию (линейная табуляция)
U+240C 9228 Символ для подачи страницы Контрольные изображения Заменяет подачу формы (разрыв страницы)
U+240D 9229 Символ возврата каретки Контрольные изображения Заменяет символ возврата каретки
U+2420 9248 Символ пробела Контрольные изображения Заменяет пробел ASCII
U + 2422 9250 Пустой символ Контрольные изображения , также известные как «замещающий пробел», используются в BCDIC, EBCDIC, ASCII-1963 и т. Д. как символ для разделителя слов
U + 2423 9251 Открыть окно Контрольные изображения Используется в блок-букве почерк, по крайней мере, с 1980-х годов, когда необходимо явно указывать количество пробелов (например, при программировании ручкой и бумагой). Используется в учебнике (опубликованном Springer-Verlag в 1982, 1984, 1985, 1988 годах) по Modula-2, языку программирования, где пространственные коды требуют явного указания. Также используется в клавиатуре графических калькуляторов Texas Instruments серии TI-8x или .. Именованный объект:
U + 2424 9252 Символ новой строки Контрольные изображения Заменяет разрыв строки
U+25B3 9651 Белый вверх- указывающий треугольник Геометрические фигуры Среди прочего, это символ ECMA-17 / ISO 2047 для пространства ASCII
U + 2A5B 10843 Логический Или со средним стержнем Дополнительные. Математические. Операторы Среди прочего, это символ ECMA-17 / ISO 2047 для вертикальной табуляции (линейная табуляция)
U + 2AAA 10922 Меньше, чем Дополнительные. Математические. Операторы Среди других применений — символ ECMA-17 / ISO 2047 для возврата каретки
U + 2AAB 10923 Больше, чем Дополнительные. Математические. Операторы Среди прочего, это символ ECMA-17 / ISO 2047 для символ табуляции
  1. ^Над нулем «0» o r отрицательная клавиша «(-)».
Exact space
  • Cambridge Z88 предоставил специальное «точное пространство» (кодовая точка 160, известное как 0xA0) (вызываемое сочетанием клавиш +SPACE,), отображаемое как «…» драйвером дисплея операционной системы. Поэтому в сочетании с BBC BASIC.
  • он также был известен как «точечный пробел». Под кодовой точкой 224 (0xE0) компьютер также предоставил специальный символ ПРОБЕЛА размером в три символа «SPC»(аналог U + 2420 для одной ячейки в Юникоде).

Пробелы без пробелов

  • Шаблоны Брайля Блок Unicode содержит U + 2800 ⠀ БРАЙЛЬНЫЙ ШАБЛОН ПУСТО (HTML ), шаблон Брайля без выпуклых точек. Некоторые шрифты отображают символ как пробел фиксированной ширины, однако в стандарте Unicode явно указано, что он не действует как пробел.
  • Unicode включает символ Hangul Filler в Блок Jamo совместимости с хангылом (U + 3164 ㅤ HANGUL FILLER (HTML )). Это классифицируется как буква, но отображается как пустое место, как блок хангыль, не содержащий джамо. Он используется в KS X 1001 комбинирующих последовательностях хангыль, но не в системе комбинирования джамо Unicode.
  • Кроме того, Halfwidth Hangul Filler включен в Формы полуширины и полной ширины (U + FFA0 ᅠ HANGUL FILLER HALFWIDTH (HTML )), которые используются при отображении кодировок, которые включают символы из Johab (или Wansung ) и N-байтный хангыль (или его EBCDIC аналог), например IBM-933, который включает как заполнители Johab, так и EBCDIC.

Пробелы и цифровая типографика

Отображение на экране

, текстовые процессоры и настольные издательские программы различаются тем, как они представляют пробелы на экране и как они представляют пробелы на концах строк длиннее экрана или ширины столбца. В некоторых случаях пробелы отображаются просто как пробелы; в других случаях они могут быть представлены интерпунктом или другими символами. Многие разные символы (описанные ниже) могут использоваться для создания пробелов, а несимвольные функции (такие как поля и настройки табуляции) также могут влиять на пробелы.

Пространство общего назначения переменной ширины

В компьютерных кодировках символов существует нормальное пространство общего назначения (символ Юникода U + 0020) ширина которого будет варьироваться в зависимости от дизайна шрифта. Типичные значения варьируются от 1/5 em до 1/3 em (в цифровой типографике em равно номинальному размеру шрифта, поэтому для шрифта размером 10 пунктов пробел, вероятно, будет между 2 и 3,3 балла). Сложные шрифты могут иметь пробелы разного размера для полужирного, курсивного и маленького начертания, и часто составители вручную регулируют ширину пространства в зависимости от размера и заметности текста.

В дополнение к этому пространству общего назначения можно кодировать пространство определенной ширины. См. Полный список в таблице ниже.

Пробелы вокруг тире

Длинные тире, используемые в качестве разделителей в скобках, и en тире, когда используются в качестве соединителей слов, обычно устанавливаются непрерывно с текстом. Однако такое тире необязательно может быть окружено пространством для волос, U + 200A или тонким пространством, U + 2009. Пространство для волос можно записать в HTML с помощью ссылок на числовые символы или или именованного объекта , но это не поддерживается повсеместно. в браузерах пока нет, по состоянию на 2016 год. Тонкое пространство называется entity , а числовые ссылки или . Эти пробелы намного тоньше, чем нормальные (за исключением моноширинного (непропорционального) шрифта ), причем пространство для волос является более тонким из двух.

Нормальное пространство по сравнению с волосами и тонкими промежутками (как отображается в вашем браузере)

Обычное пространство с длинным тире слева — справа
Тонкое пространство с длинным тире слева — right
Пробел с длинным тире left-right
Без пробела с длинным тире left-right

Форматирование значений величин

Международная система единиц (СИ) предписывает вставку пробела между числом и единицей измерения , а также между единицами измерения в составных единицах. Тонкое пространство следует использовать как разделитель тысяч. См. символы и числа единиц.

Вычислительные приложения

Языки программирования

В синтаксисе языка программирования для явного разделения токенов часто используются пробелы. В большинстве языков несколько символов пробела обрабатываются так же, как один символ пробела (вне строк в кавычках); такие языки называются свободной формой. В некоторых языках, включая Haskell, occam, ABC и Python, пробелы и отступы используются для синтаксических целей. В сатирическом языке, называемом Пробел, символы пробела являются единственными допустимыми символами для программирования, в то время как любые другие символы игнорируются.

Чрезмерное использование пробелов, особенно конечных пробелов в конце строк, считается неприятностью. Однако правильное использование пробелов может облегчить чтение кода и помочь логике группировки.

Большинство языков распознают только символы ASCII как пробелы или, в некоторых случаях, символы новой строки Unicode, но не большинство перечисленных выше символов. В языке C пробельные символы определяются как «пробел, горизонтальная табуляция, новая строка, вертикальная табуляция и перевод страницы». Сетевой протокол HTTP требует использования разных типов пробелов в разных частях протокола, например: только пробел в строке status, CRLF в конце строки и «линейные пробелы» в значениях заголовков.

Пользовательские интерфейсы командной строки

В командах, обрабатываемых командными процессорами, например, в сценариях и при вводе, символ пробела может вызвать проблемы, поскольку он имеет две возможные функции: как часть команды или параметра или как параметр или имя разделитель. Двусмысленность можно предотвратить, запретив встроенные пробелы или заключив имя со встроенными пробелами между кавычками.

Языки разметки

Некоторые языки разметки, такие как SGML, сохраняют пробелы в том виде, в котором они написаны.

Языки веб-разметки, такие как XML и HTML, специально обрабатывают пробельные символы, включая пробелы, для удобства программистов. Один или несколько пробелов, считываемых соответствующими процессорами времени отображения этих языков разметки, сжимаются до 0 или 1 пробела, в зависимости от их семантического контекста. Например, двойные (или более) пробелы в тексте сжимаются до единственного пробела, а пробелы, которые появляются по обе стороны от «=», отделяющего имя атрибута от его значения, не влияют на интерпретацию документа. Конечные теги элементов могут содержать завершающие пробелы, а теги пустых элементов в XML могут содержать пробелы перед «/>». В этих языках ненужные пробелы увеличивают размер файла, что может замедлить передачу данных по сети. С другой стороны, ненужные пробелы также могут незаметно пометить код, похожий, но менее очевидный, чем комментарии в коде. Это может быть желательно для доказательства нарушения лицензии или авторских прав, которое было совершено путем копирования и вставки.

В значениях атрибутов XML последовательности пробельных символов обрабатываются как один пробел, когда документ читается парсером. Таким образом, синтаксический анализатор не изменяет пробелы в содержимом элемента XML, но приложение, получающее информацию от анализатора, может применить аналогичные правила к содержимому элемента. Автор XML-документа может использовать атрибут xml: space = "preserve"в элементе, чтобы дать синтаксическому анализатору команду препятствовать последующему приложению изменять пробелы в содержимом этого элемента.

В большинстве HTML-элементов последовательность символов пробела рассматривается как один разделитель между словами, который может проявляться как один символ пробела при отображении текста на языке, который обычно вставляет такие пробел между словами. Соответствующие средства визуализации HTML должны применять более буквальную обработку пробелов в нескольких предписанных элементах, таких как тег preи любой элемент, для которого CSS был использован для применения pre-подобная обработка пробелов. В таких элементах пробелы не будут «сворачиваться» в разделители между словами.

Как в XML, так и в HTML, символ неразрывного пробела вместе с другими нестандартными пробелами не рассматривается как сворачиваемый «пробел», поэтому на него не распространяется правила выше.

Имена файлов

Такое использование аналогично многословным именам файлов, написанным для операционных систем и приложений, которые запутываются встроенными кодами пробелов — в таких именах файлов вместо этого используется символ подчеркивания ( _) как разделитель слов, as_in_this_phrase.

Другим таким символом был U + 2422 ␢ ПУСТОЙ СИМВОЛ. Это использовалось в первые годы компьютерного программирования при написании кодовых форм. Keypunch Операторы сразу распознали символ как «явный пробел». Он использовался в BCDIC, EBCDIC и ASCII-1963.

См. Также

  • Возврат каретки
  • Em (типографика)
  • En (типографика)
  • Подача формы
  • Стиль отступа
  • Перенос строки
  • Новая строка
  • Стиль программирования
  • Знаки азбуки Морзе
  • Регулярное выражение # Классы символов для класса символов пробела.
  • Пробел
  • Пробел (пунктуация)
  • Клавиша табуляции
  • Обрезка (компьютерное программирование)
  • Пробел (язык программирования)
  • Пробел нулевой ширины

Ссылки

Внешние ссылки

  • Список свойств базы данных символов Юникода
Пробел
 
  ! » # $

Характеристики

space

Юникод

U+0020

HTML-код

 или 

UTF-16

0x20

%20

Пробе́л — интервал между буквами, обозначающий границы слов во многих системах письменности. Функционально пробел принадлежит к знакам препинания.

ГОСТ[1] определяет пробел следующим образом: «литера, воспроизводимая отсутствием начертания».

Пробел — сравнительно позднее изобретение. В финикийском и первоначальных вариантах древнееврейского и арамейского письма пробел не использовался. В греческом письме он используется более тысячи лет. В латыни пробел иногда встречался в древности, потом исчезал и вернулся тоже около тысячи лет назад. В древнейших славянских памятниках пробел также отсутствует (как в глаголице, так и в кириллице); регулярно и в нынешнем смысле используется в кириллице только с XVII века. В арабском письме практически не использовался до XX века. В современном китайском и японском языках пробел также может не использоваться.

Для указания словораздела в письменностях, не имеющих или редко использующих пробелы, применялись и применяются различные приемы, например:

  • особые формы букв для начала и (или) конца слова;
  • использование диакритических знаков, ставящихся при первой и (или) последней букве слов, либо добавление к началу (концу) слова особых непроизносимых букв;
  • разделение слов вместо пробелов другими знаками (чаще всего точкой или двоеточием, иногда вертикальной чертой и т. п.);
  • слитное начертание знаков, входящих в одно слово, либо обозначение принадлежности знаков к слову графически (например, чертой).

В старинных письменностях пробелами (или иным способом разделения) могли отделяться не отдельные слова, а более крупные единицы текста (словосочетания) или более мелкие (слоги). Во вьетнамской письменности пробел разделяет слоги и сейчас.

Слитное и раздельное написание сочетаний полнозначных слов со служебными элементами (предлогами, частицами и т. п.) представляет собой одну из самых сложных для учащихся и нестабильную часть орфографии многих языков, в том числе и русского.

Содержание

  • 1 Обычный пробел
    • 1.1 Правила постановки пробела рядом со знаками препинания в русском языке
    • 1.2 Применение в типографике других стран
  • 2 Пробел между предложениями
  • 3 Неразрывный пробел
  • 4 Другие пробелы в Юникоде
  • 5 Пробел при типографском наборе
  • 6 См. также
  • 7 Примечания
  • 8 Литература
  • 9 Ссылки

Обычный пробел

Выглядит Юникод HTML
Название Код Десятичное Шестнадцатеричное
« » SPACE U+0020

Правила постановки пробела рядом со знаками препинания в русском языке

В русскоязычном наборе пробел ставится:

  • после запятой, точки (в том числе и обозначающей сокращения и инициалы), точки с запятой, двоеточия, вопросительного и восклицательного знака, многоточия (кроме многоточий, начинающих предложение);
  • перед многоточием, стоящим в начале предложения (если этим предложением не начинается абзац);
  • с внешней стороны скобок и кавычек;
  • с обеих сторон тире, за исключением тире между цифровыми обозначениями неотрицательных целых чисел (по типографским правилам, вокруг тире ставятся не обычные пробелы, а укороченные (двухпунктовые), но из-за ограничений стандартных раскладок клавиатуры, на которых нет укороченных пробелов, часто ставят полные пробелы: неразрывный слева и обычный справа).

Однако пробел не ставится:

  • в печатных изданиях после запятых и точек, стоящих в конце выражений, заключенных в скобки ввиду особого форматирования текста[прояснить];
  • перед запятой, точкой, точкой с запятой, двоеточием, вопросительным и восклицательным знаками, многоточием (кроме многоточия, стоящего в начале предложения);
  • после многоточия, стоящего в начале предложения;
  • с внутренней стороны скобок и кавычек;
  • с обеих сторон дефиса (за исключением односторонних дефисов, то есть случаев вроде «одно- и двухэтажный») и апострофа.

В случае одновременной применимости обоих вышеприведённых правил (например, если точка стоит перед закрывающей скобкой, или перед запятой) пробел не ставится.

В некоторых руководствах по типографскому набору также указывается, что пробел не ставится, если тире следует за точкой или запятой, но при работе с большинством современных шрифтов этот совет скорее вреден[источник не указан 1963 дня].

В случае, когда двоеточие используется в качестве знака деления, оно отбивается с обеих сторон полукегельными шпациями.

Применение в типографике других стран

В американской типографике (в отличие от британской и австралийской) пробел не ставится до и после длинного тире (как во фразе «A dash indicates a sudden break in thought—a parenthetical statement like this one—or an open range», где длинные тире выделяют вставную конструкцию[2][3]).

Во французской типографике после открывающей кавычки и перед закрывающей ставится ¼ М-пробела (пример: « Son explication n’est qu’un mensonge », s’indigna le député.)

Пробел между предложениями

Пробел между предложениями (англ.)русск.) — горизонтальное расстояние между соседними предложениями в печатном тексте. В разные периоды со времени изобретения наборного шрифта использовались пробелы различной длины по отношению к пробелам между словами — обычный, полуторный, двойной[4]. Длина пробела между предложениями также могла меняться в заданном интервале для возможности выравнивания текста по ширине страницы или для избежания появления коридоров.

Появление печатных машинок в конце XIX-го столетия привело к появлению двух чётко обособленных стилей разделения предложений — английского, при котором между предложениями используется двойной пробел, и французского, предполагающего использование одинарного.[5] К середине XX-го столетия французский стиль стал преобладать и превратился в стандарт де факто после появления компьютеров.

Неразрывный пробел

Неразрывный пробел — символ, отображающийся внутри строки подобно обычному пробелу, но не позволяющий программам отображения и печати разорвать в этом месте строку. Используется для автоматизации вёрстки, правила которой предписывают избегать разрыва строк в известных случаях (большей частью для удобочитаемости), например, между инициалами и фамилией. Во многих программах неразрывный пробел отличается от обычного также тем, что не изменяет размер при разгоне строки по ширине. В Юникоде имеет шестнадцатеричный код U+00A0.

Другие пробелы в Юникоде

Название
в Юникоде
Код в Юникоде Выглядит Мнемоника
в HTML 4
Пояснения
шестнадцатеричный десятичный
EN QUAD 2000 8192 « » канонически эквивалентен символу U+2002 EN SPACE[6]
EM QUAD 2001 8193 « » канонически эквивалентен символу U+2003 EM SPACE[6]
EN SPACE 2002 8194 « » &ensp; равен половине кегля шрифта (исторически происходит от ширины заглавной буквы «N»)
EM SPACE 2003 8195 « » &emsp; равен кеглю шрифта (исторически происходит от ширины заглавной буквы «M»)
THREE-PER-EM SPACE 2004 8196 « » ближе всех к обычному пробелу, втрое меньше, чем EM-SPACE
FOUR-PER-EM SPACE 2005 8197 « » в четыре раза меньше, чем EM-SPACE
SIX-PER-EM SPACE 2006 8198 « » в шесть раз меньше, чем EM-SPACE
FIGURE SPACE 2007 8199 « » имеет такую же ширину, что и цифры в данном шрифте, и предназначен для набора таблиц. Неразрывный.
PUNCTUATION SPACE 2008 8200 « » ширина равна ширине точки
THIN SPACE 2009 8201 « » &thinsp; обычно имеет ширину в 15 (реже — в 16) кегля. По пропорциям соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов.
HAIR SPACE 200A 8202 « » самый узкий пробел, соответствует самой тонкой шпации в кассе наборщика
ZERO-WIDTH SPACE 200B 8203 «​» показывает места, в которых можно разрывать строку, не добавляя знак переноса; ширина его нулевая. Применяется в языках, в которых пробелов нет. При выравнивании текста по ширине может расширяться, как и любой другой пробел.
NARROW NO-BREAK SPACE 202F 8239 « » узкий неразрывный пробел
MEDIUM MATHEMATICAL SPACE 205F 8287 « » узкий пробел, применяемый в математических формулах
WORD JOINER 2060 8288 «⁠» аналогичен ZERO-WIDTH SPACE, но неразрывный
IDEOGRAPHIC SPACE 3000 12288 « » используется в восточных языках, равняется ширине одного иероглифа. См. CJK

Пробел при типографском наборе

При типографском наборе пробелы между словами не имели фиксированной ширины. Для книжных изданий традиционно применяются приведённые ниже правила.

Без шпаций набираются такие комбинации:

  • знак препинания и предшествующий текст;
  • многоточие в начале предложения и последующий текст;
  • тире после точки или запятой;
  • тире между границами промежутка, включая границы, описываемые словами (например, «5—8 лет», «три—семь дней»[источник не указан 1496 дней] или «поезд Москва—Берлин»);
  • тире между фамилиями авторов результата (например, «метод Гаусса—Зейделя»);
  • точка или запятая перед знаком сноски;
  • кавычки или скобки и заключенный в них текст;
  • кавычки или скобки и знаки препинания;
  • двойные знаки номера и параграфа;
  • число перед знаком процента или промилле;
  • число перед знаком градуса, минуты, секунды или терции;
  • дефис и смежные элементы;
  • буквенно-цифровые обозначения.

С 2-пунктовыми шпациями набираются такие комбинации:

  • тире и смежные элементы (кроме случаев, указанных выше);
  • слово перед знаком сноски;
  • знак градуса, минуты, секунды или терции перед числом или буквой, обозначающей шкалу, за исключением изолированного употребления (0° C, но °C)[7];
  • классы цифр в многозначных числах.

С 3-пунктовыми шпациями набираются такие комбинации:

  • числа после знака номера или параграфа, если они разделены запятыми;
  • части сокращения с точкой («и т. д.»).

С полукегельными шпациями такие комбинации:

  • знак номера или параграфа перед числом;
  • числа после знака номера или параграфа, если они не разделены запятыми;
  • число и относящееся к нему слово;
  • части сокращения без точки («и т. д.»);
  • инициалы и фамилия.

Запрещается перенос таких комбинаций:

  • диапазон (числа, соединённые тире);
  • сокращения, подобные «и т. д.»;
  • фамилия и инициалы;
  • число и относящееся к нему слово;
  • знак номера или параграфа и число;
  • обозначение пункта списка и последующий текст.

В связи с ограниченностью возможностей компьютерных программ[8] и стандартной клавиатуры и различиями в традициях типографского набора разных стран в компьютерном наборе de facto используются упрощённые правила. При этом для предотвращения переноса текста зачастую используется «неразры́вный» пробел[9].

В текстах, предназначенных для набора с бумаги и требующих особой точности при наборе (например, в текстах компьютерных программ), место пробела иногда обозначается знаком ␢ (от англ. blank, U+2422 BLANK SYMBOL) или ␣ (U+2423 OPEN BOX).

См. также

  • Trim — часто используемое в программировании название для функции, удаляющей пробелы в начале и/или конце строк
  • Десятичный разделитель
  • Управляющие символы

Примечания

  1. ГОСТ 19781-90. Единая система программной документации. Обеспечение систем обработки информации программное.
  2. Вставная конструкция. // Энциклопедия русского языка.
  3. 85. Вставные конструкции // Валгина Н. С. Синтаксис современного русского языка. Учебник. — Московский государственный университет печати.
  4. Речь идёт в первую очередь о текстах, использующих латиницу, а не кириллицу.
  5. Imprimerie nationale (1993). Lexique des règles typographiques en usage à l’Imprimerie nationale (фр.)
  6. 1 2 Unicode Consortium. The Unicode Standard, Version 7: General Punctuation, Range 2000–206F. Проверено 21 ноября 2014.
  7. Гиленсон П. Г. Справочник художественного и технического редакторов. — М. : Книга, 1988. — 528 с.
  8. В настоящее время практически все издательские и офисные программы имеют поддержку Unicode, за счёт которой ограничения снимаются.
  9. Современные издательские программы имеют встроенные средства автоматизации, и на их основе существуют готовые решения, позволяющие без существенных затрат труда и времени расставлять в наборе пробелы, предусмотренные полной версией правил.

Литература

  • Мильчин А. Э., Чельцова Л. К. Справочник издателя и автора. Редакционно-издательское оформление издания. — 2-е изд., испр. и доп. — М. : ОЛМА-Пресс, 2003. — Гл. 6.1.3. — ISBN 5-224-04565-7.
  • Добиаш-Рождественская О. А. История письма в средние века. — М. : Книга, 1987. (Книга о латинской палеографии.)
  • Фридрих И. История письма. — М. : Наука, 1979.
  • Глаголическое письмо // Энциклопедия славянской филологии. Вып. 3 / под ред. И. В. Ягича. — Санкт-Петербург, 1911. — С. 51—262 и 36 листов снимков. (Существуют как минимум два современных репринта.)
  • Groningen, B. A. van. Short manual of Greek Palaeography. — Leyden : A. W. Sijthoff’s Uitgeversmaatschappij N. V., 1955.

Ссылки

  • Ростислав Чебыкин. Неразрывные участки текста  (недоступная ссылка с 27-06-2018 [121 день]).
  • Всё (или почти всё) о пробеле.

Понравилась статья? Поделить с друзьями:
  • Как пишется знак подобны
  • Как пишется злоупотребить
  • Как пишется знак подобности
  • Как пишется злостный нарушитель
  • Как пишется знак плюс минус