Пробел — Википедия

Пробел
 
  ! " # $
Характеристики
Название space
Юникод U+0020
HTML-код   или  
UTF-16 0x20
URL-код %20

Пробе́л — интервал между буквами, обозначающий границы слов во многих системах письменности. Пробел не относится к знакам препинания.

ГОСТ[1] определяет пробел следующим образом: «литера, воспроизводимая отсутствием начертания».

Пробел — сравнительно позднее изобретение. В финикийском и первоначальных вариантах древнееврейского и арамейского письма пробел не использовался. В греческом письме он используется более тысячи лет. В латыни пробел иногда встречался в древности, потом исчезал и вернулся тоже около тысячи лет назад. В древнейших славянских памятниках пробел также отсутствует (как в глаголице, так и в кириллице); регулярно и в нынешнем смысле используется в кириллице только с XVII века. В арабском письме практически не использовался до XX века. В современном китайском и японском языках пробел также может не использоваться.

Для указания словораздела в письменностях, не имеющих или редко использующих пробелы, применялись и применяются различные приёмы, например:

  • особые формы букв для начала и (или) конца слова;
  • использование диакритических знаков, ставящихся при первой и (или) последней букве слов, либо добавление к началу (концу) слова особых непроизносимых букв;
  • разделение слов вместо пробелов другими знаками (чаще всего точкой или двоеточием, иногда вертикальной чертой и т. п.);
  • слитное начертание знаков, входящих в одно слово, либо обозначение принадлежности знаков к слову графически (например, чертой).

В старинных письменностях пробелами (или иным способом разделения) могли отделяться не отдельные слова, а более крупные единицы текста (словосочетания) или более мелкие (слоги). Во вьетнамской письменности пробел разделяет слоги и сейчас.

Слитное и раздельное написание сочетаний полных слов со служебными элементами (предлогами, частицами и т. п.) представляет собой одну из самых сложных для учащихся и нестабильную часть орфографии многих языков, в том числе и русского.

Обычный пробел

[править | править код]
Выглядит Юникод HTML
Название Код Десятичное Шестнадцатеричное
« » SPACE U+0020    

В настоящее время принято считать, что пробел является печатным (графическим) символом, не имеющим графического представления. Тем не менее, в некоторых кодировках символов (например, телеграфном коде Бодо и производных от него кодах (ITA1, ITA2, МТК-2 и др.)) он относится к управляющим символам[a], а в некоторых других (например, стандарте ISO/IEC 646) считается и управляющим, и печатным одновременно. Такая же двойственная классификация пробела закреплена и в ГОСТ 27465-87 «Системы обработки информации. Символы. Классификация, наименование и обозначение».

Правила постановки пробела рядом со знаками препинания в русском языке

[править | править код]

В русскоязычном наборе пробел ставится:

  • после запятой, точки (в том числе и обозначающей сокращения и инициалы), точки с запятой, двоеточия, вопросительного и восклицательного знака, многоточия (кроме многоточий, начинающих предложение);
  • перед многоточием, стоящим в начале предложения (если этим предложением не начинается абзац);
  • с внешней стороны скобок и кавычек;
  • с обеих сторон тире, за исключением тире между цифровыми обозначениями неотрицательных целых чисел (по типографским правилам, вокруг тире ставятся не обычные пробелы, а укороченные (двухпунктовые), но из-за ограничений стандартных раскладок клавиатуры, на которых нет укороченных пробелов, часто ставят полные пробелы: неразрывный слева и обычный справа).

Однако пробел не ставится:

  • перед запятой, точкой, точкой с запятой, двоеточием, вопросительным и восклицательным знаками, многоточием (кроме многоточия, стоящего в начале предложения);
  • после многоточия, стоящего в начале предложения;
  • с внутренней стороны скобок и кавычек;
  • с обеих сторон дефиса (за исключением односторонних дефисов, то есть случаев вроде «одно- и двухэтажный») и апострофа.

В случае одновременной применимости обоих вышеприведённых правил (например, если точка стоит перед закрывающей скобкой, или перед запятой) пробел не ставится.

В некоторых руководствах по типографскому набору также указывается, что пробел не ставится, если тире следует за точкой или запятой, но при работе с большинством современных шрифтов этот совет скорее вреден[источник не указан 4211 дней].

В случае, когда двоеточие используется в качестве знака деления, оно отбивается с обеих сторон полукегельными шпациями.

Применение в типографике других стран

[править | править код]

В американской типографике (в отличие от британской и австралийской) пробел не ставится до и после длинного тире (как во фразе «A dash indicates a sudden break in thought—a parenthetical statement like this one—or an open range», где длинные тире выделяют вставную конструкцию[2][3]).

Во французской типографике после открывающей кавычки и перед закрывающей ставится ¼ М-пробела (пример: « Son explication n’est qu’un mensonge », s’indigna le député.)

Пробел между предложениями

[править | править код]

Пробел между предложениями[англ.] — горизонтальное расстояние между соседними предложениями в печатном тексте. В разные периоды со времени изобретения наборного шрифта использовались пробелы различной длины по отношению к пробелам между словами — обычный, полуторный, двойной[b]. Длина пробела между предложениями также могла меняться в заданном интервале для возможности выравнивания текста по ширине страницы или для избежания появления коридоров.

Появление печатных машинок в конце XIX века привело к появлению двух чётко обособленных стилей разделения предложений — английского, при котором между предложениями используется двойной пробел, и французского, предполагающего использование одинарного[4]. К середине XX века французский стиль стал преобладать и превратился в стандарт де факто после появления компьютеров.

Неразрывный пробел

[править | править код]

Неразрывный пробел — символ, отображающийся внутри строки подобно обычному пробелу, но не позволяющий программам отображения и печати разорвать в этом месте строку. Используется для автоматизации вёрстки, правила которой предписывают избегать разрыва строк в известных случаях (большей частью для удобочитаемости), например, между инициалами и фамилией. Во многих программах неразрывный пробел отличается от обычного также тем, что не изменяет размер при разгоне строки по ширине. В Юникоде имеет шестнадцатеричный код U+00A0.

Другие пробелы в Юникоде

[править | править код]
Название
в Юникоде
Код в Юникоде Выглядит Мнемоника
в HTML 4
Пояснения
шестнадцатеричный десятичный
EN QUAD 2000 8192 «» канонически эквивалентен символу U+2002 EN SPACE[5]
EM QUAD 2001 8193 «» канонически эквивалентен символу U+2003 EM SPACE[5]
EN SPACE 2002 8194 « »   равен половине кегля шрифта (исторически происходит от ширины заглавной буквы «N»)
EM SPACE 2003 8195 « »   равен кеглю шрифта (исторически происходит от ширины заглавной буквы «M»)
THREE-PER-EM SPACE 2004 8196 « » ближе всех к обычному пробелу, втрое меньше, чем EM-SPACE
FOUR-PER-EM SPACE 2005 8197 « » в четыре раза меньше, чем EM-SPACE
SIX-PER-EM SPACE 2006 8198 « » в шесть раз меньше, чем EM-SPACE
FIGURE SPACE 2007 8199 « » имеет такую же ширину, что и цифры в данном шрифте, и предназначен для набора таблиц. Неразрывный.
PUNCTUATION SPACE 2008 8200 « » ширина равна ширине точки
THIN SPACE 2009 8201 « »   обычно имеет ширину в 15 (реже — в 16) кегля. По пропорциям соответствует двухпунктовой шпации при наборе кеглем в 10 пунктов.
HAIR SPACE 200A 8202 « » самый узкий пробел, соответствует самой тонкой шпации в кассе наборщика
ZERO-WIDTH SPACE 200B 8203 «​» Пробел нулевой ширины показывает места, в которых можно разрывать строку, не добавляя знак переноса; ширина его нулевая. Применяется в языках, в которых пробелов нет. При выравнивании текста по ширине может расширяться, как и любой другой пробел.
NARROW NO-BREAK SPACE 202F 8239 « » узкий неразрывный пробел
MEDIUM MATHEMATICAL SPACE 205F 8287 « » узкий пробел, применяемый в математических формулах
WORD JOINER 2060 8288 «⁠» аналогичен ZERO-WIDTH SPACE, но неразрывный
IDEOGRAPHIC SPACE 3000 12288 « » используется в восточных языках, равняется ширине одного иероглифа. См. CJK

Пробел при типографском наборе

[править | править код]

При типографском наборе пробелы между словами не имели фиксированной ширины. Для книжных изданий традиционно применяются приведённые ниже правила.

Без шпаций набираются такие комбинации:

  • знак препинания и предшествующий текст;
  • многоточие в начале предложения и последующий текст;
  • тире после точки или запятой;
  • тире между границами промежутка, включая границы, описываемые словами (например, «5—8 лет», «три—семь дней»[источник не указан 3744 дня] или «поезд Москва—Берлин»);
  • тире между фамилиями авторов результата (например, «метод Гаусса—Зейделя»);
  • точка или запятая перед знаком сноски;
  • кавычки или скобки и заключённый в них текст;
  • кавычки или скобки и знаки препинания;
  • двойные знаки номера и параграфа;
  • число перед знаком градуса, минуты, секунды или терции;
  • дефис и смежные элементы;
  • буквенно-цифровые обозначения.

С 2-пунктовыми шпациями набираются такие комбинации:

  • тире и смежные элементы (кроме случаев, указанных выше);
  • слово перед знаком сноски;
  • классы цифр в многозначных числах.

С 3-пунктовыми шпациями набираются такие комбинации:

  • числа после знака номера или параграфа, если они разделены запятыми;
  • части сокращения с точкой («и т. д.»).

С полукегельными шпациями такие комбинации:

  • знак номера или параграфа перед числом;
  • числа после знака номера или параграфа, если они не разделены запятыми;
  • число и относящееся к нему слово;
  • части сокращения без точки («и т. д.»);
  • инициалы и фамилия.

Запрещается перенос таких комбинаций:

  • диапазон (числа, соединённые тире);
  • сокращения, подобные «и т. д.»;
  • фамилия и инициалы;
  • число и относящееся к нему слово;
  • знак номера или параграфа и число;
  • обозначение пункта списка и последующий текст.

Ранее пробел не ставился после числа перед знаком процента или промилле, а также перед знаком градуса Цельсия: (0 °C)[6]. С 2002 года в Российской Федерации ГОСТ 8.417—2002, а затем Постановление Правительства РФ от 31 октября 2009 г. № 879 «Об утверждении положения о единицах величин, допускаемых к применению в Российской Федерации» предписывают ставить пробел между числовым значением и обозначением единицы величины, за исключением обозначения единиц величин в виде знака, размещённого над строкой, перед которым пробел не ставится (например, величина плоского угла 30°; обозначение градуса Цельсия — °C, поэтому правильный вариант t = 20 °C)[7].

В связи с ограниченностью возможностей компьютерных программ[c] и стандартной клавиатуры и различиями в традициях типографского набора разных стран в компьютерном наборе de facto используются упрощённые правила. При этом для предотвращения переноса текста зачастую используется неразрывный пробел[d].

В текстах, предназначенных для набора с бумаги и требующих особой точности при наборе (например, в текстах компьютерных программ), место пробела иногда обозначается знаком ␢ (от англ. blank, U+2422 blank symbol) или (U+2423 open box).

Примечания

[править | править код]

Комментарии

[править | править код]
  1. Как символ форматирования, выполняющий функцию перемещения активной знаковой позиции (например, каретки печатающего устройства) на одну позицию вперёд.
  2. Речь идёт в первую очередь о текстах, использующих латиницу, а не кириллицу.
  3. В настоящее время практически все издательские и офисные программы имеют поддержку Юникода, за счёт которой ограничения снимаются.
  4. Современные издательские программы имеют встроенные средства автоматизации, и на их основе существуют готовые решения, позволяющие без существенных затрат труда и времени расставлять в наборе пробелы, предусмотренные полной версией правил.
  1. ГОСТ 19781-90. Единая система программной документации. Обеспечение систем обработки информации программное Архивная копия от 17 октября 2007 на Wayback Machine.
  2. Вставная конструкция. Архивная копия от 23 марта 2013 на Wayback Machine // Энциклопедия русского языка.
  3. 85. Вставные конструкции Архивная копия от 24 июля 2013 на Wayback Machine // Валгина Н. С. Синтаксис современного русского языка. Учебник. — Московский государственный университет печати.
  4. Imprimerie nationale (1993). Lexique des règles typographiques en usage à l’Imprimerie nationale (фр.).
  5. 1 2 Unicode Consortium. The Unicode Standard, Version 7: General Punctuation, Range 2000–206F. Дата обращения: 21 ноября 2014. Архивировано 17 сентября 2011 года.
  6. Гиленсон П. Г. Справочник художественного и технического редакторов. — М. : Книга, 1988. — 528 с.
  7. Постановление Правительства Российской Федерации от 31 октября 2009 г. № 879 «Об утверждении положения о единицах величин, допускаемых к применению в Российской Федерации» Архивная копия от 17 апреля 2021 на Wayback Machine.

Литература

[править | править код]
  • Мильчин А. Э., Чельцова Л. К. Справочник издателя и автора. Редакционно-издательское оформление издания. — 2-е изд., испр. и доп. — М. : ОЛМА-Пресс, 2003. — Гл. 6.1.3. — ISBN 5-224-04565-7.
  • Добиаш-Рождественская О. А. История письма в средние века. — М. : Книга, 1987. (Книга о латинской палеографии.)
  • Фридрих И. История письма. — М. : Наука, 1979.
  • Глаголическое письмо // Энциклопедия славянской филологии. Вып. 3 / под ред. И. В. Ягича. — Санкт-Петербург, 1911. — С. 51—262 и 36 листов снимков. (Существуют как минимум два современных репринта.)
  • Groningen, B. A. van. Short manual of Greek Palaeography. — Leyden : A. W. Sijthoff’s Uitgeversmaatschappij N. V., 1955.