БИТ ИЛИ НЕ БИТ

07-03-2010

«...я не очень представляю себе, что такое бит. Что-то такое, маленькое.»
В. Левашов

Много! Может быть даже... Тыщща!!
Из школьного фольклора

Одинаковое одинаковому рознь.
«Максим и Федор»
В. Шинкарев

Эта статья лишь отчасти является ответом на некоторые отклики, вызванные моей предыдущей публикацией «Литература и Информация». Наиболее существенное здесь – общее определение понятия «информация», которое, насколько мне известно, на русском языке в явном виде ещё нигде не приводилось, и к которому я пришёл в результате давнего интереса к этой проблеме. Вот оно:

Информация есть способность вызывать изменения.

Способность – свойство, допускающее количественную оценку.

Вызывать – однонаправленность, причинность.

Изменения - предполагают наличие элемента новизны, уход от предопределённости. Новый – имеющий свойство неожиданности (случайности).

Это определение по своей общности аналогично принятому определению энергии, как способности производить работу, и в применении к физическому миру информация и энергия близки по смыслу. Любое уточнение (дополнительные слова) в приведённых предложениях ограничивает сферу действия этих фундаментальных первичных понятий. Сама первичность здесь не допускает более точных формулировок, хотя, на мой взгляд, понятие информации первичней. Многочисленность же существующих определений информации объясняется конкретными подразумеваемыми областями рассмотрения (связью, коммуникацией, физикой, масс-медиа, психологией и т.п., когда уточняющие слова не конфликтуют с необходимым уровнем общности), а также узакониванием бытового (слэнгового) значения этого слова. В определении не сказано кто или что вызывает изменения у кого или чего, потому, что это не существенно. Нет там и триады источник–канал-приемник, которые, однако, являются хорошей простейшей моделью для изучения передачи сигналов–носителей информации. Существенно же для каждой ситуации разобраться кто, что и как вызывает те или иные изменения, для того, чтобы понять суть информационного процесса.

Единицей измерения информации является бит, соответствующий определённости от реализации одного из двух равновероятных событий. Классическим примером такого события является результат падения монеты. Что мы можем сказать о том, какой стороной упадёт подброшенная монета? Чаще всего ответ – 50% орел, либо столько же - решка. Однако, по сути это «научный» способ сказать, что мы ничего не знаем о падении монеты, кроме того, что ни одна из сторон не имеет преимуществ перед другой. Тем не менее, о судьбе уже подброшенной монеты (при большом желании) можно сказать очень многое. Монета является простой механической системой - стоит нам (с помощью лазера) определить её координаты и скорость, и (автоматически) ввести данные в компьютер, как дальнейшее её движение может быть рассчитано и предсказано с помощью классических законов механики. При этом мы не влияем на саму монету, а лишь затрачиваем средства на сбор данных и получение информации. Падение монеты для нас случайно не потому, что случайность есть её свойство, а потому, что у нас нет информации о не повторяющихся и не контролируемых начальных данных полета монеты.

Информацию принято путать с данными, которые являются её носителями. Эта путаница имеет под собой основания, поскольку, и то, и другое измеряется в одних и тех же единицах. На примерах я постараюсь показать разницу между этими двумя важными понятиями.

Сначала разберем сколько бит в «Анне Карениной». Сам по себе этот вопрос не вполне корректный. Предположим, это произведение пересылается через сеть из одного компьютера в другой. Текст романа состоит из символов. Необходимые символы – русский и латинский алфавиты + служебные символы (знаки препинания, апострофы, запятые, ...) всего числом менее ста. Элементарнейшая и естественная кодировка сигналов – двоичная (есть или нет дырки в определенном месте на бумажном носителе, северное или южное намагничивание элемента памяти на магнитном носителе, есть-нет импульса в заданный отрезок времени в электрической сети), и данные хранятся в ячейках, имеющих два состояния, обозначаемые как 0 и 1. Количество данных, содержащихся в одной ячейке, тоже, как и информацию, называют битом. Набор из N ячеек может иметь 2 в степени N разных уникальных состояний. Чтобы закодировать необходимые символы, обычно применяют наборы из 8-ми ячеек, что даёт 256 независимых состояний. Итого, нам нужно 8 битов для размещения на носителе одного символа. Полный текст романа имеет около 1.5 миллиона символов, что требует всего около 12 миллионов битов для их размещения. Проследим подробнее, как будет происходить передача. Получив очередной набор из 8 битов, приёмный компьютер для того, скажем, чтобы напечатать текст романа на бумаге, должен расшифровать что там написано, чтобы напечатать правильный символ. Если число возможных состояний набора 256, то, грубо говоря, вероятность появления каждого конкретного символа в данном наборе есть 1/256 – довольно маленькая величина. Количество битов набора и вероятность появления связаны простой (но фундаментальной) формулой: число битов равно минус логарифму по основанию 2 от вероятности состояния. И вот тут начинается принципиально важный момент. Дело в том, что «тупо» перебирать и сравнивать полученый набор с имеющейся в обоих компьютерах (обязательно одинаковой) таблицей кодировки принимающий компьютер не будет. Мы прекрасно знаем, что, например, буква А обычно встречается в тексте значительно чаще, чем, скажем, Ё и Ъ, и, организуя очередность перебора, более часто встречающиеся символы должны проверяться в первую очередь, чтобы процесс раскодировки шёл быстрее. Вероятность появления каждого символа можно оценить проанализировав некоторое количество текстов. Тогда, для разных символов вероятность их появления будет разная, и эффективное количество ячеек набора для них (вычисляемое по той же формуле) будет тоже разное. И вот это-то эффективное количество и есть действительная информация, принесённая данным набором.

Произвольные наборы полутора миллионов символов требуют одинакового ресурса памяти. Однако же, случайный набор символов не является текстом, и не будет иметь для нас особого смысла (нести информацию), сколько бы ресурсов памяти он ни занимал. Другая крайность - если все символы совпадают. Примените к соответствующему файлу программу сжатия, и результирующий объём существенно сократится, по сравнению с исходным, соответственно, ускоряя процесс передачи. Ну а если символов четыре – много ли из них можно извлечь смысла. Если не знать, что они означают (ключа), то вряд ли хоть сколько-нибудь, ну а если мы вдруг узнаем, что символами обозначены аминокислоты молекулы ДНК, то мы станем обладателями «формулы жизни».

Важный промежуточный итог – есть данные и есть информация. И то, и другое измеряется в битах. Данные – носитель информации. Второй итог - эту информацию пока получил компьютер, а не пользователь. Третий итог - информация, полученная от события с двумя возможными исходами, может быть любой от нуля до бесконечности. Событие с вероятностью единица (всегда имеет место) несёт информацию равную нулю. Событие с вероятностью 0,5 (как у упавшей монетки) несёт информацию равную 1 бит. Событие с вероятностью близкой к нулю несёт огромную (теоретически неограниченную) информацию.

Много данных не обязательно содержат много информации. Вполне может быть как раз наоборот. Представим себе очередной утренний выход из дверей собственного дома. Кругом - множество движущихся объектов, выполняющих различные функции и по-разному звучащие: движется транспорт, идут люди, разговаривают между собой и по телефонам, где-то летит самолет. Привычная ежеутренняя картина, которая не обращает на себя внимания. И не мешает досыпать на ходу, либо предаваться размышлениям. Или же другой вариант: вы так же открываете дверь, а вокруг - тишина и песчаная пустыня до самого горизонта. Не правда ли, инфаркт будет не самой необычной реакцией на эту, не отличающуюся структурным разнообразием, картину среди слабонервных.

Привыкший спать под боком у матери ребенок не реагирует на посторонние звуки, шевеление матери и её голос; все эти события лишь подтверждают важный для него факт, что защита, корм и тепло рядом. Напротив, тревогу и страх у ребенка вызовет полная тишина и отсутствие привычных сигналов.

Одно и то же по содержанию сообщение может нести совершенно разную информацию. Звонок с сообщением о землетрясении за пять минут до его начала несоизмерим по ценности с таким же сообщением на десять минут позже (когда и так уже всё известно). Хотя, если вы такой звонок получите, то вам уже повезло.

Итак, информация о результате падения подброшенной монетки равна одному биту. Сколько это? В случае, когда приёмниками являются люди, вступает в действие субъективный фактор, или «цена вопроса». Всем приходилось подбирать с пола упавшую монету – часто ли мы обращаем внимание на то, какая сторона оказалась сверху. Другое дело, если от результата её падения многое зависит. К примеру, несколько лет назад один британец поставил на цвет в Лас-Вегасе всё, что у него было – более ста тысяч долларов. Игру показывали в реальном времени по телевидению при большом скоплении народа. Мужику повезло. Вероятность выпадения красного цвета в рулетке около 0,5 (тот же бит), но в этом случае «цена вопроса» большая (пан или п(р)опал). Строго говоря, эту информацию можно считать битом только с очень формальных позиций. В такую ситуацию человек попадает крайне редко (может быть, никогда в жизни), и данный бит лишь является последним во множестве других, связанных с рассматриваемым случаем.

И вот текст попадает к читателю. При этом, естественно, предполагается, что имеет место владение данным языком, иначе получаемая информация мало будет отличаться от оной из хаотической расстановки символов. Текст и конкретный читатель, у которого своя (особенная) история, мышление, понимание мира, эмоции, чувствительность к различным словам. Если написавший текст - мастер своего дела, и мы готовы прожить ещё одну виртуальную судьбу, то есть шанс вжиться в повествование, сопереживать героям и почувствовать их эмоции, преломлённые через себя. Степень этих переживаний, всё то новое, что мы получим от прочтения, и будет той информацией, ради которой мы раскрываем книгу. Какие внутренние резонансы пробудит текст зависит от многого. Если эти резонансы совпадают у разных людей, то у них появляется нечто общее, что можно обсуждать и сопереживать. Но есть и уникальные реакции, в которых нас самих можем (и то не всегда) понять только мы сами. Той же Анне Карениной сочувствуют далеко не все, считая, что «мерзавке досталось поделом».

Теперь обратимся к статье Дмитрия Горбатова (Д. Г.) Litterae contra Informationis.

Её автор, к сожалению, настолько путает базовые понятия, что подробный разбор статьи смысла не имеет, иначе получится книга распутывания клубка индивидуальных заблуждений, что малоинтересно: заблуждающийся - не Аристотель и даже не Лев Толстой. Я ограничусь лишь несколькими комментариями, чтобы не быть совсем уж голословным.

Дмитрий почему-то опирается на рабочий, далекий от завершения вариант русскоязычной статьи из Википедии, пропуская наличие дискуссии, подходя к проблеме формально и не пытаясь разобраться в сути.

В то же время, вот что пишут по поводу определения информации солидные энциклопедии.

Бизнесс-словарь

In general, raw data that (1) has been verified to be accurate and timely, (2) is specific and organized for a purpose, (3) is presented within a context that gives it meaning and relevance, and which (4) leads to increase in understanding and decrease in uncertainty. The value of information lies solely in its ability to affect a behaviordecision, or outcome. A piece of information is considered valueless if, after receiving it, things remain unchanged. For the technical meaning of information see information theory.

и Мериам-Вебстер

1: the communication or reception of knowledge or intelligence
2 a (1) : knowledge obtained from investigation, study, or instruction (2) : intelligencenews (3) : factsdata b : the attribute inherent in and communicated by one of two or more alternative sequences or arrangements of something (as nucleotides in DNA or binary digits in a computer program) that produce specific effects c (1) : a signal or character (as in a communication system or computer) representing data (2) : something (as a message, experimental data, or a picture) which justifies change in a construct (as a plan or theory) that represents physical or mental experience or another construct d : a quantitative measure of the content of information; specifically : a numerical quantity that measures the uncertainty in the outcome of an experiment to be performed.

Я сознательно не привожу русского перевода, боясь хоть немного исказить смысл написанного. Не владеющие английским могут воспользоваться программой-переводчиком, чтобы посмотреть из каких слов состоит описание.

Ключевые слова при описании термина информация - вероятность, знание, неопределенность, изменение. В тексте Дмитрия этих слов просто нет, что свидетельствует о его полном непонимании смысла предмета обсуждения.

Основная мысль статьи «Литература и Информация» может быть сформулирована так: В наше время средства массовой коммуникации более эффективно исполняют все функции Литературы, которая становится информационно-бессодержательной.

Либо, ещё проще: Влияние Литературы на общество стремительно снижается, так как все её функции более эффективно выполняются средствами массовой коммуникации.

Ключевое смысловое сочетание в этих формулировках - функция Литературы.

Д. Г.: «Основная же функция литературы — быть объектом чтения.»

Следуя логике Дмитрия, основная функция, скажем, лекарств - быть объектом глотания. Или засовывания в задницу, если того требует инструкция. Но никак не облегчения состояния больного.

Набрал в поисковике «функция литературы», и нашел статью Кризис художественной литературы с точки зрения её социальных функций с аналогичными (хотя и более сдержанными) моим посылками и выводами. Никаких лишних эмоций, только анализ сложившейся ситуации.

Оттуда: «С тех пор, как в России разрушился режим "литературоцентрической" культуры, с тех пор, как идея необходимости художественной литературы перестали навязываться совокупными усилиями творческой интеллигенции, системы образования и государства, в обществе - и материалы безбрежного рунета тому подтверждение - все чаще высказываются сомнения в том, что знание художественной литературы вообще для чего-то нужно. Хотелось бы подчеркнуть, что врагом беллетристики выступает не бескультурье, а особая прагматическая культура, предпочитающая оценивать источники информации и выбирать среди них приоритетные. Эти люди оставляют в Интернете следующие высказывания: "Зачем мне знать, что какой-то Толстой придумал про выдуманных людей". "Я вообще не читаю художественную литературу. Мне дорога каждая минута. Зачем тратить время на то, что не несет полезной, нужной информации".»

Д. Г. «При сравнении с Достоевским чисто художественные достоинства Довлатова могут оказаться даже выше: это подтвердят все, кто действительно профессионально разбираются в литературе, — хотя сам по себе факт сравнимости Довлатова с Достоевским ничего не опровергает и не доказывает, ибообщественная значимость текста отнюдь не исчерпывается одними его художественными достоинствами

Мне нравятся довлатовские «Заповедник» и «Зона». То, что он написал после эмиграции, на мой взгляд, значительно слабее. До переезда он ощущал, что противостоит власти, Системе. При всей её отвратительности, эта власть была почти всемогуща, и потому быть с ней в конфронтации мог тоже человек не слабый, и Довлатов чувствовал эту свою значительность и силу. Но, приехав в Штаты, он обнаружил, что теперь бороться надо против себя самого. Против своих старых привычек, страха перед новым, которое смотрело на него с безразличием, против собственной эмигрантской беспомощности. Оказалось, что его аудитория (общественная значимость) - это обитатели Брайтон Бич, и внимание этой аудитории ещё надо «заслужить». Это унижало его и в конце концов добило. Получилась западня: из СССР ещё можно было уехать в Америку, а из Америки ехать уже было некуда.

Но дело не только в качестве им написанного, у всех свои вкусы и интересы. Дело в том, что, по большей части, его тексты – это личные наблюдения и переживания, почти всё повествование ведется от первого лица. В моем понимании, это ближе к «журнализму», а не к художественной литературе с её вымышленными сюжетом и героями. Журналист должен больше пользоваться памятью, запомненными деталями (быть фотографом), тогда как писатель выдумывает, фантазирует как сюжетный художник. Известно, что эти два разных процесса происходят в разных отделах мозга, которые редко работают одинаково хорошо. И написанное Довлатовым, для меня, в первую очередь, - журнализм, безо всяких негативных оттенков.

Д. Г. «Нота — всего лишь письменный знак, поэтому ноты-«данные» составляют не музыку-«структуру», а только партитуру-«структуру». Проще говоря, нота в записи музыкального текста есть почти полный аналог буквы в записи вербального текста.»

Википедия на английском даёт два значения для слова нота:

    1. Знак используемый в нотной грамоте для записи относительных высоты и длительности звука (a sign used in musical notation to represent the relative duration and pitch of a sound);

 

    1. Звуковой тон (a pitched sound itself).

 

Фразу «взять верхнее до» произносили многие великие певцы, и нет сомнений, что речь тут идет о звуке, а не о знаке. Когда-то то, что сейчас стали называть нотой, было нотным знаком, и путаницы не возникало. Изменения значения стали результатом слэнга, того же самого процесса «приспособившего» слово «информация» для массового употребления, то есть, по сути, приравнявшего информацию к данным.

Д. Г. «С появлением компьютеров, а особенно Интернета, трудно стало не обнародовать текст, а уничтожить его

Обнародовать текст - это не только поместить его в Интернете, но сделать так, чтобы его читали. А для этого надо писать понятно и интересно. Тексты запросто «уничтожаются» их игнорированием.

Д. Г. «Именно культ математики мешает нашему полноценному «интергалактическому» общению! Ведь математика зиждется на идее Числа — а идея Числа есть главный системный порок современного человеческого мышления, причём сомнительная гордость за эту идею нас так распирает, что блокирует всякое разумное предубеждение.

Между тем информационная ценность идеи Числа равна круглому нолю, ибо если план выражения Числа нам доступен хотя бы в виде системы письменных знаков, то план содержания Числа гносеологически непостижим: следовательно, никакое число в сущности не является знаком — ибо, не имея своего означаемого, нераздельно-неслиянное с ним означающее само полностью утрачивает информационный смысл. Хуже того, мыслимая нами априорная числовая сущность всякого объекта откровенно и грубо паразитирует на его магистральном содержании — что находит прямое отражение в грамматических категориях многих современных языков: например, «глубокомысленная» дихотомия исчисляемых и неисчисляемых существительных, за которой не стоит вообще никакая реальность.»

Может ли хоть как-то серьёзно обсуждаться подобная .... (подходящее слово убрано самоцензурой, а более точного не нашлось), если её создатель не понимает смысла слов им употребляемых? Вопрос риторический, разумеется. Теория чисел есть лишь один из многих разделов математики. Математика устанавливает отношения между объектами, первичные свойства которых чётко определены. Насколько наши модели представления о различных явлениях (равно как и соответствующие математические результаты) вписываются в реальную картину - это совсем другой вопрос. Эти модели будут уточняться и изменяться. Доказанным же математическим утверждениям пересмотр не грозит.

Резюмируя – текст Д. Горбатова органически бессмысленен начиная с заголовка, который может быть переведен как «Литература против информации». Ибо лишенное информации, а значит заведомо пустопорожнее, не вызывающее отклика произведение не может подвинуть писателей на его создание, и уж, тем более, возбудить хоть какой-либо интерес и быть востребованым у читателя.

.................

Итак, один бит это много или мало? Мы знаем, что единичное событие может нести информацию сколь угодно близкую как к нулю, так и к бесконечности. Где-то «посредине» между этими крайностями и расположен один бит. Житейски же, один бит раскрывает неопределенность, которую мы описываем любимым народным выражением «а хрен его знает». Опять же, житейски, если некоторое событие взволновало, заставило нас обратить на себя внимание, изменить намеченные действия, то значит в нём была информация, а если же оставило равнодушным, ни на что в нас не влияя, то информации в нём практически не было.

Есть редкие профессии, секреты которых скрыты от взгляда извне. Необученный человек не сможет управлять самолетом, варить металл или расшифровывать спектры излучения. У многих других специальностей таких «привилегий» нет. Например, сложно быть непререкаемым авторитетом повару, литератору или психологу, клиенты которых вполне могут прекрасно готовить, обучась этой науке ещё у бабушек, быть начитанными и иметь ежедневный опыт работы с текстом, и уж, тем более, имея собственное непрерывное и долговременное чувствование самого себя, своих эмоций и мыслей. Более того, такие люди могут рассматривать указанные дисциплины под своими собственными профессиональными углами, что, как известно, зачастую позволяет увидеть нечто новое.

Ну так и что же происходит с информацией, которую мы получаем в наши дни от Литературы, явившейся плодом воображения и фантазий писателя? Существенно ли такие произведения влияют на (изменяют) жизнь современного человека? Утвердительный ответ на этот вопрос мне представляется понятным самообманом.

Комментарии
  • Маркс Тартаковский. - 07.09.2015 в 12:40:
    Всего комментариев: 18
    Тексты Довлатова – это личные наблюдения и переживания, почти всё повествование ведется от первого лица. В моем понимании, это ближе к «журнализму», а не к Показать продолжение
    Рейтинг комментария: Thumb up 0 Thumb down 0

Добавить изображение