Контакты

Семантическая мера информации. Семантические свойства информации Информация согласованная по семантической форме с тезаурусом

  • 3. Какие существуют меры информации и когда ими надо пользоваться? Синтаксическая мера информации
  • Семантическая мера информация
  • Прагматическая мера информации
  • 4.Основные идеи иерархического, фасетного, дескрипторного методов классификации.
  • 5. Понятие системы кодирования информации. Классификация методов. Что представляет собой классификационное, регистрационное кодирование?
  • 6.Сопоставьте назначение системы классификации и системы кодирования.
  • 7.Поясните классификацию информации, циркулирующей в организации. Особенности экономической информации.
  • 8. Понятие системы счисления. Как представляются числа в форме с фиксированной и плавающей запятой?
  • 9. Основные единицы количества машинной информации. Понятие «бит».
  • 10.Каковы структура и назначение кодов ascii? Что такое алгебра логики?
  • 11.Что такое: алгоритм, машинная команда, машинная программа? Какова структура машинной команды? Что такое адрес операнда?
  • 12. Какие основные блоки входят в состав пк? Микропроцессор и его функции.
  • 14. . Каковы назначение и основные характеристики оперативной, постоянной и внешней памяти?
  • 15. Основные блоки персонального компьютера и их значение. Последовательность работы блоков пк при выполнении программы.
  • 16. Какова классификация вычислительных машин? Что такое цифровая вычислительная машина, аналоговая, гибридная?
  • 17. Что представляют собой сервер, рабочая станция, распределенная обработка данных?
  • 18. Понятия «многомашинный вычислительный комплекс» и «компьютерная сеть». Пояснить отличие компьютерной сети от многомашинного вычислительного комплекса.
  • 19. Классификация компьютерных сетей. Глобальная, региональная, локальная вычислительная сети. Основные элементы компьютерной сети.
  • 20. Понятие абонентской системы. Основные компоненты коммуникационной сети.
  • 22. Коммуникационное оборудование локальных сетей: маршрутизаторы, мосты, коммутаторы, модемы.
  • 24. Определение компьютерной сети. Цели объединения. Понятие архитектуры вычислительной сети.
  • 25. Что такое топологии сети и каковы особенности кольцевой, шинной, звездообразной топологии.
  • 26. Назовите основные типы физической передающей среды для лвс. Охарактеризуйте основные методы доступа к передающей среде.
  • 27. Архитектуры обработки удаленных данных: файл-сервер, клиент-сервер.
  • Семантическая мера информация

    Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, которая связывает семантические свойства информации со способностью пользователя принимать поступившее сообщение. Для этого используется понятие тезаурус пользователя.

    Тезаурус - это совокупность сведений, которыми располагает пользователь или система.

    В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I c , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис.2.2. Рассмотрим два предельных случая, когда количество семантической информации I c равно 0:

    при S p 0 пользователь не воспринимает, не понимает поступающую информацию;

    при Sp; пользователь все знает, н поступающая информация ему не нужна.

    Рис. 2.2. Зависимость количества семантической информации.воспринимаемой потребителем, от его тезауруса Ic=f(Sp)

    Максимальное количество семантической информации I c потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S p (S p = S p opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

    Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

    При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и S p .

    Относительной мерой количества семантической информации может служить коэффициент содержательностиС, который определяется как отношение количества семантической информации к ее объему:

    Прагматическая мера информации

    Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

    Синтаксические меры информации. Объем данных в сообщении измеряется количеством символов (разрядов) принятого алфавита в этом сообщении. Часто информация кодируется числовыми кодами в той или иной системе счисления. Естественно, что одно и то же количество разрядов в разных системах счисления способно передать разное число состояний отображаемого объекта.

    Семантическая мера информации. Для измерения смыслового содержания информации, то есть ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера информации, которая связывает семантические свойства информации со способностью пользователя воспринимать поступившее сообщение. Прагматическая мера информации Прагматическая мера информации - это полезность информации, ее ценность для пользователя (управления). Эта мера также является величиной относительной, обусловленной особенностями использования информации в той или иной системе управления. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

    По информации не рассматривался смысл (значение) поступающей информации, а в ряде случаев это принципиально, Ю.А. Шрейдер предложил «Семантическую теорию информации».

    Так «…результаты анализа или оценки одного и того же произведения литературы или искусства, полученные разными критиками или в разное время, часто не совпадают между собой даже по основным, принципиальным вопросам. Всё это показывает, что восприятие эстетическое не является абсолютным, зависящим лишь от того, что воспринимается, от «информации», заключённой в объекте восприятия, от самого художественного произведения.

    Поскольку в процессе восприятия участвует приёмник, воспринимающий эстетическое сообщение, то результаты анализа и оценка сообщения существенно зависят от свойств самого приёмника.

    В связи с этим нельзя не сказать о некоторых подходах кибернетики к вопросам эстетического восприятия, которые, в частности, могут способствовать объективной оценке художественного произведения. Естественно, что при такой постановке задачи эти подходы должны учитывать семантическую (смысловую, или содержательную) сторону произведений, а также способность приёмника извлечь из произведения «художественную», эстетическую информацию.

    Некоторые аспекты теории информации имеют непосредственное приложение к исследованию восприятия художественных произведений. Так, в последнее время за рубежом и в нашей стране проводятся исследования, связанные с разработкой семантических аспектов теории информации. В общих чертах один из таких аспектов, разрабатываемых Ю. А. Шрейдером , заключается в следующем.

    Поскольку информация I, которую получает приёмник из сообщения Т , существенно зависит от свойств самого приемника, вводится в рассмотрение понятие тезауруса θ приёмника.

    В словарной практике тезаурусом […] принято называть одноязычный ассоциативный словарь, в котором указаны различные смысловые связи между словами. Тезаурус θ , как и всякий справочник, отражает сведения, накопленные к определённому моменту времени некоторым индивидуумом (приёмником). В частности, он характеризует способность этого индивидуума воспринимать те или другие сообщения.

    Информация I , получаемая приёмником, характеризуется как принимаемым сообщением Т , так и степенью изменения тезауруса θ, т. е. I = I (Т, θ).

    Иначе говоря, количество информации I (Т, θ), содержащееся в сообщении Т относительно тезауруса θ, характеризуется степенью изменения тезауруса под действием воспринимаемого сообщения.

    Очевидно, что из одного и того же сообщения разные приёмники (с разными тезаурусами) извлекают неодинаковую информацию. Вследствие неподготовленности данный тезаурус вообще может не воспринять некоторые (непонятные ему) сообщения. Последние для данного приёмника не несут никакой информации (приемник получил нулевую информацию), и в этом случае его тезаурус не изменился.

    Но нулевую информацию приёмник получает также и в случае, если он воспринимает уже известное сообщение. В обоих этих случаях тезаурус приёмника не изменяется и I (Т, θ) = θ .

    Таким образом, семантическая теория информации признаёт, что большую роль при восприятии сообщения играет «настройка», «предпрограммирование», подготовленность приёмника.

    Поэтому из некоторого данного сообщения примитивный тезаурус информации не извлекает, развитый тезаурус «понимает» сообщение и получает максимальную информацию, а перенасыщенный тезаурус также информации не получает из-за слишком хорошей подготовленности. Так, например, одно и то же «сообщение» - учебник по высшей математике дошкольнику не даёт никакой информации (тезаурус неподготовлен), студенту-математику даёт максимум информации, а профессору-математику опять-таки не даёт никакой информации (тезаурус перенасыщен).

    Аналогично и для восприятия художественного произведения (в частности, музыкального) приемник должен обладать некоторым тезаурусом в данном виде искусства. Художественная, или эстетическая, информация, содержащаяся в данном произведении, отлична от нуля лишь для некоторого диапазона тезаурусов…».

    1.4.2.2 Семантическая мера информации

    Семантика – наука о смысле, содержании информации.

    Для измерения смыслового содержания информации, т. е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, связывающая семантические свойства информации со способностью пользователя принимать поступившее сообщение. Одно и то же информационное сообщение (статья в газете, объявление, письмо, телеграмма, справка, рассказ, чертеж, радиопередача и т. п.) может содержать разное количество информации для разных людей в зависимости от их предшествующих знаний, уровня понимания этого сообщения и интереса к нему.

    Для измерения количества семантической информации используется понятие "тезаурус пользователя", т. е. совокупность сведений, которыми располагает пользователь или система.

    В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I c , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рисунке 1. 2.

    Рис. 1. 2. Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса I C = f(S p)

    Рассмотрим два предельных случая, когда количество семантической информации I C равно 0:

    При пользователь не воспринимает, не понимает поступающую информацию;

    При пользователь все знает и поступающая информация ему не нужна.

    Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом (), когда поступающая информация понятна пользователю и несет ему ранее неизвестные (отсутствующие в его тезаурусе) сведения.

    Следовательно, количество семантической информации и новых знаний в сообщении, получаемое пользователем, является величиной относительной.

    Относительной мерой количества семантической информации может служить коэффициент содержательности С, определяемый как отношение количества семантической информации к ее объему:

    1.4.2.3 Прагматическая мера информации

    Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Это величина относительная, обусловленная особенностями использования информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.

    Введенные меры информации представлены в таблице 1.3.

    Таблица 1.3 Единицы измерения информации и примеры

    Мера информации Единицы измерения Примеры (для компьютерной области)

    Синтаксическая:

    шенноновский подход

    компьютерный подход

    Степень уменьшения неопределенности

    Единицы представления информации

    Вероятность события

    Бит, байт, кбайт и т. д.

    Семантическая

    Тезаурус

    Экономические показатели

    Пакет прикладных программ, персональный компьютер, компьютерные сети и т. д.

    Рентабельность, производительность, коэффициент амортизации и т. д.

    Прагматическая Ценность использования

    Емкость памяти, производительность компьютера, скорость передачи данных и т. д.;

    денежное выражение;

    время обработки информации и принятия решений

    1.4.3 Качество информации

    Получая какую-либо информацию, человек пытается ее осмыслить и оценить: Что в ней нового? Насколько она ему важна? Правдива ли она? Может возникнуть множество вопросов относительно полученной информации. Как же правильно ее оценить? Оказывается, любая информация должна обладать рядом свойств. Только определив, насколько ваша информация отвечает присущим ей свойствам, можно оценить ее качество. Качество информации – обобщенная положительная характеристика информации, отражающая степень ее полезности для пользователя.

    Важнейшие свойства информации: достоверность, полнота, доступность, актуальность, защищенность, ценность, содержательность, своевременность, защищенность.

    Одно из свойств информации – достоверность, означающая истинное, объективное отражение действительности. Как известно, каждый человек воспринимает окружающую действительность субъективно, имея свои собственные, отличные от других взгляд и мнение, поэтому передаваемая или получаемая человеком информация не может быть абсолютно объективна. Она лишь может быть максимально приближена к объективной, например прогноз погоды. Существуют различные источники получения информации о предстоящей погоде: собственные наблюдения, сводки погоды, составленные метеослужбами различных ведомств, городов, а также гидрометеорологическими службами целых регионов. Каждая из этих служб имеет свои средства наблюдения и составления прогнозов, учитывает какие-то показатели больше, какие-то меньше. У всех различная точность предсказания погоды.

    Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т. п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:

    Формальная, измеряется значением единицы младшего разряда числа;

    Реальная, определяется значением единицы последнего разряда числа, верность которого гарантируется;

    Максимальная, ее можно получить в конкретных условиях функционирования системы;

    Необходимая, определяется функциональным назначением показателя.

    Рассмотрим на примере прогноза погоды свойства информации. Получая сводку погоды, в одних случаях нас интересует температура и влажность воздуха, в других – осадки и направление ветра, в третьих, возможно, нам потребуется полная картина предстоящей погоды. Полнота информации означает, что она содержит минимальный, но достаточный для принятия правильного решения состав (набор) показателей. Как неполная, т. е. недостаточная для принятия правильного решения, так и избыточная информации снижают эффективность принимаемых пользователем решений.

    Также важно, чтобы получаемая информация соответствовала данной ситуации. Например, можно получить полную сводку погоды из достоверного источника, но она окажется ненужной, если будет содержать сведения недельной давности. Иными словами, информация должна быть актуальной, что определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и интервала времени, прошедшего с момента возникновения данной информации.

    Однако достоверная, полная и актуальная информация о погоде на предстоящую неделю может быть записана (или произнесена) в терминах и обозначениях синоптиков, непонятных большинству людей. В этом случае она окажется бесполезной. Значит информация должна быть выражена в таком виде, который был бы понятен получателю данной информации. В этом заключается следующее свойство информации – доступность, которая обеспечивается выполнением соответствующих процедур ее получения и преобразования.

    Получая новую информацию, человек решает, нужна ли она для решения какой-то данной проблемы. Одна и та же информация может быть очень важной для одного и быть абсолютно бесполезной для другого. От того, какие задачи можно решить с помощью данной информации, зависит ее ценность. В зависимости от того, какой объем поступивших данных был переработан, определяется содержательность информации, которая отражает семантическую емкость.

    С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных. Одинаково нежелательны как преждевременная подача информации (когда она еще не может быть усвоена), так и ее задержка. Только своевременно полученная информация может принести ожидаемую пользу. Своевременность информации означает ее поступление в соответствии со временем решения поставленной задачи.

    Защищенность – свойство, характеризующее невозможность несанкционированного использования или изменения.


    Cемантика устанавливает смысловую связь между внутренним языком системы и языком внешней среды. И в отношении этой взаимосвязи информация обладает определенными специфическими свойствами, получившими название семантических.

    Оценка объема семантической информации возможна различными способами. Все они в принципе сводятся к получению так называемого семантического конденсата сообщения. В частности, это может быть реализовано путем последовательного исключения из поступившего сообщения элементов, не несущих дополнительной по отношению к остающейся его части смысловой нагрузки.

    Необходимо отметить, что понятие смысла сообщения не является вполне однозначным, так как смысл того или иного сообщения зависит и от того, что пытается передать источник информации, и от того, что в этом сообщении является интересным для получателя. Например, один собеседник говорит другому: «Нектоприобрел обалдевающе шикарный , cтрашно дорогой , импортный костюм ».

    Объем информации (в предположении равновероятности появления отдельных символов алфавита) будет равен

    где m – количество символов алфавита; n – количество символов, вошедших в сообщение, или его семантический конденсат.

    Если систем-приемник не интересуют эмоциональные всплески источника, то при оценке объема семантической информации он удалит из текста такие слова, как «обалдевающе» и «страшно». В этом случае объем семантической информации будет равен

    Если же получателя интересует только сам факт приобретения, то объем семантической информации еще более уменьшится, поскольку в конденсате останутся только подчеркнутые слова. В этом случае будем иметь

    Однако получатель информации может извлечь из этого сообщения такой смысл, о котором источник, возможно, и не думал. Действительно, он может из этого утверждения заключить, что источник завидует купившему. В этом случае конденсат будет выглядеть так:

    «Некто приобрел страшно дорогой костюм – завидно».

    (Величина I будет равна бит.)

    Возможность вывода различных как чисто логических, так и чисто ассоциативных суждений в системе знаний получателя на основе одного и того же информационного сообщения выражает свойство интерпретируемости последнего.

    В силу свойства дополняемости, о котором речь пойдет далее, сообщение, поступившее в некоторую систему знаний, может привести к появлению в ней некоторого дополнительного объема ассоциированной информации, получающейся путем логического, правдоподобного вывода или на основе каких-либо иных ассоциаций, связанных с воспринятым информационным образом. В связи с этим мы можем говорить и о количестве ассоциированной информации. Заметим, однако, что речь в данном случае идет только о такого рода информации, истинность которой не могла быть доказана в рассматриваемой системе знаний до появления данного сообщения или требовала дополнительных подтверждений.

    Например, основываясь на полученном выше сообщении, адресат может сделать еще один неожиданный для себя вывод:

    «Некто богат!» бит.)

    «Да, некто модник». бит.).

    Помимо этого, в разгоряченном мозгу могут возникнуть и другие, не менее удивительные предположения:

    «Да, некто не собирается ли жениться?» бит.)

    Мы видим, что получение некоторого сообщения может вызвать у получателя волнообразный, а иногда и лавинообразный процесс генерации ассоциативной информации; в некоторых случаях это может привести к весьма печальным последствиям.

    Таким образом, общее количество семантической информации в принципе может превышать количество информации в сообщении. В общем случае величина и характер расхождения указанных мер зависят, помимо всего прочего, от систем знаний участников информационного обмена.

    Если один и тот же текст записать дважды, то общее количество информации в этой записи будет ровно в два раза больше, чем в исходном тексте. Объем же семантической информации останется прежним.

    Отношение объема семантической информации к общему объему (количеству) информации характеризует информативность сообщения :

    В качестве примера сообщения, обладающего почти 100%-ной информативностью, можно привести известную стихотворную фразу: «Aх! Наконец достигли мы ворот Мадрида!..» (А.С. Пушкин. Каменный гость).

    Каждое слово в этой фразе несет важную смысловую нагрузку: трудность долгого пути, желанность цели и т.п. Уберите из текста любое из этих слов и вы потеряете какую-то связанную с ним ассоциацию. Очевидно, что разные люди воспринимают смысл сообщений по-разному. И вполне очевидно, что характер и глубина ассоциативного осмысления зависят от уровня развития и индивидуальных особенностей их систем знаний. Не с этим ли связано такое разнообразие эстетических предпочтений?

    В отношении систем, выступающих в роли источников знаний, данное свойство проявляется как информированность. Именно с этим свойством связаны некоторые методики оценки квалификации специалистов.

    Семантически связанная область каких-либо знаний формально может быть представлена в виде некоторой информационной структуры, называемой тезаурусом. Он представляет собой упорядоченную по степени общности совокупность понятий, связанных между собой соответствующими отношениями. Общий образ бытия внешнего мира в системе естественного языка составляет его тезаурус. Путем иерархического деления последнего из него могут быть вычленены частные тезаурусы отдельных отраслей знаний. Понятие тезауруса сформировалось в процессе развития компьютерной обработки информации.

    Между тезаурусами различных систем знаний могут существовать определенные несоответствия и даже противоречия. Например, понятие «функция» имеет совершенно различный смысл в математике и теории организаций.

    Истинность – свойство информации, заключающееся в соответствии (изоморфизме) извлекаемого из нее образа тому прообразу исходного оригинала, который существует в системе знаний и к которому может быть приведен этот образ путем выполнения соответствующих процедур интерпретации.

    Из этого определения, в частности, следует, что изображение какого-либо объекта или субъекта в кривом зеркале можно рассматривать как истинное только в том случае, если субъект, воспринимающий этот образ, способен так его интерпретировать, чтобы он совпал с прообразом его оригинала. В этой трактовке истинность и узнаваемость есть понятия, весьма близко связанные между собой. Поскольку истинность означает непротиворечивость утверждения, содержащегося в сообщении, в некоторой логической системе, опирающейся на свои аксиомы, то она, вообще говоря, имеет неоднозначный характер, так как источники и получатели информации могут обладать разными логическими системами (существует же, например, так называемая женская логика, и не все понимали язык Эзопа).

    Заметим, что истинность очень часто носит вероятностный характер. Адекватная данной системе знаний оценка истинности сообщения осуществляется путем сравнительного анализа аргументов за и против относительно утверждения, извлекаемого из этого сообщения, и возможных его альтернатив, синтезируемых в рамках данной системы знаний. При этом, очевидно, что чем полнее синтезированное множество альтернатив, тем достовернее будет эта оценка. Однако следует иметь в виду, что свойство истинности в таком частичном его толковании следует рассматривать только лишь относительно рациональной информации. Поэтому данное свойство следовало бы трактовать как правдивость. Ведь относительность –атрибут скорее правдивости, нежели истинности. Истина в высшем смысле этого слова абсолютна и является предметом Веры.

    Как показывает практический опыт, интерес человека к тому или иному сообщению существенно зависит от того, насколько велика степень новизны содержащейся в нем семантической информации (рис. 1.4.4).

    Новизна информации свидетельствует, что в сообщении содержатся утверждения (образы), которыми система знаний до получения этой информации в явном виде не располагала. Последнее замечание весьма существенно, поскольку язык данной системы в принципе позволяет получить любые, допустимые в нем утверждения (в том числе, очевидно, и принятое). Поэтому новизну следует понимать только в плане интерпретации, т.е. в том плане, что указанное утверждение не выведено путем соответствующих преобразований имеющейся в системе знаний информации и не сопоставлено с приходящими извне образами (т.е. заранее предполагалась). Оправдывающееся предположение не есть абсолютно новая информация. Степень новизны может быть оценена как отношение

    где – объем семантической информации, представляющейся получателю сообщения X новой; – общий объем семантической информации в сообщении X .


    Рис. 1.4.4. Качественная зависимость интереса индивида
    к тому или иному сообщению от степени новизны
    семантической информации (пунктир – зависимость риска
    разрушения системы знаний от степени новизны)

    Влияние степени новизны на интерес внешне проявляется, например, в том, что много раз слышанное (или виденное) вызывает обычно скуку и порой даже отвращение, а чрезмерно новое и непонятное часто просто пугает. Однако внутренний смысл подобной зависимости связан с действием принципа сохранения, защищающего в данном случае систему знаний от проникновения в нее чужеродной, разрушительной информации. На рис. 1.4.4, помимо кривой интереса, представлена кривая степени риска разрушения системы знаний. Блокирование, снижение интереса фактически означает сопротивление системы вторгающейся в нее информации, сокращение интенсивности ее переработки. Можно сказать, что система отказывается от приема «неизвестной ей пищи, боясь быть отравленной».

    Одна и та же семантическая информация может быть представлена в различной форме (не говоря уже о различных языках). При этом, как правило, ее общий объем существенным образом зависит от выбранной формы сообщения. Например, информацию о том, что решением данного уравнения является синус, можно передать в виде сообщения

    или сообщения

    Оба сообщения в семантическом плане будут эквивалентны. Однако объемы информации в них будут значительно отличаться.

    Условием, определяющим выбор формы сообщения, являются возможности системы знаний источника и получателя. Действительно, форма сообщения должна быть такой, чтобы оно могло быть интерпретировано соответствующей системой знаний. Из сказанного следует, что, передавая или просто преобразуя информацию, можно осуществлять ее сжатие (уменьшение объема). Указанная возможность составляет суть свойства сжимаемости, характеризуемое коэффициентом сжимаемости

    где – объем (количество) информации в сообщении ; и – семантически эквивалентные сообщения.

    Как уже отмечалось выше, допустимая для данного сообщения величина сжатия определяется характером и уровнем развития соответствующих систем знаний (язык, память, интерпретатор). В природе и обществе существует невообразимое большое число различных форм представления информации, обеспечивающих достаточно высокую степень сжатия. Однако наиболее мощный способ сжатия информации – представление ее в форме некоторого закона (правила), позволяющего в случае необходимости перевести ее в развернутую форму. Так, вместо записанного выше бесконечного ряда можно использовать такую форму его представления:

    Сжимаемость есть проявление принципа семантической эквивалентности различных форм представления информации. Сжимаемость заключается в возможности передачи одной и той же семантической информации (вообще знаний) в различных формах.

    Свойство дополняемости отражает активную роль информации, которая, проникая в систему знаний, активизирует последнюю, индуцируя в ней некоторый дополнительный объем ассоциированной семантической информации. В результате этого, как отмечалось выше, реальный объем семантической информации может существенно измениться. Сообщение, проникая в систему, как бы обволакивается своеобразной информационной "шубой", дополняющей его в семантическом плане. Если бы информация не обладала свойством дополняемости, то она не могла бы обладать свойством сжимаемости, а значит, и в принципе не могла быть интерпретируемой. Ведь при интерпретации выявляются смысловые связи между элементами сообщения и элементами системы знаний.

    Дополняемость порождает весьма важное свойство систем – способность восстанавливать смысл сообщения даже в случае потери некоторой части содержащейся в нем информации. Очевидно, что в каждом конкретном случае существует некоторый предельный объем потерь, при превышении которого восстановление становится невозможным.

    Необходимым условием восстанавливаемости является наличие в апостериорной информации определенных закономерностей, выявляемых с помощью априорной информации (с помощью знаний). В этом смысле восстановление информационных сообщений есть, по сути дела, распознавание. Например, если вы знаете, что сумма углов плоского треугольника равна 180 0 , то вы сможете по двум известным (заданным) углам определить величину третьего.


    Похожая информация.


    Тема 2. Основы представления и обработки информации в компьютере

    Литература

    1. Информатика в экономике: Учебное пособие/Под ред. Б.Е. Одинцова, А.Н. Романова. – М.: Вузовский учебник, 2008.

    2. Информатика: Базовый курс: Учебное пособие/Под ред. С.В. Симоновича. – СПб.: Питер, 2009.

    3. Информатика. Общий курс: Учебник/Соавт.: А.Н. Гуда, М.А. Бутакова, Н.М. Нечитайло, А.В. Чернов; Под общ. ред. В.И. Колесникова. – М.: Дашков и К, 2009.

    4. Информатика для экономистов: Учебник/Под ред. Матюшка В.М. - М.: Инфра-М, 2006.

    5. Экономическая информатика: Введение в экономический анализ информационных систем.- М.: ИНФРА-М, 2005.

    Меры информации (синтаксическая, семантическая, прагматическая)

    Для измерения информации могут применяться различные подходы, но наибольшее распространение получили статистический (вероятностный), семантический и прагматический методы.

    Статистический (вероятностный) метод измерения информации был разработан К. Шенноном в 1948 году, который предложил количество информации рассматривать как меру неопределенности состояния системы, снимаемой в результате получения информации. Количественно выраженная неопределенность получила название энтропии. Если после получения некоторого сообщения наблюдатель приобрел дополнительную информацию о системе Х, то неопределенность уменьшилась. Дополнительно полученное количество информации определяется как:

    где - дополнительное количество информации о системе Х , поступившее в форме сообщения;

    Начальная неопределенность (энтропия) системы X ;

    Конечная неопределенность (энтропия) системы X, наступившая после получения сообщения.

    Если система X может находиться в одном из дискретных состояний, количество которых n , а вероятность нахождения системы в каждом из них равна и сумма вероятностей всех состояний равна единице, то энтропия вычисляется по формуле Шеннона:

    где - энтропия системы Х;

    а - основание логарифма, определяющее единицу измерения информации;

    n – количество состояний (значений), в котором может находится система.

    Энтропия величина положительная, а так как вероятности всегда меньше единицы, а их логарифм отрицательный, поэтому знак минус в формуле К.Шеннона делает энтропию положительной. Таким образом, за меру количества информации принимается та же энтропия, но с обратным знаком.

    Взаимосвязь информации и энтропии можно понимать следующим образом: получение информации (ее увеличение) одновременно означает уменьшение незнания или информационной неопределенности (энтропии)

    Таким образом, статистический подход учитывает вероятность появления сообщений: более информативным считается то сообщение, которое менее вероятно, т.е. менее всего ожидалось. Количество информации достигает максимального значения, если события равновероятны.

    Р. Хартли предложил следующую формулу для измерения информации:

    I=log2n ,

    где n - количество равновероятных событий;

    I – мера информации в сообщении о наступлении одного из n событий

    Измерение информации выражается в ее объёме. Чаще всего это касается объёма компьютерной памяти и объёма данных, передаваемых по каналам связи. За единицу принято такое количество информации, при котором неопределённость уменьшается в два раза, такая единица информации получила название бит .

    Если в качестве основания логарифма в формуле Хартли используется натуральный логарифм (), то единицей измерения информации является нат (1 бит = ln2 ≈ 0,693 нат). Если в качестве основания логарифма используется число 3, то - трит , если 10, то - дит (хартли).

    На практике чаще применяется более крупная единица - байт (byte ), равный восьми битам. Такая единица выбрана потому, что с ее помощью можно закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28).

    Кроме байтов информация измеряется полусловами (2 байта), словами (4 байта) и двойными словами (8 байт). Широко используются также еще более крупные единицы измерения информации:

    1 Килобайт (Кбайт - kilobyte ) = 1024 байт = 210 байт,

    1 Мегабайт (Мбайт - megabyte ) = 1024 Кбайт = 220 байт,

    1 Гигабайт (Гбайт - gigabyte ) = 1024 Мбайт = 230 байт.

    1 Терабайт (Тбайт - terabyte ) = 1024 Гбайт = 240 байт,

    1 Петабайт (Пбайт - petabyte ) = 1024 Тбайт = 250 байт.

    В 1980 году российский математик Ю. Манин предложил идею построения квантового компьютера, в связи с чем появилась такая единица информации как кубит (quantum bit, qubit) – «квантовый бит» – мера измерения объема памяти в теоретически возможном виде компьютера, использующем квантовые носители, например - спины электронов. Кубит может принимать не два различных значения («0» и «1»), а несколько, соответствующих нормированным комбинациям двух основных состояний спина, что дает большее число возможных сочетаний. Так, 32 кубита могут закодировать около 4 млрд состояний.

    Семантический подход. Синтаксической меры не достаточно, если требуется определить не объем данных, а количество нужной в сообщении информации. В этом случае рассматривается семантический аспект, позволяющий определить содержательную сторону сведений.

    Для измерения смыслового содержания информации можно воспользоваться тезаурусом ее получателя (потребителя). Идея тезаурусного метода была предложена Н. Винером и развита нашим отечественным ученым А.Ю. Шрейдером.

    Тезаурусом называется совокупность сведений , которыми располагает получатель информации. Соотнесение тезауруса с содержанием поступившего сообщения позволяет выяснить, насколько оно снижает неопределенность..

    Зависимость объема смысловой информации сообщения от тезауруса получателя

    Согласно зависимости, представленной на графике, при отсутствии у пользователя какого-либо тезауруса (знаний о существе поступившего сообщении, то есть =0), или наличия такого тезауруса, который не изменился в результате поступления сообщения (), то объем семантической информации в нем равен нулю. Оптимальным будет такой тезаурус (), при котором объем семантической информации будет максимальным (). Например, семантической информации в поступившем сообщении на незнакомом иностранном языке будет ноль , но и такая же ситуация будет в том случае, если сообщение уже не является новостью, так как пользователю уже все известно.

    Прагматическая мера информации определяет ее полезность в достижении потребителем своих целей. Для этого достаточно определить вероятность достижения цели до, и после получения сообщения и сравнить их. Ценность информации (по А.А. Харкевичу) рассчитывается по формуле:

    где - вероятность достижения цели до получения сообщения;

    Вероятность достижения цели поле получения сообщения;

    Понравилась статья? Поделитесь ей