семантический подход к определению единиц измерения информации

Семантический подход к измерению информации

Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.

В рамках этого подхода рассмотрим такие меры, как целесообразность, полезность(учитывают прагматику информации) и истинностьинформации (учитывает семантику информации).

Количество I получаемой вместе с сообщением информации с позиций ее целесообразности определяется по формуле:

image057

где p1, p2 – вероятности достижения цели после и до получения сообщения, соответственно.

Пример 1. Пусть вероятность p2 сдачи экзамена по информатике до получения сообщения (подсказки от соседа) оценивается студентом со значением 0,2. После того, как ему удалось получить подсказку, вероятность сдачи увеличилась: p1 = 0,8. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

В соответствии с приведенной формулой имеем: I = log2(0,8/0,2) = log24 = 2.

Пример 2. Пусть положение студента до получения подсказки оценивается аналогично предыдущему примеру. После получения подсказки, вопреки ожиданиям, вероятность сдачи еще уменьшилась, поскольку подсказка содержала неверную информацию: p1 = 0,1. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

Таким образом, полученная информация является дезинформацией, поскольку имеет отрицательный знак при измерении.

Зависимость усваиваемой потребителем информации от его тезауруса выражается графически следующей кривой:

image059

Как видно из графика, при тезаурусе, равном нулю и максимальному значению в точке max, информация не усваивается: в первом случае, потребителю непонятна принимаемая информация, во втором – она ему уже известна. Максимально усваивается информация (т.е. она наиболее полезна) в точке opt, когда потребитель обладает достаточным (но не максимально возможным) тезаурусом для понимания получаемой информации. При значении тезауруса i-го потребителя ТЗi количество усваиваемой им информации определяется как Iусв = f(ТЗi). Сам тезаурус ТЗi может быть практически определен как результат интеллектуального тестирования, которое проводится, например, в некоторых западных странах. При таком тестировании человеку выставляется некоторый балл, который и может расцениваться как его ТЗi.

Дата добавления: 2015-03-03 ; просмотров: 2215 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

Источник

Семантический подход к измерению информации

dark fb.4725bc4eebdb65ca23e89e212ea8a0ea dark vk.71a586ff1b2903f7f61b0a284beb079f dark twitter.51e15b08a51bdf794f88684782916cc0 dark odnoklas.810a90026299a2be30475bf15c20af5b

caret left.c509a6ae019403bf80f96bff00cd87cd

caret right.6696d877b5de329b9afe170140b9f935

Информационные процессы, их базовые составляющие.

Информационный процесс – последовательность действий, связанная с получением и хранением, обработкой и передачей информации.

Язык как средство обмена информацией.

Человек также воспринимает информацию с помощью органов чувств, а для обмена информацией между людьми служат языки. За время развития человеческого общества таких языков возникло очень много. Прежде всего это родные языки (русский, болгарский, английский и др.), на которых говорят многочисленные народы мира. Роль языка для человечества исключительно велика. Без него, без обмена информацией между людьми было бы невозможным возникновение и развитие общества. Деятельность человека, связанную с процессами получения, преобразования, накопления и передачи информации, будем называть информационной деятельностью.

1.5.Информатизация –переходный период от индустриального общества к информационному обществу.

Информационный ресурс

важнейший стратегический ресурс общества.

— это отдельные документы

— массивные отдельные документы

— отдельные документы информ.систем.(ИС)

Информационные системы

Информационныесистемы-это системы,реализующие протекание информационных процессов.

Информационное общество можно определить следующими признаками:

-высоко количество занятых в информационных сферах(80%)

-обеспечена возможность общества в любое время,на любой территории в доступе к необходимой информации

-информация становится важным стратегическим ресурсом и занимает важное место в жизни человека.

1989г-принята концепция информатизации

Основные признаки информационного общества

большинство работающих 80 % в информ. Сфере.

обеспеченна возможность к доступу любого члена общества на любой территории и в любое время к необходимой информации. Информация становится важным стратегически м ресурсом и занимает ключевое место в экономике.

Понятие информации.

Информация- это сведения об окружающем мире (объекте, процессе, явлении, событии), которые являются объектом преобразования (хранение, передачу и т.д.)

2.2. 2.3. Свойства(качество) инф :

1)релевантность(способ инф соответствовать потреб-лю)

2)своевременность(соответств-ть нужным потреб-лямворемя)

3)полнота(исчерпывающе характ-ть объект/процесс)

4)эргономичность(св-во хар-щее удобства формы и представления инф-и)

5)адекватность(соответ отраженному объекту или явлению)

6)достоверность(не иметь скрыт ошибок)

7)доступность(возможность получения инф)

8)защищенность(невозможность несанкционого использования/изменения)

9)живучесть(сохр свое кач-во с течением времени)

10)уникальность(хранящаяся в единств экземпляре)

Количество инф – числовая величина, адекватно характеризующая востребованную инф – ю

640 1

Общий характер получения инф:

Наличие опыта, до опыта должна быть неопределенность в том или ином исходе, после опыта ситуация становится более определенной.

2.4. Классификация инф:

По способам восприятия – Визуальная(90), Аудиальная(9), Тактильная, Обонятельная, вкусовая;

По формам представления–Текстовая, Числовая, Графическая, Музыкальная, Комбинированная и тд.

По общественному значению-личная,обществ,специальная, эстетическая

Личная – наши знания, умения, интуиция

Кол-во инф

Кол-во инф – числовая величина, адекватно характеризующая востребованную инф.

Получение: 1)наличие опыта-всякая инф добывается нами в виде опыта2) до опыта должна быть неопределенность, после опыта она станов более определен

Энтропия

Энтропия –кол-во уменьшенной неопределенности (можно отождествить с кол-ом полученной инф) Е=I с 2 исход.

2.7.Вероятностный подход к определению кол-ва инф: все события происходят с различной вероятностью, но зависимость между вероятностью событий и кол-ом инф можно выразить формулой Шеннона (1948) :

image002

I – кол-во инф, N-возможных событий,

Pi-вероятности отдельных событий

Семантический подход к измерению информации

Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.

В рамках этого подхода рассмотрим такие меры, как целесообразность, полезность(учитывают прагматику информации) и истинностьинформации (учитывает семантику информации).(автор Норбет Винер)

Источник

Семантический подход к определению количества информации

Для определения количества информации при разработке коммуникационных сетей или определении требуемой емкости запоминающих устройств ее измерение в битах и байтах полезно, но, к сожалению, не может быть использовано при оценке информативности, например, управленческих документов. Оценивать литературное произведение или научную статью таким способом вряд ли целесообразно. Хотя в лингвистике есть задачи, для которых методы классической теории информации бывают полезны.

Осознание этого факта привело к развитию так называемой семантической меры информации, т.е. характеристики информации с точки зрения ее смысла и содержания.

Семантика – раздел языкознания, изучающий значения, смысл отдельных единиц языка, слов и оборотов речи, связь между содержанием и знаком в процессе мышления, ее зависимость от прошлого опыта получателя сообщения. Семантический аспект является предметом исследования науки о знаках – семиотики.

Семиотика – наука, исследующая свойства знаков и знаковых систем в человеческом обществе (естественных и искусственных языков) и природе (коммуникации в мире животных). Семиотика изучает знаковую структуру сообщений как абстрактного отображения реальных явлений, а семантика изучает процесс преобразования смысла сообщения в знания.

Для условного обозначения объектов и явлений, данных в ощущениях, человек стал использовать специальные символы, знаки. Смысл знака в том, какую информацию о чем-то другом, непосредственно не связанном с сигналом, он несет. Каждый знак соотносится с другим знаком, образуя знаковую систему. Вне договора (даже с самим собой) знака не существует.

Осознанное использование даже нескольких простых знаков расширяет возможности мозга и способствует его развитию, что в свою очередь обуславливает совершенствование знаков и постепенно приводит к возникновению сложных знаковых систем. И мозг, и используемые системы знаков развиваются «в направлении прогресса обоих слагаемых». На определенном этапе этой эволюции люди начинают выражать общие, абстрактные идеи, не связанные непосредственно с какими-либо ощущениями, что дает им возможность развиться в особое высшее существо. Животные не обладают способностью к абстракции, использованию каких-либо обобщающих знаков [37].

Следствием развития знаковых систем, стало появление языков, «изобретенных» человеком для реализации своих мыслительных способностей.

Все знаки языка тесно связаны между собой, и значение каждого зависит от соотношения других элементов. Существует сложное взаимодействие слов, поддерживающих друг друга. Это позволяет с помощью ограниченного набора средств выразить неограниченное количество смыслов.

Язык можно считать главной, универсальной знаковой системой, так как его появление стало основой развитие человеческой цивилизации и с его помощью можно пересказать, описать содержание большинства других знаковых систем (возможно, кроме музыки и абстрактного искусства).

Многие знаковые системы активно используют естественный язык для расширения своих возможностей: требуются комментарии к математическим выкладкам, необходимо давать названия объектов на географических и других картах, составлять спецификации к техническим чертежам и пр.

Язык – средство информационного отображения, обозначения, кодирования объектов реального мира. Он позволяет охватывать, смоделировать и внешний, и внутренний мир человека, тончайшие нюансы его переживаний.

Язык – средство базовых информационных процессов – мышления и памяти. На нем мы думаем, творим, принимаем решения. Человек начинает себя помнить с возраста, когда достаточно хорошо овладел родным языком.

Язык – главное средство общения, информационных коммуникаций, без которых не смогло бы зародится человеческое общество. Интересно, что все известные к настоящему времени древние племена, на какой бы низкой стадии развития они не находились, имеют свой язык.

Язык – результат многовекового творчества, длительной эволюции. С одной стороны, это живая развивающаяся знаковая система, позволяющая отображать все новейшие образования, а с другой, система достаточно консервативная: практически все модные «уродства и искажения» довольно быстро исчезают и забываются.

Методы точного количественного определения смыслового содержания информации, выраженной с помощью известных знаковых систем, в настоящее время еще не разработаны. Однако можно изложить некоторые рациональные соображения и подходы к решению этой проблемы.

Семантическая мера должна учитывать не только структуру и содержание самого сообщения, взятого изолированно от получателя, но еще и запас знаний получателя, т.е. что нового несет получателю сообщение по сравнению с тем, что он уже знал или предполагал. Информативность сообщения измеряется тем вновь приобретенным знанием, которое возникает у получателя в результате усвоения сообщения.

Количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь понятное смысловое содержание для компетентного получателя и быть бессмысленным для некомпетентного.

На этой идее – оценке информационной содержательности сообщений с учетом «запаса знаний» (тезауруса) получателя или приемника сообщений основывается подход, предложенный Ю.А.Шрейдером.

Тезаурусом (от греческого «сокровище») называют словарь, в котором указаны не только значения отдельных слов, но и смысловые связи между ними. Тезаурус – это совокупность сведений, знаний, которыми располагает получатель информации (человек или система).

В данном изложении под тезаурусом будет пониматься некий обобщенный справочник, определяющий уровень знаний получателя сообщений.

При этом очевидно, что сообщения, которые содержат новую для получателя семантическую информацию, изменяют, обогащают его тезаурус.

Если сообщение не вносит ничего нового в тезаурус получателя, то естественно считать, что смысловая, семантическая информация, которая содержится в этом сообщении, равна нулю. Если одно из двух сообщений изменяет тезаурус весьма незначительно, а другое вносит в него существенные изменения, то естественно считать, что второе сообщение значительно содержательнее, несет в себе значительно большую семантическую информацию. При этом под изменением тезауруса следует понимать не только появление новых понятий, но и установление новых связей между ними, ликвидацию устаревших понятий или связей и т.д.

Можно наглядно показать количественную зависимость семантической информации, которая содержится в одном и том же сообщении, от тезауруса получателя этой информации. Пусть рассматриваемое сообщение представляет собой формулу для вычисления определенного интеграла от логарифмической функции:

Для того чтобы извлечь из этого сообщения какую-либо семантическую информацию Ic, получатель должен обладать некоторым тезаурусом Т в данной области знания, причем зависимость Ic = F(Т) можно изобразить графически в виде кривой, имеющей максимум (рис.3).

image010

Дошкольник Школьник Студент Инженер Профессор математики

Рис. 3. Зависимость количества семантической информации в сообщении

от тезауруса получателя

В самом деле, для дошкольника младшего возраста приведенная формула не несет никакой информации, но ребенок возраста 5—7 лет сможет распознать в ней отдельные элементы, например цифры 0, 1, 8.

Школьник младших классов, обладающий большим тезаурусом, обнаружит в этой формуле равенство двух дробей, хотя не поймет еще ни знака интеграла, ни натурального логарифма, ни буквы π.

Старший школьник разберется во всей этой символике, а десятиклассник поймет, что это формула интегрирования. Наибольшую информацию из приведенного выражения извлечет студент 1—2-го курса. По мере дальнейшего возрастания тезауруса новая информация, извлеченная из этого выражения, будет уменьшаться и для профессора-математика будет близка к нулю.

Впрочем, и профессор может нетвердо помнить наизусть формулы интегрирования, и поэтому приведенная формула может и для него нести некоторую небольшую информацию, способствующую вспоминанию или закреплению известных сведений.

Таким образом, одно и то же математическое выражение ничего не говорит человеку, совершенно не знающему математической символики и не имеющему представления об элементарных математических законах и соотношениях (Т = 0, Ic= 0); оно же весьма содержательно для человека, обладающего соответствующей математической подготовкой, но ранее не знавшего сообщенных ему математических соотношений (Т > 0, Ic = Ic макс), и опять становится мало содержательным для высокообразованного математика, который «все это уже давно знает» (Т à Т макс; Icà 0) [21,13].

В области организационного управления и экономики исторически сложилось огромное разнообразие форм документов, а также существует неоднозначность смысла многих терминов, показателей и их кодовых обозначений. Решение проблем рационального представления экономической информации составляет содержание экономической семиотики. В рамках данного научного направления на основе количественного и качественного анализа информационных потоков, обслуживающих экономическую деятельность предприятий и отраслей, делаются попытки формирования структуры тезауруса экономических систем, т.е. совокупности понятий и их взаимосвязей, на основе которых и должны строиться языки управления этими системами. Ведется работа над созданием эффективных систем управленческой документации, проблемно-ориентированных алгоритмических языков, классификаторов. Другими словами, ведется поиск эффективной знаковой системы для отображения информационных процессов в области организационного управления.

image003

image084

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций.

image021

Источник

Общие подходы к введению понятия информации.(Компьютерный, семантический, кибернетический, энтропийный)

Кибернетический(алфавитный) подход к измерению информации во многом является альтернативным содержательному и базируется на измерении количества информации в тексте (символьном сообщении), составленном из символов некоторого алфавита. Необходимо сразу заметить, что со смысловым содержанием текста такая мера информации не связана. Алфавитный подход обычно применяют для измерения информации, обрабатываемой в компьютерах и передаваемой в компьютерных сетях. При этом учителю следует напомнить учащимся о компьютерном подходе к измерению информации (если он изучался) и показать их различия.

-Что такое алфавит, мощность алфавита.

-Что такое информационный вес символа в алфавите.

-Как измерить информационный объем текста с алфавитной точки зрения.

-Что такое байт, килобайт, мегабайт, гигабайт.

-Скорость информационного потока и пропускная способность канала.

Содержательный (семантический) подходк измерению информации

При таком подходе определение бита оказывается достаточно сложным для понимания учащимися даже в старших классах. Поэтому учителю потребуется определённое время для его изложения.

-От чего зависит информативность сообщения, принимаемого человеком.

-Единица измерения информации.

-Количество информации в сообщении об одном из равновероятных событий.

При компьютерном подходек измерению информации учитель может сразу перейти к описанию представления информации в компьютере в форме двоичного кода. Затем догматически привести утверждение о том, что количество информации равно количеству двоичных цифр (битов) в таком двоичном коде. Следует рассказать учащимся о том, что информацию чаще всего кодируют с помощью последовательности сигналов двух видов, которые характеризуют два состояния: включено или выключено, намагничено или не намагничено, точка и тире и т.п.

36. Роль и место темы «системы счисления» в рамках непрерывного курса информатики в средней школе. Методика изучения темы «системы счисления» в базовом курсе информатики

В первых учебниках эта тема вообще не упоминалась, говорилось лишь о том, что вся информация представлена в двоичном виде. Лишь в следующих учебниках даются определения «Способ записи чисел с помощью заданного набора специальных знаков». В более поздних учебниках(4-го поколения) по базовому курсу тема СС находят отражение при изучении информации. Основное внимание уделяется двоичной СС и её связи с десятичной СС. Необходимость изучения этой темы в курсе информатики связана с тем, что в памяти компьютера числа представлены в двоичной СС. Данная тема вносит вклад в фундаментальное математическое образование школьников. Вопросы, изучаемые в данной теме:

-Позиционные – непозиционные ССи их основные понятия(алфавит, основание)

-развернутая форма записи числа

-перевод из одной СС в другую

-особенности двоичной арифметики

При изучении темы учитель ставит следующие цели:

-сформировать понимание различий между СС

-научить переводить числа

-научить выполнять простейшие операции

Для углубленного изучения

-научить осуществлять перевод целых и дробных чисел

-перевод из 8ричной СС в 16тиричную СС

37. Виды заданий по теме «системы счисления» (+ ЕГЭ) Методические рекомендации по решению типовых задач темы «системы счисления»

1) Дано N = 2278, M = 9916. Какое из чисел K, записанных в двоичной системе,

отвечает условию N

в логическом программировании(Пролог);

в схематическом программировании(Знакомство с логическими схемами компьютера).

обращаем внимание на то, что основой внутреннего языка компьютера является язык логики. Включение темы «основы логики» в курс информатики преследует цели: предоставить учащимся информацию, необходимую для изучения других тем; овладение школьниками логической культуры.

При изучении темы учитель ставит следующие цели:

1. Представить учащимся информацию необходимую для изучения других тем.

2. Овладение школьниками логической культуры.

-научить школьников формализировать высказывания

-выделять существенные высказывания

-научить представлять условия решения в формализированном виде

-преобразовывать логически выражения в соответствии с законами логики

-строить логическую схему устройства в соответствии заданными характеристиками

-находить ошибки в рассуждениях

При изучении данной темы ввыдятся основные понятия алгебры логики(константы, логические операции, логические выражения).

Высказывание-это повествовательное предложение, в котором что то либо утверждается, либо отрицается.

Логические величины— понятия выражаемые словами истина или ложь.

Логическая переменная— символически обозначенная логическая величина.

Логическое выражение— простые или сложные высказывания. Сложные строятся из простых с помошью связок.

Логические операци-конъюнкция, дизъюнкция, эмпликация, эквиваленция, импликация, отрацания).

39. Виды заданий по теме «Основы логики» (+ ЕГЭ) Методические рекомендации по решению задач.

1. Какое логическое выражение равносильно выражению (A \/ B) /\ C

1) A \/ B \/ C 2) A /\ B /\ C 3) (A \/ B) /\ C 4) (A /\ B) \/ C

2. Дан фрагмент таблицы истинности выражения F:

Каким выражением может быть F?

1) X /\ Y /\ Z 2) X \/ Y \/ Z 3) X \/ Y \/ Z 4) X /\ Y /\ Z

3. Перед началом турнира болельщики высказали предположения: 1) Максим победит, а Бил будет второй. 2) Бим будет третий, а Ник первый. 3) Максим будет последним, а Джон будет первым. Когда закончились соревнования, то выяснилось что в каждом высказываение есть что то верное. Кто и какое место занял.

Источник

Семантический подход к измерению информации

dark fb.4725bc4eebdb65ca23e89e212ea8a0ea dark vk.71a586ff1b2903f7f61b0a284beb079f dark twitter.51e15b08a51bdf794f88684782916cc0 dark odnoklas.810a90026299a2be30475bf15c20af5b

caret left.c509a6ae019403bf80f96bff00cd87cd

Учитывает целесообразность и полезность информации. Применяется при оценке эффективности получаемой информации и ее соответствия реальности.

В рамках этого подхода рассмотрим такие меры, как целесообразность, полезность(учитывают прагматику информации) и истинностьинформации (учитывает семантику информации).

Количество I получаемой вместе с сообщением информации с позиций ее целесообразности определяется по формуле:

image056

где p1, p2 – вероятности достижения цели после и до получения сообщения, соответственно.

Пример 1. Пусть вероятность p2 сдачи экзамена по информатике до получения сообщения (подсказки от соседа) оценивается студентом со значением 0,2. После того, как ему удалось получить подсказку, вероятность сдачи увеличилась: p1 = 0,8. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

В соответствии с приведенной формулой имеем: I = log2(0,8/0,2) = log24 = 2.

Пример 2. Пусть положение студента до получения подсказки оценивается аналогично предыдущему примеру. После получения подсказки, вопреки ожиданиям, вероятность сдачи еще уменьшилась, поскольку подсказка содержала неверную информацию: p1 = 0,1. Определить количество информации, содержащейся в подсказке, с точки зрения ее целесообразности.

Таким образом, полученная информация является дезинформацией, поскольку имеет отрицательный знак при измерении.

Зависимость усваиваемой потребителем информации от его тезауруса выражается графически следующей кривой:

image058

Как видно из графика, при тезаурусе, равном нулю и максимальному значению в точке max, информация не усваивается: в первом случае, потребителю непонятна принимаемая информация, во втором – она ему уже известна. Максимально усваивается информация (т.е. она наиболее полезна) в точке opt, когда потребитель обладает достаточным (но не максимально возможным) тезаурусом для понимания получаемой информации. При значении тезауруса i-го потребителя ТЗi количество усваиваемой им информации определяется как Iусв = f(ТЗi). Сам тезаурус ТЗi может быть практически определен как результат интеллектуального тестирования, которое проводится, например, в некоторых западных странах. При таком тестировании человеку выставляется некоторый балл, который и может расцениваться как его ТЗi.

Источник

Понравилась статья? Поделить с друзьями: