Информация и данные

Автор работы: Пользователь скрыл имя, 23 Января 2013 в 04:13, лекция

Краткое описание

Соотношение понятий «информация» и «данные». Качественные характеристики информации. Основные аспекты информации: синтаксический, семантический, прагматический. Меры и методы измерения количества информации.

Прикрепленные файлы: 1 файл

1 лекция.doc

— 58.50 Кб (Скачать документ)

Цели, задачи и содержание дисциплины, ее назначение в профессиональной деятельности. Общий обзор технических и программных средств для поддержки информационного обеспечения.

1 час

В результате освоения учебной  дисциплины обучающийся должен

уметь:

использовать изученные прикладные программные средства.

(Excel, СУБД, Консультант плюс, Логитекс-перевозки, Сайты по перевозке)

 

знать:

- виды современных  информационных технологий;

- достоинства  вычислительных  систем и глобальной сети Internet;

- программные продукты и пакеты прикладных программ, отраслевые информационные ресурсы.

80 часов 60 часов практика, 20 часов теория.

ТРЕБОВАНИЯ

Что изучали до этого?

 

Соотношение понятий «информация» и «данные». Качественные характеристики информации. Основные аспекты информации: синтаксический, семантический, прагматический. Меры и методы измерения количества информации.

1 час

Основные понятия данных, информации, знаний.

К базовым понятиям, которые  используются в информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид  информации, которая хранится в базе знаний и отображает знания специалиста  в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут  быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или  учебников, инструкций с описанием решения задач. Неформальные знания – это знания и опыт специалистов в определенной предметной области

Необходимо отметить, что универсальных определений  этих понятий (данных, информации, знаний) нет, они трактуются по-разному. Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и  знаний в процессе принятия решений  представлена на рисунке.

 

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее  полученная информация анализируется  с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы  использования информация может  быть различной: научной, технической, управляющей, экономической и т.д.

 

Получаемая информация должна быть соответствующего качества и количества.

Качество информации является одним из важнейших параметров для потребителя информации. Оно определяется следующими характеристиками:

    1. репрезентативность – правильность отбора информации в целях адекватного отражения источника информации. Например, в целях большей репрезентативности данных о себе абитуриенты стремятся представить в приемную комиссию как можно больше свидетельств, дипломов, удостоверений и другой информации, подтверждающей их высокий уровень подготовки, что учитывается при зачислении в ВУЗ;
    2. содержательность – семантическая емкость информации. Рассчитывается как отношение количества семантической информации к ее количеству в геометрической мере. Это характеристика сигнала, про который говорят, что «мыслям в нем тесно, а словам просторно». В целях увеличения содержательности сигнала, например, используют для характеристики успеваемости абитуриента не полный перечень его аттестационных оценок, а средний балл по аттестату;
    3. достаточность  (полнота) – минимальный, но достаточный состав данных для достижения целей, которые преследует потребитель информации. Эта характеристика похожа на репрезентативность, однако разница состоит в том, что в данном случае учитывается минимальный состав информации, который не мешает принятию решения. Например, абитуриент – золотой медалист может не представлять в приемную комиссию свой аттестат: диплом, подтверждающий получение золотой медали, свидетельствует о полном наборе отличных оценок в аттестате;
    4. доступность – простота (или возможность) выполнения процедур получения и преобразования информации. Эта характеристика применима не ко всей  информации, а лишь к той, которая не является закрытой. Для обеспечения доступности бумажных документов используются различные средства оргтехники для их хранения, а для облегчения их обработки используются средства вычислительной техники;
    5. актуальность – зависит от динамики изменения характеристик информации и определяется сохранением ценности информации для пользователя в момент ее использования. Очевидно, что касается информации, которая используется при зачислении, она актуальна, так как само обучение уже закончилось, и его результаты изменены быть не могут, а, значит, остаются актуальными;
    6. своевременность – поступление не позже заранее назначенного срока. Этот параметр также очевиден недавним абитуриентам: опоздание с представлением позитивной информации о себе при поступлении может быть чревато незачислением;
    7. точность – степень близости информации к реальному состоянию источника информации. Например, неточной информацией является медицинская справка, в которой отсутствуют данные о перенесенных абитуриентом заболеваниях;
    8. достоверность – свойство информации отражать источник информации с необходимой точностью. Эта характеристика вторична относительно точности. В предыдущем примере получаемая информация недостоверна;
    9. устойчивость – способность информации реагировать на изменения исходных данных без нарушения необходимой точности.

 

Передаваемое сообщение  должно быть представлено в виде последовательности символов некоторого алфавита. Синтаксический аспект касается формальной правильности сообщения с точки зрения синтаксических правил используемого языка безотносительно к его содержанию.

Семантический аспект передает смысловое содержание информации и соотносит её с ранее имевшейся информацией. Знания об определенной предметной области фиксируются в форме тезауруса, то есть совокупности понятий и связей между ними. При получении информации тезаурус может изменяться. Степень этого изменения характеризует воспринятое количество информации. Семантический аспект определяет возможность достижения поставленной цели с учетом полученной информации, т.е. определяет ценность информации.

Количество информации, содержащейся в некотором сообщении, можно оценить степенью изменения индивидуального тезауруса получателя под воздействием данного сообщения. Иными словами, количество информации, извлекаемой получателем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации. Если индивидуальный тезаурус получателя сообщения не пересекается с тезаурусом отправителя, то получатель не понимает сообщение и для него количество принятой информации равно нулю. Такая ситуация аналогична прослушиванию сообщения на неизвестном языке. Несомненно, что сообщение не лишено смысла, однако оно непонятно, а значит, не информативно. Если тезаурусы отправителя и получателя совпадают, то количество информации в сообщении также будет равно нулю, поскольку его получатель знает абсолютно всё о предмете. В этом случае сообщение не дает ему ничего нового. Сообщение несет информацию для получателя только в том случае, когда их тезаурусы пересекаются частично.

Человек сначала наблюдает некоторые факты, которые отображаются в виде набора данных. Здесь проявляется синтаксический аспект. Затем после структуризации этих данных формируется знание о наблюдаемых фактах, которое фиксируется на некотором языке. Это семантический аспект информации. Полученное знание и созданные на его основе информационные модели человек использует в своей практике для достижения поставленных целей.

В реальной жизни часто  возникает ситуация, когда даже наличие  полной информации не позволяет решить поставленную задачу. Прагматический аспект информации проявляется в возможности её практического использования.

Таким образом, не любое  сообщение несет информацию. Для  того чтобы сообщение несло некоторую  информацию, и было полезно получателю, оно должно быть:

  • записано на некотором языке;
  • этот язык должен быть понятен получателю;
  • получатель должен обладать методом извлечения информации из сообщения;
  • сообщение должно снижать степень неопределенности относительно объекта, который интересует получателя;
  • сообщение должно помогать ему решить поставленную задачу;
  • получатель должен обладать реальной практической возможностью использовать полученную информацию.

 

Для измерения количества информации нужна единица измерения.

В качестве единицы информации К. Шеннон предложил принять такое количество информации, при котором неопределенность уменьшается в 2 раза. Такая единица названа бит (англ. bit — binary digit — двоичная цифра).

Бит в теории информации — количество информации, необходимое  для различения двух равновероятных сообщений (типа «орел – решка», «чет – нечет» и т.п.).

В вычислительной технике  битом называют наименьшую «порцию» памяти компьютера, необходимую для  хранения одного из двух знаков «0»  и «1», используемых для внутримашинного  представления данных и команд.

Информационный объем сообщения — количество двоичных символов, используемое для кодирования этого сообщения.

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица  — байт, равная 8 бит. Именно 8 бит требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256 = 28).

1 байт = 8 бит

Широко используются также еще более крупные производные  единицы информации:

1 килобайт (Кбайт) = 1024 байт = 210 байт;

1 мегабайт (Мбайт) = 1024 Кбайт = 220 байт;

1 гигабайт (Гбайт) = 1024 Мбайт = 230 байт.

В последнее время  в связи с увеличением объёмов  обрабатываемой информации входят в  употребление такие производные  единицы, как:

1 терабайт (Тбайт) = 1024 Гбайт = 240 байт;

1 петабайт (Пбайт) = 1024 Тбайт = 250 байт.




Информация о работе Информация и данные