Современные компьютерные технологии

Автор работы: Пользователь скрыл имя, 06 Января 2013 в 18:36, контрольная работа

Краткое описание

Целью реферата является изучение основ современных компьютерных технологий, а также систематизировать материал вышеизложенных источников.
Достижению поставленной цели способствует раскрытие следующих задач:
1.Рассмотреть проблемы кодировки русского алфавита;
2.Изучить простой и расширенный поиск в WWW или в группах новостей Usenet, а также использование логических операторов для построения сложного запроса;
3.Выявить правила этикета в сообщениях электронной почты.

Содержание

Введение 3
§1. Проблемы кодировки русского алфавита 4
§2. Простой и расширенный поиск в WWW или в группах новостей Usenet. Использование логических операторов для построения сложного запроса 10
§3. Правила этикета в сообщениях электронной почты 15
Заключение 19
Список литературы 20

Прикрепленные файлы: 1 файл

Контрольная работа по Интернет ресурсам.doc

— 105.50 Кб (Скачать документ)

 

Содержание:

Введение 3

§1. Проблемы кодировки русского алфавита 4

§2. Простой и расширенный поиск в WWW или в группах новостей Usenet. Использование логических операторов для построения сложного запроса 10

§3. Правила этикета в сообщениях электронной почты 15

Заключение 19

Список литературы 20 

Введение

Актуальность. Наше время – это время несущихся вперед на невероятной скорости автомобилей, достижения научно-технического прогресса и, конечно же, безграничных просторов информации, которая постоянно обновляется. Всем знакомо выражение «кто владеет информацией – владеет миром». Достижению данной цели может способствовать Интернет. Ведь пользоваться Интернет – значит пользоваться сотнями тысяч печатных изданий на всей планете, быть в курсе последних событий и новинок в любой области, иметь полную и достоверную информацию по любому вопросу и возможность проконсультироваться у людей знающих.

Изученность. Тема «Основы современных Интернет-технологий» изучалась раньше, изучается и сейчас, что подтверждается трудами Хомченко А.Д., Фролова А.В., Шафрина Ю.А.

Целью реферата является изучение основ современных компьютерных технологий, а также систематизировать материал вышеизложенных источников.

Достижению  поставленной цели способствует раскрытие  следующих задач:

  1. Рассмотреть проблемы кодировки русского алфавита;
  2. Изучить простой и расширенный поиск в WWW или в группах новостей Usenet, а также использование логических операторов для построения сложного запроса;
  3. Выявить правила этикета в сообщениях электронной почты.

Структура контрольной работы: введение, основная часть, состоящая из трех параграфов, заключение и список литературы.

 

§ 1. Проблемы кодировки русского алфавита

Работая с Интернетом или с электронной  почтой, многие наверняка не раз  сталкивались с проблемой выбора кодировки для букв русского алфавита. Но что стоит за названиями типа koi-8r или UTF-8? И как 33 буквы русского алфавита представить из 26 букв английского?

Кодировка представляет собой таблицу символов, где каждой букве алфавита (а также  цифрам и специальным знакам) присвоен свой уникальный номер - код символа.1

Для представления  текста на экране ПК необходимо каждому знаку присвоить некоторое число - его код. Все современные таблицы кодировок происходят от возникшей еще в 60-е годы 7-разрядной таблицы ASCII (American Standard Code for Information Interchange), которая содержит 33 кода команд или управляющих символов, большая часть которых сегодня не используется, и 95 кодов для различных знаков, достаточных для работы с английскими текстами. При 7-разрядном кодировании каждому символу сопоставляется 7 бит, то есть число в диапазоне от 0 до 127.

Бурное  развитие в последние годы гипертекстовых способов представления информации в WWW обострили существующую уже  более десятилетия проблему представления  и работу с кириллической информацией в электронном виде. Это связано, в первую очередь, как с отсутствием стандарта на расширенную кодовую ASCII - таблицу, включающую кодировку кириллических символов, так и c разнообразием решений, предлагаемых различными коммерческими компаниями.

Стандартизирована только половина таблицы ASCII, а именно - первые 128 символов, которые включают в себя буквы латинского алфавита. И с ними никогда не бывает проблем. Вторая же половина таблицы (а всего  в ней 256 символов - по количеству состояний, который может принять один байт) отдана под национальные символы, и в каждой стране эта часть различна. Например, в России существует около 10 различных кодировок. То есть одному и тому же символу соответствует разный цифровой код, и если мы неправильно определим кодировку текста, то нашему вниманию предстанет абсолютно нечитаемый текст. И хотя эта проблема действительно существует, но на самом деле определить тип кодировки текста на практике недолго, и многие программы, например, "Штирлиц", делают это в автоматическом режиме.

Международный стандарт ISO/IEC 8859-1 стал в наши дни  заменой для ASCII. В нем первые 32 кода, числа 128-159, соответствуют почти  неиспользуемым управляющим символам, общим для всех таблиц кодировки ISO. Хотя 8859-1 может использоваться для текстов почти на всех западно-европейских языках, он не полностью покрывает нужды французского и финского. Этот недостаток, а также отсутствие знака для новой общеевропейской валюты привели в 1999 году к возникновению кодировки 8859-15, в которой использована новая редакция значений кодов 8859-1.

Что же касается кириллицы, то на сегодня существует пять базовых таблиц кодировки русских  букв:

- Для  использования с операционной  системой DOS была разработана кодовая  таблица CP-866 (IBM/Microsoft). Кодировка CP866 основана на альтернативной кодировке ГОСТ и создана специально для ОС MS-DOS, в которой используются символы псевдографики. Сегодня эта кодировка так же непопулярна, как и MS DOS.

- Для  использования в операционной  среде Windows используется кодовая таблица CP-1251 (Microsoft). Кодовая страница 1251 для Microsoft Windows стала популярной благодаря огромному влиянию фирмы Microsoft на рынок компьютерных технологий. Кроме того, в ней отсутствует ненужная в графических средах поддержка символов псевдографики и гораздо полнее, чем в других кодировках, представлены такие символы, как С, R, различные виды кавычек, тире и т. п. Эта кодовая таблица сегодня в России является основной.

- Кодовая  страница 10007 - используется на компьютерах  Macintosh и по своему набору знаков почти совпадает с CP1251.

- В  UNIX-среде наиболее распространена  кодовая таблица KOI8-R. Это одна  из стандартных кодировок русского  языка, принятых еще в Советском  Союзе на заре развития вычислительной  техники. КОИ расшифровывается как "код обмена информацией". Цифра 8 обозначает, что этот код 8-разрядный (в отличие от КОИ-7, широко применявшейся на советских вычислительных машинах). В настоящее время koi8-r является одной из основных русскоязычных кодировок в операционных системах Linux. Это вторая по популярности кодировка после CP-1251 (win). Кодировка поддерживает символы псевдографики, занимающие около половины всех кодов. В 1993 году таблица koi8-r стандартизирована в Интернете.

- Международный  стандарт ISO определяет для России кодовую таблицу ISO 8859-5. Псевдографика отсутствует. В настоящий момент эта кодировка практически не применяется. Тем не менее, ее поддержка присутствует во всех браузерах.

Для кодирования  кириллицы могут использоваться еще несколько таблиц, на сегодня архаичных и не имеющих международного статуса: Основная кодировка ГОСТ (государственный стандарт СССР) от 1987 года. - ее главный недостаток - символы псевдографики расположены не так, как на IBM PC; Альтернативная кодировка ГОСТ (отличается от CP866 по позициям 242-251); Болгарская кодировка (получается механическим внесением блока из 64 букв русского алфавита в позиции 128-191 CP437); КОИ-8 (на IBM PC не получила распространения из-за неалфавитного расположения букв кириллицы).

Для кодирования  символов некоторых языков, например китайского или японского, 8-разрядных чисел недостаточно. Кроме того, создание 8-разрядных таблиц кодировки в какой-то момент стало практически неконтролируемым: каждый новый компьютерный шрифт вводил и собственную таблицу. Именно поэтому был создан консорциум Unicode: его целью стала разработка единой системы кодирования всех возможных символов, что позволило присваивать коды знакам компьютерных шрифтов по определенной схеме.

Кодировка Unicode опирается на каталог символов UCS (Universal Character Set) стандарта ISO 10646 и может содержать до 231=2147483648 различных знаков, а также пополняться. Коды UCS-2 - двухбайтные, то есть числа от 0 до 65535, а UCS-4 - четырехбайтные, то есть числа от 0 до 2147483647. Двух- и четырехбайтные коды Unicode могут представляться двумя способами: байты располагаются слева направо от старшего к младшему (Big Endian, BE) или от младшего к старшему (Little Endian, LE). Второй способ встречается в подавляющем большинстве случаев. Кроме того, для более компактного кодирования используются коды переменной длины UTF-8 (Unicode Transfer Format) 1-6-байтные и UTF-16 - двух- или четырехбайтные. Последние также существуют в двух видах (Little и Big Endian) и позволяют кодировать не более 220+216=1114112 знаков.

Среди упомянутых кодировок наибольшее применение нашла кодировка UTF-8, которая позволяет  обходиться 8 битами для кодирования  символов ASCII и 16 битами для кодирования  символов большинства алфавитных письменностей, в том числе русской. Тексты в ASCII, в частности на английском языке, являются одновременно и текстами в UTF-8. Код UTF-8, последовательность байтов, получается из кода каталога UCS по определенной схеме. Например, символ Unicode с кодом 169 = a916 = 1010 1001 (знак c) кодируется в UTF-8 как 11000010 10101001 = c216 a916.

Unicode достаточно  полно поддерживается современными  программами - браузерами, офисными  пакетами и пр. В Linux используется UTF-8, а в Microsoft Windows - еще и UCS-2. Пока поддержка UCS в Linux несколько  слабее, чем в Windows 2000/Me/ XP. Главные проблемы при использовании Unicode - отсутствие соответствующего полного набора шрифтов и сложность ввода.

При использовании шрифтов на веб-страницах может возникнуть несколько проблем. Первая из них заключается в гармонии кодировок на сайтах и браузерах. Сайты с браузерами различных пользователей должны общаться в одной кодировке, т.е. браузер должен "понимать" то, что ему посылает сайт. Для этого на сайте нужно установить систему, которая умеет посылать сообщение о том, в какой кодировке будет пользователю прислана страница. Его браузер это сообщение должен принять и настроиться на правильное отображение сайта. При этом можно указать кодировку странички сайта непосредственно в HTML-коде. Для этого используется специальная версия META-тега с параметром charset, задающим нужный язык.

Однако  в России очень распространен  способ, при котором web-сервер автоматически  определяет, в какой кодировке  приходит запрос от клиента, и отдает страничку web-браузеру уже перекодированной. Вот тут данный META-тег может сыграть плохую шутку. Дело в том, что указания на страничке имеют приоритет по сравнению с командами, присылаемыми web-сервером, и правильно перекодировав страничку, сервер, тем не менее, не может изменить содержимое тега META. Происходит несовпадение реальной кодировки, в которой пришла кодировка, и указаниями в теге META. Такую страничку нельзя будет нормально просмотреть и перекодировать средствами браузера. Выбор кодировки вручную в данном случае не поможет, т.к. тег META имеет приоритет и над установками браузера. Единственный способ сделать это - сохранить страничку на диск, а затем удалить тэг.

В связи  с этим в РУНЕТ не рекомендуется  применять данный тэг вообще. В  таком случае просмотр будет осуществляться в той кодировке, на которую настроен браузер, если сервер не пришлет уведомление о кодировке документа. В случае несовпадения ее можно достаточно легко переключить. Кроме того, если по умолчанию на сайте выставлять кодировку Win-1251, то у большинства пользователей страничка сразу же будет показана правильно.

СОВЕТ

Одним из показателей удобочитаемости  является ширина строки документа. С  появлением мониторов, поддерживающих большое разрешение экрана, стало  возможно "укладывать" в одну строку до нескольких сотен знаков, однако строка "идеальной ширины" должна умещать порядка 50-70 знаков.

Второй  проблемой, связанной с кодировками, могут быть каскадные таблицы  стилей (CSS). Известно, что точный размер шрифта и другие его атрибуты можно  задать при помощи каскадных таблиц стилей. При использовании CSS мы можем пользоваться абсолютно любым шрифтом. Но проблема заключается в том, что шрифты берутся из набора, установленного на компьютере у пользователя, а не на сайте. То есть, наборы шрифтов на сайте и набор шрифтов пользователя могут не совпасть.

Третья  возможная проблема, когда шрифт  на сайте и на компьютере пользователя идентичен, но в одном случае он - кириллица, а во втором - латиница (нерусифицированная версия шрифта). В этом случае текст  будет отображен некими спецсимволами  и читать эти знаки будет проблематично.

Чтобы избежать подобных проблем при использовании  шрифтов в веб-дизайне, необходимо придерживаться ряда правил:

- Лучше  использовать только стандартные  шрифты, поставляемые с Windows и  гарантированно находящиеся на ПК клиента. Таких шрифтов три: "Arial", "Times New Roman", "Courier".

- Необходимо  корректно описывать шрифты в  таблице стилей (CSS) с перечислением  в списке других, заменяющих основной, шрифтов (шрифтов для замены). В конце списка должно быть  обязательное указание общего семейства шрифта (с засечками, без засечек, моноширинный и т.д.).

Из  всего вышесказанного следует вывод, что интернет-технологии накладывают  специфические ограничения на использование  шрифтов в оформлении web-документов и что с нестандартными шрифтами в web-дизайне следует работать осторожно.

 

§2. Простой и расширенный поиск в WWW или в группах новостей Usenet. Использование логических операторов для построения сложного запроса

Поисковая система – это комплекс программ и мощных компьютеров, автоматически просматривающих ресурсы Интернет, которые они могут найти, и индексирующих их содержание.2 Поисковые системы могут отличаться по эффективности поиска, по языку поиска (русский, английский и др.) и по некоторым другим возможностям. Например, одни поисковые системы находят информацию только в виде Web-страниц, другие могут просматривать и группы новостей, и файловые серверы. Результатом поиска являются гиперссылки на документы, содержащие требуемую информацию.

Информация о работе Современные компьютерные технологии