Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Информатика, автоматизированные информационные технологии и системы

Покупка
Основная коллекция
Артикул: 138800.12.01
К покупке доступен более свежий выпуск Перейти
В первой части книги, «Информатика», даны история развития вычислительной техники и становления информатики, вопросы представления, измерения и хранения информации, системы счисления, логические основы, архитектура и устройства ЭВМ, основные понятия операционных систем и их файловая структура, системное и прикладное программное обеспечение. Особое внимание уделено основам знаний по алгоритмизации, технологии программирования, языкам программирования, а также системе объектно-ориентированного программирования MS Visual Basic. Во второй части книги, «Информационные технологии», излагаются вопросы компьютерной обработки текстовой, числовой, графической информации, основы баз данных и знаний, систем управления базами данных (СУБД), даются представление о локальных и глобальных компьютерных сетях и знания о средствах создания веб-документов. Третья часть книги, «Автоматизированные информационные системы», посвящена вопросам разработки и функционирования АИС. Рассматриваются вопросы необходимости автоматизации информационных потоков, состав и структура АИС, методы и стадии их разработки, обеспечивающая и функциональные части, типы АИС, тенденции развития информационных систем. Для подготовки студентов учреждений среднего профессионального образования и вузов, обучающихся по техническим специальностям.
9
235
244
Гвоздева, В. А. Информатика, автоматизированные информационные технологии и системы : учебник / В.А. Гвоздева. — Москва : ФОРУМ : ИНФРА-М, 2021. — 542 с. — (Среднее профессиональное образование). - ISBN 978-5-8199-0856-3. - Текст : электронный. - URL: https://znanium.com/catalog/product/1190684 (дата обращения: 29.03.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
ИНФОРМАТИКА,

АВТОМАТИЗИРОВАННЫЕ

ИНФОРМАЦИОННЫЕ 

ТЕХНОЛОГИИ И СИСТЕМЫ

В.А. Гвоздева

Рекомендовано Учебно-методическим советом СПО 

в качестве учебника для студентов учебных заведений, 

реализующих программу среднего профессионального образования 

по техническим специальностям

УЧЕБНИК

Москва 

ИД «ФОРУМ» — ИНФРА-М

2021

УДК 004(075.32)
ББК 32.81я723
 
Г25

Гвоздева В.А.

Г25 
 
Информатика, автоматизированные информационные техноло
гии и системы : учебник / В.А. Гвоздева. — Москва : ИД «ФОРУМ» : 
ИНФРА-М, 2021. — 542 с. — (Среднее профессиональное образование).

ISBN 978-5-8199-0856-3 (ИД «ФОРУМ»)
ISBN 978-5-16-014687-4 (ИНФРА-М, print)
ISBN 978-5-16-107194-6 (ИНФРА-М, online)

В первой части книги, «Информатика», даны история развития вычи
слительной техники и становления информатики, вопросы представления, измерения и хранения информации, системы счисления, логические 
основы, архитектура и устройства ЭВМ, основные понятия операционных 
систем и их файловая структура, системное и прикладное программное 
обеспечение. Особое внимание уделено основам знаний по алгоритмизации, технологии программирования, языкам программирования, а также 
системе объектно-ориентированного программирования MS Visual Basic. 
Во второй части книги, «Информационные технологии», излагаются вопросы компьютерной обработки текстовой, числовой, графической информации, основы баз данных и знаний, систем управления базами данных 
(СУБД), даются представление о локальных и глобальных компьютерных 
сетях и знания о средствах создания веб-документов. Третья часть книги, 
«Автоматизированные информационные системы», посвящена вопросам 
разработки и функционирования АИС. Рассматриваются вопросы необходимости автоматизации информационных потоков, состав и структура 
АИС, методы и стадии их разработки, обеспечивающая и функциональные части, типы АИС, тенденции развития информационных систем. 

Для подготовки студентов учреждений среднего профессионального 

образования и вузов, обучающихся по техническим специальностям.

УДК 004(075.32)

ББК 32.81я723

Р е ц е н з е н т ы:

Иванов М.И. — кандидат технических наук, доцент, заведующий кафед
рой информатики и компьютерных технологий Государственного университета морского и речного флота имени адмирала С.О. Макарова;

Гагарина Л.Г. — доктор технических наук, профессор кафедры инфор
матики и программного обеспечения вычислительных систем Национального исследовательского университета «Московский институт электронной техники» 

ISBN 978-5-8199-0856-3 (ИД «ФОРУМ»)
ISBN 978-5-16-014687-4 (ИНФРА-М, print)
ISBN 978-5-16-107194-6 (ИНФРА-М, online)

© Гвоздева В.А., 2015
© ИД «ФОРУМ», 2018

Введение

Современная цивилизация характеризуется тем, что наиболее развитая ее часть находится в переходе от индустриального к 
информационному обществу, построенному на использовании 
большого объема информации и знаний всеми его членами. Информация во многих организациях становится ключевым ресурсом, а информационная обработка — делом огромной важности. 
Современный уровень информатизации общества предопределяет использование новейших технических, технологических, программных средств, т. е. автоматизированных информационных 
технологий и систем.

Основным направлением современной информатики как 
науки является исследование методологии информационной 
деятельности в условиях широкого применения компьютерной и 
телекоммуникационной техники для конкретных приложений.

Исследования в теории информации, развитие интегральных 
информационных систем, информационных технологий, электронных библиотек, их объединение с системами управления документами и бизнес-процессами позволило создать новый тип 
сложных корпоративных, отраслевых и межотраслевых систем 
управления на основе активного сетевого взаимодействия в ин- 
тернет/интранет-технологиях.

Изучение проблем в контексте исследований информации, информационных потоков, информационных технологий (ИТ), автоматизированных информационных систем (АИС), автоматизированных информационных технологий (АИТ), автоматизированных 
систем управления (АСУ) и т. п. и всего, что с ними связано, проводится Всероссийским институтом научной и технической информации Российской Академии наук (ВИНИТИ РАН). Он осуществляет тестирование автоматизированных информационных систем, 
формирует отчеты и отправляет их компании-производителю.

АИС представляют собой системы, основанные на постоянно 
развивающихся концепциях использования информации. Напри4
Введение

мер, сегодня информационно-поисковые системы (ИПС) являются наиболее мощным механизмом поиска сетевых информационных ресурсов. Наиболее крупные международные поисковые 
системы — Google, Yahoo!, MSN, OpenText, AltaVista и др., в русском Интернете (Рунете) — Яндекс, Rambler, Апорт. О крупных 
международных поисковых системах в российском Интернете см. 
разделы 1.1, 7.1.1,10.1 идр.

В настоящее время поисковые системы представляют собой 
не только инструменты поиска информации, но и сферы для 
бизнеса.

Например, Yahoo!, созданная в 1994 г., — на сегодняшний 
день самый старый и наиболее полный каталог интернет-ресурсов — является одним из самых популярных поисковых средств, 
имеет базу данных более 1 млн проиндексированных сайтов. 
Yahoo! обладает большим количеством всевозможных сервисов:

• Yahoo.mail (почта) — бесплатный почтовый ящик для каждого желающего;

• Yahoo.messenger (сообщения)— клиент для общения в сети 
Интернет;

• Yahoo.radio (радио) — прослушивание радиопрограмм через Интернет;

• Yahoo.Answers (ответы) — любой зарегистрированный желающий может оставить свой вопрос на сайте, и другие 
пользователи смогут на него ответить;

• Yahoo.autos (автомобили) — огромный каталог автомобилей, как новинок, так и б/у. Здесь можно найти последние 
новости мирового автопрома, купить или продать автомобиль;

• Yahoo.Finance (финансы) — любая информация в сфере 
финансов. Новости, прогнозы, личные финансы и даже 
возможность разослать свое резюме;

• Yahoo.games (игры) — игры на любой вкус, как платные, 
так и свободно распространяемые;

• Yahoo.groups (группы) — портал представляет собой каталог сообществ по интересам;

• Yahoo.hotjobs (горячие вакансии) — сервис работодате- 
лей/соискателей, позволяющий им найти друг друга;

• Yahoo.maps (карты) — аналог сервиса google.maps, но карты несколько устарели по сравнению с google.maps, разница по сравниваемой местности где-то года в четыре;

Введение
5

• Yahoo.mobile (мобильные устройства) — всевозможные программы для вашего смартфона, КПК или коммуникатора;

• Yahoo.movies (кино) — все о кино, анонсы, отзывы, рекомендации, трейлеры;

• Yahoo.music (музыка) — музыка, видеоклипы, новости, 
анонсы;

• Yahoo.omg — актуальные фото и видео знаменитостей. 
Можно оставить комментарии к фотографиям;

• Yahoo.personals — сайт знакомств от Yahoo!. Огромная база 
пользователей из множества стран;

• Yahoo.real estate (недвижимость) — сайт, посвященный недвижимости. Можно найти объект для покупки/продажи 
недвижимости, проследить изменение цен и тенденций на 
рынке недвижимости;

• Yahoo.shopping (покупки) — каталог товаров, позволяющий 
не рыться в Интернете в поисках товара, а найти его тут и 
немедленно перейти на сайт продавца;

• Yahoo.sports (спорт) — все о спорте. Результаты игр, турнирные таблицы, лучшие игроки, самые последние новости;

• Yahoo.travel (путешествия) — подборка информации обо 
всех возможных маршрутах и направлениях для путешествий, стоимости проживания в местных гостиницах;

• Yahoo.TV (ТВ) — программы передач, анонсы, премьеры, 
новости индустрии и видеоматериалы;

• Yahoo.yellow pages (Желтые страницы) — справочник адресов и телефонов предприятий, фирм и частных предпринимателей;

• Yahoo.buzz (аналог dig.com) — любой желающий может добавить свою новость или ссылку на новость из Сети. Можно проголосовать за новость других участников и тем самым способствовать появлению этой новости на главной 
странице;

• Yahoo.shine — портал обо всем.
Из перечисленных функций системы видно, что они охватывают множество сфер жизнедеятельности людей.

Поисковый запрос в системах должен быть сформулирован 
пользователем в соответствии с тем, что он хочет найти, максимально кратко и просто. А поисковая система доставляет людям 
именно ту информацию, которую они ищут. Научить пользователей делать «правильные» запросы к системе, т. е. запросы, соответствующие принципам работы поисковых систем, невоз6
Введение

можно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить 
пользователям искомую ими информацию. Это означает, что поисковая система «думает» так же, как думает пользователь при 
поиске информации.

Автоматизированные информационные системы оказывают 
влияние на многие характеристики работы организаций, они повышают:

• производительность труда, т. е. скорость и качество выполнения различных задач;

• функциональную эффективность, т. е. эффективность выполнения различных функций;

• качество обслуживания клиентов;
• создание и улучшение продукции;
• качество распределения продукции, закрепление клиентов 
и др.

В последнее время повысилась роль персональных ЭВМ, 
призванных существенно увеличить производительность личного труда непосредственно в процессе производства и управления. Преимущества создаются также за счет телекоммуникаций, 
локальных, глобальных, корпоративных сетей. С помощью информационных технологий переключение компьютера с построения диаграммы на разработку стандартного контракта или 
с разработки архитектурного проекта на создание карты погоды 
земного шара осуществляется простым изменением последовательности команд, управляющих его работой.

Взаимодействие персональных ЭВМ с сетями малых высокопроизводительных ЭВМ позволяет обеспечить потребителя необходимой информацией для управления с рабочего места, из 
дома, транспорта и т. д. Сегодня уже имеются готовые инструментальные программные средства, которые позволяют разрабатывать собственные проблемно-ориентированные продукты — 
пакеты прикладных программ. Для этого необходимо прежде 
всего быть хорошим специалистом в своей области, а также владеть навыками программирования.

Специалисты должны хорошо знать требования стандартов, 
сформированных по предметным областям в Общероссийском 
классификаторе стандартов. Например:

01.140 Информатика. Издательское дело
35 Информационные технологии. Машины конторские
35.020 Информационные технологии

Введение
7

35.040 Наборы знаков и кодирование информации
35.060 Языки, используемые в информационных технологиях
35.080 Программное обеспечение
35.110 Организация сети
35.140 Компьютерная графика
35.160 Микропроцессорные системы
35.180 Информационно-технологические терминалы и другие периферийные устройства...

35.200 Интерфейсы и межсоединительные устройства
35.220 Запоминающие устройства
35.240 Применение информационных технологий
25.040 Промышленные автоматизированные системы и др. 
Любая информационная система подразумевает участие в ее

работе людей — персонала, имеющего отношение к информационным системам. Выделяют такие категории персонала, как конечные пользователи, программисты, системные аналитики, администраторы баз данных и др. Программистом традиционно 
называют человека, который составляет программы. Человека, 
использующего результат работы компьютерной программы, называют конечным пользователем. Системный аналитик — это 
специалист, оценивающий потребности пользователей в применении компьютера, а также проектирующий информационные 
системы, которые соответствуют этим потребностям.

В сфере экономического менеджмента с информационными 
системами работают две категории специалистов: управляющие 
(конечные пользователи) и специалисты по обработке данных. 
Специалисты по обработке данных профессионально анализируют, проектируют и разрабатывают систему. Выпускники высших 
и средних профессиональных учебных заведений не могут рассчитывать на хорошую работу, если они не имеют навыков работы на компьютере, не владеют информационными технологиями, не обладают знаниями об АИС и АСУ.

Книга поможет студентам в приобретении таких знаний, ознакомит студентов с теоретическими и практическими основами 
информатики, информационных автоматизированных технологий и систем.

В первой части книги представлены темы, посвященные истории развития вычислительной техники и становлению информатики, вопросам представления, измерения и хранения информации, системам счисления, логическим основам, архитектуре и 
устройствам ЭВМ, основным понятиям операционных систем и

Введение

их файловой структуре, системному и прикладному программному обеспечению. Особое внимание уделено основам знаний по 
алгоритмизации, технологии программирования, языкам программирования, а также системе объектно-ориентированного 
программирования MS Visual Basic.

Во второй части книги темы посвящены информационным 
технологиям. Излагаются вопросы компьютерной обработки 
текстовой, числовой, графической информации, основы баз данных и знаний, систем управления базами данных (СУБД), дается 
представление о локальных и глобальных компьютерных сетях и 
знания о средствах создания веб-документов.

Третья часть книги посвящена вопросам разработки и функционирования автоматизированных информационных систем 
(АИС). Рассматриваются вопросы необходимости автоматизации 
информационных потоков, состав и структура АИС, методы и 
стадии их разработки, обеспечивающая и функциональные части, типы АИС, тенденции развития информационных систем.

Материал книги позволит студентам приобрести базовые знания и применять их на современном уровне в учебной и дальнейшей производственной деятельности.

Часть I
ИНФОРМАТИКА

Глава 1
ОСНОВНЫЕ ПОНЯТИЯ ИНФОРМАТИКИ

1.1. История развития информатики

Информатика — наука об общих свойствах и закономерностях информации, а также о методах ее поиска, передачи, хранения, обработки и использования в различных сферах деятельности человека. Как наука сформировалась в результате появления 
ЭВМ. Включает в себя теорию кодирования информации, разработку методов и языков программирования, математическую 
теорию процессов передачи и обработки информации.

Становление информатики как научной дисциплины относится к периоду создания, массового производства и широкого 
внедрения в практику быстродействующих автоматизированных 
электронных средств обработки информации.

В самом общем смысле под информатикой понимают фундаментальную естественную науку, изучающую процессы передачи, хранения и обработки информации.

Такое понятие информатики охватывает области, связанные 
с разработкой, созданием, использованием и обслуживанием 
систем обработки информации, включая машины, оборудование, математическое и программное обеспечение и организационные аспекты.

Главным в указанном определении, составляющим основу 
современного содержания информатики, является ЭВМ и ма10
Часть I. Информатика

шинная обработка информации. Отсюда следует, что основное 
содержание информатики составляют три неразрывно связанные 
между собой части: технические, алгоритмические и программные средства.

Понятие информации рассматривалось еще античными философами. После промышленной революции суть информации, 
вопросы теории информации стала рассматривать новая наука — 
кибернетика.

Кибернетика — наука об общих закономерностях в управлении и связи в различных системах: искусственных, биологических, социальных, — начала бурно развиваться после Второй мировой войны. В 1948 г. американский математик Норберт Винер 
выпустил книгу «Кибернетика, или Управление и связь в животном и машине». В ней показаны пути создания общей теории 
управления и связи. Развиваясь вместе с развитием ЭВМ, кибернетика со временем превращалась в общую науку о преобразовании информации. Можно сказать, что информатика вышла из 
кибернетики.

Под информацией в кибернетике понимается любая совокупность сигналов, воздействий или сведений, которые некоторой 
системой воспринимаются от окружающей среды (входная информация), выдаются в окружающую среду (выходная информация), а также хранятся в себе (внутренняя, внутрисистемная информация).

В нашей стране развитие кибернетики встретило идеологические препятствия, что нанесло серьезный ущерб развитию 
этой науки у нас. Так, в Философском словаре 1959 г. кибернетика характеризовалась как «буржуазная лженаука».

В мировой науке вскоре вслед за появлением термина «кибернетика» стало использоваться понятие Computer Science, а на рубеже 1960—1970-х гг. французы ввели термин Informatique. У нас 
в стране этот термин связывался с информационно-аналитической деятельностью в библиотечном деле, книгоиздании и т. п. 
Но сейчас, по словам академика А. П. Ершова, термин «информатика» «вводится в русский язык в новом и куда более широком 
значении — как название фундаментальной естественной науки, 
изучающей процессы передачи и обработки информации».

Информатика неразрывно связана с вычислительной техникой, компьютерными системами и сетями, так как именно компьютеры позволяют порождать, хранить и автоматически перерабатывать информацию в таких количествах, что научный подГлава 1. Основные понятия информатики
11

ход к информационным процессам становится одновременно 
необходимым и возможным.

Термин «информатика» еще не является общепринятым. Обратимся к истории.

В начале прошлого века появились новые концептуальные 
идеи, которые по-новому представляли картину мира. Речь шла 
об информационном факторе. На первый план стали выступать 
не отдельные предметы и явления, а их взаимозависимости. Это 
стало возможным благодаря появлению новых идей и подходов, 
которые объединяются единым понятием «формализм». Его основные черты:

• явное разделение содержательного и знакового аспектов 
изучаемого объекта;

• возможность формального преобразования знаков и знаковых систем;

• множественность интерпретаций знаков и знаковых систем.
Идеи формального преобразования знаковых систем привели к мысли об автоматизации и воплощении ее на ЭВМ.

В 1978 г. Международный конгресс по информатике дал такое 
определение: «Понятие информатики охватывает области, связанные с разработкой, созданием, использованием и материально-техническим обслуживанием систем обработки информации, 
включая машины, оборудование, математическое обеспечение, 
организационные аспекты, а также комплекс промышленного, 
коммерческого, административного и социального воздействия». 
Как наука информатика изучает общие закономерности, свойственные информационным процессам в системах различной природы. Прикладное значение ее в том, что она охватывает почти 
все виды человеческой деятельности: производство, управление, 
науку, образование, проектные разработки, торговлю, финансовую сферу, медицину, криминалистику, охрану окружающей 
среды.

Информатика и кибернетика имеют много общего, но у них 
есть и различия. За кибернетикой сохраняется исследование общих законов движения информации в производственных системах, а информатика изучает способы и приемы переработки, передачи и использования информации. Некоторые ученые считают кибернетику составной частью информатики.

Но природа информации не имеет значения, когда разрабатываются новые носители информации, каналы связи, приемы 
кодирования, визуального отображения информации и многое

Часть I. Информатика

другое. Для разработчика СУБД, например, важны общие принципы организации и эффективность поиска данных, а не то, 
какие конкретные данные будут затем заложены в базу многочисленными пользователями. Эти общие закономерности есть 
предмет информатики как науки. Объектом приложений информатики являются самые разные области человеческой деятельности, для которых она стала источником современных технологий, 
называемых «новые информационные технологии». Имея общие 
черты, они существенно различаются между собой. Реализованы 
информационные технологии могут быть как самостоятельно, 
так и в рамках автоматизированных информационных систем 
различных предметных областей. Примеры реализации информационных технологий приведены в разделе 4.2 и части III.

Составные части информатики:
1. Теоретическая информатика. Использует математические 
методы для изучения процессов обработки информации. Включает ряд математических разделов: математическую логику, теорию алгоритмов и автоматов, теорию информации и кодирования, теорию формальных языков и грамматик, исследование 
операций и др.

2. Вычислительная техника. Разрешает общие принципы построения вычислительных систем, принципы решения по архитектуре вычислительных систем (состав, назначение, функциональные возможности и принципы взаимодействия устройств).

3. Программирование. Разработка ПО (системного и прикладного).

4. Информационные системы. Решают вопросы анализа потоков информации в сложных системах, их оптимизации, структурирования, принципов хранения и поиска информации (Интернет, гипертекстовые поисковые системы в Сети, справочная система 09 и др.).

5. Искусственный интеллект. Область, в которой решаются 
сложнейшие проблемы; находится на пересечении с психологией, физиологией, лингвистикой и другими науками. Моделирование рассуждений, компьютерная лингвистика, машинный перевод, экспертные системы, распознавание образов и др. Общение человека с ПЭВМ должно стать похоже на межчеловеческое.

Дальнейшее развитие информатики предполагает массовое 
использование так называемых информационных роботов — новых систем поиска и обработки информации по Сети, в основе 
которых не только алгоритм прохода по Сети и поиска нужной

Глава 1. Основные понятия информатики
13

информации, но и элементы экспертной системы, позволяющей 
проанализировать искомую информацию и даже подготовить конечный результат в форме, подходящей для презентации. Такие 
системы помогут в подготовке любых документов — от школьного реферата или студенческого диплома до серьезного аналитического обзора.

Система мировой компьютерной коммуникации — это не 
только новая компьютерная технология передачи информации 
на любые расстояния. Это еще и особый мир, живая информационная среда, в которой с помощью средств связи, а точнее систем передачи данных, объединяются в единое целое источники, 
средства обработки и потребители информации. Это мир, в котором все люди, независимо от того, близко или далеко они находятся от центров обработки и хранения информации, имеют равные возможности доступа к ней.

Информационные технологии все активнее начинают вторгаться в различные сферы человеческой деятельности — в науку, 
производство, банковское дело, образование, здравоохранение и 
даже в домашний быт. Все больше людей во всем мире начинают 
работать с информацией, используя для этого телекоммуникации. Киберпространство и виртуальная реальность, которые постепенно входят в нашу жизнь, приобщают нас к информационным ресурсам всего человечества, расширяют наш кругозор и меняют сам образ жизни.

Одним из наиболее ярких явлений этого процесса является 
возникновение и бурное развитие глобальной информационной 
компьютерной сети Интернет. При появлении Интернета наиболее остро встала проблема поиска в нем нужных данных. Эта 
проблема послужила поводом к появлению поисковых машин.

Любая АИПС состоит из двух основных частей: формирователя собственной базы данных и генератора ответов на запросы 
пользователей. Главными показателями для первой части являются ее объем и продуманность внутренней структуры, а для 
второй — скорость поиска информации и удобство пользования. 
Функциональная гибкость запросов изначально зависит от 
структуры базы данных (БД): невозможно запросить что-то, что 
не было заложено в алгоритмы. Для просмотра и поиска в БД 
поисковых систем вводят индексацию внутренней структуры. 
Упрощенно под индексом можно понимать инструмент, помогающий существенно ускорить поиск (алгоритмы, способы обращения к большим объемам информации, способы упорядочения

Часть I. Информатика

и хранения данных и т. д.). Важно также, чтобы запрос был максимально конкретным. Тогда клиент получит наиболее точный 
результат.

Поисковые системы в Интернете обычно состоят из следующих компонентов:

• агент (поисковый робот, «паук»), который перемещается 
по Сети и собирает информацию;

• база данных, которая содержит всю информацию, собираемую поисковыми роботами;

• поисковый механизм, который используется как интерфейс для взаимодействия с базой данных.

Агенты — самые «интеллектуальные» из поисковых средств. 
Они могут просто искать, выполнять ваши транзакции, могут искать сайты специфической тематики и возвращать списки сайтов, отсортированных по их посещаемости. Агенты могут обрабатывать содержание документов, находить и индексировать страницы и другие виды ресурсов и т. д.

Поисковые роботы осуществляют общий поиск информации 
в Сети, сообщают о содержании найденного документа, индексируют его и извлекают итоговую информацию, просматривают 
заголовки, некоторые ссылки и посылают проиндексированную 
информацию в БД.

Роботы могут быть запрограммированы так, чтобы переходить по различным ссылкам разной глубины вложенности, выполнять индексацию и даже проверять ссылки в документе.

Средства поиска и структурирования, иногда называемые поисковыми механизмами (машинами), используются для того, 
чтобы помочь людям найти информацию, в которой они нуждаются. Средства поиска типа агентов, «пауков» и роботов используются для сбора информации о документах. Это специальные 
программы, которые занимаются поиском страниц в Сети, извлекают гипертекстовые ссылки на этих страницах и автоматически 
индексируют информацию, которую они находят, для построения 
базы данных. Каждый поисковый механизм имеет собственный 
набор правил, определяющих, как собирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и 
затем исследуют каждую ссылку на каждой из новых страниц. Некоторые игнорируют ссылки, которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют 
ссылки к ресурсам определенного типа баз данных; третьи просматривают прежде всего наиболее популярные страницы.

Глава 1. Основные понятия информатики
15

Администраторы поисковых систем могут определить, какие 
сайты или типы сайтов агенты должны посетить и проиндексировать. Проиндексированная информация отсылается базе данных поискового механизма. Люди могут помещать информацию 
прямо в индекс, заполняя особую форму для того раздела, в который они хотели бы поместить свою информацию. Эти данные 
передаются БД.

Для поиска информации, доступной в Интернете, пользователь посещает страницу поисковой системы и заполняет форму, 
детализирующую информацию, которая ему необходима. Здесь 
могут использоваться ключевые слова, даты и другие критерии. 
Критерии в форме поиска должны соответствовать критериям, 
используемым агентами при индексации информации, которую 
они нашли при перемещении по Сети. БД отыскивает предмет 
запроса и выводит соответствующие документы. Чтобы определить порядок, в котором список документов будет показан, БД 
применяет алгоритм ранжирования. В идеальном случае документы, наиболее релевантные пользовательскому запросу, будут 
размещены первыми в списке. Различные поисковые системы 
используют различные алгоритмы ранжирования, однако основные принципы определения релевантности следующие.

1. Количество слов запроса в текстовом содержимом документа (т. е. в HTML-коде).

2. Теги (управляющие символы), в которых эти слова располагаются.

3. Местоположение искомых слов в документе.
4. Удельный вес слов, относительно которых определяется 
релевантность, в общем количестве слов документа.

БД выводит ранжированный список документов и возвращает его человеку, сделавшему запрос. Разные поисковые механизмы также выбирают различные способы показа полученного 
списка. Некоторые показывают только ссылки; другие выводят 
ссылки с первыми несколькими предложениями, содержащимися в документе, или заголовок документа вместе со ссылкой. 
При щелчке по ссылке к одному из документов этот документ 
запрашивается у соответствующего сервера.

Рассмотрим АИС на примере поисковой системы Rambler — 
одной из старейших. Она содержит информацию о более чем 
12 млн документов, расположенных на серверах России и стран 
СНГ. Rambler ежесуточно обрабатывает не менее 500 тыс. поисковых запросов (5 запросов в секунду), сканируя 48 тыс. веб-сер16
Часть I. Информатика

веров и используя несколько одновременно работающих про- 
грамм-роботов.

Запрос может состоять из одного или нескольких слов, разделенных пробелами. Могут быть использованы как русские, так и 
английские слова и словосочетания. По умолчанию находятся 
только те документы, в которых встретились все введенные слова. Чтобы найти документы, содержащие хотя бы одно слово из 
запроса, используют логическую связку ИЛИ (Ог) либо выбирают на странице детального запроса: Слова запроса: любое. Чтобы 
исключить документы, содержащие те или иные слова, их следует указать на странице детального запроса: Исключить документы, 
содержащие следующие слова....

Регистр при построении запроса не имеет значения.
Слова запроса могут быть соединены логическими связками 
И (And), ИЛИ (Or). Вместо связок (или в сочетании с ними) могут использоваться также символы & и | соответственно. Части 
запроса могут быть сгруппированы с помощью круглых скобок. 
Возможна многократная вложенность скобок в сочетании с логическими операторами.

Rambler умеет искать слова во всех формах (например, издательство, издательства, издательством и т. д.). Чтобы слово находилось во всех формах, перед ним надо поставить служебный символ #. В меню детального запроса такой режим может быть включен для всех слов: Расширение запроса: все формы слов. Служебный 
символ @ перед словом позволяет находить не только это слово, но 
и однокоренные слова. В меню детального запроса символу @ соответствует режим Расширение запроса: все однокоренные.

Чтобы уменьшить «шум» в найденных документах, по умолчанию система ищет слова запроса так, как они были введены. 
Для обозначения произвольной части слова и произвольного 
символа или расширения запроса, можно использовать метасимволы * и ?. Ограничить поиск частями документов можно через 
меню детального запроса Искать в.... Чтобы ограничить поиск 
документами только на русском или только на английском языке, надо выбрать соответствующий режим в меню детального запроса Язык документа.... По умолчанию поиск выполняется по 
документам на всех языках. По умолчанию найденные документы сортируются по релевантности (соответствию запросу). Однако можно указать, чтобы вместо этого в начало списка были помещены самые свежие (или, наоборот, самые старые документы), 
для этого надо выбрать соответствующую установку в меню СорГлава 1. Основные понятия информатики
17

тировать по... на странице детального запроса. Ограничение поиска документов определенным периодом времени достигается 
указанием на странице детального запроса значений От даты ... 
до даты....

В 1993 г. А. Волок и И. Сегалович предложили технологию 
поиска неструктурированной информации с учетом русского 
языка. В 1996 г. линейку программ для этого поиска назвали Яндексом (Языковый Индекс). В 1997 г. была запущена одноименная поисковая система (www.yandex.ru), которая является одной 
из самых посещаемых (ежедневно около 9 млн человек). В настоящее время Яндекс — крупнейший информационный портал 
русскоязычного Интернета (Рунета), предоставляющий поисковый сервис, бесплатную почту, новости, каталоги товаров, платежную систему и многое другое.

Робот Яндекса обходит Сеть за несколько дней и индексирует 
открытую часть Сети — страницы, которые доступны при переходе по ссылке, без ввода логина и пароля. По мере роста системы 
основная нагрузка ложится уже не на индексирующего робота, а 
на поиск и выдачу результатов. Первичная индексация позволяет 
появиться странице уже через 2—4 ч в результатах поиска. На 
полную индексацию страница ставится в очередь. Качественный 
поиск обеспечивается тщательной лингвистической и технической проработкой текстов. Яндекс постоянно совершенствует алгоритм расчета релевантности (меры соответствия результатов 
поиска поставленному запросу) страниц. Поисковая машина проводит не только анализ текста, но и учитывает положение страницы на сайте, авторитетность источника, частоту обновления, ци- 
тируемость страниц. Яндекс ежедневно решает проблемы корректного ранжирования, обновления и синхронизации индекса, 
работы с различными языками и кодировками, дублирующейся 
информации, обновления базы данных и др.

Яндекс разрабатывает полезные веб-сервисы, различные программы: как бесплатные приложения для массового пользователя, так и коммерческие серверные решения.

Имеются программы:
• для поиска по веб-сайту или локальной сети с учетом морфологии русского языка;

• для обмена мгновенными сообщениями и получения уведомлений о новых письмах в Яндекс.Почта. Можно также 
выполнять поиск в Интернете, следить за прогнозом погоды и загруженностью дорог;

К покупке доступен более свежий выпуск Перейти