Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Интелектуальные информационные технологии

Учеб. пособие
Покупка
Артикул: 065825.02.99
Доступ онлайн
1 600 ₽
В корзину
Интеллектуальные информационные технологии — одна из наиболее перспективных и быстро развивающихся научных и прикладных областей информатики. В учебном пособии рассматриваются ее основные направления: обработка текстов на естественном языке, моделирование знаний и базы знаний, управление знаниями, распознавание образов, нейротехнологии, интеллектуализация Internet, концептуальное программирование и др. Основное внимание уделяется математическим моделям, методам и инструментальным средствам разработки программного обеспечения интеллектуальных автоматизированных систем. Содержание учебного пособия основано на материалах, используемых авторами в учебном процессе в МГТУ им. Н.Э. Баумана и МЭИ (ТУ). Для студентов высших технических учебных заведений, изучающих информационные технологии и методы их интеллектуализации. Может быть полезно аспирантам и специалистам, занимающимся данной проблематикой.
Башмаков, А. И. Интелектуальные информационные технологии : учебное пособие / А. И. Башмаков, И. А. Башмаков. - Москва : МГТУ им. Баумана, 2005. - 304 с. - (Информатика в техническом университете). - ISBN 5-7038-25-44. - Текст : электронный. - URL: https://znanium.com/catalog/product/2043301 (дата обращения: 02.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Информатика в техническом университете 

Информатика в техническом университете 

Серия основана в 2000 году 

РЕДАКЦИОННАЯ КОЛЛЕГИЯ: 

чл.-кор. РАН КБ. Федоров — главный редактор 
д-р техн. наук КП. Норенков — зам. главного редактора 
д-р техн. наук Ю.М. Смирнов — зам. главного редактора 
д-р техн. наук В.В. Девятков 
д-р техн. наук В.В. Емельянов 
канд. техн. наук КП. Иванов 
д-р техн. наук В.А. Матвеев 
канд. техн. наук КВ. Медведев 
д-р техн. наук В. В. Сюзев 
д-р техн. наук Б.Г. Трусов 
д-р техн. наук В.М. Черненький 
д-р техн. наук В.А. Шахнов 

А.и. Башмаков, И.А. Башмаков 

Интеллектуальные 
информационные 

технологии 

Допущено Министерством образования 

и науки Российской Федерации 

в качестве учебного пособия для студентов 

высших учебных заведений, 

обучающихся по направлению 

подготовки дипломированных специалистов 
«Информатика и вычислительная техника» 

Москва 

Издательство МГТУ имени Н.Э. Баумана 

2005 

УДК 004.8:681.3.06(075.8) 
ББК 32.813+32.973.26-018.2я73 
Б336 

Р е ц е н з е н т ы : 

д-р техн. наук, профессор И.П. Норенков 

(Московский государственный технический университет им. Н.Э. Баумана); 

кафедра «Компьютерные технологии и системы» 

Московского государственного университета прикладной биотехнологии 

(зав. кафедрой профессор Ю.А. Ивашкин); 

кафедра «Вычислительные машины, системы и сети» 

Московского энергетического института (технического университета) 

(зав. кафедрой профессор И.И. Ладыгин) 

Башмаков А.И., Башмаков И.А. Интеллектуальные информаци-
Б336 онные технологии: Учеб. пособие. - М.: Изд-во МГТУ им. Н.Э. Баумана, 
2005. - 304 с : ил. — (Информатика в техническом университете). 

ISBN 5-7038-2544-Х 

Интеллектуальные информационные технологии — одна из наиболее 
перспективных и быстро развивающихся научных и прикладных областей 
информатики. В учебном пособии рассматриваются ее основные направления: обработка текстов на естественном языке, моделирование знаний и базы 
знаний, управление знаниями, распознавание образов, нейротехнологии, интеллектуализация Internet, концептуальное программирование и др. Основное 
внимание уделяется математическим моделям, методам и инструментальным 
средствам разработки программного обеспечения интеллектуальных автоматизированных систем. 

Содержание учебного пособия основано на материалах, используемых 
авторами в учебном процессе в МГТУ им. Н.Э. Баумана и МЭИ (ТУ). 

Для студентов высших технических учебных заведений, изучающих 
информационные технологии и методы их интеллектуализации. Может быть 
полезно аспирантам и специалистам, занимающимся данной проблематикой. 

УДК 004.8:681.3.06(075.8) 
ББК 32.813+32.973.26-018.2я73 

© А.И. Башмаков, И.А. Башмаков, 2005 
ISBN 5-7038-2544-Х 
© МГТУ им. Н.Э. Баумана, 2005 

ОГЛАВЛЕНИЕ 

ПРЕДИСЛОВИЕ 
8 

СПИСОК ОСНОВНЫХ СОКРАЩЕНИЙ 
11 

СТРУКТУРА ИССЛЕДОВАНИЙ В ОБЛАСТИ ИСКУССТВЕННОГО 
ИНТЕЛЛЕКТА 
15 

ВВЕДЕНИЕ 
17 

1. ТЕХНОЛОГИЯ КОНЦЕПТУАЛЬНОГО ПРОГРАММИРОВАНИЯ 
21 

1.1. Основы теории концептуального профаммирования 
21 

1.2. Инструментарий концептуального профаммирования 
28 

Вопросы для самопроверки 
29 

2. ТЕХНОЛОГИИ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ 
ОБРАЗОВ 
32 

2.1. Основные понятия теории автоматического распознавания образов 
32 

2.2. Примеры программной реализации OCR-систем 
35 

Вопросы для самопроверки 
40 

3. АВТОМАТИЗАЦИЯ РАБОТЫ СО ЗНАНИЯМИ, 
ПРЕДСТАВЛЕННЫМИ В ТЕКСТОВОМ ВИДЕ 
41 

3.1. Основы гипертекстовой информационной технологии 
41 

3.1.1. Основные понятия гипертекстовой информационной технологии 
42 

3.1.2. Формализованная модель гипертекста 
44 

3.1.3. Условно-типовая модель гипертекста 
47 

3.1.4. Инструментальные средства для создания гипертекста 
49 

3.1.5. Гипертекстовые информационно-поисковые системы 
55 

3.1.6. Методы извлечения знаний для построения гипертекста 
61 

3.1.7. Автоматизация построения гипертекста 
62 

3.1.8. Место гипертекстовой информационной технологии среди 
технологий искусственного интеллекта 
63 

Вопросы для самопроверки 
66 

3.2. Автоматизированное извлечение знаний из текста 
67 

3.2.1. Проблема понимания текста на естественном языке 
67 

5 

Оглавление 

Ъ22. Компьютерные методы поиска в тексте 
69 

Вопросы для самопроверки 
76 

3.3. Автоматическое реферирование и аннотирование 
77 

Вопросы для самопроверки 
89 

3.4. Машинный перевод 
90 

Вопросы для самопроверки 
96 

3.5. Автоматическая классификация документов 
96 

Вопросы для самопроверки 
99 

3.6. Комплексные интеллектуальные программные системы для обработки 
текстов 
100 

3.6.1. Комплексный смысловой анализатор текста Text Analyst 
100 

3.6.2. Промышленная информационно-поисковая система Excalibur 
RetrievalWare 
107 

3.6.3. Пакет NeurOK Semantic Suite 
113 

Вопросы для самопроверки 
118 

4. МЕТАДАННЫЕ ДЛЯ ИНФОРМАЦИОННЫХ РЕСУРСОВ 
120 

4.1. Системы и модели метаданных 
120 

4.2. Семантический web и платформа XML 
128 

Вопросы для самопроверки 
133 

5. МОДЕЛИРОВАНИЕ ЗНАНИЙ О ПРЕДМЕТНЫХ ОБЛАСТЯХ КАК 
ОСНОВА ИНТЕЛЛЕКТУАЛЬНЫХ АВТОМАТИЗИРОВАННЫХ 
СИСТЕМ 
135 

5.1. Категория знания 
135 

Вопросы для самопроверки 
146 

5.2. Модели знаний 
147 

Вопросы для самопроверки 
156 

5.3. Сетевые модели знаний 
157 

5.3.1. Модель Ml —расширенные семантические сети 
157 

5.3.2. Модель Ml — неоднородные семантические сети 
160 

5.3.3. Модель МЬ — нечеткие семантические сети 
162 

5.3.4. Модель Л/4 — обобщенная модель представления знаний 

о предметной области 
164 

Вопросы для самопроверки 
172 

5.4. Онтологический подход и его использование 
173 

5.4.1. Понятие онтологии 
173 

5.4.2. Основные задачи, решаемые с помощью онтологии 
175 

5.4.3. Модель онтологии 
181 

5.4.4. Методики построения онтологии и требования к средствам их 
спецификации 
184 

5.4.5. Обзор наиболее известных онтологических проектов 
191 

5.4.6. Примеры использования онтологии 
194 

Вопросы для самопроверки 
197 

5.5. Основы технологии баз знаний 
198 

5.5.1. Общие положения 
198 

6 

Оглавление 

5.5.2. Система операций для работы со знаниями в базе знаний 
200 

5.5.3. Элементарные операции 
200 

5.5.4. Комплексные операции 
206 

Вопросы для самопроверки 
230 

6. НЕЙРОННЫЕ СЕМИОТИЧЕСКИЕ СИСТЕМЫ 
231 

6.1. Общая характеристика направления 
231 

6.2. Нейропакеты 
237 

6.3. Модели сенсорных и языковой систем человека 
246 

Вопросы для самопроверки 
251 

7. СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ 
253 

7.1. Общая характеристика направления 
253 

Вопросы для самопроверки 
256 

7.2. Технологии хранилищ данных и интеллектуального анализа данных 
256 

7.2.1. Основные понятия 
256 

7.2.2. Технология OLAP и многомерные модели данных 
258 

7.2.3. Глубинный анализ данных 
262 

Вопросы для самопроверки 
265 

7.3. Системы поддержки инновационной деятельности 
266 

Вопросы для самопроверки 
279 

ЗАКЛЮЧЕНИЕ 
280 

СПИСОК ОСНОВНОЙ ЛИТЕРАТУРЫ 
282 

СПИСОК ДОПОЛНИТЕЛЬНОЙ ЛИТЕРАТУРЫ 
283 

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 
298 

к 175-летию МГТУ имени Н.Э. Баумана 

ПРЕДИСЛОВИЕ 

Эволюция информационных технологий и систем все в большей степени определяется их интеллектуализацией. Интеллектуальные 
информационные технологии — одна из наиболее перспективных и быстро развивающихся научных и прикладных областей информатики. Она оказывает 
существенное влияние на все научные и технологические направления, связанные с использованием компьютеров, и уже сегодня дает обществу то, 
что оно ждет от науки, — практически значимые результаты, многие из которых способствуют кардинальным изменениям в сферах их применения. 

Целями интеллектуальных информационных технологий являются, 
во-первых, расширение круга задач, решаемых с помощью компьютеров, 
особенно в слабоструктурированных предметных областях, и во-вторых, 
повышение уровня интеллектуальной информационной поддержки современного специалиста. 

Ключевым компонентом научного фундамента интеллектуальных информационных технологий является искусственный интеллект (ИИ). Для 
создания и развития ИИ как научного направления за рубежом много сделали И. Винер, У. Маккаллох, У. Питтс, Д. Маккарти (который впервые ввел 
термин «artificial intelligence»), Ф. Розенблат, А. Сазерленд, М. Минский, 
С. Пейперт, А. Ньюэлл, Г. Саймон, Дж. Шоу, Э. Фейгенбаум, А. Кольмероэ, 
Н. Хомский, Т. Виноград, М. Куиллиан, Р. Шенк, И. Кильсон, П. Уинстон, 
Л. Заде, Р. Редди, Д. Ленат, Дж. Хинтон, Дж. Андерсон, Ж.-Л. Лорьер и многие другие. В СССР, а затем в России со становлением и развитием ИИ связывают имена А.А. Ляпунова, А.И. Берга, Г.С. Поспелова, М.Л. Цетлина, 
М.М. Бонгарда, М.А. Гаврилова, А.П. Ершова, В.Н. Пушкина, Л.Т. Кузина, 
А.С. Нариньяни, А.И. Половинкина, В.В. Чавчанидзе, В.К. Финна, Э.В. Попова, Э.Х. Тыугу, Н.Н. Непейводы, И.П. Кузнецова, О.И. Ларичева, А.И. Галушкина, А.Н. Горбаня, А.В. Чечкина и многих других. Следует отметить 
исключительную роль Д.А. Поспелова и его научной школы: В.Н. Вагина, 
Т.А. Гавриловой, А.П. Еремеева, Г.С. Осипова, В.Ф. Хорошевского и др. 

Настоящее учебное пособие предназначено для студентов вузов, изучающих информационные технологии и методы их интеллектуализации, а 
также аспирантов и специалистов, занимающихся данной проблематикой. 
Оно основано на материалах, используемых авторами в учебном процессе в 

Предисловие 

МГТУ им. Н.Э. Баумана и МЭИ (ТУ). Его содержание в значительной мере 
охватывает вопросы, связанные с интеллектуализацией информационных 
технологий и систем, входящие в учебные программы дисциплин «Системы 
искусственного интеллекта», «Информационные технологии», «Интеллектуальные подсистемы САПР», «Представление знаний в информационных 
системах», «Технология разработки программного обеспечения интеллектуальных автоматизированных систем», «Интеллектуальные системы», «Основы искусственного интеллекта», «Интеллектуальные информационные 
системы» и других дисциплин в рамках направлений подготовки «Информатика и вычислительная техника» (ОКСО 230100), «Информационные системы» (ОКСО 230200), «Информационные технологии» (ОКСО 010400), 
«Прикладная математика и информатика» (ОКСО 010500), «Прикладная 
математика» (ОКСО 230400). 

Основными задачами учебного пособия являются: 
1) формирование представлений о классах и структуре программного 
обеспечения (ПО) интеллектуальных автоматизированных систем (ИАС), в 
особенности об инвариантном к предметной области ядре ПО ИАС; 

2) создание представлений о методах, математическом аппарате и инструментальных средствах разработки ПО ИАС во взаимосвязи с обеспечивающими подсистемами ИАС: комплексом технических средств, а также математическим, лингвистическим и информационным обеспечениями; 

3) приобретение знаний и умений, связанных с технологическим подходом к разработке ПО ИАС. 

Использование технологического подхода к разработке ПО обеспечивает: 
• концептуальное единство всех частей программного проекта; 
• интеграцию и координацию деятельности отдельных исполнителей, 
в том числе программистов, в рамках единого проекта; 

• совмещение разработки программной документации с ходом реализации проекта; 

• повышение производительности труда программистов; 
• повышение надежности и качества программного продукта; 
• снижение стоимости разработки программного продукта; 
• повышение границы сложности программных проектов. 
Учебное пособие состоит из введения, семи глав и заключения. 
Во введении представлены задачи учебного пособия, укрупненная 
функциональная модель интеллектуальной системы и структура исследований в области ИИ. Главы и параграфы пособия соотносятся с направлениями данной структуры. 

В первой главе изложены теоретические основы технологии концептуального программирования и дана характеристика ее реализации в серии 
программных решателей пакета решения инженерных задач (ПРИЗ). 

Предисловие 

Во второй главе отражены основные понятия технологии автоматического распознавания образов. Вопросы ее реализации рассмотрены на примерах ведущих российских систем оптического чтения текстов. 

Третья глава посвящена автоматизации работы со знаниями, представленными в текстовом виде. В ней описаны гипертекстовые модели и 
системы, методы извлечения знаний из текста и компьютерного поиска в 
тексте, технологии автоматического реферирования и аннотирования, машинного перевода и автоматической классификации документов. Завершает 
главу характеристика комплексных интеллектуальных программных систем 
для обработки текстов: комплексного смыслового анализатора текста Text 
Analyst, промышленной информационно-поисковой системы ЕхсаИЬш" Re-
trievalWare, пакета NeurOK Semantic Suite. 

В четвертой главе отражено современное состояние работ в области 
метаданных для информационных ресурсов. Главное внимание уделено роли метаданных в обеспечении интеллектуализации WWW. Охарактеризованы универсальная система метаданных «Дублинское ядро» и модель RDF. 
Рассмотрены направления интеллектуализации Internet (концепция семантического web). Приведен перечень стандартов и спецификаций, составляющих ядро платформы XML, служащей технологической основой семантического web. 

Пятая глава пособия является главной. Она посвящена вопросам моделирования знаний о предметных областях и роли этих моделей и методов 
в ИАС. Изложены современные представления о категории знаний. Приведен обзор базовых моделей знаний. Рассмотрены четыре модели семантических сетей. Дана развернутая характеристика онтологического подхода. 
Описаны концептуальные основы технологии баз знаний. 

Шестая глава представляет технологии нейронных семиотических 
систем. Рассмотрены основные понятия нейротехнологий, структура работ в 
области нейрокибернетики, классификация, характеристики и примеры ней-
ропакетов, а также подход к моделированию сенсорных и языковой систем 
человека искусственными нейронными сетями. 

Седьмая глава посвящена системам управления знаниями. В ней дана 
характеристика технологий хранилищ данных и интеллектуального анализа 
данных, а также систем поддержки инновационной деятельности в технических областях. 

10 

список основных СОКРАЩЕНИИ 

АСНИ 
— автоматизированная система научных исследований 

АСУ 
— автоматизированная система управления 

ЛЯ 
— алгоритмическое ядро 

БД 
— база данных 

БЗ 
—база знаний 

БНФ 
— нормальная форма Бэкуса—Наура 

БСЭ 
— Большая советская энциклопедия 

ВМ 
— вычислительная модель 

в н е 
— высшая нервная система (человека) 

ГИПС 
— гипертекстовая информационно-поисковая система 

ГИТ 
— гипертекстовая информационная технология 

ГРНТИ 
— государственный рубрикатор научно-технической информации 

ГТ 
— гипертекст 

ЕЯ 
— естественный язык 

НАД 
— интеллектуальный анализ данных 

НАС 
— интеллектуальная автоматизированная система 

ИИ 
— искусственный интеллект 

И НС 
— искусственная нейронная сеть 

ИО 
— информационное обеспечение 

ИПС 
— информационно-поисковая система 

ИР 
— информационный ресурс 

ИС 
— информационная система 

ИСС 
— информационно-справочная статья 

КРН 
— квазирецепторный нейрон 

КТС 
— комплекс технических средств 

ЛО 
— лингвистическое обеспечение 

ЛП 
— лингвистический процессор 

MB 
— машина вывода 

МО 
— математическое обеспечение 

МП 
— машинный перевод 

МПрО 
— модель предметной области 

НИТ 
— новая информационная технология 

НК 
— нейрокомпьютер 

н о с е 
— нечеткая объектно-ориентированная семантическая сеть 

НП 
— нейропакет 

н е с 
— неоднородная семантическая сеть 

ОЕЯ 
— ограниченный естественный язык 

о с е 
— объектно-ориентированная семантическая сеть 

И 

Список основных сокращений 

ПО 
— программное обеспечение 

ПРИЗ 
— пакет решения инженерных задач (программный инструментарий, реализующий ТКП) 

ПрО 
— предметная область 

РСС 
— расширенная семантическая сеть 

САПР 
— система автоматизированного проектирования 

СИ 
— символьный нейрон 

СП 
— сетевая продукция 

СУБД 
— система управления базами данных 

СУБЗ 
— система управления базами знаний 

СУЗ 
— система управления знаниями 

ТКП 
— технология концептуального программирования 

ТРИЗ 
— теория решения изобретательских задач 

УДК 
— универсальная десятичная классификация 

УТОПИСТ — универсальный транслятор описаний теорий (язык, используемый в 
ПРИЗ) 

ФС 
— формальная система 

ЭС 
— экспертная система 

ЭСМ 
— элементарная сенсорная модель 

ЭСС 
— элементарная сенсорная система 

ЭФ 
— элементарный фрагмент 

ЭЯС 
— элементарная языковая система 

API 
— Application Programming Interface — интерфейс прикладного программирования 

APRP 
— Adaptive Pattern Recognition Processing — адаптивное распознавание 
образов (технология, разработанная Convera Technologies Corp.) 

CALS 
— Computer-Aided Acquisition and Lifecycle Support — компьютерная поддержка жизненного цикла (совокупность стандартов, унифицирующих 
спецификации технической системы на всех этапах ее жизненного цикла) 

CASE 
— Computer Aided Software Engineering — автоматизированная разработка программного обеспечения 

СОМ 
— Component Object Model — модель составных объектов (стандарт 
Microsoft, описывающий правила создания и взаимодействия программных объектов в среде Windows) 

CRISP-DM — Cross Industry Standard Process for Data Mining — проект, направленный на унификацию и стандартизацию технологий DM 

DAML 
— DARPA Agent Markup Language — язык разметки агентов, разработанный DARPA 

DARPA — Defense Advanced Research Projects Agency — Агентство перспективных исследований Министерства обороны США 

DM 
— Data Mining — глубинный анализ данных 

DS 
— Description Subsumption — диаграмма строгой классификации (используется в IDEF5) 

DTD 
— Document Туре Definition — определение типа документа (язык описания модели XML-документа) 

12 

Список основных сокращений 

EL 
— Elaboration Language — язык доработок и уточнений (используется в 

IDEF5) 

ERW 
— Excalibur RetrievalWare 

FSNL 
— Fuzzy Semantic Network Language — язык описания нечеткой семантической сети 

FTP 
— File Transfer Protocol — протокол передачи файлов 

HOLAP — Hybrid OLAP — гибридная OLAP (способ хранения данных в OLAP) 
HTML 
— HyperText Markup Language — язык гипертекстовой разметки 

HTTP 
— HyperText Transport Protocol — протокол передачи гипертекста 

KIF 
— Knowledge Interchange Format — формат обмена знаниями (один из 

языков представления знаний) 

LOM 
— Learning Object Metadata — концептуальная схема метаданных для образовательных объектов (информационных ресурсов для сферы образования) 

MDA 
— Model. Driven Architecture — архитектура, управляемая моделью (основана на объектно-ориентированной модели знаний) 

MIME 
— Multipurpose Internet Mail Extensions — многоцелевые расширения почтовой службы Internet 

MOLAP — Multidimensional OLAP — многомерная OLAP (способ хранения данных в OLAP) 

NKC 
— Natural Kind Classification — диаграмма естественной (видовой) классификации (используется в IDEF5) 

NLP 
— Natural Language Processing — обработка текстов на ЕЯ 

OCR 
— Optical Character Recognition — оптическое распознавание символов 

ODBC 
— Open DataBase Connectivity interface — открытый интерфейс взаимодействия с БД 

ODP 
— Open Distributed Processing — открытая распределенная обработка 
(основана на объектно-ориентированной модели знаний) 

OIL 
— Ontology Interchange Language — язык обмена онтологиями (один из 

языков описаний онтологии) 

OLAP 
— On-Line Analytical Processing — интерактивная аналитическая обработка данных 

OLE 
— Object Linking and Embedding — связывание и встраивание объектов 

(технология, обеспечивающая возможность включения в состав документа информационных объектов, имеющих разные форматы и обрабатываемых разными приложениями) 

OLTP 
— On-Line Transaction Processing — оперативная обработка транзакций 

OMG 
— Object Management Group — Консорциум OMG 

QBE 
— Query-By-Example — запрос no образцу, язык запросов по образцу 

RDF 
— Resource Description Framework — модель представления метаданных, 

описывающих 
ИР, 
и соответствующий 
ей язык, 
являющийся 
приложением XML 

ROLAP — Relational OLAP — реляционная OLAP (способ хранения данных в 
OLAP) 

SAO 
— (Subject — Action — Object) — (субъект — действие — объект) 

13 

Доступ онлайн
1 600 ₽
В корзину