Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Семантический веб

Покупка
Артикул: 652457.02.99
Доступ онлайн
479 ₽
В корзину
Книга посвящена всестороннему обсуждению инициативы консорциума W3С под названием «Семантический веб», которая фактически определяет переход к новому этапу развития всемирной паутины WWW. Авторы систематически описывают принципы, модели и технологии семантического веба, в том числе XML, RDF, RDFS, SPARQL, OWL, логику и логический вывод, онтологический инжиниринг. Все материалы книги сопровождаются примерами и приложениями, иллюстрирующими способы использования описанных технологий. Издание предназначено студентам и преподавателям вузов, занимающимся компьютерными науками, а также веб-разработчикам и всем, кто интересуется современными веб-технологиями. Предполагается, что читатель имеет начальные навыки разработки современных веб-приложений и знаком с теорией баз данных и основами математической логики.
Григорис, А. Семантический веб : практическое руководство / Г. Антониоу, П. Грос, Ф. ван Хармелен, Р. Хоекстра ; пер. с англ. Т. Шульги. — 2-е изд. - Москва : ДМК Пресс, 2023. - 241 с. - ISBN 978-5-89818-609-8. - Текст : электронный. - URL: https://znanium.com/catalog/product/2108487 (дата обращения: 10.05.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Семантический веб

Григорис Антониоу, Паул Грос,
Фрэнк ван Хармелен, Ринке Хоекстра
A Semantic Web 
Primer

third edition

Grigoris Antoniou, Paul Groth,  
Frank van Harmelen, Rinke Hoekstra

The MIT Press
Cambridge, Massachusetts
London, England
Семантический веб

Григорис Антониоу, Паул Грос,
Фрэнк ван Хармелен, Ринке Хоекстра

Москва, 2023

2-е издание, электронное
УДК 004.738.5:004.42
ББК 32.973.4
А72

А72
Григорис, Антониоу.
Семантический веб / Г. Антониоу, П. Грос, Ф. ван Хармелен, Р. Хоекстра ; 
пер. с англ. Т. Шульги. — 2-е изд., эл. — 1 файл pdf : 241 с. — Москва : ДМК 
Пресс, 2023. — Систем. требования: Adobe Reader XI либо Adobe Digital 
Editions 4.5 ; экран 10". — Текст : электронный.
ISBN 978-5-89818-609-8

Книга посвящена всестороннему обсуждению инициативы консорциума W3С 
под названием «Семантический веб», которая фактически определяет переход к новому 
этапу развития всемирной паутины WWW. Авторы систематически описывают 
принципы, модели и технологии семантического веба, в том числе XML, RDF, 
RDFS, SPARQL, OWL, логику и логический вывод, онтологический инжиниринг. 
Все материалы книги сопровождаются примерами и приложениями, иллюстрирующими 
способы использования описанных технологий.
Издание предназначено студентам и преподавателям вузов, занимающимся компьютерными 
науками, а также веб-разработчикам и всем, кто интересуется современными 
веб-технологиями. Предполагается, что читатель имеет начальные навыки 
разработки современных веб-приложений и знаком с теорией баз данных и основами 
математической логики.

УДК 004.738.5:004.42 
ББК 32.973.4

Электронное издание на основе печатного издания: Семантический веб / Г. Антониоу, П. Грос, 
Ф. ван Хармелен, Р. Хоекстра ; пер. с англ. Т. Шульги. — Москва : ДМК Пресс, 2016. — 240 с. — 
ISBN 978-5-97060-333-8. — Текст : непосредственный.

Все права защищены. Любая часть этой книги не может быть воспроизведена в какой бы то ни было 
форме и какими бы то ни было средствами без  письменного разрешения владельцев авторских прав.
Материал, изложенный в данной книге, многократно проверен. Но поскольку вероятность технических 
ошибок все равно существует, издательство не может гарантировать абсолютную точность и правильность 
приводимых сведений. В связи с этим издательство не несет ответственности за возможные ошибки, связанные 
с использованием книги.

В соответствии со ст. 1299 и 1301 ГК РФ при устранении ограничений, установленных техническими средствами 
защиты авторских прав, правообладатель вправе требовать от нарушителя возмещения убытков или выплаты компенсации.


ISBN 978-5-89818-609-8
© 2012 Massachusetts Institute of Technology
© Оформление, ДМК Пресс, 2016
Содержание

Предисловие к серии ................................................. 9

Глава 1. Концепция семантического веба .....................13
1.1. Введение .........................................................................................................13
1.2. Технологии сематического веба .............................................................18
1.3. Многоуровневый подход ..........................................................................26
1.4. Обзор книги  ..................................................................................................29
1.5. Выводы ............................................................................................................30
Рекомендуемая литература .............................................................................30

Глава 2. Описание веб-ресурсов: RDF ..........................32
2.1. Введение .........................................................................................................32
2.2. RDF: модель данных ...................................................................................34
2.3. Синтаксисы RDF .........................................................................................39
2.4. RDFS: добавление семантики .................................................................47
2.5. RDF Schema: язык .......................................................................................51
2.6. Формальные определения языков RDF и RDF Schema ................56
2.7. Аксиоматическая семантика языков RDF и RDF Schema ............59
2.8. Системы прямого вывода для языков RDF и RDFS ......................64
2.9. Выводы ............................................................................................................65
Рекомендуемая литература .............................................................................66
Упражнения и проекты .....................................................................................67

Глава 3. Запросы в семантическом вебе .......................70
3.1. SPARQL-инфраструктура  .......................................................................71
3.2. Основы SPARQL: сравнение с шаблоном ...........................................71
3.3. Фильтры .........................................................................................................75
3.4. Конструкции, учитывающие предположение 
об открытости мира  ...........................................................................................78
3.5. Представление результатов запроса  ....................................................80
3.6. Другие формы SPARQL-запросов .........................................................81
3.7. Запросы к схемам данных ........................................................................82
3.8. Добавление информации с помощью протокола 
SPARQL Update ...................................................................................................83
3.9. Принцип «Следуй за своим носом» ......................................................85
3.10. Выводы .........................................................................................................86
Рекомендуемая литература .............................................................................86
Упражнения и проекты .....................................................................................86
 Содержание

Глава 4. Язык веб-онтологий: OWL2 .............................88
4.1. Введение .........................................................................................................88
4.2. Требования к языкам онтологий ............................................................89
4.3. Совместимость OWL2 с RDF/RDFS ...................................................93
4.4. Язык OWL  ....................................................................................................96
4.5. Профили языка OWL2 ........................................................................... 116
4.6. Выводы ......................................................................................................... 118
Рекомендуемая литература .......................................................................... 119
Упражнения и проекты .................................................................................. 120

Глава 5. Логика и логический вывод: правила ..............122
5.1. Введение ...................................................................................................... 122
5.2. Пример монотонных правил: родственные связи ......................... 127
5.3. Монотонные правила: синтаксис ........................................................ 128
5.4. Монотонные правила: семантика ....................................................... 131
5.5. OWL2 RL: дескрипционные логики и правила  ............................ 134
5.6. Формат обмена правилами: RIF ......................................................... 137
5.7. Язык правил сематического веба SWRL.......................................... 142
5.8. Правила в языке SPARQL: SPIN ........................................................ 143
5.9. Немонотонные правила: назначение и синтаксис ........................ 145
5.10. Пример немонотонных правил: посреднические сделки ......... 147
5.11. Язык разметки правил RuleML ......................................................... 151
5.12. Выводы ...................................................................................................... 153
Рекомендуемая литература .......................................................................... 153
Упражнения и проекты .................................................................................. 155

Глава 6. Приложения ...............................................158
6.1. GoodRelations ............................................................................................ 158
6.2. BBC Artists.................................................................................................. 162
6.3. Сайт BBC World Cup 2010  ................................................................... 164
6.4. Правительственные данные .................................................................. 168
6.5. New York Times .......................................................................................... 170
6.7. OpenCalais ................................................................................................... 172
6.8. Schema.org ................................................................................................... 173
6.9. Выводы ......................................................................................................... 174

Глава 7. Онтологический инжиниринг .........................175
7.1. Введение ...................................................................................................... 175
7.2. Ручная разработка онтологий .............................................................. 176
7.3. Повторное использование существующих онтологий ................ 180
7.4. Полуавтоматическое построение онтологий .................................. 183
Содержание  7

7.5. Отображение онтологий  ....................................................................... 187
7.6. Использование реляционных баз данных ....................................... 189
7.7. Архитектура приложений семантического веба  ........................... 191
Рекомендуемая литература .......................................................................... 195
Упражнения и проекты .................................................................................. 196

Глава 8. Заключение ...............................................201
8.1. Принципы ................................................................................................... 201
8.2. Что дальше? ................................................................................................ 203

Приложение А. Основы XML .....................................205
А.1. Язык XML .................................................................................................. 205
А.2. Структурирование информации ........................................................ 209
А.3. Пространства имен.................................................................................. 222
А.4. Адресация и запросы к XML-документам ...................................... 223
А.5. Обработка ................................................................................................... 229

Предметный указатель ............................................236
Посвящается Константине, Вангелису, Гиоргосу
– Григорис Антониоу

Посвящается профессору Томасу Гроту
– Паул Грос
Предисловие к серии

Традиционный взгляд на информационные системы как на дорогостоящие, 
сделанные на заказ программные приложения, основанные 
на базах данных, быстро меняется. Это изменение обусловлено, 
с одной стороны, развитием индустрии программного обеспечения, 
в которой все чаще используются готовые типовые компоненты 
и стандартные программные решения, а с другой – натиском информационной 
революции. В свою очередь, эти изменения привели 
к формированию новых требований к информационным услугам: 
однородность с точки зрения представления и взаимодействия их 
моделей, открытость с точки зрения архитектуры программного 
обеспечения и глобальность с точки зрения масштаба использования. 
Эти требования пришли в основном из прикладных областей, 
таких как электронная коммерция, банковское дело, производство 
(в том числе собственно индустрия программного обеспечения), 
профессио нальное обучение, образование и управление природоохранной 
деятельностью; и здесь перечислены лишь немногие из этих 
областей.
Информационные системы будущего должны поддерживать бесперебойное 
взаимодействие с большим количеством независимых 
друг от друга источников данных различных производителей и унаследованных 
приложений, работающих на разнородных платформах 
в распределенных информационных сетях. При описании содержимого 
таких источников данных и при их интеграции решающую роль 
будут играть метаданные.
Кроме того, информационные системы следующего поколения 
должны поддерживать больше разнообразных социально ориентированных 
моделей взаимодействия. Эти модели могут включать модели 
навигации по данным, запросов к данным, извлечения данных 
и должны работать в сочетании с механизмами персонализированных 
уведомлений, аннотирования и профилирования. Кроме того, 
такие модели взаимодействия должны эффективно поддерживаться 
прикладными программными продуктами и быть динамически 
интег рированы в единые совместно используемые среды, ориентированные 
на пользователей. Кроме того, нужны крупные инвестиции 
как правительств, так и бизнеса в информационные ресурсы, подразумевающие 
конкретные меры по обеспечению безопасности, соблюдению 
принципа неприкосновенности частной жизни и правильности 
контента этих ресурсов. 
 Предисловие к серии

Все перечисленные задачи должны быть решены в информационных 
системах следующего поколения. Мы называем такие системы 
совместными информационными системами (англ. cooperative information systems), и именно они находятся в центре внимания этой серии.
Говоря простым языком, совместные информационные системы 
удовлетворяют разнообразным сочетаниям требований, определяемых 
контентом – обществом – коммерцией. Эти требования порождаются 
текущими тенденциями в области готовых программных решений, 
таких как ERP-системы и системы электронной коммерции.
Основной задачей при создании совместных информационных 
систем является разработка технологий, что предполагает непрерывное 
совершенствование и увеличение массовых вложений сил 
и средств в информационные ресурсы и системы. Такие технологии 
должны обеспечивать соответствующую инфраструктуру, которая 
поддерживает не только разработку, но и развитие программного 
обеспечения.
Результаты ранних исследований в области совместных информационных 
систем становятся основой технологий, используемых для 
разработки социально ориентированных информационных порталов 
или шлюзов. Информационный портал обеспечивает реализацию 
принципа «одного окна» для доступа к разнообразным информационным 
ресурсам и услугам, тем самым создавая сообщество постоянных 
пользователей.
Научно-исследовательские результаты, которые послужат базой 
для реализации совместных информационных систем, не могут быть 
получены в рамках только одного научного направления в области 
информационных технологий. Представляется перспективным использование 
таких достаточно зрелых технологий, как базы данных, 
системы, основанные на знаниях, распределенные системы, программное 
обеспечение поддержки коллективной работы и  графические 
пользовательские интерфейсы. Несмотря на то что отдельные 
технологии еще требуют усовершенствования, предполагается, что 
основным фактором успеха в этой области будет эволюция существующих 
технологий в единую технологию для разработки и управления 
совместными информационными системами.
Серия MIT Press «Совместные информационные системы» включает 
в себя учебники и научные издания, посвященные данной области 
и предназначенные для исследователей и специалистов, которые 
хотят быть в курсе текущих событий и будущих тенденций.
Серия будет включать в себя три типа книг:
Предисловие к серии  11

 
 учебники и справочные пособия, предназначенные для студентов 
старших курсов и аспирантов;
 
 научно-исследовательские монографии, в которых собраны 
и обобщены результаты исследований и опыт разработок последних 
лет;
 
 сборники научных трудов, включающие статьи на конкретные 
темы.
Мы ждем предложений от авторов. Для этого надо предоставить 
в редакцию оглавление предлагаемой книги и образец глав книги. Все 
предоставленные предложения будут формально рассмотрены, и авторы 
будут уведомлены о результатах этого рассмотрения.
Данные в источнике данных являются полезными, так как они 
моделируют некоторую часть реального мира, объект изучения (или 
приложение, или область интерпретации). Проблема семантики данных заключается в установлении и поддержании соответствия между 
источником данных, который в дальнейшем будем называть моделью, 
и предполагаемым объектом моделирования. Моделью могут 
являться база данных о сотрудниках в компании, схема базы данных, 
описывающей детали, проекты и поставщиков, веб-сайт, представляющий 
информацию об университете, или текстовый файл, описывающий 
битву при Ватерлоо. Проблема семантики данных появилась 
с момента разработки первых баз данных. Однако эта проблема 
может оставаться под контролем, пока базы данных функционируют 
в закрытой и относительно стабильной среде. В этих условиях смысл 
данных определяется правильно определенной структурой базы данных, 
и предполагается, что он будет интерпретироваться небольшим 
количеством постоянных пользователей и прикладных программ.
Появление веба все изменило. Базы данных сегодня стали в некоторой 
форме доступными в вебе, который является открытой средой: 
пользователи, прикладные программы, способы использования данных 
постоянно меняются. В этих условиях семантика данных должна 
быть доступна непосредственно вместе с самими данными. Доступность 
семантики для пользователей можно обеспечить за счет выбора 
соответствующего формата представления информации. Однако для 
прикладных программ семантика должна быть представлена в формальной, 
машинно обрабатываемой форме. Именно этот факт обусловил 
появление инициативы под названием «семантический веб» 
(англ. Semantic Web)1.

1 Tim Berners-Lee and Mark Fischetti, Weaving the Web: The Original Design 
and Ultimate Destiny of the World Wide Web by Its Inventor. San Francisco: 
 Предисловие к серии

Неудивительно, что это инициатива Тима Бернерса-Ли привлекала 
огромное внимание как исследователей, так и практиков. В настоящее 
время регулярно проводится международная конференция, 
посвященная семантическому вебу «International Semantic Web Con-
ference»1, издательством «Elsevier» выпускается журнал «Journal of 
Web Semantics»2, действуют отраслевые комитеты, которые рассматривают 
стандарты первого поколения для семантического веба3.
Данная книга представляет собой своевременную публикацию, 
учитывая стремительный характер развития концепций, технологий 
и стандартов семантического веба. Книга предлагает постепенное 
введение в концепцию и технологии семантического веба, в том числе 
XML, DTD, XML-схемы, RDF, RDFS, OWL, логику и логический 
вывод. Все материалы книги сопровождаются примерами и приложениями, 
иллюстрирующими способы использования этих технологий.
Мы рады включить эту книгу, посвященную семантическому вебу, 
в серию «Совместные информационные системы». Надеемся, что для 
читателей она будет интересной, познавательной и полезной.

Джон Милопоулос  
(John Mylopoulos)
jm@cs.toronto.edu
Кафедра компьютерных наук
Университет Торонто 
Торонто, Онтарио
Канада

Майкл Папазоглоу  
(Michael Papazoglou) 
M. P. Papazoglou@kub.nl
INFOLAB
P. O. Вох 90153 
Университет Тилбурга
Нидерланды

HarperCollins, 1999.
1 http://swsa.semanticweb.org/content/international-semantic-web-conference-
iswc.
2 www.semanticwebjournal.org.
3 На момент перевода книги уже утвержден целый ряд стандартов семантического 
веба второго поколения. См. http://www.w3.org/standards/semantic-
web/. – Прим. перев.
Глава 1

Концепция 
семантического веба

1.1. Введение

1.1.1. Цели сематического веба

Общая концепция «семантического веба» может быть сведена к одной 
фразе: «сделать веб более доступным для компьютеров». На 
данный момент веб – это веб текста и изображений. Такие мультимедийные 
материалы полезны для людей, но компьютеры играют 
очень ограниченную роль в вебе: они индексируют сайты по ключевым 
словам, передают информацию от серверов к клиентам, но этим 
и ограничиваются их функции. Вся интеллектуальная работа (выбор 
информации, ее объединение, агрегирование и т. д.) выполняется человеком. 
А что, если сделать веб более информативным для машин, 
наполнить его машиночитаемыми, то есть «понятными» для машин, 
данными? Такой веб позволит реализовать функции, осуществление 
которых невозможно на данный момент. Поиск информации не будет 
больше ограничиваться просто поиском по ключевым словам, он 
может стать более осмысленным, учитывать синонимы, исключать 
омонимы, а также учитывать контекст и цель поисковых запросов. 
Сайты могут стать более персонализированными, если браузеры смогут 
понимать содержимое веб-страницы и адаптировать его к личным 
интересам пользователя в соответствии с его профилем. Связывание 
страниц может стать более осмысленным, если реализовать динамическое 
создание полезных ссылок на основе действий конкретного 
пользователя, вместо того заранее создать одинаковые ссылки для 
всех пользователей. Станет возможна интеграция информации с разных 
веб-сайтов, в отличие от настоящего времени, когда пользователю 
для объединения найденной на сайтах информации приходится 
использовать «интеллектуальную» технологию копипаста.
Доступ онлайн
479 ₽
В корзину