Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Методы распознавания сложных систем. Байесовская процедура - оптимальная процедура распознавания

Покупка
Основная коллекция
Артикул: 626094.01.99
В книге рассмотрены методы распознавания сложных систем. Раскрыта сущность индуктивного подхода как метода изучения объектов в естественных науках. На примере диагностики технических систем показаны преимущества байесовской процедуры распознавания как основы индуктивного подхода. Отражены актуальные вопросы решения сложных комбинаторных задач и Марковская процедура распознавания,исследования генома.
Гупал, В. М. Методы распознавания сложных систем. Байесовская процедура - оптимальная процедура распознавания : монография / В. М. Гупал. - Москва : Компания Спутник+, 2005. - 78 с. - Текст : электронный. - URL: https://znanium.com/catalog/product/358812 (дата обращения: 23.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
В.М. Гупал 

Методы распознавания 

сложных систем. 
Байесовская процедура оптимальная процедура 
распознавания 

1* 

Москва 2005 

Ч н ^ 

Москва 2005 

ББК 32.817 
Г 94 

Гупал В.М. 

Г 94 
Методы распознавания сложных систем. Байесовская процедура оптимальная процедура распознавания. - М.: Компания Спутник+, 
2005. - 78 с. 

В книге рассмотрены методы распознавания сложных систем. Раскрыта 
сущность индуктивного подхода как метода изучения объектов в естественных 
науках. На примере диагностики технических систем показаны преимущества 
байесовской процедуры распознавания как основы индуктивного подхода. Отражены актуальные вопросы решения сложных комбинаторных задач и Марковская процедура распознавания,исследования генома. 

ББК 32.817 

Отпечатано с готового оригинал-макета автора. 

Гупал В.М., 2005 

ВВЕДЕНИЕ 

Минувший ХХ-й век, как период в истории человечества, на основе достижения им определенного уровня развития называют поразному: веком электричества, атомной энергии, кибернетики, генетики и др. Однако, наиболее правильным было бы назвать его термином «информационный век». 

В самом деле, по темпам развития основных потоков информации: 
интернет, мобильные и интеллектуальные системы, электронные вычислительные машины, системы управления оставили позади остальные характеристики минувшего века. 

Информационный век необычайно разнообразен. Его широкие 
возможности формируют научный, экономический и культурный потенциалы любого государства, расширяют связь с внешним миром, 
меняют образ жизни людей. 

Запуски спутников связи в 60-е годы прошлого столетия открыли 
эру глобальных коммуникаций. По сравнению с первым поколением 
ЭВМ сегодняшние компьютеры работают в несколько десятков раз 
быстрее, обладают более емкой памятью, в тысячи раз более надежны 
и стоят в тысячи раз дешевле. Область их применения охватывает 
практически все виды деятельности, связанные с информацией: проведение различного рода исследований, статистический анализ, составление отчетов, учебный процесс, всякого рода проектирование и 
дизайн - от газетных полос до зданий, управление станками и т.д. 
Компьютерные системы действуют в области здравоохранения, помогая диагностировать и лечить заболевания, обеспечивая врачам незамедлительный доступ к обширным источникам медицинской информации. Информация как воздух необходима тем, кто ведет научные исследования, внедряет и оценивает новые достижения, кто занят 
их промышленной и коммерческой реализацией. 

Обогнав США по производству стали, цемента, электроэнергии, 
добыче нефти и т.д., мы существенно отстаем в сфере информационных технологий и информации. Однако, наш собственный исторический опыт показывает, что при наличии продуманной государственной политики, при использовании резервов мы сможем превратиться 
в передовую информационную державу. 

Гонка за новой технологией убыстряет темп, время от научного открытия до его практического внедрения сокращается. Телефон ждал своего 
массового потребителя 56 лет /1820-1876 гг./, радио 35 лет /1867-1902 гг./, 
телевидение 14 лет/1922-1936 гг./, транзистор 5 лет/1956-1961 гг./. 

з 

t 

В нынешней гонке средств информации участвуют правительства 
и крупнейшие монополии. Огромные достижения последних десятилетий наложили свой отпечаток на новейшую историю и в большей 
мере формируют сейчас будущее обществ и определяют человеческое 
существование. Идет ли речь о производственной технике (станки с 
числовым программным управлением, роботы, автоматизированное 
проектирование и централизованное управление производством от 
ЭВМ, искусственный интеллект и т.д.), о биологической инженерии и 
биотехнологиях, о новых материалах (лазеры, оптические волокна, 
обработка изображения...), о космосе (спутники, дистанционное обнаружение....), о новых медицинских инструментах (томограф, ядерный магнитный резонанс....) - ни один вид человеческой деятельности не оказывается вне влияния науки или техники. 

Уже появились специальные программы, называемые экспертсистемами, которые дублируют работу людей. Некоторые экспертсистемы даже превосходят химиков в интерпретации показаний приборов, распознающих неизвестные химические вещества. Другие системы 
способны указать расположение подземных залежей минералов, дать 
инструкции о ремонте механического оборудования, поставить медицинские диагнозы. Заводские роботы могут визуально распознавать детали, сваленные в ящики или движущиеся на конвейере, отбирать их, 
устанавливать в машины или собирать из них готовые изделия. 

Новые технологии используются банками для сбора, накопления, 
хранения, обработки, анализа, передачи на расстояние и представления клиентам разнообразной информации о кредитных сделках, денежных платежах и расчетах и т.д., а также всевозможных сведениях 
о конъюнктуре рынков, состояния экономики и многих других. 

Слияние интересов банков и информационной индустрии выдвигает на повестку дня проблему влияния финансовых институтов на 
международный поток информации. 

Ныне в области информационной технологии наметилась специализация по регионам: Япония лидирует в производстве массовой 
продукции, Западная Европа - в производстве и внедрении различных видов телекоммуникаций. По данным экспертов, отставание России оценивается примерно в 10 лет. Контроль США над компьютерным рынком практически обеспечен в ближайшем будущем. 

Современная информационная технология все чаще обращается к 
биологическим системам, ища в них резервы для построения более 
совершенных компьютерных устройств. 

4 

* 

В настоящее время исследования в области искусственного интеллекта преследуют две основные цели: одну, чисто научную, добиться 
лучшего понимания процессов человеческого мышления путем их 
имитации, другую цель, инженерную, расширить сферу применения 
компьютеров, по возможности сделав их умными помощниками человека. 

Тот, кто будет контролировать революцию в области информации, 
фактически обретет и далеко идущий геополитический контроль в 
той или иной форме над миром. 

Несомненно, при этом необходимо сконцентрировать усилия на 
относительно немногих, но наиболее важных направлениях, чтобы с 
меньшими затратами получить ощутимые для экономики и для населения результаты в кратчайшие сроки. 

В последние годы стали широко применяться модели распознавания с использованием систем искусственного интеллекта, экспертных 
систем и модели, основанные на использовании алгебры логики. Каждая разновидность систем распознавания имеет свои особенности, 
что делает её наиболее пригодной для решения одного класса задач и 
менее пригодной для решения другого. Модели распознавания используют математический и логический аппарат. 

Математика на протяжении многих столетий использовала метод 
дедуктивных выводов из небольшого числа принципов, называемых 
аксиомами. Однако работа в процессе дедуктивного вывода ведется 
только на одном классе истинных утверждений, ложные утверждения 
не используются. 

Нельзя сказать, что аксиоматически-дедуктивный метод был единственным подходом в изучении явлений и процессов реального мира. 
Альтернативой ему, как это давно было известно математикам и философам, является индуктивный подход, как способ рассуждений от 
частного к общему. Кроме того, известно, что индуктивный подход 
основа изучения объектов в естественных науках. Однако, в математике он широко не использовался, поскольку до последнего времени 
не имел убедительного обоснования. 

Аксиоматический метод в математике впервые был использован 
Евклидом в Ш веке до н.э. в его книге «Начала» при изложении основ 
элементарной геометрии, теории чисел, алгебры и других разделов 
античной математики. «Начала» Евклида составлены по определенной схеме: сначала приводятся определения и постулаты, а затем 
формулировки теорем и их доказательства. 

5 

* 

Существует множество альтернативных обоснований индуктивного 
подхода. «Матерь заблуждений и бедствий всех наук, - писал Ф. Бэкон, 
есть тот способ открытия и проверки, когда сначала строятся самые 
общие основания, а потом к ним приспосабливаются и посредством их 
проверяются аксиомы». 

Гениальные открытия Гёделя положили начало строгим исследованиям возможностей формализованно-дедуктивного метода познания. Эти открытия были почти полной неожиданностью для науки 
«догеделевского» периода. Его знаменитая теорема о неполноте, 
опубликованная в 1931 году, нанесла удар по аксиоматическому подходу. Неудивительно, что она вызвала множество разных толкований. 
Открытия Гёделя лишая аксиоматически-дедуктивный метод статуса 
чего-то абсолютного, снимают его гипнотическое воздействие на логиков и математиков, побуждая их не отождествлять более этот метод 
с дедуктивным методом вообще, искать новые способы умозаключений, ведущие к познанию истины. В этом антидогматическом потенциале заключено философское значение теоремы о неполноте. 

В истории известно немало случаев, когда идеи ученых возрождаются в более поздние периоды и определяют тенденцию развития 
различных отраслей знаний.. Аналогичное происходит и с работами 
Т. Байеса по теории вероятностей. Результаты его исследований были 
опубликованы 240 лет назад, но настоящий расцвет байесовских методов начался лишь в 1990-е годы и совпал с компьютерной революцией. 

Формула Байеса лежит в основе индуктивного подхода к распознаванию. Следует отметить, что если в обучающей выборке отсутствует один из классов объектов, то любая процедура распознавания 
работает плохо. Ключевым моментом обоснования процедур распознавания индуктивного вывода является наличие всех классов в выборке и усреднение погрешности по множеству обучающих выборок. 
Поэтому попытки оценить процедуры индуктивного вывода без учета 
таких вопросов не приводили к положительным результатам. 

Главная цель книги - познакомить читателя с современным состоянием моделей и способов распознавания и показать преимущества Байесовской процедуры распознавания как индуктивного подхода 
в математике. Приводится пример байесовской процедуры распознавания. 

6 

Глава 1. МЕТОДЫ РАСПОЗНАВАНИЯ СЛОЖНЫХ СИСТЕМ 

I. ОСНОВЫ ТЕОРИИ СЛОЖНЫХ СИСТЕМ 

Управление производством и отраслями народного хозяйства в настоящее время осуществляется при помощи автоматизированных систем управления, обеспеченных современными вычислительными машинами. Производственные объединения, тем более отрасли народного хозяйства, 
управляемые 
автоматизированными 
системами 
управления, являются типичными представителями сложных систем. 

Чтобы управлять сложной системой, необходимо составить прогноз поведения управляемого объекта, рассмотреть множество вариантов управляющих воздействий и выбрать из них наиболее эффективные. Изучение прогнозов и процессов управления может быть 
проведено при помощи современных математических моделей на 
ЭВМ. 

С усложнением объектов управления и автоматизированных систем управления появляется необходимость более глубокого анализа 
их свойств. В результате возрастает объем информации, получаемой с 
ЭВМ при моделировании. И информация при этом оказывается столь 
обширной, что затрудняет, а в некоторых случаях искажает практическое осмысление ее человеком. Поэтому используются специальные 
методы обработки результатов моделирования, которые позволяют 
представить информацию в удобном и доступном для человека виде. 

Одно из первых определений сложной системы было дано в 1973 г. 
Н.П. Бусленко в [1] .Он писал, что систему надо считать сложной, если 
она состоит из большого числа взаимосвязанных и взаимодействующих между собой элементов, и что сложная система способна выполнять сложную функцию. Против такого достаточно общего определения трудно возразить. Позднее в работе [2] им было дано определение, 
характеризующее некоторые основные свойства подобных систем: 
«Сложная система является многоуровневой конструкцией из взаимодействующих элементов, объединяемых в подсистемы различных 
уровней» [2], а математическая модель сложной системы «состоит из 
математических моделей элементов и математической модели взаимодействия между элементами» [2] 

В качестве примеров сложных систем можно привести такие [1]: 
энергетические комплексы, телефонные сети крупных городов, информационные системы, производственные процессы крупных предприятий, отраслевые автоматизированные системы управления и др. 

7 

В качестве основных свойств сложных систем можно выделить следующие [1] [2]: 

1. большое число взаимосвязанных и взаимодействующих элементов; 
2. сложность выполняемой функции для достижения цели функционирования; 

3. иерархическая структура, возможность деления систем на подсистемы; 

4. наличие управления, интенсивных потоков информации и разветвленной информационной сети; 

5. взаимодействие с внешней средой и функционирование в условиях воздействия случайных факторов. 

Первое свойство не требует пояснений. 
Второе свойство определяет основную особенность системы. В 
сложной системе выполняются задачи, которые обеспечивают достижение промежуточных и конечных целей функционирования. При 
проектировании сложных систем необходимо прогнозировать ее поведение по выполнению этих задач. 

Так как на реальные системы воздействует большое число случайных факторов, для прогнозирования поведения сложной системы необходимо использовать теорию вероятностей. Таким образом, параметры моделей прогноза могут быть охарактеризованы законами распределения. Случайные отклонения системы от нормальных режимов 
функционирования определяются возмущающими факторами внешней среды и возмущающими факторами, возникающими внутри системы. Внутренними факторами являются ошибки измерительных приборов в пределах допусков, выход из строя отдельных элементов, 
ошибки людей, работающих в системе, ошибки в управлении информации, сбои вычислительных устройств. Случайные возмущения 
иногда могут привести к вынужденному изменению структуры системы. 

Нарушение нормальных режимов функционирования не приводит 
в сложной системе к нарушению функционирования в целом, но 
снижает эффективность и качество ее работы. Значит, учет случайных факторов при исследовании сложных систем и определение их 
эффективности играет большую роль. 

Третье свойство заключается в том, что сложная система обладает 
свойством иерархичности, т.е. возможностью разбиения системы на 
подсистемы. Цели функционирования подсистем подчинены общей 
цели функционирования всей системы. Следовательно, сложной сис
8 

t 

теме присуще еще и обобщающее свойство целостности. Данное свойство означает, что изменения, происшедшие с ее элементами, 
влияют на другие элементы или подсистемы и оказывают влияние на 
функционирование всей системы. Значит, при изучении сложных 
систем необходим системный подход, т.е. исследуя какую-то подсистему, мы обязаны учитывать цели функционирования всей сложной 
системы. 

Таким образом, сложная система состоит из отдельных подсистем 
и в то же время является объектом целостным, отдельные части которого функционируют во взаимодействии. С формальной точки зрения 
любая совокупность элементов системы может считаться подсистемой. В практике исследования выделение подсистемы проводится таким образом, чтобы цели функционирования подсистемы вытекали из 
целей функционирования системы. 

Для того чтобы процесс управления мог осуществляться необходимо, чтобы подсистема состояла из взаимосвязанных и совместно 
функционирующих элементов. Что же собой представляет элемент? 
Элемент системы - это совокупность средств, которая при данном 
исследовании рассматривается как целое и дальнейшему дроблению 
не подвергается. Внутренняя структура элемента не является предметом изучения. При формализации исследуемого процесса под элементом иногда понимают коллектив людей, оператора, руководителя 
подразделения и т.д. Даже если с формальной точки зрения это оказывается удобным, понятно, как велико отличие элемента «человеческий коллектив» от элемента «совокупность технических средств». 
Известно, что участие человека в управлении АСУ приводит часто к 
результатам неожиданным. Особенно ярко это проявляется в аварийных ситуациях, когда «совокупность технических средств» не в состоянии провести ^запрограммированные действия по ликвидации 
аварийной ситуации, а человек-специалист вполне может справиться 
с такой задачей. 

Расчленение системы на элементы является важным шагом при 
формальном описании системы. Подсистему можно считать элементом сложной системы. 

Благодаря наличию иерархической структуры сложные системы 
обладают большими преимуществами. 

Сложность некоторых объектов исключает их изучение в целом. 
Тогда они расчленяются на конечное число подсистем с учетом взаимосвязей между ними. Далее слишком сложные подсистемы делятся