Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Программные продукты и системы, 2012, № 2 (98)

международный научно-практический журнал
Бесплатно
Основная коллекция
Артикул: 706066.0001.99
Программные продукты и системы : международный научно-практический журнал. – Тверь : НИИ Центрпрограммсистем, 2012. - № 2 (98). – 168 с. – ISSN 0236-235X. - Текст : электронный. - URL: https://znanium.ru/catalog/product/1016233 (дата обращения: 04.05.2024)
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Н а у ч н о - и с с л е д о в а т е л ь с к и й  и н с т и т у т  
«Це нтр п р ог р ам мс и ст ем» 
 
 
 
 
 
 
 
 
 
 
 
Программные 
продукты и системы 

 
 
 
 
 
НАУЧНО-ПРАКТИЧЕСКОЕ ИЗДАНИЕ 
 
 
 
№ 2 (98), 2012 
 
 
 
 
 

Главный редактор 

С.В. ЕМЕЛЬЯНОВ, академик РАН 
 
 
 
 
 
 
 
Тверь 

Вниманию авторов! 
 
Международный журнал «Программные продукты и системы» публикует материалы научного и 
научно-практического характера по новым информационным технологиям, результаты академических и 
отраслевых исследований в области использования средств вычислительной техники. Практикуется выпуск тематических номеров по искусственному интеллекту, системам автоматизированного проектирования, по технологии разработки программных средств и системам защиты, а также специализированные 
выпуски, посвященные научным исследованиям и разработкам отдельных вузов, НИИ, научных организаций.  
Решением Президиума Высшей аттестационной комиссии Министерства образования и науки РФ 
№ 8/13 от 02.03.2012 международный журнал «Программные продукты и системы» внесен в Перечень 
ведущих рецензируемых научных журналов и изданий, в которых должны быть опубликованы основные 
научные результаты диссертаций на соискание ученых степеней кандидата и доктора наук. 
Информация об опубликованных статьях по установленной форме регулярно предоставляется в 
систему Российского индекса научного цитирования (РИНЦ) и готовится для передачи в международные 
базы цитирования. 

Условия публикации 

К рассмотрению принимаются ранее нигде не опубликованные материалы, соответствующие тематике журнала (специализация 05.13.ХХ – Информатика, вычислительная техника и управление) и отвечающие редакционным требованиям. 
Работа представляется в электронном виде в формате Word (шрифт Times New Roman, размер 11 
пунктов с полуторным межстрочным интервалом). При обилии сложных формул обязательно наличие 
статьи и в формате pdf. Формулы должны быть набраны в редакторе формул Word (Microsoft Equation 
или MathType). Объем статьи вместе с иллюстрациями – не менее 10 000 знаков. Просьба не присылать 
цветные, тонированные и не подлежащие дальнейшему редактированию средствами Word рисунки, а 
также отсканированные формулы и тексты. Заголовок должен быть информативным; сокращения, а также терминологию узкой тематики желательно в нем не использовать. Количество авторов на одну статью 
– не более 4, количество статей одного автора в номере, включая соавторство, – не более 2. Список литературы (оформленный в соответствии с ГОСТ Р 7.05–2008), наличие которого обязательно, должен 
включать не менее 3 пунктов. 
Необходимы также аннотация (не менее 200 слов), ключевые слова (7–10) и индекс УДК. Название статьи, аннотация и ключевые слова должны быть переведены на английский язык, а фамилии авторов, названия организаций, пристатейные списки литературы – транслитерированы.  
Вместе со статьей следует прислать отзыв-рекомендацию в произвольной форме, экспертное заключение, лицензионное соглашение, а также сведения об авторах: фамилия, имя, отчество, наименование организации, должность, ученые степень и звание (если есть), контактный телефон, электронный адрес, почтовый адрес для отправки бесплатного авторского экземпляра.  

Порядок рецензирования 

Все статьи, поступающие в редакцию (соответствующие тематике и оформленные согласно требованиям к публикации), подлежат обязательному рецензированию в течение месяца с момента поступления.  
В редакции есть устоявшийся коллектив рецензентов, среди которых члены международной редколлегии журнала, эксперты из числа крупных специалистов в области информатики и вычислительной 
техники ведущих вузов страны, а также ученые и специалисты НИИ «Центрпрограммсистем» (г. Тверь). 
Рецензирование проводится конфиденциально. Автору статьи предоставляется возможность ознакомиться с текстом рецензии. При необходимости статья отправляется на доработку. 
Рецензии обсуждаются на заседаниях редакционной коллегии, которая проводится один раз в месяц в НИИ «Центрпрограммсистем» или в Главной редакции международного журнала «Проблемы теории и практики управления» (г. Москва). 
Решение о целесообразности опубликования статьи после рецензирования принимается редакционным советом. 
Материалы, одобренные редакционным советом, публикуются бесплатно в течение года с момента одобрения, а статьи, отправленные на доработку, – с момента поступления после доработки. Если 
принятая к публикации статья, по мнению автора, является срочной, редакция вправе опубликовать ее в 
текущем номере на коммерческой основе. 

Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

3

УДК 519.816 
МЕХАНИЗМЫ УПРАВЛЕНИЯ ЭВОЛЮЦИЕЙ  
ОРГАНИЗАЦИОННО-ТЕХНОЛОГИЧЕСКОЙ СИСТЕМЫ 
 
Г.П. Виноградов, к.т.н.; Б.В. Палюх, д.т.н.  
(Тверской государственный технический университет, wgp272ng@mail.ru) 

 
Сформулирована задача синтеза механизма управления эволюцией организационно-технологической системы, 
использующей способность человека к самоорганизации. Разработана модель функционирования системы, содержащей агентов, способных к самоорганизации. Описано поведение самоорганизующихся агентов, приведен алгоритм построения ими множества предпочтительных состояний. 
Ключевые слова: интеллектуальные организации, нечеткий вывод, агент, целеустремленное состояние, самоорганизация, эволюция. 
 
Системный подход к управлению интеллектуальными организациями с неоднородными агентами использует два их основных креативных 
свойства: способность человека к самоорганизации (самосовершенствованию) без участия внешних сил (активная форма адаптации, когда для 
эффективного поведения системы в будущем она 
сама изменяет среду) и способность к пассивной 
форме адаптации (приспособление к изменениям 
во внешней среде для сохранения эффективности 
в ней). Организация как центр действий и процессов, ориентированных на цели, объединяет эти два 
вида потенциала своего развития. Потенциал 
адаптации реализуется с помощью механизмов 
функционирования, основанных на централизации. Либеральные механизмы, создавая соответствующий 
климат, 
способствуют 
раскрытию 
творческих способностей субъекта, реализуют его 
способность к самоорганизации.  
При централизованном механизме процедуры 
планирования должны быть направлены на постепенное обнаружение резервов используемого способа производства путем сочетания их с процедурами исследования объекта управления и активного экспериментирования. Агент, зная цель этих 
процедур, может занижать свою эффективность в 
сравнении с имеющимся потенциалом, чтобы увеличить или сохранить свои выгоды в будущем. 
Это связано со сложным характером соотношения 
параметров процедур планирования, стимулирования и субъективными оценками агентом текущей и будущих ситуаций целеустремленного состояния. Нарушение этого соотношения приводит 
к регрессу организации.  
Либеральные механизмы, использующие свойства агента к самоорганизации, будут эффективными только в случае направленности деятельности агентов на общую цель, достижение которой 
должно гарантировать им получение ожидаемых 
состояний. Если развитие зависит от инноваций, 
изобретений и творчества, эффективность организации в еще большей степени обусловлена поведением агентов. В информационном обществе 
продукт интеллектуального труда неотделим от 
работника [1]. Эволюционный менеджмент будет 

эффективным, если обеспечивает полную реализацию способностей человека. Для эффективного 
функционирования всех своих членов при достижении определенной цели организация путем обмена овладевает их человеческим капиталом. 
И в первом, и во втором случаях успех определяется тем, как центр понимает принципы и процедуры формирования у агентов представлений о 
свойствах ситуации выбора и правил выбора ими 
решений. В обоих вариантах это связано с анализом обработки информации человеком.  
 
Постановка задачи управления эволюцией  
организационно-технологической системы 
 
Пусть организационная система состоит из 
центра и n агентов, обладающих активностью, автономностью, 
креативностью. 
Каждый 
агент 
управляет каким-либо технологическим узлом. 
Возможности k-го агента по выпуску продукции 
описываются технологическим множеством − областью Xk в пространстве из nk измерений: любой 
допустимый план xk={xij, j=1,
}
kn
 k-го агента должен принадлежать области Xk: 
xk∈Xk, k=1,n . 
 
 
 
 
 
 
 
 
(1) 
План всей активной системы будет описываться вектором x={xk, k=1, }
n , имеющим размерность 

1

.

n

k
k

n
N

=

=
∑
 Тогда очевидно, что 
1

,

n

k

k

x
X
X

=
∈
= ∏
 по
скольку подвекторы x1, x2, …, xn принадлежат соответствующим множествам локальных агентов. 
Допустимый план x должен удовлетворять не 
только локальным ограничениям, но и ряду глобальных ограничений вида G(x)≥b, где 

( )
{
( ),
1, },
{ ,
1, }
i
i
G x
g x
i
L
b
b i
L
=
=
=
=
.  
(2) 
Суть глобальных ограничений в том, что за их 
выполнение отвечает не какой-либо агент, а центр, 
управляющий всей системой. Формально это выражается в том, что функции G(x) предполагаются 
зависящими от всего вектора x, а не от одного из 
векторов xk, 
1, ,
k
L
=
 описывающих планы отдельных агентов. Общие ограничения отражают зада
Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

4

ния по выпуску продукции, лимитированность ресурсов, потребляемых комплексом из внешней 
среды, связи по материальным потокам между 
технологическими узлами и т.п. 
Будем считать, что gi(x), 
1,
i
L
=
 − вогнутые, 
дифференцируемые функции, а X − выпуклое 
множество. Тогда задача, решаемая центром, может рассматриваться как задача вогнутого программирования: 

1

Ф( )
max,
( )
,
.

n

k

k

x
G x
b x
X
X

=
→
≥
∈
= ∏
  
(3) 

Здесь предполагается, что цель, стоящая перед 
центром, заключается в максимизации известной 
ему функции Ф(x), зависящей от всех компонент 
вектора x. Особенность задачи оптимального планирования (3) заключается в том, что либо центру 
неизвестна вся область X, либо он не знает все потенциальные возможности агентов. 
Практическая невозможность для центра получить точное представление о технологических ресурсах агентов предполагает необходимость разработки специальных процедур обмена информацией между центром и агентами. Это позволяет 
ему сформировать согласованный план без необходимости решения задачи математического программирования в полном объеме (с учетом всех 
глобальных и локальных ограничений, отражающих интересы агентов). 
Можно представить такую процедуру взаимодействия центра с агентами: 1) сначала центр узнает у агентов лишь грубое, приближенное описание их технологических множеств и находит решение задачи (1) (формирует план для агентов);  
2) центр запрашивает у агентов оценки плана, 

уточняет их интересы в окрестности полученного 
решения в обмен на стимулирование за раскрытие 
своих возможностей; 3) получив новую информацию, центр пересчитывает решение и задает новые вопросы агентам до тех пор, пока не будет 
получено точное или близкое к нему решение. 
Описанная модель поведения интеллектуальных агентов предполагает, что агенты, управляющие технологическим агрегатом (процессом), на 
уровне собственных представлений хорошо знают 
и чувствуют свои объекты управления и могут с 
достаточной степенью точности ответить, например, на такие вопросы: Какой план для вас выгоден при заданной системе стимулирования? Укажите по определенной шкале ценность для вас  
величины стимулирования при данном уровне 
плана. Если данный план для вас является невыполнимым, то укажите, какой из выполнимых 
планов наиболее близок к данному плану. Что 
нужно, по вашему мнению, сделать, чтобы невыполнимый план стал реализуемым?  
 
Базовая модель обучающейся  
организационно-технологической системы 
 
Рассмотрим обучающуюся адаптивную организационно-технологическую систему (см. рис.). 
Функционирование схемы начинается с периода t, t=0, 1, 2, … На вход агента подается управление центра: план ht, определяющий результаты 
деятельности агента yt, потребляемые ресурсы xt, 
режимы ведения технологического процесса в виде коэффициентов выпуска αt, а также управление 
его поведением ut. В состав последнего входят затраты на оплату деятельности агента, его обуче
ut 

Оценки потенциала 

Центр 

It 

План πt 

Стимулирование  
потенциала

Целеуказание

Интеллектуальный дальновидный агент 
{C, A0, U, WI(•), R, I} 

o=o(y)∈O

xt 

ωt 

ct 
zt 

yt 

αt 

Объект управления

w(•): C×ξ×Χ→Ao 

Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

5

ние и коучинг, стимулирование поиска скрытых 
резервов и т.п. Кроме того, на вход объекта действует помеха, значение которой в момент времени t 
известно агенту, но неизвестно центру. Обладая 
определенной структурой информированности Et, 
агент может сформировать представление о множествах Y(p(ut), xt, ωt) и Z(p(ut), xt, ωt). После анализа реализуемости возможных режимов ведения 
технологического процесса агент выбирает состояние yt∈Y(p(ut), xt, ωt). Центр наблюдает результат выбора yt и определяет оценку параметра 
αt+1 в периоде t+1: 
αt+1=I(αt, yt, xt), α0=α0,  
 
 
 
 
 
(4) 
где I – процедура оценки технологических возможностей агента; αt – оценки потенциала p(ut) 
агента в период t, ατ∈R1, τ=0, 1, 2, …, I(αt, yt, 
xt)⊂C1, I(α, y, x)↑α, 
1
t
t
t
I
A
Y
A +
Ä
¾¾¾¾®
. 

Предположим, что при любых α∈At процедура 
(4) удовлетворяет следующим условиям: I(α, y, 
x)≥I(α, y′, x)⇔µ, µ′∈Θ, u∈U, y∈Y(p(u), x, µ), 
y′∈Y(p(u), x, µ′) и µ≥µ′ [2]. 
Значит, центр, получив более высокие оценки 
потенциала агента, может быть уверен, что агент 
стремится улучшить свое представление об имеющихся резервах технологического процесса и его 
деятельность направлена на их реализацию в 
практике управления. 
Если y∈Y(p(u), x, ω) и y'∈Y(p(u), x, ω'), то I(α, y, 
x)≥I(α, y', x). В силу строгой монотонности Y(p(u), 
x, ω) и условий выпуклости и замкнутости существует единственная форма представлений агента 
µ=ξa∈θ о технологических возможностях, при ко
торой y∈Y∗(p(u), x, ω). Это, в свою очередь, гарантирует, что различным потенциалам агента p(u, µ) 
и p(u, µ′), µ≠µ′, таким, что y∈Y(p(u), x, µ) и 

y'∈Y(p(u), x, µ'), центр будет назначать разные 

оценки I(α, x, y)≠I(α, x, y′). 

Зная оценки потенциала агента αt+1, центр, используя процедуру планирования π и регулирования Q, определяет ему вознаграждение за достижение 
плановых 
показателей: 
ut+1=Q(αt+1), 
ut+1∈Ut+1 и план ht+1={yt+1, xt+1, αt+1) на период t+1: 
ht+1=π(αt+1), ht+1∈Ht+1, π(α)↑α. 
Здесь π, Q∈C – непрерывные функции, которые могут быть известны и согласованы центром  
с агентами. 
Сопоставляя фактическое состояние h*
t+1={yt+1, 
xt+1, αt+1) с плановым ht+1={yt+1, xt+1, αt+1), центр определяет стимулирующее воздействие на агента 
по правилу 
*
1
1
(
,{ , },
,
t
t
t
t
t
h
y x
R
C
ϕ = φ
ϕ ∈
φ∈
. 
На этом функционирование системы в период t 
завершается. 
Допустим, что на r-м шаге интерактивной процедуры центр имеет некоторую информацию о 

множестве предпочтительных состояний агента 
Si(r). Предположим, что на r+1-м шаге от агента 
была получена дополнительная информация и построено новое множество желательных состояний 
для агента Si(r+1). Последовательно конструируемые центром множества желательных состояний 
агента должы отвечать следующему условию: 
Si(r)⊆Si(r+1).  
 
 
 
 
 
 
 
 
(5) 
В этом случае можно говорить, что множество 
Si(r+1) непротиворечиво расширяет множество 
Si(r). Если потребовать, чтобы включение было 
строгим, то (5) будет условием содержательности 
дополнительной информации от агента о предпочтительных состояниях. Конечность множества Xk 
гарантирует сходимость процедуры. 
Пусть результат деятельности центра d∈A0 определяется результатами деятельности агентов и 
A0=G(A1, β), где G(•) – функция агрегирования результатов деятельности агентов. 
Целевая функция центра является функционалом Φ(σ, d) и представляет собой разность между 
его доходом λd, где λ может интерпретироваться 
как рыночная цена, и затратами на вознаграждение σ(d, p), выплачиваемое агентам: σ(d, p)= 

1

σ (
,
)

n

i
i
i

i

y p

=
= ∑
, где σi(yi, pi) – функция стимулиро
вания i-го агента. 

Тогда Φ(σ(•), d, λ, p)=λd–

1

σ (
,
)

n

i
i
i

i

y p

=∑
. 

 
Поведение агента 
 
Будем считать, что интересы агента описываются вектором 
o

i
i
o
O
Î
, где 
o
i
O  – множество состояний, имеющих различную привлекательность 
для агента. Значения вектора oi определяются 
фактическими значениями вектора yi и другими 
характеристиками технологической ситуации целеустремленного состояния. Предпочтения агента 
на множестве 
o
i
O  отражают устойчивые черты его 
личности. Они проявляются в действиях агента, 
которые являются результатом принятых им решений на основе субъективных представлений о 
ситуации целеустремленного состояния. Действия 
через поведение и эмоциональные переживания 
агента влияют на ситуацию целеустремленного 
состояния, изменяя ее. В свою очередь, ситуация 
оказывает обратное воздействие на устойчивые 
черты субъекта, когда он воспринимает, интерпретирует ее и изменяет свой опыт и поведение.  
При управлении технологическим узлом такое 
поведение агент реализует путем выбора значений 
режимных параметров zi, которые, в свою очередь, 
определяют значения вектора yi, а значит, и oi. 
Справедливо условие zi∈Zi, где Zi – множество допустимых значений режимных параметров, опре
Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

6

деляемое технологическим регламентом. Отметим, что агент вправе рассматривать расширенный 
вариант вектора yi. В него он может включать параметры состояния агрегатов технологического 
узла, интенсивность своего труда и т.п. 
Значения вектора режимных параметров zi  
определяются вектором способов действия ci.  
В последний входят значения энергетических потоков, расходы сырья, вспомогательных материалов и т.д. Очевидно, что ci∈Ci. 
На технологический узел влияют различного 
рода возмущающие воздействия ωi∈Ωi, из которых часть si∈Si агент принимает во внимание. Поэтому Si⊆Ωi и Si∩Ωi≠∅. 
Поведение человека как интеллектуального 
агента, зависящее от его субъективных представлений о ситуации выбора, рассматривалось в работе [3], где было показано, что принимаемое 
агентом решение о способе действия определяется 
его оценками компонент ситуации целеустремленного состояния. Оценки, в свою очередь, зависят от структуры информированности Et, которая 
определяется знаниями, убеждениями, ценностями, нормами, опытом агента. В этой же работе 
была предложена модель принятия решений агентом, позволяющая учитывать его индивидуальные 
оценки компонент ситуации целеустремленного 
состояния. Модифицированный вариант этой модели применительно к задачам управления непрерывным производством имеет следующий вид: 

{
}

1
1
2
2

(σ ,
,
, )
Arg max φ ( , , ,
),

,
(
),
,
(
)
,

( ,
,
)
,
,
1,
,

, χ ( φ )
χ , χ (
)
χ ,

t

i
i
i
i
i
i
i
i
i

i
o

i
i
i
i
t
i
i
i
i
i
i

o
o
i
E
i
i
i
i
i
ij

i
io
i
io
t
i
i

f
y p s
E
o s c u

s
S
c
C I
u
U
o
o y
O

y
f
s c y
X
O
O
j
n

I
M
E
EE

=

∈
∈
∈
=
∈

=
∈
=
=

⊆
≥
≥

 (6) 

где Eϕi и EEi – интегральные оценки агента удельной ценности ситуации целеустремленного состояния по результату и эффективности; 
,
io
lc

1,2
l =
 – оценки, отражающие эмоциональное отношение агента к ситуации выбора. 
Целевая функция агента, стремящегося не 
только увеличить свои доходы в текущем периоде, 
но и в определенной степени обеспечить их полу
чение в будущем, будет иметь вид 
τ

τ

τ

ρ
φ

t T
t
t
t

V
E

+
−

=
= ∑
, 

где ρ – коэффициент дисконтирования, используемый для приведения будущих доходов к текущему моменту времени t, 0<ρ<1; T – дальновидность агента в периодах времени. 
Пусть агент может находиться в m состояниях 
{ ,
1, }
,
i
y
y
i
m
Y
=
=
Î
 образующих его модель ограничений. Предположим, что i-й агент характеризуется параметром pi∈Ωi⊆R1, называемым его 
типом и отражающим потенциал самоорганизации 
агента. Вектор потенциалов (типов) агентов обо
значим через 
{
,
1, }
i
p
p
i
n
=
=
. Тогда y∈Y(p)⊆Rm. 
Проявление потенциала агента будет зависеть от 
управления u∈U со стороны центра, его представлений о свойствах ситуации целеустремленного 
состояния ξ∈Θ=[ , ]
x x ⊂R1, где x  – представления, 

известные и разделяемые всеми агентами и центром (общее знание); x  – представления, известные только i-му агенту и в полезности которых он 
убежден. Будем считать, что множество Y(p) выпукло и замкнуто, то есть Y(p1)⊆Y(p2)⊆ … ⊆Y(pn)⊆ 
… ⊆Y*(p), где Y*(p) – множество возможных состояний, характеризующих предельные потенциальные возможности агента; p1, p2, …, pn – последовательность 
потенциальных 
возможностей 
агента, возрастающих за счет управления u. Будем 
предполагать, что множество Y(p(u), ξ) непрерыв
но на Θ и U соответственно при любых u∈U и 
ξ∈Θ.  
Потенциал самоорганизации и адаптации, реализуемый агентом в действиях, делает справедливым утверждение, что множество Y(p(u), ξ) явля
ется расширяющимся на Θ, то есть Y(p(u), ξ1)⊂ 

⊂Y(p(u), ξ) при u∈U, ξ, ξ1∈Θ, µ(ξ)>µ(ξ1), где µ(•) – 
субъективные оценки агента полезности своих 
представлений. Кроме того, предполагается строгая монотонность Y(p(u), ξ) на Θ при любом u∈U; 

W(p(u), ξ)∩W(p(u), ξ1)=∅, µ(ξ)≠µ(ξ1), ξ, ξ1∈Θ. Это 
означает, что способность агента накапливать потенциал за счет самообучения при наличии соответствующего стимулирующего воздействия позволяет дополнить задачу (3) условием 

1
2

2
1
1
2

{
,
1, },
{
,
,

(
)
(
)}.

k

k
k
k
k
k

k
k
k
k

p
p k
n
p
P
p
p
P
p
p
X p
X p

=
=
∈
= ∀
∈
>
→
⊂
  
 
 
 
(7) 

Поскольку механизм функционирования Σ(I, π, 
Q, f) с процедурами оценки и прогнозирования  
потенциала агента I, планирования π, стимулирования f и регулирования Q обладает свойствами 
выявления потенциала агента путем активной 
идентификации, будем называть его адаптивным 
механизмом функционирования. 
Величину Vt назовем ценой, на которую агент 
согласен обменять свой человеческий капитал при 
участии в достижении целей, поставленных центром. 
В рассмотренном выше случае предполагается, 
что агент способен к самоорганизации первого 
типа.  
Обозначим через ci∈Ci способы действия аген
та, i∈N={1, 2, …} – множество агентов. Пусть 

1

1
{ ,
1, }

n

i
i

i

c
c
i
n
C
c

=
=
=
∈
= ∏
 – это вектор способов 

Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

7

действия агентов, наблюдаемый всеми агентами, 

вектор 
{
,
1, ,
}

n

i
j
i
i

j i

c
c
j
n i
j
C
c
−
−
≠
=
=
≠
∈
= ∏
 – об
становка игры i-го агента по наблюдаемым способам действия. 
Стратегией агента является вектор способа 
действия ci∈ Ci, который приводит к ожидаемому 
результату yi в соответствии с его представлениями ξi: 
i
i
i
I
c
y
¾¾¾¾¾®
, где Ii – доступная агенту информация о правиле получения результата. Тогда 

1

1
{
,
1, }

n

i
i

i

y
y
i
n
Y
y

=
=
=
∈
= ∏
 – вектор результатов 

деятельности агентов, а вектор 
{
,
1, ,
i
j
y
y
i
n
- =
=
 
}

n

i
j

j i

i
j
Y
y
−
≠
≠
∈
= ∏
 – обстановка игры i-го агента 

по результату. 
Удобно ввести вектор v-i={c-i, y-i}, характеризующий полную обстановку игры для i-го агента. 
Задача (6), решаемая агентом, зависит от параметров p и u, причем целевая функция агента f(•) 
неизвестна центру. Центр предполагает, что агент, 
наблюдая обстановку v-i={c-i, y-i}, знает правила 
реализации своего потенциала в вектор способов 
действий ∆: Pk→Ck и вектор параметров результатов ∆ψ: Ck→Yk. 
Целевая функция i-го агента является функционалом fi(σi, yi, pi) и представляет собой, как показано в (6), удельную ценность ситуации целеустремленного состояния по результату. Второй 
возможный вариант – это разность между субъективными оценками удельной ценности ситуации 
целеустремленного состояния по результату и эффективности затрат, то есть fi(σi(•), yi, pi)=Eϕ(σi(yi, 
pi)) –EEi(y(ci, pi)), i∈N. 
В этом случае агент обменивает свой человеческий капитал pi(ξi) на вознаграждение σi(yi, pi) 
при приемлемом для него уровне затрат на получение результата yi [2]. Агент является собственником этого капитала, носителем уникального 
опыта, знаний и человеческих качеств. 
Обозначим через X*={x*x*∈X*(p), p∈P} множество достижимости или множество предельных 
технологических возможностей. 
При выполнении условия (7) способности 
агента формировать расширяющееся множество 
способов ведения технологического процесса и 
стимулирующем воздействии центра u можно определить следующие свойства целевой функции и 
областей достижимости: 

1
2
2
1
1
2
2
2
1
1

1
2
2
1
1
1
2
2
1
2

,
:
;
,
( ,
)
( ,
),

{
,
:
,
:
}.

x x
X x
x
u u
U
f x u
f x u

X
x|x x x
x
x
X ; x
X X
X

∀
∈
>
∀
∈
→
>

=
>
∈
∈
⊆
(8) 

Условие (8) означает, что агент способен сконструировать более эффективные способы действия 
и видит открывающиеся при их реализации возможности. 

Алгоритм построения агентом  
множества предпочтительных состояний 
 
Поскольку конкретный вид целевой функции 

f(•) и состав множеств P и X  полностью неизвестны, решение задачи (3, 7, 8) центром целесообразно выполнять с помощью алгоритмов сводимости, то есть на базе решенных локально-оптимальных задач агентами и полученной от них  
дополнительной 
информации. 
Формирование 
встречной информации при таком подходе заключается в реализации совокупности последовательных процедур, предназначенных для поиска промежуточных решений, на основании которых 
агент уточняет свои возможности и формирует 
окончательное решение. Полный цикл формирования агентом информации о своих возможностях 
включает следующие шаги. 
1. Получение агентом от центра на r-м шаге 
варианта плана hk(r) и управляющего воздействия 
uk(r). Формирование агентом множеств Pk и Xk  на 
основе знаний, опыта, интуиции и информации о 
параметрах своего потенциала pk  и обстановке v-k. 
Просмотр множеств Pk и Xk, формирование точки 
yo*={yo*yo*=y(x), x∈Xk(p), p∈Pk}. Построение для 
найденной точки оценок значимости результата 
o(yo*), удельной ценности ситуации целеустремленного состояния по результату Eϕk(o(yo*)) и эффективности EEk(o(yo*)). Проверка существования 
x∗ и c∗, таких, что y(x*(p), c*(p))=yo* и o(yo*)=o*. Если таких способов нет, осуществляется переход к 
п. 2, иначе проверяются условия 

*
*

1
1
2
2
χ ( φ ( (
))
χ , χ (
( (
))
χ
k
o
ko
k
o
ko

k
k
E
o y
EE
o y
≥
≥
. (9) 

Если условия (9) выполняются, то x∗ принадлежит к множеству желательных состояний для 
агента, а y(x∗(p)) – вектор результатов, удовлетворяющий представлениям агента о свойствах будущей ситуации целеустремленного состояния. 
Сообщение информации центру. В противном 
случае переход к п. 2. 
2. Решение задачи поиска потенциально предпочтительного набора действий x∗∈X(p) и c∗∈C(p), 

позволяющего сформировать вектор 
*
o  предельных оценок значимости ситуации целеустремленного состояния при использовании на данный момент знания о структуре множества P и правилах 
∆ и Ψ. Так как компоненты 
,
io
1, ,
i
L
=
 порознь 
достижимы, а вместе нет, делается попытка найти 
компромиссное решение, удовлетворяющее условиям (9), за счет компенсаторных уступок по каждой компоненте, являющейся несколько хуже решения 
*
o . Если такого решения нет, то есть агент 
не намерен искать компромиссное решение, соответствующее начальным множествам Pk и Xk, 
осуществляется переход к п. 3, иначе – к п. 5. 

Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

8

3. Анализ направлений возможного расширения множества P путем изучения свойств обстановки v-k и организация процедур поиска новой 
информации (знания) для Pk(r)⊆Pk(r+1), а значит, 
конструирование новых правил ∆ и Ψ, то есть 
расширение множеств Xk и Ck. 
4. Если расширение множества Pk(r) возможно и существует Pk(r+1) такое, что Pk(r)⊆Pk(r+1), 

осуществляется переход к п. 1, иначе фиксируется, что компромиссное решение yo* является неприемлемым при управлении uk(r). 
5. На основе условий (9) путем решения обратной задачи определяются лучшие значения 
o<j(yo*), y<yo* и соответствующие им значения 
x<x* и c<c*. 
6. Выполнение процедуры поиска минимально предпочтительной точки в пространстве оценок 
значимости ситуации целеустремленного состояния по направлению предпочтения y, yo*, определение вектора p0∈P и x*∈X(p). 

7. Если полученное значение для x*, y*, o* 
принимается как удовлетворительное решение, 
процедура останавливается, в противном случае 
осуществляется переход к п. 8. 
8. Для ограничений на o (прямых и косвенных) X определяет приоритетную координату 

0
[1, ]
i
L
Î
, по которой делается расширение мно
жеств P и Х так, чтобы 
0
0
0
( )
∆
i
i
i
o
x
o
=
+
, где ∆ oi  – 

минимально возможное улучшение, которое является значимым для агента. Оно определяется по 
его высказываниям о гибкости ограничения на основе выполнения процедур поиска дополнительной информации. Определение u(r+1)=u(r)+∆u. 
Переход к п. 1. 
Описанный алгоритм использует три типа механизмов, применение которых порождает интерактивный процесс для построения компромис- 
сного решения. 
Механизм анализа: с его помощью агент в момент r обрабатывает сведения, полученные на шаге r–1, для построения множеств Pk и Xk с целью 
определения xk, yo*, c*, z*. Сопоставляются результаты, полученные на момент r, с результатами на 
шаге r–1. Формируется представление о значениях 
вектора oo* и уступок по его компонентам. Строится предварительное представление о желательных 
значениях 
показателей 
Eϕk(o(yo*)) 
и 
EEk(o(yo*)). 
Механизм целеполагания: с учетом результатов 
предшествующего анализа позволяет определять 
условия, при которых возможно достижение желательных значений xk, yo*, c*, z*, Eϕk(o(yo*)) и 
EEk(o(yo*)). Для этого рассчитывается идеальная 
точка в пространстве оценок o, связанная с мно
жествами Pk и Xk, – это точка 
*
o , имеющая коор
динаты 
*

,
max
( ( )),
1,

k
k
i
p P
x X
i
o x p
L
o
i
∈
∈
=
=
. 

То есть 
*
o  – наибольшее значение оценки по 
координате i, которое может быть получено с помощью намеченных действий. Эта точка образует 
центр области поиска предпочтительных состояний. Если при найденном значении координат 
точки 
*
o  условия (9) не выполняются, то агент 
рассматривает возможность расширения множеств 
Pk, Xk и Ck за счет включения дополнительных  
переменных, осуществления структурных изме- 
нений и т.п. для ослабления наиболее жестких ограничений так, чтобы выполнялось включение 
Pk(r)⊆Pk(r+1) и Xk(r)⊆Xk(r+1). Если это невозмож
но, формируются сведения о координатах oi<
*
io  

точки oi≠
*
io , которая была бы достижимой и стала 

лучшим компромиссом в окрестности точки 
*
o . 

Путем минимизации потерь 
*

1

L
o

i
i
i

o
o

=
å
 определя
ются величины pi=oi –
*
io ≠0, примерно эквивалентные, небольшие и значимые для агента. 
Механизм самоорганизации: для предварительно созданных условий позволяет получать 
(создавать) знания о правилах ∆ и Ψ для расширения множеств Pk, Xk и Ck. Он может иметь различные формы: проведение экспериментальных исследований на объекте с целью улучшения своего 
представления о его функционировании; анализ 
обстановки v-k; привлечение экспертов для подготовки рекомендаций по улучшению режимов ведения процесса; процедуры опроса персонала; 
процедуры голосования и т.п.  
В заключение отметим следующее. Описанная 
методика использовалась для выявления эффекта 
от внедрения АСУ технологическими комплексами и систем управления безопасностью в химической промышленности. Ее применение позволило 
определить потенциальные резервы технологических процессов и согласованные траектории их 
использования на всех уровнях управления. В  
результате сократились сроки внедрения автоматизированных систем за счет создания стимулов  
к совершенствованию технологического процесса 
и систем управления им у производственного и 
управленческого персонала. 
 
Литература 
 
1. Иноземцев В.А. За пределами экономического общества. М.: Academia-Наука, 1998. 
2. Цыганов В.В. Адаптивные механизмы функционирования промышленных объединений. М.: ИПУ РАН, 2000. 
3. Виноградов Г.П. Индивидуальное принятие решений: 
поведение целеустремленного агента: научн. монография. 
Тверь, ТГТУ, 2011.  
4. Виноградов Г.П., Кузнецов В.Н. Моделирование поведения агента с учетом субъективных представлений о ситуации 
выбора // Искусственный интеллект и принятие решений. 2011. 
№ 3. С. 58–72. 

Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

9

УДК 519.816 
МОДЕЛЬ ПРИНЯТИЯ РЕШЕНИЙ ЦЕЛЕУСТРЕМЛЕННОГО  
ПОВЕДЕНИЯ АГЕНТА В СЛАБОСТРУКТУРИРОВАННЫХ СРЕДАХ 
 
Г.П. Виноградов, к.т.н.; В.Н. Кузнецов, д.т.н.  
(Тверской государственный технический университет, wgp272ng@mail.ru);  
В.Н. Богатиков, д.т.н.  
(Институт информатики и математического моделирования Кольского научного центра РАН, 
г. Апатиты) 

 
Сформулирована задача генерации альтернатив поведения для слабоструктурированных сред, в которой сочетаются этапы целеполагания и целедостижения, что дает возможность использовать представления о предметной области проекта каждого из его участников. Описана модель выбора участника проекта, позволяющая прогнозировать 
его поведение. На основе модели предложена формальная процедура поведения участника проекта в процессе достижения целей проекта. 
Ключевые слова: проект, нечеткий вывод, агент, целеустремленное состояние, нечеткое программирование. 
 
Для наукоемких производств характерен проектно-технологический способ организации функционирования. Под проектом будем понимать 
комплекс взаимосвязанных мероприятий, направленных на достижение системой в заданный период времени и в установленном бюджете желаемых 
состояний (поставленных целей). Успешность 
проекта во многом определяется этапом целеполагания. В организационных системах цели фор- 
мулируются ЛПР. Конкретные варианты целей  
зависят от внешней обстановки, потребностей и 
мотивации ЛПР, его эмоционального состояния, 
структуры ценностей, представлений о компонентах ситуации выбора. В условиях постоянно изменяющейся внешней среды, неполной информированности, информационных атак, сложности проекта, взаимосвязанности целей в проектах нередки 
ситуации, когда отмеченные особенности ЛПР 
могут приводить к полаганию ложных целей, а в 
менее худших случаях к их неполной структурированности.  
На практике при разработке проекта и его реализации возможности исполнителей зачастую неизвестны, результат выполнения его этапов будет 
зависеть от множества как случайных, так и неопределенных факторов. Большинство факторов, определяющих успешность проекта, имеют качественную природу, информацию о них можно получить только от эксперта.  
Из-за сложности и неопределенности процесса 
целеполагания проекта при построении структуры 
целей необходимо сочетать этапы анализа и синтеза. Анализ направлен на обеспечение уменьшения неопределенности и сопряжен с полаганием 
подцелей. Целеполагание представляет собой 
многошаговый процесс, каждый шаг которого соответствует задаче и осуществляет анализ выполнения ограничений по времени, ресурсам, затратам и возможности достижения целей проекта, а 
затем по результатам анализа – корректировку целей проекта и множества возможных способов их 
достижения. В результате многошагового процес
са анализа и полагания целей формируется иерархическая структура целей. Синтез направлен на 
формирование у ЛПР высокой степени убежденности в реалистичности и достижимости целей и 
реализуется путем имитации их осуществимости 
на основе способов действия для достижения намеченных подцелей. В результате многошагового 
процесса синтеза и мысленного достижения целей 
(целедостижения) формируется сетевая структура 
целей, или схема целедостижения. 
Для описания анализа и синтеза полагания и 
достижения целей в теории и практике управления 
организационными системами и методологии системного анализа разработано большое количество 
моделей, методов, методик и рекомендаций: регулирование конечных целей надсистемами, требования к формулировкам целей и к структурам целей. Однако применение перечисленных средств в 
слабоструктурированных средах не обеспечивает 
обоснованность указанных процессов, приводит к 
ложным целям и логическим ошибкам в их структурах. Следствием формирования логически некорректных структур целей являются просчеты в 
проектах, нередко выявляемые в процессе их реализации и после завершения. Все это снижает эффективность и результативность проектов. 
Этап целеполагания для обеспечения эффективности проекта при его реализации является основой для поиска подходов к решению проблемы 
логической правильности структуры целей и способов их достижения, гарантирующих высокую 
степень убежденности ЛПР в истинности целей и 
корректности их структур. Достижение подобного 
результата возможно при сочетании методов анализа и синтеза целей с одновременным выявлением скрытых резервов исполнителей и при по- 
вышении информированности ЛПР путем индуктивного обобщения индивидуального опыта всех 
участников процесса целеполагания. Вместе с  
установленными в психологии итеративным характером указанных процессов и тем, что адекватным языком интуитивного мышления является 

Программные продукты и системы  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
№ 2, 2012 г. 

10

вербальный язык, это приводит к следующему заключению: для обеспечения логически правильного целеполагания, анализа и синтеза целей проекта и своевременного выявления и исправления 
ложных целей и некорректных структур целей необходимо дополнить указанные процессы моделированием рассуждений о целях, логическая семантика которых явным образом определяется семантикой целей и связей между ними, и выдать их 
результаты в виде семантических графов. 
Подход состоит в системном представлении 
процессов целеполагания, целедостижения, анализа и синтеза целей. Это позволяет 1) обеспечить 
соответствие лингвистической и логической форм 
описания целей, 2) установить истинность или 
ложность утверждений о целях с их свойствами в 
зависимости от наличия или отсутствия в проектах соответствующих целевых ситуаций, 3) разработать семантическую модель структуры целей,  
4) закрепить за логически корректными структурами целей по результатам анализа и полагания 
целей методологическую функцию, способствующую синтезу корректных схем целедостижения. 
 
Постановка задачи генерации альтернатив, 
анализа и синтеза целей проекта в условиях 
неопределенности 
 
Иерархическую структуру целей проекта как 
результат определения перечня целей проекта, которые должны быть достигнуты в результате выполнения проекта, и полагания структуры подцелей представим в виде графа Gпр, содержащего m 
уровней [1] 

,
пр
G
X R
=
, 
 
 
 
 
 
 
 
 
(1) 
где X – множество вершин, соответствующих целям всех i-х уровней, 
1,
1
i
m
=
- ; R – множество 
дуг графа, сопоставленных с множеством отношений подчинения целей верхнего уровня целям 
нижнего уровня и выражающих условия целедостижения. 
В соответствии с (1) можно сформировать кортеж целей 
{
}
1
2

1
(
1,
)
(
2),
0
0
1
1
( ),
(
1),
,
,
,...,
, ...,
i
m

i
m
i
j
m
j
i
j
m
j
X
x
x
j
x
x

=
, 

где x0 – цели верхнего уровня; 
1
(
1),
( ),

i

i

i
j

i
j
x
 – множест
во ji-х целей i-го уровня, подчиненных целям  
i–1-го уровня (
0,
1
i
m
=
- ); ji-1 – множество целей  
i–1-го уровня. 
Сложный процесс построения планов проекта 
и его реализации можно выразить, упорядочив во 
времени граф Gпр, если предположить, что цели 
выдвигаются (становятся актуальными для реализации) в моменты времени 
,
0,
1
it
i
m
=
- . В ре
зультате получим граф 
,
,
пр
t
i
G
X R t
=
, отражающий процесс целевого планирования проекта, 
который идет от вершины x0 в направлении вер
шин 
2

1

(
2),
(
1),
m

m

m
j
m
j
x


 нижнего уровня. Процесс реализа
ции проекта будет идти в обратном направлении 
от достижения целей нижнего уровня к достижению целей верхнего уровня. 
Обозначим через 

1
1,
m
m
j
u

 вектор тех управле
ний, которые следует реализовать для достижения 
целей 
2

1

(
2),
(
1),
m

m
m
j
m
j
x

 m–1-го уровня, описываемых век
тором 
2

1

(
2),
(
1),
m

m
m
j
m
j
X

. 
Очевидно, 
что 
2

1
(
2),
(
1),
m

m
m
j
m
j
x

Î

2

1

(
2),
(
1),
m

m
m
j
m
j
X

Î
 аналогично 

1
1
1,
1,
m
m
m
j
m
j
u
U

Î
. 

Рассмотрим процесс формирования целей k-го 
уровня, то есть подграф 
,
,

k
пр
t
k
k
k
G
X
R
t
=
 графа 

,
,
пр
t
i
G
X R t
=
. В этом подграфе xk – множество 

целей k-го уровня, в котором 
,

(
1),

k b
k
a
X
+
 – цели верх
него k-го уровня; 
[1,
]
k
b
j
Î
, 
,

(
1),
k

k a
k
d
X
+
, 
,

(
1), k

k a
k
l
X
+
 – 

подцели 

'
[1,
]
k
k
d
n
Î
, 

'
[
,
]
k
k
k
l
n n
Î
; R – множество 
дуг, выражающих отношение подчиненности цели 

,

(
1),

k b
k
a
X
+
 подцелей 
,

(
1),
k

k a
k
d
X
+
, 
,

(
1), k

k a
k
l
X
+
 (см. рис.). 

При формировании структуры целей уровня k 
решаются две задачи. Первая связана с обоснованием логической правильности введения целей 
вида 
,

(
1),

k b
k
a
X
+
 k-го уровня и полагания подцелей 

,

(
1),
k

k a
k
d
X
+
, 
,

(
1), k

k a
k
l
X
+
. Вторая задача состоит в опреде
лении способов достижения целей k-го уровня и 
формировании на этой основе совокупности подцелей. Обе эти задачи направлены на выбор наиболее рациональной альтернативы структуры совокупности подцелей k+1 уровня. 
Схема целедостижения в проекте. Всех участников проекта в первом приближении можно 
разделить на две группы – проект-менеджеры и 
исполнители. Участники проекта имеют собственные интересы, что выражается в форме активного поведения: субъективное восприятие окружения и потребности находит свое отражение в 
мотивах, определяющих цели, для достижения которых субъекты формулируют задачи, определяют 
содержание и формы деятельности, применяют 
соответствующие методы и средства.  
Пусть целевая структура проекта имеет свое 
отражение в его организационной структуре. То
 
Пример структуры целей k-го уровня  
в общей схеме целедостижения проекта 

,

(
1),

k b
X k
a
+
 

,

(
1),

k a
X k
lk
+
 

,

(
1),

k a
X k
dk
+
 

k+1-й уровень 

k-й уровень