Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Решение задач компьютерного зрения

Покупка
Основная коллекция
Артикул: 695815.01.99
Доступ онлайн
119 ₽
В корзину
В пособии рассматриваются вопросы решения наиболее популярных задач компьютерного зрения: методы распознавания образов, поиск изображений на основе содержания, обнаружение движения на изображениях, сопоставление изображений в двумерном пространстве, распознавание объектов на изображениях. Для студентов магистерской подготовки по направлению 09.04.04 «Программная инженерия», аспирантов и специалистов, работающих в области использования компьютерной графики и компьютерного зрения. Учебное пособие разработано в рамках выполнения базовой части государственного задания по теме "Информационно-алгоритмическое обеспечение систем цифрового управления, автономной высокоточной навигации и технического зрения для перспективных летательных аппаратов: разработка теоретических основ проектирования, алгоритмов, способов эффективной и надежной программной реализации, использование высокопроизводительной вычислительной инфраструктуры для экспериментального моделирования" № 3442.
Селянкин, В. В. Решение задач компьютерного зрения: Учебное пособие / Селянкин В.В. - Таганрог:Южный федеральный университет, 2016. - 92 с.: ISBN 978-5-9275-2090-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/991922 (дата обращения: 25.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
В.В. Селянкин

Решение задач 

компьютерного зрения

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное автономное образовательное

учреждение высшего образования

«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

Инженерно-технологическая академия

В.В. Селянкин

Решение задач 

компьютерного зрения

Учебное пособие

Таганрог

Издательство Южного федерального университета

2016

УДК 004.93 (075.8)
ББК 32.973я73

С299

Печатается по решению редакционно-издательского совета

Южного федерального университета

Рецензенты:

профессор кафедры информатики Таганрогского института им. А.П. 

Чехова (филиал РИНХ), доктор технических наук

Витиска Н.И.;

директор направления в ООО «ЭйТи Консалтинг» в
г.Таганроге, кандидат технических наук Калачев Д.П.

Селянкин, В.В.

Решение задач компьютерного зрения : учебное пособие /

Селянкин В.В. ; Южный федеральный университет. – Таганрог : 
Издательство Южного федерального университета, 2016. – 92 с.

ISBN 978-5-9275-2090-9

В пособии рассматриваются вопросы решения  наиболее 

популярных задач компьютерного зрения: методы распознавания 
образов, поиск изображений на основе содержания, обнаружение 
движения на изображениях, сопоставление изображений в двумерном 
пространстве, распознавание объектов на изображениях.

Для студентов магистерской подготовки по направлению 

09.04.04 «Программная инженерия», аспирантов и специалистов, 
работающих в области использования компьютерной графики и 
компьютерного зрения.

Учебное пособие разработано в рамках выполнения базовой 

части 
государственного 
задания 
по 
теме 
"Информационно
алгоритмическое 
обеспечение 
систем 
цифрового 
управления, 

автономной высокоточной навигации и технического зрения для 
перспективных летательных аппаратов: разработка теоретических 
основ проектирования, алгоритмов, способов эффективной и надежной 
программной
реализации, использование высокопроизводительной 

вычислительной 
инфраструктуры 
для 
экспериментального 

моделирования" № 3442.
ISBN 978-5-9275-2090-9
УДК 004.93 (075.8)
ББК 32.973я73

© Южный федеральный университет, 2016
© Селянкин В.В., 2016

С299

Оглавление

Введение......................................................................................................5

1. Методы распознавания образов ............................................................6

1.1. Основные задачи распознавания образов .................................6

1.2. Ошибки распознавания...............................................................8

1.3. Распознавание по набору измерений.......................................10

1.4. Распознавание по элементарным признакам ..........................10

1.4.1. Нахождение класса объекта по среднему значению .11

1.4.2. Нахождение класса по расстоянию до ближайших 

соседей...............................................................................................12

1.5. Структурные методы распознавания.......................................14

1.6. Матрица неточностей................................................................14

1.7. Дерево решений.........................................................................15

1.8. Автоматическое построение дерева решений ........................19

1.9. Байесовский метод принятия решений ...................................22

1.10. Понятие методов кластеризации............................................23

1.11. Искусственные нейронные сети.............................................24

2. Поиск изображений на основе содержания........................................26

2.1. Задача поиска изображений .....................................................26

2.2. Поиск с использованием ключевых слов ................................27

2.3. Поиск с использованием запросов по образцу .......................27

2.4. Меры расстояния между изображениями ...............................29

2.4.1. Характеристики цветового сходства.........................29

2.4.2. Характеристики текстурного сходства....................30

2.4.3. Характеристики сходства формы ..............................32

2.4.4. 
Характеристики 
сходства 
объектов 
и 
их 

расположения на изображении ......................................................37

2.5. Организация базы данных ........................................................42

2.5.1. Стандартные индексы .................................................42

2.5.2. Пространственная индексация....................................45

2.5.3. Индексация в системах поиска изображений на основе 

содержания.......................................................................................46

3. Обнаружение движения на изображениях .........................................48

3.1. Задача обнаружения движения ................................................48

3.2. Вычитание изображений ..........................................................49

3.3. Вычисление векторов перемещения........................................49

3.4. Вычисление траекторий движущихся точек...........................51

3.5. Виды изменений условий съемки............................................54

3.6. Сегментация видеопоследовательностей...................................55

4. Сопоставление изображений в двумерном пространстве.................56

4.1. Основные понятия.....................................................................56

4.2. Распознавание двумерных объектов с помощью аффинных 

преобразований ....................................................................................58

4.3. Распознавание двумерных объектов с использованием 

реляционных моделей..........................................................................62

5. Распознавание объектов на изображениях.........................................68

5.1. Определение соответствия точек двумерного изображения и 

точек трехмерной сцены......................................................................68

5.2. Распознавание объектов на основе моделей...........................69

5.3. Существующие разновидности трехмерных моделей ....................70

5.4. Классы видимости трехмерных объектов...............................75

5.5. Физические и деформационные модели .................................76

5.6. Методы распознавания трехмерных объектов .......................78

5.6.1. Классификация задач распознавания...........................78

5.6.2. 
Распознавание 
с 
использованием 
процедуры 

совмещения .......................................................................................80

5.6.3. Распознавание на основе реляционных моделей..........84

Заключение................................................................................................90

Библиографический список .....................................................................91

Введение

Понятие 
компьютерного
зрения
изначально 

подразумевало восстановление трехмерных изображений по 
двумерным изображениям. В настоящее время это понятие 
трактуется шире, как принятие решений о физических объектах 
на основе
их изображений. Близкое по смыслу понятие 

машинного 
зрения
обычно 
используется
как 
решение 

промышленных, производственных задач в робототехнике, 
конвейерном производстве и аналогичных производственных 
процессах.

В 
данном 
пособии 
рассматриваются 
вопросы 

распознавания 
образов, 
поиска 
изображений 
на 
основе 

содержания, построения трехмерных сцен по двумерным 
изображениям, 
построения 
виртуальной 
и 
дополненной 

реальности.

Первый раздел, посвященный распознаванию образов, 

содержит краткий обзор методов распознавания объектов по 
исходным изображениям или предварительно обработанным, а 
также по кадрам видеопотока. При этом распознаваемый образ 
представляется 
некоторым 
вектором 
характеристических 

параметров. Рассматриваются и методы распознавания с 
обучением.

Второй раздел описывает задачу поиска изображений на 

основе содержания и методы её решения с использованием 
ключевых слов, запросов по образцу и расчетом меры 
расстояния между изображениями. Даны принципы организации 
базы данных.

Третий раздел посвящён обнаружению движения на 

изображениях. Приведены алгоритмы обнаружения движения 
путем 
вычитания 
изображений, 
вычислением 
векторов 

перемещения, а также расчетом траекторий движущихся точек.

В 
четвертом 
разделе 
рассматриваются 
вопросы 

сопоставления изображений в двумерном пространстве с 
помощью аффинных преобразований и с использованием 
реляционных моделей.

Пятый раздел посвящён распознаванию объектов на 

изображениях. 
Рассматриваются 
различные 
алгоритмы 

распознавания объектов на основе двумерных и трехмерных 
моделей, а также методы распознавания трехмерных объектов.

Учебное пособие разработано в рамках выполнения 

базовой 
части 
государственного 
задания 
по 
теме 

"Информационно-алгоритмическое 
обеспечение 
систем 

цифрового управления, автономной высокоточной навигации и 
технического зрения для перспективных летательных аппаратов: 
разработка теоретических основ проектирования, алгоритмов, 
способов эффективной и надежной программной реализации, 
использование 
высокопроизводительной 
вычислительной 

инфраструктуры для экспериментального моделирования" № 
3442.

1. Методы распознавания образов

1.1. 
Основные 
задачи 
распознавания 

образов

Под образом обычно понимается
группа объектов, 

объединенных по некоторому набору признаков, обладающих
характерными 
свойствами, 
позволяющими
выявлять
его 

представителей. Способ отнесения распознаваемого элемента к 
какому-либо образу называется решающим правилом. При этом 
основную роль отнесения элемента к тому или иному образу 
играет так называемая метрика. Под метрикой понимается 
расстояние
между элементами универсального множества, 

определяемое 
по 
заданному 
способу.
Чем 
меньше 
это 

расстояние, тем более похожими считаются распознаваемые 
объекты и их образы. В связи с этим эффективность решения 
задачи распознавания образов в сильной степени зависит от
выбора признаков образа и способа определения метрики [1].

При распознавании образов нередко применяются методы 

обучения, позволяющие повысить эффективность решения 
задачи распознавания. Обычно методами обучения называют 
процесс выработки реакции на группы внешних идентичных 
сигналов путем многократного воздействия на систему внешней 
корректировки. Такую внешнюю корректировку в обучении 

принято называть "поощрениями" и "наказаниями". Механизм 
генерации 
этой 
корректировки 
практически 
полностью 

определяет алгоритм обучения. Самообучение отличается от 
обучения отсутствием дополнительной информации системы о 
верности реакции.

В 
качестве 
наиболее 
известных
примеров
задач 

распознавания образов можно указать:

- распознавание объектов;
- распознавание текста;
- распознавание штрих-кодов;
- распознавание автомобильных номеров;
- идентификация лиц и других биометрических данных;
- распознавание речи.
Можно выделить три основных метода распознавания 

образов:
методы 
перебора, 
методы
с 
использованием 

характеристик 
образов
и 
методы
с 
использованием 

искусственных нейронных сетей.

В случае перебора выполняется простое сравнение 

объекта 
с 
базой 
данных, 
содержащей
всевозможные 

модификации отображения. При этом база данных может 
формироваться из различных видов объекта. Например, могут 
использоваться
изображения 
объекта, 
выполненные 
под 

различными углами, масштабами, смещениями, деформациями 
и так далее. Для распознавания текста используются наборы
гарнитур
шрифтов
с
различными
их 
начертаниями

(полужирный, подчеркнутый, курсив)
и т. д. В случае 

распознавания звуковых образов происходит сравнение с 
некоторыми 
известными 
шаблонами 
(например, 
слово, 

произнесенное одним или несколькими людьми) ограниченного 
списка слов.

Метод, 
использующий
наборы 
характеристик 

распознаваемого объекта, позволяет выполнять более глубокий 
анализ образа. В случае визуального распознавания это может 
быть определение различных геометрических размеров и 
частотных характеристик. Звуковой вариант распознавания в 
этом случае подвергается частотному, амплитудному анализу и 
т. д.

Использование искусственных нейронных сетей требует 

либо большого количества примеров задачи распознавания при 
обучении, либо специальной структуры нейронной сети, 
учитывающей специфику данной задачи. Тем не менее, его 
отличает более высокая эффективность и производительность.

Процесс решения задачи распознавания можно описать 

общей моделью классификации. Предполагается наличие 
множества из m известных классов, представленных набором 
примеров (эталонных образцов) объекта или в форме его 
описания. Кроме того, обычно предусматривается и особый 
класс объектов, состоящий из объектов, которые в процессе 
распознавания не были отнесены к какому-либо известному 
классу. Это класс носит название класс выбросов.

В 
процессе 
классификации 
объектов 
для 
каждого 

распознаваемого объекта выполняется назначение метки класса, 
которая определяет его принадлежность к конкретному классу.
В качестве такого классификатора может выступать некоторое 
устройство или алгоритм.

Классификатор 
на 
входе 
имеет 
d-мерный 
вектор 

признаков 
объекта, 
который 
обрабатывается 
блоками, 

хранящими сведения о каждом из m
классов
объекта.

Результаты обработки вектора признаков служат основанием 
для назначения соответствующих меток класса, включая и класс 
выбросов.

1.2. Ошибки распознавания
Качество работы классификатора можно охарактеризовать 

коэффициентом 
ошибок. 
Ошибкой 
считается 
отнесение 

входного объекта класса Ci к классу Cj, причем i≠j и Cj не 
является классом выбросов. Коэффициент ошибок определяется 
отношением числа ошибок в серии испытаний к общему числу 
испытаний. Эти коэффициенты могут различаться в каждой 
серии испытаний и для достаточного множества таких 
испытаний 
можно 
рассчитать 
математическое 
ожидание 

коэффициента ошибок данного классификатора.

Аналогично можно вычислить и коэффициент выбросов 

делением количества выбросов в серии испытаний на общее 
число испытаний.

Особо следует выделить случаи, когда результатом 

распознавания является отнесение объекта к одному из двух 
возможных классов по типу «Да/Нет». Например, возможны 
такие определения – хороший/плохой, присутствует/ отсутствует, болен/здоров, есть ошибка/нет ошибки и так далее.
Значение и цена ошибок отнесения к этим классам могут быть 
несимметричными. Например, если объект присутствует на 
изображении, 
то 
должна 
следовать 
определенная 

последовательность действий по обработке этой ситуации. В 
противоположном случае обработка ситуации будет другая. 
Ошибка, при которой дается ответ «Да» для случая «Нет»,
называется ложным срабатыванием или позитивной ошибкой. В 
противоположном случае, когда дается ответ «Нет» для случая 
«Да», ошибка называется ложным пропуском или негативной 
ошибкой.

Когда цена ошибки одного из вариантов значительно 

отличается 
от 
цены 
другого, 
то 
могут 
применяться 

дополнительные меры по снижению числа таких ошибок даже, 
может 
быть, 
за 
счет 
увеличения 
числа 
ошибок 

противоположного 
случая.
Как 
правило,
число 
ложных 

срабатываний
увеличивается 
при 
попытке 
системы 

распознавания обнаружить большее число известных объектов.

Обычно с такими системами распознавания связывают 

понятия точности системы и полноты выборки распознаваемых 
объектов. Если обозначить через С1 класс распознаваемых 
объектов, а через С2 – класс объектов, не представляющих 
интерес, тогда точность системы t будет определяться как

,

2
1

1
k
k

k
t



где k1 – число найденных объектов класса С1,

k2 – число найденных объектов класса С2.

Полнота 
выборки 
определяется 
отношением 
числа

найденных объектов k1 класса С1 к общему числу объектов К1
этого класса:

.

1

1

K
k
p 

1.3. Распознавание по набору измерений
Для распознавания объектов необходимо иметь их 

описания. Такими описаниями может служить набор признаков
измерений, характеризующих класс распознаваемых объектов. 
В набор признаков включаются:


геометрические 
размеры 
объекта 
(площадь, 

ширина, высота, центр тяжести, периметр и т.п.);


структура объекта (контур, число отверстий, 
краев, вытянутость, направление главной оси и 
т.д.);


текстурные параметры;


другие признаки.

Сформированный набор признаков представляется в виде 

упорядоченного вектора d признаков, каждый из которых 
представлен вещественным числом. На основании этого вектора
можно ввести количественные оценки близости объекта к 
распознаваемому классу. Такая оценка формулируется в виде 
евклидова расстояния между двумя d-мерными векторами 
признаков x1 и x2:

.
))
(
)
(
(

,1

2

2
1
2
1







d
i

i
x
i
x
x
x

1.4. 
Распознавание 
по 
элементарным 

признакам

Для распознавания объектов по набору элементарных 

признаков формируется соответствующий вектор признаков в 
результате обучения или на основе каких-либо моделей. При 
этом предполагается, что имеется m классов объектов, для 
каждого из которых заданы ni эталонных векторов (i=1, m) 
размерностью 
d. 
Далее 
рассматриваются 
два 
метода 

распознавания с использованием эталонных образцов – по 
ближайшему 
среднему 
значению 
и 
по 
расстоянию 
до 

ближайших соседей.

Доступ онлайн
119 ₽
В корзину