Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Инфокоммуникационные технологии обработки экспериментальных данных в агроинженерии

Покупка
Основная коллекция
Артикул: 702753.01.99
Содержатся теоретические положения, примеры решения задач по обработке экспериментальных данных с использованием специали-зированных программ MS Excel, Matlab, Statistica, Mathcad и др. Учебное пособие содержит методические указания по выполнению контрольных заданий, вопросы и тесты для изучения дисциплины. Для аспирантов и соискателей, а также магистрантов очного и заочного обучения, по направлениям подготовки 35.06.01, 35.06.02, 35.06.04, 36.06.01, 05.06.01, 08.06.01, 38.06.01.
Мелихова, Е. В. Инфокоммуникационные технологии обработки экспериментальных данных в агроинженерии: Учебное пособие / Мелихова Е.В. - Волгоград:Волгоградский государственный аграрный университет, 2018. - 112 с.: ISBN. - Текст : электронный. - URL: https://znanium.com/catalog/product/1007889 (дата обращения: 29.03.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Министерство сельского хозяйства Российской Федерации

Департамент научно-технологической политики и образования

Федеральное государственное бюджетное образовательное

учреждение высшего образования

«Волгоградский государственный аграрный университет»

Кафедра «Математическое моделирование и информатика»

Е.В. Мелихова
А.Ф. Рогачев

ИНФОКОММУНИКАЦИОННЫЕ ТЕХНОЛОГИИ
ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

В АГРОИНЖЕНЕРИИ

Учебное пособие

Волгоград

Волгоградский ГАУ

2018

УДК 004.42:631.5
ББК 32.81
М-47

Рецензенты:

кандидат экономических наук, доцент кафедры «Информационные 
системы в экономике» ФГБОУ ВО «Волгоградский ГТУ» А.Г. Гагарин; Почетный работник высшего профессионального образования 
РФ, доктор сельскохозяйственных наук, профессор кафедры «Эксплуатация машинно-тракторного парка» ФГБОУ ВО Волгоградский ГАУ, 
Заслуженный работник высшей школы РФ, академик РАЕ А.И. Ряднов

Мелихова, Елена Валентиновна

М-47
Инфокоммуникационные технологии обработки эксперимен
тальных данных в агроинженерии: учебное пособие / Е.В. Мелихова, 
А.Ф. Рогачев. – Волгоград: ФГБОУ ВО Волгоградский ГАУ, 2018. –
112 с.

Содержатся теоретические положения, примеры решения задач 

по обработке экспериментальных данных с использованием специализированных программ MS Excel, Matlab, Statistica, Mathcad и др. 
Учебное пособие содержит методические указания по выполнению
контрольных заданий, вопросы и тесты для изучения дисциплины.

Для аспирантов и соискателей, а также магистрантов очного и 

заочного обучения, по направлениям подготовки 35.06.01, 35.06.02, 
35.06.04, 36.06.01, 05.06.01, 08.06.01, 38.06.01. 

УДК 42:631.5

ББК 32.81

© ФГБОУ ВО Волгоградский 
ГАУ, 2018
© Мелихова Е.В., Рогачев А.Ф.,
2018

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ ..........................................................................................
5

1.
ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ ..............................
7

1.1.
Представление эмпирических данных ....................................
7

1.2.
Построение уравнения регрессии ............................................
8

1.3.
Оценка параметров модели ......................................................
9

1.4.
Оценка тесноты связи ...............................................................
10

1.5.
Оценка значимости уравнения регрессии ...............................
12

1.6.
Определение доверительных интервалов ...............................
15

1.7.
Вопросы для самопроверки ......................................................
16

1.8.
Решение типовых задач ............................................................
16

1.9.
Контрольные задания ................................................................
22

2.
МНОЖЕСТВЕННАЯ РЕГРЕССИЯ ........................................
27

2.1. Основные понятия ........................................................................
27

2.2.
Параметры уравнения множественной регрессии и их 

оценка ...................................................................................................
28

2.3.
Мультиколлинеарность ............................................................
31

2.4.
Оценка качества модели множественной регрессии .............
32

2.5.
Проверка остатков регрессии на гомоскедастичность ..........
34

2.6.
Устранение проблемы гетероскедастичности метод взве
шенных наименьших квадратов .........................................................
34

2.7.
Автокорреляция .........................................................................
35

2.7.1. Метод рядов ...............................................................................
36

2.7.2. Критерий Дарбина-Уотсона .....................................................
36

2.7.3. Фиктивные переменные ............................................................
37

2.8.
Вопросы для самопроверки ......................................................
38

2.9.
Решение типовых задач ............................................................
39

2.10 Визуализация экспериментальных данных и их аппроксимация кубическим сплайном в программе Mathcad .........................
47

2.11. Контрольные задания ................................................................
52

3.
ВРЕМЕННЫЕ РЯДЫ ................................................................
56

3.1.
Основные понятия .....................................................................
56

3.2.
Моделирование временных рядов ...........................................
58

3.3.
Решение типовых задач ............................................................
60

3.4.
Контрольные задания ................................................................
70

4.
СТАТИСТИЧЕСКАЯ 
ОБРАБОТКА 
ЭКСПЕРИМЕН
ТАЛЬНЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ НАДСТРОЙКИ 
«АНАЛИЗ ДАННЫХ» MS EXCEL ...................................................
72

4.1. Оценка изменчивости количественных признаков для независимых выборок ................................................................................
72

4.2.
Оценка средней разности при количественной изменчиво
сти признаков для зависимых выборок. Парный двухвыборочный 
t-тест для средних ................................................................................
74

4.3.
Дисперсионный анализ данных однофакторного вегетаци
онного и полевого опытов с полной рандомизацией вариантов ....
75

4.4.
Дисперсионный анализ данных двухфакторного вегетаци
онного и полевого опытов с полной рандомизацией вариантов ....
77

4.5.
Задания для самостоятельной работы .....................................
79

5. ПОСТРОЕНИЕ ГИСТОГРАММ НА ОСНОВЕ ОБРАБОТКИ 
ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ .............................................
81

КОНТРОЛЬНЫЕ ВОПРОСЫ И ТЕСТЫ ПО КУРСУ .....................
87

6.
ПЛАНИРОВАНИЕ И ОБРАБОТКА МНОГОФАКТОР
НЫХ  ЭКСПЕРИМЕНТОВ ................................................................
88

6.1.
Планирование однофакторных экспериментов ......................
88

6.2.
Двухуровневые планы многофакторных экспериментов ......
89

Вопросы для самопроверки ................................................................
94

КОНТРОЛЬНЫЕ ТЕСТЫ ...................................................................
95

ПРИЛОЖЕНИЕ А ...............................................................................
103

ПРИЛОЖЕНИЕ Б ...............................................................................
104

ПРИЛОЖЕНИЕ В ...............................................................................
105

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ ...........................................................
106

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ ...........................
107

СВЕДЕНИЯ ОБ АВТОРАХ ................................................................
109

ВВЕДЕНИЕ

Обработка экспериментальных и статистических данных явля
ется основой научных исследования в ряде наук.

Анализ экспериментальных и статистической информации тре
бует специальных методов, которые составляют один из аспектов математического моделирования. Центральной проблемой являются построение математической модели и определение ее адекватности для 
использования, анализа и прогнозирования различных природных и 
социальных процессов.

На совершенствование данного направления существенное вли
яние оказало развитие вычислительной техники и сопутствующих 
компьютерных программ.

Цель учебной дисциплины «Компьютерная обработка экспери
ментальных данных» построение, визуализация и анализ математических моделей. 

Задача дисциплины состоит в том, чтобы с помощью информа
ционных технологий и комплексов программ найти выражения тех закономерностей, которые были выявлены экспериментально или статистически.

Для аспирантов, соискателей и магистрантов, обучающихся по 

очной и заочной формах обучения. Студенты, прослушавшие учебный 
курс «Компьютерная обработка экспериментальных данных» должны:

знать: методы построения регрессионных моделей, объектов и 

процессов; основы построения расчетов и анализ современной системы показателей, характеризующих деятельность хозяйствующих 
субъектов на микро- и микроуровне;

уметь: осуществлять выбор инструментальных средств для об
работки экспериментальных данных в соответствии с поставленной 
задачей, анализировать результаты расчетов и обосновывать полученные выводы; строить на основе описания ситуаций стандартные теоретические и математические модели, анализировать и содержательно 
интерпретировать полученные результаты; прогнозировать на основе 
стандартных регрессионных моделей развитие моделируемы процессов и явлений;

владеть: методологией научного исследования; современной 

методикой построения математических моделей; методами и приѐмами анализа экономических явлений и процессов с помощью стандартных теоретических и экономических моделей.

Данное пособие предназначено для освоения практических 

навыков построения линейных моделей множественной регрессии с 
применением метода наименьших квадратов, оценки качества эконометрических моделей и их анализ, линеаризации нелинейных моделей, построение аддитивных и мультипликативных моделей временных рядов, решение систем линейных одновременных уравнений и их 
идентификация.

Структура учебного пособия позволяет аспирантам, соискате
лям и магистрантам познакомиться с теоретическим и практическим 
материалом. Проверить себя по освоению основных понятий изученной темы с помощью вопросов. Закрепить навыки и умения, решив 
самостоятельно задачи, представленные в конце каждой главы. И,
наконец, пройти тест по дисциплине «Инфокоммуникационные технологии обработки экспериментальных данных».

1
ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ

1.1
Представление эмпирических данных

Обработка и представление многомерных данных и наглядное 

представление в виде поля распределения или таблицы распределения 
(частот, относительных частот) возможно лишь в двумерном случае.

Пусть имеется выборка х1,..., хn наблюдений по двум признакам 

xi = (xi, yi). Наглядное представление о двумерном распределении 
можно получить в виде поля наблюдений, которое представляет собой 
в системе координат xOy множество точек с координатами (xi, yi)
     
̅̅̅̅̅. Рассмотрим пример построения двумерного поля.

Пример 1. В таблице представлены данные эксперимента зави
симости сопротивления (yi) от диаметра сечения провода (xi)

Таблица

№
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

y
0.55
1
7.7
7.8
5.6
1.7
0.9
3.2
0.74
1.2
4.5
3.8
0.4 3.1 4.2 3.5

x
0.13
0.46 10.9 6.6
9.3
1.3
3.4
3.7
1.5
2.7
3.7
1.5
0.6 7.7 4.2 4.8

На рис. 1.1 приведен пример поля наблюдений, где первой ком
понентой является проницаемость, измеренная промысловым методом, а второй по шлифам.

Другим способом наглядного представления двумерных данных 

является составление таблиц двумерных статистик, в ячейках которых 
указывается количество наблюдений, попавших в соответствующие 
интервалы значений признаков (табл. 1.1).

Рисунок 1 – Поле наблюдений

Таблица 1.1 – Сгруппированные двумерные данные

z/y
[0.4, 2.25)
[2.25, 4.1)
[4.1, 5.95)
[5.95, 7.8]

[0.13, 2.8)
6
1
0
0

[2.8, 5.5)
1
2
1
0

[5.5, 8.2)
0
2
0
1

[8.2, 10.9]
0
0
1
1

После группировки данных можно показать количество попада
ний значений в заданные интервалы в виде графика (рис. 2).

Рисунок 1 – График частот

1.2
Построение уравнения регрессии

Линейная регрессия представляет собой модель, где среднее 

значение зависимой переменной у рассматривается как функция одной независимой переменной х, т.е. это модель вида:






)
,...,
,
(
)
(
1
n
x
f
x
y
,

где y – зависимая переменная (результативный признак); x – независимая (объясняющая) переменная; βj – параметры регрессии; ε – случайная составляющая.

Случайная величина включает влияние неучтенных в модели 

факторов, случайных ошибок и особенностей измерения.

В зависимости от вида функции f(x) различают линейные и не
линейные регрессии.

Линейная регрессия имеет вид:

 ̂         

где bj – оценки параметров βj. 

Нелинейные регрессии делят на два класса:
1) регрессии, нелинейные по объясняющим переменным:

полиномы разных степеней 

 ̂                    ;


равносторонняя гипербола  ̂     

  
 ;

2) регрессии, нелинейные по оцениваемым параметрам:

степенная  ̂       ;


показательная  ̂      

 


экспоненциальная  ̂         .

Постановка задачи. По имеющейся выборке объема n двух па
раметров (xi; yi),i=1…n необходимо определить аналитическую зависимость
x
b
b
y
1
0 


, которая наиболее точно описывает данные 

наблюдений.

Построение уравнения осуществляется в два этапа:

спецификация модели, т.е. определение вида аналитиче
ской зависимости   ̂      ;


оценка параметров полученной модели. 

В парной линейной регрессии выбор вида математической 

функции может быть осуществлен графическим, аналитическим или 
экспериментальным методом [19].

1.3
Оценка параметров модели

Построение уравнения регрессии сводится к оценке ее парамет
ров. Для оценки параметров регрессий обычно используют метод 
наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака y от теоретических 
x
y
ми
нимальна, т.е.

min
)
(
2
2





xy
y

.

Для линейных и нелинейных уравнений, приводимых к линей
ным, решается следующая система относительно b0 и b1:


















xy
x
b
x
b

y
x
b
nb

2

1
0

1
0
.
(2.1)

Можно воспользоваться готовыми формулами, которые выте
кают из этой системы:

 

2
2
1
1
0
,

x
x

y
x
xy
b
x
b
y
b









.
(2.2)

Для нелинейных уравнений регрессии, приводимых к линейным 

с помощью преобразования (x, y) → (x′, y′), система нормальных 
уравнений имеет вид (2.1) в преобразованных переменных x′, y′. 

Коэффициент b при факторной переменной x имеет следующую 

интерпретацию: он показывает, на сколько изменится в среднем величина y при изменении фактора x на 1 единицу измерения. 

Гиперболическая регрессия:       

  
 .

Линеаризующие преобразования:    

 

 ,     .

Уравнения (2.1) и (2.2) принимают вид:



















 

x
y

x

b
x
b

y
x
b
nb

1
1
1

1

2
1
0

1
0

, 
 

,

)
(

,
2
2
1
1
0

x
x

y
x
y
x
b
x
b
y
b

















где 
,
1
1



x
n
x
,
1


y
n
y
.

Экспоненциальная регрессия:           .
Линеаризующие преобразования:     ,       .

 

,

)
(

,
2
2
1
1
0

x
x

y
x
y
x
b
x
b
y
b

















где 



x
n
x
1

,



y
n
y
ln
1

1.4
Оценка тесноты связи

Тесноту связи изучаемых явлений оценивает:

линейный коэффициент парной корреляции rxy для ли
нейной регрессии (
1
1



xy
r
):

√

∑
  ̂   ̅  
 
   

∑
     ̅  
 
   
 

  
̅̅̅̅  ̅ ̅

√(  
̅̅̅̅   ̅  )(  
̅̅̅̅     ̅  )

;
(2.3)


индекс корреляции 
xy

для нелинейной регрессии

(
1
0


xy

):


















2

2

2

2

1
1

y
yi

y
y

y

ост
xy

i
i







.
(2.4)

Оценку качества построенной модели даст коэффициент (ин
декс) детерминации, а также средняя ошибка аппроксимации.

Коэффициент парной корреляции r показывает поведение y cро
стом x. Знак коэффициента корреляции совпадает со знаком коэффициента b1.Чем ближе значение r к 1, тем ближе связь х и у к линейной. 
При r=0 линейной связи между х и у нет;

Оценку качества построенной модели даст коэффициент (ин
декс) детерминации, а также средняя ошибка аппроксимации.

Коэффициент детерминации характеризует долю дисперсии, 

объясняемую регрессией, в общей дисперсии результативного признака y:









































n

i

i

n

i

i
i

n

i

i

n

i

i

y
y

y
y

y
y

y
y

r
R

1

2

1

2

1

2

1

2

2
2
1




.
(2.5)

Величина (1–R2) характеризует долю дисперсии у, вызванную 

влиянием остальных не учтенных в модели факторов.

Средняя ошибка аппроксимации – среднее отклонение расчет
ных значений результативного признака от фактических:

%
100
1


 
y
y
y

n
A
x


(2.6)

Рекомендуемый допустимый предел значений A – не более 8
10 % [5, 6].

1.5
Оценка значимости уравнения регрессии

Оценивание значимости уравнения регрессии по F-критерию 

Фишера состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fнабл и критического (табличного) 
Fкр значений F-критерия Фишера. 

m
m
n

R

R
Fнабл

)1
(

1
2

2





,
(2.7)

где n – число единиц совокупности; m – число параметров при переменной х.

Для парной регрессии m=1 и вместо R используется rxy.
Fкр – это максимально возможное значение критерия под влия
нием случайных факторов при данных степенях свободы (k1=m, k2=nm–1) и уровне значимости α. Уровень значимости α – вероятность отвергнуть гипотезу при условии что она верна. Обычно принимается 
равной 0,05 или 0,01.

Если Fкр<Fнабл, то H0 – гипотеза о случайной природе оценивае
мых характеристик отклоняется и признается их статистическая значимость и надежность, т.е. bj≠ 0. Если Fкр>Fнабл, то гипотеза H0 не отклоняется и признается статистическая незначимость и ненадежность 
уравнения регрессии и показателя тесноты связи, т.е. bj = 0.

Для оценки статистической значимости коэффициентов регрес
сии рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. 

Выдвигается гипотеза H0 о случайной природе показателей, т.е. 

о незначимом их отличии от нуля. Оценка значимости коэффициентов 
регрессии с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной стандартной ошибки:

j

j

b

j

b
S

b
t



(2.8)

.

Стандартные ошибки параметров линейной регрессии опреде
ляются по формулам:

,
)
(

;
)
(

2
2

2
2

2

2

0

1














i
i

i

b

i

b

x
x
n

x
S
S

x
x
S
S







(2.9)

где 



2

2

2



 

n

y
y
S

i
i



– оценка остаточной дисперсии.