Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Статистичеcкий анализ в металлургии и материаловедении

Покупка
Артикул: 751036.01.99
Доступ онлайн
2 000 ₽
В корзину
Рассмотрены практические вопросы статистического анализа, включая статистические оценки, проверку гипотез, корреляционный, дисперсионный, регрессионный анализ, анализ случайных функций, многомерный статистический анализ. По каждой теме приводятся краткие теоретические сведения и примеры решения реальных задач из области металлургии и материаловедения. В учебник включены задания для самостоятельной работы и тесты для самоконтроля. Учебник содержит справочные денные по статистическим функциям программ Excel и Mathcad и статистические таблицы. Предназначен для студентов специальностей 080801, 150702, 150105, а также для магистров и бакалавров по направлению «Металлургия». Может быть использован аспирантами в области металлургии и материаловедения.
Мельниченко, А. С. Статистичеcкий анализ в металлургии и материаловедении : учебник / А. С. Мельниченко. - Москва : Изд. Дом МИСиС, 2009. - 268 с. - ISBN 978-5-87623-258-8. - Текст : электронный. - URL: https://znanium.com/catalog/product/1222876 (дата обращения: 25.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
№ 801 

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ 
УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО 
ОБРАЗОВАНИЯ «НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ 
ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» 

А.С. Мельниченко 

Статистический анализ  
в металлургии  
и материаловедении 

Учебник 

Допущено учебно-методическим объединением по образованию  
в области металлургии в качестве учебника для студентов высших 
учебных заведений, обучающихся по направлению  
150100 – Металлургия, специальностям 150105 – Металловедение  
и термическая обработка металлов, 150702 – Физика металлов 

Москва     Издательский Дом МИСиС     2009 

УДК 669:519.221.25 
 
М47 

Р е ц е н з е н т  
канд. техн. наук С.Н. Богданов 

Мельниченко А.С. 
М47  
Статистичеcкий анализ в металлургии и материаловедении: 
Учеб. – М.: Изд. Дом МИСиС, 2009. – 268 с. 
ISBN 978-5-87623-258-8 

Рассмотрены практические вопросы статистического анализа, включая 
статистические оценки, проверку гипотез, корреляционный, дисперсионный, 
регрессионный анализ, анализ случайных функций, многомерный статистический анализ. По каждой теме приводятся краткие теоретические сведения и 
примеры решения реальных задач из области металлургии и материаловедения. В учебник включены задания для самостоятельной работы и тесты для 
самоконтроля. Учебник содержит справочные денные по статистическим 
функциям программ Excel и Mathcad и статистические таблицы. 
Предназначен для студентов специальностей 080801, 150702, 150105, а 
также для магистров и бакалавров по направлению «Металлургия». Может 
быть использован аспирантами в области металлургии и материаловедения.   
 

УДК 669:519.221.25 

ISBN 978-5-87623-258-8 
© Мельниченко А.С., 2009 
 
  

ОГЛАВЛЕНИЕ 
Предисловие ........................................................................................................................ 4 
1. Статистическое оценивание........................................................................................... 6 
1.1. Генеральная совокупность и выборка................................................................... 6 
1.2. Точечные оценки................................................................................................... 13 
1.3. Интервальные оценки........................................................................................... 17 
1.4. Проверка статистических гипотез....................................................................... 20 
1.5. Сравнение дисперсий ........................................................................................... 22 
1.6. Сравнение средних................................................................................................ 24 
1.7. Проверка гипотезы о виде распределения.......................................................... 29 
1.8. Анализ выбросов................................................................................................... 35 
1.9. Корреляционный анализ....................................................................................... 38 
1.10. Дисперсионный анализ....................................................................................... 51 
2. Построение эмпирических зависимостей................................................................... 68 
2.1. Постановка задачи ................................................................................................ 68 
2.2. Однофакторная линейная модель........................................................................ 69 
2.3. Более сложные модели ......................................................................................... 76 
2.4. Анализ модели....................................................................................................... 78 
2.5. Анализ остатков .................................................................................................... 85 
2.6. Нелинейная регрессия .......................................................................................... 93 
2.7. Регрессия двумя функциями................................................................................ 99 
2.8. Ортогональные базисные функции................................................................... 101 
2.9. Принцип максимума правдоподобия................................................................ 105 
2.10. Пример. Первичный анализ спектральной зависимости............................... 112 
2.11. Многофакторная регрессия.............................................................................. 121 
2.12. Элементы планирования эксперимента.......................................................... 132 
3. Анализ случайных функций ...................................................................................... 140 
3.1. Понятие случайной функции............................................................................. 140 
3.2. Основные типы случайных функций................................................................ 144 
3.3. Оценка параметров случайной функции .......................................................... 150 
3.4. Преобразование случайных функций ............................................................... 156 
3.5. Спектральный анализ случайных функций...................................................... 159 
3.6. Параметрические модели стационарных случайных процессов.................... 166 
3.7. Идентификация стационарных случайных процессов.................................... 172 
3.8. Нестационарные случайные процессы ............................................................. 180 
3.9. Пример. Анализ профиля излома...................................................................... 187 
4. Многомерный статистический анализ...................................................................... 197 
4.1. Факторный анализ............................................................................................... 197 
4.2. Многомерное шкалирование ............................................................................. 210 
4.3. Кластерный анализ ............................................................................................. 216 
4.4. Дискриминантный анализ.................................................................................. 222 
4.5. Пример. Автоматическая классификация областей на микрофрактограмме................................................................................................................... 233 
Задания для самостоятельной работы и тесты............................................................. 237 
Библиографический список ........................................................................................... 252 
Приложения..................................................................................................................... 253 
Приложение 1. Статистический анализ в программах Excel и Mathcad.................... 253 
Приложение 2. Таблицы................................................................................................. 262 
 

 

Предисловие 

В основе учебника лежит курс лекций для студентов материаловедческих специальностей. Этот учебный курс читается после курса 
теории вероятностей и математической статистики и предполагает 
знание основ последнего. Для полноты и последовательности изложения в учебник включены некоторые темы, традиционно относящиеся к курсу математической статистики, но излагаются они иначе, 
чем в учебниках по математике. Целью было объяснить и показать на 
примерах, а не доказать. В то же время везде, где возможно, даются 
краткие сведения из теории, чтобы книга не сводилась к простому 
сборнику формул и рецептов. Специализированные программы статистического анализа создают иллюзию, что достаточно запомнить 
последовательность нужных действий, – все остальное программа 
сделает сама. К сожалению, это далеко не так. Окончательные выводы и принятие решений – прерогатива специалиста, а не программы. 
Понимание основ теории используемых методов, так же как и знание 
предметной области, играет здесь не последнюю роль. 
Отбор материала для лекций и учебника определялся потребностями специальности. В металлургии и материаловедении большинство характеристик материалов и процессов измеримы, поэтому в 
учебнике рассматриваются методы числовой статистики и мало внимания уделяется методам нечисловой статистики. С другой стороны, 
материаловедение – область профессиональной деятельности, лежащая между физикой твердого тела и технологиями получения материалов. Физикам и технологам нужны разные стороны прикладного 
статистического анализа. Целью автора было дать тем и другим первоначальные сведения, необходимые для практической работы.  
По всем разделам курса имеются многочисленные учебники и монографии. Некоторые из них приводятся в списке литературы. Теоретические сведения по всем частям курса можно найти в [1–3]. Общим вопросам теории вероятностей и математической статистики 
посвящены издания [4–8], методы регрессионного и дисперсионного 
анализа и планирования эксперимента изложены в [8, 9], двухтомник 
[10] – фундаментальная монография по регрессионному анализу, 
анализ случайных функций рассмотрен в [11, 12], подробное справочное издание по многомерному статистическому анализу – книга 
[13]. Часть этих книг давно не переиздавалась, но все они присутствуют в Интернете. 

Предисловие 

5 

Хотя выше и говорилось, что автор не стремился сделать учебник 
сборником рецептов, приведенный в учебнике материал в виде формул и описания последовательности вычислений позволяет самостоятельно реализовать на компьютере изучаемые методы. Часто 
достаточно воспользоваться встроенными функциями общедоступных программ. Описание этих функций приводится в Приложении 1. 
Исключением является бóльшая часть последней главы. Здесь действительно следует использовать специализированное программное 
обеспечение.  
Для приобретения навыков компьютерного анализа данных в 
учебнике дается несколько комплексных заданий для самостоятельной работы. Правильность собственных программ можно проверить, 
повторяя расчеты приведенных в учебнике примеров. Для контроля 
усвоения теоретических знаний предназначены тесты. 
Автор благодарит преподавателей и сотрудников кафедры металловедения и физики прочности и других кафедр МИСиС, любезно 
предоставивших ему отдельные материалы. Особая благодарность 
профессору М.А. Штремелю, поддержавшему автора в начинании 
написать этот учебник, а также за подробное заинтересованное обсуждение п. 2.10. Наполнению книги реальными примерами способствовала практическая деятельность автора в Центре физической химии, материаловедения, биметаллов и специальных видов коррозии 
ЦНИИчермет им. И.П. Бардина, сотрудникам которого автор выражает свою искреннюю признательность. Автор благодарен рецензенту, доценту С.Н. Богданову, взявшему на себя труд прочитать рукопись и сделавшему много ценных замечаний. 

1. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 

1.1. Генеральная совокупность и выборка 

Исследователь анализирует данные, полученные из эксперимента 
или в результате контроля производства. Эксперимент, или процесс 
контроля, или иные действия, в результате которых получается очередное значение наблюдаемой величины, в теории вероятностей называется статистическим испытанием, а его результат, выраженный 
количественно, – случайной величиной. Теория статистических оценок предполагает, что результаты наблюдений – выборка измеряемой случайной величины из ее генеральной совокупности. Одно из 
определений генеральной совокупности: генеральная совокупность – 
бесконечное множество значений результатов статистического испытания, которое может при идентичных условиях повторяться сколь 
угодно большое число раз. Предполагается, что генеральная совокупность случайной величины х имеет плотность распределения 
w(x), и для нее могут быть вычислены моменты. По определению k-й 
момент распределения величины х  

 
( )d
k
k
x w x
x

∞

−∞
µ = ∫
. 
(1.1) 

Наиболее важны первый момент (иначе – математическое ожидание, истинное среднее), который далее будем обозначать просто μ 
(без индекса 1) или 
x
µ , и второй центральный момент – дисперсия, – 

который далее будем обозначать σ2 или 
2
x
σ : 

 
2
2
(
)
( )d .
x
x
x
w x
x

∞

−∞
σ =
− μ
∫
 
(1.2) 

Квадратный корень из дисперсии 
2
x
x
σ =
σ – стандартное отклонение – величина, имеющая ту же размерность, что и сама переменная х и характеризующая ширину разброса данных вокруг центра 
распределения – его первого момента.  
Моменты и производные от них величины, вычисленные по генеральной совокупности, называются истинными или теоретическими 
значениями параметров распределения случайной величины х. Чтобы 

1.1. Генеральная совокупность и выборка 

7 

воспользоваться формулами (1.1), (1.2), надо знать функцию плотности распределения 
( )
w x , т.е. иметь модель генеральной совокупности. Создать такую модель почти никогда невозможно, так как невозможно учесть все особенности реальных технологических или 
физических процессов. 
Фактически в распоряжении исследователя имеется выборка из генеральной совокупности – конечное число n наблюдений х1, х2, …, хn, 
по которым он должен оценить истинные значения параметров генеральной совокупности. Величины, рассчитанные по выборке, называются выборочными оценками, или просто оценками. Теоретическая статистика предъявляет определенные требования к оценкам. 
Как минимум, оценка должна быть состоятельной, т.е. стремиться к 
истинному значению параметра генеральной совокупности при увеличении объема выборки (при 
∞
→
n
). Желательна также несмещенность оценки, т.е. отсутствие систематического (иначе, наличие 
только случайного) отклонения оценки от истинного значения параметра. Систематическое смещение уменьшается с увеличением объема выборки, поэтому смещенными оценками иногда можно пользоваться при анализе выборок большого объема. Существует еще требование эффективности оценки: оценка должна быть самой лучшей 
(быстрее всех сходящейся к истинному значению) из всех возможных. Последнее означает, что эффективная оценка (т.е. формула, которая используется для расчета числовых значений оценки по наблюдаемым значениям х1, х2, …, хn) может зависеть от вида плотности вероятности w(x).  
Иногда можно сделать обоснованные предположения о виде распределения генеральной совокупности. Ниже приводится описание и 
основные характеристики нескольких распределений, часто встречающихся на практике.  

Нормальное распределение 
Плотность вероятности  

 
(
)
2

2
1
( )
exp
2
2

x
w x
⎡
⎤
− μ
⎢
⎥
=
−
σ
π
σ
⎢
⎥
⎣
⎦
. 
(1.3) 

Область определения: 
x
−∞ <
< ∞ . 
Математическое ожидание 
x
µ = µ . 

1. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 

8 

Дисперсия 
2
2
x
σ = σ . 
Параметры распределения µ  и 
0
σ >
 являются первым моментом 
и стандартным отклонением нормально распределенной случайной 
величины х.  
График нормального распределения с параметрами 
0,
1
μ =
σ =  
приведен на рис. 1.1. Нормальное распределение возникает, когда 
разброс наблюдаемой величины вызван множеством причин, каждая 
из которых вносит в этот разброс вклад, сравнимый с вкладом других 
причин, и нет единственной преобладающей причины. Нормальное 
распределение занимает центральное место в теоретической статистике. Приводимые в следующих разделах оценки предполагают, что 
исследуемая случайная величина имеет нормальное распределение. 

 

Рис. 1.1. Плотность вероятности нормального распределения 
с 
0,
1
μ =
σ =  

Пусть 
(
)
P
x
μ − α ≤
≤ μ + α  – вероятность того, что нормально распределенная 
случайная 
величина 
х 
находится 
в 
интервале 

[
]
;
μ − α μ + α . Тогда 

(
)
0,6827
x
x
x
x
P
x
μ − σ ≤
≤ μ + σ
=
; 
(
2
2
)
0,9545
x
x
x
x
P
x
μ − σ ≤
≤ μ + σ
=
; 
(
3
3
)
0,9973
x
x
x
x
P
x
μ − σ ≤
≤ μ + σ
=
. 

1.1. Генеральная совокупность и выборка 

9 

Следовательно, вероятность отклонения нормально распределенной величины от ее первого момента более чем на два стандартных 
отклонения не превышает 0,0455, а на три стандартных отклонения 
0,0027. Этими свойствами нормального распределения пользуются 
для приближенных оценок. 

Экспоненциальное распределение 
Плотность вероятности 

 
( )
exp(
)
w x
x
= λ
−λ
. 

Область определения 
0
x ≥
. 

Математическое ожидание 
1
x
μ = λ . 

Дисперсия 
2
2
1
x
σ =
λ
. 

Единственный параметр распределения – 
0
λ >
.  
Графики 
экспоненциального 
распределения 
приведены 
на 
рис. 1.2. Если случайные события происходят независимо с равной 
вероятностью в любой момент времени и среднее число событий в 
единицу времени равно λ , то время между последовательными событиями распределено экспоненциально с параметром λ . Так распределено время между попаданиями частиц или квантов в счетчик, 
время между внезапными отказами оборудования на стадии его стационарной эксплуатации с постоянной интенсивностью отказов. 

 

Рис. 1.2. Плотность вероятности экспоненциального распределения 

1. СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ 

10 

Гамма-распределение 
Плотность вероятности 

 

1
(
)
exp(
)
( )
( )

b
x
x
w x
b

−
λ λ
−λ
=
Γ
, 
(1.4) 

где ( )
b
Γ
 – гамма-функция. 
Область определения 
0
x ≥
. 

Математическое ожидание 
x
b
μ = λ . 

Дисперсия 
2
2
x
b
σ = λ . 

Параметры распределения: 
0
λ >
 – масштабный параметр, 
0
b >
 – 
параметр формы.  
Графики плотности вероятности гамма-распределения приведены 
на рис. 1.3.  

 

Рис. 1.3. Плотность вероятности гамма-распределения:  
а – 
1
λ = , 
0,5
b =
; б – 
1
λ = , 
2
b =
; в – 
0,5
λ =
, 
2
b =
 

По мере увеличения параметра b при постоянном λ  центр распределения удаляется от нуля, а само распределение становится более 
симметричным. Гамма-распределение – универсальное распределение для описания ограниченных снизу случайных величин, например, распределения времени между отказами сложного оборудования 
на различных этапах его эксплуатации. В материаловедении оно 

1.1. Генеральная совокупность и выборка 

11 

применимо для описания распределения по размерам сечений зерен 
на металлографическом шлифе, результатов испытаний на усталостную долговечность и длительную прочность. Экспоненциальное распределение – частный случай гамма-распределения с 
1
b = . Рассматриваемое в п. 1.3 распределение Пирсона (
2
χ -распределение) – также 
частный случай гамма-распределения. 

Логарифмически-нормальное распределение 
Плотность вероятности 

 
(
)

2

2
ln
1
( )
exp
2
2

x
w x
x

⎡
⎤
− μ
=
⎢−
⎥
σ
π σ
⎢
⎥
⎣
⎦
. 

Область определения 
0
x >
. 

Математическое ожидание 

2
exp
2
x
⎛
⎞
σ
μ =
μ −
⎜
⎟
⎝
⎠
.  

Дисперсия 
(
)
(
)

2
2
2
exp 2
exp
1
x
⎡
⎤
σ =
μ + σ
σ
−
⎣
⎦ . 

Параметры распределения: µ , 
0
σ >
.  
Графики плотности вероятности логарифмически-нормального 
распределения приведены на рис. 1.4.  

 

Рис. 1.4. Плотность вероятности логарифмически-нормального 
распределения: а – 
0
µ =
, 
1
σ = ;  б – 
0
µ =
, 
0,5
σ =
;  в – 
1
μ = , 
1
σ = ;  
г – 
1
μ = , 
0,5
σ =
 

Доступ онлайн
2 000 ₽
В корзину