Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Основы прикладной и математической лингвистики

Покупка
Основная коллекция
Артикул: 738657.01.01
К покупке доступен более свежий выпуск Перейти
Учебное пособие знакомит читателей с основными вехами становления и развития прикладной и математической лингвистики, отражает современный отечественный и зарубежный опыт приложения лингвистических знаний в различных сферах практической деятельности. Особое внимание уделяется тем направлениям, которые важны для профессиональной деятельности судебных экспертовречеведов. Изложены основные методологические подходы к исследованию речевых продуктов, охарактеризованы некоторые автоматизированные системы анализа письменных текстов и звучащей речи. Практические задания, содержащиеся в пособии, призваны сформировать у обучающихся навыки работы с компьютерными словарями, лингвистическими корпусами, компьютерными программами. Для студентов и аспирантов, специализирующихся в области судебного речеведения, лингвистических экспертиз и других исследований языка и речи.
Надеина, Т. М. Основы прикладной и математической лингвистики : учебное пособие / Т. М. Надеина. — Москва : Норма : ИНФРА-М, 2020. — 152 с. - ISBN 978-5-00156-072-2. - Текст : электронный. - URL: https://znanium.com/catalog/product/1092460 (дата обращения: 29.03.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
НОРМА
ИНФРАМ
Москва, 2020

Основы прикладной
и математической
лингвистики

Учебное пособие

Рекомендовано
Редакционноиздательским советом Московского государственного
юридического университета имени О. Е. Кутафина (МГЮА)
для обучающихся юридических вузов и факультетов по специальности
40.05.03 Судебная экспертиза (уровень специалитета)

Московский государственный юридический университет
имени О. Е. Кутафина (МГЮА)

Т. М. Надеина

УДК 801:001.8(075.8)
ББК 81.1я73
Н17

Рецензенты

Е. И. Галяшина, профессор кафедры судебных экспертиз Университета имени О. Е. Кутафина (МГЮА), доктор филологических наук,
доктор юридических наук, профессор.
Е. Р. Россинская, заведующая кафедрой судебных экспертиз, член
Редакционноиздательского совета Университета имени О. Е. Кутафина (МГЮА), доктор юридических наук, профессор.
Н. А. Фатеева, главный научный сотрудник Института русского
языка имени В. В. Виноградова РАН, доктор филологических наук.

Надеина Т. М.
Н17
Основы прикладной и математической лингвистики : учебное пособие / Т. М. Надеина. — Москва : Норма : ИНФРАМ,
2020. —  152 с.
ISBN 9785001560722 (Норма)
ISBN 9785160162744 (ИНФРАМ, print)
ISBN 9785161085844 (ИНФРАМ, online)
Учебное пособие знакомит читателей с основными вехами становления и
развития прикладной и математической лингвистики, отражает современный
отечественный и зарубежный опыт приложения лингвистических знаний в различных сферах практической деятельности. Особое внимание уделяется тем направлениям, которые важны для профессиональной деятельности судебных
экспертовречеведов. Изложены основные методологические подходы к исследованию речевых продуктов, охарактеризованы некоторые автоматизированные системы анализа письменных текстов и звучащей речи. Практические задания, содержащиеся в пособии, призваны сформировать у обучающихся навыки
работы с компьютерными словарями, лингвистическими корпусами, компьютерными программами.
Для студентов и аспирантов, специализирующихся в области судебного речеведения, лингвистических экспертиз и других исследований языка и речи.

УДК 801:001.8(075.8)
ББК 81.1я73

ISBN 9785001560722 (Норма)
ISBN 9785160162744 (ИНФРАМ, print)
ISBN 9785161085844 (ИНФРАМ, online)
© Надеина Т. М., 2020

Об авторе

Надеина Татьяна Михайловна — доктор филологических наук, профессор, почетный работник высшего профессионального образования РФ. Специалист в области теоретической и прикладной лингвистики, фонетики и интонологии, коммуникационных технологий.
В сферу научных интересов Т. М. Надеиной входят исследование
устной спонтанной речи в аспекте судебного речеведения, а также
смежные области — просодические особенности звучащей речи, прагмалингвистика, психолингвистика, средства речевого воздействия,
массовые коммуникации. Автор имеет большой опыт научноисследовательской работы в области лингвистической экспертизы звучащей речи.
Т. М. Надеина — автор более 100 учебнометодических и научных
работ, учебников и учебных пособий, в числе которых монография
«Фразовая просодия как фактор речевого воздействия», учебники и
учебные пособия «Речевая коммуникация», «Русский язык и культура
речи», «Теория и практика реферирования», «Бизнескоммуникации
в сервисе».

Оглавление

Предисловие ............................................................................................9

Глава 1. Объект и методы прикладной лингвистики ..............................11
Источники .......................................................................................14
Контрольные вопросы ....................................................................14
Практические задания ....................................................................14

Глава 2. Математическая лингвистика ..................................................16
§ 1.Предпосылки возникновения математической лингвистики ....16
§ 2. Предмет и разделы математической лингвистики ..................17
§ 3. Квантитативная лингвистика ..................................................18
3.1. Частотные словари ...............................................................19
3.2. Корпусная лингвистика .......................................................20
3.3. Построение структурновероятностных моделей языка ....20
Источники .......................................................................................23
Контрольные вопросы ....................................................................24
Практические задания ....................................................................25
Пример выполнения задания 2 .......................................................25

Глава 3. Контентанализ ........................................................................28
§ 1. Из истории применения контентанализа ..............................29
§ 2. Процедура контентанализа .....................................................31
§ 4. Анализ тональности текста ......................................................36
§ 3. Контентанализ как метод психодиагностики ........................41
Источники .......................................................................................42
Контрольные вопросы ....................................................................43
Практическое задание .....................................................................43
Пример выполнения задания .........................................................43

Глава 4. Компьютерная лингвистика ......................................................45
§ 1. Основные принципы автоматической обработки текста .......46
§ 2. Общие принципы компьютерного моделирования
мышления .................................................................................49
§ 3. Гипертекстовые технологии представления текста .................54

Источники .......................................................................................57
Контрольные вопросы ....................................................................58
Практические задания ....................................................................58

Глава 5. Лексикография .........................................................................59
§ 1. Основные типы словарей .........................................................60
§ 2. Основные структурные компоненты словаря .........................71
§ 3. Компьютерная лексикография ................................................75
§ 4. Терминоведение и терминография ..........................................79
Источники .......................................................................................81
Контрольные вопросы ....................................................................81
Практические задания ....................................................................82
Пример выполнения задания 1 .......................................................82

Глава 6. Корпусная лингвистика ............................................................84
§ 1. Национальные корпусы текстов ..............................................86
§ 2. Специализированные корпусы текстов ...................................91
Источники .......................................................................................93
Контрольные вопросы ....................................................................93
Практическое задание .....................................................................94

Глава 7. Машинный перевод ..................................................................95
§ 1. Когнитивные стратегии перевода ............................................95
§ 2. Виды перевода как деятельности .............................................97
§ 3. История становления машинного перевода ...........................98
§ 4. Системы машинного перевода ...............................................100
Источники .....................................................................................104
Контрольные вопросы ..................................................................104
Практические задания ..................................................................105
Пример выполнения задания 1 .....................................................105
Пример выполнения задания 2 .....................................................106

Глава 8. Информационный поиск .........................................................107
§ 1. Основные понятия ..................................................................108
§ 2. Информационнопоисковые системы ..................................109
Источники .....................................................................................112
Контрольные вопросы ..................................................................112
Практические задания ..................................................................113

Глава 9. Речевые технологии ................................................................114
§ 1. Распознавание речи ................................................................114

Оглавление
7

1.1. Из истории разработки САРР ............................................115
1.2. Современные системы .......................................................118
§ 2. Синтез речи .............................................................................120
2.1. Из истории создания синтезаторов ...................................121
2.2. Типы синтезаторов .............................................................126
2.3. Оценка качества синтеза речи ...........................................128
Источники .....................................................................................130
Контрольные вопросы ..................................................................130
Практические задания ..................................................................131

Глава 10. Системы искусственного интеллекта ....................................132
§ 1.Направления и этапы развития искусственного интеллекта ....133
§ 2. Классификация систем искусственного интеллекта .............137
§ 3. Национальная стратегия развития искусственного
интеллекта в Российской Федерации ....................................143
Источники .....................................................................................145
Контрольные вопросы ..................................................................145
Практические задания ..................................................................146

Литература ...........................................................................................147

8
Оглавление

Предисловие

Учебное пособие предназначено для студентов, обучающихся по
специальности 40.05.03 «Судебная экспертиза» (уровень специалитета) со специализацией «Речеведческие экспертизы», в основную образовательную программу которой входит дисциплина «Основы прикладной и математической лингвистики». Целью учебной дисциплины является формирование у обучающихся целостного представления
о методологии прикладных исследований языка и речи, о методах изучения текстов естественного и искусственного языков, о возможностях формализации лингвистического описания текста и компьютеризации текстологического анализа.
Цель учебного пособия — ознакомить обучающихся:
— с основами прикладной и математической лингвистики;
— с современным отечественным и международным опытом приложения лингвистических знаний в различных проблемных сферах
деятельности;
— с методологическими основами лингвистического исследования
текстовой информации;
— со структурой и функциями автоматизированных систем анализа письменных текстов и звучащей речи;
— с ролью прикладных лингвистических исследований в практической экспертной деятельности.
Прикладная лингвистика трактуется нами широко — как научнопрактическое направление, связанное с применением лингвистических знаний для решения прикладных задач в различных сферах жизнедеятельности людей. В связи с этим (и вслед за А. Н. Барановым)
мы рассматриваем математическую лингвистику в качестве одного из
направлений прикладной лингвистики, связанного с использованием
математических методов для исследования языка и речи. Поскольку в
настоящее время лингвистические исследования не обходятся без
применения компьютерных технологий, мы считаем также, что крупнейшим направлением прикладной лингвистики является компьютерная лингвистика, выделяемая «по инструменту», т. е. по применению компьютерных средств обработки языковых данных1.

1 См.: Баранов А. Н. Введение в прикладную лингвистику: учеб. пособие. М., 2001.
С. 14.

В учебное пособие включены те направления прикладной лингвистики, которые наиболее важны для деятельности судебных экспертовречеведов и содержат знания, призванные способствовать успешному усвоению студентами специальных дисциплин, включенных
в основную образовательную программу. Перечень этих направлений
определяется такой базовой специальной дисциплиной, как «Судебное речеведение».
Судебное речеведение представляет собой интегративную область
специальных синтетических научнопрактических знаний о речевой
деятельности и ее результатах (продуктах речевой деятельности), подвергаемых экспертному исследованию в целях содействия судам,
судьям, органам дознания, лицам, производящим дознание, следователям в установлении обстоятельств, подлежащих доказыванию по
конкретному делу. Оно охватывает не только правовую сферу, но и
сферу фундаментальных научных знаний о процессе речепроизводства, восприятия и понимания речевых произведений, а также о технологиях их использования для решения практических задач с учетом
разнообразных экстралингвистических источников информации
(коммуникативной ситуации, фоновых знаний коммуникантов, невербальных средств коммуникации и т. д.)1.
Учебное пособие содержит 10 глав, каждая из которых сопровождается контрольными вопросами и практическими заданиями, а также перечнем источников, которые были использованы при ее написании.
Практические задания, содержащиеся в пособии, нацелены на развитие у обучающихся навыков работы с компьютерными словарями,
лингвистическими корпусами, компьютерными программами анализа речевых продуктов и т. п., что является важным фактором успешного формирования профессиональных компетенций.
Автор выражает глубокую признательность рецензентам учебного
пособия за высказанные ими замечания и рекомендации, которые были учтены при редактировании рукописи. Искренняя благодарность — преподавателям и сотрудникам кафедры судебных экспертиз
Московского государственного юридического университета имени
О. Е. Кутафина (МГЮА) во главе с профессором Е. Р. Россинской за
помощь и поддержку.

10
Предисловие

1 См.: Галяшина Е. И. Судебное речеведение: учебник. М., 2020. С. 16—20.

Глава 1. Объект и методы
прикладной лингвистики

Прикладная лингвистика — это широкое научнопрактическое направление, связанное с применением лингвистических знаний для решения прикладных задач в различных сферах жизнедеятельности людей.
Первоначально, согласно западной традиции, к сфере прикладной
лингвистики относилось в основном преподавание языков, как иностранных, так и родного, поскольку важной задачей обучения является адаптация теоретических описаний к условиям обучения. И до сих
пор такая трактовка сохраняется в названиях английских и американских учебных заведений. Например, институт в Дублине называется
School of Applied Languages (дословно «школа прикладных языков»,
хотя фактически она является институтом иностранных языков).
Такой подход существенно ограничивает сферу прикладной лингвистики, поскольку имеющая давнюю историю деятельность по созданию алфавитов для бесписьменных языков, составлению словарей,
дешифровке древних рукописей — это сфера приложения лингвистических знаний.
В СССР термин «прикладная лингвистика» начал широко употребляться в 50е гг. в связи с появлением компьютерных технологий и
разработкой систем автоматической обработки информации (систем
управления, информационного поиска, обработки текста и проч.).
Впоследствии наряду с этим термином появились и другие наименования: «автоматическая лингвистика», «инженерная лингвистика»,
«вычислительная лингвистика», «компьютерная лингвистика», которые не являются полными синонимами. Каждое из этих практических
направлений имеет свой предмет и относится к сфере прикладной
лингвистики в целом.
Объединяет все перечисленные направления одна главная задача — оптимизация функций языка. Для успешного решения каждой
конкретной практической задачи необходимо «приспособить знания
о языке» к ее условиям и выбрать или разработать соответствующие
методы.

Поэтому прикладную лингвистику можно определить как научную
дисциплину, в которой изучаются и разрабатываются способы оптимизации функционирования языка1.
Основными функциями языка являются коммуникативная, эпистемическая и когнитивная, которые объединяют в своем составе более конкретные функции. Коммуникативная функция включает фатическую (контактоустанавливающую), информационную (передача
информации), функцию воздействия, социальную функцию. Эпистемическая функция заключается в хранении и передаче знаний, а также отражении национального сознания. Когнитивная функция связана с познанием действительности2.
Основные функции языка находят применение в нескольких сферах научнопрактической деятельности:

Основные функции языка
Сферы научнопрактической
деятельности

Коммуникативная
функция
Теория перевода,
машинный перевод,
обучение родному и неродному языку,
информационный поиск,
создание информационных и искусственных
языков,
кодирование,
языковая политика,
теория воздействия,
политическая лингвистика,
автоматическое распознавание и синтез речи

Эпистемическая
функция
Составление словарей,
упорядочение терминологии,
создание базы речевых произведений,
описание бесписьменных языков

Когнитивная функция
Изучение языка математическими методами,
контентанализ массива текстов,
компьютерные методы моделирования речевых
явлений,
искусственный интеллект,
судебное речеведение

12
Глава 1. Объект и методы прикладной лингвистики

1 См.: Баранов А. Н. Указ. соч. С. 8.
2 Там же. С. 7.

Для судебноэкспертной деятельности особую значимость имеют
такие направления прикладной лингвистики, как:
— математическая лингвистика,
— контентанализ массива текстов,
— компьютерная лингвистика,
— лексикография и терминоведение,
— корпусная лингвистика,
— машинный перевод,
— информационный поиск,
— речевые технологии,
— системы искусственного интеллекта.
Именно этим отраслям знаний будет уделяться основное внимание
в данном учебном пособии.
Каждое из перечисленных прикладных направлений обладает своим уникальным набором методов. Все они относятся к области прикладной лингвистики. Общим для них, универсальным и основным методом прикладной лингвистики является метод моделирования.
Он используется в тех случаях, когда непосредственное изучение
объекта затруднено (например, сознание человека и мыслительные
процедуры). Для создания модели надо знать, как ведет себя объект
моделирования в тех или иных условиях.
Исходный пункт использования метода моделирования — представление о входной и выходной информации, характеризующей
функционирование объекта моделирования. Например, создание модели синтаксиса естественного языка опирается на факты возможности или невозможности осуществления тех или иных синтаксических трансформаций предложения.
Если созданная модель повторяет поведение объекта моделирования, т. е. входная и выходная информация модели повторяет аналогичную информацию объекта моделирования, то модель функционирует хорошо, адекватно.
Теория моделирования позволяет в этом случае перенести особенности устройства модели на сам объект. Это важное теоретическое положение, которое позволяет метод моделирования считать исследовательским методом.
Модель всегда является идеализацией объекта моделирования, его
огрублением. Одновременно она должна предсказывать поведение
объекта и объяснять его.
В теоретической лингвистике часто используются следующие типы
моделей:
— компонентные модели, или модели структуры (из чего состоит X);

Глава 1. Объект и методы прикладной лингвистики
13

К покупке доступен более свежий выпуск Перейти