Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Интерпретация и применение больших данных в юриспруденции юридической практике

Покупка
Артикул: 758717.01.99
Доступ онлайн
100 ₽
В корзину
Работа посвящена проблемам применения в юридической профессии информационных технологий, основанных на использовании больших данных. В первом разделе рассматриваются теоретические вопросы интерпретации больших данных, а также ряд ограничений применения, основанных на больших данных технологий в сфере социальной координации. Во втором разделе анализируется опыт практического применения ряда технологий для юридических целей. В третьем разделе описываются результаты эксперимента по применению технологий искусственного интеллекта для упрощения текстов российских нормативных правовых актов. Работа носит междисциплинарный характер и адресована органам государственной власти, специалистам 8 сфере юриспруденции и IT, обеспечивающим внедрение информационных технологий в практику государственного управления, преподавателям образовательных учреждений, научным работникам. Ключевые слова: большие данные; анализ больших данных, искусственный интеллект, интерпретация результатов анализа больших данных, судебная практика.
Интерпретация и применение больших данных в юриспруденции юридической практике : монография / Ю. А. Тихомиров, А. В. Кашанин, В. Д. Чураков [и др.] ; науч. ред. Ю. А. Тихомиров. - Москва : Юстицинформ, 2021. - 188 с. - ISBN 978-5-7205-1723-6. - Текст : электронный. - URL: https://znanium.com/catalog/product/1481725 (дата обращения: 25.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
 
ИНТЕРПРЕТАЦИЯ 
И ПРИМЕНЕНИЕ 
БОЛЬШИХ ДАННЫХ 
В ЮРИСПРУДЕНЦИИ 
И ЮРИДИЧЕСКОЙ 
ПРАКТИКЕ

Монография

Научный редактор 
Ю.А. Тихомиров

Москва
ЮСТИЦИНФОРМ
2021

© ООО «Юстицинформ», 2021
ISBN 978-5-7205-1723-6

УДК 34.01
ББК 87.256.6

Интерпретация и применение больших данных в юриспруденции 
и юридической практике: монография / [Ю.А. Тихомиров, А.В. Кашанин, 
В.Д. Чураков и др.]; науч. ред. Ю.А. Тихомиров. —  М.: Юстицинформ, 
2021. —  188 с.

Работа посвящена проблемам применения в юридической профессии 
информационных технологий, основанных на использовании больших 
данных. В первом разделе рассматриваются теоретические вопросы 
интерпретации больших данных, а также ряд ограничений применения, основанных на больших данных технологий в сфере социальной 
координации. Во втором разделе анализируется опыт практического 
применения ряда технологий для юридических целей. В третьем разделе описываются результаты эксперимента по применению технологий 
искусственного интеллекта для упрощения текстов российских нормативных правовых актов.
Работа носит междисциплинарный характер и адресована органам 
государственной власти, специалистам в сфере юриспруденции и IT, 
обеспечивающим внедрение информационных технологий в практику 
государственного управления, преподавателям образовательных учреждений, научным работникам.

Ключевые слова: большие данные; анализ больших данных, искусственный интеллект, интерпретация результатов анализа больших 
данных, судебная практика.

Исследование осуществлено в рамках Программы фундаментальных 
исследований НИУ ВШЭ в 2020 г. 

УДК 34.01
ББК 87.256.6
          И73

ISBN 978-5-7205-1723-6

 И73 

Авторы:
Тихомиров Ю.А. (введение); Кашанин А.В. (раздел 1); 
Чураков В.Д. (раздел 2); Осипова П.М. (раздел 3); 
Погребной Е.О. (раздел 2); Рофин М.П. (раздел 3); 
Хачатрян Г.А. (раздел 2)

INTERPRETATION AND 
APPLICATION OF BIG 
DATA IN LAW AND LEGAL 
PRACTICE

Monograph

Edited by 
Yu.A. Tikhomirov

Moscow
YUSTITSINFORM
2021

Interpretation and application of big data in law and legal practice: 
monograph / [Yu.A. Tikhomirov, A.V. Kashanin, V.D. Churakov, et al.]; ed. by 
Yu.A. Tikhomirov. — M.: Yustitsinform, 2021. —   188 р.

The monograph is dedicated to the problems of using based on big data 
technologies in the legal profession. The first section deals with theoretical 
issues of interpretation of big data, as well as a number of limitations of the 
application of technologies in the field of social coordination. The second 
section analyses experience in the practical application of a number of 
technologies for legal purposes. The third section describes the results of 
an experiment on the use of artificial intelligence technologies to simplify the 
texts of legal acts in Russia.
The work has an interdisciplinary nature and is addressed to authorities, 
legal and IT experts, who are responsible for the introduction of information 
technologies into the practice of public administration, as well as lecturers 
and researchers.

Keywords: big data, big data analysis, artificial intelligence, interpretation 
of big data analysis results, judicial practice.

The research was carried out within the framework of the HSE Basic 
Research Program in 2020.

И73   

УДК 34.01
ББК 87.256.6

ISBN 978-5-7205-1723-6

© LLC «Yustitsinform», 2021
ISBN 978-5-7205-1723-6

УДК 34.01
ББК 87.256.6
          И73

Authors:
Tikhomirov Yu.A. (introduction); Kashanin A.V. (section 1); 
Churakov V.D. (section 2); Osipova P.M. (section 3); 
Pogrebnoy E.O. (section 2); Rofin M.P. (section 3); 
Khachatryan G.A. (section 2)

СОДЕРЖАНИЕ

Авторский коллектив ...............................................................8
Введение .................................................................................9
Глава 1. Проблемы интерпретации и применения  
 
  больших данных в юриспруденции и юридической 
практике...................................................................20
 
1.1. Эпоха «big data paradigm»............................................20
 
1.1.1. Этап некритического отношения 
 
 
к большим данным в теории познания............20
 
1.1.2. Big data paradigm в праве. Теория 
 
 
персонализированного права............................26
 
1.2. Критика концепции объективности больших 
 
    данных..........................................................................28
 
1.2.1. Эпистемологические проблемы........................28
 
1.2.2. Проблемы объективности больших данных  
 
 
          в юриспруденции и судебной практике...........33
 
1.2.2.1. Оценка полноты и качества данных...............34
 
1.2.2.2. Интерпретация больших данных 
 
 
  и их применение в целях социального 
 
 
  регулирования................................................43
 
1.2.2.2.1. Большие данные и социальная 
 
 
     реальность....................................................44
 
1.2.2.2.2. Нормативность права..................................49
 
1.2.2.2.3. Предсказательная сила больших 
 
 
     данных в правоприменении........................63
 
1.2.2.2.4. Искажающие эффекты больших данных: 
 
 
самооправдывающиеся пророчества 
 
 
и «эффект колеи».........................................80
 
1.2.2.2.5. Непрозрачность, недемократичность, 
 
неподотчетность, проблемы 
 
дискриминации...........................................83
 
1.2.2.2.6. Непредсказуемость правового 
 
 
положения...................................................86

Содержание

 
1.2.2.2.7. Этика и ценности........................................86
 
1.3. Перспективы использования больших данных.........88
 
1.4. Выводы.........................................................................96

Глава 2. Опыт применения в юридической профессии 
 
технологий, основанных на анализе больших 
 
данных.....................................................................107
 
2.1. Вводные положения..................................................107
 
2.2. Введение в используемые средства машинного 
 
анализа  больших  данных..........................................108
 
2.3. Предсказание решений Европейского суда 
 
   по правам человека....................................................118
 
2.4. Лингвистический анализ нормативной правовой 
 
информации.............................................................124
 
2.4.1. Анализ сложности текстов правовых актов  
 
 
           органов власти Российской Федерации..........124
 
2.4.2. Трансформация текстов нормативных 
 
 
правовых актов в открытые данные................127
 
2.5. Применение патентного права к деятельности 
 
искусственного интеллекта......................................129
 
2.6. Проекты компании Palantir.......................................133
 
2.7. IT-решения в области анализа судебной 
 
 
практики....................................................................139
 
2.7.1. Российские базы данных судебных актов.......139
 
2.7.2. Зарубежные сервисы анализа судебной 
 
            практики...........................................................151
 
2.7.3. Исследования в области автоматизированного 
 
 
анализа судебной практики.............................154

Глава 3. Практическое применение Natural Language Processing  
 
для упрощения текстов нормативных 
 
правовых актов.......................................................160
 
3.1. Введение....................................................................160
 
3.2. Толкование как способ уяснения надсообщения 
 
 
текста закона.............................................................162
 
3.3. Уяснение текста закона без юридической 
 
 
подготовки...............................................................165
 
3.4. Возможные методы упрощения юридических 
 
 
текстов с помощью NLP...........................................171
 
3.4.1. Введение в NLP...............................................171
 
3.4.2. Решение через машинный перевод...............173
 
3.4.3. Использование переноса стиля.....................174
 
3.4.4. Использование text simplification....................176
 
3.5. Предлагаемый подход к созданию алгоритма, 
 
способного адаптировать юридический текст........177
 
3.5.1. Обучение модели машинного перевода 
 
на параллельном корпусе................................177
 
3.5.2. Методы без использования параллельного  
 
 
 
корпуса...........................................................178
 
3.6. Описание проведенного эксперимента...................179
 
3.6.1. Подготовка параллельного корпуса..............179
 
3.6.2. Обучение........................................................180
 
3.7. Выводы и дальнейшие перспективы 
 
исследования...........................................................187

АВТОРСКИЙ КОЛЛЕКТИВ

Тихомиров Юрий Александрович, научный руководитель Института 
исследований национального и сравнительного права Факультета 
права Национального исследовательского университета «Высшая школа экономики», доктор юридических наук, профессор, 
utikhomirov@hse.ru

Кашанин Андрей Васильевич, заместитель директора Института 
государственного и муниципального управления Национального 
исследовательского университета «Высшая школа экономики», 
кандидат юридических наук, akashanin@hse.ru

Чураков Владимир Дмитриевич, младший научный сотрудник 
Института исследований национального и сравнительного права 
Факультета права Национального исследовательского университета 
«Высшая школа экономики», преподаватель Департамента теории 
права и межотраслевых юридических дисциплин Факультета права 
НИУ ВШЭ,  vchurakov@hse.ru

Осипова Полина Максимовна, стажер-исследователь Института 
исследований национального и сравнительного права Факультета 
права Национального исследовательского университета «Высшая 
школа экономики», posipova@hse.ru

Погребной Евгений Олегович, стажер-исследователь Института 
исследований национального и сравнительного права Факультета 
права Национального исследовательского университета «Высшая 
школа экономики», epogrebnoy@hse.ru

Рофин Марк Петрович, студент бакалавриата Факультета компьютерных наук Национального исследовательского университета 
«Высшая школа экономики», mprofin@edu.hse.ru

Хачатрян Гарик Арменович, стажер-исследователь Института 
исследований национального и сравнительного права Факультета 
права Национального исследовательского университета «Высшая 
школа экономики», gkhachatryan@hse.ru

ВВЕДЕНИЕ

Анализ данных (Big Data analysis) в социальных науках является 
одной из сфер, показывающих впечатляющий прогресс в последние годы. Активный интерес научного сообщества в указанном 
направлении обусловлен двумя основными обстоятельствами. 
Во-первых, стали доступны огромные массивы информации, связанной с функционированием социальных систем (социальные сети 
и корпоративные информационные системы являются, возможно, 
наиважнейшими поставщиками информации «нового времени»). 
Во-вторых, появляются и развиваются новые методы анализа больших данных, применимые для анализа социальных явлений на 
совершенно новом уровне.
В последние годы применение информационных технологий 
в юридической науке и практике стало одним из наиболее перспективных и обсуждаемых направлений развития юридической профессии, а также решения целого ряда прикладных юридических задач.
Прежде всего, информационные технологии могут эффективно использоваться на тех участках юридической деятельности, 
где преобладает рутинная работа. Как показывает практика, 
в процедурах оценки благонадежности контрагентов команда юридических аналитиков, изучающих жалобы сотрудников 
и клиентов, личные дела, судебные документы и нормативную 
документацию, может быть вполне заменена программным продуктом. Это устраняет необходимость в значительном объеме 
человеческих усилий и дает возможность обеспечить анализ 
большего количества материала 1.
Использование информационных технологий стимулирует к новым и важным результатам. Так, технологии искусственного интеллекта позволяют прогнозировать вероятный исход рассмотрения 
дел в судах, при этом предсказательная способность искусственного 
интеллекта в своих прогнозах достигает 86,6% точности по сравнению с аналогичным показателем в 66,3% команды юристов 2.

1 What are legal analytics? How AI and big data is changing law school. [Электронный ресурс] // URL: https://bigdata-madesimple.com/what-are-legalanalytics-how-ai-and-big-data-is-changing-law-school/ 
(дата 
обращения: 
14.11.2020).

2 Там же.

Введение

Однако существуют ограничения и пределы полезности применения информационных технологий в юридической профессии. 
Многие из них так или иначе связаны с необъективностью результатов, что бы под ней ни понималось (теоретическая и ценностная 
нагруженность, произвольность интерпретации и т. п.). Алгоритмы, 
используемые для анализа юридических данных, не являются безусловно безличными и нейтральными. История юриспруденции 
изобилует примерами сознательной и бессознательной предвзятости 
людей. Обученный на подобном наборе данных искусственный 
интеллект будет давать соответствующий результат. Например, 
именно данное обстоятельство дает повод для критики технологий, 
которые оценивают риски рецидива со стороны афроамериканцев 
как более высокие 3.
Далее, как отмечается в литературе, в связи с распространением 
информационных технологий меняются перспективы занятости 
студентов юридических ВУЗов. Многие из них вполне могут посвятить часть своего времени программированию и аналитике. Работа 
другой части юристов будет заключаться в том, чтобы анализировать 
и корректировать сокращенную информацию, предоставляемую 
аналитическими платформами. Юристы с харизмой, навыками 
ораторского искусства и ведения переговоров останутся столь же 
востребованными, как и сейчас. Таким образом, вполне вероятно, 
что скоро мы увидим двойную специализацию в юридической сфере: 
с одной стороны, это аналитика и программирование, с другой — 
риторические навыки и стремление к справедливости 4.
Большая часть современных LegalTech технологий так или иначе 
основана на использовании методов анализа больших данных (Big 
Data).

3 Machine Bias. [Электронный ресурс] // URL: https://www.propublica.org/
article/machine-bias-risk-assessments-in-criminal-sentencing (дата обращения: 
14.11.2020).

4 What are legal analytics? How AI and big data is changing law school. 
[Электронный ресурс] // URL: https://bigdata-madesimple.com/what-arelegal-analytics-how-ai-and-big-data-is-changing-law-school/ (дата обращения: 
14.11.2020).

В настоящем исследовании мы будем исходить из классических 
признаков Big Data:
• 
«большой» объем (дать четкое определение минимального 
объема данных, при достижении которого они становятся 
«большими», вряд ли представляется возможным);
• 
гибкость и быстрота изменения (данные собираются практически в реальном времени и, как правило, в автоматизированном режиме);
• 
полнота. Этот признак является одновременно самым спорным и наиболее значимым для понимания феномена больших данных. Полнота данных требуется в целях выявления 
достоверных корреляций между всем массивом переменных 
и полученными результатами. Соответственно, неполнота 
данных может существенно искажать интерпретацию связей. 
Однако часто добиться исчерпывающего набора данных 
невозможно» 5.

Не являются исключением также и технологии, применяемые 
судьями и судебными юристами, которые основаны на анализе полных баз данных текстов судебных решений либо картотек судебных 
дел, представляющих собой размеченные данные, характеризующие 
судебные дела. Цели таких информационных систем могут быть 
различными. При создании таких систем преследуются, прежде 
всего, учетные цели, а также обеспечение транспарентности правосудия. При этом дальнейший анализ данных о судебной практике 
чаще всего преследует прогностические цели (анализ вероятности 
выиграть дело, поиск наиболее эффективного способа разрешения 
спора и т. п.). Также может осуществляться анализ практики с точки 
зрения ее единообразия либо разнородности. Отметим, что в основе 
решения данных задач могут лежать сходные алгоритмы, основанные 

5 Классическое определение больших данных см.: Kitchin R. Big data and 
human geography: Opportunities, challenges and risks // Dialogues in Human 
Geography. 2013. № 3(3). Р. 262–263. См. также: Чураков В. Д. Актуальные 
вопросы применения информационных технологий в юридической науке 
и практике // Журнал зарубежного законодательства и сравнительного 
правоведения. 2020. № 1. С. 103.

Введение

на поиске корреляций между существенными характеристиками 
судебных решений (поиск паттернов), которые при сопоставлении 
позволяют делать выводы о наличии либо отсутствии однородности 
судебной практики (например, практики одного суда в различные 
периоды времени либо практики различных судов), определять 
стандартный трек дела с определенными характеристиками. Это, 
в свою очередь, позволяет делать прогнозы о наиболее вероятном 
исходе дела.
Так, на применении аналогичных принципов реализован соответствующий прогностический функционал российской компанией 
PravoTech, обеспечивающей функционирование информационных 
систем арбитражного судопроизводства и основанный на базе анализа арбитражных решений и карточек арбитражных дел сервиса 
Casebook 6.
Как и в других сферах науки и практики, возможность использования технологий анализа больших данных для решения различных юридических задач, а также их кажущаяся эффективность, 
первоначально, породили значительный энтузиазм среди ученых 
и практиков. Казалось, что появляется возможность автоматизации 
решения юридических проблем, включая поиск эффективных способов разрешения споров. Собственно, это дало почву для дискуссий 
о потере юридической теорией и юридической профессией своей 
актуальности, их замещении алгоритмами.
Однако стадия энтузиазма в отношении технологий стала сменяться этапом скепсиса, почву для которого дает ряд вопросов 
и сомнений в эффективности и этичности таких технологий, объективности и обоснованности результатов их применения, их приемлемости с точки зрения целей и ценностей социального управления. 
Текущий этап характеризуется рутинизацией использования 
информационных технологий для решения частных задач юридической профессии, постепенным их развитием с учетом трезвого 
осознания их возможностей и ограничений. 

6 Casebook. [Электронный ресурс] // URL: https://casebook.ru/ (дата 
обращения: 14.11.2020).

Эволюцию технологий больших данных можно проследить по 
графику «Цикла зрелости технологий», лежащего в основе ежегодного отчета о перспективных технологиях аналитического агентства 
Gartner. Технологии больших данных появляются в области «триггера 
технологий» в июне 2011 г. со степенью вызревания технологии от 
2 до 5 лет. В графике от июля 2012 г. технологии больших данных 
переходят уже на «пик завышенных ожиданий» с той же степенью 
вызревания, которая в 2013 г. меняется на степень от 5 до 10 лет. 
В 2014 г. технологии больших данных вступили в область «пропасть разочарований», а в 2015 г. покинули график «Цикла зрелости технологий», это означает, что технологии стали рутинными 
в применении 7.
В центре настоящей работы исследования находится проблема 
интерпретации результатов анализа больших данных в юриспруденции и юридической практике. При этом с учетом того, что коллективом авторов в 2018–2019 годах разрабатывались алгоритмы 
машинного анализа судебной (арбитражной) практики на основе 
полной базы данных решений, проблема интерпретации результатов 
анализа больших данных рассматривается преимущественно на 
примере анализа данных о судопроизводстве 8.

7 См. Hype Cycle for Emerging Technologies 2011 (http://www.gartner.com/hc/
images/215650_0001.gif); Key Trends to Watch in Gartner 2012 Emerging Technologies 
Hype Cycle (http://www.forbes.com/sites/gartnergroup/2012/09/18/key-trendsto-watch-in-gartner-2012-emerging-technologies-hypecycle-2/); Gartner’s 2013 
Hype Cycle for Emerging Technologies Maps Out Evolving Relationship Between 
Humans and Machines (http://www.gartner.com/newsroom/id/2575515); Gartner’s 
2014 Hype Cycle for Emerging Technologies Maps the Journey to Digital Business 
(http://www.gartner.com/newsroom/id/2819918); Gartner’s 2015 Hype Cycle for 
Emerging Technologies Identifies the Computing Innovations That Organizations 
Should Monitor (URL: http://www.gartner.com/newsroom/id/3114217). Приводится 
по: Журавлева Е. Ю. Вызовы технологий «Больших данных» для современных 
социогуманитарных наук // Вопросы философии. 2018. № 9. С. 50–59.

8 В частности, была создана и протестирована на основе базы судебных 
решений российских арбитражных судов за 2010–2017 годы пилотная версия 
системы автоматизированного анализа судебной практики с точки зрения 
наличия повторяющихся обобщенно понимаемых паттернов правоприменения. 
Это позволило убедиться в применимости методов Data Mining по отношению 
к анализу судебной практики в рамках отдельного правопорядка.

Доступ онлайн
100 ₽
В корзину