Article: PDF
Аннотация: Статья посвящена проблеме эвристической продуктивности использования метода компьютерного тематического моделирования для филологического анализа художественного текста. Анализируются результаты применения алгоритма Латентного размещения Дирехле (LDA) для поиска интертекстуальных связей мотивов в двух подкорпусах художественных текстов: 62 текстах разного жанра (рассказы, очерки, повести, критические статьи), принадлежащих перу С. Довлатова, с одной стороны, и 35 художественных произведениях, которые в одном из писем Т. Уржумовой писатель перечислил как произведения, которые оказали на него воздействие и которые должен прочитать каждый. Примененный алгоритм выявил 20 тем (топиков), по которым были распределены все тексты. Каждый полученный топик – это цепочка слов с весами значимости для реализации данной темы. В результате сопоставления текстов и тем были выявлены три соответствия «текст – тема». Одной общей теме принадлежат тексты в каждой из трех следующих групп: 1) роман Б. Пильняка «Голый год» и рассказ С. Довлатова «У реки»; 2) роман Г. Уэльса «Машина времени», повесть Э. Хемингуэя «Старик и море» и рассказ С. Довлатова «Эмигранты»; 3) рассказ А. Грина «Комендант порта» и очерк С. Довлатова «Мы говорим на разных языках». Дальнейший филологический анализ позволил выявить пересечения мотивов в данных группах произведений. Проведенное пилотное исследование показало, что методы компьютерного анализа текста, в том числе на основе машинного обучения, могут стать для филолога инструментом разведывательного поиска, направляя экспертную интуицию по пути, намеченному алгоритмом за счет обработки больших корпусных массивов.
Ключевые слова: художественный текст; метод компьютерного тематического моделирования; мотив; интертекстуальность; С. Довлатов

Для цитирования:

Колмогорова, А. В. Компьютерное моделирование как инструмент анализа художественного текста / А. В. Колмогорова, Е. Д. Залевская // Филологический класс. – 2023. – Том 28 ⋅ №2. – С. 22-33.

For citation

Kolmogorova, A. V., Zalevskaya, E. D. (2023). Computer-Assisted Modeling as an Instrument for Fiction Text Analysis. In Philological Class. 2023. Том 28 ⋅ №2. P. 22-33.

Об авторе (авторах) :

Колмогорова А. В. 
Национальный исследовательский университет «Высшая школа экономики»
(Санкт-Петербург, Россия)
ORCID ID: https://orcid.org/0000-0002-6425-2050


Залевская Е. Д.

Национальный исследовательский университет «Высшая школа экономики»
(Санкт-Петербург, Россия)
ORCID ID: https://orcid.org/0009-0009-0929-722X

Благодарности: в данной научной работе использованы результаты проекта «Текст как Big Data: моделирование конвергентных процессов в языке и речи цифровыми методами», выполненного в рамках Программы фундаментальных исследований НИУ ВШЭ в 2023 году.

Сроки публикации:

Дата поступления: 02.05.2023; дата публикации: 30.06.2023