АДИТ-2003. Тезисы доклада
Тема: "Аппаратно-программные технологии для сферы культуры"
Москин Николай Дмитриевич
  Петрозаводск
  Петрозаводский государственный университет
  аспирант
  Тел.: (8142)783759
  E-mail: moskin@sampo.ru
 
Варфоломеев Алексей Геннадьевич (Петрозаводский государственный университет)

Проект информационной системы для представления и анализа текстов фольклорных песен

Развитие компьютерных технологий дает возможность введения в научный оборот больших комплексов архивных источников. Одним из таких комплексов является коллекция текстов бесёдных песен Заонежья конца XIX века, собранная Р.Б.Калашниковой из разнообразных архивных фондов и публикаций [1]. Важными задачами, возникающими при рассмотрении этой коллекции, оказываются задачи классификации песен и поиска стандартных тем (мотивов). Для автоматизации процесса решения таких задач необходимо представить текст песни в виде какой-либо формальной структуры. Наш доклад посвящен созданию информационной системы, представляющей коллекцию бесёдных песен вместе с гибкими средствами их формализации и анализа [2].

Для формализации текстов в гуманитарных науках традиционно применяются типологические формулы или контент-анализ, который подсчитывает частоту встречаемости в тексте определенных словосочетаний (индикаторов). Однако эти методы недостаточны для отражения содержания песни. На наш взгляд, адекватной моделью для представления фольклорной песни является граф, представляющий из себя совокупность некоторых объектов и связей между ними. Под объектами можно понимать разные сущности: все слова текста, его предложения, или же те персонажи и предметы, вокруг которых ведется повествование. Связи соединяют между собой пары объектов. В тексте песни они подкреплены глаголами или отглагольными формами и выражают конкретное действие (например, девица ждет парня). Существуют также связи, которые не отражены в тексте, но незримо присутствуют в нем – принадлежность, эквивалентность и т.д.

Представив песни в виде графов, мы можем сравнивать их между собой по внутренней структуре, выделять группы похожих песен. Кроме того, графы позволяют решать задачу обнаружения в текстах стандартных мотивов. Мотив представляет из себя устойчивый по семантике и эпитетам фрагмент песни или образ, имеющий скрытый символический смысл. В рамках предложенной структуры проблема обнаружения мотивов сводится к задаче поиска похожих фрагментов во множестве графов.

К настоящему времени реализован прототип информационной системы в среде Delphi, который содержит полные тексты песен и их формальные представления. Программа позволяет проводить сравнения песен, выделять инварианты, решать задачи классификации фольклорного материала, и, кроме того, использовать уникальную историческую информацию в справочных, учебных, культурно-просветительских целях.

Сноски:
 
1. Калашникова Р.Б. Бесёды и бесёдные песни Заонежья второй половины XIX века. Петрозаводск, 1999

2. Варфоломеев А.Г., Москин Н.Д., Кравцов И.В. Информационная система по фольклорным песням Заонежья как инструмент формализации и классификации песен // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды IV Всероссийской научной конференции RCDL''2002 (Дубна, 15-17 октября 2002 г.). Т.2. Дубна, 2002. С.143-147.

 

 
  © АДИТ, 1997-2003