Create post

Онтоинженерия на службе филологии: как создавать онтологии литературных произведений.

panddr
Vitaliy Bolataev

Современная инженерия знаний, на мой взгляд, исходит из предпосылок введенных Монтегю и Льюисом о понятии онтологии: выражения естественного языка откосятся к реальному миру во всем его богатстве, причем к миру в «широком смысле», и к воспринимаемой нами реальности, и к нашему внутреннему миру, включающем и мыслимые, и возможные миры. Мир этот богат, красочен и неисчерпаем.

В такой теории выражения искусственных языков интерпретируются на моделях, т.е. на математических структурах, и их значение четко определяется интерпретацией. Хотя модели — это математические абстракции, их структура отражает структуру языка, для интерпретации которого они служат. Но искусственные языки создаются, как правило, для описания некоторой реальности, и в этом случае модели должны отражать структуру этой реальности. Мы говорим в логике о модели языка или модели теории, и говорим в то же время о модели в физике (атома) или о модели экономических отношений. «Устройство» моделей искусственных языков — это основные предположения об устройстве мира, описываемого этими языками, иногда называемой онтологией.

Язык OWL обладает двумя видами понятий: классами и свойствами, что роднит их с теорией композициональности Фреге: значение выражение есть функция значений его компонентов и способа их связей. Как свойство языка это легло в основу онтоинженерии ABBYY Compreno, а вот как методологический прием анализа литературных или публицистических произведений он может использоваться в качестве Digital Humanities. Для этого можно сфокусироваться на контекстуальной интерпретации: предложения обретают смысл контекстуально, исходя из значения предложений в которые входят. Причем можно пойти еще дальше и анализировать все случаи контекстуального употребления. В случае филологии мы можем использовать пространство литературоведческих фактов с целью максимально адекватного отражения реальности и экземплификации нетривиальных связей между классами.

Для нашей цели мы используем роман «Москва-Петушки» Венедикта Ерофеева как достаточно веховое произведение советской эпохи, исходя, главным образом из двух соображений.

Мемуаристы свидетельствуют, что уже не герой, а автор Ерофеев обладал тягой к ненормативному классификаторству:

"Помню, например, длиннейший список нормальных температур диких и домашних животных, который он знал, как таблицу умножения (кошка? 37,8; лошадью…и т. п.) .

Каждое лето он вел дневник грибника. Возвратившись с добычей… он открывал записную книжку и, тщательно рассортировав находки и пересчитав каждую кучку, вносил в соответствующие графы (далее таблица, сколько в какой день найдено отдельно белых, подберезовиков, свинушек, лисичек и сыроежек.- В. К.).

В этой связи построение онтологии алкогольных напитков может стать своеобразной формой логического постмодернизма — рациональной реконструкцией личности писателя.

Другая, более существенная задача — это экземплификация гуманитарных знаний из произведения для изучения культуры повседневности в тех смыслах, в которых это понимает корпус дисциплин под общим названием Soviet studies. Мы попытаемся показать на примере онтологии алкоголя гипотезу Юркевича о двух типах отношений субъекта к советской реальности. С другой стороны, это и первый шаг к гипертекстовой энциклопедии знаний о повседневности.

В-третьих, это еще и способ построения базы знаний для литературных и журналистских ресурсов, которые, опираясь на ABBYY Compreno, как нам кажется, исходят из жесткой композициональной трактовки, а не контекстуальной, и не используя другие формулировки из других баз знаний, не обращая внимания на проблему непереводимости в духе Крипке и т.д.

В качестве материалов мы будем использовать текст источника+ работу «Энциклопедического словаря-справочника поэмы В.В. Ерофеева "Москва — Петушки» как пример подключения к онтологии дополнительных баз знаний.

Онтология классов и вхождений индивидов:

Выводы:

1) Венечка действительно парадирует большинство коктейлей — учитывая, что большинство напитков состоят всего из двух компонентов, его коктейли (множества) обладают большей мощностью. Частично — но только частично — это может быть интерпретировано как противопоставление народной культуры пития — официозной.

2) Контрафакт, который Венечка называет «Дерьмом» , исходя из дополнительных баз знаний, используется фрагментарно, и редко входит в состав большинства напитков, потребляемых главным героем.

3) Построенная онтология грешит разделением повторяющихся подклассов — большинство готовых напитков, не употреблялись в чистом виде, а исполосовывались в качестве готовых ингредиентов. Потребление в чистом виде готовых образцов промышленного производства отвергалось, предпочитая смешиваемость напитка, как подлинно «народный» стиль.

4) Концепция добавки и основы в духе Леви-Стросса и его структуралистких пассажей о приправе и основном блюде.

В конце концов, Стефан Хейсбруггер прав — онтология, это просто инструмент, и выбор онтологии должен задаваться прагматическими задачами.

P. S.: Рисовал в Protégé — этаком недо-UML. Вообще, думаю, что рисовать архитектуру текста основываясь только на семантике — фигня. Нужно как-то прописать иллокутивную силу, мб при помощи анализа общности и изменчивости как в объектно-ориентированном программировании.

Subscribe to our channel in Telegram to read the best materials of the platform and be aware of everything that happens on syg.ma
panddr
Vitaliy Bolataev

Author

Building solidarity beyond borders. Everybody can contribute

Syg.ma is a community-run multilingual media platform and translocal archive.
Since 2014, researchers, artists, collectives, and cultural institutions have been publishing their work here

About