Мы редуцировали искусство и медиа до языковых моделей и напечатали их диалог на принтере. Зачем?

Ксюша Тихомирова
20:02, 14 мая 2021
Добавить в закладкиДобавить в коллекцию
Image

Представим, что архив текстов — это способ смотреть на вещи — эдакая призма. Работа дает нам целых две оптики: со стороны медиа и со стороны теории искусства, — которые не только преломляют наблюдаемую реальность, но и смотрят друг на друга. Они как Мыслитель и Будда у Нам Джун Пайка, поставленные в ситуацию диалога через стекла кинескопов. Только медиа и искусство изначально наблюдают одно и то же, а замечают разное. Хотя, возможно, эти две точки зрения куда ближе, чем может показаться.

Через языковые модели мы смотрим на массив текстов упрощенно, собственно, как на модель. Сопоставляя же две языковые модели, мы можем узнать, насколько они родственны и где пересекаются. Чтобы не уходить совсем в абстракцию, это делается пословно. Таким образом, возможно сохранить коннотации и уйти в дальнейший качественный анализ (но пойдем ли туда, вот вопрос).

В работе используются две базы (наборы текстов): архив некоторых русскоязычных СМИ и архив Художественного журнала. С помощью слов из этих двух наборов и строится диалог.

Работа дает нам целых две оптики: со стороны медиа и со стороны теории искусства, — которые не только преломляют наблюдаемую реальность, но и смотрят друг на друга.

Диалог идет через декларацию сущностей. Никаких вопросов, никаких ответов: разговор получается, если собеседники совпали друг с другом изначально. То есть разговор строится на основе близости. Если в другой базе находится близкое слово, то оно выводится в ответ. Если в ответ тишина, то слово переводится в штрихкод, а разговор начинается заново.

Image

Семантическая близость, по сути, означает, насколько слова близки по смыслу. База ХЖ и база медиа переводятся в корпуса, где слова представляются в виде векторов. Чтобы вычислять близость слова из одного корпуса в другом, слово должно присутствовать в обоих. В Калькуляторе семантической близости можно вводить слова и посмотреть, как это работает на корпусе русского языка. Например, слова король и королева соотносятся с собой так же, как мужчина и женщина.

Баркод после ряда пословного сравнения представляется финальным ответом: что это слово означает в мире искусства и мире медиа. Однако, архив — это не просто база штрихкодов, художник — не только их считыватель. Знание должно оставаться свободным.

Однако, архив — это не просто база штрихкодов, художник — не только их считыватель. Знание должно оставаться свободным.

Еще пара слов

Этот проект не был бы возможен без:

• библиотеки corus, в которой собрано очень-очень много текстов из русскоязычных медиа;

статьи на Хабре, где понятно описано, как подружить термопринтер с Linux;

статьи на Системном Блоке, которая объясняет, как обучать языковые модели;

• бесконечного списка других вещей, которые находятся в открытом доступе, и людей, которые их создают и делают доступными.

Подпишитесь на наш канал в Telegram, чтобы читать лучшие материалы платформы и быть в курсе всего, что происходит на сигме.
Добавить в закладки