Ученые ВятГУ разрабатывают и исследуют глубокие русскоязычные нейросетевые модели

Новости 13:59, 16 мая 2024 415 0

Создание передовых программных систем в области машинного обучения и искусственного интеллекта – актуальная задача современной науки, решение которой открывает новые перспективы в различных областях жизни и экономики


Проблемы, возникающие в процессе разработки ПО, помогают разрешать ученые Вятского государственного университета. Они разработали метод автоматической управляемой генерации русскоязычного текста, который будет содержать доводы для желаемой точки зрения, на основе существующих текстов.

- На сегодня существует несоответствие между потребностью широкого круга пользователей в программных инструментах, позволяющих оперативно находить и раскрывать аргументы по заданной точке зрения, и отсутствием таких систем аргументационной поддержки. Эта проблема недостаточно исследована для русского языка, в отличие от существующих работ, в которых исследования проводятся только для английского языка, - рассказал руководитель проекта, профессор кафедры прикладной математики и информатики Института математики и информационных систем ВятГУ, доктор технических наук Евгений Вячеславович Котельников .

  - Наше исследование было направлено на решение проблемы автоматической управляемой генерации текстов на естественном языке, содержащих аргументы, поддерживающие или опровергающие заданную точку зрения относительно определенного целевого объекта. 

В ходе реализации проекта ученые создали три глубоких нейросетевых модели. Модель ArgBERT позволяет классифицировать тексты на три класса:

«аргумент за», «аргумент против» и «не является аргументом». Модель AspBERT дает возможность извлекать аспекты аргументации из текстов. Модель ArgGPT-3 делает управляемую генерацию аргументативных предложений. Все эти модели планируется предоставить в общий доступ. Ученые также сделают общедоступными созданные ими размеченные текстовые корпуса аспектов аргументации и пар «управляющая последовательность – предложение».

Созданный метод автоматической управляемой генерации русскоязычного текста, содержащего аргументы – это не только вклад ученых ВятГУ в развитие теоретических основ генерации аргументационных текстов за счёт разработки и исследования новых нейросетевых моделей. Метод может быть использован на практике для аргументационных текстов в научных исследованиях, журналистике, юриспруденции, образовании, диалоговых системах и в других сферах.

Исследование выполнено за счет гранта Российского научного фонда № 22-21-00885.

"*" - фото сгенерировано нейросетью