МОСКВА, 13 мая. /ТАСС/. Специалисты Московского государственного университета им. М. В. Ломоносова разработали мультиязычную нейросеть для научных электронных библиотек, которая позволяет быстрее находить близкие по смыслу публикации с результатами исследований. Об этом сообщила пресс-служба МГУ.
Нейросеть SciRus-tiny внедрена в научную электронную библиотеку elibrary.ru. Теперь похожие публикации в ней можно искать не только по ключевым словам, точность подбора которых влияет на количество и содержание документов, но и по текстам самих статей.
«Нейросетевой поиск позволяет задать в качестве условия запроса аннотацию, полный текст научной статьи или даже подборки статей по интересующей тематике. Система автоматически подберет документы, максимально близкие по своей тематической направленности», — уточнил руководитель междисциплинарной группы проекта, заведующий кафедрой физического факультета МГУ Алексей Хохлов, чьи слова приводятся в сообщении.
Кроме функции поиска с помощью нейросети, пользователи библиотеки могут искать публикации по таким параметрам, как совместное цитирование, просмотр публикаций пользователями, состав авторов, дата выпуска статьи и другим.
«Важной для нас особенностью данной модели является ее мультиязычность, поскольку научная электронная библиотека содержит документы на различных языках. Также тестирование подтвердило высокую эффективность модели, что расширяет круг задач и приложений, где она может быть использована. В стадии разработки — применение нейросети для идентификации авторов в публикациях, тематической классификации научных статей, а также в новом интерфейсе расширенного поиска на elibrary.ru», — прокомментировал генеральный директор библиотеки Геннадий Еременко, чьи слова приводит пресс-служба МГУ.
Нейросеть была создана сотрудниками Института ИИ МГУ при поддержке портала elibrary.ru. Авторы также опубликовали нейросеть в интернете, открыв доступ для всех пользователей.
О библиотеке
Библиотека elibrary.ru — крупнейшая в России база научных публикаций, интегрированная с Российским индексом научного цитирования. Платформа была создана в 1999 году по инициативе Российского фонда фундаментальных исследований (в 2022 году преобразован в Российский центр научной информации). Согласно данным на сайте проекта, сегодня пользователям портала доступны рефераты и полные тексты более 38 млн научных публикаций и патентов, в том числе электронные версии более 5,6 тыс. российских научно-технических журналов. Общее число зарегистрированных организаций — более 2 800, индивидуальных пользователей — 1,7 млн, представляющих 125 стран.