Ученые НГЛУ имени Добролюбова разработали модель для работы с узбекским языком на основе программы «Фразеоэкстрактор». Об этом сообщили в пресс-службе вуза.
По словам и.о. ректора Никиты Авралева, узбекский стал вторым после турецкого тюркским языком, с которым успешно справляется программа. Разработка не имеет аналогов. Представитель вуза отметил также, что Турция и Узбекистан являются стратегическими партнёрами Нижегородской области, а изучение этих языков – еще один шаг для укрепления сотрудничества.
Сейчас пользовательский интерфейс программы находится в стадии разработки. При этом студенты вуза, ученики лицея-интерната «Центр одаренных детей» и другие желающие могут получить от НГЛУ специальные коды для использования в онлайн-редакторе.
Никита Авралев заявил и о планах создать пользовательскую версию программы и продолжить дальнейшее внедрение новых языков.
Как уточнил сотрудник Научно-образовательного центра дизайна и проектирования инновационной среды дополнительного образования Максим Чиков, создание «Фразеоэкстрактора» стартовало в 2022 году и включало несколько этапов.
«Модель обработки узбекского языка создана нами с нуля, и сейчас необходимо создание большого набора данных – сначала 5000 слов, затем десятки тысяч и так далее – для ее точного функционирования», – сказал он.
Отметим, что программа «Фразеоэкстрактор» была создана для автоматизированного составления глоссариев из словосочетаний на базе текстов на русском, английском, немецком, французском, испанском, китайском, корейском, турецком и узбекском языках.
Ранее мы писали, что ученые ННГУ получили 65 патентов и свидетельств на инновационные разработки.