К программе
Доклад·22 мая · 12:00–13:00ИИLLMМашинное Обучение
Русские омографы: от мемов до задач, которые пока не под силу LLM
О чём доклад?
Омография, или фонетическая неоднозначность, — неотъемлемая часть языка. Она лежит в основе шуток, мемов и народного творчества (вспомним, например, фразу «У страха глаза велики», которую в шутку изображают с велосипедами). Для систем синтеза речи разрешение этой неоднозначности — серьёзный вызов: даже носители языка не всегда угадывают верное ударение по контексту, а алгоритмы тем более. В докладе разберём четыре типа омографов в русском языке и выясним, как контекстные эмбеддинги в связке с логистической регрессией справляются с каждым из типов неоднозначности.
Кому будет полезно?
Разработчикам TTS и голосовых помощников, NLP-инженерам и всем, кто хочет понять, почему боты часто путаются в произношении.
Ещё на конференции
ИИ22 мая · 11:00
Гибкий и безопасный ML "вслепую": как построить MLops-систему в условиях On-Premise и Zero-Data-Access

Игорь Кабанов
ИИ21 мая · 13:00
Фреймворк агентизации бизнес-процессов на примере аутрича

Дмитрий Дружин
Облака21 мая · 11:00
JWT в геораспределённой архитектуре: аутентификация пользователей веб-консоли мультирегионального облака

Никита Трунов