ДВФУ совместно с «Нейросети Ашманова» займутся оцифровкой русского языка.
В Школе цифровой экономики Дальневосточного федерального университета (ШЦЭ ДВФУ) создадут цифровой корпус русского языка для обучения машин, нейросетей и разработки синтетической личности на основе искусственного интеллекта. Проект реализуется в лаборатории машинного обучения ШЦЭ на базе магистерской образовательной программы «Искусственный интеллект и большие данные».
Одним из первых продуктов лаборатории станет цифровой менеджер – виртуальная синтетическая личность, способная поддерживать диалог с человеком на естественном языке и решать сервисные задачи.
Наша компания выступает техническим партнёром по машинному обучению и предоставляет технологию цифровой разметки материала для обучения нейросети. Перед нами стоит целый комплекс задач: от сбора аудио-корпуса до качественной разметки профессиональными лингвистами и специалистами по компьютерной лингвистике.
«Для развития алгоритмов искусственного интеллекта обучающие данные не менее важны, чем алгоритмы. Появление в прошлом десятилетии открытого корпуса из 14 млн. изображений ImageNet оказало большое влияние на развитие компьютерного зрения – исследователи и разработчики смогли создавать различные методы анализа данных и применять компьютерное зрение в реальных задачах. Вместе с ДВФУ мы сможем собрать «голосовой ImageNet», который продвинет исследования в области распознавания и синтеза речи в России и мире. Кроме того, мы постараемся собрать не только русские речевые корпуса, но и корпуса для языков малых народов России», - отметил Станислав Ашманов, генеральный директор «Нейросетей Ашманова».
Полный текст новости можно прочитать здесь.