2022-08-20 15:18
Mozilla Common Voice — это инициатива с открытым исходным кодом, направленная на то, чтобы сделать голосовые технологии более инклюзивными. Участники жертвуют речевые данные в общедоступный набор данных, который затем любой может использовать для обучения голосовой технологии. Голосовые технологии больше не являются прерогативой умных динамиков — доступ к банковским услугам, государственным службам и медицинским технологиям все чаще осуществляется с помощью голоса. Если мы хотим, чтобы никто не был забыт, такие проекты, как Common Voice, необходимы.
Common Voice 8 — это самый разнообразный многоязычный корпус открытой речи в мире. Это крупнейший выпуск благодаря растущему, преданному сообществу и многоотраслевым ресурсам таких партнеров, как Gates, NVIDIA и GIZ. Сейчас это 18 000 часов и 13 миллионов голосовых клипов, полностью созданных более чем 200 000 добровольцев по всему миру.
Новые языки в Common Voice 8 включают игбо, маратхи, датский, норвежский нюнорск, центральнокурдский, малаялам, суахили, эрзянский, мокшанский, македонский и сантали (ол чики).
Наши сообщества участников по всему миру сотрудничали, вдохновляли и поддерживали людей в наших усилиях по краудсорсингу, чтобы сделать этот набор данных возможным. Каждый участник предлагает уникальную и живую точку зрения на свой языковой опыт и культурный контекст.
В рамках этого выпуска набора данных мы хотели бы выделить вклад; представителям Common Voice Language, Крису Чиненье Эмезуэ, Джоан Монтане и Нарту за исключительные усилия по сбору приговоров в рамках процесса CC0, Бюленту Оздену за создание сообщества для турецкого сообщества и Стефании Делепрете за их усилия по защите общего голоса. Мы также хотели бы поздравить узбекскую, лугандскую, сербскую, хауса, белорусскую и абхазскую общины с их удивительным ростом.
Такие партнеры, как NVIDIA, используют данные для поддержки интересных инновационных проектов с открытым исходным кодом. Ученый-исследователь Виталий Лаврухин говорит: «Последняя версия Mozilla Common Voice — отличная вещь для исследовательских сообществ. Данные по-прежнему являются основным компонентом моделей автоматического распознавания речи NeMo с открытым исходным кодом NVIDIA, и мы поздравляем команду со значительным расширением набора данных. NVIDIA также выпустит сценарии предварительной обработки данных в NeMo, чтобы облегчить воспроизводимость исследований».
Совместная поддержка Фонда Гейтса, GIZ и FCDO в растущих цифровых инновациях для решения проблемы неравенства в Восточной Африке с помощью голосовых инноваций также приносит свои плоды, поскольку суахили достиг 500 часов за несколько месяцев. Это стало возможным благодаря работе замечательных участников сообщества британцев Мвасару (Кения) и Ребекки Рьякитимбо (ДРК/Танзания) и специалиста по машинному обучению Кэтлин Симинью (Кения).
Вы можете скачать набор данных Common Voice здесь бесплатно.
2021-11-19
2021-12-27
2022-11-16