news-img

2022-08-20 15:18

Набор данных Mozilla Common Voice вырос на 30% и достиг 87 языков

Поделиться в:

Mozilla Common Voice — это инициатива с открытым исходным кодом, направленная на то, чтобы сделать голосовые технологии более инклюзивными. Участники жертвуют речевые данные в общедоступный набор данных, который затем любой может использовать для обучения голосовой технологии. Голосовые технологии больше не являются прерогативой умных динамиков — доступ к банковским услугам, государственным службам и медицинским технологиям все чаще осуществляется с помощью голоса. Если мы хотим, чтобы никто не был забыт, такие проекты, как Common Voice, необходимы.

Common Voice 8 — это самый разнообразный многоязычный корпус открытой речи в мире. Это крупнейший выпуск благодаря растущему, преданному сообществу и многоотраслевым ресурсам таких партнеров, как Gates, NVIDIA и GIZ. Сейчас это 18 000 часов и 13 миллионов голосовых клипов, полностью созданных более чем 200 000 добровольцев по всему миру.

Новые языки в Common Voice 8 включают игбо, маратхи, датский, норвежский нюнорск, центральнокурдский, малаялам, суахили, эрзянский, мокшанский, македонский и сантали (ол чики).

Наши сообщества участников по всему миру сотрудничали, вдохновляли и поддерживали людей в наших усилиях по краудсорсингу, чтобы сделать этот набор данных возможным. Каждый участник предлагает уникальную и живую точку зрения на свой языковой опыт и культурный контекст.

В рамках этого выпуска набора данных мы хотели бы выделить вклад; представителям Common Voice Language, Крису Чиненье Эмезуэ, Джоан Монтане и Нарту за исключительные усилия по сбору приговоров в рамках процесса CC0, Бюленту Оздену за создание сообщества для турецкого сообщества и Стефании Делепрете за их усилия по защите общего голоса. Мы также хотели бы поздравить узбекскую, лугандскую, сербскую, хауса, белорусскую и абхазскую общины с их удивительным ростом.

Такие партнеры, как NVIDIA, используют данные для поддержки интересных инновационных проектов с открытым исходным кодом. Ученый-исследователь Виталий Лаврухин говорит: «Последняя версия Mozilla Common Voice — отличная вещь для исследовательских сообществ. Данные по-прежнему являются основным компонентом моделей автоматического распознавания речи NeMo с открытым исходным кодом NVIDIA, и мы поздравляем команду со значительным расширением набора данных. NVIDIA также выпустит сценарии предварительной обработки данных в NeMo, чтобы облегчить воспроизводимость исследований».

Совместная поддержка Фонда Гейтса, GIZ и FCDO в растущих цифровых инновациях для решения проблемы неравенства в Восточной Африке с помощью голосовых инноваций также приносит свои плоды, поскольку суахили достиг 500 часов за несколько месяцев. Это стало возможным благодаря работе замечательных участников сообщества британцев Мвасару (Кения) и Ребекки Рьякитимбо (ДРК/Танзания) и специалиста по машинному обучению Кэтлин Симинью (Кения).

Вы можете скачать набор данных Common Voice здесь бесплатно.

По теме

247128a7-edd7-48be-aab8-d621d7d037e3

MITC, IT Park и ПРООН в Узбекистане организуют хакатон «Voice AI Challenge Uzbekistan»

24-26 декабря 2021 года в университете Inha в Ташкенте состоится хакатон «Voice Ai Challenge Uzbekistan», организованный Министерством по развитию информационных
f4151122-ba6a-4bb9-8dc8-7c20e6f160d3

Победители хакатона «Voice Ai Challenge Uzbekistan»!

С 24 по 26 декабря текущего года в университете INHA в Ташкенте прошёл хакатон «Voice Ai Challenge Uzbekistan», организованный Министерством
6c07bd88-9662-423f-9da1-b7a69198c163

🏕 Завершился и проект «Voice-Camp», организованный в рамках марафона «UzbekVoice»!

Из 8000+ заявок, поданных на участие в лагере, было отобрано 150 участников из разных регионов нашей республики.

С 12:00 21 октября

По теме