2023-04-03 18:09
Учитывая важность разработки набора текстовых и голосовых данных с открытым исходным кодом для узбекского языка, с целью создания справедливого и инклюзивного будущего для голосовых технологий, наша команда собрала этот набор данных при помощи телеграм-бота https://t.me/UzbekVoiceBot.
На сегодняшний день мы успешно собрали около 1000 часов высококачественного аудио и сопроводительного текста, которые все находятся в открытом доступе на Google Диске.
Наша команда надеется, что предоставление этого набора данных исследователям и разработчикам поможет в разработке передовых и точных инструментов распознавания речи и обработки естественного языка для узбекского языка.
2021-11-19
2021-12-27
2022-08-20