Resurslar

Siz uchun nima muhimligini bilib oling

NVIDIA NeMo™

NVIDIA NeMo ™ zamonaviy suhbatdosh AI modellarini ishlab chiquvchi va avtomatik nutqni aniqlash (ASR), tabiiy tilni qayta ishlash (NLP) va matndan nutqqa sintez (TTS) ustida ishlaydigan tadqiqotchilar uchun ochiq manbali asboblar to'plamidir. NeMo ning asosiy maqsadi sanoat va akademiya tadqiqotchilariga oldingi ishlardan (kod va oldindan tayyorlangan modellar) qayta foydalanishda yordam berish va yangi suhbatdosh AI modellarini yaratishni osonlashtirishdir.

Batafsil
image
image
NVIDIA NeMo™

NVIDIA NeMo ™ zamonaviy suhbatdosh AI modellarini ishlab chiquvchi va avtomatik nutqni aniqlash (ASR), tabiiy tilni qayta ishlash (NLP) va matndan nutqqa sintez (TTS) ustida ishlaydigan tadqiqotchilar uchun ochiq manbali asboblar to'plamidir. NeMo ning asosiy maqsadi sanoat va akademiya tadqiqotchilariga oldingi ishlardan (kod va oldindan tayyorlangan modellar) qayta foydalanishda yordam berish va yangi suhbatdosh AI modellarini yaratishni osonlashtirishdir.

DeepSpeech

DeepSpeech - ochiq manbali o'rnatilgan (oflayn, qurilmada) nutqdan matnga o'tish mexanizmi bo'lib, u Raspberry Pi 4 dan yuqori quvvatli GPU serverlarigacha bo'lgan qurilmalarda real vaqt rejimida ishlay oladi. DeepSpeech loyihasi amalga oshirishni osonlashtirish uchun Google TensorFlow’dan foydalanadi. Oʻrnatish, foydalanish va oʻqitish modellari boʻyicha hujjatlar deepspeech.readthedocs.io sahifasida mavjud.

Batafsil
image
image
DeepSpeech

DeepSpeech - ochiq manbali o'rnatilgan (oflayn, qurilmada) nutqdan matnga o'tish mexanizmi bo'lib, u Raspberry Pi 4 dan yuqori quvvatli GPU serverlarigacha bo'lgan qurilmalarda real vaqt rejimida ishlay oladi. DeepSpeech loyihasi amalga oshirishni osonlashtirish uchun Google TensorFlow’dan foydalanadi. Oʻrnatish, foydalanish va oʻqitish modellari boʻyicha hujjatlar deepspeech.readthedocs.io sahifasida mavjud.

Coqui

Coqui ochiq nutq texnologiyasiga bag'ishlangan. Ularning loyihalari chuqur o'rganishga asoslangan STT va TTS mexanizmni o'z ichiga oladi. Matndan nutqqa o'tish bilan skriptdan ishlashning bevositaligini his eting. Yuqori sifatli, boshqariladigan, hissiyotli ovozlarning keng tanlovidan translatsiya qiling yoki ehtiyojlaringizga mos keladigan ovozni klonlang. Coqui bilan matndan nutqqa ishlab chiqarish vaqtlari bir necha oydan bir necha daqiqagacha boradi. STT modellarini o'rgatish va joylashtirish hech qachon bunchalik oson bo'lmagan.

Batafsil
image
image
Coqui

Coqui ochiq nutq texnologiyasiga bag'ishlangan. Ularning loyihalari chuqur o'rganishga asoslangan STT va TTS mexanizmni o'z ichiga oladi. Matndan nutqqa o'tish bilan skriptdan ishlashning bevositaligini his eting. Yuqori sifatli, boshqariladigan, hissiyotli ovozlarning keng tanlovidan translatsiya qiling yoki ehtiyojlaringizga mos keladigan ovozni klonlang. Coqui bilan matndan nutqqa ishlab chiqarish vaqtlari bir necha oydan bir necha daqiqagacha boradi. STT modellarini o'rgatish va joylashtirish hech qachon bunchalik oson bo'lmagan.

Community Playbook

Common Voice — butun dunyo boʻylab koʻngillilar ovoziga asoslangan ommaviy ovozli maʼlumotlar toʻplami. Ovozli ilovalarni yaratmoqchi bo'lgan odamlar ma'lumotlar to'plamidan mashinani o'rganish modellarini o'rgatish uchun foydalanishlari mumkin. Common Voice odatda til bo'yicha guruhlangan turli muhim sohalarda loyihani qo'llab-quvvatlaydigan ko'plab jamoalarga ega. Common Voice sayohati davomida mahalliylashtirishdan tortib maʼlumotlar toʻplamidan foydalanishgacha va hamjamiyatimiz bilan qanday bogʻlanish boʻyicha foydali koʻrsatmalarni toping.

Batafsil
image
image
Community Playbook

Common Voice — butun dunyo boʻylab koʻngillilar ovoziga asoslangan ommaviy ovozli maʼlumotlar toʻplami. Ovozli ilovalarni yaratmoqchi bo'lgan odamlar ma'lumotlar to'plamidan mashinani o'rganish modellarini o'rgatish uchun foydalanishlari mumkin. Common Voice odatda til bo'yicha guruhlangan turli muhim sohalarda loyihani qo'llab-quvvatlaydigan ko'plab jamoalarga ega. Common Voice sayohati davomida mahalliylashtirishdan tortib maʼlumotlar toʻplamidan foydalanishgacha va hamjamiyatimiz bilan qanday bogʻlanish boʻyicha foydali koʻrsatmalarni toping.

Nima uchun Common Voice?

Hozirgi vaqtda ovozli ma'lumotlar to'plamining aksariyati kompaniyalarga tegishli bo'lib, bu innovatsiyalarni to'xtatmoqda. Ovoz to'plamlari ingliz tilini bilmaydiganlarni ham kam baholaydi. Bu shuni anglatadiki, ovozli texnologiya ko'p tillar uchun umuman ishlamaydi va qaerda ishlayotgan bo'lsa, u hamma uchun birdek yaxshi ishlamasligi mumkin. Biz hamma joyda odamlarni o'z ovozlarini baham ko'rish uchun safarbar qilish orqali buni o'zgartirmoqchimiz.

Batafsil
image
image
Nima uchun Common Voice?

Hozirgi vaqtda ovozli ma'lumotlar to'plamining aksariyati kompaniyalarga tegishli bo'lib, bu innovatsiyalarni to'xtatmoqda. Ovoz to'plamlari ingliz tilini bilmaydiganlarni ham kam baholaydi. Bu shuni anglatadiki, ovozli texnologiya ko'p tillar uchun umuman ishlamaydi va qaerda ishlayotgan bo'lsa, u hamma uchun birdek yaxshi ishlamasligi mumkin. Biz hamma joyda odamlarni o'z ovozlarini baham ko'rish uchun safarbar qilish orqali buni o'zgartirmoqchimiz.