The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Обновление голосовых данных Mozilla Common Voice 18.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от opennews (ok), 23-Июн-24, 00:51 
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением  объём речевого материала в коллекции увеличился с 31.1 до 31.8 тысяч часов речи, из которых 20.8 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 124 до 129 (добавлены языки африканских племён коса, календжин, кидавида, долуо и тсвана)...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=61422

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Обновление голосовых данных Mozilla Common Voice 18.0"  –5 +/
Сообщение от Константавр (ok), 23-Июн-24, 00:51 
>русского языка - 3241 участник и 277 часов

Что-то мало. Чувствуется, что указа свыше небыло.

Ответить | Правка | Наверх | Cообщить модератору

16. "Обновление голосовых данных Mozilla Common Voice 18.0"  +3 +/
Сообщение от Анонус (?), 23-Июн-24, 09:37 
Для русского уже есть отличные модели распознавания речи. Поэтому мало интереса к развитию новых. А вот для разных малых языков пока потребность в датасетах и моделях есть.
Ответить | Правка | Наверх | Cообщить модератору

17. "Обновление голосовых данных Mozilla Common Voice 18.0"  –1 +/
Сообщение от Аноним (17), 23-Июн-24, 13:52 
Английский очень малый язык.
Ответить | Правка | Наверх | Cообщить модератору

22. "Обновление голосовых данных Mozilla Common Voice 18.0"  +2 +/
Сообщение от Анонус (?), 23-Июн-24, 18:13 
> Английский очень малый язык.

Интересно, а шотландцы понимают ямайцев?

Ответить | Правка | Наверх | Cообщить модератору

18. "Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от Васян из васяна (?), 23-Июн-24, 17:09 
какие?
Ответить | Правка | К родителю #16 | Наверх | Cообщить модератору

21. "Обновление голосовых данных Mozilla Common Voice 18.0"  +2 +/
Сообщение от Анонус (?), 23-Июн-24, 18:12 
> какие?

https://alphacephei.com/nsh/2024/04/14/russian-models.html

Ответить | Правка | Наверх | Cообщить модератору

24. "Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от Аноним (24), 25-Июн-24, 18:20 
это все про распознавание, а как с синтезом?
Ответить | Правка | Наверх | Cообщить модератору

25. "Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от Аноним (24), 25-Июн-24, 18:22 
внезапно, лучшая моделька с этой страницы натренирована на Common Voice
Ответить | Правка | К родителю #21 | Наверх | Cообщить модератору

26. "Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от Аноним (24), 25-Июн-24, 18:32 
(окей, внезапно ещё и на своем новом открытом датасете)
Ответить | Правка | Наверх | Cообщить модератору

23. "Обновление голосовых данных Mozilla Common Voice 18.0"  +1 +/
Сообщение от Аноним (24), 25-Июн-24, 18:19 
модели "есть", все среднего качества кроме закрытых коммерческих (например, яндексовых или тинькова), а открытых качественных датасетов - нет
Ответить | Правка | К родителю #16 | Наверх | Cообщить модератору

27. "Обновление голосовых данных Mozilla Common Voice 18.0"  –1 +/
Сообщение от Аноним (24), 25-Июн-24, 18:33 
(ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса)
Ответить | Правка | Наверх | Cообщить модератору

28. "Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от Анонус (?), 25-Июн-24, 19:41 
> (ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса)

А ведь есть еще VK, ЦРТ, Наносемантика, Silero, МТС. Так еще и многие иностранные системы ASR поддерживают русский.

Ответить | Правка | Наверх | Cообщить модератору

29. "Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от Бывалый Смузихлёб (ok), 26-Июн-24, 15:38 
сбер, яндекс.. да тот же билайн - раскалёнными кочергами по голым задам хреначить надо за их "успехи". Те проблемы, что ещё 10-15 лет назад решались за 0,5-1мин с оператором - нынче решаются за 10-15-30 мин с "ИИ" и огромной горой потраченных нервов
За подобное уже надо бы вводить статью

"предлагаю вам ознакомиться со справкой.. "( а с хрена ли тогда звонок, если "справка" его не покрывает и надо решить лично !? )

Ответить | Правка | К родителю #27 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру