The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Опубликована открытая AI-модель hertz-dev для полнодуплексного голосового общения"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Опубликована открытая AI-модель hertz-dev для полнодуплексного голосового общения"  +/
Сообщение от opennews (??), 04-Ноя-24, 13:16 
Компания Standard Intelligence объявила о публикации hertz-dev, первой открытой AI-модели  для синтеза речи в полнодупексном режиме, которая может использоваться в качестве основы для создания систем голосового общения в реальном времени или генерации разговорной речи. Модель позволяет генерировать речь,  близкую к голосовым данным, на которых она обучена, и  обеспечивая взаимодействие в стиле живого человеческого общения без задержек, напоминающих прерывистый телефонный разговор. Наработки проекта распространяются под лицензией Apache 2.0...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=62170

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  –3 +/
Сообщение от Аноним (1), 04-Ноя-24, 13:16 
Странно, что в примере такое мощное оборудование. Кто-то будет покупать RTX 4090 только для того, чтобы с нейросетью общаться голосом? (А ещё нужно оборудование под нейросеть с которой происходит общение).
Мне кажется, основное целевое оборудование подобных нейросетей это смартфоны
Ответить | Правка | Наверх | Cообщить модератору

2. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +6 +/
Сообщение от Аноним (2), 04-Ноя-24, 13:21 
Теперь хоть не стыдно покупать RTX 4090 - "Это для... общения с нейросетями! Какие там игори..."
Ответить | Правка | Наверх | Cообщить модератору

8. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Аноним (8), 04-Ноя-24, 13:51 
Какое у него КПД денег? Вот, поэтому и стыдно.
Ответить | Правка | Наверх | Cообщить модератору

15. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Аноним (15), 04-Ноя-24, 14:20 
Среди не специализированных ускорителей лучшее. Та же 4070 для им уже не подходит от слова ваше совсем.
Ответить | Правка | Наверх | Cообщить модератору

10. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +8 +/
Сообщение от Аноним (10), 04-Ноя-24, 14:05 
> такое мощное оборудование

RTX 4090 -- далеко не мощное оборудование, когда речь про нейросети. Для игор -- мощное. Для нейронок -- это игрушечный набор доктора для ребенка дошкольного возраста. Посуди сам: 24 гига видеопамяти. Это совершенно ни о чем. Например, в 24 гига влезут лишь некоторые из общедоступных локально-запускаемых LLM.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

11. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Аноним (11), 04-Ноя-24, 14:15 
https://www.youtube.com/watch?v=RjRQ1DYnuJA
Ответить | Правка | Наверх | Cообщить модератору

12. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +4 +/
Сообщение от Аноним (15), 04-Ноя-24, 14:16 
Ещё Биль Гейтс говорил две 4090 хвататит всем.
Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

18. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Аноним (18), 04-Ноя-24, 15:11 
ага,
а Муртазин говорил что самсунг не откажется от комплектной зарядки.
ты действительно веришь всему, что пишется в интернете?
Ответить | Правка | Наверх | Cообщить модератору

19. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (15), 04-Ноя-24, 15:14 
Муртазин и айпад называл разъевшейся фоторамкой. Которая никому не нужна. Муртазин это вообще аналитика уровня Первый канал.  
Ответить | Правка | Наверх | Cообщить модератору

17. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Аноним (17), 04-Ноя-24, 14:54 
В Ryzen APU до 96 гб оперативы можно выделить под GPU. Хватит?
Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

32. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (32), 04-Ноя-24, 16:58 
> Хватит?

Нет конечно.

Ответить | Правка | Наверх | Cообщить модератору

47. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от crandel (ok), 04-Ноя-24, 23:11 
Свободно запускаю на интеле 11 поколения и 16 гиг рамы llama3.2 и gemma2 модели. Вполне подходит для всего, что нужно
Ответить | Правка | К родителю #10 | Наверх | Cообщить модератору

21. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Жорик (??), 04-Ноя-24, 15:26 
Она сможет вместо меня в конфе разговаривать?
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

46. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от YetAnotherOnanym (ok), 04-Ноя-24, 22:49 
Ну я же здесь могу.
Ответить | Правка | Наверх | Cообщить модератору

36. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +3 +/
Сообщение от Сижу на дебиан с крысой (?), 04-Ноя-24, 17:03 
Так это же оупенсорс. Просто нужно подождать пока какой-нибудь гугель сделает форк и загонит всё это дело в облако по подписке. Вот тогда хоть со смартфона, хоть с 4 пня.
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

39. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от погроммист (?), 04-Ноя-24, 17:41 
> Кто-то будет покупать RTX 4090 только для того, чтобы с нейросетью общаться голосом?

Ещё как будут! Рабочий час человека выйдет дороже, а рабочих мест всяких продажников-обзвонщиков миллион.

Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

52. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Я (??), 05-Ноя-24, 04:37 
для таких систем это ещё весьма слабое и дешёвое оборудование.. обычно там всё на кластерах побольше крутится
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

3. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +7 +/
Сообщение от Аноним (3), 04-Ноя-24, 13:25 
скоро (или уже) в ТП всех крупных компаний...
Ответить | Правка | Наверх | Cообщить модератору

4. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (4), 04-Ноя-24, 13:34 
Ну все телефонные мошенники, держитесь.
Ответить | Правка | Наверх | Cообщить модератору

20. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +2 +/
Сообщение от Аноним (15), 04-Ноя-24, 15:16 
Мощенники с помощью ИИ звонит жертве, а там тоже ИИ. Причём та же самая.
Ответить | Правка | Наверх | Cообщить модератору

5. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от бух. (?), 04-Ноя-24, 13:44 
Почему корпы так любят апач 2?
Ответить | Правка | Наверх | Cообщить модератору

37. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Сижу на дебиан с крысой (?), 04-Ноя-24, 17:06 
Потому что just works.
Ответить | Правка | Наверх | Cообщить модератору

6. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  –3 +/
Сообщение от Аноним (8), 04-Ноя-24, 13:49 
Очередная попытка запланированного устаревания.
Ответить | Правка | Наверх | Cообщить модератору

7. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Аноним (11), 04-Ноя-24, 13:50 
>в стиле живого человеческого общения

Почему то сразу думаешь, про то, кто будет это использовать...
Риски описаны:
https://en.wikipedia.org/wiki/Artificial_Intelligence_Act

Ответить | Правка | Наверх | Cообщить модератору

9. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +2 +/
Сообщение от Аноним (9), 04-Ноя-24, 13:58 
Человек редко отвечает на вопрос за 65мс, так что допустимо и секунда и две
Ответить | Правка | Наверх | Cообщить модератору

22. Скрыто модератором  –5 +/
Сообщение от 12yoexpert (ok), 04-Ноя-24, 15:48 
Ответить | Правка | Наверх | Cообщить модератору

30. Скрыто модератором  –3 +/
Сообщение от Аноним (-), 04-Ноя-24, 16:54 
Ответить | Правка | Наверх | Cообщить модератору

25. Скрыто модератором  +/
Сообщение от Ося Бендер (?), 04-Ноя-24, 16:11 
Ответить | Правка | Наверх | Cообщить модератору

43. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от ano (??), 04-Ноя-24, 21:12 
ужос. в приведённом в пример аудио файле - 20% воды, 40% пауз и эканий-мэканий, 20% поддакиваний, 20% ошибок, и никакой сути.
Ответить | Правка | Наверх | Cообщить модератору

44. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +3 +/
Сообщение от чатжпт (?), 04-Ноя-24, 22:09 
прямо как разговор со среднестатистическим человеком
Ответить | Правка | Наверх | Cообщить модератору

45. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  –1 +/
Сообщение от Full Master (?), 04-Ноя-24, 22:19 
Значит на 99% соответствует речи среднестатистического нормиса.
Ответить | Правка | К родителю #43 | Наверх | Cообщить модератору

49. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (49), 05-Ноя-24, 03:18 
Код и дока, как обычно, какое-то говно. Питоний пакет неструктурирован, а значит вообще неприменим для прода. В файле https://raw.githubusercontent.com/Standard-Intelligence/hert... на самом деле лежит код для embeddingа аудио в вектор. Модели - в формате pytorch, а не onnx, что опять неприменимо для прода. pytorch - это pickle, отличная вещь для малварщиков. safetensors они видимо намеренно не осилили. AS IS ведь.
Ответить | Правка | Наверх | Cообщить модератору

56. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Аноним (56), 05-Ноя-24, 09:43 
Ну питон впринципе неприменим для прода... В нормальном мире
В котором мы, увы, не живем
Ответить | Правка | Наверх | Cообщить модератору

50. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +/
Сообщение от Ананоним (?), 05-Ноя-24, 03:51 
Люди часто между собой не делают разговаривать, кому нужны будут эти говорящие роботы-болваны?
Ответить | Правка | Наверх | Cообщить модератору

51. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (51), 05-Ноя-24, 04:26 
Поскольку качается не очень быстро, сделал torrent-файлы для двух файлов моделей:

https://0x0.st/XGn1.torrent/inference_volcano_3.pt.torrent&n... - magnet:?xt=urn:btih:60798491cf14dbc48a49330da49b11142f9e1d26&xt=urn:btmh:1220e42c967b520fa653732aed8c4641c0de2052ab5091405fafc5761957a74711bc&dn=inference_volcano_3.pt&ws=https://ckpt.si.inc/hertz-dev/inference_volcano_3.pt
https://0x0.st/XGnM.torrent/inference_apatosaurus_95000.pt.t... - magnet:?xt=urn:btih:07aba0554f6ad8728bea6783d56857f19c02171d&xt=urn:btmh:1220892e966aed5f990f773a9af2664d0ebc339402c15882a4f018bd281ac0eb6654&dn=inference_apatosaurus_95000.pt&ws=https://ckpt.si.inc/hertz-dev/inference_apatosaurus_95000.pt


Пока не-веб сидеров недостаточно - магниты работать не будут. Остальные файлы ещё не скачались.

Ответить | Правка | Наверх | Cообщить модератору

53. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (51), 05-Ноя-24, 05:07 
https://0x0.st/XGn3.torrent/inference_care_50000.pt.torrent&... -     magnet:?xt=urn:btih:2312f271d607ca2e123ca743d91f0e41ea0ae19d&xt=urn:btmh:1220244c3d5924236d3e1b6c1a5f88094a29503b9253368f4a6e3f0799cd451274b1&dn=inference_care_50000.pt&ws=https://ckpt.si.inc/hertz-dev/inference_care_50000.pt
https://0x0.st/XGnx.torrent/inference_whip_72000.pt.torrent&... -     magnet:?xt=urn:btih:e90a258efe8ab546e117557c4112762e9138c58d&xt=urn:btmh:1220feea5879872f4e2d01db453975fb77af96008ee223fb4aacacb7e82479418021&dn=inference_whip_72000.pt&ws=https://ckpt.si.inc/hertz-dev/inference_whip_72000.pt
Ответить | Правка | Наверх | Cообщить модератору

54. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (51), 05-Ноя-24, 05:42 
https://0x0.st/XGnD.torrent/inference_scion_54000.pt.torrent... - magnet:?xt=urn:btih:24966fde5dfaa4faf157cf8cac5303e22863c4b2&xt=urn:btmh:1220f644e493b5e52cb7e60b4c2da125dabaf939d1424ff9bb679075032698361716&dn=inference_scion_54000.pt&ws=https://ckpt.si.inc/hertz-dev/inference_scion_54000.pt

https://0x0.st/XGnG.torrent/inference_caraway_112000.pt.torrent -  
magnet:?xt=urn:btih:892e281b1ce2ae4e6b4a03eaba550dd051970836&xt=urn:btmh:1220aa0110025f02e4d017be37a495ffdc36f0d72b151a855f0ae7c5ba044f8eac5d&dn=inference_caraway_112000.pt&ws=https://ckpt.si.inc/hertz-dev/inference_caraway_112000.pt

Ответить | Правка | К родителю #51 | Наверх | Cообщить модератору

55. "Опубликована открытая AI-модель hertz-dev для полнодуплексно..."  +1 +/
Сообщение от Аноним (55), 05-Ноя-24, 06:02 
https://0x0.st/XGn7.torrent/inference_syrup_110000.pt.torren...
Ответить | Правка | К родителю #51 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру