|
|
|
4.16, arisu (ok), 07:55, 01/06/2012 [^] [^^] [^^^] [ответить] [п©Б∙╗ п©Б∙╙п©Б∙╛п©Б∙╒п©Б∙ёя▐Б■─п©Б∙÷я▐Б■▄п©Б∙╛я▐Б■─я▐Б■░]
| +/– |
а что, аудиокниги у нас уже стали кодировать спецкодеками для речи? круто.
ты, конечно, не читатель, поэтому успешно не прочитал про то, что "универсальные" кодеки при таких частотах вполне предсказуемо косячат. и не читай, а то чересчур умным станешь, а это нынче не принято.
| |
|
5.20, dwefdewf (?), 01:14, 04/06/2012 [^] [^^] [^^^] [ответить] [п©Б∙╗ п©Б∙╙п©Б∙╛п©Б∙╒п©Б∙ёя▐Б■─п©Б∙÷я▐Б■▄п©Б∙╛я▐Б■─я▐Б■░]
| +/– |
>ты, конечно, не читатель, поэтому успешно не прочитал про то, что "универсальные" кодеки при таких частотах вполне предсказуемо косячат. и не читай, а то чересчур умным станешь, а это нынче не принято.
ну вот ты и читай, недаром великий Мао сказал - чем больше читаешь, тем глупее становишься. какое отношение частота дискретизации имеет к любым кодекам вообще? лучше подумай на досуге, дай клаве отдохнуть то
| |
|
6.22, arisu (ok), 08:44, 04/06/2012 [^] [^^] [^^^] [ответить] [п©Б∙╗ п©Б∙╙п©Б∙╛п©Б∙╒п©Б∙ёя▐Б■─п©Б∙÷я▐Б■▄п©Б∙╛я▐Б■─я▐Б■░]
| +/– |
я так понимаю, это тот же самый персонаж. возьми себе ник «ёжик», тогда «я не обгадился» будет выглядеть органичней.
то, что изначальный камент был сформулирован глупо — факт. впрочем, из него просто выходит, что поциент путает (возможно, намеренно) частоту дискретизации и stream bandwith. но даже это не важно, потому что «универсальные» кодеки вполне предсазуемо косячат на звуке, оцифрованом с низкой частотой.
но ты продолжай ничего не читать, ведь чем меньше знаешь — тем удобней Вещать.
| |
|
|
|
|
2.12, Аноним (-), 18:08, 31/05/2012 [^] [^^] [^^^] [ответить] [п©Б∙╗ п©Б∙╙п©Б∙╛п©Б∙╒п©Б∙ёя▐Б■─п©Б∙÷я▐Б■▄п©Б∙╛я▐Б■─я▐Б■░]
| +9 +/– |
> Это как? Или тут особая акустическая магия.
Именно так. Для голоса традиционно используются кодеки способные загонять его в очень узкий поток (единицы-десятки килобит/сек) путем продвинутой обработки, но для музыки такие кодеки не подходят, поскольку их работа (в т.ч. отбрасывание избыточности) сильно завязана на то как происходит произношение слов человеками, их восприятие и использование этих особенностей, так что для достаточно правдоподобно звучащей реконструкции достаточно небольшого объема информации. Музыка не попадает в эти принципы, поэтому качество передачи музыки таким кодеком в результате получается ниже всякой критики - там будет вопиюще заметно что это совсем не то же самое что и оригинал, т.к. принципы реконструирвоания сигнала ориентированные на голос неважно работают для музыки. Типовые примеры: speex, iLBC, AMR, и прочие "голосовые" кодеки.
Для музыки и просто "звуковых дорожек" используются более качественно звучащие и универсальные кодеки, которым не принципиально - голос там или музыка или что-то еще (mp3, vorbis, aac, ... ). Но у них есть свои проблемы. Используется более генеральная модель того как двуногие слышат (без допущений что это именно голос) и отброс того чего они по идее слышать не должны. Поэтому им не важно, музыка, голос или что там еще. Но это означает куда бОльший поток данных. Ни один из таковых кодеков не работает на единицах килобит с приемлимым качеством. Ни для голоса ни для музыки. На десятках килобит - потери ощутимы на слух. На сотне кбит и более - качество много лучше "голосовых" кодеков и приближается к lossless, при существенной (vs lossless) экономии потока.
Упомянутый кодек - попытка сделать нечто промежуточное, вытащив лучшие технологии и там и тут, чтобы и при низком битрейте в грязь лицом не падал при кодировании голоса, а на более высоких битрейтах - хорошо предавал не только голос но и все остальное. Этакий два-в-одном.
| |
|
3.23, ram_scan (?), 13:56, 12/06/2012 [^] [^^] [^^^] [ответить] [п©Б∙╗ п©Б∙╙п©Б∙╛п©Б∙╒п©Б∙ёя▐Б■─п©Б∙÷я▐Б■▄п©Б∙╛я▐Б■─я▐Б■░]
| +/– |
Направление магии в целом правильное. Но детали практически все мимо тазика.
Собственно в части кодирования как такового разница музыка/голос не особо принципиальна (психоакустические модели таки для речи попроще и в плане "отрезать лишнего" поэкстремальнее но речь щас не про то). Основная шляпа в речевом кодеке с поддержкой "музыки" - алгоритм детектирования пауз. То есть то что превосходно работает на человеческой речи на музыке путается, и находит паузы там где их нет. В итоге музыку (в частности music on hold) слышно "с дырками", а в особо тяжелых случаях бывает не слышно вовсе.
Для решения этой засады в кодеке есть костыль который называется "music detect", который определяет кодируется речь/не речь и при кодировании "не речи" умеет принудительно отключать voice activity detect.
Фича получается обратно совместимой, но музыка при этом не корежица.
| |
|
|
|