>ник User256 чем надпись "аноним"? Да, по крайней мере было бы понятно - один и тот же фрукт или разные. Ну и вообще было бы понятно что за фрукт, собственно. С анонимами несколько сложнее, хотя и удается их зачастую идентифицировать на основе их стиля, это несколько геморнее а потому добавляет несимпатий. Не говоря о том что большая часть анонимов как правило занимается только тем что срет, флеймит и троллит, не утруждая себя чем-либо полезным, поэтому нелестное мнение о нике аноним зачастую возникает "по умолчанию".
>Я там постом ниже написал про количество регистров 64-ных процов. их как
>бы не сильно меньше чем в армах.
Ну так я против х64 имею сильно меньше чем против классического 386, который, пардон, должен умереть. Ну не место этому ужасу в 21 веке. Как не место паровозам и паровым автомобилям в массовых перевозках пассажиров.
>Почитайте криса касперского на тему оптимизации,
Крис судя по его статься - достаточно специфичный чувак. Он не тупой, но я бы никогда не стал воспринимать его спич как истину в последней инстанции.
>я никогда не специализировался на оптимизации под проц,
Ну вот хотя-бы честно признались.
>у меня всегда были другие задачи, но общее представление
>имею и пущ/поп на амсе в который вы уперлись это не есть мега оптимизация,
Это один из примеров дебилизмов 386-й архитектуры. Кроме самого пуш-попа, знаете ли, еще например неравноправные регистры и прочая - тоже прикольно так. В итоге с такой системой команд опять же будет больще бесполезных перегрузок регистров. Просто потому что "вон тот регистр не позволяет сделать вот это". В этом плане большой регистровый файл дает кучу плюсов. Более того - если вы обратите внимание как делаются скоростные числокрушилки то заметите что как правило это все-таки набор равноправных регистров, да побольше, побольше. Даже интель в конце концов к этому всему пришел с своими MMX и далее. Правда как обычно сделал все через известное место. Т.е. как костыль, в своем фирменном стиле.
>а компилятор очень во многих случая генерит вменяемый код,
А вы его смотрели? Нет, иногда он конечно вменяем. Но иногда - там жесточайший трындец. Да, компилер может соптимизить. А может и бредом насрать в тугой цикл, что и происходит. Просадив его в 100500 раз, разумеется (в тугих циклах каждая лишняя команда - как нож в спину производительности, пардон). Собссно потому то и пишут критичные куски у кодеков и прочих чувствительных к скорости программ на асме: аккуратный кусочек асма работает намного быстрее чем бредятина выданная компилерм. С другой стороны - на портянке асма в мег у человека снесет крышу, он не сможет эффективно выделять регистры. А компилеру пофигу - он железный. В итоге большую программу писать на асме от и до - удивительно дурное занятие. Может так выйти что в сумме компилер еще и выиграет.
>а там где он невминяемый всегда можно посмотреть горячие точки профайлером
Кого-то мне это напоминает. Жабист? Дотнетчик? Это они любят аться с профайлерами вместо того чтобы сразу нормально задизайнить и накодить (на это большинства оных не хватает). В итоге разработка то у таких быстрая, зато потом долго зеленеют в профайлерах, пытаются разгрести баги ну и прочая знакомая фигня :). Потому что юзерье чертыхается на тормознутость, воет от зиллионов допекающих багов и прочая. Ну а общее впечатление от такого софта - понятно какое.
>и в большинстве случаев или переписать на С++ или уж в оставшихся 10 попросить
>колегу написать на асме замену,
Ну, как бы, логично.
>но в моей практике такое было 1 раз.
Есть ряд примеров когда это бывает надо. Поэтому растопырить пальцы с апломбом сказав что на асме не пишут конечно можно. Но чисто сишный xvid например здорово сливает его си+асм варианту. Достаточно для того чтобы быть невостребованным и неиспользуемым. А если что-то такое на managed языке переписать, понятно чего будет (еще в несколько раз тормознется). А например на форумах по компрессии чуть ли не первый совет который обычно получает интересующийся адгоритмами компрессии чувак - выбросить нафиг свои C# или яву и юзать си или плюсы. После чего его экспериментальная софтина начинает демонстрировать куда более вменяемые результаты и даже годится не только для того чтобы посмотреть на то как оно хорошо жрет ресурсы и тормозит, но и померяться с остальными своими параметрами :).
>А вообще самая правильная оптимизация подбор подходящего алгоритма
>и на данный момент со всеми "костылями и архаизмами"
>архитектура х86 запиливает всех по скорости общих вычилений.
А с кем сравнивалось то? И в каких условиях? А то даже у фороникса и прочих например тот же х64 заруливает х86 в ряде бенчей. При том процы - одинаковые, а команды в 64 битном режиме пухлее и указатели длиннее, что заведомо ставит х64 в невыгодные условия (больше тягать из тормозной памяти, меньше сущностей лезет в кеш, ...). С фига ли тогда на ряде тестов заруливание происходит? :)
>У меня стоит видеокарта радеон 4870 и она умеет считать в 100
>раз быстрее проца,
Насколько я понимаю, там пачка примитивных ядер с кучей регистров или что-то типа того (если честно, я не изучал архитектуру GPU в деталях).Т.е. опять же решение ну совсем не в духе х86 ни разу.
>хрен, даже сортировка масива уперается в проблему.
Ну, каждому свое. Хотя наверное сортировку массива при желании можно изобразить, особенно если он небольшой, но я не заморачивался вопросом вычислений на видяхах всерьез, честно говоря. А так - ну оно не для того делалось. ARMы собственно тоже не для того.
>целл у современных видиокарт как бы помягче выразиться, гпыль глотает в общем.
Да, но идея в конечном итоге - достаточно похожая. Системный CPU дирижирует пачкой простых но быстрых параллельно работающих числокрушилок.
>>слива производительности разумеется.
>Слива производительности по сравнению с 8-ми ядерным хеоном? или по сравнению с
>снапдарогоном?
По сравнению с более сложным ядром которому дали больше кеша в тех же услових.
>Кстати чем 512 кб кеша - это мало,
Оно не мало, но у современных десктопных процов его зачастую больше. Еще и само ядро обрезано. Как и количество ядер. Поэтому типичный современный десктопный проц рвет атомы на британский флаг как правило. В итоге атом - он не прямой конкурент арму а скорее что-то среднее между десктопными и тем более серверными тяжеловесами и мелкими армами.
>Ну короче вы вот сейчас реально тролите,
Скорее, едко констатирую факты. Все потуги интеля сделать Tablet PC (aka UMPC, aka MID, aka internet tablet) проваливались с треском потому что или уж мелкий девайс, или уж большая батарейка. Здоровый MID с ноутовой батареей - никому не нужен, а маленький будучи сделан на х86 высаживает акк в момент и ... правильно, кому нужен бесполезный кирпич?
>конечно тегра может и лучше
Вот это кстати хрен бы его там знает. На момент анонса оно было круто. А пока нвидия тупила с выпуском реальных продуктов, всякие фрискейлы, техасские инструменты и прочие тоже явно подтянулись.
>все отключать, тока смысл. считают то армы реально сейчас медленно.
Медленно - понятие относительное. Скажем есть такая характеристика как число MIPS на ватт. И вот по этому параметру большой вопрос кто кого. А в мобильных девайсах не катит считать быстро любой ценой. Надо считать побольше а жрать поменьше. И tradeoff-ы в итоге совсем иные получаются. И х86 нифига не рулит в таких устройствах в итоге.
>Ещё раз цел сос*т у современных видях,
Видяха + CPU по идее чем-то напоминает SPE + PPE у Cell, aren't they?
>Я так понимаю что если человек общается на уровне быдла из "соседнего
>крутого района" то его можно и счиать таким быдлом.
Это было за "ламера". Если называете ламером - так, блин, обосновывайте. Со знанием предмета. Если внятно и убедительно разжевать почему я дурак - я соглашусь с оным тезисом, если не найду нормальных контраргументов. А если просто вы%$нуться в мой адрес назвав меня ламером без вятного обоснования тезиса - ну, как бы, наивно ожидать что я буду тепло и вежливо общаться, а?