>> Основная фича ускорителя в основном куча SIMD-образных крушилок
> Грубо говоря основная фича в другой модели доступа к памяти, остальное детали. Вообще-то в случае ARM и интеграшек о которых мы тут - оно как раз вынуждено делить память и шину на двоих с системным процом.
И таки то что обычный DDR оптимизирован на вот именно то - не оптимально для GPU, зато так имлементация системы дешевле. И остается только мой пойнт - про массовый SIMD оптом. Круто, да?
> ЦП оптимизирован под случайный доступ, ГП под большие однообразные куски.
Да вот видите ли ARMовским GPU и прочим интеграхам приходится довольствоваться обычным системным DDRом как раз, оптимизированным на обычные процы. GDDR ему был бы лучше но кто ж ему его даст. Это верно только для дискреток с отдельной VRAM на отдельной шине. И конечно это сильно оптимальнее, поэтому дискретки и мощнее при прочих равных в разы, отдельная шина с отдельным бандвизом и оптимизацией на вон тот доступ. Но это денег стоит, чудес не бывает. А HBM на интерпозере еще круче. И еще дороже, ага. Делать "печатку" из кремния не дешево.
> В принципе с АПУ неплохо стало получаться последнее время, но там фактически две
> разные модели доступа на уровне контроллера ОЗУ разделяемые.
GPU намноооооооого более массовый SIMD чем системный проц. У него число операций за такт куда как больше, особенно в топовых штуках.
> Как-то это совместить идея неплохая, передавая доступ от ЦП к ГП и
> обратно, но сильно зависит от платформы...
Если это про шаринг памяти, у амд по своему эффектный фокус с zerocopy CPU <-> GPU есть на APU (интеграшках) дающий бонус относительно дискреток на PCIe. Но на фоне обычного DDR RAM на всю парочку вместо GDDR или HBM у GPU это все ни о чем. Вон то тоже не совсем безопасный фокус потому что маппинг 2 адресных пространств друг в друга и ессно под контролем софта, кто ж еще знает где там какие текстуры и проч и сколько этого надо в граммах. И лажа в тех маппингах конечно же достаточно чревата.
> Сони в своих консолях вообще неплохо сделала, было бы прикольно увидеть такое
> на стероидах в десктопах.
А у них там что-то особенное было? Там вроде GPU по сути радеон обычный.
> Но пока только в серверных решениях есть.
Что есть? Я пока самое мощное что видел это HBM память для GPU - и в десктопных было тоже. Разгоняет вон то, под крупные блоки, дофига, с 4096-битной то шиной, но - дорогое, и сильно не подешевеет. А для SoC соответственно избыточное очень.