На днях компания AMD выпустила первый чип на базе микроархитетуры Bulldozer. Выпуск решения в пресс-релизе назван «новой вехой в развитии архитектуры x86», и такая высокопарность действительно имеет под собой серьезные основания. Bulldozer (акцент в названии — на способности бульдозеров единовременно перемещать значительные порции материала) — это новая микроархитектура AMD, сменяющая текущую K10.
Если проследить историю архитектурной конкуренции в сегменте x86, ситуация такова. Весьма удачная разработка AMD K8 очень достойно смотрелась на фоне тогдашней NetBurst от Intel. Впоследствии лидер отрасли перешел к архитектуре Core, которая по многим параметрам, как говорится, «делала» и K8, и пришедшую ей на смену K10. Как бы ни строились модельные ряды, ценовая политика и бизнесы компаний, следует констатировать — все последние годы существовал ощутимый разрыв в удельной производительности на ядро между Core и K10.
AMD удавалось многое компенсировать за счет графической части платформы. Скажем, в текущем положении, при продвижении на рынок полноценных вариантов Fusion A на базе ядер K10 явно акцентируется возможность использования мощных интегрированных GPU Radeon в целях поддержки слабоватых ядер CPU. В серверной же области компании приходилось активно играть с позиционированием уже на уровне системы, предлагая четырехсокетовые решения в качестве конкурента двухсокетовым Xeon.
Ныне выходит Bulldozer. Тесты мы увидим позднее. Но уже ясно одно — AMD явно собирается улучшить конкурентное положение в отношении именно базовых вычислительных модулей x86. Это, во-первых, позволит ему воспрять на фактически утерянном (по крайней мере в сравнении со временами K8) рынке серверов, во-вторых, еще сильнее продвинуться в области высокопроизводительных ПК, где теперь компания обладает не только высоконкурентными блоками GPU, но и CPU.
Главной особенностью новой микроархитектуры является недвумысленный акцент на параллелизм исполнения потоков. Если совсем уж в грубом приближении — AMD реализовал что-то типа аппаратной реализации гиперпоточности. При более низкой частоте процессор способен исполнять за такт большее количество инструкций. В процессоре 8 исполнительных целочисленных конвейеров в сравнении с
Дмитрий Шульгин, аналитическая компания ITResearch