Числодробилки с частотами за 2ГГц
Последний процессор от Intel - P4 и вы все это прекрасно знаете.
Но знаете ли вы в чем его принципиальное отличие, почему он настолько
быстр?
4-й пень не унаследован от от третьего, он разработае с нуля, а потому
отличается от предшественников радикально, а архитектира его носит гордое
имя NetBurst.
Гиперконвейерная архитектура.
Пень 4 имеет просто огромный, по сравнению со своими отцами конвеер.
Он у него составляет аж 20 стадий(у третьего пня было 10).
Именно поэтому новый процессор способен работать на новых частотах.
Обьясняется это так, если последовательность исполнения команды разбита
на более мелкие этапы, то каждый из них процессор сможет выполнить
быстрее. Но, такой конвеер имеет недостаток в конструкциях условных
переходов. Т.е. при ошибке в прогнозе на переход, из-за длинного
конвеера процессор будет долго простаивать, ожидая пока конвеер очистится.
Но разработчики заявляют, что 4-й пень ошибается на треть меньше третьего.
Таким образом за высокие частоны Pentium 4 расплачивается простоями.
Кэш трасировки исполнения.
Пень 4 отличается от своих Х86 совместимых собратьев уникальностью
организации кэша. Р3 и Атлон используют первую половину кэша для хранения
инструкций, а вторую для данных. Обьем кэша у них соответственно 16 и 64К.
У Р4 лишь 8Кб. А все потому, что новый процессор не хранит инструкции в
кэше первого уровня. Вместо этого он складирует уже декодированный код
в новом кэше трасировки исполнения. Т.е. Р4 хранит лишь готовые к
исполнению микрооперации. Таким образом исполнительные устройства не
ждут декодера(основная проблема для атлона и Р3). Помимо того пропускная
способность кэша второго уровня увеличена вдвое.
Механизм ускоренного выполнения.
Новый пентиун имеет два АЛУ (арифметико-логические устройства), они
работают параллельно, что значительно повышает производительность.
АЛУ отвечают за элементарные математические вычисления. При этом сложные
операции (умножение) АЛУ вычисляют на частоте процессора, а простые
(сложение/вычмтание и логические) на удвоенной частоте. Т.е. если
процессор имеет 2ГГц, то АЛУ работают аж на 4ГГц!!!
SSE2
Набор процессорных команд SSE дебютировал вместе с третим пнем, в
четвертом же он значительно расширен(к 70 старым добавили 144 новых).
Новые SIMD-инструцции позволяют работать с двумя парами вещ. чисел
с двойной точностью и целочисленныими операндами длинной от одного
до 16 байт. SSE же могла обрабатывать за раз лишь четыре пары вещ.
чисел с одинарной точностью.
Системная шина.
Помимо нового ядра четвертый пень имеет и оригинальную шину. Она
отличается возможностью передавать данные четыре раза за такт. Так,
работая даже на частоте в 100МГц она сможет передавать 3,2 Гб/с.
Атлон, с его знаменитой EV6 шиной работает в два раза медленне.
Но шина будет простаивать, если память не будет за ней успевать.
И тут для четвертого пентиума есть вариант: либо дорогая Rim память
либо дешовая, но мене быстрая DDR память.У RDRAM пропускная
способность достигает 3,2 Гб/с, у DDR порядка 2Гб/с.
Первый Р4 был совместимых только с RDRAM имел разъем socket 423
(частота до 2ГГц). Затем частота процессоров перешла границу в 2ГГц
и появился новый разьем socket 478(свыше 2ГГц). К тому же материнки
под socket 478 ориентированны уже на DDR память.