Обзор процессора AMD Athlon (Thunderbird) 800Наконец-то можно отметить, что процесс миграции кеша второго уровня с системной платы в процессорное ядро совершился. Казалось бы, еще совсем недавно все мы покупали Socket 7 материнские платы, стараясь выбрать такую, на которой L2-кеша установлено побольше, как теперь уже микросхем SRAM, на которых выполняется кеш второго уровня, не видно нигде. Промежуточный вариант, когда эти микросхемы устанавливались на процессорной плате, успешно преодолен. Сначала дешевые процессоры Intel Celeron стали обладать встроенным в ядро L2 кешем, затем Intel Pentium III, а теперь пришла очередь и AMD со своим Athlon. Почему же производители стали стремиться интегрировать L2-кеш в процессорное ядро? Это желание имеет как архитектурные, так и экономические причины. Ну с экономией все понятно. Поскольку отпадает необходимость в дополнительных микросхемах SRAM, процессор можно теперь делать без процессорной платы и без картриджа. Следовательно, упрощается сборка, да и лишняя зависимость от поставщиков-смежников, производящих PCB, SRAM и картриджи явно не на руку производителю процессоров. То есть, налицо как экономия на деталях, которых теперь меньшее количество, так и на процессе сборки. Что касается архитектуры, то первое преимущество, лежащее на поверхности, это возможность использования для кеша той же несущей частоты, что и для ядра процессора, так как теперь эти части находятся на едином кристалле. То есть, говоря обычным языком, в результате переноса L2-кеша внутрь ядра кеш может работать на частоте ядра. Как мы помним, в случае расположения кеша на внешней процессорной плате этот номер не проходил. У Athlon, в частности, максимальная скорость кеша была у 700-мегагерцовой модели, где L2-кеш работал на половинной частоте ядра, то есть на 350МГц. Дальше, с ростом скорости ядра, ситуация у обычных Athlon только ухудшалась, так как поставщики не смогли снабжать AMD более скоростными чипами SRAM. В результате, начиная с частоты 750 МГц Athlon стал снабжаться кеш-памятью, работающей на 2/5 частоты процессора, а начиная с частоты 900 МГц - и вовсе работающей на 1/3 частоты. В результате L2-кеш стал узким местом и тормозил дальшнейший рост производительности процессора. Еще один теоретический плюс расположения L2 кеша на одном силиконе с ядром заключается в том, что это позволяет сделать гораздо лучшую шину, связывающую L2-кеш с ядром. Действительно, разработчикам в этом случае гораздо легче соединить две вещи, расположенные рядом, чем раздумывать над синхронизацией сигналов и разводкой PCB для внешних микросхем SRAM. Яркой иллюстрацией этого тезиса может служить Intel Pentium III с ядром Coppermine, так как при переходе от внешнего L2-кеша ко внутреннему Intel расширил шину, соединяющую ядро и кеш аж в четыре раза - с 64 бит до 256 бит. Однако, возникает вполне резонный вопрос, почему же если интегрированный кеш второго уровня так выгоден, производители тем не менее использовали внешний кеш? Ответ несложен, достаточно взглянуть на минусы кеша внутри ядра. Ведь кеш-память - это дополнительные транзисторы, а значит перенос их внутрь ядра необратимо приведет к его росту, а следовательно к большим трудностям при выращивании такого кристалла, да и к его большему тепловыделению при работе. И вот тут-то все определяется технологией, используемой для производства. При применении 0.25 мкм техпроцесса внедрить L2-кеш в ядро было весьма проблематично по описанным выше причинам (сейчас мы не берем во внимание Celeron на ядре Mendocino - там сам кристалл и кеш был небольшой сам по себе и на ядро помещался без особых проблем). Но зато при переходе на производство CPU по технологии 0.18 мкм мечты разработчиков стали явью. L2-кеш объемом 256Кбайт стал легко помещаться на ядро, да так, что производители теперь заявляют о выходе годных кристаллов даже выше запланированного. Итак, взвесив все плюсы и минусы L2-кеша на ядре, AMD, как наверное и мы с вами, пришла к выводу о необходимости переноса кеша на ядро. Тем более, что оба завода AMD, находящиеся в Дрездене и Остине вполне успешно освоили технологию 0.18 мкм, по которой, кстати, некоторое время уже выпускались старшие модели обычных AMD Athlon. Так появился новый старый AMD Athlon с кодовым именем Thunderbird, архитектурно отличающийся от старого Athlon наличием интегрированной кеш-памяти второго уровня размером 256 Кбайт вместо внешнего 512-килобайтного L2-кеша. Посмотрим на его спецификацию:
|
Итак, с точки зрения архитектуры, Thunderbird ничем не отличается от обычного Athlon, кроме встроенного в ядро 256-Кбайтного кеша второго уровня. Несмотря на сокращение размера кеша вдвое по сравнению с обычным Athlon, быстродействие от этого упасть не должно - ведь новый кеш работает гораздо быстрее старого - на полной частоте ядра процессора. Да и к тому же благодаря более близкому его расположению к ядру латентность кеша у Thunderbird на 45% меньше, чем аналогичная характеристика у кеша старого Athlon. В остальном же, архитектурно и старые и новые Athlon ничем не отличаются, поэтому подробности о строении ядра этих CPU можно почерпнуть из обзора AMD Athlon 600, написанного мной еще год назад. При этом, все же необходимо иметь в виду, что все же Thunderbird имеют обновленное и технологически усовершенствованное ядро, выпускаемое по технологии 0.18 мкм. В результате, например, даже получается, что ядро Thunderbird со встроенным L2-кешем по площади ненамного больше, чем ядро K75 (0.18 мкм Athlon) и даже значительно меньше чем старое ядро K7, выполненное по технологии 0.25 мкм.
Вторым и не менее важным отличием старых и новых Athlon является то, что поскольку необходимость в процессорной плате отпала, они используют новый процессорный разъем типа socket, а не slot - Socket A. Хотя, конечно, некоторое время Slot A Thunderbird на рынке присутствовать будут, основным форм-фактором для этих CPU следует считать 462-контактный Socket A. Как я уже говорил в обзоре AMD Duron 650, новый Socket A в целях упрощения перехода на него имеет те же геометрические размеры, что и Socket 370, а следовательно позволяет использовать старые кулеры для охлаждения новых процессоров.
AMD выпускает Thunderbird на двух заводах - в Остине и в Дрездене, по двум различным технологиям - с использованием алюминиевых соединений и медных соединений. Тем не менее, обе эти модификации, похоже, между собой ни чем не отличаются, кроме : цвета. Дрезденские Thunderbird имеют синий цвет кристалла, в то время как Остинские - зеленый.
Что же касается видимых отличий старых и новых Athlon производимых в Slot A варианте, то тут найти отличие будет не так просто, так как оба они имеют одинаковый внешний вид картриджа и что более забавно, одинаковую цену. Однако отличить их все-таки возможно как по маркировке (старые Athlon маркируются как AMD-K7XXX, в то время как новые имеют маркировку AMD-AXXXX) так и заглянув внутрь картриджа со стороны процессорного разъема - у новых Athlon отсутствуют микросхемы SRAM, расположенные по обе стороны от ядра, в то время как у старых Athlon они есть.
До сих пор мы восхищались новыми Thunderbird и их интегрированным L2-кешем. Теперь пришло время немного огорчить фанатов AMD. Тем более, что сделать это будет нетрудно, если сравнить кеш Thunderbird и Coppermine.
Единственным преимуществом L2-кеша Thunderbird с этой точки зрения может являться его эксклюзивность. То есть, алгоритм работы L2 кеша у Thunderbird таков, что данные, хранящиеся в L1-кеше, в L2-кеше не дублируются. Это значит, что суммарный объем эффективной кеш-памяти новых Athlon равен 128+256 = 384Кбайта. В случае же с Coppermine 32Кбайта L2-кеша всегда занято копией содержимого кеш-памяти первого уровня и эффективный объем кешей у этого CPU составляет всего 256Кбайт.
Что же касается недостатков, то просто напросто кеш Thunderbird медленнее чем кеш Coppermine. Причины этого кроются как в меньшей латентности кеша Intel Pentium III так и в том, что инженеры AMD поленились переделать шину соединяющую ядро и L2 кеш, после того как перенесли последний внутрь процессорного ядра. В результате, она так и осталась 64-битной, в то время как шина кеша Coppermine в четыре раза шире.
Еще одной большой проблемой Thunderbird является непонятная ситуация с системными платами под него. Socket A платы, основанные на чипсете VIA Apollo KT133 только-только начинают появляться на рынке и купить их пока не так просто. Что же касается Slot A Thunderbird, то тут тумана навела сама AMD, своей серий заявлений о том, что этот процессор с чипсетом VIA Apollo KX133 не работает. Чтобы хоть как-то прояснить эту непонятную ситуацию, мы протестировали несколько плат на совместимость с новым AMD Athlon 700 на ядре Thunderbird. Как это не покажется странным, практически все протестированные платы работали с этим процессором без особых проблем. Вот их список:
Не работали с Thunderbird 700 только две платы:
Четыре из шести протестированных плат на VIA Apollo KX133 показали свою полную работоспособность с новым процессором Athlon. Все это, конечно, не красит AMD и еще раз подчеркивает, что фирма занимается нечестным маркетингом, распространяя заявления руководствуясь не реальным положением вещей, а желанием как можно скорее пропихнуть на рынок Socket A форм-фактор. Я уже говорил об этом в сравнительном тестировании плат на VIA Apollo KX133 и совершенно теперь не удивлюсь, если на рынке появятся Slot A - Socket A адаптеры, сделать которые, по словам AMD, также невозможно.
Перейдем, наконец, к результатам тестов. В тестовой системе использовалось следующее оборудование
Как видите, тестирование выполнялось на системных платах построенных на различных чипсетах VIA (Apollo Pro133A, KX133, KT133), но имеющих одинаковую архитектуру. Сделано это для того, чтобы показать реальное соотношение производительностей процессоров, по возможности уменьшив вклад вносимый различиями наборов логики.
Первым делом мы посмотрим на производительность по результатам синтетических тестов, а затем обратим внимание на то, как чувствует себя Thunderbird в реальных задачах.
Этот тест показывает производительность целочисленной части процессора и скорость работы с данными. Благодаря более скоростному L2 кешу Thunderbird в этом тесте выглядит достаточно привлекательно, опережая Pentium III более чем на 3%. Также результаты дают ясно понять, что увеличение скорости кеша второго уровня до частоты ядра дает положительный эффект несмотря на его уменьшение в два раза.
Этот бенчмарк показывает "чистую" скорость работы арифметического сопроцессора благодаря тому что все данные, необходимые для его работы умещаются в L1 кеше процессора. Результаты еще раз подтверждают, что ядро нового Thunderbird такое же, как и у старого Athlon. Оба процессора, работая на одинаковой частоте, показывают совершенно одинаковое быстродействие.
Этот бенчмарк, входящий в состав 3Dmark2000 демонстрирует теоретическую скорость работы процессора по обработке типовых игровых 3D-сцен при активном использовании наборов SIMD-команд SSE и 3Dnow!. Как видим, на высоте тут Intel Pentium III, однако скорее это связано с более совершенным L2 кешем этого процессора, чем с более качественной реализацией набора SIMD инструкций.
Переходим к тестам, основанным на реальных приложениях. По данным Content Creation Winstone 2000 процессоры AMD несколько опережают своих соперников от Intel. Однако, если сравнить скорости старого и нового Athlon, то разница в их производительности составляет всего 5%.
Этот тест также использует офисные приложения для измерения производительности. Однако же, состав задач, входящих в SYSmark 2000 таков, что процессоры от Intel традиционно показывали в нем более высокие результаты. Причины две - лучшая поддержка SSE приложениями этого теста и лучшая реализация в процессорах от Intel работы с L2 кешем. Однако, теперь ситуация изменилась и новый Athlon вышел вперед, обогнав Pentium III, работающий на той же частоте на 3 пункта.
Теперь посмотрим на то, как ведет себя новый AMD Athlon в играх. Как я уже неоднократно говорил, число fps в высоких разрешениях в Quake3 зависит в основном от пропускной способности шин, связывающих различные компоненты системы. Поскольку процессорная шина EV6, применяемая в Athlon-системах позволяет передавать больше данных между процессором и другими компонентами системы, результаты процессоров от AMD оказываются чуть выше, чем у Pentium III.
Производительность в низких разрешениях в Quake3 зависит от многих причин, поэтому данный тест хорошо показывает средневзвешенную скорость процессоров. Правда, особого повода для обсуждения он сейчас не дает - все показатели разных CPU близки друг к другу. Тем не менее, Thunderbird чуть-чуть вырвался вперед.
Различия в скоростях минимальны. Thunderbird опережает Pentium III всего на 1%, а старый Athlon - на 2%. Наверняка, в этом тесте можно добиться и другого расклада, если поменять, например, системные платы.
Результаты аналогичны предыдущему случаю.
Expendable - игра, производящая во время своей работы интенсивные операции с большими объемами данных. Поэтому в данном случае сильно сказывается высокая пропускная способность процессорной шины EV6, которой обладают процессоры от AMD. Ну и, конечно, скоростной L2 кеш Thunderbird позволяет ему слегка обогнать старый Athlon.
Картина та же, однако, тут результат нового Athlon оказывается лучше результата старого где-то на 2-3%.
К сожалению, в настоящий момент мы не можем оценить потенциал новых Athlon с точки зрения разгона. Дело в том, что сама системная шина EV6, используемая этими процессорами не позволяет сильно увеличивать частоту FSB. Данные по ней передаются на обоих фронтах сигнала, поэтому малейшее увеличение ее частоты приводит к дестабилизации системы. Например, протестированный Thunderbird я смог запустить только при частоте FSB 105МГц, большие ж значения частоты остались недосягаемы.
Что касается системных плат с возможностью изменения коэффициента умножения, про которые много говорится в последнее время, то и тут нас ждет разочарование. Как подтвердила AMD, эта функция работать не серийно продающихся процессорах не будет.
К сожалению, я вынужден констатировать, что Thunderbird не представляет из себя ничего особенного ни с точки зрения архитектуры, ни с точки зрения производительности и ни с точки зрения маркетинга. Хотя, впрочем, AMD ни на что и не претендовала выпуская этот процессор, просто логически продолжающий линейку AMD Athlon.
В Thunderbird нет ничего нового, просто изменен размер, частота и местонахождение кеша второго уровня. Именно поэтому мы так и не увидели практически никакого прироста в производительности по сравнению со старым Athlon. К сожалению, вся архитектура процессора так и осталась старой, AMD даже не переделала шину L2 кеша, по которой идет обмен данными с ядром. Именно это не позволяет проявить L2 кешу всю свою мощь.
Что касается планов, то AMD даже и не собирается модифицировать эту шину вплоть до выхода Mustang - процессора с большим объемом интегрированного в ядро кеша. Так что,единственное, что может дать возможность Athlon-системам увеличить свою производительность в ближайшем будущем, это применение в них системной памяти типа DDR SDRAM, которое, теоретически, не за горами. Выход первого Athlon-чипсета, поддержиающего DDR SDRAM, AMD 760 запланировано на осень. Что ж, ждем с нетерпением.
А пока вопрос "Pentium III vs Athlon" будет продолжать решаться исходя из личных симпатий: производительности у обоих процессоров примерно одинаковы.