Інтернет Windows Android

Будівництво десятиліття. Вивчаємо процессорную архітектуру AMD Bulldozer

сисадмін(Він же англійською мовою sysadmin, system administrator) - скорочена назва професії, повна назва якої російською мовою звучить як системний адміністратор. Дана професія останнім часом стала дуже популярною для більшості молодих, і не дуже, людей, їй навчають, по ній працюють, за неї отримують хороші гроші. Пов'язано це з бурхливим розвитком різних комп'ютерних технологійі їх проникненням в усі сфери людського життя. Слово сисадмін часто використовується в розмовній мові, у вакансіях і резюме при пошуку роботи, одним словом - всюди. Нижче піде мова про те, що ж представляє із себе професія системного адміністратора.

У сучасних реаліях, системним адміністратором може називатися фактично будь-яка людина, який займається обслуговуванням і підтримкою роботи певної комп'ютерної мережі, Включаючи всі її апаратні і / або програмні компоненти, до якої можуть входити:

  • Персональні комп'ютери, як робочі станції, так і сервера;
  • Мережеве обладнання, таке як комутатори, маршрутизатори, фаєрволли і багато іншого;
  • Веб-сервера, поштові сервера, сервера баз даних, і інші.

Так само в певних випадках, на плечі системного адміністратора можуть лягти обов'язки щодо забезпечення належної інформаційної безпеки.

Залежно від своєї спеціалізації, системний адміністратор може займатися наступними видами діяльності:

  • Адміністратор робочих станцій і серверів найчастіше займається лагодженням як апаратних (що вийшли з ладу материнські плати, що погоріли блоки живлення), так і програмних (не завантажується Windows, що не друкуються коми в Word "e ...).
  • Адміністратор корпоративної мережіна основі домену Active Directory. Дуже популярне заняття, враховуючи поширеність операційних систем Windows, а так само необхідність їх якось централізовано контролювати. Такий фахівець повинен вміти створювати, розподіляти по групах, редагувати користувачів, видавати їм відповідні права в домені AD, а так само вміти управляти груповими політикамидля користувачів, їх комп'ютерів і груп, в яких вони все складаються.
  • Адміністрування мереж і мережевого устаткування. В його обов'язки входить знання топології мереж, вміння працювати як з не настроюється, так і з налаштованим мережевим обладнанням, планування локальної обчислювальної мережі, А так само можливість об'єднання в одну мережу декількох віддалених один від одного робочих місць, шляхом настройки NAT "ов і VPN" ов. Не варто також забувати і контролі доступу в рамках цієї мережі, і за її межами - настройка проксі.
  • Адміністратор веб-сервера, який повинен як мінімум вміти встановлювати, налаштовувати і обслуговувати один з наступних веб-серверів - Apache, IIS, Nginx, стежити за хостингом (який може розташовуватися як всередині мережі організації, так і поза нею). Крім того, хороший адміністратор повинен вміти налаштувати нормальний розподіл ресурсів при високих навантаженнях, кластеризації і багато інших специфічних речей.
  • Адміністрування поштового сервера так-же є поширеною завданням для сисадміна, в його завдання входить робота з такими популярними рішеннями як Exim, Microsoft Exchange, Postfix, Sendmail, або корпоративними поштовими рішеннями від Google або, наприклад, Yandex. Крім очевидного контролю за обліковими записами (створення, видалення, настройка), так само обов'язково вміти налаштувати антиспам систему та інше.
  • Адміністратор сайту. У ці обов'язки може входити як просто якесь наповнення вмістом сайту, але раз мова йде про системний адміністратора, то по ідеї він повинен вміти і налаштувати хостинг (в тому числі і веб-сервер, про що вже говорилося вище), встановити і налаштувати потрібний сайт, наприклад якусь систему управління вмістом (CMS).
  • Зовсім рідко під обов'язки системного адміністратора може потрапити завдання створення або обслуговування системи відеонаблюдленія. У завданнях встановлення та налаштування камер, реагування на різні події, збереження і відтворення записів. Відноситься до системного адміністрування слабо, і часто потрапляє в його обов'язки за сумісництвом до яких-небудь інших обов'язків.

За бортом описаних вище занять системного адміністратора залишилися такі можливі речі, як адміністрування баз даних ( Microsoft SQL, MySQL і його множинні відгалуження, Oracle і т. Д.), Адміністрування 1C (не плутати з "програміст 1C"), АТС і багато іншого.

Недавній анонс новітніх процесорів AMDстав одним з найяскравіших подій поточного року. Напружене очікування, яке підігрівалося численними витоками інформації і секретними слайдами, не полишало в спокої не тільки фанатів біло-зеленого табору, а й прихильників продукції конкуруючої компанії. Дані про продуктивність надходили найсуперечливіші: від переважної переваги над конкурентами до повного провалу. Ніхто не стане сперечатися з твердженням, що мікроархітектура Stars, що лежить в основі всіх нинішніх настільних рішень компанії AMD, на сьогоднішній день порядком застаріла. Можливості спадкоємців легендарних К8, процесорів AMD Phenom II і Athlon II, більш не відповідають сучасним реаліям. Саме тому висновок на ринок процесорів, заснованих на принципово новій архітектурі Bulldozer, був надзвичайно необхідний. Це дозволило б зрівнятися або навіть обігнати рішення конкурентів по продуктивності і енергоефективності. Перевага в швидкодії повинна забезпечити принципово нова восьмиядерна архітектура, а впровадження тонкого 32-нм технологічного процесу разом з «просунутими» можливостями управління напругою і частотами окремих функціональних блоків обіцяють значне зниження енергоспоживання в порівнянні з рішеннями попереднього покоління.

Нарешті, 12 жовтня покрив таємничості був зірваний: саме тоді відбувся довгоочікуваний анонс процесорів AMD FX, в основі яких лежить мікроархітектура Bulldozer. Чіпмейкер представив цілу лінійку CPU - носіїв цієї мікроархітектури, яка включає чотирьох-, шести і восьмиядерні моделі. Окрім іншого, компанія AMDвідродила торгову марку «FX», ім'я якої в минулому носили продукти для ентузіастів. Дійсно, всі процесори AMD FX нинішнього покоління мають розблокований на підвищення коефіцієнт множення, що, по ідеї, повинно зробити їх привабливими для любителів розгону. Гнучко варіюючи кількістю функціональних блоків і робочими частотами, AMD вдалося заповнити практично всі основні ринкові ніші, починаючи від недорогих ігрових систем і закінчуючи пропозиціями для конфігурацій верхнього цінового діапазону. повний модельний рядновітніх процесорів AMD в порівнянні з чотирьох- і шестиядерними Phenom II виглядає так:

FX 8150 FX 8120 FX 6100 FX 4100 Phenom II X6 Phenom II X4
ядро Zambezi Zambezi Zambezi Zambezi Thuban Deneb
роз'єм Socket AM3 / AM3 + Socket AM3 / AM3 + Socket AM3 / AM3 + Socket AM3 / AM3 + Socket AM2 + / AM3 Socket AM2 + / AM3
Техпроцес CPU, нм 32 32 32 32 45 45
Кількість транзисторів, млн. 2000 2000 2000 2000 904 758
Площа кристала, кв. мм 315 315 315 315 346 243
число ядер 8 8 6 4 6 4
Номінальна частота, МГц 3600 3100 3600 3100 2600 — 3300 3200 — 3700
Частота Turbo Core, МГц 3900/4200* 3400/4000* 3300/3900* 3600/3800* 3100 — 3700
Частота NB, МГц 2200 2200 2200 2200 2000 2000/1800
Обсяг L1 кеша, КБ 16 x 8 + 64 x 4 16 x 8 + 64 x 4 16 x 6 + 64 x 3
16 x 4 + 64 x 2 128 x 6 128 x 4
Обсяг L2 кешу, КБ 2048 x 4
2048 x 4
2048 x 4
2048 x 4
512 x 6
512 x 4
Обсяг L3 кешу, МБ 8 8 8 8 6 6
множник 18 15,5 16,5 18 13 — 16,5 16 — 18,5
каналів пам'яті 2 2 2 2 2 2
Підтримуваний тип пам'яті DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR2 800/1066, DDR3 1333/1600
Шина для зв'язку з чіпсетом Hyper Transport 3.1 Hyper Transport 3.1 Hyper Transport 3.1 Hyper Transport 3.1 Hyper Transport 3.0 Hyper Transport 3.0
Частота Hyper Transport, МГц 5200 5200 5200 5200 4000 4000
Робоча напруга, В 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4
TDP, Вт 125 125 95 95 125 125
Рекомендована вартість, $ 245 205 165 115 165 — 205 117 — 185

Якщо закрити очі на кількість обчислювальних ядер, в порівнянні з попередниками процесори FX отримали більш швидку шину Hyper Transport 3.1, підтримку швидкісної пам'яті DDR3 1866 МГц і збільшену до 8 Мбайт кеш-пам'ять 3-го рівня. Крім того, звертаємо вашу увагу на досить високі тактові частоти, які впритул наблизилися, а в окремих випадках навіть подолали позначку в 4000 МГц. Якщо виходити з рекомендованої ціни, чотирьохядерний процесор FX 4100 повинен конкурувати з двоядерним Sandy Bridge і молодшими Phenom II X4; суперниками шестиядерного FX 6100 стануть молодші моделі Core i5 і шестиядерних Phenom II X6. Восьмиядерні моделі FX 8120 і FX 8150 грають у «вищій лізі», де правлять бал старші Core i5 і Core i7, які до сих пір показували чудовий рівень продуктивності. Як видно, позиціонування нових процесорів AMD FX зобов'язує їх триматися на рівні дуже серйозних суперників, так що новачкам доведеться ой як нелегко!

Мікроархітектура Bulldozer: будова і особливості функціонування

Перш за все, необхідно відзначити, що AMD FX є чистокровними центральними процесорами і не мають в своєму складі графічного ядра. Звичайно, в зв'язку з цим можна звинуватити AMD в непослідовності, адже просування на ринок APU (Accelerated Processing Unit) - одна з основних стратегічних ініціатив компанії. Натомість вбудованого відеоадаптера користувачі отримують повну сумісність AMD FX з продуктивною платформою Socket AM3 / AM3 +, для якої пропонується безліч відмінних системних платі забезпечена підтримка всіх актуальних можливостей розширення. Спеціально для процесорів FX компанія AMD випустила оновлену 9-ю серію наборів системної логіки.


Нагадаємо основні можливості флагманського чіпсета AMD 990FX. Отже, він дозволяє будувати графічні конфігурації AMD CrossFireX і NVIDIA SLI, завдяки південному мосту SB950 підтримує стандарт SATA 6 Гбіт / с, але позбавлений можливості підключення пристроїв USB 3.0. Що стосується материнських плат Socket AM3, заснованих на наборах системної логіки попередніх поколінь, то після поновлення микрокода прошивки вони теж повинні будуть підтримувати Bulldozer. Але це вже залежить від конкретної моделі.

Одною з ключових особливостейпроцесорів на базі мікроархітектури Bulldozer став перехід на 32-нм літографічний процес, який протягом майже двох років досить успішно використовується основним конкурентом - компанією Intel. Крім потенційного зменшення енергоспоживання і поліпшення розгінного потенціалу, цей факт позитивно позначилося на вартості виробництва напівпровідникових кристалів. AMD вже не можна назвати новачком у справі освоєння 32-нм техпроцесу: саме з таким рівнем деталізації випускаються цілком вдалі APU Llano, які хоч і не завоювали визнання серед ентузіастів, зате відмінно підходять для побудови недорогих і компактних універсальних ПК. завдяки застосуванню сучасних технологійвиробництва чіп (незважаючи на те що містить майже 2000 млн. транзисторів) вийшов вельми компактним. Восьмиядерні AMD FX 8150 мають площу ядра всього в 315 мм², що менше, ніж у флагманів попереднього покоління - Phenom II X6, кристал яких займає цілих 346 мм ². Втім, до показників чотириядерних Sandy Bridge процесорам AMD FX все ж далеко, так як у перших чіп, незважаючи на наявність вбудованого графічного акселератора, займає всього 216 мм².

Головні нововведення, які були зроблені в мікроархітектурі Bulldozer, торкнулися алгоритму виконання багатопоточних обчислень. Довгий час центральні процесори були здатні виконувати єдиний обчислювальний потік в один момент часу. Так звана одночасна робота декількох програм здійснювалася за допомогою обробника переривань, тобто обчислювальні завдання різних додатківпо черзі отримували короткочасний доступ до ресурсів процесора. Саме завдяки цьому стала можливою робота багатозадачних операційних систем. Чи варто говорити, що швидкість роботи в такому режимі була невисокою. У той же час, розробники CPU стали помічати, що в навантаженні різні функціональні блоки процесора можуть простоювати без роботи, поки інші зайняті обробкою обчислювального потоку. Саме це і наштовхнуло їх на спільне використанняодних і тих же ресурсів процесора для обробки декількох обчислювальних потоків. Компанія Intel впровадила таку можливість під назвою Hyper-Threading в свої процесори ще в далекому 2002 році. Даний принцип дає деякий приріст в певному типі завдань. У той же час, підхід AMD до реалізації багатопотокових обчислень довгий часзалишався незмінним: кожен потік повинен виконуватися на окремому ядрі. Тепер же, після оптимізації продуктивності окремих вузлів процесора і ретельного аналізу навантаження, розробники AMD порахували, що швидкодії деяких вузлів цілком достатньо для обслуговування відразу двох незалежних обчислювальних потоків. Такий підхід дозволив здорово скоротити кількість транзисторів, але зберегти високу продуктивність. Тепер же, в світлі збільшення вимог до швидкодії при збереженні прийнятних параметрів енергоспоживання, розробники змушені шукати шляхи збільшення кількості виконуваних за такт інструкцій.

Отже, в основі всіх центральних процесорів AMD FX лежить напівпровідниковий кристал, що складається з чотирьох обчислювальних модулів, кожен з яких забезпечений власним масивом кеш-пам'яті 2-го рівня, загального кеша 3-го рівня обсягом 8 Мбайт, двоканального контролера пам'яті DDR3, контролерів шини HyperTransport і вбудованого північного мосту.


Очевидно, що молодші моделі виходять з повноцінних чіпів шляхом відключення окремих функціональних блоків. Дивлячись на структуру кристала Zambezi мимоволі складається враження, що перед нами звичайний чотирьохядерний процесор. Насправді це не так, і більш за все даний факт демонструє будову обчислювального модуля - структурної одиниці процесорів AMD FX.

До складу обчислювального модуля входять два блоки цілочисельних обчислень (ALU), кожен з яких здатний виконувати до чотирьох інструкцій за такт, забезпечених власної кеш-пам'яттю 1-го рівня для зберігання даних. Всі інші блоки, такі як провісник розгалужень, декодер інструкцій, буферна пам'ять для зберігання інструкцій і масив кеш-пам'яті 2-го рівня розмірів 2 Мбайт, представлені в одиничному екземплярі. Очевидно, розробники вважали, що продуктивності цих блоків досить для обслуговування двох ALU.


Крім того, кожен з обчислювальних модулів має блоком обчислень з плаваючою точкою (FPU), який також зазнав значних доопрацювань. Так до стандартних SIMD-розширень додалися набори SSE4.1 і SSE4.2, а також специфічні інструкції XOP, AES і AVX, які дозволяють значно підвищити швидкодію за умови їх підтримки з боку програмного забезпечення. Цікаво виглядає можливість виконання 256-бітних інструкцій AVX, для цього задіюються ресурси відразу двох блоків, кожен з яких здатний обробляти 128-бітові команди FMAC. При цьому блок FPU здатний виконувати дві коротких інструкції AVX одночасно.

Як видно, мікроархітектура Bulldozer має дуже просунуті можливості обчислення, особливо в порівнянні з процесорами AMD попередніх поколінь. Однак за таке технологічну перевагу доводиться платити необхідністю ретельної оптимізації програмного коду. В іншому випадку, особливо в старих додатках, рівень швидкодії може бути далеким від очікуваного.

Пару слів варто сказати про організацію внутрішньої пам'яті AMD FX, які стали чемпіонами не лише за кількістю ядер, але і за сумарним обсягом кешу. Як ми вже говорили, кожен з блоків цілочисельних обчислень має буфером для зберігання даних об'ємом 16 Кбайт, при цьому обидва буфера можуть використовуватися для роботи блоку FPU. Для зберігання інструкцій кожен обчислювальний модуль розпорядженні окремий кешем L1 обсягом 64 Кбайт, а проміжні дані накопичуються в кеш-пам'яті другого рівня, розміри якого становлять вражаючі 2 Мбайт. Загальний для всіх чотирьох обчислювальних блоків масив кешу 3-го рівня має об'єм 8 Мбайт і володіє асоціативністю в 64 лінії на кожен модуль. Завдяки застосуванню ексклюзивної організації кешей 2-го і 3-го рівнів можна говорити про їх сумарному обсяг в 16 Мбайт. Тож не дивно, що кристал Bulldozer вийшов таким складним, левова частка транзисторного бюджету відведена для організації внутрішньої пам'яті процесора. Зауважимо, що робоча частота кеш-пам'яті L3 може становити 2000 МГц або 2200 МГц в залежності від моделі процесора.

Як видно з короткого описудизайну ядра, мікроархітектура Bulldozer, незважаючи на всі свої нововведення, не позбавлена ​​деяких недоліків. Все-таки на кожен обчислювальний модуль доводиться тільки один провісник розгалужень, блок вибірки інструкцій і один декодер інструкцій, який, до слова, здатний обробляти не більше чотирьох інструкцій за такт. Подивимося, як поведеться AMD FX в реальних додатках, але інтуїція підказує, що в додатках, які активно використовують FPU, але не мають програмної оптимізації для нових наборів SIMD-інструкцій, новітні процесоридемонструватимуть рівень продуктивності, характерний для чотириядерних моделей.

Крім архітектури змін зазнали і механізми управління енергоспоживання. Незважаючи на більшу кількість транзисторів і високі тактові частоти, навіть старші восьмиядерні AMD FX мають тепловий пакет, що не перевищує 125 Вт. Звісно, певну рольв цьому зіграв і 32-нм технологічний процес, завдяки якому штатний напруга живлення не перевищує 1,4 В, але основна заслуга все таки належить просунутим механізмам регулювання тактових частот і живлячих напруг. Перше покоління цієї концепції було реалізовано в Phenom II X6, де в разі обчислювального навантаження не більше трьох потоків, частоти трьох активних ядер могли підвищуватися на 400 МГц. Процесори AMD FX пропонують набагато більш гнучкий підхід до управління ключовими параметрами швидкодії. Так, завдяки застосуванню силових вентильних транзисторів диспетчер енергозбереження процесора здатний відключати цілі функціональні блоки. При відсутності навантаження обчислювальний модуль разом з масивом кеш-пам'яті 2-го рівня може повністю відключатися, вивільняючи частина бюджету TDP. У той же час, тактова частота і напруга активних обчислювальних модулів може підвищуватися, причому приріст частоти в режимі Max Turbo досягає солідних 900 МГц. Погодьтеся, настільки агресивний алгоритм роботи автоматичного розгону нам ще не зустрічався. Більш того, при рівномірному навантаженні всіх обчислювальних модулів існує можливість збільшення тактової частоти порядку 300 МГц. Власне, це і є режим роботи Turbo Core, причому він буде активний до тих пір, поки енергоспоживання процесора не виходить за рамки теплового пакету. Іншими словами, саме поняття «штатна тактова частота» для AMD FX втрачає свій первісний зміст.


І все було б дуже добре, якби не було так сумно. А справа в тому, що планувальник процесів операційних систем Windowsпоки недостатньо оптимізований для процесорів AMD FX. Існує ймовірність того, що два потоку однієї програми будуть виконуватися на цілочисельних обчислювальних блоках різних модулів, що не дозволить процесору перейти в режим Max Turbo і зажадає перезавантаження даних і інструкцій в кеш-пам'ять. В ідеальному випадку планувальник операційної системи повинен враховувати архітектурні особливості Bulldozer, в цьому випадку комбінація використання Turbo Core і Max Turbo повинні дати максимальний позитивний ефект.


Уже зараз відомо, що планувальник завдань майбутньої Microsoft Windows 8 буде оптимізований для роботи на процесорах Bulldozer. А що стосується дня сьогоднішнього, можливо, буде випущено оновлення для нинішніх операційних систем, або ж програмісти AMD нарешті розроблять «чудо-драйвер» ...

З чого складається продуктивність процесора? Раніше в ходу була формула, що описує швидкодію як добуток кількості виконуваних за один такт інструкцій і частоти, на якій цей процесор функціонує. Тепер в цій формулі з'явився і третій співмножник - кількість обчислювальних ядер. Тому розробник процесорів, який бажає випустити швидкий продукт, має для цього кілька шляхів.

Однак не все так просто. Збільшення кількості виконуваних обчислювальним ядром за такт інструкцій - досить складне завдання. Класичний x86 програмний код передбачає послідовне виконання команд, а тому, щоб домогтися їх паралельної обробки, в процесор необхідно закласти високоефективні блоки передбачення переходів і переупорядочивания інструкцій, реалізація яких вимагає чималих інженерних зусиль. При цьому ускладнення мікроархітектури позначається на фізичних розмірах кристала і призводить до обмежень при нарощуванні кількості ядер. Так що якщо виробник збирається зробити процесор з великим числом ядер, то микроархитектуру потрібно, навпаки, намагатися спростити. Непросто все і з тактовою частотою. Ставка на її зростання знову зажадає внесення змін у внутрішні блоки процесора і подовження його виконавчого конвеєра. У підсумку виходить наступне: щоб процесор міг завоювати медальку за продуктивність, його розробники повинні неабияк попітніти над одночасною оптимізацією цілого ряду параметрів.

Проблема полягає ще і в тому, що будь-який з обраних шляхів поліпшення швидкодії процесора може виявитися вдалим лише для окремих випадків. Далеко не всі програми можуть ефективно працювати з великою кількістю ядер. Якісь алгоритми не дозволяють коректно прогнозувати переходи і змінювати порядок інструкції. А в деяких випадках продуктивність не росте і зі збільшенням тактової частоти, тому що в системі знаходяться якісь інші вузькі місця.

Підібрати оптимальний баланс непросто, та й що вважати критерієм оптимальності? Ми можемо лише зіставити продуктивність процесорів в кінцевому числі програм і вибрати з них найшвидший для даного конкретного випадку. Однак це зовсім не гарантує, що, застосувавши інший набір тестового інструментарію, ми не отримаємо абсолютно протилежні оцінки. Настільки великий вступ наведено тут тому, що сьогодні ми маємо знайомство з новою серією процесорів AMD FX - флагманським продуктом компанії AMD, широко відомим під кодовим ім'ям Zambezi. В основі цього процесора лежить вельми неоднозначна мікроархітектура Bulldozer, яка вже встигла зібрати чималий букет невтішних відгуків. Але справа зовсім не в тому, що ця мікроархітектура зовсім погана. Підбираючи найкращий баланс характеристик, розробники невірно оцінили потреби більшості користувачів і зробили в «базову формулу» основний акцент не на той співмножник. У підсумку початковий задум з випуску високопродуктивного рішення нового покоління пішов шкереберть і зацікавлені обіцянками прориву прихильники AMD отримали зовсім не те, що очікували. Однак чи є це серйозним і об'єктивним приводом для розчарування? Про це і поговоримо в даному матеріалі.

⇡ Вважаємо ядра: вісім або чотири?

Працюючи над новим дизайном для продуктивних процесорів, AMD вирішила поставити на чільне місце кількість обчислювальних ядер. Це цілком логічний вибір, заснований на тому, що з роками многопоточного програмного забезпечення стає все більше і більше і розробка мікроархітектури, розрахованої на багаторічне розвиток, повинна враховувати в першу чергу не поточний стан ринку, а спостережувані тенденції. Вісім ядер, передбачених в базовому варіанті нового процесора, - це те, чим AMD і збиралася підкорити ринок, на якому поки що були представлені тільки чіпи, максимальна кількістьядер в яких обмежувалося шістьма. ( Тут ми говоримо тільки про настільних комп'ютерах. — прим. ред. )

При цьому брати ядра старої мікроархітектури K10 розробники не захотіли. Вони не тільки мають занадто великий фізичний розмір, а й, як можна судити по Llano, не схильні до функціонування на високих тактових частотахнавіть після перекладу на сучасну 32-нм технологію. До того ж вони не підтримують багатьох сучасних можливостей, таких як, наприклад, AVX-інструкції. Тому, для збірки восьміядерніков AMD зробила нову мікроархітектуру - Bulldozer. Представники компанії вважають за краще говорити, що її розробка велася з чистого аркуша, але насправді ж в ядрах Bulldozer можна знайти чимало відсилань до іншої представленої в цьому році мікроархітектурі - Bobcat, орієнтованої на застосування в компактних і енергоефективних пристроях. Втім, спорідненість між Bulldozer і Bobcat - досить віддалене, і згадуємо ми про нього лише для того, щоб стала зрозуміла загальна ідея - в Bulldozer об'єднано багато порівняно нескладних ядер.

При цьому мова йде зовсім про примітивне суміщенні на одному напівпровідниковому кристалі восьми простих ядер. При такому розкладі вийшов процесор мав би зовсім невисокою однопоточному продуктивністю, і це стало б досить серйозною проблемою, так як програм, які не дроблять навантаження на кілька обчислювальних потоків, не так вже й мало. Тому, по-перше, ядра були оптимізовані під роботу на високих тактових частотах. А по-друге, вони були спарені в двоядерні модулі, здатні спільно використовувати свої ресурси на благо обслуговування одного потоку. В результаті вийшла досить цікава конструкція: вхідна частина виконавчого конвеєра у такого двоядерного модуля - загальна, а в подальшому обробка інструкцій ділиться між двома наборами виконавчих пристроїв.

Основа конструкції Bulldozer - умовно званий двоядерним модуль

Нагадаємо, процес обробки даних в сучасному процесорівключає кілька етапів: вибірку x86-інструкцій з кеш-пам'яті, їх декодування - переклад у внутрішні макрооперації, виконання, запис результатів. Перші два етапи в модулі Bulldozer виробляються для пари ядер спільно, а далі для цілочисельних інструкцій виконання розподіляється по двом ядрам-кластерам або, в разі дійсної арифметики, воно здійснюється в загальному для двох ядер блоці операцій з плаваючою крапкою.

Модулі Bulldozer розраховані на обробку чотирьох інструкцій за такт, причому, завдяки технології макросліянія, деякі пари x86-інструкцій можуть розглядатися процесором як одна операція. Це означає, що в цілому двоядерний модуль Bulldozer за своєю потужністю подібний одному ядру сучасних интеловских процесорів, які також можуть обробляти по чотири інструкції за такт і при цьому теж підтримують макросліянія.

Однак між модулем Bulldozer і ядром Sandy Bridge є істотні відмінності, здатні поставити їх приблизно однакову теоретичну швидкість під сумнів. З огляду на те, що модуль нових процесорів AMD містить залишки двох рівноправних ядер, максимальну продуктивністьвін може продемонструвати лише при обробці пари потоків. Якщо ж на нього лягає однопоточні навантаження, то швидкість її обслуговування буде обмежуватися числом виконавчих пристроїв всередині одного такого кластера. А їх там, з огляду на бажання AMD спростити окремі ядра, не так вже й багато - в півтора рази менше, ніж в процесорах з мікроархітектури Sandy Bridge або K10. Тобто по два арифметичних ALU і по два адресних AGU.

так виглядає функціональний пристріймодуля, побудованого на мікроархітектурі Bulldozer. Від двох ядер залишилося лише два набори цілочисельних виконавчих пристроїв

Відносно невисоку складність має і загальний на процесорний модуль блок операцій з плаваючою крапкою. У нього входить два 128-бітних виконавчих пристрої FMAC, які для обробки 256-бітних інструкцій можуть об'єднуватися в єдине ціле. Здавалося б, і тут виконавчих пристроїв не так багато, особливо з урахуванням того, що діляться вони на пару ядер. Але зате вони - більш універсальні, ніж в попередніх і конкуруючих мікроархітектури, де застосовуються окремі умножители і суматори. І завдяки цьому в певних випадках при роботі з числами двоядерний модуль Bulldozer може забезпечувати порівнянну і навіть більш високу продуктивність, ніж, наприклад, одне ядро ​​Sandy Bridge.

Аналогічна ідея об'єднання 128-бітних пристроїв для роботи з 256-бітними інструкціями використовується і в Sandy Bridge

Однак свої найсильніші сторони модуль Bulldozer повинен проявляти при двухпоточной навантаженні. Одне ядро ​​Sandy Bridge теж здатне обробляти два обчислювальних потоку, для цього в ньому є технологія Hyper-Threading. Однак все інструкції при цьому направляються на один набір виконавчих пристроїв, що на практиці викликає численні колізії. У модулі Bulldozer ж збережено два незалежних цілочисельних кластера, які можуть виконувати потоки паралельно, а сумарна кількість виконавчих пристроїв в них перевищує число таких пристроїв в ядрі Sandy Bridge в півтора рази.

Зліва - модуль Bulldozer, праворуч - якесь конкуруюче ядро ​​з підтримкою Hyper-Threading. Насправді на Sandy Bridge воно не дуже-то і схоже, але суть проблеми ілюстрація передає

В результаті модуль Bulldozer володіє вищою піковою продуктивністю, ніж ядро ​​Sandy Bridge, але розкрити цю продуктивність трохи складніше. Ядро Sandy Bridge інтелектуально завантажує власні ресурси завдяки просунутої внутріпроцессорной логіці, самостійно розбиратися однопотоковий код і виконує його паралельно на повному наборі своїх виконавчих пристроїв. У Bulldozer ж завдання ефективного використання виконавчих пристроїв частково перекладається на програміста, який повинен розбити свій код на два потоки - повноцінна завантаження всіх потужностей модуля стане можливою лише тоді.

І ось що характерно. Розглядаючи двоядерний модуль процесора Bulldozer, ми весь час порівнювали його з одним ядром Sandy Bridge, і при цьому нам вдавалося проводити цілком коректні паралелі. Це змушує замислитися - чи не варто вважати «восьмиядерна» нової мікроархітектури породженням фантазії маркетологів? AMD говорить, що вважати ядра слід за кількістю цілочисельних кластерів, аргументуючи це тим, що модуль здатний забезпечити до 80% продуктивності двох незалежних ядер. Однак не слід забувати, що ядра, покладені в основу Bulldozer, істотно простіше ядер інших процесорів. Тому кількість двоядерних модулів - характеристика, що відображає продуктивність Bulldozer куди адекватніше.

Знайди максимальну кількість процесорних ядер і отримай роботу в маркетинговому відділі AMD

⇡ Кеш-пам'ять

Організація кеш-пам'яті в процесорах Bulldozer також «прив'язана» не стільки до окремим ядер, скільки до двоядерним модулів. Фактично на кожне ядро ​​виділено лише власний кеш даних першого рівня, всі інші рівні кеш-пам'яті відносяться або до модуля в цілому, або до процесора:

  • Кожне ядро ​​має власну кеш-пам'ять першого рівня для даних. Її обсяг становить 16 Кбайт, а архітектура передбачає наявність чотирьох каналів асоціативності. Цей кеш працює за алгоритмом з наскрізною записом, що означає його інклюзивність.
  • Кеш першого рівня для інструкцій представлений в єдиному екземплярі на кожен двопроцесорний модуль. Його обсяг - 64 Кбайт, а кількість каналів асоціативності - два.
  • Кеш другого рівня також реалізується в одиничному на модуль екземплярі. Його розмір - значні 2 Мбайт, асоціативність - 16 канальна, а алгоритм роботи - ексклюзивний.
  • Крім того, восьміядерний процесор в цілому має у своєму розпорядженні 8-мегабайтним L3 кешем з 64-канальної асоціативністю. Особливість цього кеша складається в його роботі на істотно меншою в порівнянні з самим процесором частоті, яка складає близько 2 ГГц.

Наступна таблиця описує співвідношення обсягів кеш-пам'яті процесорів восьмиядерних Bulldozer, чотирьохядерним Sandy Bridge і Thuban (шестиядерних Phenom II X6, побудованих на мікроархітектурі K10).

Тип кеша Bulldozer (8 ядер / 4 модуля) Sandy Bridge (4 ядра) Thuban (6 ядер)
L1I (інструкції) 4x64 Кбайт 4x32 Кбайт 6х64 Кбайт
L1D (дані) 8x16 Кбайт 4х32 Кбайт 6х64 Кбайт
L2 4х2 Мбайт 4х256 Кбайт 6х512 Кбайт
L3 8 Мбайт, 2,0-2,2 ГГц 8 Мбайт, працює на частоті процесора 6 Мбайт, 2,0 ГГц

Як видно з таблиці, AMD зробила ставку на місткі кеши верхніх рівнів, Що може бути дійсно корисно в разі серйозної багатопотокової навантаження. Однак кеш-пам'ять в нових процесорах в цілому працює повільніше, ніж у попередніх і конкуруючих продуктів. Це легко виявляється при вимірюванні практичної латентності.

Великі затримки при зверненні до даних в Bulldozer можуть бути компенсовані лише високою тактовою частотою цих CPU. Що, втім, і планувалося спочатку - по частотах нові восьміядернікі повинні були перевищувати Phenom II на 30%. Однак AMD так і не змогла спроектувати напівпровідникові кристали, здатні стабільно працювати при таких високих значеннях частоти. В результаті висока латентність кеш-пам'яті здатна нанести системам на базі Bulldozer певний шкоди.

Процесорів AMD з принципово новою архітектурою Bulldozer відверто зачекалися не тільки шанувальники продукції компанії, але і багато користувачів, що стежать за IT-прогресом. В останні кілька років пропонуючи цікаві рішення по співвідношенню ціна / продуктивність, AMD в основному концентрувалася на пристроях початкового і середнього рівнів. Відроджуючи лінійку FX, очевидно, що компанія розраховує привернути увагу і більш вимогливих ентузіастів, готових до експериментів і вимагають максимальних швидкостей. Можливості нового сімейства ми будемо вивчати на прикладі першого в світі восьмиядерного процесора для десктопів - AMD FX-8150. Подивимося, чи вдасться виробникові виправдати очікування своїх шанувальників.

На відміну від основного конкурента, який може собі дозволити слідувати маятниковому принципом розробки CPU, проводячи зміну архітектур і технологічних процесів c річної періодичністю, компанія AMD не окреслює для своїх проектів певних часових рамок, покладаючись на чуття ринку і власний технологічний потенціал. Історія з архітектурою Bulldozer почалася давно. Передбачалося, що її представлять ще в 2009 році, але в силу різних обставин практичне втілення сміливих інженерних рішень в кремнії стало можливим лише зараз.

Bulldozer для AMD - це всерйоз і надовго. Дана мікроархітектура на найближчі кілька років стане основою для майбутніх процесорів з різних сегментів: серверного, десктопного та мобільного. Це стосується як дискретних CPU, так і гібридних - APU також з часом планується трансформувати під Bulldozer. Лише для компактних систем AMD збирається використовувати чіпи на економічній Bobcat і її модерних версіях. З анонсом Bulldozer компанія вирішила відродити легендарну серію, представивши процесори лінійки AMD FX, які отримали нову архітектуру і виробляються із застосуванням найбільш прогресивного 32-нанометрів техпроцесу.

особливості архітектури

В основі чіпів Bulldozer лежать модулі з двома обчислювальними блоками x86. При цьому останні не є повністю автономними - деякі ресурси загальні для обох ядер. Зокрема, блок попередньої вибірки, декодер інструкцій, FPU і кеш-пам'ять другого рівня (L2). Монолітний двоядерний модуль забезпечує одночасне виконання двох потоків, але з певними застереженнями. За розрахунками виробника, такий підхід цілком виправданий і дозволяє отримати близько 80% ефективності повноцінних фізичних ядер. Однак при цьому значно зменшується кількість транзисторів, а відповідно, площа кристала і його енергоспоживання.

З урахуванням нової структури внутрішня архітектура була дуже серйозно перероблена, що фактично торкнулося всі виконавчі блоки. Схожість з К10, яка використовувалася для чіпів Phenom II і Athlon II, практично немає. AMD впровадила підтримку інструкцій AVX, SSE 4.2 і AES-NI і додала власні набори FMA4 і XOP.

Як і топові процесори Phenom, чіпи FX отримали трирівневу систему кешування. Однак її організація також помітно відрізняється про ту, що була у попередників. Кеш-даних L1 зменшився з 64 КБ до 16 КБ, в той же час істотно зросла його пропускна спроможність. L2 об'ємом 2 МБ є загальним для обох ядер кожного модуля. Залежно від кількості останніх сумарна ємність кеш-пам'яті другого рівня в процесорі AMD FX може становити від 4 до 8 МБ. Латентність його дещо збільшена - плата за оптимізацію для роботи на підвищених частотах. Чіпи з архітектурою Bulldozer також оснащені L3-кешем об'ємом 8 МБ. З огляду на ексклюзивну схему роботи, сумарний обсяг буфера досить вражаючий як для десктопних моделей. Вдосконалений алгоритм передвибірки даних дозволяє сподіватися, що швидкість підсистеми пам'яті буде збільшена. Що стосується безпосередньо ОЗУ, то CPU FX підтримують модулі DDR3-1866 в двоканальному режимі.

Для виробництва AMD FX використовується 32-нанометровий техпроцес з технологією SOI, аналогічний вживаному при виготовленні APU Llano. Чіпи випускаються на потужностях спорідненої компанії GlobalFoundries. В основі CPU лежить восьміядерний кристал площею 315 мм 2. Згідно топології, більша його частина відводиться під кеш-пам'ять, тому не дивно, що сумарна кількість транзисторів в даному випадку становить вражаючі 2 млрд. Для порівняння: шестиядерних Phenom II X6 (Thuban) включають «всього» 904 млн транзисторів, але через 45 -нанометрового техпроцесу площа кристала дорівнює 346 мм2. З огляду на різницю в площі, можна припустити, що собівартість чіпів FX нижче, ніж у попередників. Однак перехід на 32 нм непросто дається GlobalFoundries. AMD вже повідомляла про складнощі з виходом придатних заготовок, з огляду на які компанія не може в повній мірі задовольнити попит на гібридні Llano. Будемо сподіватися, що це ніяк не вплине на доступність у продажу FX, і всі бажаючі зможуть їх придбати.

Для чотирьох- і шестиядерних моделей буде використовуватися той же кристал, що дозволить ефективніше розпорядитися чіпами, що мають певні дефекти. Тим часом цілком ймовірно, що для виробництва даних CPU стануть застосовуватися і повністю працездатні кристали з деактивовано модулями. А в цьому випадку можна розраховувати на чергову лотерею з розблокуванням відключених ядер. Прекрасний вийшов би спосіб підігріти інтерес до процесорів AMD FX.

Технічні характеристики процесорів
Модель FX-8150 Phenom II X6 1075T Phenom II X4 975 Core i7-2600K Core i5-2500K
кодове ім'я Bulldozer Thuban Deneb Sandy Bridge Sandy Bridge
Кількість ядер / потоків, шт. 8/8 6/6 4/4 4/8 4/4
Базова тактова частота, ГГц 3,6 3 3,6 3,4 3,3
Тактова частота після авторозгону, ГГц 3,9/4,2 3,5 3,8 3,7
Об'єм кеш-пам'яті L2 / L3, МБ 8/8 6 × 0,5 / 6 4 × 0,5 / 6 4 × 0,25 / 8 4 × 0,25 / 6
Технологія виробництва, нм 32 45 45 32 32
процесорний роз'єм AM3 + AM3 AM3 LGA1155 LGA1155
Споживання енергії (TDP), Вт 125 125 125 95 95
Рекомендована ціна, $ 245 181(162*) 175 (160*) 317 (315*) 216 (225*)
* За даними каталогу Hotline.ua.

Turbo Core

Технологія динамічного збільшення частоти Turbo Core раніше використовувалася компанією AMD для шестиядерних Thuban і APU Llano. Процесори FX мають новий механізмі алгоритм роботи даної функції. У разі, коли під навантаженням енергоспоживання чіпа укладається в рамки його TDP, а температура не перевищує заданого значення, частота може автоматично збільшуватися (100-300 МГц) навіть в ситуації, коли активні всі ядра (All Core Boost). Якщо ж як мінімум половина модулів простоюють, то AMD FX може переходити в режим Max Turbo Boost, підвищивши напруга живлення і вельми значно тактову частоту працюючих блоків (до 900 МГц).

AMD також потурбувалася про поліпшення економічності нових чіпів. З огляду на зростання кількості обчислювальних ядер, покладатися тільки на ефект від використання більш тонкого техпроцесу не можна. При відсутності навантаження на обидва процесорних ядра в рамках одного модуля і переході їх в стан енергозбереження C6 силові транзистори дозволяють відключати живлення від даного вузла, знижуючи загальне споживання CPU.

логічна підтримка

Як і у попередньої десктопной платформи AMD, контролер шини PCI Express 2.0 залишився прерогативою північного моста чіпсета, а не перебрався під кришку процесора. Саме кількість підтримуваних ліній даного інтерфейсу, А внаслідок і здатність побудови конфігурацій з декількома відеокартами стали визначальними відзнаками нових наборів логіки для чіпів Zambezi. У розпорядженні топового AMD 990FX перебувають 42 линка з можливістю компонування на графічні потреби як 2 × 16x або 4 × 8x. AMD 990X має 26 ліній і дозволяє подружити тільки дві відеокарти в режимі CrossFireX або SLI у конфігурації 2 × 8x. Ну а AMD 970 при такому ж числі лінків PCI-E пропонує задовольнятися одним адаптером. У всіх випадках периферію обслуговує південний міст SB950, який не несе будь-яких цікавих нововведень: шість портів SATA 6 Гб / c з можливістю створення RAID(0,1,5,10), до 14 роз'ємів USB 2.0, робота з PCI. На жаль, на відміну від чіпсета AMD A75 для платформи FM1 підтримки швидкісної шини USB 3.0 тут немає.

Платформа AM3 +

Для роботи з процесорами серії FX потрібна материнська плата з роз'ємом AM3 +. Це може бути як модель на «новому» чіпсеті AMD 9xx, так і продукт з логікою попередніх поколінь. Сумісність з AM3 теоретично можлива, але не гарантується ні самої AMD, ні виробниками материнських плат. Не виключено, що останні випустять прошивки для своїх топових рішень, але це скоріше поодинокі випадки. І навіть в подібних ситуаціях чіпи FX будуть функціонувати зі зменшеною швидкістю перемикання станів Turbo Boost і Cool'n'Quiet. При цьому всі можливі проблемиз роботою системи ляжуть на плечі користувачів. Тому на безпроблемний апгрейд розраховувати в даному випадку не доводиться.

Плати з AM3 + легко відрізнити по чорному кольору процесорного роз'єму, тоді як коннектор AM3 білий. На щастя, конструкція елементів кріплення СО не змінилася, тому для охолодження AMD FX підійде будь-який кулер, сумісний з AM2 / AM2 + / AM3.

Модельний ряд

3DMark 11, тест CPU (Physics), бали
3DMark Vantage, бали
PC Mark 7, тест Cоmputation, бали
CineBench 11.5, бали
x264 HD Benchmark 4.0, кадри / c
7-Zip 9.20, MIPS
Far Cry 2, 1920 × 1080, DX10, висока якість, Кадри / c
Hard Reset, 1920 × 1080, режим High, кадри / c
Metro 2033, 1920 × 1080, DX11, PhysX, висока якість, кадри / c
Colin McRae: DiRT 3, 1920 × 1080, висока якість, кадри / c
Lost Planet 2, 1920 × 1080, DX11, висока якість, тест B, кадри / c
Crysis 2, 1920 × 1080, DX9, висока якість, тест Downtown, кадри / c
Енергоспоживання системи, Вт

завдяки модульній структуріпроцесорів компанії нескладно вибудувати свій модельний ряд, пропонуючи пристрої з різними кількістюобчислювальних блоків і тактовою частотою. На старті лінійка десктопних чіпів, які отримали назву Zambezi, включає чотири CPU. Флагманом є восьмиядерна рішення FX-8150 з частотної формулою 3,6 / 3,9 / 4,2 ГГц. За 8 МБ кеш-пам'яті L2 і L3, а також TDP на рівні 125 Вт. Схожа по оснащенню і FX-8120, відмінність лише в частотному режимі роботи - 3,1 / 3,4 / 4,0 ГГц. Шестиядерний FX -6100 має 6 МБ кеш-пам'яті другого рівня і все ті ж 8 МБ L3, а ось його тепловий пакет - 95 Вт. найбільш доступна версіяз двома модулями і чотирма обчислювальними блоками x86 FX-4100 функціонує на 3,6 / 3,7 / 3,8 ГГц, задовольняється 4 МБ L2, ємним L3 (8 МБ) і TDP в 95 Вт. Що стосується вартості пристроїв, то рекомендовані оптові цінидля перерахованих моделей знаходяться на рівні $ 245/205/165/115 відповідно.

розгін

Можливість безперешкодного розгону процесорів є одним з ключових параметрів чіпів FX. На цю особливість компанія AMD робить окремий акцент. Вільний множник доступний всім моделям лінійки, а можливість його зміни буде присутній на будь-який платі з AM3 +.

Архітектура FX спочатку створювалася з урахуванням функціонування на високих тактових частотах. Умільці, озброєні судинами з рідким азотом, змогли отримати скріншот CPU-Z в ситуації, коли процесор працював майже на 8,5 ГГц. При цьому, правда, знадобилося залишити активним лише один модуль з чотирьох. Всі вісім ядер вдалося змусити функціонувати на 8,1 ГГц. Раніше подібних частот досягали хіба що максимально полегшені версії Intel Celeron для LGA775. Тепер же у ентузіастів з'явиться куди більш цікавий об'єкт для оверклокерських експериментів.

У випадку з повітряною системою охолодження доведеться задовольнятися більш скромними результатами. При підвищенні напруги живлення до 1,45 В CPU стабільно працював на 4,6 ГГц. Може і не настільки вражаюче, але потенціал очевидно краще, ніж у 45-нанометрових чіпів Phenom II.

підсумки

Результати тестів продуктивності представлені на діаграмах. Картина досить показова для того, щоб в цілому скласти думку про можливості нової розробки AMD. Процесори FX очікувано отримали приріст швидкодії в багатопоточних завданнях - створення резервної копії, кодуванні HD-відео, рендеринге. Тут восьмиядерна чіпу цілком під силу змагатися і з Core i5-2500K, і з більш дорогим Core i7-2600K. Однак як тільки справа доходить до додатків з неважливою оптимізацією для паралельного виконання коду, AMD FX здають позиції - питома продуктивність їх x86-блоків навіть трохи нижче, ніж у продуктів з архітектурою K10. В іграх, які в кращому випадку задіють 3-4 потоку, помітну перевагу у процесорів від Intel. якщо використовувати максимальні налаштуванняякості графіки, де відеокарта стає обмежувачем, показники систем вирівнюються, але оцінити реальний потенціал CPU в таких умовах неможливо.

Перехід на 32-нанометровий техпроцес, скоріше, дозволив утримати енергоспоживання на колишньому рівні при збільшеному швидкодії. Ймовірно, пріоритетом в даному випадку була саме продуктивність, а не поліпшена економічність CPU.

Навіть судячи з вартості AMD FX очевидно, що компанія в першу чергу планує закріпитися в середній ціновій категорії, усвідомлено віддаючи Intel сегмент топових дорогих рішень. В поточних умовахгідно виступати в лізі «суперважковаговиків» об'єктивно виробник зараз не може. Зробивши ставку на багатоядерні обчислення, отримати видатні результати в слабо оптимізованому ПЗ дуже проблематично. Разом з тим лише п'ять років тому ми щиро дивувалися, кому може знадобитися на робочому столі чотирьохядерний процесор і як ефективно використовувати ресурси подібного CPU. Сьогодні ж це буденність, і переваги чіпів з такою кількістю обчислювальних блоків вже не викликають питань. Можливо, подібне визнання через якийсь час отримають і восьмиядерні моделі.

На щастя, AMD не буде склавши руки спостерігати, яка доля спіткає її процесори. Озвучені плани подальшого розвитку вселяють хоча і стриманий, але все ж оптимізм. Компанія продовжить активно допрацьовувати нинішню архітектуру, покращуючи як енергоефективність, так і продуктивність CPU, проте зазначені темпи - 10-15% на рік - не дуже вражають. З подібними показниками розраховувати на кардинальну зміну ситуації можна лише в тому випадку, якщо Intel сповільнить розвиток своїх продуктів, але передумов для цього немає - механізм «тік-так» поки що не давав збоїв. Уже навесні 2012 року будуть представлені чіпи Ivy Bridge, Виконані по 22-нанометровій технології і використовують 3D-транзистори.

Підсумкова оцінка розглянутої архітектури і процесора AMD FX-8150 на її основі неоднозначна, а це вже говорить про те, що революції не відбулося. Принаймні на даному етапі вона непомітна для кінцевого користувача. Якісний стрибок продуктивності має місце на добре распараллелівать додатках, тоді як в однопоточних завданнях серйозної прибавки не спостерігається. Великі очікування, які покладає на Bulldozer, виправдалися лише частково. AMD ще є над чим попрацювати, щоб запропонувати цікаві рішення і поборотися за місце в серцях вимогливих ентузіастів.