ПРИМЕЧАНИЕ------------------------------------------------------------------------------------------------------

Для того чтобы понять, как сильно нагревается микропроцессор даже в простом персональном компьютере, не надо быть специалистом: достаточно жарким летним днем попытаться поработать, положив ноутбук на колени. Через 15-20 минут вы в полной мере поймете, насколько близко к технологическим пределам подошла микропроцессорная техника.

Таблицы 12.3 и 12.4. достаточно точно характеризуют современное положение на рынке микропроцессорных устройств. Естественно, в эти таблицы попали только фирмы-лидеры и только лучшие образцы современных микропроцессоров. Несмотря на неполноту этих данных, по ним можно отметить как уровень, на ко­тором находится микропроцессорная техника, так и направления, в которых она развивается.

Таблица 12.3. Микропроцессоры для персональных компьютеров и рабочих станций
Производитель Название (серия) Количество ядер Частота процессора, ГГц Дополнительные сведения
Intel Intel® Соге™2 Extreme Quad 3,2 FBD RAM, 12-мегабайтный кэш 2-го уровня
  Intel® Core™2 Quad 3,0 DDR2, DDR3,12-мегабайтный кэш 2-го уровня
  Intel® Core™ 2 Duo 3,33 DDR2, DDR3, 6-мегабайтный кэш 2-го уровня
AMD AMD Athlon™ X2 Dual-Core 3,200 32/64 bit operation mode
  AMD Athlon™ FX 3,0  
  AMD Athlon™ 2,400 32/64 bit operation mode

 

Таблица 12.4. Микропроцессоры для серверов
Производитель Название (серия) Количество ядер Частота процессора, ГГц Дополнительные сведения
Intel Intel® Xeon® серии 7400 3,5 64-bit, 16-мегабайтный кэш 3-го уровня, 256 Гбайт RAM, тех­нология виртуализации, самое низкое энергопотребление из расчета на одно ядро
  Intel Xeon серии 5000 3,4 64-bit, 8-мегабайтный кэш 3-го уровня, 64 Гбайт RAM, техноло­гия виртуализации
  Intel® Xeon® 3000 3,0 64-bit, 12-мегабайтный кэш 3-го уровня, 8 Гбайт RAM, техноло­гия виртуализации
  Intel® Itanium® 1,6 Технология Hyper-Threading, автоматическая регулировка энергопотребления
AMD Third- Generation AMD Opteron™ 2,5 64-bit, мегабайтный кэш 2-го уровня, архитектура direct connect для повышения скоро­сти межпроцессорного взаимо­действия
  Second- Generation AMD Opteron™ 3,6 64-bit, мегабайтный кэш 2-го уровня, архитектура direct connect для повышения скоро­сти межпроцессорного взаимо­действия
IBM POWER6 4,7 128-мегабайтный кэш 1-го уровня, 4-мегабайтный кэш 2-го уровня, 32-мегабайтный кэш 3-го уровня, ядро с двумя по­токами команд
  POWER7  
  CELL PowerXCell 8i 2 + 8 синер- гетических элементов 3,2  
SUN UltraSPARC T2 1,4 На сегодняшний день един­ственный процессор этого клас­са, выполненный по технологии System. On Chip, то есть име­ющий встроенную поддержку сети, шифрования и расширение ввода-вывода PCI Express

 

Сведения, содержащиеся в этих двух таблицах, достаточно ясно намечают бли­жайшие перспективы развития микропроцессоров, на основе которых создаются как персональные компьютеры, так и мощные серверы, или суперкомпьютеры. Все эти перспективы разворачиваются в первую очередь в сторону попыток обойти физические и технологические ограничения, сдерживающие рост производитель­ности процессоров.

□ Повышение количества ядер. На одном кремниевом кристалле создается не один процессор, а несколько. При этом, в зависимости от выбранной разработчиком архитектуры процессора, эти несколько процессоров могут совместно, зависимо использовать общие, расположенные на одном кристалле ресурсы (таким обра­зом повторяя в каких-то чертах структуру построения суперкомпьютеров) для повышения производительности, или могут быть настолько независимы друг от друга, чтобы на каждом из них одновременно можно было запустить свою операционную систему. Такая схема используется в процессорах Intel, что делает возможным эффективное применение технологии виртуализации.

□ Увеличение разрядности. Постепенно происходит переход от 32-разрядных процессоров к процессорам с 64-разрядной шиной. Для серверных процессоров это уже де-факто стандарт, для процессоров персональных компьютеров это реализованная на уровне процессора возможность. Надо заметить, что повы­шение разрядности вдвое не означает повышения вдвое производительности компьютера в целом. Однако для решения некоторых задач, требующих масси­рованной обработки данных, это именно так.

□ Автонастройка. Все больше процессоров оснащаются встроенными механизмами регулирования производительности, контроля температурного режима, энерго­потребления и производительности в зависимости от загруженности процессора.

□ Многопоточность ядра. Ядра процессоров получают возможность образовывать внутри себя несколько независимых потоков команд и выбирать тот, который в данный момент будет выполняться.

□ System-On-Chip. Целый комплекс задач, который раньше решался сочетанием аппаратных средств и средств операционной системы, теперь решается не­посредственно в мультипроцессорном кристалле. Это на порядок повышает скорость выполнения многих функций за счет сокращения числа обращений к системной шине и облегчает программирование многих приложений (напри­мер, если шифрование данных является встроенным).

□ Встроенные механизмы интеграции и масштабирования. Этим отличаются в основном серверные микропроцессоры; в их конструкцию изначально закла­дываются средства работы в «больших микропроцессорных коллективах», из которых собираются мощные серверы и суперкомпьютеры.

Суперкомпьютеры

Микропроцессорные устройства довольно близко подошли к технологическому пределу как своей миниатюризации, так и увеличения тактовой частоты. Самые производительные на сегодняшний день процессоры обеспечивают вычислитель­ную мощность меньше одной четырехтысячной самого производительного супер­компьютера. Каким же образом достигается эта невероятная скорость обработки информации? Механизм, при помощи которого удается создавать суперкомпьюте­ры, этих титанов компьютерного мира, один: параллельные вычисления.

Если между двумя точками пути, AwB, расстояние 100 км и на это рассто­яние нужно переместить некий пакет с сообщением, то нет никакой разницы, один человек будет его проходить, сотня или тысяча — результат будет одинаков, ускорения не произойдет. Однако если нужно почистить тысячу картофелин, то тысяча человек сработает в тысячу раз быстрее, чем один. То есть существуют такие задачи, которые можно решать параллельно (чистка картошки), и такие, которые решаются только последовательно (преодоление расстояния). К счастью, подавля­ющее большинство задач в компьютерном мире носят параллельный характер — будь то прием информации от метеорологических спутников, анализ состояния от сотен тысяч детекторов частиц адронного коллайдера или обработка запросов пользователей корпоративной информационной системы. Большинство научных расчетных задач и процессов моделирования также может быть разбито на парал­лельно выполняемые потоки. Каждая параллельная задача может обрабатываться одним микропроцессором. Таким образом, создание суперкомпьютера может быть сведено к решению следующей задачи: как соединить между собой множество микропроцессоров, чтобы каждый из них выполнял отдельное задание и в то же время они представляли собой единое целое, один микроэлектронный супермозг.

Существуют несколько способов заставить микропроцессоры выполнять парал­лельные вычисления и множество вариантов классификации этих конфигураций. Наиболее информативной и часто используемой (а также наиболее простой) яв­ляется классификация Флинна (рис. 12.8).

  Одиночный поток команд (Single Instruction) Множество потоков команд (Multiple Instruction)
Одиночный поток команд (Single Data) SISD MISD
Множество потоков данных (Multiple Data) SIMD MIMD
Рис. 12.8. Классификация Флинна

 

 


 

К этому классу можно отнести все настольные компьютеры с одним процес­сором. В этом случае мы имеем одну последовательность инструкций, которую выполняет процессор в одном потоке данных.

В этом классе один поток инструкций выполняется сразу над множеством на­боров данных. Такое поведение свойственно векторным процессорам, или вектор­ным машинам. Одна инструкция обрабатывается сразу множеством процессоров, каждым в своей памяти, или одним процессором, но сразу во множестве регистров. Это дает возможность за один такт обработать большой массив данных. Массив однотипных данных составляет вектор, отсюда и название подобного рода про­цессоров (архитектур).


 

Этот класс является пустым, поскольку есть только теоретические предпо­ложения о том, как могла бы выглядеть подобная архитектура, но практической реализации ни одной нет.


 

В этом классе множество потоков команд выполняется над множеством потоков данных. К данному классу можно отнести практически все современные суперком­пьютеры, оснащенные большим числом микропроцессоров.

Кроме этой классификации есть еще множество других вариантов классикации компьютеров, выполняющих параллельные вычисления и уточняющих диаграмму Флинна. К примеру, очень важным показателем является то, как процессоры, вхо­дящие в состав суперкомпьютера, взаимодействуют с памятью.


 

Все микропроцессоры, входящие в состав суперкомпьютера, подключены к од­ному адресному пространству, к одной памяти при помощи специальной высоко­скоростной шины памяти. При этом все эти процессоры абсолютно равноправны с точки зрения доступа к любому адресу этой памяти. Эта архитектура дает наи­больший выигрыш по производительности, но плохо масштабируется (расширяет­ся) и не может содержать большого количества процессоров, поскольку увеличение количества процессоров приводит к резкому возрастанию вероятности конфликтов при доступе к одним и тем же адресам памяти. Кроме того, сама высокоскоростная шина имеет физические ограничения, не позволяющие наращивать ее объем.


 

В этом случае общей памяти нет. Каждый процессор или модуль с несколькими процессорами является владельцем своего банка памяти, а между процессорами (модулями) устанавливаются соединения, образующие топологию вычислитель­ной системы. Соединения могут быть выполнены как при помощи обыкновенных сетевых устройств, так и посредством специальных вспомогательных компьютеров, предназначенных для высокоскоростной передачи данных (транспьютеров).


 

Обычно это одна из перечисленных архитектур (SMP, MPP или NUMA), в ко­торой задействованы не обычные скалярные процессоры, а специальные процес­соры векторно-конвейрного типа. Это дает возможность эффективным образом организовывать параллельные вычисления любого типа. Недостатком такой архи­тектуры является большая стоимость как самих процессоров, так и программного обеспечения для организации вычислений.


 

В состав кластера могут входить как специализированные компьютеры, то есть изготовленные специально для организации кластера, так и обыкновенные рабочие станции. Физически кластеры могут быть организованы в одной локальной сети (гомогенная организация) или объединяться через разного рода сетевые соеди­нения, включая Интернет (так называемая гетерогенная структура). Кластерная организация суперкомпьютеров на сегодняшний день является суперпопулярной. Достаточно сказать, что из 500 самых мощных суперЭВМ в мире 400 созданы на основе кластерной архитектуры. И еще несколько важных понятий:

□ Суперскалярный процессор — процессор, который способен выполнить несколь­ко операций за один такт. Естественно, для того чтобы это стало возможным, у суперскалярного процессора должны быть «в подчинении» независимые устройства, которым можно разослать этот пакет команд для обработки.

□ Конвейерная обработка — при такой обработке повторяющаяся последова­тельность операций делится на ряд подопераций и каждая подоперация вы­полняется отдельным процессором. В результате получается, что за один такт выполняется не одна, а множество команд.

□ RISC (Reduced Instruction Set Computer) — компьютер с сокращенным набором команд. В результате сокращения в наборе команд процессора остаются только инструкции, которые можно выполнить за 1-2 такта (в то время как в полном наборе команд могут быть инструкции, требующие 4-6 тактов).

При такой архитектуре несколько процессоров объединяются между собой в SMP-узел, а SMP-узлы, в свою очередь, образуют МРР-архитектуру.

Одним из важнейших показателей, при помощи которых оценивают суперком­пьютеры, является производительность. Производительность измеряется в коли­честве операций с плавающей точкой в секунду (Float Point Operation Per Second, FLOPS). Рост этого показателя для суперкомпьютеров сравним с тенденцией роста плотности транзисторов для микропроцессоров. В 2000 г. еще только ставилась за­дача преодоления барьера в 1 TFLOPS (терафлопс, миллиард флопсов), а в 2008 г. уже был преодолен рубеж в 1 PFLOPS (петафлопс, триллион флопсов).

Современные достижения в суперкомпьютерной технике отслеживает специ­альный рейтинг пяти сотен самых производительных суперкомпьютеров в мире. В настоящее время 5 первых строчек этого рейтинга занимают американские компьютеры (табл. 12.5).

Таблица 12.5. Первые пять мест рейтинга самых мощных суперкомпьютеров
Место Страна Система и производитель Кол-во процессоров Макс. произв., TFLOPS Пиковая произв., TFOLPS
DOE/NNSA/LANL United States BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz/Opteron DC 1.8 GHz, Voltaire Infiniband IBM 122 400 1375,78
DOE/NNSA/LLNL United States eServer Blue Gene Solu­tion IBM 212 992 478,2 596,38
Argonne National Laboratory United States Blue Gene/P Solution IBM 163 840 450,3 557,06
Texas Advanced Com­puting Center/Univ. of Texas United States SunBlade x6420, Opteron Quad 2Ghz, Infiniband Sun Microsystems 62 976 503,81
Oak Ridge National Laboratory United States Cray XT4 QuadCore 2.1 GHz Cray Inc 30 976 260,2

 

Из этих пяти пунктов видно, что всемирно известный производитель суперком­пьютеров корпорация Cray находится только на пятом месте. Новейший микро­процессор IBM CELL PowerXCell 8i с его гибкой архитектурой, в которой кроме 2 базовых ядер есть еще 8 вспомогательных, работающих как в режиме векторных сопроцессоров, так и в режиме независимых ядер, позволил не только выйти на первое место в рейтинге, но и преодолеть петафлопсный барьер.

Назначение современных серверов самое широкое: серверы Интернета, серверы телекоммуникационных систем, серверы информационных систем, серверы баз данных.

В рейтинге top500, благодаря выдвинутым в нашей стране приоритетам на осна­щение суперкомпьютерами университетов и научных центров, присутствие России увеличивается каждый месяц. На сегодняшний день в рейтинге уже 9 российских суперкомпьютеров, причем лучший из них занимает 36-е место (СКИФ МГУ).








Дата добавления: 2016-04-14; просмотров: 675;


Поиск по сайту:

При помощи поиска вы сможете найти нужную вам информацию.

Поделитесь с друзьями:

Если вам перенёс пользу информационный материал, или помог в учебе – поделитесь этим сайтом с друзьями и знакомыми.
helpiks.org - Хелпикс.Орг - 2014-2024 год. Материал сайта представляется для ознакомительного и учебного использования. | Поддержка
Генерация страницы за: 0.011 сек.