Проектировщики микропроцессоров из японского института RIKEN считают, что специализация открывает безграничные возможности.
RIKEN (это англизированный акроним от названия японского Института физических и химических исследований) обнародовал информацию о процессоре MDGrape 3, который должен стать краеугольным камнем конструкции компьютера, способного обеспечить производительность в один терафлоп (квадрильон операций в секунду) — гораздо выше, чем 36 триллионов операций в секунду у современных суперкомпьютеров.
Выступив на конференции Hot Chips в Стэнфордском университете, сотрудник группы высокопроизводительных вычислений RIKEN Макото Тандзи рассказал, что опытные образцы этого чипа, разработанного для исследований в сфере наук о жизни, уже сейчас демонстрируют производительность в 230 гигафлоп, или 230 миллиардов операций в секунду, при тактовой частоте 350 МГц. При наихудшем сценарии чип выполняет 160 гигафлоп при тактовой частоте 250 МГц.
По словам Тандзи, высокая вычислительная мощность обеспечивается тем, что процессор оптимизирован для решения задач, содержащих множество подобных вычислений над относительно короткими наборами данных. Такие задачи часто встречаются в науках о жизни и бионанотехнологии, где нужно определять, например, как тот или иной белок будет взаимодействовать с тысячами разных молекул. Поэтому данный процессор и компьютеры на его основе можно будет непосредственно сравнивать с суперкомпьютерами общего назначения лишь в ограниченной области применения, зато там этот процессор будет блистать.
«Специализация позволяет получить стократное превосходство в производительности. В компьютерах общего назначения число операций сильно ограничено, — говорит Тандзи. — Чтобы MDGrape 3 мог проявить свои преимущества, количество вычислений должно значительно превышать количество данных».
Токийский университет начал работу над проектом MDGrape 15 лет назад с целью создания процессора для астрофизиков. Последние годы RIKEN, один из крупнейших в мире институтов биологических наук, занимался расширением архитектуры этого чипа для наук о жизни и молекулярной динамики, круг приложений которых становится все шире. Группа построит компьютеры на базе MDGrape для своего проекта Protein 3000, цель которого — определить характеристики 3000 белков. Эти машины должны заработать где-то в 2007 году.
Уже существуют коммерческие системы, использующие процессор MDGrape 2, который выполняет 16 гигафлоп при тактовой частоте 100 МГц, сказал Тандзи. Работа над MDGrape 3, который еще называют Protein Explorer, началась в 2002 году, а в 2006 должно начаться практическое применение этих процессоров.
Токийский университет тоже продолжает свои исследования, разрабатывая чип квази-общего назначения, выполняющий 1 терафлоп, или триллион операций в секунду. IBM и Университет штата Техас работают над аналогичным проектом «терафлоп на кристалле».
Архитектурно MDGrape 3 существенно отличается от большинства других процессоров. Он содержит 20 вычислительных конвейеров, тогда как у коммерческих чипов обычно бывает один или два. Кроме того, у MDGrape 3 есть то, что RIKEN называет архитектурой широковещательной памяти: данные принудительно подаются в разные конвейеры одновременно. В этом процессоре максимально используется принцип параллелизма.
Несмотря на отличия от других чипов, MDGrape 3 изготавливается по тому же 130-нм технологическому процессу, который широко применяется в последние годы.
Конструктивные усовершенствования привели к гигантским преимуществам по сравнению с процессорами общего назначения. По словам Тандзи, соотношение цена/производительность на гигафлоп у 350-МГц Grape 3 составляет $15, вместо $400 для Pentium 4, $650 для процессоров суперкомпьютера IBM Blue Gene/L и аж $4000 для процессоров самого быстродействующего на сегодняшний день суперкомпьютера NEC Earth Simulator.
Что касается потребляемой мощности, то 350-МГц MDGrape 3 рассеивает всего 14 Вт, или 0,1 Вт на гигафлоп. 3-ГГц Pentium 4 потребляет 82 Вт, или 14 Вт на гигафлоп, а процессоры Blue Gene/L и Earth Simulator соответственно по 6 и 128 Вт на гигафлоп.
RIKEN разрабатывает и компьютер на процессорах MDGrape 3. Две платы, по 12 процессоров на каждой, составят блок высотой 2U (3,5 дюйма). Все процессоры связаны друг с другом 81-канальной шиной, а платы поддерживают связь с остальным оборудованием компьютера по магистрали PCI Express.
Компьютер производительностью в петафлоп будет содержать 6144 процессора на 512 платах. Вся система разместится в 32 блоках, установленных в 19-дюймовые стойки. «Она очень компактна», — сказал Тандзи.
|