12.07.2015 Views

ПРАЗДНИК ТЕХНОМАНЬЯКА - Xakep Online

ПРАЗДНИК ТЕХНОМАНЬЯКА - Xakep Online

ПРАЗДНИК ТЕХНОМАНЬЯКА - Xakep Online

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

ИНФО/ТЕХНОЛОГИЯМатеринская плата на основе новейшего чипсета RD790 с поддержкой HyperTransport 3.0Визуальная схема работыHTX-порта(чередование приоритета запросов, priority requestinterleaving). То есть во время передачи одним устройствомпакета данных другое устройство можетвставить в него запрос на чтение, и в то время,пока передача первым устройством продолжается,второе может уже принимать результат запроса(поскольку шина дуплексная, то бишь двунаправленная).Заявленная латентность на 20 нс меньшепри большой загруженности шины.Оптимизация на физическом уровне представленаиспользованием только одной дорожки для опорнойчастоты на одну восьмибитную шину, против однойна каждую линию PCI-E. У PCI-E из 10 передаваемыхбит только 8 несут полезную информацию,оставшиеся 2 – служебные. Таким образом, HTна 25% эффективнее использует пропускнуюспособность, так же как и не имеет задержек наконвертирование данных 8/10 бит (принимаемых ииспользуемых на более высоких уровнях). МеньшееHTX-слот на материнской платеэнергопотребление также заявлено в качествеплюса, хотя никаких цифр не приводится. Пропускнаяспособность HT, с учетом потерь конвертирования8/10 бит у PCI-E, выше на 40%.На канальном уровне разница в скорости достигаетсяза счет оптимизации структуры кадров. Пакетданных для HT может составлять от 4 до 64 байт,тогда как у PCI-E – 4-4096. Зато на служебнуюинформацию в одном кадре приходится 8-12 байту HT, тогда как у конкурента этот параметр составляет20-24 байта. Очевидно, что HT намного лучшеприспособлен к обмену небольшими (до 128 байт)пакетами, нежели PCI-E, скорее рассчитанный набольшие блоки данных. Разница в эффективностиструктуры кадра разнится от 100% в пользу HT намалых пакетах до -15% на больших (от 1024 байт)пакетах. Паритет достигается на размере в 128байт. Таким образом, в большинстве ситуацийHT будет заметно лучше или, в худшем случае,ненамного хуже соперника. Данное обстоятельстводелает технологию весьма ценной для реализацииприложений MPI (Message Passing Interface), характеризующихсяобменом весьма малыми пакетами,а потому весьма критичных к латентности. Именноэти факторы сводят на нет всю теоретическуюмощность технологии Ethernet, заставляя ееработать в очень неоптимальном режиме. Полагаю,именно шины, подобной HT, давно ждали компании,выпускающие адаптеры для Infiniband и Myrinet.Архитектурные различияС точки зрения архитектуры технологияHyperTransport также выглядит более выгодной,поскольку является родной для процессора и нетребует сторонней системной логики для работы.PCI-E, наоборот, будучи периферийной шиной,требует для работы мост, управляющий шиной, содной стороны, и общающийся с процессором – сдругой. Intel собирается внедрить в свои будущиепроцессоры поколения Nehalem контроллер шиныPCI Express, но насколько он будет «нативным»,то есть родным архитектуре процессора, покажетвремя. Пока мы имеем задержку в 190 нс при работес шиной PCI-E и около 340 нс – при небольшихзапросах к памяти у Intel и на 55% меньшие (ввидуотсутствия посредника – сторонней логики) – уHT-концорциума. Уже на текущий момент удалосьсоздать сетевые адаптеры, обладающие на 64%большей производительностью в серверныхприложениях, чем обычно. Тому причиной, в первуюочередь, именно низкая латентность (от чего и зависятбольше MPI-приложения) и, отчасти, большаяпропускная способность.Примерами таких адаптеров являются PathscaleInfinipath HTX, обещающий 1.26 мкс в MPI, и MyricomMyri-10G NIC (поддерживающий два протокола10 Гб Ethernet и 10G Myrinet) с заявленнойлатентностью 2 мкс. Для примера можно привеститрадиционные для них 7 и 10 мкс соответственно.Для типичных приложений, используемых в высокопроизводительныхсистемах, разница во временипередачи пакета может составлять от 17 нс до6.1 мкс. С учетом того, что использовались PCI-E1.0 2,5 ГГц и HTX 800 МГц, можно понять, что хотястандарт PCI-E и подрос до второй версии и удвоилпропускную способность, у HTX есть в запас в 3.25раза, что с головой перекроет возможности PCI-E.Так, простой расчет показывает, что 16-битный HTXтогда будет иметь скорость, эквивалентную PCI-E2.0 x21. Шины больше x16 (а из таковых стандартомразрешена лишь конфигурация x32) весьма редки ипочти не встречаются, впрочем, как пока и серверныеустройства, работающие в режиме PCI-E 2.0.Новшества HT 3.0Одним из самых заметных изменений может показатьсявозросшие тактовая частота и, как следствие,пропускная способность. С максимальнойчастоты в 1400 МГц (а в процессорах AMD Athlon64s939/AM2 поддерживалась частота в 1000 МГц) онавыросла до 2600 МГц. Максимальная пропускнаяспособность повысилась до 20.8 ГБ/с (в одномнаправлении) супротив максимальных 11.2 ГБ/с вверсии HT 2.0, что означает повышение теоретическойскорости на 85%. Стали поддерживаться новыечастотные режимы – 1800, 2000, 2400 и 2600 МГц.На деле, очень интересным нововведением являетсявозможность динамического изменения частотышины. Как известно, частота ядер процессора неможет быть ниже частоты HT. Потому снижение частотыHT «на лету» может увеличить функциональностьрежимов энергосбережения. Просто меняя098

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!