Методы организации параллельных вычислений в системах обработки данных на базе процессоров с суперскалярной архитектурой

Методы организации параллельных вычислений в системах обработки данных на базе процессоров с суперскалярной архитектурой

Автор: Скворцов, Сергей Владимирович

Автор: Скворцов, Сергей Владимирович

Шифр специальности: 05.13.13

Научная степень: Докторская

Год защиты: 1999

Место защиты: Рязань

Количество страниц: 468 с. ил.

Артикул: 292851

Стоимость: 250 руб.

Методы организации параллельных вычислений в системах обработки данных на базе процессоров с суперскалярной архитектурой  Методы организации параллельных вычислений в системах обработки данных на базе процессоров с суперскалярной архитектурой 

СОДЕРЖАНИЕ
ВВЕДЕНИЕ И ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ. Модели оценки эффективности параллельных вычислений. Параллелизм векторных и скалярных вычислений. Анализ состава операций и операндов реальных программ. Анализ известных архитектурных решений проблемы распараллеливания скалярных вычислений. Методы оптимизации скалярных вычислений в процедурах генерации параллельного микрокода. СУПЕРСКАЛЯРНОЙ АРХИТЕКТУРОЙ. Целочисленная модель задачи оптимизации объектного кода по критерию времени. Задачи локальной оптимизации объектного кода на основе дизъюнктивной теоретикографовой модели. Общий подход к решению задачи синтеза параллельных объектных программ с циклами и ветвлениями. Сравнение с известными моделями и методами. Выводы. ФРАГМЕНТОВ КОДА 0
и оптимизируются компилятором с целью выделения параллельных операций и кодирования их в длинных КС при генерации объектного кода. Такой подход реализован в процессорах с управлением по принципу VI, к которым относят известную модель i0 4, 5, 7 фирмы I, процессор отечественной суперЭВМ Эльбрус3 4, 0, процессор на кристалле i 9, процессоры обработки мультимедиаданных ii , 1 фирмы ii i США, процессоры семейства XX , для параллельной обработки сигналов фирмы vi и другие современные модели, например РА 6.


Все семь ФУ выполнены конвейерными, что обеспечивает возможность загрузки каждого устройства в каждый такт синхронизации. Кроме того, КС обеспечивает управление записью результатов в регистровую память, выполнение условного или безусловного перехода, а также параллельное обращение по восьми каналам к локальной и глобальной оперативной памяти. Основное преимущество здесь очевидно если аппаратный декодер просматривает программу вперед всего лишь на несколько ближайших команд, то компилятор обрабатывает программу в целом и в процессе оптимизации вычислений может переставлять команды таким образом, чтобы добиться максимальной степени параллелизма, а следовательно, и эффективности объектного кода. Однако, суперскалярные процессоры с управлением по принципу ЫУ имеют существенный недостаток, который препятствует их широкому распространению в качестве элементной базы универсальных ВС и заключается в отсутствии программной совместимости даже внутри семейства процессоров. Это связано с тем, что компилятор формирует объектный код на основе конкретных данных о количестве и типах ФУ процессора, форматах длинных КС и возможных сочетаниях одновременно выполняемых операций. В результате полученный код не может быть качественным для всех процессоров семейства, так как они имеют отличающиеся архитектурные характеристики. В настоящее время технология УЫЛУ с наибольшим успехом применяется в специализированных системах, предназначенных, в частности, для обработки мультимедиаданных в режиме реального времени.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.204, запросов: 244