+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Организация параллельных вычислительных процессов в исполнительных устройствах машины нетрадиционной архитектуры

Организация параллельных вычислительных процессов в исполнительных устройствах машины нетрадиционной архитектуры
  • Автор:

    Янкевич, Евгений Александрович

  • Шифр специальности:

    05.13.15

  • Научная степень:

    Кандидатская

  • Год защиты:

    2003

  • Место защиты:

    Москва

  • Количество страниц:

    163 с. : ил. + Прил. (с.164-216: ил.)

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"
1.2. Обзор проектов построения суперкомпьютеров петафлопной производительности 
2.2. Исследование преимуществ использования ассоциативной памяти



Организация параллельных вычислительных процессов в исполнительных устройствах машины нетрадиционной архитектуры
Введение
Глава 1. Обзор методов организации вычислительных процессов в современных высокопроизводительных вычислительных системах и микропроцессорах
1.1. Краткий анализ архитектур современных высокопроизводительных вычислительных систем

1.2. Обзор проектов построения суперкомпьютеров петафлопной производительности


1.3. Исследование методов повышения производительности микропроцессоров, как компонентов многопроцессорных вычислительных систем
1.4. Анализ попыток создания вычислительных систем нетрадиционной архитектуры ...34 Выводы к первой главе
Глава 2. Исследование особенностей организации параллельных вычислительных процессов в вычислительной системе с автоматическим распределением ресурсов
2.1. Исследование принципов построения и функционирования предлагаемой вычислительной системы с автоматическим распределением ресурсов

2.2. Исследование преимуществ использования ассоциативной памяти


2.3. Анализ особенностей функционирования и реализации исполнительных устройств системы
2.4. Принципы реализации многопоточной обработки в исполнительном устройстве
2.5. Решение задачи повышения производительности на уровне модуля многопоточного исполнительного устройства
2.6. Алгоритмы функционирования и структура многопоточного исполнительного устройства
2.7. Алгоритмы функционирования и структура устройств, входящих в состав модуля многопоточного исполнительного устройства
Выводы по второй главе
Глава 3. Разработка алгоритмов обработки данных в многопоточном исполнительном устройстве вычислительной системы с автоматическим распределением ресурсов
3.1. Обработка пар токенов в многопоточном исполнительном устройстве
3.2. Алгоритм выполнения стандартных арифметических команд
3.3. Обработка прерываний в многопоточном исполнительном устройстве
Выводы к третьей главе
Глава 4. Создание макета исполнительного устройства системы с автоматическим распределением ресурсов и разработка методов снятия с него информации
4.1. Выбор элементной базы и конструктив для реализации макета
4.2. Инструментальная среда и методология проектирования макета
4.3. Разработка макета исполнительного устройства
4.4. Методы снятия и анализа информации с макета исполнительного устройства
4.5. Перспективы развития макета исполнительного устройства
Выводы к четвертой главе
Заключение
Литература
Перечень сокращений
Введение

Актуальность проблемы. В наше время передовые фундаментальные научные исследования являются одним из тех факторов, которые определяют национальную безопасность и экономическую независимость государства. Прорыв во многих научных областях оказался возможен благодаря применению в исследованиях высокопроизводительной вычислительной техники.
Современные вычислительные задачи предъявляют растущие требования к производительности вычислительных систем. В настоящее время требуемая производительность суперЭВМ для решения большинства фундаментальных задач оценивается 1012-1015 оп/с с соответствующими объемами оперативной памяти высокого быстродействия.
Производительность наиболее мощных вычислительных систем - суперкомпьютеров возрастает, ориентировочно, на порядок за пятилетие. Рост производительности вычислений и обработки данных происходит как за счет повышения быстродействия физических элементов, так и за счет увеличения числа элементов в вычислительной установке. Большинство суперкомпьютеров в настоящее время строится на основе объединения требуемого числа микропроцессоров в условиях организации массового распараллеливания обработки. В этих условиях решающими становятся следующие параметры - время доступа к памяти, время межпроцессорного обмена, а также процесс синхронизации по данным между параллельными вычислительными процессами.
Таким образом, в настоящее время повышение производительности компьютерной техники идет в основном за счет улучшения кремниевых технологий, в частности за счет снижения технологических норм изготовления кремниевых микросхем, и за счет увеличения вследствие этого в несколько раз скорости работы микропроцессорной элементной базы, а также за счет повышения на несколько порядков плотности компоновки вентилей на одном кристалле. Но этого не всегда достаточно для сложных задач проблемного характера (а именно в основном для них и создаются суперЭВМ), работающих с, так называемыми, глобальными данными — данными с которыми одновременно работают несколько вычислительных процессов. Необходима разработка новых архитектурных методов построения вычислительных систем, а также совершенствование и разработка новых методов организации вычислительных процессов.
В настоящее время повышается пиковая производительность вычислительных систем, в то время как реальная производительность на разных классах задач остается низкой. Для большинства современных суперЭВМ отношение пиковой производительности, заявленной
производителем, к реальной превосходит порядок. Это означает, что эффективность использования современных систем массового параллелизма чрезвычайно низка и падает с увеличением числа процессоров в системе. Так как с увеличением числа процессоров в системе для задач, оперирующих глобальными данными, резко падает коэффициент их загрузки. Загрузка вычислительной системы может быть удовлетворительной только на задачах, работающих с локальными данными, и то после их адаптации к вычислительной системе.
Вопрос загрузки вычислительных средств является принципиальным тормозом на пути повышения производительности. Принципиальным является то обстоятельство, что программист при составлении программы не может иметь информацию о том, сколько времени тот или иной параллельно выполняемый фрагмент задачи будет выполняться на процессоре или других ресурсах вычислительной системы. Во многих случаях, время занятости того или иного ресурса вычислительной системы зависит от данных, с которыми работает программа.
Задача загрузки вычислительных средств может быть эффективно решена

аппаратными средствами в динамике выполнения вычислений. Это обстоятельство вынуждает перейти к поиску методов построения вычислительных систем на новых нетрадиционных принципах и разработке методов организации параллельных вычислительных процессов в этих системах. Встает задача поиска новых архитектурных решений, обеспечивающих автоматическое распределение вычислительных процессов по ресурсам вычислительных средств, с целью эффективного их использования.
Данная диссертационная работа посвящена проблеме организации параллельных вычислительных процессов в исполнительных устройствах вычислительной машины нетрадиционной архитектуры, обеспечивающей автоматическое распределение ресурсов системы между вычислительными процессами. Актуальность этой проблемы определяется необходимостью исключения процесса распределения вычислительных ресурсов при написании программы, повышения эффективности использования вычислительных средств, эффективной синхронизации вычислительных процессов и сокращения затрат на систему прерывания систем реального времени. Таким образом, новая архитектура вычислительной системы предъявляет новые требования и определяет новые задачи к применению исполнительных устройств системы. В связи с чем, возникает проблема разработки исполнительных устройств, отвечающих всем требованиям новой архитектуры и обеспечивающих максимальную производительность всей системы, построенной на новых архитектурных принципах.

на длину извлеченной инструкции, так, чтобы он всегда содержал адрес следующей. Глобальная адресуемая память и счетчик инструкций, таким образом, создают поток инструкций, которые устройство управления декодирует, а операционные устройства исполняют, поэтому компьютеры архитектуры фон Неймана носят еще название машин с потоком инструкций, или машин потока команд [46].
Любой вычислительный процесс может быть представлен графом потока данных (dataflow graph) - это ориентированный граф, узлами которого являются операторы (акторы), выполняемые над данными, а по дугам графа перемещаются данные. Вычислительные машины архитектуры потока данных реализуют непосредственное выполнение данного графа. Это обеспечивает параллельность вычислительных процессов, заданных программой, и исключает конфликтные ситуации по данным, возникающие из-за того, что при использовании памяти есть риск при неправильной синхронизации вычислительного процесса вместо новых данных взять из памяти старые данные или наоборот [11].
Данные, передаваемые по дугам графа, именуются "токенами”. Токены представляют из себя сложную структуру, которая помимо самого данного содержит в себе операцию, которая будет выполнена над данным, а также некий контекст, идентифицирующий это данное. Вторым фундаментальным понятием концепции машины потока данных является понятие оператора (узла) или "актора". Вычисления в машине потока данных организуются следующим образом: значения (токены) передаются между операторами (узлами), когда узел получает все необходимые значения для выполнения операции, он активизируется, поглощает входные токены, а после завершения операции порождает токен результата, пересылаемый к другому узлу, для которого он становится входным [9, 89].
Компьютер потока данных не имеет ни глобальной памяти, ни счетчика инструкций. Машина потока данных вообще не имеет дела с адресами ячеек памяти, в которых лежат некоторые величины, она имеет дело только с величинами, каждая из которых представляет самостоятельный объект.
В компьютерах архитектуры фон Неймана последовательность выполняемых инструкций образует поток управления, который создается с помощью счетчика инструкций и глобальной памяти, откуда инструкции извлекаются [46]. В этих компьютерах инструкция выполняется, когда на нее указывает счетчик инструкций. В компьютерах потока данных никаких указателей на инструкции нет, и принцип активизации операций (узлов) совсем другой: операция объявляется готовой к исполнению, как только на ее входные дуги поступит полный набор величин (токенов). Например, инструкция сложения будет готовой к исполнению, как только на ее входные две дуги поступят и первое, и второе слагаемое. Пока набор входных токенов не содержит полного набора операндов для данной операции, она

Рекомендуемые диссертации данного раздела

Время генерации: 0.112, запросов: 967