+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Отображение DVMH-программ на кластеры с графическими процессорами

  • Автор:

    Притула, Михаил Николаевич

  • Шифр специальности:

    05.13.11

  • Научная степень:

    Кандидатская

  • Год защиты:

    2013

  • Место защиты:

    Москва

  • Количество страниц:

    105 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

Оглавление
Введение
Актуальность темы
Цели работы
Постановка задачи
Научная новизна работы
Практическая значимость
Апробация работы и публикации
Краткое содержание работы
Глава 1. Обзор языков и технологий программирования для кластеров и графических процессоров
1.1 Разработанное расширение БУМ-модели
1.1.1 Организация вычислений, спецификации потоков данных
1.1.2 Управление отгружаемыми данными, актуальностью
1.1.3 Пример программы на языке Фортран-ОУМН
1.2 Обзор высокоуровневых моделей программирования для ускорителей20 Глава 2. Схема построения компилятора с языка Фортран-ОУМН
2.1 Схема работы компилятора с языка Фортран-БУМН
2.2 Основные функции системы поддержки выполнения БУМН-программ
Глава 3. Алгоритмы учета актуального состояния переменных при выполнении ОУМН-программ
3.1 Способы управления перемещениями данных на ускоритель и обратно
3.1.1 Ручное копирование
3.1.2 Указание входных и выходных данных для фрагментов программы
3.2 Недостатки ручного копирования
3.3 Определения терминов и базовых операций

3.4 Алгоритмы учета состояния актуальности переменных
3.4.1 Обработка входа в вычислительный регион
3.4.2 Обработка запроса актуализации
3.4.3 Обработка указания SHADOW_RENEW
3.4.4 Обработка указания REMOTE_А CCESS
3.4.5 Обработка указания CONSISTENT
Глава 4. Режимы распределения данных и вычислений между вычислительными устройствами
4.1 Схема выполнения DVMH-программы
4.2 Режимы распределения данных и вычислений
4.2.1 Простой статический режим
4.2.2 Динамический режим с подбором распределения
4.2.3 Динамический режим с использованием подобранной схемы распределения
Глава 5. Алгоритм распределения подзадач между узлами кластера
5.1 Формализация постановки задачи
5.1 Эвристический алгоритм распределения подзадач
5.2 Способы применения предложенного алгоритма
Глава 6. Дополнительные возможности по функциональной отладке и отладке производительности
6.1 Сравнение при завершении региона
6.2 Сравнение при входе в регион и при выполнении запроса актуализации
6.3 Возможности по отладке производительности
Глава 7. Приложения и тесты, разработанные с использованием языка Фортран-DVMH
7.1 Приложения, демонстрирующие применимость языка Фортран-DVMH
7.1.1 Каверна
7.1.2 Контейнер

7.1.3 Состояния кубитов
7.1.4 Кристаллизация
7.1.5 Спекание
7.1.6 Спекание
7.2 Тесты на производительность из набора NASA ИРВ
Заключение
Литература
Приложение 1. Описание программного интерфейса системы поддержки
выполнения БУМН-программ
Инициализация системы поддержки и завершение с ней работы
Запросы актуализации данных в основной памяти
Объявление актуальности данных в основной памяти
Вспомогательные функции для поддержки ЭУМ-директив
Уничтожение переменных
Сервисные функции для вызова из обработчиков
Функции работы с вычислительными регионами
Функции работы с параллельными циклами и последовательными участками внутри регионов

Под растягиванием профиля теневых граней подразумевается формирование требований актуальности D на основе профиля теневых граней Р по правилу: D(ibi2,...,in)=P(I(iiUi)(i|-Ui), 1(12<В2Хь-B2)+I(i2>U2)(i2-U2), I(inUn)(in-Un)), где В, и Uj являются нижними и верхними границами локальной части соответственно (включительно).
Далее приводятся алгоритмы учета актуального состояния данных при различных ситуациях.
3.4.1 Обработка входа в вычислительный регион
При входе в вычислительный регион системе поддержки выполнения сообщается о каждой переменной направления ее использования для ее подмассивов. Это делается или как результат указаний пользователя, или как результат анализа компилятором. Для каждого массива задается отображение из множества индексов массива во множество {О, IN, OUT, INOUT, LOCAL, INLOCAL}, где: 0 означает, что данный элемент не используется в регионе; IN - региону нужно актуальное значение и данный элемент может использоваться только на чтение; OUT - региону не нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение может быть использовано далее; INOUT -региону нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение может быть использовано далее; LOCAL - региону не нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение не может быть использовано далее; TNLOCAL - региону нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение не может быть использовано далее.
После определения распределения данных по устройствам (определения локальных частей каждого массива на каждом устройстве),

Рекомендуемые диссертации данного раздела

Время генерации: 0.543, запросов: 967