Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Притула, Михаил Николаевич
05.13.11
Кандидатская
2013
Москва
105 с. : ил.
Стоимость:
499 руб.
Оглавление
Введение
Актуальность темы
Цели работы
Постановка задачи
Научная новизна работы
Практическая значимость
Апробация работы и публикации
Краткое содержание работы
Глава 1. Обзор языков и технологий программирования для кластеров и графических процессоров
1.1 Разработанное расширение БУМ-модели
1.1.1 Организация вычислений, спецификации потоков данных
1.1.2 Управление отгружаемыми данными, актуальностью
1.1.3 Пример программы на языке Фортран-ОУМН
1.2 Обзор высокоуровневых моделей программирования для ускорителей20 Глава 2. Схема построения компилятора с языка Фортран-ОУМН
2.1 Схема работы компилятора с языка Фортран-БУМН
2.2 Основные функции системы поддержки выполнения БУМН-программ
Глава 3. Алгоритмы учета актуального состояния переменных при выполнении ОУМН-программ
3.1 Способы управления перемещениями данных на ускоритель и обратно
3.1.1 Ручное копирование
3.1.2 Указание входных и выходных данных для фрагментов программы
3.2 Недостатки ручного копирования
3.3 Определения терминов и базовых операций
3.4 Алгоритмы учета состояния актуальности переменных
3.4.1 Обработка входа в вычислительный регион
3.4.2 Обработка запроса актуализации
3.4.3 Обработка указания SHADOW_RENEW
3.4.4 Обработка указания REMOTE_А CCESS
3.4.5 Обработка указания CONSISTENT
Глава 4. Режимы распределения данных и вычислений между вычислительными устройствами
4.1 Схема выполнения DVMH-программы
4.2 Режимы распределения данных и вычислений
4.2.1 Простой статический режим
4.2.2 Динамический режим с подбором распределения
4.2.3 Динамический режим с использованием подобранной схемы распределения
Глава 5. Алгоритм распределения подзадач между узлами кластера
5.1 Формализация постановки задачи
5.1 Эвристический алгоритм распределения подзадач
5.2 Способы применения предложенного алгоритма
Глава 6. Дополнительные возможности по функциональной отладке и отладке производительности
6.1 Сравнение при завершении региона
6.2 Сравнение при входе в регион и при выполнении запроса актуализации
6.3 Возможности по отладке производительности
Глава 7. Приложения и тесты, разработанные с использованием языка Фортран-DVMH
7.1 Приложения, демонстрирующие применимость языка Фортран-DVMH
7.1.1 Каверна
7.1.2 Контейнер
7.1.3 Состояния кубитов
7.1.4 Кристаллизация
7.1.5 Спекание
7.1.6 Спекание
7.2 Тесты на производительность из набора NASA ИРВ
Заключение
Литература
Приложение 1. Описание программного интерфейса системы поддержки
выполнения БУМН-программ
Инициализация системы поддержки и завершение с ней работы
Запросы актуализации данных в основной памяти
Объявление актуальности данных в основной памяти
Вспомогательные функции для поддержки ЭУМ-директив
Уничтожение переменных
Сервисные функции для вызова из обработчиков
Функции работы с вычислительными регионами
Функции работы с параллельными циклами и последовательными участками внутри регионов
Под растягиванием профиля теневых граней подразумевается формирование требований актуальности D на основе профиля теневых граней Р по правилу: D(ibi2,...,in)=P(I(iiUi)(i|-Ui), 1(12<В2Хь-B2)+I(i2>U2)(i2-U2), I(in
Далее приводятся алгоритмы учета актуального состояния данных при различных ситуациях.
3.4.1 Обработка входа в вычислительный регион
При входе в вычислительный регион системе поддержки выполнения сообщается о каждой переменной направления ее использования для ее подмассивов. Это делается или как результат указаний пользователя, или как результат анализа компилятором. Для каждого массива задается отображение из множества индексов массива во множество {О, IN, OUT, INOUT, LOCAL, INLOCAL}, где: 0 означает, что данный элемент не используется в регионе; IN - региону нужно актуальное значение и данный элемент может использоваться только на чтение; OUT - региону не нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение может быть использовано далее; INOUT -региону нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение может быть использовано далее; LOCAL - региону не нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение не может быть использовано далее; TNLOCAL - региону нужно актуальное значение, данный элемент может использоваться как на чтение, так и на запись, причем новое значение не может быть использовано далее.
После определения распределения данных по устройствам (определения локальных частей каждого массива на каждом устройстве),
Название работы | Автор | Дата защиты |
---|---|---|
Метод редукции тестового набора для интеграционного тестирования | Кичигин, Дмитрий Юрьевич | 2010 |
Инструментальные средства синтеза языков и протоколов взаимодействия распределенных систем | Никифоров, Андрей Юрьевич | 2009 |
Разработка и исследование методов и программных средств параллельного выполнения функциональных программ на многоядерных компьютерах | Шамаль, Павел Николаевич | 2014 |