Средство анализа эффективности MPI программ
Постановка задачи
В системе DVM существуют развитые средства анализа эффективности выполнения параллельной DVM-программы. Эти средства являются более мощными, чем те, которые существуют для MPI-программ, поскольку многие важные характеристики выполнения MPI-программ (например, соотношение параллельных и последовательных вычислений) невозможно определить из-за отсутствия необходимой информации. Кроме того, в настоящее время при разработке MPI-программ у нас в стране практически не используются инструментальные средства отладки эффективности. Это вызвано следующими основными факторами: - разные средства требуют от пользователя знания их собственного интерфейса (отсутствие фактического стандарта); - отсутствием вообще каких-либо инструментальных средств анализа эффективности на многих параллельных ЭВМ. Поэтому важно создать такие средства для получения характеристик эффективности MPI-программ, которые могли бы быть доступны пользователям на любых многопроцессорных ЭВМ. Целью данной дипломной работы является создание экспериментальной системы отладки эффективности MPI-программ. Входными данными для нее будут трассы, создаваемые DVM-системой для функциональной отладки MPI-программ. В этих трассах отражены обращения к MPI-функциям и времена их работы. Для получения характеристик, аналогичных тем, которые выдаются для DVM-программ, от программиста потребуется дополнительная информация о том, какие вычисления являются параллельными, а какие последовательными (дублированными на каждом процессоре). Эти указания должны быть оформлены таким образом, что их наличие в MPI-программе не мешало ее правильному и эффективному выполнению на тех ЭВМ, где отсутствует данная система отладки эффективности MPI-программ. Таким же образом должны оформляться и средства описания тех интервалов выполнения программы, для которых требуется отдельно собирать все характеристики эффективности. Этапы работы анализатора. В работе анализатора можно выделить следующие этапы. Этап 1 Обработка трасс со всех процессоров и вычисление для каждого интервала и каждого процессора следующих характеристик: Основные характеристики и их компоненты Коэффициент эффективности (Parallelization efficiency) равен отношению полезного времени к общему времени использования процессоров. Время выполнения (Execution time). Число используемых процессоров (Processors). Общее время использования процессоров (Total time) - произведение времени выполнения (Execution time) на число используемых процессоров (Processors). Полезное время (Productive time) – прогнозируемое время выполнения на одном процессоре Потерянное время (Lost time). Коммуникации (Communication) и все компоненты. Простои (Idle time). Разбалансировка (Load _ Imbalance). Потенциальные потери из-за синхронизации (Synchronization) и все компоненты. Потенциальные потери из-за разброса времен (Time _ variation) и все компоненты. Характеристики выполнения программы на каждом процессоре Потерянное время (Lost time) - сумма его составляющих – потерь из-за недостаточного параллелизма (User insufficient _ par), системных потерь из-за недостаточного параллелизма (Sys insufficient _ par), коммуникаций (Communication) и простоев (Idle time). Простои на данном процессоре (Idle time) - разность между максимальным временем выполнения интервала (на каком-то процессоре) и временем его выполнения на данном процессоре. Общее время коммуникаций (Communication). Реальные потери из-за рассинхронизации (Real synchronization). Потенциальные потери из-за разброса времен (Variation). Разбалансировка (Load _ imbalance) вычисляется как разность между максимальным процессорным временем (CPU + MPI) и соответствующим временем на данном процессоре. Время выполнения интервала (Execution _ time). Полезное процессорное время (User CPU_time). Полезное системное время (MPI time). Число используемых процессоров для данного интервала (Processors). Времена коммуникаций для всех типов коллективных операций Реальные потери из-за рассинхронизации для всех типов коллективных операций. Потенциальные потери из-за рассинхронизации для всех типов коллективных операций. Потенциальные потери из-за разброса времен для всех типов коллективных операций. Этап 2 Подготовка текстового представления вычисленных характеристик. Такое представление упрощает первоначальный анализ характеристик при запуске параллельной программы на удаленной ЭВМ. Этап 3 Визуализация результатов анализа эффективности. Подсистема визуализации должна обеспечить графическое представление вычисленных характеристик эффективности и помочь пользователю их исследовать - позволить с разной степенью подробности просматривать историю выполнения программы и объяснять, как были вычислены те или иные характеристики.
Популярное: Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы... Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация... Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней... Как вы ведете себя при стрессе?: Вы можете самостоятельно управлять стрессом! Каждый из нас имеет право и возможность уменьшить его воздействие на нас... ©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (168)
|
Почему 1285321 студент выбрали МегаОбучалку... Система поиска информации Мобильная версия сайта Удобная навигация Нет шокирующей рекламы |