Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

БАЛАНСИРОВКА ВЫЧИСЛИТЕЛЬНОЙ НАГРУЗКИ ДЛЯ МНОГОЯДЕРНЫХ КЛАСТЕРОВ

Покупка
Основная коллекция
Артикул: 486155.0007.99.0065
Доступ онлайн
от 49 ₽
В корзину
Новиков, А. БАЛАНСИРОВКА ВЫЧИСЛИТЕЛЬНОЙ НАГРУЗКИ ДЛЯ МНОГОЯДЕРНЫХ КЛАСТЕРОВ / А. Новиков. - Текст : электронный // Вестник Удмуртского университета. Серия 1. Математика. Механика. Компьютерные науки. - 2008. - №2. - С. 197-198. - URL: https://znanium.com/catalog/product/499670 (дата обращения: 29.03.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.

ВЕСТНИК УДМУРТСКОГО УНИВЕРСИТЕТА


КОМПЬЮТЕРНЫЕ НАУКИ



2008. Вып.2

УДК 519.687.1

° А. К. Новиков




                БАЛАНСИРОВКА ВЫЧИСЛИТЕЛЬНОЙ НАГРУЗКИ ДЛЯ МНОГОЯДЕРНЫХ КЛАСТЕРОВ ¹




На примере конечно-элементного приложения рассматривается балансировка вычислительной нагрузки для многоядерных кластеров. Балансировка основывается на многоуровневом отображении расчетных данных и учитывает, что латентность и пропускная способность средств коммуникации между ядрами процессоров, между процессорами и между вычислительными узлами существенно отличаются.

Ключевые слова: вычислительный кластер, многоядерность, балансировка вычислительной нагрузки, метод конечных элементов.

   Современные многопроцессорные вычислительные системы строятся на основе многоядерных процессоров и многопроцессорных вычислительных узлов. Существенное различие в латентности и пропускной способности коммуникационных средств при обмене данными между процессами, размещенными на разных ядрах и разных вычислительных узлах, подтверждается результатами теста производительности межпроцессорных обменов [1], проведенного на МВ С-10 0k (Межведомственный суперкомпьютерный центр РАН, г. Москва). Латентность при однонаправленном обмене средствами MPI внутри вычислительного узла составляет 0.3-0.6 мкс, между вычислительными узлами 3-4 мкс. Пропускная способность внутри вычислительного узла в 1.5-2 раза выше.
   Применительно к параллельному конечно-элементному приложению учесть многоядерность вычислительной системы можно разделяя расчетную сетку на подобласти одним из следующих способов.
   1. Выбрать число подобластей сетки равным числу ядер процессоров.
   2.    Выполнить многоуровневое разделение сетки, создав дерево данных с корнем — исходной сеткой и числом листьев равным количеству ядер процессоров. В обоих случаях выделение вычислительных процессов и обмен осуществимы средствами стандарта MPI-1.
   3.    Выбрать число подобластей сетки равным количеству вычислительных узлов. Процессы внутри конечно-элементного приложения порождать

  Работа выполнена при финансовой поддержке РФФИ (грант 06-07-89015).

Доступ онлайн
от 49 ₽
В корзину