WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

загрузка...
   Добро пожаловать!

Pages:     | 1 || 3 |

где сопряженные функции являются решением соответствующей сопряженной системы уравнений. Зная градиент функционала, можно построить итерационный алгоритм решения обратной задачи инициализации. Алгоритм состоит в следующей последовательности шагов: 1) в решении прямой задачи и вычислении отклонения модельного решения от данных наблюдений (источники в сопряженной задаче); 2) в решении в обратном времени сопряженной задачи и вычислении градиента функционала; 3) в расчете поправки начального условия в соответствии с вычисленным градиентом функционала.

Сопряженная система уравнений имеет более сложный вид, чем уравнения исходной прямой модели, однако структура основных блоков одна и та же. Это достигается за счет симметризованной формы записи прямой системы уравнений и является оригинальной особенностью сигма-модели ИВМ РАН. Исключение составляют задачи, решаемые на этапах адаптации по вертикальной координате. Для решения такой задачи удобно использовать представление горизонтальных компонент вектора скорости в виде суммы их средних значений по вертикали и отклонений от них. В таком случае удается свести сопряженную задачу к виду, аналогичному для прямой, и воспользоваться разработанными алгоритмами решения прямой задачи.

В параграфе 2.4 разработан алгоритм идентификации для задачи переноса-диффузии тепла в океане. Сформулирована задача идентификации начальных и граничных условий как задачи минимизации функционала отклонения от данных наблюдений. Выписан итерационный процесс минимизации функционала и приведена теорема, обосновывающая разработанный алгоритм идентификации.

В третьей главе описаны разработанный метод распараллеливания сигма-модели динамики океана и эффективный алгоритм решения задачи для “функции уровня”.

Рисунок 1. Ускорение, полученное на МВС 1000М для пространственного разрешения 2.5°x2°x33 (148х88х33) и 0.5°х0.4°х33 (720х420х33) для области Мирового океана

Задача определения начального состояния океана является очень трудоемкой с вычислительной точки зрения. Наибольшее ускорение расчетов можно получить за счет параллелизации алгоритмов решения сигма-модели и использования супер-компьютеров. В параграфе 3.1 разработан метод и алгоритм распараллеливания программы решения уравнений сигма-модели ИВМ РАН с граничным условием “твердой крышки” для многопроцессорных вычислительных систем с распределенной памятью. Большинство современных программ моделирования динамики океана используют явные схемы для интегрирования уравнений по времени. В отличие от большинства моделей динамики океана способ решения уравнений модели циркуляции океана ИВМ РАН основан на использовании метода расщепления и неявных схемах. Проведен анализ наиболее трудоемких мест алгоритма решения уравнений модели. В параллельной программной реализации модели использован подход SPMD (одна программа – множество данных). Обмены между процессорами реализованы с помощью MPI. Основные трудности в распараллеливании программной реализации связаны с решением трехмерного уравнения переноса-диффузии с помощью неявных схем и расчетом функции тока. Дополнительные сложности связаны с использованием балансных конечно-разностных аппроксимаций на сдвинутых сетках и со сложностью расчетной области. Для блока переноса-диффузии предлагается использовать алгоритм с одномерным распределением данных по процессорам и транспонированием. На один шаг интегрирования по времени требуется две операции транспонирования.

В главе решена задача автоматического разбиения сложной расчетной области на одномерные подобласти, позволяющего сбалансировать нагрузку на процессоры. Если, например, для расчетной области Мирового океана применять равномерное распределение по широте и долготе, то нагрузка на один процессор больше, чем на другие в несколько раз. Для решения этой проблемы было применено равномерное распределение по числу расчетных точек. Разработан алгоритм автоматического разбиения, в котором учитывается сдвиг сеток для разных типов данных (температуры, компонентов вектора скоростей и функции тока).

Для параллельной версии модели получено ускорение в 12 раз для разрешения 2.5°x2°x33 (148х88х33) на 32 процессорах и в 68 раз на 180 процессорах для разрешения 0.5°х0.4°х33 (720х420х33) (см рис. 1).

В параграфе 3.2 описан разработанный алгоритм решения задачи модуля “функции уровня ” (2)-(4) дополненной соответствующими граничными условиями.

, (2)

, (3)

, (4)

где - широта, - долгота, - время, l – параметр Кориолиса, - средние по вертикали горизонтальные компоненты скорости,, - уровень океана, - коэффициент трения о дно - заданная положительная величина. К уравнениям (2)-(4) присоединяются граничные условия непротекания.

Уравнения (2)-(4) аппроксимируются неявно на интервале по времени и задача сводится к системе линейных алгебраических уравнений (СЛАУ) для, U, V. Так как матрица системы не меняется на каждом шаге по времени, а шагов по времени очень много, то временем необходимым для LU разложения матрицы или построения предобуславливателя можно пренебречь по сравнению со временем, требуемым для решения задачи с большим количеством правых частей. Соответственно, эффективный с точки зрения быстродействия, вычислительный алгоритм должен обеспечивать наиболее быстрое решение СЛАУ на каждом шаге по времени при ограничениях на использованную память. Для построения такого алгоритма используются современные методы решения разреженных СЛАУ, учитывающие свойства разреженности матрицы.

Таблица 1. Свойства и время решения СЛАУ в задаче о “функции уровня“ с помощью прямого метода

прямой метод решения (Super Lu)

Число неизвестных

16879

Число ненулевых элементов в матрице

106657

Число ненулевых элементов в L

1274839

Необходимая память

16M

Время на LU разложение (сек.)

0,85

Время на решения СЛАУ с одной правой частью (сек.)

0,03

Таблица 2. Время решения одной СЛАУ в секундах для задачи o “функции уровня“ без учета времени на построение предобуславливателя с помощью выбранных итерационных методов. (lfill максимальное число внедиагональных элементов в неполном LU разложении (ILUT), droptol порог отбрасывания внедиагональных элементов в предобуславливателе)

 

итерационные методы

параметры предобуславливания

GMRES

BCG

TFQMR

DQGMRES

без предобуславливания

33

Нет сходимости

Нет сходимости

33

ILU(0)

7

4,95

3,06

14

ILUT(lfill = 10, droptol = 0)

2,5

3,3

2,18

3,87

ILUT(lfill = 30, droptol = 0)

0,46

0,73

0,73

0,51

ILUT(lfill = 50, droptol = 0)

0,35

0,63

0,39

0,4

ILUT(lfill = 70, droptol = 0)

0,32

0,51

0,31

0,37

ILUT(lfill = 100, droptol = 0)

0,34

0,43

0,28

0,37

ILUT(lfill = 100, droptol = 1E-4)

0,34

0,42

0,33

0,37

ILUT(lfill = 100, droptol = 1E-6)

0,28

0,342

0,28

0,32

ILUT(lfill = 100, droptol = 1E-8)

0,32

0,37

0,26

0,34

Полученная в результате дискретизации СЛАУ, в зависимости от свойств вычислительной техники и размерности системы, решается либо разреженными прямыми методами (SuperLu), либо итерационными методами на основе Крыловских пространств с неполным LU разложением матрицы в качестве предобуславливателя. Проведено сравнение разных методов решения СЛАУ для задачи (2)-(4). В таблице 1 приведены параметры матрицы, полученной из задачи для “функции уровня”, для расчетной области Охотского моря с числом расчетных точек 173x88 и показано время необходимое для LU разложения матрицы и решения треугольной матрицы. В таблице 2 приведено время решения одной СЛАУ c помощью итерационных методов с предобуславливанием для задачи о “функции уровня”. Видно, что, если памяти для хранения разложения матрицы достаточно, то имеет смысл использовать прямые методы. Так же показано, что использование более “сильных” предобуславливателей может ускорить решение этой задачи в 100 раз. Еще один вывод, состоит в том, что при решении этой задачи, свойства сходимости метода QMR оказывается не хуже, чем метода GMRES. Метод QMR не требует хранить пространство Крылова, поэтому он оказывается эффективным с точки зрения использования памяти.

Разработана процедура автоматического выбора метода решения в зависимости от свойств СЛАУ и доступной оперативной памяти.

Аналогичные алгоритмы используются как для решения задачи (2)-(4), так и сопряженной к ней. Отметим, что безитерационный алгоритм решения задачи о “функции уровня” позволяет рассчитывать алгебраически точное значение градиента к дискретизованной прямой модели.

В четвертой главе описываются проведенные численные эксперименты по моделированию динамики океана с высоким пространственным разрешением 1/8° по долготе и 1/12° по широте. Численный эксперимент по моделированию Индийского океана является первым расчетом с высоким пространственным разрешением, проведенным с помощью сигма-моделью ИВМ РАН. Одной из основных целей эксперимента является оценка адекватности вихреразрешающей сигма-модели ИВМ РАН и оценка способности сигма-модели ИВМ РАН быть составной частью системы усвоения данных. Расчеты квазиравновесной циркуляции Индийского океана проведены на 15 лет с помощью параллельной программы сигма-модели океана. На рис. 2 приведены поля скорости, полученные по модели с высоким разрешением. Сравнение результатов численного эксперимента со схемами течений, построенными по данным наблюдений, показывает адекватность вихреразрешающей сигма-модели и разработанных алгоритмов.

Рисунок 2. Вычисленные среднемесячные скорости течений Индийского океана 15-го расчетного года (в ) для января (а) и июля (б) на глубине 30 м

В параграфе 4.2 проведены численные эксперименты по решению задачи по восстановлению начального условия в модели динамики океана. Численные эксперименты по идентификации начального условия температуры, солености, скорости в сигма-модели динамики океана проводились в расчетной области Индийского океана. Пространственное разрешение 1°x0.5°. Размер сеточной области 124x35x33. Период усвоения 1 сутки. Модельный шаг по времени 2 часа. В качестве данных наблюдений использованы реальные данные о поверхностной температуре и аномалии уровня. Управляя начальным условием, с помощью разработанных алгоритмов удается значительно уменьшить значения функционала отклонения. Результаты численных экспериментов показывают эффективность разработанных алгоритмов.

Pages:     | 1 || 3 |






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»