WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

На правах рукописи

Книжнерман Леонид Аронович

Оценки погрешности методов Ланцоша и Арнольди в точной и машинной арифметике

01.01.07 — вычислительная математика

АВТОРЕФЕРАТ

диссертации на соискание учёной степени доктора физико-математических наук

Москва — 2012

Работа выполнена в Федеральном государственном бюджетном учреждении науки Институте вычислительной математики Российской академии наук

Официальные оппоненты:

доктор физико-математических наук, профессор Валерий Павлович Ильин (Федеральное государственное бюджетное учреждение науки Институт вычислительной математики и математической геофизики Сибирского отделения Российской академии наук, лаборатория вычислительной физики, г. н. с.) доктор физико-математических наук Игорь Евгеньевич Капорин (Федеральное государственное бюджетное учреждение науки Вычислительный центр им. А. А. Дородницына Российской академии наук, с. н. с.) доктор физико-математических наук Сергей Павлович Суетин (Федеральное государственное бюджетное учреждение науки Математический институт им. В. А. Стеклова Российской академии наук, отдел комплексного анализа, в. н. с.)

Ведущая организация:

Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В. А. Трапезникова Российской академии наук

Защита состоится 2012 г. в часов на заседании диссертационного совета Д 002.045.01 в Федеральном государственном бюджетном учреждении науки Институте вычислительной математики Российской академии наук по адресу: 119333, г. Москва, ул. Губкина, д. 8.

С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного учреждения науки Института вычислительной математики Российской академии наук.

Автореферат разослан 2012 г.

Учёный секретарь диссертационного совета Д 002.045.доктор физико-математических наук Г. А. Бочаров

Общая характеристика работы

Исторический обзор Численное решение дифференциальных и интегральных уравнений после дискретизации часто сводится к выбору приближённого решения из подпространства КрыловаKm(A, ) span{A0, A1,..., Am-1}, (1) где A — матрица размера n n и — вектор (далее предполагаемый нормированным). При непосредственной работе со степенным базисом (A0, A1,..., Am-1) (2) подпространства (1) вероятны вычислительные трудности, связанные с плохой обусловленностью этого базиса, поэтому обычно предпочитают работу с базисом, полученным в результате ортогонализации (2). Имеются два варианта ортогонализации, и выбор определяет возможность получения априорных оценок погрешности метода.

1. Осуществляется в неявном виде ортогонализация по Граму–Шмидту базиса (2). Соответствующие методы в случаях эрмитовой и неэрмитовой матрицы A называются методами Ланцоша и Арнольди. Проведение классической (эрмитовой) ортогонализации позволяет при исследовании этих методов использовать технику ортогональных многочленов и многочленов Фабера. Если A — не матрица, а ограниченный оператор в гильбертовом пространстве, то для получения оценок можно работать со спектрами и использовать теорию логарифмического потенциала. Вклад в обоснование именно этих методов призвана внести представленная диссертация.

2. Все другие случаи: строится квазиортогональный базис или пара базисов. Методы этого подсемейства семейства крыловских методов (неэрмитовы обобщения метода Ланцоша и др.) также используются на практике, но в них случаются неприятности, когда в знаменателях расчётных формул появляются маленькие числа или ноль. Обычно эти методы можно использовать, когда имеется хороший предобуславливатель, но и это не даёт гарантии сходимости. Путей получения общих априорных оценок для методов этого подсемейства не видно.

А. Н. Крылов, Изв. АН СССР, VII сер., Отд. матем. и ест. наук, № 4 (1931), 491–539.

Т. е. не требующих знания результатов вычислений, в отличие от апостериорных ;

см. А. А. Амосов, Ю. А. Дубинский, Н. В. Копченова, Вычислительные методы для инженеров, М., Высшая школа, 1994: с. 61–62. Под погрешностью метода мы понимаем отклонение искомой величины от выдаваемого методом приближения (а не оценки промежуточных величин). См. с. 23–24 там же.

Метод Арнольди3 вычисления собственных пар неэрмитовых матриц и несамосопряжённых операторов стал востребованным в 1980-х годах благодаря4 работам Ю. Саада. Метод Арнольди применяется во многих задачах: собственно для вычисления спектра;5 6 как средство решения систем линейных алгебраических уравнений;7 8 для локализации спектра в итерационных методах решения линейных систем;9 10 при решении жёстких систем обыкновенных дифференциальных уравнений;для вычисления матричной экспоненты.13 14 15 Пусть A — ограниченный оператор в гильбертовом пространстве H, H, = 1. Процесс Арнольди в H с A и основан на ортогонализации по Граму–Шмидту степенного базиса подпространства Крылова (1). Первые m шагов процесса Арнольди можно выразить соотношением T AQ = QH + hm+1,mqm+1em, (3) где Q = (q1,..., qm) — набор первых m ортонормированных векторов Арнольди, верхняя хессенбергова m m-матрица H = (hij) содержит коэффициенты рекурсии, а ej есть j-й единичный вектор размерности m).

Числа Ритца (собственные значения H), которые считают приближениями к собственным значениям A, не обязаны лежать в спектре S оператора A; они находятся в поле значений (множестве значений отношения Рэлея) { A, | H, = 1}. Замыкание поля значений будем обозначать K.

Предпринятые до наших работ попытки оценить скорость сходимости метода Арнольди для матриц не привели, на наш взгляд, к получению законченных естественных результатов. Расстояние от собственного вектора до крыловского подпространства (1) оценено Ю. Саадомчерез коэффициенты разложения по собственным векторам A и значеW. E. Arnoldi, Quart. Аррl. Math., 9 (1951), 17–29.

Х. Д. Икрамов, Несимметричная проблема собственных значений, М., Наука, 1991: § 16.

A. Ruhe, Lect. Notes in Math., 973 (1982), 104–120.

Y. Saad, Liпеаr Algebra and its Applic., 34 (1980), 269–295.

Y. Saad, Math. Comp., 37 (1981), 105–126.

Y. Saad, M. H. Schultz, SIAM J. Sci. Stat. Comp., 7 (1986), 856–869.

Н. С. Elman, Y. Saad, Р. Е. Saylor, SIAM J. Sci. Stat. Comp., 7 (1986), 840–855.

D. Ho, F. Chatelin, M. Bennami, Math. Mod. and Numer. Anal., 24 (1990), 53–65.

P. N. Brown, Y. Saad, SIAM J. Sci. Stat. Comp., 11 (1990), 450–481.

С. W. Gear, Y. Saad, SIАМ J. Sci. Stat. Comp., 4 (1983), 583–601.

E. Gallopulos, Y. Saad, SIAM J. Sci. Stat. Comp., 13 (1992), 1236–1264.

M. Hochbruck, C. Lubich, J. Numer. Anal., 34 (1997), 1911–1925.

M. Hochbruck, C. Lubich, H. Selhofer, SIAM J. Sci. Comp., 19 (1998), 1552–1574.

Y. Saad, SIAM J. Numer. Anal., 29 (1992), 209–228.

Y. Saad, Numerical methods for large eigenvalue problems, Manchester, Manchester Univ.

Press, 1992: глава VI, § 7.

ния многочленов степени не выше m - 1 в точках спектра:

dist (zj, Km(A, )) (4) |k| min max |p()|, |j| pC[], deg pm-1, p(j)=1 Sp(A), =j 1kn, k =j n где k — коэффициенты разложения = kzk входного вектора k=по набору нормированных собственных векторов zk матрицы A. Коэффициенты k могут быть велики при больших перекосах где-то в спектре A. Таким образом, плохая обусловленность неинтересной моды может послужить причиной развала оценки для искомой собственной пары.

Кроме того, оценить расстояние от собственного вектора до крыловского подпространства недостаточно: из малости этого расстояния не следует малость расстояния от искомого собственного вектора до какого-либо вектора Ритца. Стьюарт18 распространяет результат Саада на недиагонализируемые матрицы, но оценивает то же расстояние, и его оценка также может содержать необоснованно большие величины. Стьюартом и Джа19 погрешность аппроксимации собственного значения j на шаге m оценена по порядку корнем m-ой степени из расстояния от соответствующего собственного вектора zj до подпространства (1):

1/m 1-1/m A A min |j - l| 4 2 A + , (5) 1lm 1 - 2 1 - где = sin (zj, Km(A, )). Глава 9 диссертации показывает, что в одной из типичных ситуаций указанное расстояние убывает со скоростью геометрической прогрессии при росте m, а тогда из оценки (5) вряд ли можно извлечь что-либо полезное.

Для сравнения скажем, что одна из наших простейших оценок погрешности решения спектральной задачи имеет следующий вид: если есть конечное количество s собственных значений 1,..., s, не принад лежащих полю значений K сужения оператора A на подпространство, дополнительное к интересующим нас s модам (это условие даёт возможность вывести из оценок расстояний от нужных собственных векторов до крыловского подпространства оценки ошибок соответствующих векторов Ритца), то оценка погрешности вычисления j (1 j s) равна O(mmc), где числа 0 < j < 1 определяются взаимным расположением j j и K, c — константа, зависящая от формы границы K, и под зна ком O не скрыты никакие перекосы (перекосы влияют на K). В общем G. W. Stewart, Matrix algorithms. Volume II: eigensystems, Philadelphia, SIAM, 2001: гл. 4, теорема 3.10.

Zh. Jia, G. W. Stewart, Math. Comp., 70 (2001), 637–647: следствие 4.2.

случае оценка не может быть существенно улучшена. Из этого следует, что оценки (4) и (5), игнорирующие поле значений сужения оператора, в принципе не могут даже гарантировать факт сходимости при m для оператора или семейства матриц, удовлетворяющих условиям нашей оценки.

В тот же период Ю. Саадом20 была дана оценка погрешности решения системы линейных уравнений Au = с помощью обобщённого метода минимальных невязок GMRES, использующего базис, построенный процессом Арнольди.21 В этой оценке также (как и в (4)) фигурируют коэффициенты разложения правой части по системе собственных векторов A.

В [4], [5, § 4], [18, § 5] автором получены оценки погрешности метода спектрального разложения Арнольди (МСРА), т. е. варианта метода Арнольди, предназначенного для вычисления произведения матричной (операторной) функции на вектор. Если функция f аналитична в окрестности S и окрестности Sp(H) — спектра H, то МСРА в качестве приближения к вектору u = f(A) (6) выдаёт вектор um = Qf(H)e1. (7) Из рекурсии (3) следует, что МСРА точен для многочленов степени m - 1, то есть f(A) = Qf(H)e1, f C[t], deg f m - 1. (8) Если f аналитична на всём компакте K, то её можно разложить там в ряд Фабера и благодаря (8) свести оценку погрешности МСРА к оценке остатка ряда Фабера. Использование поля значений A в статье [4] благодаря оценке нормы резольвенты вне K освободило нас от необходимости явным образом отражать в оценке погрешности метода перекосы в спектре. Случай функций, которые могут иметь особенности между несколь кими внешними собственными значениями A, рассмотрен нами в работах [5] и [18]; там с аналогичной целью мы использовали поле значений сужения A на подходящее инвариантное подпространство. А в работе [19] мы получили результаты, учитывающие спектр оператора (здесь — не матрицы) A; в частности, для FOM (метода полной ортогонализации вычисления A-1) показана сходимость на некоторой последовательности шагов, если 0 лежит в неограниченной связной компоненте C\Sp(A), о чём не было речи в старой матричной теории.

Y. Saad, Iterative methods for sparse linear systems, Philadelphia, SIAM, 2003: предложение 6.32.

Г. И. Марчук, Ю. А. Кузнецов, Докл. АН СССР, 181 (1968), № 6, 1331–1334.

В [5, § 2], [18, § 3] мы получили оценки для точности вычисления собственных пар. Первое, что хочется сделать для оценки качества выделения собственной пары (, z), — воспользоваться формулой (8) и взять многочлен f степени не выше m - 1, равный 1 в точке и принимающий как можно меньшие значения на остальной части спектра или на поле значений ограничения A на подходящее инвариантное подпростран ство ( дополнительное к Cz). Так и делается, но ситуация осложняется ненормальностью оператора A и ненормальностью H. Часть оценок представляет собой обычные неравенства, но некоторые оценки получаются коши-адамаровского типа: оценивается верхний или нижний предел m-го корня ошибки в терминах функции Грина (с особенностью в бесконечности) поля значений или спектра. Нижним пределом приходится довольствоваться, когда поле значений ограничения A на инвариантное подпространство содержит искомое собственное значение. Наши оценки для спектральной задачи также сформулированы в терминах упомянутых функций Грина для подходящего сужения оператора; соответственно, в доказательствах используются элементы теории потенциала. То, что было сказано выше об отсутствии необходимости явно учитывать перекосы в спектре и об оценках, верных для подпоследовательностей, справедливо и здесь. Использование в формулировках функции Грина позволяет рассматривать произвольные, а не частные (отрезки, эллипсы) поля значений.

В статье [21] мы для частного случая f(A) = (zI -A)-1 и g = 1 установили в терминах операторов жёсткие ограничения на A, при выполнении которых есть толк от квадратуры Гаусса–Арнольди,22 23 под которой понимается приближённое равенство f(A), g(A) f(H)e1, g(H)e1, где функции f и g аналитичны на спектрах A и H; до нас оставался открытым вопрос о том, быстрее ли сходится квадратура по сравнению с приближённым вычислением векторов f(A) и g(A) с помощью метода спектрального разложения Арнольди.

Метод Ланцоша24 теоретически представляет собой метод Арнольди, применённый к самосопряжённому оператору: A = A. В этом случае матрица H коэффициентов рекурсии является вещественной симметричной трёхдиагональной, а многочлены Арнольди Qi (Qi(A) = qi+1) ортогональны на вещественной оси и удовлетворяют трёхчленному рекуррентному соотношению. Компакт K превращается в отрезок вещественной оси; ряд Фабера функции f на K становится сдвинутым рядом Фурье D. Calvetti, S.-M. Kim, L. Reichel, SIAM J. Matrix Anal. Appl., 26 (2005), 765–781.

R. W. Freund, M. Hochbruck, In: Linear Algebra for Large Scale and Real-Time Applications;

M. S. Moonen et al. (eds), Kluwer Academic Press, Amsterdam, 1993, 377–380.

С. Lanczos, J. Res. Nat. Bur. Standards: Sect. В, 45 (1950), 225–280.

по многочленам Чебышёва. Эрмитовость матрицы H сильно облегчает построение теории в точной арифметике. Общая оценка погрешности метода спектрального разложения Ланцоша (МСРЛ; эрмитов аналог МСРА) была получена (для точной арифметики) в [2]; она позволила оценить ошибку вычисления произвольного собственного значения методом Ланцоша. До наших работ были известны лишь теоремы Каниэляи Саада,26 уточнённые Пэйджем,27 которые касались аппроксимации со скоростью геометрической прогрессии нескольких собственных значений на одном краю спектра. Результаты Каниэля и Саада оценивают качество приближения j-го точного собственного значения j j-ым же числом Ритца j. Оценки эффективны, если число этих собственных значений существенно меньше, чем размерность подпространства Крылова m.

Используя равенство (8), В. Л. Друскин и автор получили априорные оценки ошибки вычисления не обязательно близкого к краю спектра собственного значения методом Ланцоша.

Исследование метода Ланцоша существенно усложняется при переходе к машинной арифметике (естественно, в случае матриц).28 29 30 Было выяснено, что векторы Ланцоша qj теряют ортогональность и даже становятся почти линейно зависимыми после того, как появится хорошее приближение к какому-либо собственному значению. Процесс Ланцоша с одной и той же парой (A, ) может по-разному идти на компьютерах разных типов или даже на одном компьютере при разных способах компиляции программы. Причина в том, что в процессе Ланцоша при стандартной реализации вследствие теоретической трёхдиагональности H новый вектор Ланцоша ортогонализуется только к двум предыдущим, а не ко всем, в отличие от метода Арнольди. Поведению процесса Ланцоша в условиях машинной арифметики посвящены основополагающие работы К. Пэйджа,31 32 33 в которых виртуозно вскрыт механизм появления неустойчивости в процессе Ланцоша и влияние неустойчивости на базовые матричные соотношения процесса. Оценки погрешности34 можно извлечь S. Kaniel, Math. Comp., 20 (1966), 369–378.

Y. Saad, SIAM J. Numer. Anal., 17 (1980), 687–706.

Б. Парлетт, Симметричная проблема собственных значений, М., Мир, 1983: § 12.4, (12.4.17).

С. К. Годунов, Г. П. Прокопов, Ж. вычисл. матем. и матем. физ., 10 (1970), 1180–1190.

Б. Парлетт, Op. cit.: гл. 13.

G. H. Golub, D. P. O’Leary, SIAM Review, 31 (1989), 50–102.

С. С. Paige, The computation of eigenvalues and eigenvectors of very large sparse matrices, Ph. D. thesis, London, Univ. of London, 1971.

С. С. Paige, J. Inst. Math. Аррliс., 18 (1976), 341–349.

С. С. Paige, Linear Algebra and its Applic., 34 (1980), 235–258.

Говоря о погрешности крыловских методов в машинной арифметике, мы имеем в виду суммарный эффект от остановки на конкретном шаге m и от ошибок округления.

из эстетичной работы Гринбаум,35 которая, используя работы Пэйджа, результат реального процесса Ланцоша на шаге m представила как результат идеального процесса Ланцоша с матрицей размерности n + m, но в упомянутой работе наложены очень жёсткие ограничения на параметры задачи и нельзя в общем случае получить оценку погрешности лучше корня четвёртой степени 1/4 из элементарной ошибки округления .

Оценка погрешности МСРЛ в машинной арифметике с правильным порядком по была дана в [3]. Для анализа влияния ошибок округления на процесс Ланцоша было построено чебышёвское рекуррентное соотношение с правой частью порядка ошибки округления; эта правая часть отвечает за неточность процесса. Получение оценки ошибки МСРЛ, в правой части которой слагаемое, отвечающее за ошибки округления, линейно по (что выведено из результатов Пэйджа), свелось к доказательству устойчивости чебышёвской рекурсии.

В [3], [11] был также в принципе объяснён феномен Ланцоша — свойство процесса Ланцоша рано или поздно вырабатывать приближения к собственным значениям с почти машинной точностью. Попытка объяснить феномен Ланцоша была предпринята Каллэм и Уиллафби,36 однако в их работе используется ряд недоказанных предположений.Априорных оценок погрешности МСРЛ и МСРА до наших работ не было, если не считать оценки для решения систем линейных уравнений (f(A) = A-1).

Итак, до нас:

• спектральные оценки в неэрмитовом случае или содержали в левой части промежуточные величины (невязки, расстояния от собственного вектора до крыловского подпространства), а не истинные отклонения чисел и векторов Ритца от собственных значений и векторов соответственно, или в правой части необоснованно содержали потенциально большие величины (результаты Саада, Стьюарта и др.). Непосредственно применимые (а не содержащие оценки лишь промежуточных величин) априорные результаты о сходимости чисел Ритца к собственным значениям относились лишь к краю спектрального интервала в эрмитовом случае при точной арифметике (оценки Каниэля и Саада);

• из матричных функций исследовалась только функция f(A) = A-1, соответствующая решению системы линейных уравнений. Не было средств теоретического рассмотрения даже такой важной и популярной функции, как матричная экспонента f(A) = exp(-tA), t 0, A 0;

A. Greenbaum, Linear Algebra and its Applic., 113 (1989), 7–63.

J. Cullum, R. А. Willoughby, Linear Algebra and its Applic., 29 (1980), 63–90.

Х. Д. Икрамов, Итоги науки и техн.: Матем. анализ, 20 (1982), 179–260: § 9.

• априорные оценки для простого процесса Ланцоша и квадратуры Гаусса–Ланцоша в машинной арифметике имели в лучшем случае правую часть порядка n3m1/4 (результат Гринбаум и следствия из него);

• Были лишь частные попытки объяснить явление адаптации методов к спектру. Оценки для квадратуры Гаусса–Арнольди ничего не говорили о её эффективности: не было ясно, имеет ли (и если имеет, то при каких условиях на спектр) применение квадратуры преимущество перед вычислением соответствующих матричных функций.

Цель работы:

построение общей теории сходимости методов Ланцоша и Арнольди.

Актуальность темы Методы Ланцоша и Арнольди — классические методы вычислительной математики. Они широко используются,38 им уделяется много внимания. Однако имевшиеся до нас априорные результаты об их сходимости носили частный или незаконченный характер. Это и обусловило актуальность темы диссертации.

Научная новизна В диссертации систематически изложена общая теория сходимости методов Ланцоша и Арнольди (в том числе в форме МСРЛ и МСРА), ликвидирующая имевшиеся качественные пробелы и содержащая прямые априорные оценки погрешности.

Теоретическая и практическая ценность Результаты диссертации дают пользователям (математикам и программистам):

• принципиальную уверенность в том, что обсуждаемые методы при установленных условиях работают. В частности, прояснены классы матричных функций, к вычислению которых можно применять методы спектрального разложения Ланцоша и Арнольди;

• возможность априори оценивать объём вычислительной работы, достаточный для решения конкретной задачи, а также, зная вид аналитической зависимости границы ошибки от номера шага m, апостериорно прогнозировать фактическую ошибку путём подбора параметров (curve fitting);

На момент написания данного данного предложения поисковая система Google выдаёт 79 тысяч ссылок на запрос “Lanczos method” и 16 тысяч — на запрос “Arnoldi method”.

• инструмент для исследования методов в условиях машинной арифметики: возмущённые чебышёвские и фаберовские рекуррентные соотношения.

Ссылки на описания некоторых приложений, к которым имеет отношение автор, даны в диссертации. Приложений, возможно, и не было бы, если б не была развита теория.

Методы исследования Из линейной алгебры применены теоремы типа Гершгорина и теоремы о невязке с учётом и без учёта отделённости, из вычислительной математики — теорема о сходимости ньютоновского процесса решения системы нелинейных уравнений, из математического анализа — ортогональные многочлены, многочлены Фабера, специальные функции, конформные отображения, функция Грина и экстремальные многочлены.Положения, выносимые на защиту:

• Доказано, что при вычислении методом Арнольди крайних собственных пар сходимость имеет место со скоростью геометрической прогрессии, показатель которой выражается через значение функции Грина дополнения к полю значений сужения оператора на инвариантное под пространство, порождённое неинтересной частью спектра. Предложен метод спектрального разложения Арнольди для вычисления умноженной на вектор операторной функции; дана оценка погрешности этого метода в терминах коэффициентов ряда Фабера вычисляемой функции, построенного на поле значений.

• Исследован метод спектрального разложения Ланцоша для вычисления умноженной на вектор функции от эрмитовой матрицы. Для точной арифметики дана оценка погрешности метода в терминах коэффициентов ряда вычисляемой функции по многочленам Чебышёва, смещённым на спектральный интервал. Оценена погрешность вычисления произвольно расположенного в спектральном интервале собственного значения методом Ланцоша; в частности, показано, что числа Ритца сходятся к заданному собственному значению со скоростью геометрической прогрессии, показатель которой определяется отделённостью собственного значения в спектре.

Автор полагает, что он был среди тех, кто в начале 1990-х годов стал активно внедрять использование поля значений, функции Грина и многочленов Фабера в ис следование сходимости крыловских методов. Из соратников отметим М. Айерманна, О. Неванлинну и Л. Н. Трефевена с соавторами (список не претендует на полноту).

Сейчас этими понятиями удивишь не очень многих вычислительных линейных алгебраистов: они (понятия) начали входить в учебники, а тогда их использование встречало заметное сопротивление.

• С помощью техники возмущённых чебышёвских рекурсий оценка погрешности метода спектрального разложения Ланцоша обобщена на случай машинной арифметики. Показано, что неустойчивость метода спектрального разложения Ланцоша в машинной арифметике не препятствует его практическому применению. Аналогичный результат получен для квадратуры Гаусса–Ланцоша. Доказаны конкретные утверждения, касающиеся феномена Ланцоша; в частности, установлено, что при выполнении ограничений, проистекающих из теории Пэйджа, минимальная ошибка вычисления хорошо отделённого собственного значения имеет примерно порядок машинной ошибки округления.

• В терминах линейных ограниченных операторов показано, почему на практике обсуждаемые методы работают лучше, чем гарантировано предыдущими оценками (адаптация к спектру). Адаптивные оценки погрешности сформулированы в терминах функции Грина неограниченной компоненты дополнения к операторному спектру. Получены результаты о сходимости на подпоследовательностях шагов процесса Ланцоша или Арнольди в ситуациях, когда процесс сходиться в обычном смысле не обязан. Проанализирована эффективность квадратуры Гаусса– Арнольди.

Обоснованность и достоверность результатов Представленные в диссертации утверждения снабжены математическими доказательствами. Результаты численных экспериментов иллюстрируют многие из доказанных утверждений. Кроме того, справедливость положений представленной теории подтверждается многолетней практикой моделирования геофизических и иных процессов с помощью методов Ланцоша и Арнольди.

Апробация работы Результаты диссертации излагались на юбилейной ланцошевской конференции (Рэйли, США, 1993), конференции по вычислительной линейной алгебре (Миловы, Чехия, 1997), конференции SIAM-GAMM-20(Дюссельдорф, Германия), на кафедре вычислительной математики Технического горного университета Фрайберга (Германия), в ВЦ РАН им.

А. А. Дородницына, в ИПУ РАН им. В. А. Трапезникова, по нескольку раз обсуждались на семинарах в Институте вычислительной математики РАН и Институте прикладной математики РАН им. М. В. Келдыша (в том числе на семинаре им. К. И. Бабенко).

Публикации Основные результаты диссертации изложены в статьях [2, 3, 4, 5, 6, 10, 11, 13, 17, 18, 21], опубликованных в рецензируемых научных журналах из списка, рекомендованного ВАК. Другие результаты диссертации опубликованы в работах [7] и [19] (последняя реферирована в Zentralblatt).

Всего по теме диссертации, включая аннотации конференционных докладов и препринты, автором опубликована 21 работа, из них 12 — в рецензируемых научных изданиях.

В статьях, написанных совместно с В. Л. Друскиным, лично диссертант: использовал разложение в ряды Фурье–Чебышёва и специальные функции (В. Л. Друскин оценивал коэффициенты нужных рядов Фурье– Чебышёва с помощью сведения к оценке погрешности разностных схем для обыкновенных дифференциальных уравнений40); провёл выкладки, связанные с многочленами Чебышёва; разработал и использовал технику возмущённых чебышёвских рекуррентных соотношений. Включённые в диссертацию результаты, полученные совместно с В. Л. Друскиным и Э. Гринбаум, принадлежат их авторам в равной степени.

Разумеется, результаты из совместных статей, полученные без участия автора, в диссертацию не включены.

Ссылки на статьи автора по теме диссертации можно найти в нескольких книгах41 42 43 44 45 46 47 и в статьях разных авторов.

Благодарности Автор благодарит: В. Л. Друскина — за многолетнюю совместную деятельность по исследованию и практическому применению метода Ланцоша, а также за полезные обсуждения личных статей автора; Э. Гринбаум — за совместное написание нескольких статей по теории метода Ланцоша, а также за полезные обсуждения личных статей автора; за полезные обсуждения диссертации в целом или части отражённых в ней статей и за библиографическую поддержку — М. Айерманна, С. К. Асвадурова, Б. Бекерманна, А. Б. Богатырёва, Дж. Голуба, С. А. Горейнова, V. Druskin, L. Knizhnerman, Radio Science, 29 (1994), 937–953: § 5.

С. К. Годунов, Лекции по современным аспектам линейной алгебры, Новосибирск, Научная книга (ИДМИ), 2002: предисловие.

G. H. Golub, G. Meurant, Matrices, moments and quadrature with applications, Princeton and Oxford, Princeton Univ. Press, 2009: § 7.5, 8.0.

A. Greenbaum, Iterative methods for solving linear systems, Philadelphia, SIAM, 1997: гл. 4.

N. J. Higham, Functions of matrices. Theory and computation, Philadelphia, SIAM, 2008:

§ 13.5–13.6.

G. Meurant, The Lanczos and Congugate Gradient algorithms: From theory to finite precision computations, Philadelphia, SIAM, 2006: § 3.11.

B. N. Parlett, The symmetric eigenvalue problem, Philadelphia, SIAM, 1998: § 13.11.

L. N. Trefethen, M. Embree, Spectra and pseudospectra: the behavior of nonnormal matrices and operators, Princeton, Princeton Univ. Press, 2005: гл. VI, § 28.

С. Н. Давыдычеву, Н. Л. Замарашкина, Х. Д. Икрамова, В. П. Ильина, Дж. Каллэм, А. В. Князева, В. И. Лебедева, О. В. Локуциевского, К. Любиха, Ю. М. Нечепуренко, Б. Парлетта, Л. Райхеля, А. Руэ, В. С. Рябенького, А. Скороходова, А. В. Собянина, В. З. Соколинского, С. П. Суетина, К. Торреса-Вердина, Е. Е. Тыртышникова, М. Хохбрук, О. Эрнста, участников перечисленных в пункте Апробация конференций и семинаров; Дэвида Бейли — за публикацию фортранного пакета повышенной точности48 в Интернете; Центральную геофизическую экспедицию и Schlumberger–Doll Research — за организационную помощь.

Структура и объём работы Диссертация состоит из двенадцати глав, десять из которых содержат математические результаты и распределены между четырьмя частями. Объём диссертации — 255 с. Список литературы содержит 187 наименований.

Краткое содержание работы Глава 1 Введение описывает задачи, даёт исторический обзор и содержит информацию, обязательную для диссертаций.

Часть 1 Методы Ланцоша и спектрального разложения Ланцоша в точной арифметике: неадаптивные оценки содер жит главы 2–3. Термин неадаптивные означает не адаптированные к спектру, то есть зависящие лишь от спектрального интервала оператора в случае метода спектрального разложения Ланцоша и не зависящие от лакун в спектре, не связанных с отделённостью нужного собственного значения, в случае метода Ланцоша. Адаптивные оценки рассматриваются позже.

Глава 2 Метод спектрального разложения Ланцоша в точ ной арифметике содержит начальную информацию про МСРЛ. Пусть A — симметричная вещественная матрица размера n n, f — функция, определённая на спектральном интервале A, Rn. Обозначим через i, i = 1, 2,..., n, i+1 i, собственные значения A (n > 1), а через zi — соответствующую ортонормированную систему собственных векторов.

Пусть разложение по собственным векторам имеет вид n = izi. (9) i=Напомним содержание m шагов процесса Ланцоша приближённого вычисления спектра оператора A. В подпространстве Крылова (1) D. N. Bailey, ACM Trans. Math. Software, 21 (1995), 379–387.

строится базис q1,..., qm, получаемый в результате ортогонализации по Граму–Шмидту последовательности , A,..., Am-1. Ортогонализацию можно провести с помощью трёхчленной рекурсии Aqi = i-1qi-1 + iqi + iqi+1, i = 1, 2,..., m - 1, где 0q0 0, q1 = и i 0. Обозначим через H трёхдиагональную матрицу 1 1 2 2 H =, ...

...

...

m-1 m T через i, si = (s1i,..., smi), i = 1, 2,..., m, — собственные значения и соответствующие нормированные собственные векторы H. Положим Q = (q1... qm), yi = Qsi. Тогда (i, yi) — приближённые собственные пары оператора A, получаемые методом Ритца на Km(A, ). Положим n + 1 2 n + 1 - (n - 1)x B = In - A, g(x) = f, n - 1 n - 1 где In — единичная матрица порядка n. Рассмотрим ряд Фурье–Чебышёва функции g:

g(x) = gkTk(x). (10) k=Мы оцениваем скорость сходимости МСРЛ через скорость сходимости ряда (10).

Теорема 1. Пусть ряд (10) абсолютно сходится на отрезке [-1, 1].

Тогда для вектора (7) справедлива оценка погрешности u - um 2 |gk| < +. (11) k=m В общем случае оценка (11) неулучшаема по порядку. Для многих функций, возникающих при решении дифференциальных уравнений, gk выражаются через элементарные или специальные функции, что позволяет получить конкретизированные оценки погрешности: см. четыре следующих утверждения.

tn Предложение 1. Пусть 1 0, f(A) = exp(-tA), t 0, a =.

При m a справедлива оценка погрешности m 2 a m2 m u - um 2 + O exp - + O.

a m 2a a 2t Предложение 2. Пусть 1 0, f(A) = cos t A, =, x =, n 2m = - 1. Если 0 < 1, то имеет место оценка погрешности x 1 (2)1. exp -x + O(2) 1 + O + x u - um .

4m2 - xВведём в рассмотрение обратную функцию Жуковского (w) = w + w2 - 1.

Предложение 3. Пусть 1 > 0, f(A) = exp -z A, z 0. Справедлива оценка погрешности -n + u - um 4(c)-m 1 - (c)-1, c =.

n - Предложение 4. Пусть 1 0, n 1, f(A) = As, s N\{0}.

Справедлива оценка погрешности m 2 2s 1 m2 m u - um 1 + O + O exp - + O.

m s s - m s s Глава 3 Метод Ланцоша в точной арифметике содержит доказательство аппроксимационных оценок для собственного значения, не зависящих от его номера в спектре. Первая из оценок не учитывает отделённость желаемого собственного значения в спектре, а вторая учитывает.

Предложение 5. Предположим, что A 1, r = 0, r = 0 и m 3. Тогда m-- 2 - r min |i| . (12) 1im log -r Когда m log - 2, то правая часть (12) близка к.

2 2m r Определим величину = min max |f()| f(X) R[X], deg f m - 1, f(r) = 1, [1,r-1][r+1,n] где 1 < r < n, r > 0 и m 3.

Теорема 2. Если A 1 и r <, 1 + 1 - r то выполняется оценка 2(1 - 2) r min |r - j| . (13) 1jm 1+ 1-r r 1 - r Правая часть оценки (13) убывает со скоростью геометрической прогрессии благодаря оптимизации многочлена f,49 50, например, по Золотарёву.

Часть 2 Методы Ланцоша и спектрального разложения Ланцоша в машинной арифметике состоит из глав 4–6 и также содержит неадаптивные оценки. Оценки из глав 4–5 являются аналогами оценок из глав 2–3 соответственно для машинной арифметики. Оценки главы 6 для квадратуры Гаусса–Ланцоша являются аналогами хорошо известных свойств квадратур типа Гаусса.

Глава 4 Метод спектрального разложения Ланцоша в ма шинной арифметике напоминает начальную информацию о машинной арифметике и содержит машинно-арифметические оценки погрешности МСРЛ. Буквой обозначается элементарная машинная ошибка округления. Будем придерживаться относительно машинной арифметики предположений из книги Парлетта.51 Обозначения Q, H и т. п. будут относиться к соответствующим реально вычисленным объектам. Введём также следующие обозначения: c1 — максимальное количество ненуле вых элементов в строках A, 0 2(n + 4), 1 = 7 + c1 |A| , 2 = A 2 max(60, 1), = m2.5 A 2. Пэйджем показано, что при условиях m[6(n + 4) + 1] 1, (n + 4) < (14) справедливо неравенство 1 - i n + , i = 1, 2,..., m. (15) Как принято в теории метода Ланцоша, мы считаем, что все действия с трёхдиагональной матрицей H, включая решение спектральной задачи, производятся точно.

Сделаем спектральное линейное преобразование, переводящее отрезок [1 - , 1 + ], заведомо содержащий, в силу (15), собственные значения H, в отрезок [-1, 1]. А именно, положим (n + 1) - (n - 1 + 2)x g(x) = f.

В. И. Лебедев, Ж. вычисл. матем. и матем. физ., 9 (1969), 1247–1252.

Е. М. Никишин, В. Н. Сорокин, Рациональные аппроксимации и ортогональность, М., Наука, 1988: гл. 2, доказательство утверждения 8.3].

Б. Парлетт, Op. cit.: § 2.4.

Введём в рассмотрение ряд Фурье–Чебышёва g(x) = gkTk(x), -1 x 1. (16) k=Теорема 3. Пусть функция f определена на интервале [1-, n+ ] и ряд Фурье–Чебыш (16) абсолютно сходится на отрезке [-1, 1].

ева Тогда вектор um определ корректно и при выполнении (14) справеден лива оценка погрешности 2 A u - um 4 g L (]-1,1[;1/1-x2)n m31 + m |gk|. (17) - k=m Член оценки (17), отвечающий за машинную арифметику, имеет порядок машинной ошибки округления.

Пример запуска МСРЛ. В Горном техническом университете Фрайберга (Германия) одна из научных программ, написанная автором совместно с В. Л. Друскиным, вычисляющая матричную функцию f(A) = A-1 exp(-tA), t 0, была запущена с одними и теми же входными данными на персональных компьютерах, работавших под управлением операционных систем Windows и Linux. Трансляция была осуществлена фортранными компиляторами фирмы Intel: автором для Windows и в ИВМ РАН — для Linux. Таблица 1 показывает, что два процесса Ланцоша в конце концов выдали приближённое решение, совпадающее в пяти десятичных знаках. При этом коэффициенты ланцошевской рекурсии и значения приближённого решения по ходу процесса (от момента потери ортогональности векторами Ланцоша и до достижения сходимости заданного уровня) различались весьма значительно.

Глава 5 Феномен Ланцоша и расположение чисел Ритца содержит машинно-арифметические оценки погрешности процесса Ланцоша. Рассмотрим процесс Ланцоша с начальным вектором (9) и будем интересоваться качеством приближений к фиксированному собственному значению r матрицы A, 1 r n. Без ограничения общности можно считать, что A 0.9 и r = 0.

Предложение 6. Пусть A 0.9, r = 0, r = 0 в (9) и m 3.

Предположим, что выполнены условия Пэйджа (14), а также условия 1 0.9m2.52 1, m21 |r|.

4 Тогда справедлива оценка m-1 10 m min |i| = min |i - r| - 1. (18) 1im 1im 6|r| Таблица 1: Результаты вычисления матричной функции на двух компьютерах, работающих под управлением операционных систем Windows и Linux. j — номер шага процессов Ланцоша, j и j — коэффициенты ланцошевских рекурсий, Uj — значения приближённого решения в отдельном (контрольном) узле пространственной разностной сетки.

Linux Windows j j j Uj j j Uj 50 -0.15702E-14 -0.15702E-100 998.23 20434. -0.16543E-09 998.23 20434. -0.16543E-150 -0.15208E-07 -0.15208E-200 1987.9 2817.1 -0.79739E-07 1985.8 2813.8 -0.79744E-250 -0.62672E-06 0.63888E-300 5083.4 2987.7 -0.31798E-05 9944.3 9050.3 -0.32142E-350 -0.77681E-05 -0.76203E-400 10448. 12052. -0.11058E-04 8183.5 5388.9 -0.11047E-450 -0.11686E-04 -0.11686E-500 11734. 11345. -0.11666E-04 9273.5 5455.4 -0.11666E-Если 2 10 m log 1, m - 6|r| то правая часть оценки (18) примерно равна 1 10 m log .

m 6|r| log m Таким образом, оценка имеет по m порядок.

m Если известна отделённость собственного значения, то ошибку аппроксимации можно оценить членом геометрической прогрессии с известными параметрами.

Теорема 4. Пусть 1 < r < n, r > 0, min1in, i =r |r - i| > 0, m 3, f(X) R[X], deg f m - 3, f(r) = 1, 1 при x [1 - , n + ], |f(x)| 1 при x [1 - , n + ] \ ]r-1 + , r+1 - [ и (помимо (14)) выполнены условия D c2r и m2 c3 A -1, где D m + , c4m32 A, m32 A (n - 1)-1, и где c2 и c3 — достаточно малые, а c4 — достаточно большая положительная константа. Тогда справедлива оценка A -1 min |i - r| 1im max m-2 m1.52 A -1 + D, -1(m1.52 + D) A -1.

r r При достаточно большом допустимом числе шагов оценка теоремы имеет порядок машинной ошибки округления.

Когда матрица A является невырожденной, но не положительно определённой, то матрица H = Hm, порождённая m шагами процесса Ланцоша, может быть вырожденной. В этом случае аппроксиманта МСРЛ к решению системы линейных уравнений Au = не определена на m-ом шаге процесса. Мы показываем, однако, что по меньшей мере одна из двух последовательных трёхдиагональных матриц, Hm или Hm-1, имеет спектр, чьё относительное расстояние до нуля больше, чем примерно нормированный квадрат расстояния от Sp(A) до нуля.

Предложение 7. Положим d(z) min |z - i| = dist(z, Sp(A)).

i=1,2,...,n Пусть — собственное значение Hm, — собственное значение Hm-1, A = 1 и ни , ни не слишком близко к спектру A, именно, min{d(), d()} > (m + 1)3 + 3 m2 2.

Тогда d(0)2 - amax{||, ||} , (19) d(0) + 6.25m + (6.25m)2 + 12.5md(0) + c где a 12.5 m + O(). При условии 90.625 [(2n + 6) + m(30 + 1)] + 12.5 m 1 8.неравенство (19) может быть заменено на d(0)2 12.max{||, ||} - m 1 + O(2).

16 Попутно в этой главе получено обобщение теоремы Стилтьеса о разделении,52 53 улучшающее аналогичный результат из работы Гринбаум.T. J. Stieltjes, Annales scientifiques de .N.S. 3e srie, 1 (1884), 409–426.

Е. М. Никишин, В. Н. Сорокин, Op. cit.: гл. 2, § 8, упражнение 6.

A. Greenbaum, Op. cit.

Глава 6 Гауссова квадратурная формула, порождаемая про стым процессом Ланцоша, и её приложения посвящена квадратурной формуле типа Гаусса (Гаусса–Ланцоша, КФГЛ), порождаемой m первыми шагами простого (т. е. без реортогонализации) процесса Ланцоша. Под этим понимается квадратурная формула (для матриц это, точнее, формула приближённого суммирования) m f(A)q1, q1 f(H)e1, e1 = s2 f(i), 1i i=где f — функция, определённая и гладкая на отрезке [1 - , n + ] и где первое скалярное произведение берётся в Rn, а второе — в Rm. Нарушение ортогональности векторов Ланцоша в простом процессе Ланцоша не позволяет просто обосновать законность использования КФГЛ, порождаемой m первыми шагами простого процесса Ланцоша, и побуждает использовать вычислительно дорогую реортогонализацию, что нежелательно. Это порождает задачу обоснования КФГЛ в условиях машинной арифметики.

Теорема 5. Пусть A /(n - 1). Пусть функции f и g определены на [1 - , n + ] и разлагаются в ряды n + 1 - 2 n + 1 - 2 f() = fkTk, g() = gkTk, n - 1 + 2 n - 1 + 2 k=0 k=сходящиеся абсолютно на указанном отрезке. Тогда справедливы неравенства | f(A)q1, g(A)q1 - f(H)e1, g(H)e1 | O m32 |fkgl| + 2 |fkgl| k+l2m-2 k+l2m-и f(A)q 2 f(H)e1 2 O m32 |fkfl| + 2 |fkfl|.

k+l2m-2 k+l2m-Следствие 1. В условиях теоремы 5 верна оценка 2m-2 | f(A)q1, q1 - f(H)e1, e1 | O m32 |fk| + 2 |fk|. (20) k=0 k=2m-Бесконечный ряд в оценке (20) для КФГЛ начинается примерно с вдвое большего номера, чем в оценке (17) теоремы 3 для МСРЛ.

20 40 60 80 100 120 140m 2 - 2 - 2 - 2 Рис. 1: Пример вычисления величины A-1q1, q1. Кривая 1 — график log10 | q1, qm |, кривая 2 — log10 | A-1q1, q1 - H-1e1, e1 |, кривая 3 — log10 | A-1q1, q1 - QH-1e1, q1 |.

В конце главы описываются приложения доказанных оценок: конструктивные — к методу спектрального разложения Ланцоша и решению некорректных задач с помощью вариационной регуляризации и теоретические — к феномену Ланцоша. В иллюстративных целях рассматривается пример со сравнением вычисления A-1, с помощью КФГЛ и непосредственно с помощью МСРЛ. Матрица A положительно определена и имеет хорошо отделённое собственное значение. Приведены результаты счёта для чётных m (для нечётных m картинка несколько сдвинута, но качественно не отличается). Рисунок 1 показывает, что величина H-1e1, e1 стабильно сходится к решению, в то время как QH-1e1, q делает подскоки, связанные, очевидно, с моментами потери ортогональности, происходящей при сходимости очередного дубля к хорошо отделённому собственному значению.

Часть 3 Методы Арнольди и спектрального разложения Арнольди: неадаптивные оценки содержит главы 7–9. Неада птивность здесь понимается в том смысле, что оценки сформулированы в терминах поля значений оператора или сужения оператора на подходящее инвариантное подпространство, а не в терминах спектра. Здесь мы получаем аналоги результатов части 1 для несамосопряжённого случая; вместо многочленов Чебышёва и рядов Фурье–Чебышёва появляются многочлены и ряды Фабера; появляются также функции Грина, в терминах которых можно оценить поведение нужных экстремальных многочленов.

В главе 7 Метод спектрального разложения Арнольди: об щие оценки оценивается погрешность вычисления вектора (6) с помощью метода Арнольди в несимметричном случае в условиях точной и машинной арифметики. Вместо разложения f в ряд Фурье–Чебышёва, применявшегося в симметричном случае, здесь используется разложение в ряд Фабера55 на поле значений.

Процесс Арнольди в компьютерной арифметике с реортогонализаT цией может быть выражен формулами AQ - QH = hm+1,mqm+1em + F и T Q Q - I = G, где под Q, H и др. понимаются реально вычисленные на ЭВМ объекты и нормы n n-матрицы F и m m-матрицы G — умеренные кратные величины . Мы даём оценки погрешности в терминах велиT чин F, G и Q qm+1, не вдаваясь в стандартную для вычислительной линейной алгебры задачу оценивания упомянутых норм. (Величины T F и max( G, Q qm+1 ) не превосходят произведений, соответственно, A и на одночлены от m, n с небольшими показателями степеней и T коэффициентами.) Положим F + max( G, Q qm+1 ) A. ПредпоT ложим, что выполняются условия G 0.5, F A, Q qm+1 1, qm+1 2, |hm+1,m| 2 A. Они естественны и следуют из оценок точности вычисления скалярных произведений, линейных комбинаций векторов, умножения матрицы на вектор и т. п.56 57 при наложении на m, n и ограничений типа полиномиальных неравенств.

Свяжем с матрицей A множество K её значений отношения Рэлея.

Будем рассматривать задачу вычисления (6) в предположении аналитичности f на K. Обозначим через функцию, конформно и биектив но отображающую внешность единичного круга w C | |w| > 1 на дополнение к K в расширенной комплексной плоскости C при условиях () = и () > 0, через — границу K, а через , > 1, — линию уровня {(w) | |w| = }. Через k, k N, обозначаем многочлены Фабера для K — целые части k-ой степени -1. Пусть f() = fkk() (21) k=— ряд Фабера функции f на K.

Теорема 6. Если функция f аналитична в канонической области GR, ограниченной кривой R с параметром R > 1+1/, то справедлива П. К. Суетин, Ряды по многочленам Фабера, М., Наука, 1984.

Б. Парлетт, Op. cit.: гл. 2.

G. Н. Wilkinson, Rounding errors in algebraic processes, N. Y., Prentice-Hall, 1964.

оценка погрешности l u - um max |f(z)| F m2+2.5 max 1 + + 1/ (22) z 0lm-max(l, 1) k + |fk| 1 + + 1/ k, k k=m где константа 1 и константа под знаком зависят от K.

Следствие 2. Если = 0 (точная арифметика) и функция f аналитична на K, то справедлива оценка погрешности u - um |fk|k, (23) k=m где константа и константа под знаком зависят от K.

С помощью недавнего результата Бекерманна58 можно убрать степенной множитель из правой части (23).

Далее в главе с помощью примера с жордановыми клетками обосновано использование именно поля значений, а не матричного спектра, а также рассмотрено приложение к решению систем линейных алгебраических уравнений, в том числе с рестартами.

В методе Арнольди ортогональность векторов Арнольди устойчиво поддерживается,59. поэтому вопросы машинной арифметики гораздо менее актуальны для метода Арнольди, чем для метода Ланцоша, частным случаем которого метод Арнольди является лишь в точной арифметике.

Эта глава — последняя, где фигурирует машинная арифметика.

Глава 8 Оценки погрешности метода Арнольди и метода спектрального разложения Арнольди: случай нормальной ма трицы и крайних изолированных собственных значений начинает изучение влияния дискретности края спектра на поведение процесса Арнольди. В предыдущей главе метод Арнольди, применённый к матрице A Mn(R) и вектору Rn, исследован как средство приближённого вычисления векторов вида (6), где f — функция, аналитическая на множестве отношений Рэлея матрицы A. В настоящей главе изучается сходимость в методе Арнольди крайних собственных значений, не принадлежащих выпуклой оболочке K остальных собственных значений, и B. Beckermann, C. R. Acad. Sci. Paris: Ser. I, 340 (2005), 855–860.

Хотя устойчивость вычисления конкретного базиса не гарантируется. См., например, A. Malyshev, M. Sadkane, Linear Algebra and its Applic., 371 (2003), 315–331; J.-F. Carpraux, S. K. Godunov, S. V. Kuznetsov, Linear Algebra and its Applic., 248 (1996), 137–160.

соответствующих собственных векторов. Даны аналоги теорем Каниэля и Саада из теории метода Ланцоша, сформулированные в терминах функции Грина (с особенностью в бесконечности) дополнения к K в расширенной комплексной плоскости. Затем исследуется метод Арнольди как метод вычисления (6) при ослабленном по сравнению с предыдущей главой ограничении на функцию f: ей разрешается иметь особенности между крайними собственными значениями A (f должна быть аналитична в области, содержащей K и искомые собственные значения). Показано, что при больших m оценённая скорость сходимости МСРА не зависит от выделенных собственных значений.

Глава 9 Оценки погрешности метода Арнольди и метода спектрального разложения Арнольди: случай крайних изолиро ванных собственных значений содержит результаты, аналогичные результатам предыдущей главы, но не использующие предположения о нормальности. В терминах функции Грина дополнения к полю значений K сужения оператора на подпространство, дополнительное к искомым собственным векторам, даны более слабые (что обусловлено отсутствием теоремы о невязке с учётом отделённости) аналоги теорем Каниэля и Саада и последнего результата предыдущей главы.

Пусть H — гильбертово пространство, A: H H — ограниченный линейный оператор, — элемент H с = 1. Мы рассмотрим процесс Арнольди с A и .

Пусть 1,..., s (s 1) — различные собственные s значения A, = [ (A - iI)] H, G — замыкание линейного подi= пространства span , A, A2,.... Будучи замыканием инвариантного подпространства, G само инвариантно, и мы можем определить ограничение B = A|G : G G и замыкание K поля значений B.

Мы исследуем сходимость собственных значений 1,..., s в предположениях, что 1 K,..., s K и что 1 = 0,..., s = 0. Пусть / / — функция, конформно и биективно отображающая дополнение к еди ничному кругу w C | |w| > 1 на дополнение к K в C при условиях () = , () > 0, — функция, обратная к , ti = (i). Определим величины i =| ti |-m mc /i, где константа c5 1 зависит от формы K.

Теорема 7. Метод Арнольди, примен енный к оператору A и вектору , за m > s шагов выработает такие приближ енные собственные пары (1, y1),..., (m, ym), что при подходящей нумерации и нормализации верны оценки i - i i, zi - yi i (i = 1,..., s).

Обозначим через k (k N) многочлены Фабера, построенные на K, через — изолинии функции Грина = { (w) | w C, |w| = }, > 1. функции f, аналитической на K, можно построить ряд Фабера По f = fkk, сходящийся на K.

k=Теорема 8. Пусть функция f аналитична в области, содержащей внутренность контура R (R > 1) и окрестности точек 1,..., s.

Тогда метод Арнольди, примен енный к A и , за достаточно большое число шагов m выработает корректно определ енную аппроксиманту um к u, такую что lim u - um 1/m R-1.

m Часть 4 Методы Ланцоша, Арнольди, спектрального разложения Ланцоша и спектрального разложения Арнольди:

адаптивные оценки содержит главы 10–11. Гл. 10 объясняет, почему результаты применения методов Ланцоша и Арнольди обычно лучше, чем обещано оценками из предыдущих глав. Вводится понятие адаптации обоих методов к спектру оператора (который в данном случае нельзя считать матрицей), то есть зависимости качества результатов от спектра. Приводятся количественные выражения утверждений о том, что лакуны в спектре ускоряют сходимость и что сходимость в значительной степени обусловлена спектром S, а не полем значений K. Гл. 11 в терминах операторов обсуждает качество квадратуры Гаусса–Арнольди для функции (zI - A)-1, и связь между методом Арнольди и рациональной аппроксимацией типа Паде функций марковского типа.

Глава 10 Об адаптации методов Ланцоша и Арнольди к спектру, или почему два этих метода так мощны трактует адаптацию изучаемых методов к операторному спектру. Простое вычисление начального куска ряда Фурье–Чебышёва (10) и ряда Фабера (21) с подставленной туда матрицей даёт несколько лучшие оценки, чем (11) и (23). Причина успешного использования МСРЛ/МСРА заключается в так называемой адаптации обоих методов к спектру, то есть в зависимости их эффективности от спектра A, теоретический учёт лакун в котором способен приводить к лучшим оценкам, чем (11) и (23). Данная глава посвящена как раз этому аспекту поведения МСРЛ/МСРА и собственно методов Ланцоша и Арнольди как методов вычисления спектра. По причине нерелевантности в ненормальном случае матричного спектра работа ведётся с операторами.

Пусть A — ограниченный оператор в гильбертовом пространстве H, H, S = Sp(A), D — связная компонента дополнения C\S, содержащая бесконечность, E = C\D S, capl E — логарифмическая ёмкость.

Если capl E > 0, то существует обобщённая функция Грина g для D;

A в противном случае считаем, что g +. Обозначим через rk невязку FOM на k-ом шаге процесса Арнольди с A и (если приближённое A rk решение МСРА не существует, мы полагаем = +).

Предложение 8. Если 0 E, то для FOM справедлива оценка A rm 1/m e-g(0).

lim (24) m Адаптивный характер (24), так же, как и оценок ошибки из последующих утверждений, очевиден благодаря монотонности функции Гринапо области: чем меньше множество E, тем больше (нестрого) показатель g(0) и, значит, тем лучше сходимость. Обсуждаемая монотонность является строгой для регулярных областей. Так как K выпукло и содержит S, справедливо включение E K. Если gK обозначает функцию Грина для K и E = K, то g(0) > gK(0), что и выражает преимущество (24) над неадаптивной оценкой (23) ввиду свойств сходимости рядов Фабера.

Предложение 9. Пусть A = A и 0 S. Тогда A A rm 1/m e-g(0), lim min rm-1, (25) m где g — обобщ функция Грина спектра S.

енная Заметим, что в отличие от (24) оценка (25) гарантирует хорошее поведение FOM для последовательности значений m, имеющей положительную нижнюю натуральную плотность ( 0.5).

Отметим, что на практике метод Ланцоша используется для решения знакоопределённых и знаконеопределённых ССЛАУ в течение длительного времени.61 62 Однако при обосновании использования метода в случае знаконеопределённых операторов были трудности, связанные с проблемой устойчивости.63 Утверждая, что по крайней мере один из каждых двух последовательных ланцошевских шагов хороший, предложение 9 как раз обосновывает применение МСРЛ в этом случае (не смотря на возможные выскоки ).

Определим критический уровень функции Грина R0 = inf R > 1 K GR, где GR — каноническая область для компакта E.

J. L. Walsh, Interpolation and approximation by rational functions in the complex domain, AMS Colloquium Publications, 20, Providence, RI, AMS, 1969: § 4.1.

В. N. Parlett, Linеаr Algebra and its Applic., 29 (1980), 323–346.

Н. D. Simon, Math. Comp., 42 (1984), 115–142.

C. C. Paige, B. N. Parlett, H. A. van der Vorst, Numer. Linear Algebra with Applic., 2 (1995), 115–133.

Теорема 9. Пусть R > R0, а функция f аналитична в GR и непрерывна на GR. Тогда ошибка МСРА удовлетворяет неравенству lim u - um 1/m R-1. (26) m Если E = K, то (26) экспоненциально сильнее, чем (11) и (23).

Пусть 0 — изолированное простое собственное значение A, z — соответствующий собственный вектор, = A, G — замыкание линейного подпространства span{, A, A2,...}, B = A|G : G G. В следующей теореме спектр S, множество E и функция g относятся к оператору B (не A).

Теорема 10. Метод Арнольди, примен к оператору A и векенный тору , на m-ом шаге выработает приближ енную собственную пару (m, ym), такую что при подходящей нормализации ym верны оценки lim |m|1/m e-g(0), lim z - ym 1/m e-g(0). (27) m m Заметим, что добавление конечного числа точек к спектру не меняет обобщённых изолиний64 функции Грина. Поэтому здесь нет необходимости совместно рассматривать несколько собственных значений, в отличие от теоремы 7.

Одна и та же последовательность значений m (которая может быть редкой) даёт два нижних предела в заключениях (27) теоремы 10.

Теорема 11. Пусть A = A и 0 — изолированный элемент S (и, следовательно, собственное значение оператора A). Метод Ланцоша, примен енный к паре (A, ), за m 2 шагов выработает такие пары Ритца (m, ym) с подходящим образом нормализованными векторами Ритца ym, что справедливы оценки lim |m|1/m e-g(0), lim [min (|m-1|, |m|)]1/m e-2g(0), m m lim [min ( z - ym-1, z - ym )]1/m e-g(0), m где z — нормированный собственный вектор A, соответствующий собственному значению 0, g — обобщ функция Грина для S и g(0) енная следует понимать как существующий предел g(0) lim0, =0 g() > 0.

J. L. Walsh, Op. cit.

Если ограничиться главной, экспоненциальной частью оценок, то можно сказать, что теорема 11 обобщает теоремы Каниэля и Саада в следующих двух направлениях. Во-первых, интересные собственные значения не обязаны лежать на краю спектра или быть соседними. Вовторых, дополнительные (т. е. не связанные с отделённостью желаемых собственных значений) зазоры в спектре ускоряют сходимость, что как раз и выражает адаптацию. Отметим, что рассуждение на тему адаптации оценок Каниэля и Саада к спектру имеется в уже упомянутой книге Парлетта (§ 12.4).

Глава 11 Квадратура Гаусса–Арнольди для функции (zIA)-1, и Паде-подобная рациональная аппроксимация функ ций марковского типа посвящена квадратуре Гаусса–Арнольди и связанных вопросам. Пусть A — ограниченный оператор в гильбертовом пространстве H — нормированный вектор из H. Функция fm(z) = и (zI - H)-1e1, e1 (z Sp(H)) является [m - 1/m]-аппроксимантой типа Паде в бесконечности с полюсами в точках i (1 i m) к функции f(z) = (zI - A)-1, (z S = Sp(A)). Аппроксимация f(z) fm(z) обсуждается в нескольких работах.65 66 Она является частным случаем квадратуры Гаусса–Арнольди. Пусть — неограниченная связная компонента C\S, E = C\ S.

Если оператор A нормален, то он обладает спектральным разложением,67 а пара (A, ) — спектральной мерой с носителем S; имеем d(t) f(z) =. (28) z - t S Поскольку в терминах обобщённой функции Грина g области мы имеем 1/m lim dist (zI - A)-1, Km(A, ) e-g(z), z , m то два следующих утверждения являются критериями нетривиальности квадратуры Гаусса–Арнольди (мы считаем квадратуру нетривиальной, если с ростом m её ошибка уменьшается существенно быстрее, чем величина (zI - A)-1 - Q(zI - H)-1e1 ).

Предложение 10. Пусть оператор A нормален и спектральная мера пары (A, ) регулярна.68 Если существует такая точка z , D. Calvetti, S.-M. Kim, L. Reichel, SIAM J. Matrix Anal. Appl., 26 (2005), 765–781.

R. W. Freund, M. Hochbruck, In: Linear Algebra for Large Scale and Real-Time Applications, M. S. Moonen et al. (eds), Kluwer Academic Press, Amsterdam, 1993, 377–380.

У. Рудин, Функциональный анализ, М., Мир, 1975: гл. 12.

H. Stahl, V. Totik, General Orthogonal Polynomials, Encyclopedia of Math. Appl., 43, Cambridge, Cambridge Univ. Press, 1992: гл. 3.

что limm |f(z) - fm(z)|1/m < e-g(z), то у множества E и, следовательно, у спектра S нет внутренних точек.

Теорема 12. Если спектр S нормального оператора A является частью аналитической кривой без самопересечений и не разделяет комплексную плоскость, то справедливы оценки lim |f(z) - fm(z)|1/m < e-g(z), z C\ Co(S), m lim |f(z) - fm(z)|1/m < e-g(z), z = C\E, m где Co(S) — выпуклая оболочка S.

Продемонстрировано, что замена нормального оператора с нетривиальной квадратурой на подобный ему в алгебраическом смысле с помощью ограниченного и непрерывно обратимого оператора может привести к потере нетривиальности (т. е. в ненормальном случае оценку в терминах спектра дать нельзя).

d(t) Для марковской функции (z) =, где — положительная мера z-t с компактным носителем бесконечной мощности S = Supp , лежащим в R, сходимость диагональных аппроксимант Паде гарантируется теоремой Маркова и её уточнениями;69 70 71 см. также препринт авторапо поводу сходимости в лакунах спектра S по меньшей мере на каждом втором шаге ассоциированного процесса Ланцоша.

В работе Гончара73 (см. также работы Рахманова74 75) исследована сходимость поддиагональных аппроксимант Паде к функции + r, где r C(t), r() = 0, — рациональное возмущение , при усло вии (t) > 0 почти всюду на выпуклом замыкании S (из чего следует, что S — отрезок); даны оценки сходимости полюсов аппроксимант к полюсам r. В статье Рахманова76 рассмотрен случай носителя меры — объединения нескольких отрезков вещественной прямой и вещественного рационального возмущения r R(t). В статье Гончара и С. П. Суетинаполучены аналогичные результаты для комплекснозначных мер некоторых типов на вещественной прямой.

A. Markoff, Acta Math., 19 (1895), 93–104.

Е. М. Никишин, В. Н. Сорокин, Op. cit.: гл. 2, § 6.

H. Stahl, V. Totik, Op. cit.: гл. 6.

L. Knizhnerman, Schlumberger-Doll Research, Res. Note EMG-001-95-12 (1995), 18 p.

А. А. Гончар, Матем. сб., 97 (139) (1975), 607–629.

Е. А. Рахманов, Матем. сб., 103 (145) (1977), 237–252.

Е. А. Рахманов, Матем. сб., 118 (160) (1982), 104–117.

Е. А. Рахманов, Матем. сб., 104 (146) (1977), 271–291.

А. А. Гончар, С. П. Суетин, Современные проблемы математики, 5 (2004), 3–67.

В статье С. П. Суетина78 отмечено, что если S не лежит на прямой, то предельные точки полюсов диагональных аппроксимант Паде могут быть всюду плотны в C. Эта и родственные трудности в теории аппроксимации Паде возникают из-за квази-, а не эрмитовой ортогональности знаменателей аппроксимант. Тот факт, что соответствующие квазиор тогональные многочлены хорошо себя ведут, приходится выводить из алгебраической специфики случая.79 Мы представляем рациональное возмущение с простыми полюсами в виде, удобном для проведения процесса Арнольди. На рациональное возмущение налагается условие вещественности суммарного вычета и его положительности.

Предложение 11. Пусть s 1, 1,..., s — попарно различные комплексные числа, c1,..., cs — ненулевые комплексные числа, такие что 0 < c1+ +cs R. Существует ехдиагональная матрица sтакая тр cj T Css, что (zI - T )-1e1, e1 =, z C\{1,..., s}.

j=z-j Оставшиеся утверждения этой главы показывают, с какой скоростью метод Арнольди локализует полюсы рационального возмущения s cj s d2, cj = 1, d > 0, функции марковского типа (28). Мы j=1 j=z-j приведём здесь одно из них.

Матрицу A1 из условия предложения 12 можно найти с помощью предложения 11.

Предложение 12. Пусть — положительная мера с компактным носителем S C, A2 — оператор умножения на независимую переменную в L2,(S), K = Co(S) — замыкание поля значений A2, s 1, числа 1,..., s попарно различны, c1,..., cs — ненулевые комплексные числа, c1 + + cs = 1, d > 0, матрица A1 Css такова, что s cj (zI - A1)-1e1, e1 =, z C\{1,..., s}, z - j j=zj — нормированный собственный вектор A1, отвечающий собствен ному значению j, H = Cs L2,(S), A = A1 A2 — ортогональная прямая сумма пространств и соответствующая прямая сумма операторов. Процесс Арнольди с оператором A в H и начальным вектором T = (de1, 1) H, d2 + (S) С. П. Суетин, Успехи матем. наук, 57 (2002), 45–142: пункт 3 введения.

С. П. Суетин, Матем. сб. 191 (2000), 81–114.

С. П. Суетин, Матем. сб. 194 (2003), 63–92.

где 1 — постоянная функция единица из L2,(S), за m > s шагов выработает такие пары Ритца (j, yj), j = 1,..., m, что при подходящей их нумерации верны следующие оценки. Если при данном j (1 j s) j K, то j j lim |j - j|1/m e-g( )-min1ks g(k), lim |zj - yj|1/m e-g( ).

m m В общем случае (j E) j j lim |j - j|1/m e-g( )-min1ks g(k), lim |zj - yj|1/m e-g( ). (29) m m Здесь g — обобщ енная функция Грина области с особенностью в бесконечности.

В гл. 12 (заключительной) сформулированы краткие выводы, перечислены нерешённые задачи, упомянуты подходы других авторов и высказаны благодарности.

Машинной арифметике посвящены главы 4–6 и частично 7. Результаты глав 10 и 11 применимы только к ограниченным операторам в бесконечномерных гильбертовых пространствах. Результаты, касающиеся машинной арифметики, применимы только к матрицам. Остальные результаты применимы как к операторам, так и к матрицам или классам матриц неограниченной размерности, причём пространство обычно можно считать комплексным, даже если приведённая формулировка вещественна.

Публикации автора по теме диссертации [1] Друскин В. Л., Книжнерман Л. А. Использование операторных рядов по ортогональным многочленам при вычислении функций от самосопряжённых операторов и обоснование феномена Ланцоша. Деп.

в ВИНИТИ. 1987. № 1535-В87. 47 с.

[2] Друскин В. Л., Книжнерман Л. А. Два полиномиальных метода вычисления функций от симметричных матриц // Ж. вычисл. матем.

и матем. физ. 1989. Т. 29. № 12. C. 1763–1775.

[3] Друскин В. Л., Книжнерман Л. А. Оценки ошибок в простом процессе Ланцоша при вычислении функций от симметричных матриц и собственных значений // Ж. вычисл. матем. и матем. физ. 1991.

Т. 31. № 7. С. 970–983.

[4] Книжнерман Л. А. Вычисление функций от несимметричных матриц с помощью метода Арнольди // Ж. вычисл. матем. и матем.

физ. 1991. Т. 31. N 1. С. 5–16.

[5] Книжнерман Л. А. Оценки погрешности метода Арнольди: случай нормальной матрицы // Ж. вычисл. матем. и матем. физ. 1992.

Т. 32. N 9. С. 1347–1360.

[6] Druskin V., Knizhnerman L. The Lanczos optimization of a splittingup method to solve homogeneous evolutionary equations // J. Comput.

Appl. Math. 1992. V. 42. № 2. P. 221–231.

[7] Druskin V., Knizhnerman L. Evaluation for Krylov subspace approximation to internal eigenvalues of large symmetric matrices and bounded self-adjoint operators with continuous spectrum // Schlumberger-Doll Research. 1992. Res. note EMG-001. 20 p.

[8] Druskin V., Knizhnerman L. Error bounds for Lanczos method to compute matrix-vector functions // Cornelius Lanczos International Centenary Conference. Conference Program. December 12–17, 1993.

North Carolina State University, Raleigh, North Carolina. P. 85.

[9] Knizhnerman L. The quality of approximations to a separated eigenvalue and location of values” // Cornelius Lanczos International Centenary Conference. Conference Program. December 12–17, 1993.

North Carolina State University, Raleigh, North Carolina. P. 90.

[10] Druskin V., Knizhnerman L. Krylov subspace approximation of eigenpairs and matrix functions in exact and computer arithmetic // Numer. Linear Algebra with Appl. 1995. V. 2. № 3. P. 205–217.

[11] Книжнерман Л. А. Качество аппроксимаций к хорошо отделённому собственному значению и расположение чисел Ритца в простом процессе Ланцоша // Ж. вычисл. матем. и матем. физ. 1995. Т. 35.

N 10. С. 1459–1475.

[12] Knizhnerman L. On adaptation of the Lanczos method to the spectrum // Schlumberger-Doll Research. 1995. Res. Note EMG-001-95-12. 18 p.

[13] Книжнерман Л. А. Простой процесс Ланцоша: оценки погрешности гауссовой квадратурной формулы и их приложения // Ж. вычисл.

матем. и матем. физ. 1996. Т. 36. N 11. С. 5–19.

[14] Knizhnerman L. On adaptation of the Arnoldi method to the spectrum // Schlumberger-Doll Research. 1996. Report EMG-001-96-03. 13 p.

[15] Knizhnerman L. On adaptation of the Lanczos and Arnoldi methods to the spectrum // Workshop on Iterative Methods and Parallel Computing, June 16-21, 1997, Milovy, Czech Republic. Abstracts.

[16] Druskin V., Greenbaum A., Knizhnerman L. Using nonorthogonal Lanczos vectors in the computation of matrix functions // SIAM J.

Sci. Comp. 1998. V. 19. № 1. P. 38–54.

[17] Greenbaum A., Druskin V. L., Knizhnerman L. A. On solving indefinite symmetric linear systems by means of the Lanczos method // Ж.

вычисл. матем. и матем. физ. 1999. Т. 39. № 3. C. 371–377.

[18] Knizhnerman L. Error bounds for the Arnoldi method: a set of extreme eigenpairs // Linear Algebra and its Applic. 1999. V. 296. P. 191–211.

[19] Knizhnerman L. Adaptation of the Lanczos and Arnoldi methods to the spectrum, or why the two Krylov subspace methods are powerful // Чебышёвский сборник. 2002. V. 3. № 2. P. 141–164.

[20] Knizhnerman L. The quality of the Gauss–Arnoldi quadrature for (zI - A)-1, and application to Pad-like approximation, In: SIAMGAMM ALA 2006, Dusseldorf. Abstracts of the Applied Linear Algebra Conference SIAM-GAMM, 2006.

[21] Книжнерман Л. А. Квадратура Гаусса–Арнольди для функции (zI -A)-1, и Паде-подобная рациональная аппроксимация функций марковского типа // Матем. сб. 2008. Т. 199. № 2. С. 27–48.




© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.