WWW.DISSERS.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

   Добро пожаловать!

На правах рукописи

Оселедец Иван Валерьевич

Вычислительные тензорные методы и их применения

01.01.07 Вычислительная математика

Автореферат диссертации на соискание учёной степени доктора физико-математических наук

Москва 2011

Работа выполнена в Учреждении Российской академии наук Институте вычислительной математики РАН.

Научный консультант: чл-корр. РАН, д.ф.-м.н., профессор Тыртышников Евгений Евгеньевич

Официальные оппоненты: Ильин Валерий Павлович, д.ф.-м.н, профессор (Институт вычислительной математики и математической геофизики СО РАН, г.н.с), Гутерман Александр Эмилевич д.ф.-м.н., профессор, (механико-математический факультет МГУ, кафедра алгебры), Хазанов Владимир Борисович, д.ф.-м.н., профессор (Cанкт-Петербургский государственный морской технический университет, кафедра прикладной математики и математического моделирования).

Ведущая организация: Вычислительный центр им А.А. Дородницына РАН.

Защита состоится 20 12 г. в часов на заседании диссертационного совета Д 002.045.01 в Учреждении Российской академии наук Институте вычислительной математики РАН по адресу: 119333, г.

Москва, ул. Губкина, д. 8.

С диссертацией можно ознакомиться в библиотеке Учреждения Российской академии наук Института вычислительной математики РАН.

Автореферат разослан 200 12 г.

Учёный секретарь диссертационного совета Д 002.045.д.ф.-м.н. Г. А. Бочаров

Общая характеристика работы

Актуальность работы Многомерные задачи возникают во многих приложениях. В вычислительной химии основным уравнением является уравнение Шредингера, в котором число независимых переменных растет линейно по числу электронов. Важными многомерными уравнениями математической физики являются уравнения Фоккера-Планка, а также уравнение Блэка-Шоулза в финансовой математике. При решении стохастических и многопараметрических задач искомая функция, зависящая от нескольких параметров, должна приближаться с использованием небольшого числа степеней свободы. В задачах сжатия и обработки данных возникает необходимость приближать многомерные массивы данных.

Во всех вышеперечисленных примерах необходимо строить малопараметрические приближения для функций многих переменных и связанных с ними многомерных массивов (тензоров). При этом число координатных осей тензора может быть огромным. Например, в вычислительной химии для молекул с N электронами или атомами функции, подлежащие определению (волновые функции, потенциальные поверхности), описываются d = 3N параметрами. Использование простых сеток сразу приводит к массивам с числом элементов nd, где n число точек по одному направлению. Экспоненциальная зависимость числа параметров от числа координатных осей носит название проклятие размерности. Тем не менее, во многих приложениях удается найти методы представления многомерных массивов. В частности, могут использоваться специальные базисы, например на основе радиальных базисных функций. Однако такие схемы не являются универсальными, и для каждой конкретной задачи приходится создавать свои методы.

На данный момент не существует единого математического аппарата и подхода к построению надежных и эффективных вычислительных алгоритмов для работы с тензорами (вычислительных тензорных алгоритмов). Из алгебраических подходов можно выделить два. Они основаны на разделении дискретных переременных. Первый подход основан на так называемом каноническом разложении, а второй на разложении Таккера. Они обладают рядом достоинств и достаточно успешно применялись для различных задач, но при этом обладают существенными недостатками. Разложение Таккера не может быть использовано для большого числа координатных осей, а каноническое разложение нельзя вычислить с помощью надежных алгоритмов.

Алгебраические методы разделения переменных хорошо исследованы в двумерном случае. Это классические результаты матричного анализа, в основе которых лежит сингулярное разложение матрицы. Сингулярное разложение является устойчивым, и существуют надежные алгоритмы для его вычисления, реализованные в стандартных библиотеках линейной алгебры.

Однако, попытки напрямую перенести сингулярное разложение на случай массивов с тремя и более индексами, приводят к существенным затруднениям. Поэтому создание новых устойчивых малопараметрических представлений для многомерных массивов и эффективных алгоритмов работы с такими представлениям, является актуальной проблемой вычислительной математики.

Исследования, отражённые в диссертации, поддерживались грантами РФФИ №02-01-00590-а, 04-07-90336-в, 05-01-00721-а, 06-01-08052-офи, 08-01-00115а, 09-01-00565-а, 09-01-12058-офи_м, 09-01-91332-ННИО_а, 11-01-00549-а,1101-12137-офи-м-2011, Программами ОМН-3 и ОМН-5, грантами МК-127.2009.и МК-140.2011.1 президента РФ молодым кандидатам наук, госконтрактами П940, П1178, П1112, 14.740.11.1067, 14.740.11.0345 в рамках ФЦП Кадры.

Цели работы Целью работы является создание и обоснование эффективных вычислительных методов для аппроксимации и работы с многомерными массивами (тензорами) и их применение для решения практически важных задач высокой размерности.

Методы исследования Методами исследования являются классические результаты матричного анализа и вычислительной линейной алгебры (сингулярное разложение, QRразложение, малоранговые аппроксимации с помощью скелетного разложения матриц), мультилинейная алгебра.

Научная новизна работы Представленные результаты являются новыми и состоят в следующем.

Предложено новое представление тензоров TT-формат, которое может быть построено с помощью быстрых устойчивых алгоритмов на основе сингулярного разложения, и не содержит экспоненциального по размерности числа параметров.

Получены базовые алгоритмы для работы с массивами в TT-формате:

алгоритм перехода от полного массива к ТТ-формату с точностью (алгоритм TT-SVD), алгоритм округления (приближения) в TT-формате.

Доказано, что основные операции линейной алгебры (сложение, поэлементное умножение, умножение матрицы на вектор) можно проводить, оставаясь в рамках TT-формата; для этих операций получены явные формулы.

Получено многомерное обобщение скелетного разложения формула TT-интерполяции, которая показывает, что тензор с малыми TTрангами можно восстановить по небольшому количеству его элементов. На основе этой формулы получен многомерный крестовый метод аппроксимации тензоров.

Введено понятие тензоризации или QTT-формата, когда исходный массив малой геометрической размерности представляется как массив большей размерности за счет введения виртуальных уровней. Доказаны теоремы о QTT-структуре функций одной переменной, а также о QTTструктуре характеристической функции многомерного симплекса. Показано, что QTT-ранги обратной к ленточной теплицевой матрице не зависят от порядка матрицы.

Предложен и реализован новый метод сжатия данных с потерями на основе интерпретации QTT-формата как адаптивного вейвлет-преобразования.

На основе QTT-формата предложен новый быстрый метод решения многопараметрических задач.

Получены оценки на QTT-ранги полиномиальных потенциальных поверхностей квантовой молекулярной динамики, построен линейный по числу степеней свободы алгоритм приближенного нахождения минимального собственного значения на основе метода DMRG (Density Matrix Renormalization Group).

Теоретическая и практическая ценность Теоретическая значимость работы заключается в создании и обосновании принципиального нового математического аппарата для работы с многомерными массивами. Основой предложенного подхода является Tensor Train - разложение (TT-разложение) и и введение дополнительных размерностей (тензоризация, QTT-формат). Созданы и обоснованы вычислительные алгоритмы для работы с тензорами в TT и QTT форматах.

Практическая значимость состоит в том, что построенный математический аппарат позволил создать новые вычислительные алгоритмы для решения различных практически важных задач, которые более эффективны, чем ранее используемые алгоритмы, а также позволил решить задачи, для которых применение стандартных методов невозможно в силу экспоненциальной зависимости от числа координатных осей.

В вычислительной химии удалось получить приближенные основные состояния для потенциала Эно-Хайлеса с числом степеней свободы вплоть до 256, а также вычислить основное колебательное состояние для различных молекул более точно, чем с помощью методов, реализованных в современном квантово-химическом пакете GAMESS. При решении многопараметрических и стохастических уравнений методы, основанные на TT-разложении, оказались в десятки раз эффективнее, чем стандартные методы (стохастический метод Галеркина и метод стохастической коллокации). Методы аппроксимации многомерных массивов были также применены для сжатия поля температуры, вычисленной с помощью -модели ИВМ РАН, удалось получить сжатие в 44 раза при абсолютной погрешности 0.1 градус Цельсия.

Обоснованность и достоверность результатов Представленные в диссертации результаты имеют строгое математическое обоснование, а вычислительные алгоритмы основаны на применении классических процедур линейной алгебры и матричного анализа. Достоверность результатов основана на известных оценках сложности работы классических алгоритмов линейной алгебры и матричного анализа, а также на сравнении полученных результатов с результатами, полученными с помощью стандартных алгоритмов.

Апробация работы Основные результаты докладывались на следующих конференциях и семинарах.

Международные конференции Матричные методы и операторные уравнения (ИВМ РАН, 2005 и 2007).

3-я международная конференция Математические идеи П.Л. Чебышёва и их приложение к современным проблемам естествознания (Обнинск, ИАТЭ, 2006).

Международные конференции по линейной алгебре ILAS-13 (Амстердам, 2006), ILAS-14 (Шанхай, 2007), ILAS-17 (Пиза, 2010), ILAS-18 (Брауншвейг, 2011).

Международные конференция SCPDE (Гонконг, 2008, 2010).

Международная конференция по структурированным матрицам (Кортона, 2008).

Международная конференция по численному анализу и теории операторов (Хельсинки, 2008).

Международный симпозиум GAMM (Гданьск, 2009).

Workshop on Advanced Computer Simulation Methods for Junior Scientists (Санкт-Петербург, 2009).

Международные семинары GAMM-26, GAMM-27.

Международная научная конференция Современные проблемы вычислительной математики и математической физики памяти А.А. Самарского (Москва, 2009).

Международная конференция МДОЗМФ (Херсон, 2009).

Международная конференция NOLTA-2009 (Саппоро, 2009).

Международная конференция AIM Workshop on computational optimization for tensor decompositions (Пало Альто, 2010).

Международная конференция Актуальные проблемы вычислительной математики и математического моделирования посвященная 85-летию Г.И. Марчука, (Новосибирск, 2010).

Международная конференция Tensor Methods in Multi-Dimensional BoundaryValue and Spectral Problems, (Лейпциг, 2010).

Международная конференция TDA (Монополи, 2010).

Международная конференция Separation of variables and applications (Ницца, 2010).

Школа-конференция Теория и численные методы решения обратных и некорректных задач, (Новосибирск, 2010).

Международная конференция HDA-2011 (Бонн, 2011).

Международный симпозиум Householder-18 (Тахо, 2011).

Всероссийский симпозиум по прикладной и промышленной математике (Кисловодск, 2006, 2008).

Всероссийские конференции Научный сервис в сети интернет (АбрауДюрсо, 2006,2007,2008,2009,2011).

XLIX научная конференция МФТИ (Москва, 2006).

Ломоносовские чтения (Москва, 2008).

Тихоновские чтения (Москва, 2006,2007, 2010).

Семинар Вычислительные и информационные технологии в математике (научные руководители в разные годы Ю.М. Нечепуренко, В.И.

Лебедев, Е.Е. Тыртышников, В. И. Агошков, А. Б. Богатырев, Ю.В.

Василевский), Семинар кафедры теории функций и функционального анализа мехмата МГУ (научный руководитель Б.С. Кашин), Семинар кафедры алгебры мехмата МГУ (2009).

Семинар ИПМ РАН им. Бабенко (2009).

Семинар физфака МГУ и НИВЦ МГУ (2011, руководитель А.Г. Ягола ).

Семинар кафедры химии РХТУ им. Менделеева (2011, руководитель В.Г. Цирельсон).

Семинар кафедры физической химии химфака МГУ (2011, руководитель А.Ю. Немухин).

Публикации Основные результаты диссертации отражены в публикациях [1-32], из них 8 работ опубликовано в отечественных рецензируемых изданиях, рекомендованных ВАК, 15 работ опубликовано в международных рецензируемых изданиях из рекомендованного ВАК списка Web of Science: Citation Index Expanded (база данных по естественным наукам), 2 работы в рецензируемых международных изданиях, 1 работа в сборнике научных трудов. работ опубликовано в других научных изданиях.

Вклад автора в совместные работы заключался: в формировании постановки проблемы [1, 6, 9, 13, 15, 18, 20, 22, 31] предложении идеи решения [2, 6, 9, 10, 11, 12, 13, 16, 17, 18, 19, 20, 22, 24, 25, 26, 27, 29, 31], теоретическом обосновании [6, 11, 12, 16, 17, 18, 27], совместном теоретическом обосновании [1, 2, 9, 10, 13, 15, 20, 24, 25, 26, 31], технической реализации [2, 10, 11, 12, 16, 17, 18, 20, 24, 25, 26, 27], совместной технической реализации [13, 21, 31], постановке численных экспериментов [2, 10, 11, 12, 16, 17, 18, 20, 24, 25, 26, 27].

Благодарности Автор выражает искреннюю благодарность своему научному консультанту проф., чл.-корр РАН Е.Е. Тыртышникову за всестороннюю поддержку и прекрасную атмосферу, созданную в ИВМ РАН, д.ф.-м.н, проф. В.И. Агошкову, д.ф.-м.н А.Б. Богатыреву, д.ф.-м.н Ю.В. Василевскому, д.ф.-м.н. Ю.М.

Нечепуренко за очень полезные и стимулирующие обсуждения и предложения, повлекшие за собой существенную переработку работы, д.ф.-м.н Б.Н.

Хоромскому за плодотворное сотрудничество, к.ф.-м.н В.Х. Хоромской за полезные замечания и обсуждения.

Диссертация посвящена памяти моего дедушки, к.ф.-м.н, генерал-майора И.О. Бежаева. (1918-2010).

Структура и объём работы Работа состоит из введения, четырёх глав и заключения. Объём диссертации 206 страниц. Библиография включает в себя 158 наименований. Диссертация содержит 20 рисунков и 7 таблиц.

Краткое содержание работы Во введении отображена актуальность темы диссертационной работы, сформулированы основные цели и показана научная новизна и практическая значимость работы.

В первой главе вводится новое тензорное разложение TT-разложение.

TT-разложение лежит в основе всех разработанных в диссертации вычислительных тензорных методов. В разделе 1.1 формулируются требования к малопараметрическим представлениям тензоров (тензорным форматам). В разделе 1.2 рассматриваются два стандартных разложения тензоров: каноническое разложение и разложение Таккера, приводятся их свойства. Формулируются их недостатки, и ставится основной вопрос:

Можем ли мы найти такое разложение для d-мерных массивов, которое свободно от экспоненциальной зависимости от d, но при этом операции линейной алгебры и округление можно проводить с помощью устойчивых подходов на основе SVD? В разделе 1.3 доказываются две основные леммы, которые позволяют построить такое представление.

Лемма 1 Если тензор A = [a(i1,..., id)] имеет каноническое разложение ранга r, то для любой матрицы-развёртки B = [a(I1, I2)] rank B r.

Лемма 2 Пусть тензор A = [A(i1,..., id)] имеет каноническое представление ранга r и развёртка B = [A(I1, I2)] определяется длинными индексами I1 и I2, содержащими соответственно d1 и d2 исходных индексов. Рассмотрим произвольное разложение B вида B = UV, U = [U(I1, )], V = [V(I2, )], где U и V имеют r = rank B столбцов. Тогда U(I1, ) и V(I2, ) могут быть рассмотрены как тензоры порядка d1+1 и d2+1 соответственно, и для обоих тензоров существуют канонические представления ранга не выше r.

На основании этих двух лемм в разделе 1.4. строится иерархическое разложение Таккера. Пример построения приведен на Рис. 1.

Рис. Расщепление измерений.

Предположим, что для 9-мерного массива существует (неизвестное нам) каноническое разложение ранга r. Тогда на основании леммы 1 его можно заменить на 6-мерный и 5-мерный массивы, которые (на основании леммы 2) имеют каноническое представление ранга не выше r. Продолжая рекурсию, получим вместо исходного 9-мерного массива 7 3-х мерных массивов. Для числа параметров такого представления верна следующая теорема.

Теорема 1 Пусть A d-мерный тензор с каноническим разложением ранга r. Тогда существует ТТ-разложение с nrd + (d - 2)r3 (1) параметрами.

В разделе 1.5 все три рассмотренных разложения: разложение Таккера, каноническое разложение и иерархическое разложение Таккера рассматривается с точки зрения формализма тензорных сетей. Вводится TT(Tensor train разложение), как частный случай иерархического разложения Таккера. Оно имеет вид.

A(i1,..., id) = G1(i1, 1) G2(1, i2, 2)...

,...,d-(2)... Gd-1(d-2, id-1, d-1) Gd(d-1, id), Доказывается следующая теорема, которая показывает эквивалентность любого иерархического разложения Таккера и TT-разложения с точностью до некоторой перестановки индексов.

Теорема 2 Тензорное разложение, заданное произвольным деревом, удовлетворяющим ограничениям 1 и 2 можно представить в виде A(i1,..., id) = G1(0, i(1), 1) G2(1, i(2), 2)...

1,...,d-(3)... Gd-1(d-2, i(d-1), d-1) Gd(d-1, i(d), d).

В разделе 1.6 исследуются свойства TT-разложения. Вводится компактная матричная форма разложения в виде произведения матриц, зависящих от параметров:

A(i1,..., id) = G1(i1)G2(i2)... Gd(id), (4) где Gk(ik) матрица размера rk-1 rk, r0 = rd = 1. Доказана теорема, связывающая TT-ранги с рангами матриц-разверток тензора A. Матрица Ak называется k-ой разверткой тензора A, если Ak(i1... ik; ik+1... id) = A(i1,..., id), (5) т.е. первые k индексов нумеруют строки Ak, а последние (d - k) столбцы Ak.

Теорема 3 Если для каждой матрицы-развёртки Ak d-мерного тензора A вида (5) выполняется rank Ak = rk, (6) то существует разложение (4) с TT-рангами не выше rk.

Доказательство теоремы 3 конструктивно и дает алгоритм построения TT-разложения TT-SVD. Разложение является устойчивым, что показывает Теорема 4 Для заданного тензора A = [A(i1,..., id)] существует TT-приближени T = [T(i1,..., id)] с TT-рангами rk такими, что d-||A - T||F 2, (7) k k=где k расстояние (во фробениусовой норме) от Ak до наилучшего приближения ранга rk:

k = min ||Ak - B||F.

rank Brk В разделе 1.7 вводится и обосновывается быстрая процедура тензорного округления: для заданной точности и заданного тензора A в TT-формате с рангами rk r требуется найти тензор B с минимально возможными рангами такими, что ||A - B||F ||B||F. Вычислительная сложность такого алгоритма O(dnr3) операций. В разделе 1.8 вводится TT-формат для матриц, и доказывается теорема о связи кронекеровских рангов матрицы с TTрангами. В разделе 1.9 систематически выводятся формулы для основных арифметических операций в TT-формате: сложение и умножение на число, поэлементное произведение, скалярное произведение, умножение матрицы на вектор, вычисление многомерной свертки. Все эти процедуры имеют линейную по d сложность, и результат получается также в TT-формате. В разделе 1.10 вводится понятие функционального TT-разложения, получены явные формулы для FTT-представления нескольких функций многих переменных, которые в дальнейшем будут использованы для получения оценок для числа параметров QTT-формата. В разделах 1.11-1.12 получена интерполяционная формула в TT-формате, и доказано, что если известно, что тензор имеет ранг r, его можно точно восстановить по O(dnr2) элементам. Предложен адаптивный многомерный крестовый метод (TT-cross) для нахождения интерполяционных индексов на основе алгоритма поиска подматрицы максимального обьема. В разделе 1.13 приведены краткие выводы.

Глава 2 посвящена QTT-разложению (Q=Quantized), которое основано на идее виртуальных уровней или квантизации. В разделе 2.1 вводится понятие квантизации и дается определение QTT-формата. При квантизации заданный массив превращается в многомерный. (например, одномерный массив с 2d элементами рассматривается как d-мерный массив с модовыми размерами 2). К этому новому массиву применяется TT-разложение. Если ранги малы, то получаем число параметров 2dr2, т.е. логарифм от полного числа элементов. В разделе 2.2. получены явные QTT-представления для полиномов, тригонометрических функций и функций, для которых f(x+y) является сепарабельной. Для рациональных функций доказано, что QTT-ранги зависят от шага сетки и требуемой точности логарифмически.

В разделе 2.3 получено явное QTT-представление для характеристической функции K-мерного стандартного симплекса, показано, что QTT-ранги ограничены 2K-1 и не зависят от шага сетки. В разделе 2.4 приведены QTTразложения некоторых операторов, в частности, оператора Лапласа, который играет важную роль во многих многомерных задачах (как оператор кинетической энергии). Также в разделе 2.4 доказано, что QTT-ранги обратной к ленточной теплицевой матрице с верхней шириной ленты s1 и нижней шириной ленты s2 ограничены (s1 + s2)2 + 1, т.е. не зависят от порядка матрицы.

В разделе 2.5 выявлена аналогия между QTT-разложением и дискретными вейвлет-преобразованиями. На основе этой связи в разделе 2.6 вводится новая интерпретация QTT как нелинейного адаптивного вейвлет-преобразования с фильтрами, вычисляемыми по самой функции. Построены алгоритмы вычисления фильтров и применения преобразования. В разделе 2.7 показано, как применить WTT для создания новых вейвлет-преобразований.

Глава 3 посвящена применению разработанных в главах 1 и 2 вычислительных тензорных методов для решения практически важных многомерных задач. Раздел 3.1 посвящен перечислению таких задач в следующих областях: вычислительная химия, многопараметрические задачи, сжатие данных. В разделе 3.2 описывается формулировка задачи о решении молекулярного уравнения Шредингера, кратко вводятся основные понятия. В разделе 3.3. формулируется задача на собственные значения многомерного оператора, описывающего колебательные движения молекул. В разделе 3.4 для случая полиномиальной потенциальной поверхности, имеющего важный практический смысл при малых колебаниях, доказаны оценки на TT и QTT ранги вида rk = O(f s/2 ), где f число степеней свободы, а s порядок полинома.

Для молекулы HONO получены QTT-представления высокой точности для потенциальной поверхности с рангами порядка 10 и относительной точностью 10-8.

В разделе 3.5 строится оптимизационный метод нахождения минимального собственного значения матрицы, заданной в QTT формате, основаный на алгоритме Density Matrix Renormalization Group (DMRG), который много лет применялся в физике твердого тела. Оказывается, что этот алгоритм является ничем иным, как методом блочной релаксации в QTT-формате. Получены расчетные формулы для одной итерации алгоритма. В разделе 3.приведены численные расчеты для трехмерного потенциала и для потенциала Эно-Хайлеса с числом степеней свободы вплоть до 256. В разделе 3.произведено сравнение алгоритма DMRG-QTT на реальных молекулах с использованием данных, полученных с помощью пакета GAMESS. Результаты сравнения по вычислению энергии основного колебательного состояния приведены в таблице 1. Видно, что тензорный метод систематически дает более низкое, а так как методы являются вариационными, то и лучшее приближение к минимальному собственному значению при заданной дискретизации потенциальной поверхности. Время расчета всех трех методов (при вычисленной потенциальной поверхности) составило порядка нескольких минут.

Таблица Минимальные собственные значения для различных молекул (в см-1).

Молекула E(DIAG) E(VMP2) E(DMRG-QTT) Эксперимент H2CO 6005.83 5904.54 5808.19 5643.CH3OH 12264.27 12071.90 11187.57 10848.C2H4 11477.09 11298.93 11263.74 10784.В разделе 3.8 рассмотрено вычисление многих собственных значений с помощью решения нестационарной задачи в мнимом времени d = iH, (0) = 0, H = - + V, dt и расчет спектра с помощью преобразования Фурье от автокорреляционной функции a(t) = ((t), (0)). Используется схема расщепления МарчукаЯненко-Стрэнга и арифметика TT-формата с округлением. Результаты вычисления спектра (при разных точностях) приведены на Рис. 2 и 3.

Рис. Спектр для потенциала Хенона-Хайлеса (f = 2) при использовании различных рангов. По горизонтали частота, по вертикали амплитуда Рис. Некоторые детали спектра В разделе 3.9 описывается применение разработанных вычислительных методов к решению стохастических и многопараметрических задач. Рассматриваются задачи вида L(a)u = f, где линейный оператор L(a) зависит от некоторого случайного поля a. Случайное поле предполагается параметризованным с помощью M параметров, после чего задача рассматривается как система линейных уравнений с NpM неизвестными. Описаны стандартные подходы к решению таких задач, основанные на стохастическом методе Галеркина и методе стохастической коллокации. В диссертации предложено использовать TT-разложение для приближенного представления решения. В разделе 3.10 представлен метод решения больших линейных систем, основанный на итерациях Ричардсона с одноточечным предобуславливателем. На каждом шаге такого метода требуется решить r систем при некоторых значениях параметров, остальные вычисления производятся с помощью быстрой TT-арифметики. В разделе 3.12 приведены численные эксперименты по решению скалярного уравнения диффузии с коэффициентом, зависящим от параметров. Рассмотрены четыре примера.

Приведем результаты численных экспериментов для одного из них Необходимо решить уравнение диффузии с граничными условиями Дирихле на квадрате [0, 1]2. Коэффициент диффузии задан в виде a(x, y) = 1 + ii(x)yi, i=где i(x) характеристические функции четырех кругов, см. Рис.4. Переменные yi, i = 1,..., 4 принадлежат интервалу [-0.99, 0]. Такая задача может возникнуть, например, при решении обратной задачи о восстановлении коэффициента диффузии в некоторых подобластях: в этом случае решение многопараметрической задачи эквивалентно решению всех прямых задач, и эффективному представлению для многомерной параметрической зависимости в QTT-формате. Для дискретизации по физической переменной взята сетка 256 256. Результаты расчетов приведены на рис. 5.

Рис. Расчетная область: 4 круга Рис. Задача 4-х кругов. Вверху: невязка в зависимости от итерации. Слева внизу: время на итерацию. Справа внизу: ранги в зависимости от итерации.

Стандартные методы существенно более трудоемки. Тензорный метод требует всего 100 решений линейных систем для достижения точности 10-5. Метод стохастической коллокации требует решения в 1000 раз больше линейных систем, а стохастический метод Галеркина требует решения системы, в которой примерно 60 миллионов неизвестных.

В разделе 3.12 рассмотрен пример примения WTT-разложения для сжатия поля температуры, вычисленного с помощью -модели общей циркуляции океана, разработанной в ИВМ РАН. Данные представляют собой четырехмерный массив размера 36033740648 (NxNyNzNt ), в котором хранится температура в узлах широтно-долготной сетки, с 40 уровнями по высоте. Интервал по времени 1 час. Весь массив занимает на диске объём примерно 12 гигабайт, и необходимо приблизить его с потерями, с ошибкой в C-норме не больше 0.1 градуса Цельсия. При таких условиях удалось получить сжатие примерно в 44 раза. Более подробно численные результаты приведены в таблице 2.

Таблица Сжатие массива температуры с помощью WTT-разложения Память Ошибка абсолютная Ошибка относительная Время сжатия 497 MB 0.0392 0.0004 500 секунд 277 MB 0.0984 0.0009 500 секунд Отметим, что время сжатия оказалось меньше, чем полное время, требуемое на чтение всего массива в оперативную память.

В заключении сформулированы основные результаты диссертации.

Основные результаты работы Основной результат диссертации: введено и исследовано новое представление тензоров ТТ-формат, созданы эффективные вычислительные алгоритмы для работы с тензорами в TT-формате и применены для решения практически важных многомерных задач. Этот результат состоит в следующем:

Предложено новое представление тензоров TT-формат, которое, в отличие от канонического разложения, может быть построено с помощью быстрых устойчивых алгоритмов на основе сингулярного разложения, и в отличие от разложения Таккера не содержит экспоненциального по размерности числа параметров Получены все базовые алгоритмы для работы с массивами в TT-формате:

переход от полного массива к ТТ-формату с точностью (алгоритм TT-SVD), алгоритм округления в TT-формате. Показано, что основные операции линейной алгебры (сложение, поэлементное умножение, умножение матрицы на вектор) можно проводить, оставаясь в рамках TT-формата.

Получено многомерное обобщение скелетного разложения формула TT-интерполяции, которая показывает, что тензор с малыми TTрангами можно восстановить по небольшому количеству его элементов. На основе этой формулы получен многомерный крестовый метод аппроксимации тензоров.

Введено понятие тензоризации или QTT-формата, когда исходный массив малой геометрической размерности представляется как массив большей размерности за счет введения виртуальных уровней. Доказаны теоремы о QTT-структуре функций одной переменной, а также о QTT-структуре характеристической функции многомерного симплекса.

Показано, что QTT-ранги обратной к ленточной теплицевой матрицы не зависят от n.

Создан новый метод сжатия данных с потерями на основе интерпретации QTT-формата как адаптивного вейвлет-преобразования.

На основе QTT-формата построен метод решения многопараметрических задач, показана его эффективность на численных экспериментах Получены оценки на QTT-ранги полиномиальных потенциальных поверхностей квантовой молекулярной динамики, построен эффективный алгоритм нахождения минимального собственного значения, основанный на методе DMRG, который линеен по числу степеней свободы, вычислено минимальное собственное значения потенциала Эно-Хайлеса с числом степеней свободы вплоть до 256.

На основе решения нестационарной задачи построен метод эффективного нахождения спектра Гамильтонианов квантовой молекулярной механики (колебательных спектров) QTT/WTT разложения применены для сжатия поля температуры, вычисленного с помощью -модели общей циркуляции океана ИВМ РАН, получено сжатие в 44 раза с точностью 0.1 градус Цельсия.

Публикации по теме диссертации [1] Оселедец И. В., Савостьянов Д. В. Методы разложения тензора // Матричные методы и технологии решения больших задач / ред.

Е. Е. Тыртышников. ИВМ РАН, 2005. С. 51–64.

[2] Оселедец И.В., Тыртышников Е.Е. Приближенное обращение матриц при численном решении гиперсингулярного интегрального уравнения // Ж. вычисл. матем. и матем. физ. 2005. Т. 45, № 2. С. 315–326.

[3] Оселедец И.В. Применение разделенных разностей и B-сплайнов для построения быстрых дискретных преобразований вейвлетовского типа на неравномерных сетках // Матем. заметки. 2005. Т. 77, № 5.

С. 743–752.

[4] Оселедец И. В., Савостьянов Д. В. Минимизационные методы аппроксимации тензоров и их сравнение // Ж. вычисл. матем. и матем.

физ. 2006. Т. 46, № 10. С. 1752–1734.

[5] Оселедец И.В. Оценки снизу для сепарабельных аппроксимаций ядра Гильберта // Матем. сб. 2007. Т. 198, № 3. С. 137–144.

[6] Оселедец И. В. О новом тензорном разложении // ДАН. 2009. Т.

427, № 2. С. 168–169.

[7] Оселедец И. В. О приближении матриц логарифмическим числом параметров // ДАН. 2009. Т. 428, № 1. С. 23–24.

[8] Оселедец И.В., Тыртышников Е.Е. Рекурсивное приближение многомерных тензоров // ДАН. 2009. Т. 427, № 1. С. 14–16.

[9] Замарашкин Н.Л., Оселедец И.В., Тыртышников Е.Е. Тензорная структура обратной к ленточной теплицевой матрице // ДАН. 2009.

Т. 422, № 2. С. 168–169.

[10] Olshevsky V., Oseledets I. V., Tyrtyshnikov E. E. Tensor properties of multilevel Toeplitz and related matrices // Linear Algebra Appl. 2006.

Vol. 412, no. 1. P. 1–21.

[11] Oseledets I.V., Tyrtyshnikov E. E. A unifying approach to the construction of circulant preconditioners // Linear Algebra Appl. 2006. Vol. 418, no. 2–3. P. 435–449.

[12] Olshevsky V., Oseledets I. V., Tyrtyshnikov E. E. Superfast inversion of two-level Toeplitz matrices using Newton iteration and tensor-displacement structure // Operator Theory: Advances and Applications. 2008. Vol.

179. P. 229–240.

[13] Oseledets I. V., Savostianov D. V., Tyrtyshnikov E. E. Tucker dimensionality reduction of three-dimensional arrays in linear time // SIAM J.

Matrix Anal. Appl. 2008. Vol. 30, no. 3. P. 939–956.

[14] Oseledets I. V. The integral operator with logarithmic kernel has only one positive eigenvalue // Linear Algebra Appl. 2008. Vol. 428, no. 7.

P. 1560–1564.

[15] Oseledets I. V., Tyrtyshnikov E. E., Zamarashkin N. L. Matrix inversion cases with size-independent rank estimates // Linear Algebra Appl. 2009.

Vol. 431, no. 5-7. P. 558–570.

[16] Oseledets I. V., Savostyanov D. V., Tyrtyshnikov E. E. Fast simultaneous orthogonal reduction to triangular matrices // SIAM J. Matrix Anal. Appl.

2009. Vol. 31, no. 2. P. 316–330.

[17] Oseledets I. V., Savostyanov D. V., Tyrtyshnikov E. E. Linear algebra for tensor problems // Computing. 2009. Vol. 85, no. 3. P. 169–188.

[18] Oseledets I. V., Tyrtyshnikov E. E. Breaking the curse of dimensionality, or how to use SVD in many dimensions // SIAM J. Sci. Comput. 2009.

Vol. 31, no. 5. P. 3744–3759.

[19] Oseledets I. V., Savostyanov D. V., Tyrtyshnikov E. E. Cross approximation in tensor electron density computations // Numer. Linear Algebra Appl. 2010. Vol. 17, no. 6. P. 935–952.

[20] Oseledets I. V., Tyrtyshnikov E. E. TT-cross algorithm for the approximation of multidimensional arrays // Linear Algebra Appl. 2010. Vol.

432, no. 1. P. 70–88.

[21] How to find a good submatrix / S.A. Goreinov, I.V. Oseledets, D.V. Savostyanov et al. // Matrix Methods: Theory, Algorithms, Applications / Ed. by V. Olshevsky, E. Tyrtyshnikov. World Scientific Publishing, 2010. P. 247–256.

[22] Goreinov S. A., Oseledets I. V., Savostyanov D. V. Wedderburn rank reduction and Krylov subspace method for tensor approximation. Part 1: Tucker case: Preprint 2010-01. Moscow: INM RAS, 2010. arXiv:1004.1986.

http://pub.inm.ras.ru.

[23] Oseledets I.V. Constructive representation of functions in tensor formats:

Preprint 2010-04. Moscow: INM RAS, 2010.http://pub.inm.ras.ru.

[24] Khoromskij B. N., Oseledets I. V. QTT-approximation of elliptic solution operators in high dimensions // Rus. J. Numer. Anal. Math. Model.

2011. Vol. 26, no. 3. P. 303–322.

[25] Khoromskij B. N., Oseledets I. V. Quantics-TT collocation approximation of parameter-dependent and stochastic elliptic PDEs // Comput. Meth. Appl. Math. 2010. Vol. 10, no. 4. P. 376–394.

[26] Khoromskij B. N., Oseledets I. V. DMRG + QTT approach to highdimensional quantum molecular dynamics: Preprint 68. Leipzig: MPI MIS, 2010.www.mis.mpg.de/preprints/2010/preprint2010_68.pdf.

[27] Oseledets I. V. Tyrtyshnikov E.E. Algebraic wavelet transform via quantics tensor train decomposition // SIAM J. Sci. Comput. 2011. Vol. 31, no. 3. P. 1315–1328.

[28] Oseledets I. V. Approximation of 2d 2d matrices using tensor decomposition // SIAM J. Matrix Anal. Appl. 2010. Vol. 31, no. 4. P. 2130– 2145.

[29] Tensor structured iterative solution of elliptic problems with jumping coefficients: Preprint 55 / S. Dolgov, B. Khoromskij, I. Oseledets, E. Tyrtyshnikov. Leipzig: MPI MIS, 2010.www.mis.mpg.de/preprints/2010/ preprint2010_55.pdf.

[30] Oseledets I. V. Tensor-train decomposition // SIAM J. Sci. Comput.

Vol. 33, no. 5. P. 2295–2317.

[31] Dolgov S. V., Oseledets I. V. Solution of linear systems and matrix inversion in the TT-format: Preprint 19 (Submitted to SIAM J. of Sci. Comput.). Leipzig: MIS MPI, 2011.http://www.mis.mpg.de/preprints/2011/ preprint2011_19.pdf.

[32] Oseledets I. V. DMRG approach to fast linear algebra in the TT-format // Comput. Meth. Appl. Math. 2011. Vol. 10, no. 3. P. 382–393.






© 2011 www.dissers.ru - «Бесплатная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.