Применение функционального анализа в теории приближений. Тверь: ТвГУ, 1999. С. 19-30.
=========================================================
УДК 519.6 : 62.50
В.О.АШКЕНАЗЫ
Тверской государственный университет
СПЛАЙН–ПОВЕРХНОСТИ И АППРОКСИМАЦИОННЫЙ ПОИСК ЭКСТРЕМУМА
Обсуждаются математические основы и вычислительные аспекты аппроксимационного метода оптимизации дорогостоящих целевых функций. Для аппроксимации целевой функции по ее значениям, получаемым путем трудоемких вычислений или экспериментальных измерений, предлагается использовать вариационные и стохастические сплайн-поверхности.
-------------------------------------------------------------------------------------------------
SURFACE SPLINES AND THE APPROXIMATION METHOD OF EXTREMUM SEARCH
By Wenjamin O. Aszkenazy
We are considering the mathematical principles and computational aspects of the approximation technique for optimization of expensive objective functions. To approximate the objective function on the basis of its values obtained by means of complicated computations or experimental measurements, we propose to use the variational thin plate splines and stochastic surface splines.
-------------------------------------------------------------------------------------------------
![]()
Во многих прикладных постановках эта задача характеризуется рядом особенностей, затрудняющих ее практическое решение:
– явный вид целевой функции
может быть неизвестен и определение ее значений в точках
в процессе поиска экстремума производится либо путем дорогостоящих измерений на реальном объекте, либо в результате трудоемкого численного моделирования на ЭВМ;
– получаемые при этом значения целевой функции обычно определяются с некоторыми случайными погрешностями
![]()
– отсутствуют сведения о производных (векторе градиента) целевой функции;
– целевая функция в прикладных задачах оптимизации может быть многоэкстремальной
.В таких условиях для решения задачи (1) необходимо использовать поисковые (нулевого порядка) численные методы глобальной оптимизации, отдавая при этом предпочтение методам, слабо чувствительным к наличию помех (погрешностей определения значений
. В то же время экспериментальное определение значений целевой функции в большинстве прикладных задач является весьма дорогостоящим, так как сопряжено с большими экономическими или вычислительными затратами.
Эти затраты могут быть настолько велики, что при планировании очередных точек поиска
оказываются оправданными любые усилия, направленные на максимально возможное использование всех ранее полученных данных. Для этого, в частности, целесообразно на каждом шаге поиска экстремума строить глобальную аппроксимацию целевой функции, наилучшим образом согласующуюся с полученными значениями во всех уже пройденных точках и с априорными представлениями о виде целевой функции и помех. При этом использование большого числа точек и пересчет аппроксимации после каждого нового определения значения целевой функции позволяет усреднять помехи и получать все более точную аппроксимацию. Такому замыслу соответствует следующий алгоритм.
Общий алгоритм аппроксимационного поиска экстремума дорогостоящей целевой функции :
Начальный этап. Выбрать наименьшее число
начальных точек
, расположив их в области поиска экстремума
таким образом, чтобы обеспечить эффективное построение нетривиальной глобальной аппроксимации целевой функции. Определить значения целевой функции
(возможно, с погрешностями) в этих точках. Положить
и перейти к основному этапу.
Основной этап.
Шаг 1. По имеющемуся множеству данных
построить функцию
, наилучшим образом аппроксимирующую неизвестную целевую функцию
. Аппроксимация
должна допускать явное представление с легко вычисляемыми производными.
Шаг 2. Найти точку
как решение экстремальной задачи
![]()
используя для этого любой эффективный вычислительный алгоритм глобальной оптимизации явно заданной гладкой функции ![]()
Шаг 3.
ЕслиПримечание. Заметим, что если точка
совпадет с одной из уже имеющихся точек
, то следует предпринять дополнительные действия по надлежащему выбору новой точки
.
Идею аппроксимации целевой функции используют многие существующие численные методы поиска экстремума, однако обычно осуществляется лишь локальная линейная или квадратичная аппроксимация на основе данных, полученных в одной-двух последних точках поиска. Описанная выше общая схема аппроксимационного поиска экстремума до последнего времени не была реализована в связи с вычислительными трудностями глобальной аппроксимации функций многих переменных по произвольной системе точек, не расположенных на регулярной сетке.
2. Многообещающим в этом смысле является использование вариационных сплайн-поверхностей
(Соответствующий вычислительный алгоритм оптимального восстановления гладкой функции двух переменных был впервые предложен в [1]. Математическая теория и вычислительные аспекты построения интерполяционных и сглаживающих сплайн-функций в многомерной области на хаотической сетке детально разрабатывались как в нашей стране, так и за рубежом (см., например, [2]-[5]).
Сглаживающий
-сплайн (сплайн-поверхность)
, обеспечивает минимизацию функционала

на пространстве Соболева
, где первый член характеризует среднее
![]()
характеризует "гладкость" аппроксимации. Здесь
,
где
- мультииндекс. Параметр регуляризации (сглаживания)
выбирается так, чтобы согласовать невязку с погрешностями в исходных данных ![]()
Если
, а множество точек
содержит подмножество точек
, на которых можно построить единственный многочлен
степени, то существует единственный непрерывный
-сплайн вида

где
- это различные одночлены степени меньшей или равной
, а
.
Функция
является фундаментальным решением (функцией Грина) полигармонического уравнения (см., например, [6]) и с точностью до положительного постоянного множителя имеет вид

Коэффициенты
и
находятся из решения линейной системы

где ![]()

Определяемые простым аналитическим соотношением (5) сплайн-функции
бесконечно дифференцируемы во всех точках
, кроме точек
, где они непрерывно дифференцируемы вплоть до производных порядка
. Таким образом, изменяя параметр "гладкости"
, можно получить аппроксимирующие функции
требуемого класса гладкости
, согласующегося с классом гладкости целевой функции
. Порядок гладкости сплайн-поверхности при данном значении параметра
можно увеличить, используя псевдополиномиальные сплайны
3. В некоторых прикладных задачах оптимизации может быть задано априорное приближенное описание неизвестной целевой функции
, (основанное, например, на физических соображениях или на особенностях
![]()
где
- известное случайное поле погрешностей. Таким образом, возникает задача оптимального восстановления
по ее приближенному описанию (8) и имеющимся приближенным значениям
в конечном числе точек
, при известном распределении случайных ошибок
. В [7] эта задача получения оценки
для
представлена в виде статистической игры (см., например, [8]) с вещественным функционалом потерь
. Соответствующая минимаксная оценка найдена для случая, когда
, а 
Если
есть гауссово случайное поле с нулевым средним и известной корреляционной функцией
, а случайные ошибки
, имеют нормальное распределение с нулевым средним и известной корреляционной матрицей
, то минимаксная аппроксимация функции
, имеет удобный для вычисления вид
![]()
Здесь

Заметим, что если функция
является гладкой на
, а корреляционная функция
дважды дифференцируема, то и оценка
будет также гладкой функцией. Аналитические формулы для производных от
имеют столь же простой вид, что и (9).
Достаточно реалистичным обычно является представление об однородности и изотропности случайного поля
, с
,
где
и
для
, а
- дисперсия погрешностей априорного описания
. Что касается ошибок в значениях целевой функции
, то их обычно можно считать независимыми случайными величинами с
, где
- единичная
матрица. При этом аппроксимирующая функция (9) принимает вид
![]()
где

Как показано в [9], построение статистической оценки вида (9) соответствует построению некоторого
-сплайна, обеспечивающего минимизацию функционала (4) на элементах
из гильбертова пространства с воспроизводящим ядром
. Поэтому аппроксимирующую функцию (9) можно назвать стохастической сплайн--поверхностью
Заметим, что при параметрическом представлении корреляционной функции, например, в виде
![]()
где
- интервал пространственной корреляции случайного поля
, можно попытаться оценивать значение параметра
по исходным данным
в точках поиска. Аналогичный подход использован в алгоритме аппроксимационного поиска экстремума, описанном в [10].
4. Рассмотренные в п.п. 2, 3 методы глобальной аппроксимации целевой функции могут быть положены в основу алгоритма аппроксимационного поиска экстремума дорогостоящей целевой функции по п. 1. Однако при практической реализации соответствующих вычислительных процедур возникает ряд нетривиальных проблем. К их числу можно отнести:
- построение множества начальных точек поиска;
- построение аппроксимирующей (интерполирующей или сглаживающей) сплайн-поверхности по данным о целевой функции в имеющемся множестве точек;
- отыскание экстремума аппроксимирующей функции;
- управление областью поиска и множеством текущих точек поиска;
- выбор критериев остановки процесса аппроксимационного поиска экстремума.
Рассмотрим некоторые возможные подходы к решению этих проблем.
а) Даже при решении задачи безусловной минимизации
![]()
по алгоритму, описанному в п. 1, необходимо каким-то образом локализовать начальную область поиска экстремума
с тем, чтобы разместить в ней
начальных точек поиска. Число точек,
, должно быть, с одной стороны, достаточным для построения по ним разумной исходной аппроксимации целевой функции. Так, для простейшей квадратичной аппроксимации необходимо
точек. Для построения
-сплайна с параметром гладкости
необходимо иметь не менее
точек.
Следовательно, для построения непрерывного или непрерывно дифференцируемого
-сплайна
необходимо выполнение условия
при
. Так, в двумерном случае при
мы имеем
и
(такой
-сплайн точно воспроизводит любую квадратичную функцию). Однако уже при
мы получаем
и
, а при
имеем
и ![]()
С другой стороны, число начальных точек и их размещение должны обеспечить возможность поиска глобального экстремума целевой функции. Во всяком случае
должно быть значительно больше ожидаемого числа локальных экстремумов. Размещение начальных точек должно быть в некотором смысле равномерным в области поиска
. Как указывается в [11], для эффективной глобальной оптимизации естественно выбирать
точек так, чтобы обеспечить оптимальное покрытие области
, т.е. минимизировать величину характерного параметра сгущения точек в этой области:

Однако задача оптимального покрытия в общем случае конструктивно не решена.
При практической реализации процедуры размещения начальных точек можно предположить, что область начального поиска имеет вид
![]()
Рассматривались два способа равномерного размещения в
начальных точек ![]()
"Детерминированный" способ состоит в выборе точек в узлах кубической решетки. При этом целесообразно иметь
, где
есть некоторое натуральное число. Но с ростом размерности задачи (
) кубическая решетка быстро становится неэффективной для поиска экстремума и желательно использовать "квазистохастические" равномерно распределенные последовательности точек (см. [11]-[14]), в частности
- последовательности [13] или последовательности Холтона [14]. Описанные в [13] и [14] алгоритмы построения таких последовательностей достаточно просты для реализации на компьютере.
б) Следует отметить, что основные вычислительные затраты при построении вариационных сплайн-поверхностей приходятся на обращение плотной матрицы системы (6), не являющейся положительно определенной, и для этого требуется как минимум
ячеек оперативной памяти компьютера и
арифметических операций. Это может приводить к определенным затруднениям при
. В то же время известен ряд вычислительных приемов, позволяющих экономично (вплоть до рекуррентного учета новых точек) строить вариационные сплайн-поверхности, а также оптимально выбирать параметр регуляризации
в сглаживающих сплайнах. В [3] предложен эффективный алгоритм для построения интерполяционной сплайн-поверхности, сводящий вычисление коэффициентов сплайна к решению линейной системы порядка
с положительно определенной симметрической матрицей. При этом можно воспользоваться устойчивыми и экономичными алгоритмами метода Холецкого или итерационного метода сопряженных градиентов, требующими значительно меньших вычислительных затрат (см., например, [15]). Вновь получаемые точки поиска экстремума можно учитывать, пересчитывая решение системы по методу окаймления
Аналогичными вычислительными достоинствами обладают и алгоритмы построения стохастических сплайнов. При их реализации могут быть ослаблены жесткие ограничения на минимальное число начальных точек, а матрица
всегда является симметрической и положительно определенной. Однако для построения стохастической сплайн-поверхности следует располагать некоторым априорным приближенным описанием целевой функции - например, основываясь на ее гладкости, выбрать оценку интервала ![]()
пространственной корреляции случайного поля
в модели (10).
в) Любая из описанных нами аппроксимирующих функций
, моделирующих целевую функцию
по ее значениям в
точках
, допускает явное представление функции градиента
и производных более высоких порядков. Поэтому для решения задачи (3) отыскания экстремума (если нужно - глобального) аппроксимирующей функции на каждом шаге поиска, можно использовать любую подходящую вычислительную процедуру нелинейного программирования для гладких функций (см., например, [16]-[18]).
г) При безусловной минимизации целевой функции
, после получения достаточно большого числа точек поиска, обеспечивающих приемлемую аппроксимацию
с точкой минимума
в окрестности искомой точки
, можно было бы снять начальные ограничения на область поиска
. Однако непредсказуемость эволюции модельного описания
сложной (возможно, многоэкстремальной) целевой функции
делает необходимым сохранение ограничений области
на всех шагах поиска. В одном из вариантов вычислительного алгоритма это достигается тем, что центр
для
Число точек
, по которым строится аппроксимация целевой функции, с каждым шагом поиска по алгоритму п. 1, вообще говоря, увеличивается. Необходимость ограничения множества этих точек обусловлена следующими обстоятельствами. Во-первых, при сложной структуре целевой функции
не все уже пройденные точки поиска
будут одинаково существенными для построения хорошей аппроксимации
в окрестности искомой точки минимума
: значения
(или
) в удаленных точках менее важны, чем в ближних. Иными словами, при приближении поиска к
аппроксимацию целесообразно делать все более "локальной". Поэтому при достижении некоторого максимального числа точек
следует отбрасывать в первую очередь точки, наиболее удаленные от текущей области поиска
. Кроме того, возможно управлять поиском, увеличивая допустимую невязку сглаживающих сплайн--поверхностей в удаленных точках. Оправданность такого подхода подтверждается и проведенными вычислительными экспериментами по аппроксимационному поиску экстремума на тестовых задачах.
д) Наиболее сложная в принципиальном смысле проблема связана с выбором критерия остановки поиска экстремума. В известной автору литературе по численным методам оптимизации отсутствуют обоснованные рекомендации по этому вопросу, тем более для случая, когда имеются погрешности в определении текущих значений целевой функции.
Применительно к аппроксимационному поиску экстремума целесообразно вести контроль за процессом оптимизации, сравнивая последовательно получаемые аппроксимации ![]()
5. Остановимся на вопросе о сходимости аппроксимационного метода оптимизации. Какие--либо теоремы сходимости здесь отсутствуют, как, впрочем, и для большинства других, более простых схем поисковой оптимизации (см, например, [16]). Некоторые оценки можно сделать, основываясь на свойствах сходимости аппроксимирующей функции
к истинной целевой функции ![]()
Применительно к
-сплайнам в [19] получена следующая асимптотическая оценка погрешности гладкого восполнения функции
сплайн-поверхностью
на сгущающейся сетке из
точек.
Для
в любой внутренности области
справедлива оценка
![]()
Здесь
- характерный параметр сгущения точек в области
(см. (12)). При
мы имеем оценку среднеквадратической погрешности, при
- максимальной абсолютной погрешности. Если с учетом необходимого условия гладкости сплайна принять
, а в качестве области
взять сужающуюся окрестность точки минимума, включающую "лучшие" точки поиска, то
Материалы исследований по тематике этой статьи докладывались на научной конференции, посвященной 25-летию ТвГУ [20].
СПИСОК ЛИТЕРАТУРЫ
1.
Смоляк С.А. Оптимальное восстановление функций и связанные с ним геометрические характеристики множеств // Труды третьей зимней школы по математическому программированию и смежным вопросам. М., 1970. Вып. 3. С. 509-557.2. Duchon J. Splines Minimizing Rotation-Invariant Semi-Norms in Sobolev Spaces} // Constructive Theory of Functions of Several Variables. Berlin, 1977. P. 85-100.
3. Meinguet J. Multivariate Interpolation at Arbitrary Points Made Simple // ZAMP. 1979. V. 30, N 2. P. 292--304.
4.
Василенко В.А. Сплайн-функции: теория, алгоритмы, программы. Новосибирск, 1983.5.
Ашкеназы В.О. Сплайн--поверхности. Тверь, 1993.6.
Соболев С.Л. Введение в теорию кубатурных формул. М., 1974.7.
Ашкеназы В.О. Статистическая игра оценивания функции по неточным данным // Математические методы оптимизации и управления в системах. Калинин, 1984. С. 42-48.8.
Ашкеназы В.О. Статистические игры. Калинин, 1981.9. Kimmeldorf G.S., Wahba G. A Correspondence Between Bayesian Estimation on Stochastic Processes and Smoothing by Splines // The Annals of Math. Statistics. 1970. V. 41, N 2. P. 495-502.
10. Shagen I.P. Stochastic Interpolating Functions - Applications in Optimization // J. Inst. Maths. Applics. 1980. V. 26, N 1. P. 93-101.
11.
Кейперс Л., Нидеррейтер Г. Равномерное распределение последовательностей. М., 1985.12. Niederreiter H. Quasi-Monte Carlo Methods and Pseudo-Random Numbers // Bull. Amer. Math. Soc. 1978. V. 84, N 6. P. 957-1041.
13.
Соболь И.М., Статников Р.Б. Выбор оптимальных параметров в задачах со многими критериями. М., 1981.14. Halton J.H. On the Efficiency of Certain Quasy-Random Sequences in Evaluating Multi-Dimensional Integrals // Numer. Math. 1960. V. 2, N 2. P 84-90.
15.
Уилкинсон, Райнш. Справочник алгоритмов на языке АЛГОЛ: Линейная алгебра. М., 1976.16.
Поляк Б.Т. Введение в оптимизацию. М., 1983.17.
Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. М., 1985.18.
Дэннис Дж.(мл.), Шнабель Р. Численные методы безусловной оптимизации и решения нелинейных уравнений. М., 1988.19. Dushon J. Sur l'erreur d'interpolation des fonctions de plusieurs variables par les
-splines // R.A.I.R.O. Analyse numerique. 1978. V. 12, N 4. P. 325-334.
20.
Ашкеназы В.О. Сплайн--поверхности и аппроксимационный поиск экстремума // Ученые записки. Тверь, 1996. Т. 1. С. 36-37.Поступила в редколлегию 15.12.98.