Квадратната форма на матрицата. Положително определени квадратни форми

Концепцията за квадратна форма. Матрица с квадратна форма. Канонична форма на квадратна форма. Метод на Лагранж. Нормалната форма на квадратна форма. Ранг, индекс и сигнатура на квадратна форма. Положително определена квадратна форма. Квадрика.

Концепцията за квадратна форма:функция във векторно пространство, зададена от хомогенен полином от втора степен в координатите на вектора.

квадратна форма от ннеизвестен се нарича сбор, всеки член от който е или квадрат на едно от тези неизвестни, или продукт на две различни неизвестни.

Квадратна матрица:Матрицата се нарича матрица на квадратна форма в дадена основа. Ако характеристиката на полето не е равна на 2, можем да приемем, че матрицата на квадратната форма е симетрична, т.е.

Напишете матрица с квадратна форма:

Следователно,

Във векторно-матрична форма квадратичната форма е:

А, къде

Канонична форма на квадратна форма:Квадратната форма се нарича канонична, ако всички т.е.

Всяка квадратна форма може да бъде намалена до канонична форма с помощта на линейни трансформации. На практика обикновено се използват следните методи.

Метод на Лагранж : последователен избор на пълни квадратчета. Например ако

След това се прави подобна процедура с квадратната форма и т.н. Ако в квадратна форма всичко освен е след това, след предварителна трансформация, въпросът се свежда до разглежданата процедура. Така, ако, например, тогава ние задаваме

Нормалната форма на квадратна форма е:Нормалната квадратна форма е канонична квадратна форма, в която всички коефициенти са равни на +1 или -1.

Ранг, индекс и сигнатура на квадратна форма:Рангът на квадратната форма НОнаречен ранг на матрицата НО. Рангът на квадратична форма не се променя при неизродени трансформации на неизвестните.

Броят на отрицателните коефициенти се нарича отрицателен индекс на формата.

Броят на положителните членове в каноничната форма се нарича положителен индекс на инерция на квадратичната форма, броят на отрицателните членове се нарича отрицателен индекс. Разликата между положителните и отрицателните индекси се нарича сигнатура на квадратичната форма

Положително определена квадратна форма:Реална квадратна форма се нарича положително-определен (отрицателно-определен), ако за всякакви реални стойности на променливите, които не са едновременно равни на нула

. (36)

В този случай матрицата се нарича още положително определена (отрицателна определена).

Класът на положително-определените (отрицателно-определените) форми е част от класа на неотрицателните (съответно неположителните) форми.


Четворки:Квадрик - н-дименсионална хиперповърхност в н+1-мерно пространство, дефинирано като набор от нули на полином от втора степен. Ако въведете координатите ( х 1 , х 2 , x n+1 ) (в евклидово или афинно пространство), общо уравнениеквадрика има формата

Това уравнение може да бъде пренаписано по-компактно в матрична нотация:

където x = ( х 1 , х 2 , x n+1 ) е ред вектор, х T е транспонираният вектор, Qе матрицата на размера ( н+1)×( н+1) (приема се, че поне един от елементите му е различен от нула), Пе ред вектор и Ре константа. Най-често квадриките се разглеждат над реални или комплексни числа. Дефиницията може да бъде разширена до квадрики в проективно пространство, вижте по-долу.

По-общо, наборът от нули на система от полиномиални уравнения е известен като алгебрично разнообразие. Така квадриката е (афинно или проективно) алгебрично многообразие от втора степен и коразмерност 1.

Равнинни и пространствени трансформации.

Дефиниция на равнинна трансформация. Определение за движение. свойства на движение. Два вида движения: движение от първи вид и движение от втори вид. Примери за движение. Аналитично изразяване на движението. Класификация на равнинните движения (в зависимост от наличието на неподвижни точки и инвариантни прави). Група равнинни движения.

Определение за трансформация на равнина: Определение.Равнинна трансформация, която запазва разстоянието между точките, се нарича движение(или преместване) на равнината. Равнинната трансформация се нарича афинен, ако взема всякакви три точки, лежащи на една и съща права, до три точки, също лежащи на същата права, и в същото време запазва простата връзка на трите точки.

Определение на движението:Това е трансформация на формата, която запазва разстоянията между точките. Ако две фигури са точно съчетани една с друга чрез движение, тогава тези фигури са еднакви, равни.

Свойства на движението:всяко движение на равнина, запазващо ориентацията, е или паралелно преместване, или ротация; всяко движение на равнина, променящо ориентацията, е или аксиална симетрия, или плъзгаща симетрия. Точките, лежащи на права линия, при движение преминават в точки, лежащи на права линия, като редът на тяхното взаимно разположение се запазва. При преместване ъглите между полуправите се запазват.

Два вида движения: движение от първи вид и движение от втори вид:Движения от първи вид са тези движения, които запазват ориентацията на основите на определена фигура. Те могат да се реализират с непрекъснати движения.

Движенията от втория вид са тези движения, които променят ориентацията на основите към противоположната. Те не могат да се реализират чрез непрекъснати движения.

Примери за движения от първи вид са транслация и въртене около права линия, а движения от втори вид са централна и огледална симетрия.

Съставът на произволен брой движения от първи вид е движение от първи вид.

Съставът на четен брой движения от втори род е движение от 1-ви род, а съставът на нечетен брой движения от 2-ри род е движение от 2-ри род.

Примери за движение:Паралелен трансфер. Нека a е даден вектор. Паралелно пренасяне към вектора a е преобразуването на равнината върху себе си, при което всяка точка M се преобразува в точката M 1, че векторът MM 1 е равен на вектора a.

Паралелният превод е движение, защото е картографиране на равнината върху себе си, като се запазват разстоянията. Визуално това движение може да се представи като изместване на цялата равнина по посока на даден вектор a по дължината му.

Завъртете .Нека обозначим точка O на равнината ( център за обръщане) и задайте ъгъла α ( ъгъл на завъртане). Завъртането на равнината около точка O с ъгъл α е преобразуване на равнината върху себе си, при което всяка точка M се преобразува в точка M 1, че OM = OM 1 и ъгълът MOM 1 е равен на α. В този случай точката O остава на мястото си, т.е. показва се сама по себе си, а всички останали точки се въртят около точката O в същата посока - по посока на часовниковата стрелка или обратно на часовниковата стрелка (фигурата показва въртене обратно на часовниковата стрелка).

Завоят е движение, защото е картографиране на равнината върху себе си, което запазва разстоянията.

Аналитичен израз на движението:аналитичната връзка между координатите на предобраза и образа на точката има вида (1).

Класификация на равнинни движения (в зависимост от наличието на фиксирани точки и инвариантни линии): Определение:

Точка в равнина е инвариантна (фиксирана), ако при дадено преобразуване се трансформира в себе си.

Пример: Кога централна симетрияточката на центъра на симетрия е инвариантна. При завъртане точката на центъра на въртене е инвариантна. При аксиалната симетрия правата е инвариантна - оста на симетрия е линията на инвариантните точки.

Теорема: Ако движението няма инвариантна точка, то има поне една инвариантна посока.

Пример: Паралелен трансфер. Наистина, правите, успоредни на тази посока, са инвариантни като фигура като цяло, въпреки че не се състои от инвариантни точки.

Теорема: Ако някакъв лъч се движи, лъчът се преобразува в себе си, тогава това движение е или идентична трансформация, или симетрия по отношение на правата, съдържаща дадения лъч.

Следователно според наличието на инвариантни точки или фигури е възможно да се класифицират движенията.

Име на движението Инвариантни точки Инвариантни линии
Движение от първи вид.
1. - завой (център) - 0 Не
2. Трансформация на идентичността всички точки на равнината всичко направо
3. Централна симетрия точка 0 - център всички прави, минаващи през точка 0
4. Паралелен трансфер Не всичко направо
Движение от втори вид.
5. Аксиална симетрия. набор от точки ос на симетрия (права) всички прави

Група за движение на самолета:В геометрията самосъвпадащите групи от фигури играят важна роля. Ако - някаква фигура в равнината (или в пространството), тогава можем да разгледаме набора от всички онези движения на равнината (или пространството), при които фигурата преминава в себе си.

Този набор е група. Например, за равностранен триъгълник, групата от равнинни движения, които трансформират триъгълника в себе си, се състои от 6 елемента: завъртания на ъгли около точка и симетрии около три прави.

Те са показани на фиг. 1 с червени линии. Елементите от групата на самосъвпадение на правилен триъгълник могат да бъдат зададени и по друг начин. За да изясним това, нека номерираме върховете на правилен триъгълник с числата 1, 2, 3. може условно да се въведе под формата на една от тези скоби:

и т.н.

където числата 1, 2, 3 означават номерата на онези върхове, в които върховете 1, 2, 3 преминават в резултат на разглежданото движение.

Проективни пространства и техните модели.

Понятие за проективно пространство и модел на проективно пространство. Основни факти от проективната геометрия. Куп линии с център в точка O е проективен модел на равнина. проективни точки. Разширената равнина е модел на проективната равнина. Разширено триизмерно афинно или евклидово пространство е проективен пространствен модел. Изображения на равнинни и пространствени фигури в паралелен дизайн.

Концепция за проективно пространство и модел на проективно пространство:

Проективно пространство над поле е пространство, състоящо се от линии (едномерни подпространства) на някакво линейно пространство над дадено поле. Правите пространства се наричат точкипроективно пространство. Това определение се поддава на обобщение за произволно тяло

Ако има размерност , тогава размерността на проективното пространство се нарича число , а самото проективно пространство се обозначава и се нарича свързано с (за да се посочи това, нотацията се приема).

Преходът от векторно пространство на размерност към съответното проективно пространство се нарича проективизацияпространства.

Точките могат да бъдат описани с хомогенни координати.

Основни факти от проективната геометрия:Проективната геометрия е клон на геометрията, който изучава проективни равнини и пространства. основна характеристикапроективната геометрия се основава на принципа на дуалността, който добавя изящна симетрия към много дизайни. Проективната геометрия може да се изучава както от чисто геометрична гледна точка, така и от аналитична (използваща хомогенни координати) и алгебрична гледна точка, разглеждайки проективната равнина като структура над поле. Често и в исторически план истинската проективна равнина се третира като евклидова равнина с добавяне на "права в безкрайност".

Докато свойствата на фигурите, с които работи евклидовата геометрия, са показател(специфични стойности на ъгли, сегменти, области), а еквивалентността на фигурите е еквивалентна на техните конгруентност(т.е. когато фигурите могат да се превеждат една в друга чрез движение, като същевременно се запазват метричните свойства), има повече "по-дълбоко разположени" свойства геометрични форми, които се запазват при трансформации на повече от общ типотколкото движение. Проективната геометрия изучава свойствата на фигурите, които са инвариантни спрямо класа проективни трансформации, както и самите тези трансформации.

Проективната геометрия допълва Евклидовата, като предоставя красиви и прости решенияза много задачи, усложнени от наличието на успоредни прави. Проективната теория на коничните сечения е особено проста и елегантна.

Има три основни подхода към проективната геометрия: независима аксиоматизация, добавяне към евклидовата геометрия и структура върху поле.

Аксиоматизиране

Проективното пространство може да бъде дефинирано с помощта на различен набор от аксиоми.

Coxeter предоставя следното:

1. Има права и на нея няма точка.

2. На всеки ред има поне три точки.

3. През две точки може да се прекара точно една права.

4. Ако А, б, ° С, и дразлични точки и ABи CDпресичат се, тогава ACи BDпресичат се.

5. Ако ABCе равнина, тогава има поне една точка извън равнината ABC.

6. Две различни самолетипресичат поне две точки.

7. Три диагонални точки на пълен четириъгълник не са колинеарни.

8. Ако на една права има три точки х х

Проективната равнина (без третото измерение) се определя от малко по-различни аксиоми:

1. През две точки може да се прекара точно една права.

2. Всякакви две прави се пресичат.

3. Има четири точки, от които няма три колинеарни.

4. Три диагонални точки на пълни четириъгълници не са колинеарни.

5. Ако на една права линия има три точки хса инвариантни спрямо проективността на φ, тогава всички точки от хса инвариантни по отношение на φ.

6. Теорема на Дезарг: Ако два триъгълника имат перспектива през точка, то те имат перспектива и през права.

При наличието на трето измерение теоремата на Дезарг може да бъде доказана без въвеждане на идеалната точка и права.

Разширена равнина - модел на проективна равнина:в афинно пространство A3 вземете сноп от прави S(O) с център в точка O и равнина Π, която не минава през центъра на снопа: O 6∈ Π. Сноп от прави в афинно пространство е модел на проективната равнина. Нека зададем преобразуването на множеството от точки на равнината Π към множеството от прави на снопа S (По дяволите, моля те, ако получиш този въпрос, съжалявам)

Разширено триизмерно афинно или евклидово пространство - модел на проективно пространство:

За да направим картографирането сюръективно, ние повтаряме процеса на формално разширяване на афинната равнина Π до проективната равнина, Π, допълвайки равнината Π с набор от неправилни точки (M∞), така че: ((M∞)) = P0(O). Тъй като в преобразуването обратният образ на всяка равнина от снопа от равнини S(O) е права в равнината d, очевидно е, че множеството от всички неправилни точки на разширената равнина: Π = Π ∩ (M∞) , (M∞), е неправилна права d∞ на разширената равнина, която е обратен образ на сингулярната равнина Π0: (d∞) = P0(O) (= Π0). (I.23) Нека се съгласим, че тук и по-нататък ще разбираме последното равенство P0(O) = Π0 в смисъл на равенство на множества от точки, но снабдени с различни структури. Допълвайки афинната равнина с неправилна права, ние гарантираме, че картографирането (I.21) става биективно върху множеството от всички точки на разширената равнина:

Изображения на плоски и пространствени фигури в паралелен дизайн:

В стереометрията се изучават пространствените фигури, но на чертежа те се изобразяват като плоски фигури. Как тогава трябва да се изобрази една пространствена фигура на равнина? Обикновено в геометрията за това се използва паралелен дизайн. Нека p е някаква равнина, л- пресичаща го права линия (фиг. 1). През произволна точка А, непринадлежащи на линията лначертайте линия, успоредна на линията л. Пресечната точка на тази права с равнината p се нарича успоредна проекция на точката Акъм равнината p по посока на правата л. Нека го обозначим А". Ако точката Апринадлежи на линията л, след това паралелната проекция Акъм равнината p се счита пресечната точка на правата лс равнина p.

Така всяка точка Апространството се картографира към неговата проекция А" върху равнината p. Това съответствие се нарича успоредна проекция върху равнината p по посока на правата л.

Група проективни трансформации. Приложение за решаване на проблеми.

Концепцията за проективна трансформация на равнината. Примери за проективни равнинни трансформации. Свойства на проективните трансформации. Хомология, свойства на хомологията. Група проективни трансформации.

Концепцията за проективна равнинна трансформация:Понятието проективна трансформация обобщава понятието централна проекция. Ако извършим централната проекция на равнината α върху някаква равнина α 1 , тогава проекцията на α 1 върху α 2 , α 2 върху α 3 , ... и накрая, някаква равнина α нотново върху α 1 , тогава съставът на всички тези проекции е проективната трансформация на равнината α; такава верига може да включва паралелни проекции.

Примери за проективни равнинни трансформации:Проективна трансформация на разширена равнина е нейното едно-към-едно преобразуване върху себе си, което запазва колинеарността на точките, или, с други думи, образът на всяка права линия е права линия. Всяка проективна трансформация е композиция от верига от централни и паралелни проекции. Афинната трансформация е специален случайпроективна, при която правата в безкрайност преминава в себе си.

Свойства на проективните трансформации:

При проективна трансформация три точки, които не са на права, се преобразуват в три точки, които не са на права.

При проективна трансформация рамката преминава към рамката.

При проективна трансформация права преминава в права линия, сноп преминава в сноп.

Хомология, хомологични свойства:

Проективна трансформация на равнина, която има права от инвариантни точки и следователно молив от инвариантни прави, се нарича хомология.

1. Права, минаваща през съответни несъвпадащи точки на хомология, е инвариантна права;

2. Правите, минаващи през съответните несъвпадащи точки на хомология, принадлежат на един и същи молив, чийто център е инвариантна точка.

3. Точка, нейният образ и центърът на хомоложността лежат на една права линия.

Група проективни трансформации:разгледайте проективно преобразуване на проективната равнина P 2 върху себе си, т.е. проективна трансформация на тази равнина (P 2 ’ = P 2).

Както и преди, композицията f от проективни трансформации f 1 и f 2 на проективната равнина P 2 е резултат от последователно изпълнение на трансформации f 1 и f 2: f = f 2 °f 1 .

Теорема 1: Множеството H от всички проективни трансформации на проективната равнина P 2 е група под състава на проективни трансформации.

Квадратни форми

квадратна форма f(x 1, x 2,..., x n) от n променливи се нарича сбор, всеки член от който е или квадрат на една от променливите, или продукт на две различни променливи, взети с определен коефициент: f(x 1, x 2, ...,x n) = (a ij = a ji).

Матрицата A, съставена от тези коефициенти, се нарича матрица на квадратна форма. Винаги е така симетриченматрица (т.е. матрица, симетрична спрямо главния диагонал, a ij = a ji).

В матричната нотация квадратичната форма има формата f(X) = X T AX, където

Наистина

Например, нека запишем квадратната форма в матрична форма.

За да направим това, намираме матрица от квадратна форма. Неговите диагонални елементи са равни на коефициентите при квадратите на променливите, а останалите елементи са равни на половината от съответните коефициенти на квадратната форма. Ето защо

Нека колоната на матрицата от променливи X се получава чрез неизродена линейна трансформация на колоната на матрицата Y, т.е. X = CY, където C е неизродена матрица от ред n. След това квадратната форма
f(X) \u003d X T AX \u003d (CY) T A (CY) \u003d (Y T C T) A (CY) \u003d Y T (CT AC) Y.

По този начин, при недегенерирана линейна трансформация C, матрицата на квадратната форма приема формата: A * = C T AC.

Например, нека намерим квадратичната форма f(y 1, y 2), получена от квадратната форма f(x 1, x 2) = 2x 1 2 + 4x 1 x 2 - 3x 2 2 чрез линейна трансформация.

Квадратната форма се нарича каноничен(То има каноничен изглед), ако всички негови коефициенти a ij = 0 за i ≠ j, т.е.
f(x 1, x 2,...,x n) = a 11 x 1 2 + a 22 x 2 2 + ... + a nn x n 2 = .

Матрицата му е диагонална.

Теорема(доказателството не е дадено тук). Всяка квадратична форма може да бъде редуцирана до канонична форма с помощта на неизродена линейна трансформация.

Например, нека редуцираме до канонична форма квадратичната форма
f (x 1, x 2, x 3) \u003d 2x 1 2 + 4x 1 x 2 - 3x 2 2 - x 2 x 3.

За да направите това, първо изберете пълния квадрат за променливата x 1:

f (x 1, x 2, x 3) \u003d 2 (x 1 2 + 2x 1 x 2 + x 2 2) - 2x 2 2 - 3x 2 2 - x 2 x 3 \u003d 2 (x 1 + x 2) ) 2 - 5x 2 2 - x 2 x 3.

Сега избираме пълния квадрат за променливата x 2:

f (x 1, x 2, x 3) \u003d 2 (x 1 + x 2) 2 - 5 (x 2 2 - 2 * x 2 * (1/10) x 3 + (1/100) x 3 2 ) - (5/100) x 3 2 =
\u003d 2 (x 1 + x 2) 2 - 5 (x 2 - (1/10) x 3) 2 - (1/20) x 3 2.

Тогава неизродена линейна трансформация y 1 = x 1 + x 2, y 2 = x 2 - (1/10) x 3 и y 3 = x 3 довежда тази квадратна форма до каноничната форма f (y 1 , y 2, y 3) = 2y 1 2 - 5y 2 2 - (1/20)y 3 2 .

Обърнете внимание, че каноничната форма на квадратна форма е дефинирана двусмислено (същата квадратна форма може да бъде намалена до каноничната форма различни начини). както и да е различни начиниканоничните форми имат редица общи имоти. По-специално, броят на членовете с положителни (отрицателни) коефициенти на квадратична форма не зависи от това как формата се редуцира до тази форма (например в разглеждания пример винаги ще има два отрицателни и един положителен коефициент). Това свойство се нарича законът за инерцията на квадратичните форми.

Нека проверим това, като намалим същата квадратна форма до каноничната форма по различен начин. Нека започнем трансформацията с променливата x 2:
f (x 1, x 2, x 3) \u003d 2x 1 2 + 4x 1 x 2 - 3x 2 2 - x 2 x 3 \u003d -3x 2 2 - x 2 x 3 + 4x 1 x 2 + 2x 1 2 \u003d - 3(x 2 2 -
- 2 * x 2 ((1/6) x 3 + (2/3) x 1) + ((1/6) x 3 + (2/3) x 1) 2) - 3 ((1/6) x 3 + (2/3) x 1) 2 + 2x 1 2 =
\u003d -3 (x 2 - (1/6) x 3 - (2/3) x 1) 2 - 3 ((1/6) x 3 + (2/3) x 1) 2 + 2x 1 2 \ u003d f (y 1, y 2, y 3) = -3y 1 2 -
-3y 2 2 + 2y 3 2, където y 1 \u003d - (2/3) x 1 + x 2 - (1/6) x 3, y 2 \u003d (2/3) x 1 + (1/6) ) x 3 и y 3 = x 1 . Тук положителен коефициент 2 при y 3 и два отрицателни коефициента (-3) при y 1 и y 2 (и използвайки друг метод, получихме положителен коефициент 2 при y 1 и два отрицателни коефициента - (-5) при y 2 и (-1/20) за y 3).

Трябва също да се отбележи, че рангът на матрица от квадратна форма, т.нар рангът на квадратичната форма, е равен на броя на ненулевите коефициенти на каноничната форма и не се променя при линейни трансформации.

Квадратната форма f(X) се нарича положително (отрицателен) определени, ако за всички стойности на променливите, които не са едновременно равни на нула, той е положителен, т.е. f(X) > 0 (отрицателно, т.е.
f(X)< 0).

Например, квадратичната форма f 1 (X) \u003d x 1 2 + x 2 2 е положително определена, тъй като е сумата от квадрати, а квадратната форма f 2 (X) \u003d -x 1 2 + 2x 1 x 2 - x 2 2 е отрицателно определена, тъй като представлява може да се представи като f 2 (X) \u003d - (x 1 - x 2) 2.

В повечето практически ситуации е малко по-трудно да се установи знакоопределеността на квадратична форма, така че за това се използва една от следните теореми (ние ги формулираме без доказателства).

Теорема. Квадратната форма е положително (отрицателно) определена тогава и само ако всички собствени стойностинеговите матрици са положителни (отрицателни).

Теорема (критерий на Силвестър). Квадратната форма е положително определена тогава и само тогава, когато всички главни минори на матрицата на тази форма са положителни.

Голям (ъглов) минор K-тият ред на матрицата A от n-ти ред се нарича детерминанта на матрицата, съставена от първите k реда и колони на матрицата A ().

Обърнете внимание, че за отрицателно-определени квадратични форми, знаците на главните минори се редуват и минорът от първи ред трябва да е отрицателен.

Например, ние изследваме квадратичната форма f (x 1, x 2) = 2x 1 2 + 4x 1 x 2 + 3x 2 2 за определеност на знака.

= (2 - l)*
*(3 - l) - 4 \u003d (6 - 2l - 3l + l 2) - 4 \u003d l 2 - 5l + 2 \u003d 0; D \u003d 25 - 8 \u003d 17;
. Следователно квадратната форма е положително определена.

Метод 2. Главният минор от първи ред на матрицата A D 1 = a 11 = 2 > 0. Главният минор от втори ред D 2 = = 6 - 4 = 2 > 0. Следователно, според критерия на Силвестър, квадратната форма е положително определена.

Разглеждаме друга квадратна форма за определеност на знака, f (x 1, x 2) \u003d -2x 1 2 + 4x 1 x 2 - 3x 2 2.

Метод 1. Да построим матрица от квадратна форма А = . Характеристичното уравнение ще има формата = (-2 - l)*
*(-3 - l) - 4 \u003d (6 + 2l + 3l + l 2) - 4 \u003d l 2 + 5l + 2 \u003d 0; D \u003d 25 - 8 \u003d 17;
. Следователно квадратната форма е отрицателно определена.

Сервизно задание. За намиране се използва онлайн калкулатор Хесиански матриции определяне на вида на функцията (изпъкнала или вдлъбната) (виж примера). Решението се прави във формат Word. За функция на една променлива f(x) се определят интервалите на изпъкналост и вдлъбнатост.

f(x 1,x 2,x 3) =

Намерете в точка X 0: x 1 = , x 2 = , x 3 =

Правила за въвеждане на функция:

Два пъти непрекъснато диференцируема функция f(x) е изпъкнала (вдлъбната) тогава и само ако Хесианова матрицафункцията f(x) в x е положително (отрицателно) полуопределена за всички x (виж точките на локални екстремуми на функции на няколко променливи).

Критични точки на функцията:

  • ако хесианът е положително дефиниран, тогава x 0 е локална минимална точка на функцията f(x),
  • ако Хесианът е отрицателно определен, тогава x 0 е локалната максимална точка на функцията f(x),
  • ако хесианът не е знакоопределен (приема както положителни, така и отрицателни стойности) и неизроден (det G(f) ≠ 0), тогава x 0 е седлова точка на функцията f(x).

Критерии за сигурност на матрица (теорема на Силвестър)

положителна категоричност:
  • всички диагонални елементи на матрицата трябва да са положителни;
  • всички водещи главни детерминанти трябва да са положителни.
За положително полуопределени матрици Критерият на Силвестързвучи така: Формата е положително полуопределена тогава и само ако всички главни второстепенни са неотрицателни. Ако матрицата на Хесиан в дадена точка е положително полуопределена (всички главни второстепенни са неотрицателни), тогава това е минимална точка (обаче, ако хесианската матрица е полуопределена и един от второстепенните е 0, тогава това може също да бъде седловина. Необходими са допълнителни проверки).

Положителна полуопределеност:

  • всички диагонални елементи са неотрицателни;
  • всички основни детерминанти са неотрицателни.
Основната детерминанта е основната второстепенна детерминанта.

Квадратна симетрична матрица от ред n, чиито елементи са частни производни на целевата функция от втори ред, наречена матрица на Хесиани се обозначава:

За да бъде една симетрична матрица положително определена, е необходимо и достатъчно всички нейни диагонални минори да са положителни, т.е.


за матрицата A = (a ij) са положителни.

Отрицателна сигурност.
За да бъде една симетрична матрица отрицателно определена, е необходимо и достатъчно да са изпълнени неравенствата:
(-1) k D k > 0, к=1,.., n.
С други думи, за да бъде квадратичната форма отрицателно определено, е необходимо и достатъчно знаците на ъгловите минори на матрицата на квадратната форма да се редуват, като се започне със знака минус. Например, за две променливи, D 1< 0, D 2 > 0.

Ако Хесианът е полуопределен, тогава той може да бъде и инфлексна точка. Необходими са допълнителни изследвания, които могат да се извършат по един от следните варианти:

  1. Понижаване. Извършва се промяна на променливите. Например, за функция на две променливи това е y=x, като резултат получаваме функция на една променлива x. След това се изследва поведението на функцията върху линиите y=x и y=-x. Ако в първия случай функцията в изследваната точка ще има минимум, а в другия случай максимум (или обратното), тогава изследваната точка е седлова точка.
  2. Намиране на собствените стойности на Хесиан. Ако всички стойности са положителни, функцията в изследваната точка има минимум, ако всички са отрицателни, има максимум.
  3. Изследване на функцията f(x) в околност на точката ε. Променливите x се заменят с x 0 +ε. Освен това е необходимо да се докаже, че функцията f(x 0 + ε) на една променлива ε е или по-голяма от нула (тогава x 0 е минималната точка), или по-малко от нула(тогава x 0 е максималната точка).

Забележка. Да намеря обратен хесиандостатъчно е да се намери обратната матрица .

Пример #1. Кои от следните функции са изпъкнали или вдлъбнати: f(x) = 8x 1 2 +4x 1 x 2 +5x 2 2 .
Решение. 1. Да намерим частни производни.


2. Да решим системата от уравнения.
-4x1 +4x2 +2 = 0
4x1 -6x2 +6 = 0
Получаваме:
а) Изразете x 1 от първото уравнение и го заместете във второто уравнение:
x2 = x2 + 1/2
-2x 2 +8 = 0
Където x 2 \u003d 4
Тези x 2 стойности се заместват в израза за x 1 . Получаваме: x 1 \u003d 9 / 2
Броят на критичните точки е 1.
М 1 (9 / 2 ;4)
3. Намерете частните производни от втори ред.



4. Изчислете стойността на тези частни производни от втори ред в критичните точки M(x 0 ;y 0).
Изчислете стойностите за точка M 1 (9 / 2 ;4)



Изграждаме матрицата на Хесиан:

D 1 = a 11< 0, D 2 = 8 > 0
Тъй като диагоналните минори имат различни знаци, нищо не може да се каже за изпъкналостта или вдлъбнатостта на функцията.

положително определено квадратни форми

Определение. Квадратна форма от ннеизвестен се нарича положително определено, ако неговият ранг е равен на положителния индекс на инерция и е равен на броя на неизвестните.

Теорема.Квадратната форма е положително определена тогава и само тогава, когато за всеки различен от нула набор от стойности на променливи тя приема положителни стойности.

Доказателство.Нека квадратичната форма е неизродена линейна трансформация на неизвестните

се върна към нормалното

.

За всеки различен от нула набор от стойности на променливи, поне едно от числата различен от нула, т.е. . Необходимостта от теоремата е доказана.

Да предположим, че квадратичната форма приема положителни стойности за всеки ненулев набор от променливи, но нейният индекс на инерция е положителен Чрез неизродена линейна трансформация на неизвестните

Нека го върнем към нормалното. Без загуба на общност можем да приемем, че в тази нормална форма квадратът на последната променлива или отсъства, или влиза в нея със знак минус, т.е. , където или . Да предположим, че това е ненулев набор от стойности на променливи, получени в резултат на решаване на системата линейни уравнения

В тази система броят на уравненията е равен на броя на променливите и детерминантата на системата е различна от нула. По теоремата на Крамър системата има уникално решение и то е различно от нула. За този комплект. Противоречие с условието. Стигаме до противоречие с предположението, което доказва достатъчността на теоремата.

Използвайки този критерий, не е възможно да се определи от коефициентите дали дадена квадратна форма е положително определена. Отговорът на този въпрос се дава от друга теорема, за формулирането на която въвеждаме още едно понятие. Главни диагонални матрици второстепенниса непълнолетните, разположени в горния му ляв ъгъл:

, , , … , .

Теорема.Квадратната форма е положително определена тогава и само тогава, когато всички нейни главни диагонални минори са положителни.

Доказателствоние ще проведем метода на пълен математическа индукцияпо номер нпроменливи на квадратна форма f.

Хипотеза за индукция.Да приемем, че за квадратни форми с по-малко променливи нтвърдението е правилно.

Разгледайте квадратичната форма от нпроменливи. Съберете в една скоба всички термини, съдържащи . Останалите членове образуват квадратна форма в променливи. По индукционната хипотеза твърдението е вярно за него.

Да приемем, че квадратната форма е положително определена. Тогава квадратната форма също е положително определена. Ако приемем, че това не е така, тогава има ненулев набор от стойности на променливи , за което и съответно, , което противоречи на факта, че квадратната форма е положително определена. По индукционната хипотеза всички главни диагонални минори на квадратична форма са положителни, т.е. всички първи главни минори на квадратична форма fса положителни. Последен главен минор на квадратична форма е детерминантата на неговата матрица. Този детерминант е положителен, тъй като знакът му съвпада със знака на матрицата на нормалната му форма, т.е. със знака на детерминанта на матрицата на идентичността.

Нека всички главни диагонални минори на квадратната форма са положителни.Тогава всички главни диагонални минори на квадратната форма са положителни от равенството . Според хипотезата на индукция, квадратичната форма е положително определена, така че има неизродена линейна трансформация на променливи, която редуцира формата до формата на сумата от квадратите на нови променливи. Тази линейна трансформация може да бъде разширена до неизродена линейна трансформация на всички променливи чрез задаване на . Квадратната форма се редуцира чрез тази трансформация до формата

квадратна форма f(x 1, x 2,..., x n) от n променливи се нарича сбор, всеки член от който е или квадрат на една от променливите, или продукт на две различни променливи, взети с определен коефициент: f(x 1, x 2, ...,х n) = (a ij =a ji).

Матрицата A, съставена от тези коефициенти, се нарича матрица на квадратна форма. Винаги е така симетриченматрица (т.е. матрица, симетрична по отношение на главния диагонал, a ij = a ji).

В матричната нотация квадратичната форма има формата f(X) = X T AX, където

Наистина

Например, нека запишем квадратната форма в матрична форма.

За да направим това, намираме матрица от квадратна форма. Неговите диагонални елементи са равни на коефициентите при квадратите на променливите, а останалите елементи са равни на половината от съответните коефициенти на квадратната форма. Ето защо

Нека колоната на матрицата от променливи X се получава чрез неизродена линейна трансформация на колоната на матрицата Y, т.е. X = CY, където C е неизродена матрица от ред n. Тогава квадратичната форма f(X) = X T AX = (CY) T A(CY) = (Y T C T)A(CY) =Y T (C T AC)Y.

По този начин, с недегенерирана линейна трансформация C, матрицата на квадратната форма приема формата: A * =C T AC.

Например, нека намерим квадратичната форма f(y 1, y 2), получена от квадратната форма f(x 1, x 2) = 2x 1 2 + 4x 1 x 2 - 3x 2 2 чрез линейна трансформация.

Квадратната форма се нарича каноничен(То има каноничен изглед), ако всички негови коефициенти a ij \u003d 0 при i≠j, т.е. f (x 1, x 2,..., x n) \u003d a 11 x 1 2 + a 22 x 2 2 + ... + a nn x n 2 = .

Матрицата му е диагонална.

Теорема(доказателството не е дадено тук). Всяка квадратична форма може да бъде редуцирана до канонична форма с помощта на неизродена линейна трансформация.

Например, нека приведем в каноничната форма квадратичната форма f (x 1, x 2, x 3) = 2x 1 2 + 4x 1 x 2 - 3x 2 2 - x 2 x 3.

За да направите това, първо изберете пълния квадрат за променливата x 1:

f (x 1, x 2, x 3) \u003d 2 (x 1 2 + 2x 1 x 2 + x 2 2) - 2x 2 2 - 3x 2 2 - x 2 x 3 \u003d 2 (x 1 + x 2) ) 2 - 5x 2 2 - x 2 x 3.

Сега избираме пълния квадрат за променливата x 2:

f (x 1, x 2, x 3) \u003d 2 (x 1 + x 2) 2 - 5 (x 2 2 - 2 * x 2 * (1/10) x 3 + (1/100) x 3 2 ) - (5/100) x 3 2 \u003d \u003d 2 (x 1 + x 2) 2 - 5 (x 2 - (1/10) x 3) 2 - (1/20) x 3 2.

Тогава неизродената линейна трансформация y 1 \u003d x 1 + x 2, y 2 \u003d x 2 - (1/10) x 3 и y 3 \u003d x 3 довежда тази квадратна форма до каноничната форма f (y 1 , y 2, y 3) \u003d 2y 1 2 - 5y 2 2 - (1/20)y 3 2 .

Обърнете внимание, че каноничната форма на квадратна форма е дефинирана двусмислено (една и съща квадратна форма може да бъде редуцирана до канонична форма по различни начини1). Въпреки това, каноничните форми, получени по различни методи, имат редица общи свойства. По-специално, броят на членовете с положителни (отрицателни) коефициенти на квадратична форма не зависи от това как формата се редуцира до тази форма (например в разглеждания пример винаги ще има два отрицателни и един положителен коефициент). Това свойство се нарича законът за инерцията на квадратичните форми.

Нека проверим това, като намалим същата квадратна форма до каноничната форма по различен начин. Нека започнем трансформацията с променливата x 2: f (x 1, x 2, x 3) \u003d 2x 1 2 + 4x 1 x 2 - 3x 2 2 - x 2 x 3 \u003d -3x 2 2 - x 2 x 3 + 4x 1 x 2 + 2x 1 2 \u003d -3 (x 2 2 - - 2 * x 2 ((1/6) x 3 + (2/3) x 1) + ((1/6) x 3 + (2/3) x 1) 2) - 3 ((1/6) x 3 + (2/3) x 1) 2 + 2x 1 2 = = -3 (x 2 - (1/6) x 3 - (2/3) x 1) 2 - 3 ((1/6) x 3 + (2/3) x 1) 2 + 2x 1 2 \u003d f (y 1, y 2, y 3) \u003d - 3y 1 2 - -3y 2 2 + 2y 3 2, където y 1 = - (2/3) x 1 + x 2 - (1/6) x 3, y 2 = (2/3) x 1 + (1 /6) x 3 и y 3 = x 1 . Тук положителен коефициент 2 при y 3 и два отрицателни коефициента (-3) при y 1 и y 2).

Трябва също да се отбележи, че рангът на матрица от квадратна форма, т.нар рангът на квадратичната форма, е равен на броя на ненулевите коефициенти на каноничната форма и не се променя при линейни трансформации.

Квадратната форма f(X) се нарича положително(отрицателен)определени, ако за всички стойности на променливи, които не са едновременно равни на нула, той е положителен, т.е. f(X) > 0 (отрицателен, т.е. f(X)< 0).

Например, квадратичната форма f 1 (X) \u003d x 1 2 + x 2 2 е положително определена, тъй като е сумата от квадрати, а квадратната форма f 2 (X) \u003d -x 1 2 + 2x 1 x 2 - x 2 2 е отрицателно определена, тъй като представлява може да се представи като f 2 (X) \u003d - (x 1 - x 2) 2.

В повечето практически ситуации е малко по-трудно да се установи знакоопределеността на квадратична форма, така че за това се използва една от следните теореми (ние ги формулираме без доказателства).

Теорема. Квадратната форма е положителна (отрицателна) определена тогава и само ако всички собствени стойности на нейната матрица са положителни (отрицателни).

Теорема (критерий на Силвестър). Квадратната форма е положително определена тогава и само тогава, когато всички главни минори на матрицата на тази форма са положителни.

Голям (ъглов) минор K-тият ред на матрицата An-ти ред се нарича детерминанта на матрицата, съставена от първите k реда и колони на матрицата A ().

Обърнете внимание, че за отрицателно-определени квадратични форми, знаците на главните минори се редуват и минорът от първи ред трябва да е отрицателен.

Например, ние изследваме квадратичната форма f (x 1, x 2) = 2x 1 2 + 4x 1 x 2 + 3x 2 2 за определеност на знака.

= (2 -)* *(3 -) - 4 = (6 - 2- 3+ 2) - 4 = 2 - 5+ 2 = 0; D= 25 - 8 = 17; . Следователно квадратната форма е положително определена.

Метод 2. Главният минор от първи ред на матрицата A  1 = a 11 = 2 > 0. Главният минор от втори ред  2 = = 6 - 4 = 2 > 0. Следователно, според критерия на Силвестър , квадратната форма е положително определена.

Разглеждаме друга квадратна форма за определеност на знака, f (x 1, x 2) \u003d -2x 1 2 + 4x 1 x 2 - 3x 2 2.

Метод 1. Да построим матрица от квадратна форма А = . Характеристичното уравнение ще има формата = (-2 -)* *(-3 -) – 4 = (6 + 2+ 3+ 2) – 4 = 2 + 5+ 2 = 0; D= 25 – 8 = 17 ; . Следователно квадратната форма е отрицателно определена.

Метод 2. Основният минор от първи ред на матрицата A  1 \u003d a 11 \u003d \u003d -2< 0. Главный минор второго порядка 2 = = 6 – 4 = 2 >0. Следователно, според критерия на Силвестър, квадратичната форма е отрицателно определена (знаците на главните минори се редуват, като се започне от минус).

И като друг пример, ние изследваме квадратичната форма f (x 1, x 2) \u003d 2x 1 2 + 4x 1 x 2 - 3x 2 2 за определеност на знака.

Метод 1. Да построим матрица от квадратна форма А = . Характеристичното уравнение ще има формата = (2 -)* *(-3 -) - 4 = (-6 - 2+ 3+ 2) - 4 = 2 +- 10 = 0; D= 1 + 40 = 41; . Едно от тези числа е отрицателно, а другото е положително. Знаците на собствените стойности са различни. Следователно квадратичната форма не може да бъде нито отрицателно, нито положително определена, т.е. тази квадратична форма не е знакоопределена (може да приема стойности на всеки знак).

Метод 2. Главният минор от първи ред на матрицата A  1 = a 11 = 2 > 0. Главният минор от втори ред  2 = = -6 - 4 = -10< 0. Следовательно, по критерию Сильвестра квадратичная форма не является знакоопределенной (знаки главных миноров разные, при этом первый из них – положителен).

1Разглежданият метод за редуциране на квадратичната форма до каноничната форма е удобен за използване, когато под квадратите на променливите се срещат ненулеви коефициенти. Ако те не са там, все още е възможно да се извърши преобразуването, но трябва да използвате някои други трикове. Например, нека f(x 1, x 2) = 2x 1 x 2 = x 1 2 + 2x 1 x 2 + x 2 2 - x 1 2 - x 2 2 =

\u003d (x 1 + x 2) 2 - x 1 2 - x 2 2 \u003d (x 1 + x 2) 2 - (x 1 2 - 2x 1 x 2 + x 2 2) - 2x 1 x 2 \u003d (x 1 + x 2) 2 - - (x 1 - x 2) 2 - 2x 1 x 2; 4x 1 x 2 \u003d (x 1 + x 2) 2 - (x 1 - x 2) 2; f (x 1, x 2) \u003d 2x 1 x 2 \u003d (1/2) * * (x 1) + x 2 ) 2 - (1/2) * (x 1 - x 2) 2 \u003d f (y 1, y 2) \u003d (1/2) y 1 2 - (1/2) y 2 2, където y 1 \u003d x 1 + x 2, ay 2 \u003d x 1 - x 2.