KONVEKSNA ANALIZA 1 Sadrˇ zaj Konveksni skupovi Definicija, primjeri, Konveksni omota´c,Topoloˇska svojstva, Projekcija, Ekstremalne tacke, Teoreme razdvajanja, teoreme alternative, Polarni skupovi, Poliedri Konveksne funkcije Zadaci Konveksne funkcije i ekstremi Zadaci Rjeˇsenja Literatura Spisak pojmova 2 Uvod Konveksna analiza se krajem 60 i poˇcetkom 70 ih... Neka je f realna funkcija sa domenom D(f ) ⊆ Rn , i neka je S ⊆ D(f ) neprazan skup. Opˇsti (apstraktan) problem matematiˇckog programiranja sastoji se u odred¯ivanju vrijednosti π = inf f (x) x∈S i skupa S ∗ = {x ∈ S : f (x) = π}. Problem oznaˇcamo sa (P A) : min{ f (x) : x ∈ S}. Ako je funkcija f konveksna, a tzv. dopustivi skup S konveksan skup, onda se dobija problem konveksnog programiranja (konveksne optimizacije). Tada se dopustivi skup najˇceˇs´ce zadaje pomo´cu konveksnih funkcija g1 , ..., gm definisanih na konveksnom skupu C ⊆ Rn : G = {x ∈ C : g1 (x) 6 0, ..., gm (x) 6 0}. Taˇcka x∗ ∈ S je rjeˇsenje problema (PA) ako vrijedi f (x) > f (x∗ ) ∀x ∈ S. ˇ U suˇstini, x∗ je taˇcka globalnog minimuma funkcije f na skupu S. Cesto je lakˇse, a nekad i jedino mogu´ce na´ci taˇcku minimuma date funkcije na nekom podskupu skupa S. Zato kaˇzemo da je x∗ lokalno rjeˇsenje datog problema, ako je to taˇcka lokalnog minimuma funkcije f na skupu S, tj. ako postoji okolina O taˇcke x∗ takva da vrijedi f (x) > f (x∗ ) ∀x ∈ S ∩ O. 3 x1 Rn ... x = ... , y > = (y1 , ..., yn ), hx, yi := x> y xn kxk := p hx, xi = à n X ! 12 x2i i=1 kx + yk 6 kxk + kyk | kxk − kyk | 6 kx − yk |hx, yi| 6 kxk kyk 2 kx − yk + kx + yk2 = 2(kxk2 + kyk2 ) (1) B(x0 , r) = {x ∈ Rn : kx0 − xk < r}, B[x0 , r] = {x ∈ Rn : kx0 − xk 6 r} d(x0 , S) = inf kx0 − xk x∈S S + T = {x + y : x ∈ S, y ∈ T }...αS = {αx : x ∈ S} Primjer 1 B[x1 , r1 ] + B[x2 , r2 ] = B[x1 + x2 , r1 + r2 ] Zbog ... moˇzemo uzeti x1 = x2 = 0. Inkluzija B[0, r1 ] + B[0, r2 ] ⊆ B[0, r1 + r2 ] vrijedi na osnovu nejednakosti trougla. Neka je sada x ∈ B[0, r1 + r2 ], pri ˇcemu je r1 6 r2 . Ako r2 2 semo x = x + 0. je r2 < kxk stavljamo x = kxk−r kxk x + kxk x. U suprotnom piˇ S + T = T + S, S + {0} = S 1. α(S + T ) = αS + αT 2. (α + β)S ⊆ αS + βS. 3. S + (T ∪ U) = (S + T ) ∪ (S + U). Analogna formula za ∩ ne vrijedi, ali je korisna sljede´ca relacija 4. (S + T ) ∩ U = ∅ ⇐⇒ S ∩ (U − T ) = ∅ T OP OL Naveˇs´cemo neka svojstva operacija sa skupovima, posebno imaju´ci u vidu otvorene, zatvorene te kompaktne podskupove u Rn . Taˇcka x0 je unutraˇsnja taˇcka skupa S ako postoji broj ε > 0 tako da vrijedi B(x0 , ε) ⊆ S. Skup svih unutraˇsnjih taˇcaka datog skupa je njegova unutraˇsnjost (interior): int S = {x ∈ S : ∃ε > 0 (x + εB) ⊆ S}. (2) 4 Skup je otvoren ako mu je svaka taˇcka unutraˇsnja, tj. ako je int S = S. Taˇcka x0 je graniˇcna taˇcka skupa S ako se u svakoj kugli B(x0 , ε) nalaze taˇcka iz S i taˇcka iz njegovog komplementa Rn \S. Skup svih tih taˇcaka je granica skupa S, a oznaˇcavamo ga sa bd S. Zatvorenje skupa S definiˇsemo sa cl S := S ∪ bd S. Kaˇze se da je neki skup zatvoren ako je njegov komplement otvoren skup. pokazuje se da su bd S i cl S zatvoreni skupovi. Odatle izlazi da je cl S najmanji zatvoreni nadskup skupa S, i to da je on je zatvoren ako i samo ako je cl S = S. Navedimo joˇs da je skup S zatvoren ako i samo ako za svaki konvergentan niz (xk ), xk ∈ S vrijedi lim xk ∈ S. Za karakterizaciju zatvorenja skupa osim x0 ∈ cl S ⇐⇒ d(x0 , S) = 0, koristi´cemo i sljede´cu cl S = \ (S + εB), (3) ε>0 koja slijedi iz (). Uopˇste, vrijede formule: int (S ∪ T ) ⊇ int S ∪ int T , cl (S ∪ T ) = cl S ∪ cl T , int (S ∩ T ) = int S ∩ int T , cl (S ∩ T ) ⊆ cl S ∩ cl T . Mi ´cemo, zbog prirode konveksnih skupova, viˇse paˇznje posvetiti operacijama ∩ i +. Kao prvo, navedimo da u posljednjoj formuli ne mora da vrijedi jednakost. Primjer 2 Za skupove S = {x ∈ R2 : x1 > 0, x2 > 0} ∪ {0}, T = [0, e1 ], imamo cl (S ∩ T ) = {0}, dok je cl S ∩ cl T = T . Primjedba 1 Tre´ca formula vrijedi i za konaˇcan broj skupova,Tali to nije tako 1 u sluˇcaju T da ih je prebrojivo. Za Ck = [0, 1+ k ] imamo da je int k∈N Ck =]0, 1[, dok je k∈N int Ck =]0, 1]. S obzirom da je S + T = [ (x + T ), imamo da je suma dva skupa otvoren skup x∈S ako je jedan od njih (ovdje T ) otvoren. 5. Sada, iz int S+ int T ⊆ S + T slijedi int(int S+ int T ) ⊆ int (S + T ), odnosno int S + int T ⊆ int (S + T ). Obratna inkluzija nije na snazi, bez dodatnih uslova. Na primjer: S = [0, 1], T = S ∪ {2}, int S+ int T =]0, 2[ ⊂ int (S + T ) =]0, 3[. 6. Med¯utim, suma dva zatvorena skupa ne mora biti zatvorena. Na primjer, © ª u R2 za zatvorene skupove S = (x, x1 ) : x > 0 , i T = R × {0} suma S + T = 5 R×]0, +∞[ je otvoren skup. Ovo je i primjer da nije uvijek cl S+ cl T = cl (S + T ). Uvijek je cl S + cl T ⊆ cl (S + T ), a da bismo imali jednakost dovoljno je da je jedan od skupova kompaktan. To slijedi iz sljede´ce ˇcinjenice. 7. Suma zatvorenog i kompaktnog skupa je zatvoren skup. Zaista, neka je z k niz sa ˇclanovima iz S + T koji teˇzi z 0 . Vrijedi z k = xk + y k , xk ∈ S i y k ∈ T za sve prirodne k. Neka su dati skupovi zatvoreni, i joˇs neka je T ograniˇcen (tj. kompaktan). Niz (y k ) ima podniz koji teˇzi nekom y 0 ∈ T . Sada i odgovaraju´ci podniz niza (xk ) ima graniˇcnu vrijednost, i to z 0 − y 0 ∈ S (S je zatvoren). Dakle, z 0 = (z 0 − y 0 ) + y 0 ∈ S + T , pa je ova suma zatvoren skup. 6 Afini skupovi 1. Skup V 6= ∅ je potprostor ako je i sam vektorski prostor, u odnosu na iste operacije. Za to je potrebno i dovoljno da vrijedi αx + βy ∈ V ∀x, y ∈ V, α, β ∈ R, ˇsto je ekvivalentno sa αV + βV ⊆ V ∀ α, β ∈ R. (4) 0 Zbir jednoˇclanog skupa {v } i potprostora V zove se linearna (afina) mnogostrukost L: L = v 0 + V. S obzirom da 0 ∈ V, to je v 0 ∈ L. Uzmimo neki drugi vektor v ∈ L. Imamo v − v 0 ∈ V, pa je L − v = V − (v − v 0 ) = V. Znaˇci da za svaki v ∈ L je L = v + V. Dalje, zbog L − L = v 0 + V − (v 0 + V) = V − V = V, imamo, za svaki v ∈ L, L − L = L − v. (5) Sliˇcno je (1 − λ)L + λL = (1 − λ)(v 0 + V) + λ(v 0 + V) = v 0 + (1 − λ)V + λV ⊆ v + V = L, tj. za sve λ ∈ R vrijedi 0 (1 − λ)L + λL ⊆ L. (6) Ova formula je i dovoljne da L bude linearna mnogostrukost. Zaista, uzmimo vektore u, v ∈ L − L. Imamo u = u1 − u2 , v = v 1 − v 2 , gdje su svi sabirci iz L. 2 2 u1 +v 1 Vrijedi αu = u1 − ((1 − α)u1 + αu2 ) ⊆ L − L, i u+v − u +v ∈ L − L. 2 = 2 2 Sada je u+v = 2 u+v ∈ L−L, pa je ta razlika skupova potprostor i koristi se (4). 2 2. U sluˇcaju da je linearna mnogostrukost u prostoru Rn zva´cemo je ravan R. Ako je potprostor R − R dimenzije k ∈ {1, ..., n − 1}, onda postoji linearno nezavisan skup {x1 , ..., xk } ⊆ R takav da je R − R = lin (v 1 , ..., v k ). Dakle, prema (4), za neki x0 ∈ R imamo R = x0 + lin (x1 , ..., xk ), i kaˇzemo da je ta ravan dimenzije k. Specijalno, prava je ravan dimenzije 1: P = x0 + lin (v) = {x0 + λv : λ ∈ R}, v 6= 0. Neka su x1 , x2 ∈ razliˇcite taˇcke sa prave. Tada je za neke razliˇcite skalare λ1 , λ2 x1 = x0 + λ1 v, x2 = x0 + λ2 v, x2 − x1 = (λ2 − λ1 )v, odakle je lin (v)= lin 7 (x2 − x1 ). Zakljuˇcno uzimaju´ci x1 umjesto x0 jednaˇcina prave kojoj pripadaju raˇzliˇcite taˇcke x1 i x2 je x = x1 + λ(x2 − x1 ), λ ∈ R. Ravan dimenzije n − 1 H = x0 + lin (x1 , ..., xn−1 ) zovemo hiperravan. Inaˇce svaka hiperravan je data sa H(a, α) = {x ∈ Rn : ha, xi = α}, gdje je a ∈ Rn , a 6= 0 i α ∈ R. Za a = 0 dobijamo ∅ (ako je α 6= 0) ili ˇcitav prostor (α = 0). Skup rjeˇsenja sistema Ax = b, gdje je A m × n matrica, b ∈ Rn , a x ∈ Rn je ravan dimenzije k = n − rang(A), a vrijedi i obratno, svakoj ravni odgovara sistem ˇciji je skup rjeˇsenja. 3. Na kraju, odredimo najmanju ravan (poredak je dat relacijom ⊆) u kojoj je neprazan skup S. Neka je x0 ∈ S, tada je {0} ⊆ S − x0 ⊆ Rn , pa postoji najmanji potprostor ˇciji podskup je S − x0 , a to je presjek svih odgovaraju´cih potprostora, tj. lin (S − x0 ). Transliraju´ci taj lineal za x0 dobijamo traˇzenu ravan, koja se naziva afini omotaˇc skupa S aff S = x0 + lin (S − x0 ). Kao i dokazuje se da vrijedi [ aff S = {λ1 x1 + ... + λk xk : x1 , ..., xk ∈ S, λ1 + ... + λk = 1} k∈N Pod dimenzijom skupa S smatra´cemo dimenziju njegovog afinog omotaˇca. Ako je ona k onda postoji skup {x0 , x1 , ..., xk } ⊆ S takav da je {x1 − x0 , ..., xk − x0 } linarno nezavisan. Tada je µ 0 ¶ µ 0 ¶ x x1 ... xk x x1 − x0 ... xk−1 − x0 = rang = k + 1, rang 1 1 ... 1 1 0 ... 0 i x ∈ aff S ⇔ x = k X i=0 λi xi , k X λi = 1. (7) i=0 Kaˇzemo da je {x0 , x1 , ..., xk } afino nezavisan, dok je vektor (λ0 , ..., λk ) jedinstven i njegove koordinate nazivamo baricentriˇcnim. 8 FUNKCIJE Vaˇzni skupovi koji su pridruˇzeni svakoj funkciji f : Df → R, Df ⊆ Rn su nadgraf (epigraf), podgraf (hipograf) i nivoski (Lebegov) skup : ½µ ¶ ¾ x epi f = ∈ Df × R : α > f (x) α hypo f = −epi (−f ), lev (f, α) = {x ∈ Df : f (x) 6 α} . Umjesto domena funkcije moˇzemo uzeti neki njegov neprazan podskup S, tj. posmtaramo restrikciju f |S . Tada se i gornje definicije modifikuju, pri ˇcemu se umjesto epi (f, S) i lev (f, S, α) zadrˇzavaju stare oznake, a ako nema zabune za nivoski skup imamo oznaku levα Limes inferior niza, odnosno limes inferior funkcije definiˇsemo na sljede´ci naˇcin. lim inf xn = sup inf xk n x>n lim inf f (x) = lim o x→x inf ε↓0 0<kx−x0 k<ε f (x) Kaˇzemo da je funkcija f odozdo poluneprekidna u taˇcki x0 ∈ S ako vrijedi lim inf f (x) > f (x0 ). o x→x Ovo je ekvivalentno sa (∀ε > 0)(∃δ > 0)(∀x ∈ S ∩ B(x0 , δ)) f (x0 ) − ε < f (x), odnosno sa uslovom da za svaki niz {xk }, xk ∈ S, xk → x0 vrijedi f (x0 ) 6 lim inf f (xk ). Teorema 1 (Vajerˇ stras) Neka je realna funkcija f odozdo poluneprekidna na zatvorenom ograniˇcenom skupu S ⊆ Rn . Tada postoji x∗ ∈ S takva da je f (x∗ ) = min f (x). x∈S Dokaz. Po definiciji postoji niz sa ˇclanovima xk ∈ S takav da f (xk ) → inf f (S). Zbog kompaktnosti skupa S uoˇceni niz ima podniz koji konvergira taˇcki, na primjer x∗ , iz tog skupa. Niz slika tog podniza teˇzi ka infimumu, pa je lim inf f (x) 6 inf f (S). Na osnovu poluneprekidnosti imamo f (x∗ ) 6 lim inf f (x), ∗ ∗ x→x x→x pa slijedi f (x∗ ) 6 inf f (S). ¤ Dakle, pojam poluneprekidnosti je posebno vaˇzan, pa ´cemo mu posvetiti viˇse paˇznje. Teorema 2 Funkcija f je poluneprekidna odozdo na zatvorenom skupu S ⊆ Rn ako i samo ako je svaki njen nivoski skup zatvoren, ili ako i samo ako je nadgraf zatvoren skup. 9 µ ¶ xk iz nadgrafa epi f odozdo polµ αk¶ x . Tada imamo αk > f (xk ), xk → uneprekidne funkcije f konvergira ka α µ ¶ x k x ∈ S i α = lim αk > liminf f (x ) > f (x). Znaˇci i ∈ epi f . Neka xk ∈ α µ k ¶ x levα , xk → x. Ako je nadgraf zatvoren skup, onda je i limes niza α u epi f, tj. f (x) 6 α, odnosno x ∈ levα . Na kraju, pretpostavimo da f nije poluneprekidna odozdo u x. Postoji niz xk koji teˇzi toj taˇcki, dok je lim f (xk ) = α < f (x). Skoro svi ˇclanovi niza {xk } su u lev (f, α+f2 (x) ), ali ne i x, pa taj nivoski skup nije zatvoren. ¤ Dokaz. Uzmimo da niz sa ˇclanovima Primjedba 2 Ako skup S nije zatvoren, onda za poluneprekidnost odozdo je potrebna i dovoljna zatvorenost nadgrafa u S × R, odnosno zatvorenost svakog nivoskog skupa u S. Osim realnih funkcija definisanih na podskupu prostora Rn posmatra´cemo i funkcije definisane na Rn , sa vrijednostima u proˇsirenom skupu realnih brojeva R = R ∪ {±∞}. Na taj naˇcin svaka funkcija f : S → R, S ⊆ Rn moˇze se dodefinisati tako da joj domen bude ˇcitav prostor ½ f (x), x∈ S e f (x) = (8) +∞, x ∈ Rn \ S, tako da vrijedi min f (x) = minn fe(x). x∈S Skup x∈R dom(f ) = {x ∈ Rn : f (x) < +∞} naziva se efektivni domen funkcije f Nas ´ce posebno zanimati funkcije koje ne uzimaju vrijednost −∞, a identiˇcki nisu +∞, odnosno ako vrijedi dom(f ) 6= ∅, −∞ ∈ / f (Rn ). (9) Nazivaju se sopstvene funkcije, a... Definicije iz ranijih razmatranja prenose se i na funkcije f : Rn → R, uz uobiˇcajene operacije sa ±∞. Tako je f poluneprekidna odozdo u x0 ∈ Rn ako je f (x0 ) 6 lim inf f (x). 0 x→x Ovdje uoˇcimo da iz neprekidnosti funkcije f ne slijedi da je (polu)neprekidna i funkcija fe, data formulom (33) . Na primjer, f (x) = x je neprekidna na ]0, +∞[, ali ½ x, x>0 fe(x) = +∞, x 6 0 nije ni poluneprekidna u 0. 10 Primjer 3 Karakteristiˇcna (indikatorna) funkcija skupa S ½ 0, x∈S IS (x) = +∞, x ∈ /S Uoˇcimo da za funkciju fe datu sa (8), za sve x ∈ Rn , vrijedi fe(x) = f (x) + IS (x). 11 KONVEKSNI SKUPOVI Definicija i primjeri Definicija 1 Skup C ⊆ Rn je konveksan ako za sve x1 , x2 ∈ C i sve λ ∈ [0, 1] vrijedi (1 − λ)x1 + λx2 ∈ C. Primjedba 3 Geometrijski duˇz [x1 , x2 ] je skup taˇcaka x sa prave P za koje vrijedi kx1 − xk + kx − x2 k = kx1 − x2 k. Ako je x1 6= x2 i x ∈ P imamo da je x = x1 + λ(x2 − x1 ), λ ∈ R. Odavde je kx − x1 k = |λ|kx1 − x2 k, kx − x2 k = |1 − λ|kx1 − x2 k, tako da je polazna jednakost ispunjena ako i samo ako je |λ| + |1 − λ| = 1, odnosno 0 6 λ 6 1. Dakle, duˇz je skup [x1 , x2 ] = {(1 − λ)x1 + λx2 : 0 6 λ 6 1}. Prema tome skup je konveksan ako i samo ako mu je podskup svaka duˇz ˇcije krajnje taˇcke su u njemu. slika 1. C Iz definicije slijedi da je skup C konveksan ako za svaki λ ∈ [0, 1] je (1 − λ)C + λC ⊆ C, (10) a poˇsto vrijedi i obratna inkluzija (za proizvoljne skupove) to u prethodnoj formuli moˇze da stoji znak =. Primjedba 4 Stavljaju´ci da je 1 − λ = λ1 , λ = λ2 vidimo da je λ1 + λ2 = 1, a uslov 0 6 λ 6 1 je isto ˇsto i λ1 , λ2 > 0, tako da uz nove uslove (8) postaje λ1 C + λ2 C ⊆ C Od osnovnih skupovnih operacija konveksnost ˇcuvaju sabiranje skupova i mnoˇzenje realnim brojem. Isto tako vrijedi Teorema 3 Neka su C1 i C2 konveksni skupovi. Tada su C1 ∩ C2 C1 + C2 i α · C1 konveksni skupovi. Dokaz. Iz x1 , x2 ∈ C1 ∩ C2 , zbog konveksnosti datih skupova, slijedi [x1 , x2 ] ⊆ C1 i [x1 , x2 ] ⊆ C2 , pa je [x1 , x2 ] ⊆ C1 ∩ C2 . Dalje, zbog (1), za sve λ ∈ [0, 1] vrijedi (1 − λ)(C1 + C2 ) + λ(C1 + C2 ) = (1 − λ)C1 + λC1 + (1 − λ)C2 + λC2 ⊆ C1 + C2 , kao i (1 − λ)αC1 + λαC1 = α((1 − λ)C + λC) ⊆ αC. ¤ Napomenimo da je presjek i proizvoljno mnogo konveksnih skupova opet konveksan skup. Oˇcigledno je da unija dva konveksna skupa ne mora biti konveksan skup. 12 Primjer 4 S obzirom da inkluzija (4) vrijedi za sve realne brojeve, taˇcna je i za sve brojeve iz [0, 1], tako da je svaka ravan konveksan skup. Tu su ,specijalno, ukljuˇceni jednoˇclani skupovi, potprostori kao i ˇcitav Rn . Primjer 5 Svaka hiperravan H(a, α), a 6= 0 odred¯uje u Rn ˇcetiri poluprostora. Zatvoreni poluprostori H+ (a, α) = {x ∈ Rn : ha, xi > α}, H− (a, α) = {x ∈ Rn : ha, xi 6 α}, kao i otvoreni poluprostori intH+ (a, α) = {x ∈ Rn : ha, xi > α}, int H− (a, α) = {x ∈ Rn : ha, xi < α} su konveksni skupovi. Ovo direktno slijedi iz jednakosti ha, (1 − λ)x1 + λx2 i = (1 − λ)ha, x1 i + λha, x2 i. Nazivi poluprostora nisu sluˇcajni. Prvi je zaista zatvoren skup, ˇsto slijedi iz neprekidnosti skalarnog mnoˇzenja (ha, xk i > α i xk → x0 povlaˇce ha, x0 i > α). Posljednji je komplement prvog, pa je otvoren. Sliˇcno je za ostale. Primjer 6 Neka su a1 , ..., am ∈ Rn i b1 , ..., bm realni brojevi. Presjek konaˇcnog broja zatvorenih poluprostora (ovdje m) H− (ai , bi ) = {x ∈ Rn : hai , xi 6 bi } i zemo pisati je konveksan skup. Naziva se poliedar. Umjesto ∩m i=1 H− (a , bi ) moˇ n i {x ∈ R : ha , xi 6 bi i = 1, ..., m} ili {x ∈ Rn : Ax 6 b}, (11) gdje jeTA matrica tipa m × n sa vrstama ai , dok je b = [b1 , ..., bm ]> . Specijalno, n Rn+ = i=1 H+ (ei , 0) je polieadar. Primjer 7 Otvorena kugla sa centrom u x0 , polupreˇcnika r je konveksan skup. Zaista, za x1 , x2 ∈ B(x0 , r), λ1 > 0, λ2 > 0, λ1 + λ2 = 1 imamo kx0 −(λ1 x1 +λ2 x2 )k = kλ1 (x0 −x1 )+λ2 (x0 −x2 )k 6 λ1 kx0 −x1 k+λ2 kx0 −x2 k < < λ1 r + λ2 r = r, odnosno λ1 x1 + λ2 x2 ∈ B(x0 , r). Na isti naˇcin se vidi da je i zatvorena kugla B[x0 , r] konveksna. Moglo se i na osnovu sljede´cih jednakosti (prva je iz primjera), koriste´ci (3)i teoremu 1, (1 − λ)B[0, 1] + λB[0, 1] = B[0, 1], Kao ˇsto znamo, zbir B[x0 , r] = x0 + rB[0, 1]. λ1 x1 + · · · + λk xk je linearna kombinacija vektora x1 , ..., xk ∈ S ako su λ1 , ..., λk ∈ R, a afina kombinacija ako je λ1 + · · · + λk = 1 (formula (6)). Ako je λ1 > 0, ..., λk > 0, onda kaˇzemo da je linearna kombinacija nenegativna. Konveksna kombinacija je ona linearna kombinacija datih vektora je ona koja je afina i nenegativna. 13 Primjer 8 Skup svih konveksnih kombinacija konaˇcnog skupa vektora x1 , ..., xm naziva se politop, a oznaˇcava sa co {x1 , ..., xm }. Svaki politop je konveksan skup: x, y ∈ co {x1 , ..., xm } ⇒ x = m X λi x i , y = m X i=1 gdje je Pm i=1 λi = 1, Pm i=1 µi y i , i=1 µi = 1, xi > 0, yi > 0 (i = 1, ..., m). Sada je (1 − λ)x + λy = m X ((1 − λ)λi + λµi )xi ∈ co {x1 , ..., xm }, i=1 zato ˇsto je Pm i=1 ((1 − λ)λi + λµi ) = (1 − λ) Pm i=1 λi + λ Pm i=1 µi = 1. Politop se, za m > 1, naziva (m − 1)-dimenzionalni simpleks u Rn , ako je {x , ..., xm } afino nezavisan. Jednoˇclane skupove smatramo simpleksima dimenzije 0. Specijalno, ∆n = co {0, e1 , ..., en } 1 je standardan n-simpleks u Rn , dok je σ n = co {e1 , ..., en+1 } n - dimenzionalni jediniˇcni simpleks u Rn+1 slika Teorema 4 Neka su C, D konveksni skupovi i a : Rn → Rm afino preslikavanje. Tada su skupovi a(C) i a−1 (D) konveksni. Dokaz. Iz a((1 − λ)x1 + λx2 ) = (1 − λ)a(x1 ) + λa(x2 ) ∀ xn , x2 ∈ Rn λ ∈ [0, 1] slijedi (1 − λ)a(C) + λa(C) = a(C) (1 − λ)a−1 (D) + λa−1 (D) ⊆ a−1 (D), tako da su ovi skupovi konveksni po definiciji. ¤ Skup K ⊆ Rn naziva se konus ako vrijedi x ∈ K, λ > 0 ⇒ λx ∈ K. Ova implikacija je ekvivalentna sa λK ⊆ K, ∀λ > 0. (12) Ako je konus konveksan skup onda se naziva konveksan konus. Za njihovu karakterizaciju potrebna je i dovoljna prethodna formula i zatvorenost skupa K u odnosu na sabiranje, tj. K + K ⊆ K. (13) 14 Fakat, iz ove dvije formule slijedi konveksnost: (1 − λ)K + λK ⊆ K + K ⊆ K ∀λ ∈ [0, 1]. Obratno, pokaˇzimo da iz (8) i konveksnosti slijedi (9). Na osnovu 2K ⊆ K, je K ⊆ 12 K, pa ako je konus konveksan imamo K+K ⊆ 1 1 K + K = K. 2 2 Primjer 9 Skup K = {x ∈ Rn : Ax 6 0}, 0 ∈ Rm , je konveksni konus, ˇsto neposredno slijedi iz (8), (9) i svojstava matriˇcnog mnoˇzenja. U skladu sa Primjerom 5., naziva se homogeni poliedar, a moˇze i poliedarski konus. Primjer 10 Skup svih nenegativnih linearnih kombinacija konaˇcnog skupa taˇcaka x1 , ..., xm je, oˇcigledno, konveksan konus. Nazivamo ga konaˇcno generisanim,a oznaka mu je cone .... Dakle, cone {x1 , ..., xm } = {λ1 x1 + ... + λm xm : λ1 > 0, ..., λm > 0}. (14) Vaˇzan primjer je {Ax : x > 0} ⊆ Rm . On je konaˇcno generisan konus zato ˇsto je K = cone {a∗1 , ..., a∗n }. Primjer 11 Svakom konveksnom konusu K dodjeljuju se dva konusa {y : hy, xi 6 0 ∀x ∈ K} i {y : hy, xi > 0 ∀x ∈ K}. To su normalni konusi (negativan normalan i pozitivan). Prvi se najˇceˇs´ce zove polaran konus, sa oznakom Ko . Pozitivan normalan konus zove se konjugovan (dualan) konus konusa K, a oznaˇcava sa K∗ . jasno, vrijedi K◦ = −K∗ . SLIKA Konveksan omotaˇ c Ukoliko neki skup nije konveksan, moˇzemo mu dodijeliti najmanji konveksan skup koji ga sadrˇzi. U tom cilju, za proizvoljan neprazan skup S ⊆ Rn posmatra´cemo sve njegove konveksne nadskupove. Jedan od njih je aff S, a presjek im je neprazan (podskup mu je S) i konveksan. Nazivamo ga konveksni omotaˇc skupa S i piˇsemo co S. Dakle, \ co S = C. S⊆C Na osnovu definicije, za prozvoljne skupove S, T i konveksan skup C vrijedi S ⊆ T ⇒ co S ⊆ co T , C = co C, 15 co (co S) = co S . Za svaki prirodan broj k, proizvoljnom nepraznom skupu S dodjeljujemo skup svih konveksnih kombinacija svakih k njegovih elemenata (uniju svih politopa generisanih taˇckama iz S): [ cok S = co {x1 , ..., xk }, x1 ,...,xk ∈S ( cok S = k X i 1 k λi x : x , ..., x ∈ S, λ1 , ..., λk > 0, i=1 k X ) λi = 1 . i=1 Pomo´cu njih opisa´cemo konveksni omotaˇc skupa S. Prije svega, za proizvoljne skupove S, T , konveksan skup C iz Rn , i sve brojeve λ ∈ [0, 1] vrijedi: S ⊆ T ⇒ cok S ⊆ cok T , (15) (1 − λ)cop S + λcoq S ⊆ cop+q S, (16) cok C ⊆ C. (17) Posljednja inkluzija se dokazuje indukcijom: co1 C = C, a co2 C ⊆ C je po definiciji konveksnog skupa. Pk+1 Ako je cok C ⊆ C i x ∈ cok+1 C, onda je x = i=1 λi xi za neke x1 , ..., xk+1 ∈ C, λ1 , ..., λk+1 ∈ [0, 1], λ1 + ... + λk+1 = 1. Ukoliko je tada λk+1 6= 1 imamo x = λk+1 xk+1 + (1 − λk+1 ) k X i=1 λi xi ∈ λk+1 C + (1 − λk+1 )C = C. 1 − λk+1 Ako je λk+1 = 1, onda je opet x = xk+1 ∈ C. Dakle, cok C ⊆ C povlaˇci cok+1 C ⊆ C, za sve k ∈ N. Teorema 5 Ako je S neprazan podskup od Rn , onda je [ co S = cok S. k∈N Dokaz. S = co1 S ⊆ ∪k∈N cok S, odakle je, prema (13), co S ⊆ co (∪k∈N cok S). Poˇsto iz (14) slijedi da je posmatrana unija konveksan skup imamo [ co S ⊆ cok S. k∈N Dalje, zbog S ⊆ co S vrijedi cok S ⊆ cok (co S), a na osnovu (15) je cok (co S) ⊆ co S, tako da imamo cok S ⊆ co S. Kako posljednja inkluzija vrijedi za sve prirodne brojeve, to je [ cok S ⊆ co S. ¤ k∈N 16 Ovaj rezultat se moˇze precizirati. Teorema 6 (Karateodori, 1911) Ako je S ⊆ Rn neprazan skup vrijedi co S = n+1 [ cok S. k=1 Dokaz. Neka je x ∈ co S. Prema prethodnom, tada je x = λ1 x1 +· · ·+λk xk , za neke x1 , ..., xk ∈ S, λ1 > 0, ..., λk > 0, λ1 +···+λk = 1. ½µ i ¶ µ k ¶¾ x x linearno zavisan u Rn+1 . Ako je k > n + 1, onda je skup , ..., 1 1 Postoje realni brojevi α1 , ..., αk , koji nisu svi jednaki 0, takvi da je α1 x1 + · + αk xk = 0, α1 + · + αk = 0. Bar jedan od njih je pozitivan (druga jednakost), pa neka je Imamo x=x− λi λj = min . i:αi >0 αi αj ¶ k k k µ X X λj λj X λj ·0= λi xi − αi xi = λi − αi xi . αj αj i=1 αj i=1 i=1 λj αi > 0 (za i takvo da je αi 6 0 to je oˇcigledno, a za ostale αj ´ Pk ³ λ λ zbog izbora indeksa j ) i i=1 λi − αjj αi = 1 − αjj · 0 = 1, dobili smo da je Poˇsto je λi − k x konveksna kombinacija taˇcaka skupa {x1 , ..., xj−1 , xj+1 µ, ...,i x¶ }. x Postupak se nastavlja sve dok skup preostalih vektora ne postane lin1 n+1 [ earno nezavisan, tj. dok ih ne ostane najviˇse n + 1. Tada je x ∈ cok S. k=1 Dakle, co S ⊆ n+1 [ cok S. Obratna inkluzija izlazi iz prethodne teoreme. ¤ k=1 Primjedba 5 Zbog jasne veze cok S ⊆ cok+1 S tvrdnja Karateodorijeve teoreme svodi na jednakost co S = con+1 S. Isto tako moˇzemo primjetiti da je konveksni omotaˇc nekog skupa unija simpleksa dimenzije (najviˇse) n, sa vrhovima iz tog skupa. Primjer 12 Na osnovu Karateodorijeve teoreme dobijamo σ n−1 = {x ∈ Rn : n X i=1 17 xi = 1, xi > 0}. za n - dimenzionalni standardni simpleks je ∆n = {x ∈ Rn : n X xi 6 1, xi > 0}. i=1 Dalje je int ∆n = int H− (e, 1) ∩ int H+ (e1 , 0) ∩ ... ∩ int H+ (en , 0) = n = {x ∈ R : n X xi < 1, x1 > 0, ..., xn > 0}. i=1 1 1 Uoˇcimo joˇs da je ( n+1 , ..., n+1 )> ∈ int ∆n . Pomo´cu konveksnog omotaˇca definiˇse se nova operacija koja ˇcuva konveksnost C1 ∪ C2 := co (C1 ∪ C2 ) (18) Slijede´ce jednakosti su korisne ne samo za konstrukciju konveksnog omotaˇca sloˇzenijih skupova co (S1 + S2 ) = co S1 + co S2 , (19) C1 ∪ C2 = {(1 − λ)x1 + λx2 : x1 ∈ C1 , x2 ∈ C2 , λ ∈ [0, 1]}. (20) Dokaˇzimo prvu formulu, koja vrijedi za proizvoljne skupove. Poˇsto je konveksan zbir konveksnih skupova imamo da iz S1 + S2 ⊆ co S1 + co S2 slijedi co (S1 + S2 ) ⊆ co (co S1 + co S2 ) = co S1 + co S2 . Za obratnu inkluziju koristimo Karateodorijevu teoremu. Za svaki xi ∈ S1 je xi + co S2 = co (xi + S2 ) ⊆ co (S1 + S2 ). Taˇcka x ∈ co S1 , je oblika x = k X λi xi , xi ∈ S1 , λi > 0, i=1 nakon mnoˇzenja sa λi i sabiranja, dobijamo x+ k X i=1 λi co S2 ⊆ k X k X λi = 1, tako da, i=1 λi co (S1 + S2 ). i=1 Zbog konveksnosti omotaˇca, dalje je x + co S2 ⊆ co (S1 + S2 ), i to za sve x ∈ co S1 , ˇsto znaˇci da je co S1 + co S2 ⊆ co (S1 + S2 ). Druga jednakost vaˇzi za konveksne skupove. Oznaˇcimo sa C skup sa desne strane jednakosti (19), i neka je x ∈ co (C1 ∪C2 ). Ako je x ∈ C1 ili x ∈ C2 situacija je jasna. Inaˇce x je konveksna kombinacija taˇcaka v 1 , ..., v k iz C1 ∪ C2 , tako da su skupovi J2 = {i : v i ∈ C1 } i J1 = {i : v i ∈ C2 } neprazni. Stavljaju´ci za 18 odgovaraju´ce koeficijente λ1 , ..., λk da je λ = 1 − 0 < λ < 1. Tada je x = (1 − λ) X i∈ J1 P i∈J1 = P i∈J2 λi dobijamo X λi λi i v +λ v i ∈ (1 − λ)C1 + λC2 ⊆ C. 1−λ λ i∈ J2 Obratna inkluzija je trivijalna. Za konveksni omotaˇc unije konveksnih konusa imamo preciznije K1 ∪K2 = K1 + K2 . (21) Jasno, za sve λ > 0 je λK = K. Prema (20) imamo [ [ K1 ∪ K 2 ) = (1 − λ)K1 + λK2 = K1 + (K1 + K2 ) + K2 = K1 + K2 . 06λ61 0<λ<1 Topoloˇ ska svojstva Kao prvo navedimo da se zatvorenje skupa moˇze zapisati kao \ cl C = (C + εB), (22) ε>0 dok je njegova unutraˇsnjost int S = {x ∈ S : ∃ε > 0 (x + εB) ⊆ S}. (23) Teorema 7 Za svaki konveksan skup sa nepraznim interiorom vrijedi x1 ∈ int C, x2 ∈ cl C =⇒ [x1 , x2 [ ⊆ int C. Dokaz. Za svaki λ ∈]0, 1[ i svaki ε > 0, koriste´ci formulu za zatvorenje imamo (1−λ)x1 +λx2 +εB ⊆ (1−λ)x1 +λ(C +εB)+εB ⊆ (1−λ)(x1 + gdje je ε tako uzeto da je x1 + λε 1−λ B λε B)+λC ⊆ C, 1−λ ⊆ C, ˇsto je mogu´ce, zbog x1 ∈ int C. ¤ Posljedica 1 Za konveksan skup sa nepraznim interiorom vrijedi x ∈ int C ⇔ ∀v ∈ Rn ∃ε > 0 x + εv ∈ C. (24) Zaista, neka je x0 ∈ int C i x 6= x0 takav da vrijedi desna strana ekvivalencije. Prema tome postoji ε > 0 za koji je x1 = x + ε(x − x0 ) ∈ C. Sada je x = ε 1 0 1 0 1 1+ε x + 1+² x ∈]x , x [ ⊆ int C. Obratna implikacija je jasna. Teorema 8 Unutraˇsnjost i zatvorenje konveksnog skupa su konveksni skupovi. Dokaz. Za x1 , x2 ∈ int C, prema prethodnom, vrijedi [x1 , x2 ] = [x1 , x2 [ ∪{x2 } ⊆ int C ∪ {x2 } = int C. Drugo tvrd¯enje slijedi iz (5) i konveksnosti zbira i presjeka konveksnih skupova. ¤ 19 Teorema 9 Ako je int C = 6 ∅, onda je int cl C = int C, cl int C = cl C Dokaz. Iz C ⊆ cl C slijedi int C ⊆ int cl C. Obratno, neka je x ∈ int cl C i B(x, ε) ⊆ cl C. Za x 6= y ∈ int C postoji taˇcka z ∈ S(x, ε) takva da je x ∈]y, z[, pa prema Teoremi 4 je x ∈ int C. I u drugoj jednakosti jedna inkluzija je oˇcigledna, pa onda neka je x ∈ cl C i y ∈ int C. Tada je [y, x[⊆ int C, odakle je cl [y, x[⊆ cl int C, i x ∈ [x, y] ⊆ cl int C. ¤ Na osnovu ove teoreme neposredno slijede veze za dva konveksna skupa. Teorema 10 Ako su C i D konveksni skupovi sa nepraznim interiorima onda je int C = int D ⇔ cl C = cl D. Svaka od jednakosti ekvivalentna je sa int C ⊆ D ⊆ cl C. Dokaz. Na primjer, ako je D izmed¯u interiora i zatvorenja skupa C, slijedi da je cl int C ⊆ cl D ⊆ cl C, ˇsto uz drugu jednakost iz Teoreme 6 je cl C = cl D. Iz int C = int D dobijamo int C ⊆ D ⊆ cl D ⊆= cl int D = cl int C =cl C. Preostaje da se dokaˇze prva ekvivalencija. ¤ Teorema 11 Neka je l : Rn → Rm linearno preslikavanje i C konveksan podskup od Rn sa nepraznim interiorom, tada vrijedi int l(C) = l(int C). Dokaz. Pokaˇzimo prvo da vrijedi dio ” ⊆ ”. U tom cilju ustanovimo da je konveksan skup D = l(C) izmed¯u unutraˇsnjosti i zatvorenja skupa l(int C). Tada ´ce biti, na osnovu Teoreme 7, int D = int l(int C), odakle je int l(C) ⊆ l(int C). Dakle, imamo uz jednakosti iz teoreme 6 int l(int C) ⊆ l(int C) ⊆ D ⊆ l(cl C) = l(cl int C) ⊆ cl l(int C). Obratno, neka je y ∈ l(int C) i v ∈ Rm proizvoljan vektor. Postoje x ∈ intC, u ∈ Rn i ε > 0 takvi da je y = l(x), v = l(u) i x + εu ∈ C. Sada je y + εv = l(x) + εl(u) = l(x + εu) ∈ l(C). Prema posljedici 1. zakljuˇcujemo da je y ∈ int l(C). ¤ Konveksnost skupova je dovoljna da vrijede jednakosti u ... Teorema 12 int (C + D) = int C + int D. Dokaz. Dosta je primjeniti teoremu 8. na funkciju l : Rn ×Rn → Rn , l(x1 , x2 ) = x1 + x2 koja je je linearna, i za koju vrijedi l(C × D) = C + D. sada je int l(C × D) = int (C + D), l(int (C × D)) = l(int C × int D) = int C + int D. ¤ 20 Teorema 13 Ako su C, D konveksni skupovi i ako je int (C ∩ D) 6= ∅, onda vrijedi cl (C ∩ D) = cl C ∩ cl D. Dokaz. Neka je x ∈ cl C ∩ cl D. Za x0 ∈ int C ∩ int D vrijedi [x0 , x[ ⊆ int C ∩ int D = int (C ∩ D), odakle je x ∈ cl (C ∩ D). ¤ Primjedba 6 Formula vrijedi i za presjek proizvoljno mnogo konveksnih skupova, uz odgovaraju´ci uslov (presjek njihovih unutraˇsnjosti je neprazan) i isti dokaz. Uslov int C 6= ∅ jeste bitan, ali za konveksne skupove nije prirodan, nije ispunjen ve´c za duˇzi u ravni, krugove u trodimenzionom prostoru, kao i hiperravni. Stoga ga je potrebno oslabiti, a to se postiˇze uopˇstavanjem pojma interiora. Primjer 13 Za 2- dimenzioni simpleks σ 2 = co {e1 , e2 , e3 } u R3 imamo da je int σ 2 = ∅. Med¯utim posmatraju´ci ovaj trougao u njegovom afinom omotaˇcu aff (σ 2 ) = {x ∈ R3 : x1 + x2 + x3 = 1}, vidimo, na primjer, za x0 = ( 31 , 13 , 31 ) da je B(x0 , 13 ) ∩ aff ⊆ σ 2 . Kako je ovaj presjek otvoreni krug u posmatranoj (hiper)ravni to je x0 unutraˇsnja taˇcka u odnosu na afini omotaˇc. Skup svih takvih taˇcaka naziva se relativni interior, i piˇse ri T . Uopˇste, relativni interior definiˇsemo sa ri S = {x ∈ S : ∃ε > 0 (x + εB) ∩ aff S ⊆ S}. Jasno ako je int C 6= ∅ onda je relint C = int C. Sada ´cemo dokazati osnovno svojstvo relativnog interiora, po ˇcemu se i razlikuje od interiora. Teorema 14 Ako je C ⊆ Rn neprazan konveksn skup, onda je ri C = 6 ∅. Dokaz. Primjedba 7 Za konveksne skupove C = {(1, 0, 0)} i D = σ 2 imamo C ⊆ D, ali ri C = C * ri D = {x ∈ R3 : x1 + x2 + x3 = 1, x1 , x2 , x3 > 0}. Inaˇce, S ⊆ T ⇒ int S ⊆ int T . Ostala svojstva ostaju na snazi a za dokaz se, umjesto karakterizacije ...koristi x ∈ ri C ⇔ ∀y ∈ C ∃ λ > 1 : y + λ(x − y) ∈ C. (25) Posmatraju´ci re C umjesto int C, na snazi ostaju sve teoreme 4 - 10, riC je konveksan, ri C = ri D ⇔ ri C ⊆ D ⊆ C riCC, riC = riC ril(C = l(riC)) ri(C + D) = riC + riD pri ˇcemu je u posljednjoj potreban dodatni uslov ri C ∩ ri D 6= ∅, kao ˇsto pokazuje Primjer 2. Uz isti uslov je i 21 Teorema 15 ri (C ∩ D) = ri C ∩ ri D Dokaz. Kao u dokazu Teoreme 10 je cl C∩ cl D ⊆ cl (ri C∩ ri D). Sada zbog , cl (ri C∩ ri D) ⊆ cl (C ∩ D) ⊆ cl C∩ cl D, slijedi jednakost cl (riC ∩ riD) = cl(C ∩ D). Na osnovu ... (relativan interior jednog je podskup drugog skupa) imamo ri (C ∩ D) ⊆ ri C∩ ri D. Neka je x0 u presjeku relativnih interiora, i y ∈ C ∩ D. Prema (15) postoje λ > 1 i µ > 1 takvi da je y + λ(x0 − y) ∈ C i y + µ(x0 − y) ∈ D. Ako je, na primjer, µ > λ, onda je y + λ(x0 − y) = µλ (y + µ(x0 − y)) + (1 − µλ )y ∈ D. Dakle, y + λ(x0 − y) ∈ C ∩ D, pa je x0 ∈ ri (C ∩ D). Slijedi ri C∩ ri D ⊆ ri (C ∩ D). ¤ omota´ ci Jednostavno je dokazati da vrijedi S otvoren =⇒ co S otvoren. Na primjer, int co S je konveksan, a podskup mu je S, poˇsto je int S = S. Dakle, po definiciji konveksnog omotaˇca, imamo da je co S ⊆ int co S. S druge strane, konveksan omotaˇc zatvorenog skupa ne mora biti zatvoren: S = {(x, 0) : x > 0} ∪ {(0, 1)}, co S = (R+ × [0, 1]) \ {(x, 1) : x > 0}. Med¯utim dodaju´ci uslov da je posmatrani skup ograniˇcen dobijamo Teorema 16 S kompaktan =⇒ co S kompaktan. Dokaz. Posmatrajmo funkciju f datu sa 1 (λ1 , ..., λn+1 , x , .., x n+1 ) 7→ n+1 X λi xi , λi ∈ R, xi ∈ Rn . i=1 Ona je neprekidna funkcija i kompaktan preslikava u kompaktan skup. Preostaje da se vidi da je, po Karateodorijevoj teoremi, ¡ ¢ co S = f [0, 1] × ... × [0, 1] × S × ... × S . ¤ {z } | {z } | n+1 n+1 Sada ´cemo izuˇciti osnovna svojstva nekih posebnih konveksnih skupova. Sljede´ce imamo iz prethodne teoreme, s obzirom da je konaˇcan skup kompaktan. Posljedica 2 Politop je kompaktan skup 22 Naravno, konaˇcno generisan konus nije kompaktan skup, ali Teorema 17 Konaˇcno generisan konus je zatvoren skup. Dokaz. Neka je K = cone {x1 , ..., xm }, pri ˇcemu je dati skup linearno nezavisan. U suprotnom se, kao u dokazu Karateodorijeve teoreme, vrˇsi redukcija do linearno nezavisnog skupa. Preslikavanje l : Rm → lin (x1 , ..., xm ), l(λ1 , ..., λm ) = λ1 x1 + ... + λm xm je linearno i bijektivno. Inverzno preslikavanje je neprekidno 1 m tako da je slika zatvorenog skupa zatvoren skup. Dakle l(Rm + ) = cone {x , ..., x } je zatvoren skup. ¤ Sada ... Posljedica 3 Zbir politopa i konaˇcno generisanog konusa je zatvoren skup. Neograniˇ ceni konveksni skupovi Teorema 18 Neka C konveksan zatvoren neograniˇcen. Za svaki x ∈ C postoji v 6= 0 takav da vrijedi {x + λv : λ > 0} ⊆ C. (26) Dokaz. Neka je x ∈ C i λ > 0. Postoji niz (xk ) taˇcaka iz C takav da kxk k → ∞, k 0 6 kxλk k 6 1 i ( kxxk k ) konvergira, nekom v. Sada x+ kxλk k (xk −x) ∈ C konvergira ka x + λv ∈ cl C = C. ¤ Primjedba 8 Ako konveksan skup skup nije zatvoren, onda ovo tvrd¯enje vaˇzi za taˇcke iz ri C. Za ostale ne mora, na primjer nijedna poluprava sa vrhom u 0 nije podskup skupa C = ( R×]0, 1[ ) ∪ {0}. Primjedba 9 Navedimo joˇs da u (13) za svaki x moˇzemo uzeti isti v. Zaista, neka (13) vrijedi za x0 ∈ C i neka je x ∈ C proizvoljan. Tada, je k1 (x0 + λkv) + (1 − k1 )x ∈ C, pa taj niz konvergira taˇcki x + λv ∈ cl C = C, za sve pozitivne λ. Projekcija. Teoreme razdvajanja 0 −a,vi Taˇcka y 0 = a + hxkvk v je ortogonalna projekcija taˇcke x0 na pravu P = 2 {a + tv : t ∈ R}, zato ˇsto je hx0 − y 0 , vi = 0. Zbog toga,za bilo koju drugu taˇcku y sa prave, imamo kx0 − yk > kx0 − y 0 k. Uopˇste, taˇcku y 0 ∈ S zva´cemo projekcijom taˇcke x0 ∈ Rn na neprazan skup S j Rn ako vrijedi kx0 − y 0 k 6 kx0 − yk ∀y ∈ S. Jasno, projekcija ne mora da postoji, kao na primjer na otvorenu kuglu iz taˇcke van nje, a ako i postoji ne mora biti jedinstvena (unija dvije zatvorene disjunktne kugle i sredina duˇzi koja spaja njihove centre). Teorema 19 Svaka taˇcka iz Rn ima jedinstvenu projekciju na neprazan, zatvoren konveksan C ⊆ Rn . 23 Dokaz. Kao prvo, ako je taˇcka x0 u C ona je sama sebi projekcija, jer kx0 −y 0 k = kx0 − x0 k = 0. Za x0 ∈ / C neka je r > 0 takav broj da je C ∩ B(x0 , r) neprazan skup. On je kompaktan skup (kao presjek zatvorenog C i zatvorene kugle), pa neprekidna funkcija y 7→ ky − x0 k dostiˇze na njemu minimum, u nekoj taˇcki y 0 . Dakle, za sve taˇcke y posmatranog presjeka vrijedi ky − x0 k > ky 0 − x0 k. Za ostale taˇcke skupa C (van kugle) je ky − x0 k > r > ky 0 − x0 k. Zakljuˇcno, za sve y ∈ C vrijedi ky − x0 k > ky 0 − x0 k. Za dokaz jedinstvenosti koristimo jednakost paralelograma ku + vk2 + ku − vk2 = 2(kuk2 + kvk2 ), uzimaju´ci da je u = x0 − y 0 , v = x0 − y 1 , gdje su y 0 i y 1 projekcije taˇcke x0 . Zbog kx0 − y 0 k = kx0 − y 1 k imamo ¶ µ y0 + y1 2 1 0 2 0 0 2 0 ky − y k = 4 kx − y k − kx − k 6 0, 2 0 1 budu´ci da je y +y ∈ C, zbog konveksnosti datog skupa. Iz prethodne nejed2 nakosti slijedi da je y 0 = y 1 . ¤ Sada vidimo da je na ovaj naˇcin definisana funkcija (x0 7→ y 0 ), koju nazivamo (metriˇcka projekcija) i oznaˇcavamo sa PC . Dakle, za konveksan i zatvoren skup C definisana je PC : Rn −→ C sa y 0 = PC (x0 ) ⇐⇒ (∀y ∈ C) k x0 − yk > kx0 − y 0 k. Osnovna svojstva su data nejednakostima, pri ˇcemu iz druge slijedi neprekidnost ove funkcije. Teorema 20 Za C 6= ∅ konveksan i zatvoren skup, x0 ∈ Rn i y 0 ∈ C vrijedi a) y 0 = PC (x0 ) ako i samo hx0 − y 0 , y − y 0 i 6 0 b) ∀y ∈ C, kPC (x1 ) − PC (x0 )k 6 kx1 − x0 k ∀x1 , x0 ∈ Rn . (27) (28) Dokaz. a) Kako je C konveksan i y 0 ∈ C, to za svaki y ∈ C i sve λ ∈]0, 1[ imamo y 0 + λ(y − y 0 ) ∈ C, pa je kx0 − (y 0 + λ(y − y 0 ))k2 > kx0 − y 0 k2 , tj. 2hx0 − y 0 , y 0 − yi + λky − y 0 k2 > 0. Pri λ → 0+, dobijamo prvu nejednakost. Iz (5) imamo redom (uzimamo da je y 0 6= x0 , inaˇce je nejednakost trivijalna) hx0 −y 0 , x0 −y 0 +y−x0 i 6 0, kx0 −y 0 k2 6 hx0 −y 0 , x0 −yi, kx0 −y 0 k 6 kx0 −yk 24 i to za sve y ∈ C, ˇsto znaˇci da je y 0 = PC (x0 ). b) Oznaˇcavaju´ci projekciju taˇcke x1 sa y 1 slijede nejednakosti: hx0 − y 0 , y 1 − y i 6 0, hx1 − y 1 , y 0 − y 1 i 6 0, odakle je 0 hy 1 − y 0 + x0 − x1 , y 1 − y 0 i 6 0, ky 1 − y 0 k2 6 hx1 − x0 , y 1 − y 0 i. Preostaje da se opet iskoristi nejednakost Koˇsi-Bunjakovskog. ¤ Primjedba 10 Uzimaju´ci da je a = x0 − y 0 , iz prve nejednakosti, za sve y ∈ C vrijedi ha, yi 6 ha, y 0 i. Ako je x0 6= y 0 , onda je a 6= 0, pa je odred¯ena hiperravan H(a, α), α = ha, y 0 i i formula (5) znaˇci y 0 ∈ H, i C ⊆ H− . Ovo je motivacija za sljede´cu definiciju. Definicija 2 H se naziva potporna hiperravan (hiperravan oslonca) nepraznog skupa S ⊆ Rn u taˇcki x ∈ bd S, ako je x ∈ H i S ⊆ H− ili S ⊆ H+ Teorema 21 Zatvoren i konveksan skup u svakoj graniˇcnoj taˇcki ima potpornu hiperravan. Dokaz. Dovoljno je dokazati da je y 0 ∈ bd C projekcija neke druge taˇcke . Postoji niz xk ∈ Rn \C koji teˇzi ka y 0 , pri ˇcemu moˇzemo uzeti da su svi xn ∈ B(y 0 , 1). Prema teoremi 7. imamo niz projekcija y k = PC (xk ), kojem pridruˇzujemo niz z k ∈ S(y 0 , 1) takav sa je xk ∈]y k , z k [. Vrijedi ky k − y 0 k = kPC (xk ) − PC (y 0 )k 6 kxk − y 0 k, odakle je y k → y 0 pa, zbog neprekidnosti projekcije, slijedi PC (y k ) → y 0 . Na osnovu prvog dijela prethodne teoreme je PC (z k ) = y k . Niz (z k ) ima konvergentan podniz, za ˇciju graniˇcnu vrijednost z 0 ∈ S(y 0 , 1) je PC (z 0 ) = y 0 . ¤ Dakle, ako je x0 ∈ bd C, onda je x0 ∈ H, dok je C ⊆ H− . Za x0 ∈ / C (Napomena 2) moˇzemo re´ci i viˇse. Naime, tada je x0 ∈ H+ , zbog ha, y 0 i < ha, x0 i. Ako 0 0 2 i uzmemo α = ha,x i−ha,y = kak dobijamo za sve y ∈ C vrijedi ha, yi < α < 2 2 ha, x0 i, odnosno x0 ∈ int H+ i C ⊆ int H− . Na osnovu ovog razmatranja, uzimaju´ci umjesto jednoˇclanog {x0 } proizvoljan konveksan skup moˇzemo definisati pojam razdvojenih skupova. Definicija 3 Konveksni skupovi C1 , C2 ⊆ Rn su razdvojeni ako postoje taˇcka a ∈ Rn , a 6= 0 i realan broj α takvi da za sve x ∈ C1 i sve y ∈ C2 , vrijedi ha, yi 6 α 6 ha, xi, 25 tj. C1 ⊆ H+ (a, α), C2 ⊆ H− (a, α), Kaˇzemo da su razdvojeni skupovi potpuno razdvojeni ako nije [ C1 C2 ⊆ H(a, α). Skupovi C1 , C2 su strogo razdvojeni ako su u razliˇcitim otvorenim poluprostorima ( postoje a 6= 0, α takvi da za sve x ∈ C1 i sve y ∈ C2 vrijedi ha, yi < α < ha, xi. Navedimo joˇs jednom da je C razdvojen od taˇcke koja mu ne pripada, a ako taˇcka nije u njegovom zatvorenju onda je od nje strogo razdvojen. Teorema 22 Neka su C1 , C2 ⊆ Rn neprazni, disjunktni, konveksni i zatvoreni. Ako je jedan od njih ograniˇcen, onda postoji hiperravan koja ih strogo razdvaja. Dokaz. Razlika C1 − C2 datih skupova, po pretpostavkama, je konveksan i zatvoren skup. Uz ovo, uslov C1 ∩ C2 = ∅ znaˇci da je 0 ∈ / C1 − C2 . Prema prethodnoj teoremi postoji a ∈ Rn , a 6= 0 i β > 0 tako da za sve x ∈ C1 i sve y ∈ C2 vrijedi ha, x − yi > β > 0, odakle je ha, xi > ha, yi + β > ha, yi. Skup {ha, xi : x ∈ C1 } je ograniˇcen odozdo sa ha, yi + β, za proizvoljan fiksiran y ∈ C2 . Sada je inf ha, xi − β x∈C1 gornja med¯a skupa {ha, yi : y ∈ C2 }, pa imamo inf ha, xi > sup ha, yi + β > sup ha, yi. x ∈ C1 y ∈ C2 y ∈ C2 Uzimaju´ci α izmed¯u uoˇcenog supremuma i infimuma slijede nejednakosti iz definicije 2. ¤ Koriste´ci drugi dio teoreme 5, a ponavljaju´ci prethodni postupak, uz izbor α ∈ [ sup ha, yi, inf ha, xi] x∈C1 y∈C2 dobija se Teorema 23 Neprazni, disjunktni i konveksni skupovi C1 i C2 su razdvojeni. Posljedica 4 Ako je uz uslove teoreme 23, joˇs int C1 6= ∅, onda su C1 i C2 potpuno razdvojeni, pri ˇcemu je int C1 u otvorenom poluprostoru. 26 Dokaz. Iz prethodne teoreme slijedi da je ha, xi 6 α za sve x ∈ C1 . Ako bi bilo a ha, x0 i = α za neki x0 ∈ int C1 , onda (imaju´ci na umu da je i x0 + ε ∈ C1 , kak2 pri malom ε > 0) dobijamo À ¿ a = α + ε 6 α. a, x0 + ε kak2 Ovo nije mogu´ce, tako da preostaje ha, x0 i < α, pa x0 ∈ / H(a, α) ¤ Jasno, strogo razdvojeni skupovi su i potpuno razdvojeni. Dakle, mi smo u prethodnom tvrd¯enju pokazali i viˇse od potpune razdvojenosti, tj. da je unutraˇsnjost jednog skupa u otvorenom poluprostoru. Med¯utim pojam potpune razdvojenosti je vaˇzan i zbog potpune karakterizacije. Teorema 24 Neprazni konveksni skupovi C1 , C2 ⊆ Rn su potpuno razdvojeni ako i samo ako vrijedi ri C1 ∩ ri C2 = ∅. Teorema 25 Neprazni konveksni skupovi C1 , C2 ⊆ Rn su strogo razdvojeni ako i samo ako vrijedi inf kx − yk > 0. x∈C1 ,y∈C2 Kao primjenu Teorma separacije dokaza´cemo dvije vaˇzne ... Teorema 26 Ako su C i D konveksni, zatvoreni i ograniˇceni skupovi i za sve vektore a ∈ Rn vrijedi maxha, xi = maxha, xi, x∈C x∈D onda je C = D. Dokaz. Ako bi postojao x0 ∈ (C \D)∪(D\C), onda se ta taˇcka strogo razdvaja od C ili D. Na primjer, ako je x0 ∈ D\C, onda postoji a takav da je ha, x0 i > ha, xi za sve x ∈ C. Uvaˇzavaju´ci kompaktnost imamo maxha, xi < ha, x0 i 6 maxha, xi, x∈C x∈D ˇsto je suprotno uslovu teoreme. ¤ Alternativni sistemi linearnih (ne)jednaˇcina su oni kod kojih samo jedan ima rjeˇsenje. Neka je A m × n matrica, b ∈ Rm dok su vektori 0, x i y u skladu s tim. Teorema 27 (Farkaˇ s, 1902) Samo jedan od sljede´ca dva sistema ima rjeˇsenje: Ax = b, x > 0, (29) A> y > 0, hb, yi < 0. (30) 27 Dokaz. Uzmimo prvo da oba imaju rjeˇsenja i to x0 i y 0 . Mnoˇze´ci skalarno x0 > 0 sa A> y 0 > 0 dobijamo hx0 , A> y 0 i = hAx0 , y 0 i = hb, y 0 i > 0. Pretpostavimo da prvi sistem nema rjeˇsenje. Znaˇci b ∈ / K = {Ax : x ∈ Rn+ }, koji je konveksan (teorema 4) i zatvoren (teorema 17). Posmatrani skup i {b} strogo razdvaja neka hiperravan H(y, α), odnosno, za sve x > 0 vrijedi hy, bi < α < hy, Axi. (31) Specijalno, za x = 0 dobijamo hb, yi < 0. Sada, za sve x > 0, vrijedi hA> y, xi = hy, Axi > 0. Odatle je A> y > 0, tako da je vektor normale y rjeˇsenje drugog sistema. ¤ Ekstremalne taˇ cke Definicija 4 Taˇcka x je vrh (ekstremalna taˇcka) nepraznog konveksnog skupa C ⊆ Rn ako je x ∈ C i ne postoje razliˇcite taˇcke x1 , x2 ∈ C takve da vrijedi x= x1 + x2 . 2 Lako se vidi da je x vrh tog skupa ako i samo ako iz x1 , x2 ∈ C, λ ∈]0, 1[, x = (1 − λ)x1 + λx2 slijedi x1 = x2 . Primjer 14 krug-simplex-poliedar Vidimo da ˇsto se tiˇce broja vrhova situacija je razliˇcita. Konveksan skup ne mora imati vrhove, a moˇze i biti neprebrojivo. Za poliedre imamo sljede´ce. Primjedba 11 Neka je H = H(a, α) potporna hiperravan skupa C ⊆ H+ i C1 = C ∩ H neprazan skup. Tada je ext C1 ⊆ ext C. Zaista, neka je v 0 ∈ ext C1 , ali nije u ext C. Postoje razliˇciti v 1 , v 2 ∈ C takvi da je 2v 0 = v 1 + v 2 . S obzirom na ha, v 1 i > α = ha, v 0 i, dobijamo ha, v 1 − vi > 0, i na isti naˇcin ha, v 2 − vi > 0. No, ha, v 1 − vi + ha, v 2 − vi = 0, pa mora da bude v 1 , v 2 ∈ H, te je v 1 , v 2 ∈ C1 , a to je u suprotnosti s v ∈ ext C1 . Teorema 28 Zatvoren konveksan skup C ⊆ Rn ima vrh ako i samo ako ne postoji prava P ⊆ C. Dokaz. Neka je {x0 + λv : λ ∈ R} ⊆ C, za neku x0 ∈ C i v 6= 0. Prema Teoremi... za svaki x ∈ C je {x + λv : λ ∈ R} ⊆ C. Sada moˇzemo uzeti x = x+v+x−v , pa 2 zbog v 6= 0 taˇcka x nije vrh skupa C. Obratno, koristimo indukciju po dimenziji skupa. Za jednoˇclane skupove situacija je jasna. U induktivnom koraku uzmimo da je n dimenzija skupa C, a tvrd¯enje vrijedi za sve konveksne skupove dimenzije 6 n−1, kojima nijedna prava nije podskup. Svaka prava odred¯ena sa dvije taˇcke iz posmatranog skupa ima neprazan presjek sa bd C. Potporna hiperravan u toj taˇcki je dimenzije n − 1, pa rezultat izlazi iz prethodne napomene. ¤ Teorema 29 Poliedar ima najviˇse konaˇcan broj vrhova. 28 Dokaz. Neka je x0 vrh nekog poliedra. Jasno, postoji J ⊆ {1, ..., m} takav da je hai∗ , xi = bi za indekse iz uoˇcenog podskupa, a hai∗ , xi < bi za ostale. Za neku drugu taˇcku x sa istim svojstvom stavimo x1 = x0 + λ(x − x0 ) i x1 = x0 − λ(x − x0 ). Imamo hai∗ , x1 i = hai∗ , x2 i = bi , za i ∈ J i hai∗ , x1 i < bi + λhai∗ , x − x0 i < bi , i hai∗ , x2 i < bi , za dovoljno malu vrijednost λ. Prema 1 2 tome x1 i x2 su u poliedru, uz x0 = x +x . Ovo nije mogu´ce, pa svakom skupu 2 J odgovara najviˇse jedan vrh, a takvih je konaˇcan broj. ¤ Vidjeli smo da neograniˇceni, zatvoreni konveksni skupovi ne moraju imati vrhove. Situacija je drukˇcija ako je skup ograniˇcen. Teorema 30 Neprazan, konveksan, kompaktan skup C ⊆ Rn ima bar jedan vrh. Dokaz... Kao jednu primjenu ove teoreme pokaˇzimo da linearna funkcija l : Rn → R, l(x) = hc, xi dostiˇze minimum i maksimum na kompaktnom, konveksnom skupu C u njegovom vrhu. Prije svega, postoji x∗ ∈ C takva da je minx∈C l(x) = l(x∗ ). Jasno, skup C ∗ = {x ∈ C : l(x) = l(x∗ } je konveksan i kompaktan, pa ima vrh x0 . Pokaˇzimo da je on vrh i skupa C. Ako nije, postoje razliˇcite taˇcke x1 , x2 iz C, od kojih bar jedna nije u C ∗ , takve da je 2x0 = x1 + x2 . Poˇsto {x1 , x2 } * C ∗ mora biti l(x1 ) + l(x2 ) > 2l(x0 ), a zbog linearnosti funkcije l to je nemogu´ce. ¤ Ova primjedba ima poseban znaˇcaj u linearnom programiranju. Mi ´cemo je iskoristiti za precizniji opis konveksnog omotaˇca. Naime, u izgradnji konveksnog omotaˇca kompaktnog, konveksnog skupa ne sudjeluju, u suˇstini, sve njegove taˇcke, nego samo vrhovi. U narednoj teoremi ext C oznaˇcava skup svih vrhova skupa C. Teorema 31 (Minkovski, 1911) Neka je C ⊂ Rn neprazan, konveksan, kompaktan skup. Tada C = co (ext C). Dokaz. Zbog konveksnosti skupa C vrijedi ext C ⊆ C ⇒ co ext C ⊆ C. Obratna inkluzija se dokazuje indukcijom, po dimenziji skupa. Za n = 1 jedini neprazni konveksni kompaktni skupovi su zatvoreni intervali [α, β], α 6 β, a za njih je [α, β] = co {α, β}. Za induktivni korak neka je dim C = n, a tvrdjenje taˇcno za sve konveksne kompaktne skupove manje dimenzije. Uzmimo x ∈ C i taˇcke x1 , x2 ∈ bd C takve da je x ∈ [x1 , x2 ]. Prema Teoremi 17 postoje potporne hiperravni H1 i H2 , za koje je x1 ∈ H1 ∩ C, x2 ∈ H2 ∩ C. Ti presjeci, npr. C1 i C2 , su u (n − 1)− dimenzionalnim hiperravnima, pa iz C1 ⊆ co ext C1 i C2 ⊆ co ext C2 , na osnovu ˇcinjenice da su vrhovi skupova C1 i C2 ujedno vrhovi i skupa C, slijedi x ∈ [x1 , x2 ] ⊆ co (C1 ∪ C2 ) ⊆ co (co ext C1 ∪ co ext C2 ) ⊆ co ext C. Zakljuˇcno, x ∈ C ⇒ x ∈ co ext C. ¤ 29 Primjedba 12 U proizvoljnim normiranim prostorima ne vrijedi ova teorema ve´c njena posljedica koju su dokazali Krejn i Milman, (1940), a glasi Za neprazan, konveksan, kompaktan skup vrijedi C = cl (co (ext C)). Ilustrujmo dokaz na inkluziji C ⊆ cl (co (ext C)). Pretpostavimo da ona nije taˇcna, tj. da postoji x0 ∈ C koji ne pripada skupu cl (co (ext C)). Ovaj skup je konveksan i zatvoren, pa je strogo razdvojen od x0 . Postoji a 6= 0 tako da za sve x ∈ ext C vrijedi ha, x0 i < ha, xi. Prema tome linearna funkcija data sa l(x) = ha, xi ne dostiˇze minimum u vrhu konveksnog kompaktnog skupa . ¤ Polarni skupovi Vidjeli smo kako se proizvoljnom nepraznom skupu S ⊆ Rn dodjeljuje konveksan skup (S 7→ co S). Drugi naˇcin sastoji se u sljede´cem... Neka je C konveksan, zatvoren skup u Rn u kome se nalazi 0. Tada je pomo´cu duˇzi [0, x] opisan taj skup: C = ∪x∈C [0, x]. Svakim vektorom x ∈ C odred¯ena je hiperravan H(x, 1). Presjek svih poluprostora H+ (x, 1) je neprazan (u njemu je bar 0), naziva se polaran skup skupa C i oznaˇcava sa C ◦ . Dakle, C o = ∩x∈C {y ∈ Rn : hy, xi 6 1}. (32) SLIKA 1, slika B Primjer 15 {0}◦ = Rn , {c}◦ = H+ (c, 1) Primjer 16 B ◦ = B Moˇzemo pisati C ◦ = {y ∈ Rn : hy, xi 6 1 ∀x ∈ C} = {y : SC (y) 6 1} = lev(SC , 1). Sada, za proizvoljan neprazan S ⊆ Rn polaran skup definiˇsemo sa S o = {y ∈ Rn : hy, xi 6 1 ∀x ∈ S}. Odmah vidimo da vrijedi S ⊆ T =⇒ T ◦ ⊆ S ◦ S ⊆ T ⇒ SS 6 ST , y ∈ T ◦ ⇒ ST (y) 6 1 ⇒ SS (y) 6 1 ⇒ y ∈ S ◦ . 1 rS ◦ = ( S)◦ , r > 0. r Specijalno, 1 B ◦ [0, r] = B[0, ]. r 30 (33) Iz definicije vidimo da je polarni skup konveksan, zatvoren i da mu pripada 0. Da bismo dali karakterizaciju skupova sa navedenim svojstvima definiˇsemo polarni skup polarnog skupa (tzv. bipolarni skup) S ◦◦ = (S ◦ )◦ = {x ∈ Rn : hx, yi 6 1 ∀y ∈ S ◦ }. Sada, zbog hx, yi 6 1, za sve x ∈ S i sve y ∈ S ◦ zakljuˇcujemo S ⊆ S ◦◦ . Obratno ne mora da bude uvijek, ali vrijedi sljede´ca jednakost, odakle je jasna veza izmed¯u skupova S i S ◦◦ . Teorema 32 Za svaki neprazan skup S ⊆ Rn vrijedi S ◦◦ = cl co (S ∪ {0}). Dokaz. Stavimo C = cl co (S ∪ {0}). U suˇstini, ve´c smo vidjeli da je C ⊆ S ◦◦ . Ako x0 ∈ / C, onda (Teorema separacije 20.) postoje a 6= 0 i realan broj α tako da je ha, xi > α > ha, x0 i, za sve x ∈ C. Kako je 0 ∈ C slijedi α < 0, pa stavljaju´ci da je a0 = αa imamo ha0 , xi < 1 za sve S ⊆ C i ha0 , x0 i > 1. To znaˇci da je a0 ∈ S ◦ i nije ha0 , x0 i 6 1, tako da x0 ne moˇze biti u S ◦◦ . Dakle, C = S ◦◦ . ¤ Posljedica 5 Skup S ⊆ Rn je zatvoren konveksan skup i 0 ∈ S ako i samo ako S ◦◦ = S Dokaz. Uz pretpostavke imamo S ◦◦ = cl co (S ∪ {0}) = cl co S = cl S = S. S druge strane ako je taˇcna jednakost skup preuzima svojstva odgovarajuˇceg bipolarnog skupa. ¤ Pojam polarnosti se moˇze iskoristiti i za karakterizaciju ograniˇcenosti nekih konveksnih skupova. Teorema 33 Neka je skup S zatvoren i neka mu pripada 0.Tada je je taj skup ograniˇcen ako i samo ako 0 ∈ int S ◦ . Dokaz. Prvo, neka je skup ograniˇcen. Postoji broj r > 0 takav da je S ⊆ rB, odakle je (rB)◦ ⊆ S ◦ , 1r B ⊆ S ◦ ˇsto znaˇci da je 0 ∈ int S ◦ . Na isti naˇcin se dokazuje da ako je 0 u unutraˇsnjosti nekog skupa, onda mu je polaran skup ograniˇcen. Sada imamo, zbog Posljedice 5., da 0 ∈ int S povlaˇci ograniˇcenost skupa (S ◦ )◦ = S. ¤ Sada ´cemo dati neke formule koje povezuju... Teorema 34 (C ∪ D)o = C o ∩ Do o o (C + D) = C ¢ D 31 o (34) (35) DOKAZ. Imamo iz C, D ⊆ C∪D da je (C∪D)◦ ⊆ C ◦ i (C∪D)◦ ⊆ D◦ , odakle je (C∪D)◦ ⊆ C ◦ ∩ D◦ . Neka je sada y ∈ C ◦ ∩ D◦ . Za sve c ∈ C, d ∈ D, λ ∈ [0, 1] vrijedi hy, (1 − λ)c + λdi 6 1. Prema (19) je y ∈ (C∪D)◦ . U drugoj formuli inkluzija ” ⊇ ” je trivijalna. Uzmimo da y ∈ / C ◦ ¢ D◦ i 1 ◦ 1 ◦ ◦ pokaˇzimo da y ∈ / (C + D) . Dakle, ako je y ∈ / 2 C ∩ 2 D , onda postoje (stroga separacija) vektori c0 , d0 6= 0 i pozitivni brojevi γ i δ takvi da za sve c ∈ C ◦ i sve d ∈ D◦ vrijedi hco , 2yi > γ, hc0 , ci 6 γ, hdo , 2yi > δ, hdo , di 6 δ. odavde je co γ ∈ C oo = C i sliˇcno h do δ ∈ D. No, sada imamo co do + , yi > 1, γ δ tako da y nije u skupu (C + D)◦ . ¤ Primjer 17 Polarni skup konveksnog konusa K je upravo njegov polarni konus (Primjer 10.) Zaista, K◦ = {y ∈ Rn : hy, xi 6 1 ∀x ∈ K}. S obziroma da za sve λ > 0 i x ∈ K imamo λx ∈ K, to za proizvoljan y ∈ K◦ vrijedi hy, xi 6 λ1 , odakle je hy, xi 6 0. K◦ ⊆ {y ∈ Rn : hy, xi 6 0 ∀x ∈ K}. Obratna inkluzija je oˇcigledna. Formula ... (K1 + K2 )∗ = K!∗ ∩ K2∗ (36) Primjer 18 Odredimo polaran konus konaˇcno generisanog konusa K = {Ax : x > 0} (Primjer 9.) : {Ax : x > 0}0 = {y : hy, Axi 6 0 ∀ x > 0} = {y : hA> y, xi 6 0 ∀x 6 0} = = {y : A> y 6 0}. Dakle, dobili smo homogen poliedar. Primjer 19 Naka je X matrica sa kolonama xi , i = 1, ..., m. Vrijedi (co{x1 , ..., xm })◦ = {y : y > X 6 1> }. Pk Pm Fakat, za svaki x = i=1 λi xi , i=1 λi = 1, λ1 > 0, ..., λm > 0, uslov hy, xi 6 1 je ispunjen ako i samo ako je hxi , yi 6 1, i = 1, ..., k Primjer 20 Polaran skup zbira politopa i konaˇcno generisanog konusa je poliedar. Dokaz. Prema (35) (co {x1 , ..., xm } + {Ax : x 6 0})◦ = ∪λ λ{y : y > X 6 1} ∩ (1 − λ){y : y > A 6 0} = = {y : y > A 6 0} ∩ (∪λ {y : y > X 6 λ1}) = {y : y > A 6 0} ∩ {y : y > X 6 1}) = = {y : y > (X|A) 6 (1, 0)> }). 32 Poliedri Ovdje ´cemo pokazati da ... dio toga smo mogli i ranije , no kako koristimo i polarnost to je na jednom mjestu. Teorema 35 Ograniˇcen poliedar je politop. Dokaz. Svaki poliedar je zatvoren (primjer 5.) pa je u naˇsem sluˇcaju ,zbog ograniˇcenosti, kompaktan. Prema teoremi Minkovskog on je konveksni omotaˇc svojih vrhova, a taj skup je konaˇcan (Posljedica 3). Dakle, ograniˇcen poliedar je politop. ¤ Teorema 36 (Minkovski) Homogeni poliedar je konaˇcno generisan konus. Dokaz. Presjek homogenog poliedra K i jediniˇcne kugle B1 je ograniˇcen poliedar, pa je prema ve´c dokazanom politop, tj. oblika je co (x1 , ..., xk ), x1 , ...xk ∈ K. Konaˇcno generisani konus cone (x1 , ..., xk ) je K. Zaista, neka je x ∈ K. Jasno, Pk Pk postoji λ > 0 takav da λx ∈ co (x1 , ..., xk ). Sada, iz λx = i=1 λi xi , i=1 λi = Pk λi i 1, λ1 > 0, ..., λk > 0, slijedi da je x = i=1 λ x ∈ cone (x1 , ..., xk ). Obratno je oˇcigledno. ¤ Teorema 37 Poliedar je zbir politopa i konaˇcno generisanog konusa. Dokaz. Sistemu Ax 6 b, kojim je odred¯en poliedar, dodijelimo sistem nejednaˇcina Ax 6 ξb, ξ > 0. Jasno, µ 0 n x ∈ {x ∈ R : Ax 6 b} ⇔ x0 1 ¶ ½µ ∈ x ξ ¶ µ A : 0 −b −1 ¶µ x ξ ¶ ¾ 60 . Drugi skup je homogeni poliedar u Rn+1 , pa je prema teoremi Minkovskog x1 xm jednak nekom cone {( ), ..., ( )}. ξ1 ξm Neka su ξ1 > 0, ..., ξk > 0, a ostali ξi = 0. Sada ovaj konaˇcno generisani konus je v1 vm vk v k+1 cone {( ), ..., ( ), ( ), ..., ( )}, gdje je v i = ξ1i xi za ξi > 0, dok 1 0 1 0 i je v i = Prema tome, x0 pripada poliedru ako Pk i samo ako Pxk za ostalePindekse. m x0 = i=1 λi v i + i=k+1 λi v i , pri ˇcemu je λ1 > 0, ..., λm > 0, i=1 λi = 1, a odavde slijedi tvrd¯enje. ¤ Dokaza´cemo da vrijede i obrati ovih teorema i time dati reprezentaciju poliedara. Teorema 38 Zbir politopa i konaˇcno generisanog konusa je poliedar. Dokaz. Neka je posmatrani zbir P + K. Tada je (P + K)◦ poliedar, prema Primjeru 19., a prema Teoremi 33. to je zbir politopa i KGK, tako da je i (P + K)◦◦ poliedar. Ako pretpostavimo da 0 ∈ P + K, tada je zbog zatvorenosti 33 (...) i konveksnosti zbira (P +K)◦◦ = P +K (posljedica 5.). Ukoliko 0 ne pripada zbiru, onda za proizvoljnu njegovu taˇcku x0 je 0 ∈ P − x0 + K. S obzirom da je i P − x0 politop dobili smo poliedar, na primjer {x : Ax 6 b}, tako da je P + K = {x : Ax 6 b + Ax0 }. ¤ Teorema 39 (Vejl) Konaˇcno generisan konus je homogen poliedar. Dokaz. cone {...} = (cone {...})◦◦ = (hompol)◦ = (kgk)◦ = hompol Teorema 40 Politop je ograniˇceni poliedar. Dokaz. Prema Teoremi 34., politop P = P+ cone {0} je poliedar, a poˇsto je kompakatan on je ograniˇcen poliedar. ¤ 34 KONVEKSNE FUNKCIJE .... 1. Definicija, vrste i osnovni primjeri Definicija 5 Funkcija f je konveksna ako je epi f konveksan skup. Funkcija je konveksna na konveksonm skupu C ⊆ Df ako je njena restrikcija na C konveksna funkcija. Neka je f realna funkcija definisana na skupu D(f ) ⊆ Rn , i C ⊆ D(f ) neprazan, konveksan skup. Teorema 41 Funkcija f je konveksna na C ako i samo ako za sve x1 , x2 ∈ C i svaki λ ∈ [0, 1] vrijedi ¡ ¢ f (1 − λ)x1 + λx2 6 (1 − λ)f (x1 ) + λf (x2 ). (37) Dokaz. Neka su x1 , x2 ∈ µC i neka¶je µodgovaraju´ ¶ ci nadgraf konveksan skup. x1 x2 Poˇsto mu pripadaju taˇcke , , onda za sve λ ∈ [0, 1] mora f (x1 ) f (x2 ) da bude µ ¶ µ ¶ µ ¶ x1 x2 (1 − λ)x1 + λx2 (1 − λ) +λ = ∈ epi f, f (x1 ) f (x2 ) (1 − λ)f (x1 ) + λf (x2 ) a ovo znaˇci daµvrijedi¶nejednakost µ 2 ¶ (37). x1 x Uzmimo sada , ∈ epi (f |C ), λ ∈ [0, 1]. Kako je C konveksan i α1 α2 f ((1 − λ)x1 + λx2 )) 6 (1 − λ)f (x1 ) + λf (x2 ) 6 (1 − λ)α1 + λα2 , µ ¶ (1 − λ)x1 + λx2 slijedi da je ∈ epi (f |C ), te je ovaj skup konveksan. ¤ (1 − λ)α1 + λα2 Ako je u nejednakosti (37) znak < umjesto 6, za sve x1 6= x2 i svaki λ ∈]0, 1[, kaˇzemo da je f strogo konveksna funkcija. Funkcija f je konkavna ako je -f konveksna, tj. ako umjesto (37) vrijedi ¡ ¢ f (1 − λ)x1 + λx2 > (1 − λ)f (x1 ) + λf (x2 ). Primjer 21 Afina funkcija a(x) = ha, xi + α je konveksna na C = Rn . Njen nadgraf je poluprostor Ona je i konkavna na tom skupu. Afine funkcije su jedine koje su konveksne i konkavne. Primjer 22 Ako je nadgraf funkcije h : Rn → R konveksan konus, ona je konveksna i pozitivno homogena, ˇsto je, prema (12) i (13), ekvivalentno sa h(x + y) 6 h(x) + h(y), h(αx) 6 αh(x) 35 ∀x, y ∈ Rn , α > 0. Odmah vidimio da je h(0) = 0, zbog h(0) = h(0 + 0) 6 h(0) + h(0) i h(0) 6 0. Uoˇcimo joˇs da je za α > 0 h(x) = h(α α1 x) 6 α1 h(αx), tj. αh(x) 6 h(αx), pa vrijedi jednakost h(αx) = αh(x), za sve x ∈ Rn , α > 0. Isto tako lako se dobije da je h(−x) = −h(x) i h( m X αi xi ) 6 i=1 m X αi h(hi ). i=1 Sljede´ca dva su primjeri pozitivno homogenih konveksnih funkcija. Primjer 23 (Funkcija Minkovskog) Neka je 0 ∈ C. Tada je domen funkcije MC (x) = inf {α > 0 : x ∈ αC} (38) S αC, a ako je 0 unutraˇsnja taˇcka skupa C onda je efektivni domen ˇcitav ˇ R . Funkcija Minkovskog je konveksna pozitivno homogena funkcija. Staviˇ se, vrijedi jednakost M (αx) = αM (x) za sve x i α > 0. Jasno M (0x) = M (0) = 0 = 0M (x), a za α > 0 imamo α>0 n M (αx) = inf {β > 0 : αx ∈ βC} = α inf { β β : x ∈ ∈ C} = αM (x). α α Joˇs je, zbog 0 ∈ int C, x ∈ (M (x) + ε)C i y ∈ (M (y) + ε)C, za sve ε > 0. slijedi x + y ∈ (M (x) + M (y) + 2ε)C, odakle je M (x + y) 6 M (x) + M (y) + 2ε. Dakle M (x + y) 6 M (x) + M (y). Primjer 24 Ako u prethodnom primjeru uzmemo da je C jediniˇcna kugla B dobijamo da je euklidska norma x 7→ kxk konveksna na Rn , s obzirom da je kxk = MB (x). Ovo slijedi i direktno iz svojstava norme i teoreme 40. Med¯utim, ako je int C = 6 ∅, x1 ∈ int C, x2 = (1 + t)x1 (t malo, dovoljno da bude x2 ∈ C) 1 i λ = 2 , onda (37) postaje jednakost. Dakle, norma nije strogo konveksna na C sa nepraznom unutraˇsnoˇs´cu. Primjer 25 Poˇsto vrijedi k(1 − λ)x1 + λx2 k2 = (1 − λ)kx1 k2 + λkx2 k2 − (1 − λ)λkx1 − x2 k2 vidimo da je f (x) = kxk2 strogo konveksna na Rn . U konveksne spadaju jako konveksne funkcije, za koje vaˇzi jaˇca nejednakost od (37): ¡ ¢ f (1 − λ)x1 + λx2 6 (1 − λ)f (x1 ) + λf (x2 ) − λ(1 − λ)αkx1 − x2 k2 , za neki α > 0 i sve x1 , x2 ∈ C, λ ∈ [0, 1]. Jasno, svaka jako konveksna funkcija je i strogo konveksna. Na osnovu jednakosti iz primjera vidi se da je funkcija f jako konveksna ako i samo ako je f − αk k2 konveksna, za neki α > 0. Samim tim x 7→ kxk2 je jako konveksna sa α = 1. 36 Primjer 26 Kvadratna forma q(x) = hCx, xi + hc, xi je konveksna na svakom C ⊆ Rn , ako i samo ako je simetriˇcna matrica C pozitivno semidefinitna. Ovo slijedi iz (1 − λ)q(x1 ) + λq(x2 ) − q((1 − λ)x1 + λx2 ) = λ(1 − λ)hC(x1 − x2 ), x1 − x2 i. Kvadratna forma je jako konveksna ako i samo ako je C pozitivno definitna. Za α moˇzemo uzeti njenu najmanju sopstvenu vrijednost. 2. Osnovna svojstva, neke nejednakosti Teorema 42 Funkcija f je konveksna na C ⊆ Rn ako i samo ako je funkcija ¡ ¢ ϕ(λ) = f x1 + λ(x2 − x1 ) konveksna na intervalu [0, 1], za sve x1 , x2 ∈ C. Drugim rijeˇcima f je konveksna na C ⊆ Rn ako i samo ako je konveksna njena restrikcija na svakoj duˇzi iz C. Jasno, f je konkavna ako i samo ako je hypo f konveksan skup. Poˇsto je lev(f, α) ortogonalna projekcija na Rn skupa ¡ ¢ epi f ∩ H en+1 , α , imamo da je za konveksnu funkciju f svaki nivoski skup (ukljuˇcuju´ci ∅) konveksan. I na osnovu nejednakosti (37) dokaz je trivijalan. Jensenova nejednakost A-G nejednakostJensenova nejednakost A-G nejednakost Teorema 43 Neka je funkcija f konveksna na C. Tada, za svaki m ∈ N i sve x1 , ..., xm ∈ C, λ1 > 0, ..., λm > 0, takve da je λ1 + · · · + λm = 1, vrijedi f (λ1 x1 + · · · + λm xm ) 6 λ1 f (x1 ) + · · · + λm f (xm ). (39) Dokaz. Neka su m ∈ N i x1 , ..., xm ∈ C proizvoljni. Tada, zbog konveksnoti x1 xm nadgrafa i formule (15) vrijedi co {( )} ⊆ epi (f |C ), za sve 1 ), ..., ( f (x ) f (xm ) nenegativne λ1 , ..., λm ˇciji zbir je 1. To znaˇci da je µ ¶ λ1 x1 + ... + λm xm ∈ epi (f |C ), λ1 f (x1 ) + ... + λm f (xm ) odnosno (33). ¤ Primjer 27 Funkcija jedne promjenljive f (x) = −P ln x je konveksna Pn na ]0, +∞[. n Jensenova nejednakost u ovom sluˇcaju glasi − ln i=1 λi xi 6 i=1 −λi ln xi . Ova nejednakost, zapisana u obliku n Y i=1 xλi i 6 n X i=1 37 λi x i , (40) Pn za sve x1 , ..., xn > 0, λ1 , ..., λn > 0, ¯u i=1 λi = 1 naziva se nejednakost izmed aritmetiˇcke i geometrijske sredine. Uzimaju´ci da su svi brojevi λi = n1 , imamo √ n x1 + ... + xn . n x1 ...xn 6 Primjer 28 (Helder) Polaze´ci od toga da je eksponencijalna funkcija konveksna, za pozitivne brojeve ξ i η i brojeve p > 1, q > 1 takve da je p1 + 1q = 1 dobija se, iz Jensenove nejednakosti za m = 2, nejednakost 1 ξη 6 e p ln ξ p + q1 ln η q odnosno ξη 6 6 1 ln ξp 1 ln ηq e + e , p q ξp ηq + . p q xi 1 i η P p p ( n i=1 xi ) 1 1 1 6 p + q = q i=1 yi )) Stavljaju´ci, za sve i = 1, ..., n, ξ = Pn i dobijamo i=1 Pn p x1i yP q n ( i=1 xi ) p ( (41) = yi 1 P q q ( n i=1 yi ) , nakon sumiranja 1, tj. hx, yi 6 kxkp kykq . 3. Prirodna svojstva konveksnih funkcija Konveksne funkcije imaju vaˇzno svojstvo da su neprekidne na otvorenom skupu. Preciznije, vrijedi Teorema 44 Neka je C ⊆ Rn konveksan skup sa nepraznim interiorom i neka je f : C → R konveksna funkcija. Tada je f neprekidna na int C. Dokaz. Neka je g(x) = f (x + x0 ) − f (x0 ), x0 ∈ int C. Tada je g konveksna i g(0) = 0. Treba dokazati da je g neprekidna u 0. Prije svega postoji t > 0 takav da je zatvorena kugla tB1 ⊆ C − {x0 }, i g je ograniˇcena na toj kugli. Ograniˇcenost slijedi iz Teoreme 27 (Minkovskog) i Jensenove nejednakosti. Neka je sada ε ∈]0, 1[. Za sve x ∈ εtB1 vrijedi µ µ ¶¶ µ ¶ 1 1 g(x) = g (1 − ε)0 + ε x 6 (1 − ε)g(0) + εg x 6 εM. ε ε Isto tako, iz zapisa 1 ε 0= x+ 1+ε 1+ε µ ¶ 1 − x , ε dobijamo g(x) > −εM. Dakle, za svaki ε > 0 postoji δ > 0 takav da za sve x ∈ δB1 vrijedi |g(x) − g(0)| 6 εM. ¤ Situacija se mijenja ako se neprekidnost posmatra na ˇcitavom C, koji nije otvoren skup. 38 ½ 1, x = 0 je konveksna, ali u 0 0, x > 0 nije neprekidna, ˇcak ni poluneprekidna odozdo. Uoˇcimo da je njen nivoski skup lev( 12 ) =]0, +∞[ otvoren. Primjer 29 f data na [0, 1] sa f (x) = Postoje odozdo poluneprekidne konveksne funkcije koje nisu neprekidne. x2 x1 > 0 x1 + 2 , Primjer 30 f (x1 , x2 ) = x1 0, (x1 , x2 ) = (0, 0) je konveksna (nejednakost (37) pri x1 = (ξ1 , η1 ) x2 = (ξ2 , η2 ) svodi se na 0 6 (ξ1 η2 − ξ2 η1 )2 ), poluneprekidna odozdo ( nivoski skupovi su zatvoreni: ∅, {0} i B[( α2 , 0), α2 ]), ali nije neprekidna u 0, zbog f ( n12 , n1 ) 9 f (0, 0). Drugo vaˇzno svojstvo je postojanje izvoda po pravcima. Neka su v 1 , v 2 dopustivi pravci skupa C u taˇcki x0 . Postoje pozitivni brojevi t1 i t2 takvi da za i = 1, 2 vrijedi x0 + tv i ∈ C, ∀t ∈]0, ti [. Sada, za sve pozitivne t manje od 2 min{t1 , t2 } imamo x0 + t(v 1 + v 2 ) = ¢ 1¡ 0 ¢ 1 1¡ 0 1 x + tv 1 + x + tv 2 ∈ C + C = C, 2 2 2 2 tako da je i v 1 +v 2 dopustiv pravac. Jasno, za svaki dopustivi pravac v i sve α > 0 pravac αv je dopustiv. Ukljuˇcuju´ci ovdje i nula vektor dobijamo konveksan konus V(x0 , C). Konveksnost ne garantuje postojanje parcijalnih izvoda, ˇsto vidimo ve´c na primjeru euklidske norme. Med¯utim, ako postoje parcijalni izvodi oni su neprekidni. (Zadatak ...) Mi ´cemo ustanoviti da konveksna funkcija f u unutraˇsnjoj taˇcki x0 domena, u svakom pravcu v, ima (jednostrani) izvod : ¡ ¢ f x0 + tv − f (x0 ) 0 0 f (x ; v) = lim x→0+ t Naime, postoji ε > 0 takav da je x0 +tv ∈ C za sve |t| 6 ε. Funkcija g :]0, ε] → R, g(t) = f (x0 + tv) − f (x0 ) t je neopadaju´ca, jer za 0 < t1 < t2 6 ε nejednakost g(t1 ) 6 g(t2 ) glasi ¶ µ ¢ t1 ¡ t1 f (x0 ) + f x0 + t2 v , f (x0 + t1 v) 6 1 − t2 t2 a ova vrijedi zbog konveksnosti funkcije f . Slijedi da postoji lim g(t), koji je x→0+ konaˇcan, budu´ci da je g(t0 ) 6 g(t) za sve t ∈]0, ε[ i fiksiran t0 ∈] − ε, 0[. Dakle, f 0 (x0 ; v) = lim g(t) = inf g(t). x→0+ 39 0<t6ε Specijalno, za svaki x ∈ C vektor v = x − x0 je dopustiv pravac, pri ˇcemu je ε = 1. Sada iz prethodne formule dobijamo f 0 (x0 ; x − x0 ) = inf g(t) 6 g(1), 0<t61 odnosno vaˇznu nejednakost f 0 (x0 ; x − x0 ) 6 f (x) − f (x0 ). (42) Neka je f konveksna na otvorenom C. Tada je funkcija v 7→ f 0 (x0 ; v) konveksna, pozitivno homogena na Rn i vaˇzi jednakost f 0 (x0 ; −v) = −f 0 (x0 ; v). (f1 + f2 )0 (x; v) = f10 (x; v) + f20 (x; v) (f1 ∨ f2 )0 (x; v) = max (f10 (x; v), f20 (x; v)) (43) 4. Operacije koje ˇ cuvaju konveksnost, primjeri 1. Prije svega zbir dvije konveksne funkcije je konveksna funkcija. Proizvod konveksne funkcije nenegativnim realnim brojem je, opet, konveksna funkcija. Ovo se jednostavno dokazuje pa ´cemo samo navesti tvd¯enje. Prije toga recimo da je za konveksnu funkciju f funkcija −f konveksna jedino u sluˇcaju da je funkcija afina. Ovo znaˇci da skup svih konveksnih funkcija (na istom C) nije potprostor, ali jeste konus, u prostoru realnih funcija. Teorema 45 Neka su f1 , ..., fm konveksne na C ⊆ Rn , i α1 , ..., αm nenegativni realni brojevi. Tada je f = α1 f1 + · · · + αm fm konveksna funkcija na C. Primjer 31 (Lagranˇ zova funkcija) U vezi sa problemom konveksne optimizacije posmatra se Lagranˇzova funkcija definisana sa L(x, u) = f (x) + hu, g(x)i na C × Rm cemu je g = (g1 , ..., gm ). Prema prethodnoj teoremi x 7→ L(x, u) je + , pri ˇ konveksna na C, za svaki fiksiran u > 0. u 7→ ϕ(u) = inf L(x, u) je konkavna x∈C na Rm +. 2. Kompozicija dvije konveksne funkcije je konveksna, ali uz dodatne uslove ... Na osnovu definicije konveksne funkcije, pomo´cu operacija sa konveksnim skupovima dobi´cemo nove konveksne funkcije. To nam omogu´cuje Teorema 46 Neka je C ⊆ Rn+1 konveksan skup. Funkcija f, ½ µ ¶ ¾ x f (x) = inf ξ ∈ R : ∈C ξ je konveksna na skupu D ⊆ Rn taˇcaka x u kojima je infimum konaˇcan. 40 (44) Dokaz. Prvo, skup D = {x : C ∩ ({x} × R)je ogranicen odozdo} je konveksan. Neka je ε > 0 po volji. Postoje (x1 , ξ1 )> , (x2 , ξ2 )> , x1 , x2 ∈ D takvi da vrijedi f (x1 ) 6 ξ1 < f (x1 ) + 2ε , i f (x2 ) 6 ξ2 < f (x2 ) + 2ε . Zbog konveksnosti skupa C je (λ1 x1 + λ2 x2 , λ1 ξ1 + λ2 ξ2 ) ∈ C, odakle je f (λ1 x1 + λ2 x2 , λ1 ) 6 λ1 ξ1 + λ2 ξ2 6 λ1 f (x1 ) + λ2 f (x2 ) + ε. ¤ Primjedba 13 Jedan uslov da je infimum konaˇcan je da postoji nevertikalna hiperravan u Rn+1 , H((a, −1)> , α), takva da je C ⊆ H− . Tada je ξ > ha, xi − α, za fiksiran x i sve ξ uz (x, ξ) ∈ C. 3. Supremum (maksimum) konveksnih funkcija. Vaˇzan primjer ovkve funkcije je x 7→ |x| = max {−x, x}. Njen nadgraf je konus dobijen u presjeku dva poluprostora. Za bilo koje dvije konveksne funkcije f1 i f2 definisane na C ⊆ Rn skup epi f1 ∩ epi f2 je konveksan skup u Rn+1 . Jasno, to je nadgraf funkcije C 3 x 7→ max {f1 (x), f2 (x)}, koja je konveksna prema prethodnoj teoremi. Oznaˇcavamo je sa f1 ∨f2 . Ovo vrijedi za funkciju f datu sa f (x) = maxi=1,...,m fi (x), x ∈ C, kao i za proizvoljno konveksnih funkcija, zahvaljuju´ci tome ˇsto je presjek mnogo proizvoljno konveksnih skupova konveksan skup. To se moˇze dokazati i direktno. Teorema 47 Neka je C ⊆ Rn konveksan, S ⊆ Rm i neka je funkcija F : C×S → R konveksna na C za svaki y ∈ S i ograniˇcena na S za svaki x ∈ C. Tada je na skupu C konveksna funkcija f data sa f (x) = sup F (x, y). y∈S Dokaz. Primjer 32 (supremum afinih minoranti) Uskladu sa Primjedbom 13. prirodno je vidjeti ˇsta se moˇze odrediti pomo´cu skupa svih afinih minoranti date funkcije f . Jasno, taj skup moˇzemo identifikovati sa Af = {(a, α) ∈ Rn × R : ha, xi − α 6 f (x) ∀x ∈ C}. Sada formalno moˇzemo definisati funkciju f na sljede´ci naˇcin: f (x) = sup (ha, xi − α). (45) (a,α)∈Af Naravno, za proizvoljnu funkciju skup afinih minoranti Af moˇze biti prazan, kao ˇsto se vidi na primjeru funkcije x 7→ x3 , x ∈ R. Ako je taj skup neprazan, prema prethodnoj teoremi, dobijamo konveksnu funkciju. Pokaˇzimo joˇs da ako je f konveksna funkcija na C onda je Af neprazan. Zaista, uzmimo prvo da je int C ©= 6 ∅ i da mu pripada x0 . ª Skup (x, xn+1 )> : x ∈ int C, xn+1 > f (x) je konveksan, otvoren (f je neprekidna na int C) i ne pripada mu (x0 , f (x0 )> . Postoje (Posljedica 4) (a, α) 6= 0 i β, 41 ® takvi da za sve x ∈ int C vrijedi a, x0 + αf (x0 ) 6 β < ha, xi + αxn+1 . Za x = x0 i xn+1 = ®f (x0 ) + 1 dobijamo α > 0, a za xn+1 = f (x) + ε (ε → 0+) β je a(x) = − αa , x + α 6 f (x) ∀x ∈ int C. Jasno, a(x0 ) = f (x0 ), pa za os0 0 0 (x) tale taˇcke iz C, zbog [x0 , x[ ⊆ int C imamo a( x 2+x ) 6 f ( x 2+x ) 6 f (x )+f , 2 0 x +x 0 2a( 2 ) − a(x ) 6 f (x), a(x) 6 f (x). Dakle, za sve x ∈ C vrijedi a(x) 6 f (x), odnosno H((a, α)> , αf (x0 ) + ha, x0 i) sadrˇzi taˇcku (x0 , f (x0 ))> , a nalazi se ispod nadgrafika epi f . U sluˇcaju da je x0 rubna taˇcka domena opet postoji potporna hiperravan nadgrafika, u (x0 , f (x0 )> ), ali moˇze biti okomita na Rn (Primjer .., x0 = 0, H = H(e1 , 0)). Ovdje, ako je epi f zatvoren i konveksan, a x0 rubna taˇcka zatvorenog C, onda nakon strogog razdvajanja skupova epi f i {(x0 , ξ)> }, ξ < f (x0 ), dobijamo afinu minorantu datu sa a(x) = h− αa , x − x0 i + ξ, za koju vrijedi a(x) 6 f (x), za sve x ∈ C, i a(x0 ) = ξ. Qn i Primjer 33 (Kob-Daglasova funkcija) Funkcija f (x) = − i=1 xα koni n n−1 veksna je na R+ za svaki (α , ..., α ) ∈ σ . 1 n Qn Pn Stavimo da je S = {y : i=1 yiαi = 1}, i F (x, y) = − i=1 αi xi yi , za x > 0, y ∈ S. Pomo´cu A-G nejednakosti dobijamo f (x) = − n Y (xi yi )αi > − i=1 n X αi xi yi = sup F (x, y). y∈S i=1 S jedne strane svaka od funkcija x 7→ F (x, y), y ∈ S je konveksna (linearna), a supremum se dostiˇze na kompaktnom S, (npr. u taˇcki (− fx(x) , ..., − fx(x) )> ). 1 n Dakle, prema prethodnoj teoremi funkcija f je konveksna. Primjer 34 (potporna funkcija skupa) Ako skup C ograniˇcen onda je sa SC (x) = sup hx, yi y∈C definisana na Rn funkcija, koja je oˇcigledno konveksna i pozitivno homogena (SC (αx) = αSC (x), α > 0). Uzmimo da je x0 6= 0 taˇcka iz Rn . Tada za konveksan C postoje dvije potporne hiperravni H(x0 , α) i H(x0 , β). Za α 6 β vrijedi hx0 , xi 6 β za sve x ∈ C, te je SC (x0 ) = β, pa je H(x0 , SC (x0 )) jedna potporna hiperravan skupa C, normalna na vektor x0 6= 0. Druga takva hiperravan je H(−x0 , SC (−x0 )), zbog α = inf hx0 , xi = − sup h−x0 , xi = −SC (−x0 ). Odavde x∈C x∈C je i izvedeno ime za ovu funkciju. Primjer 35 (konjugovana funkcija) Svakoj funkciji f : D(f ) → R dodjeljuje se konjugovana funkcija f ∗ : D(f ∗ ) → R, f ∗ (y) = sup (hy, xi − f (x)), (46) x∈D(f ) gdje je D(f ∗ ) skup taˇcaka za koje je supremum konaˇcan. Svaka konjugovana funkcija je konveksna. 42 4. Infimum konveksnih funkcija ¡ ®¢ ϕ(λ1 u1 + λ2 u2 ) = inf f (x) + λ1 u1 + λ2 u2 , g(x) = x ¢ λ1 f (x) + λ1 hu1 , g(x)i + λ2 f (x) + λ2 hu2 , g(x)i > ¡ ¢ ¡ ¢ > λ1 inf f (x) + hu1 , g(x)i + λ2 inf f (x) + hu2 , g(x)i = = inf ¡ x x x = λ1 ϕ(u1 ) + λ2 ϕ(u2 ), za sve λ1 , λ2 > 0, λ1 + λ2 = 1. Primjer 36 (zatvorenje) Funkcija cl f, zvana zatvorenje funkcije f definiˇse se sa epi(cl f ) := cl(epi f ). Kaˇzemo da je neka funkcija zatvorena ako je jednaka svom zatvorenju, tj. f = cl f. Prema teoremi 2. f je zatvorena na zatvorenom skupu ako i samo ako je odozdo poluneprekidna funkcija. Ako je f konveksna onda je i cl f konveksna funkcija (Teorema 6.) Ovim vaˇznim funkcijama posveti´cemo viˇse paˇznje kasnije i izmed¯u ostalog pokaza´cemo, u konveksnom sluˇcaju, da je zatvorenje supremum afinih minoranti date funkcije. 5.Infimalna konvolucija Neka su f1 i f2 konveksne funkcije na Rn , sa zajedniˇckom afinom minorantom. Odredimo funkciju f1 ⊕ f2 primjenjuju´ci teoremu ... na zbir nadgrafa datih funkcija. Dakle, pod¯imo od problema minimizacije ½ µ ¶ ¾ x inf α : ∈ epi f1 + epi f2 = α © ª inf α1 + α2 : α1 > f1 (x1 ), α2 > f1 (x1 ), x = x1 + x2 . Nakon eliminacije α1 i α2 imamo (f1 ⊕ f2 )(x) = inf x=x1 +x2 ¡ ¢ f1 (x1 ) + f2 (x2 ) , (47) a moˇzemo pisati i (f1 ⊕ f2 )(x) = infn (f1 (y) + f2 (x − y)). y∈R Prema konstrukciji je epi (f1 )+epi (f2 ) ⊆ epi (f1 ⊕f2 ). Za (x, α)> ∈ epi (f1 ⊕f2 ), gdje je α > 0, postoje v i ε > 0 takvi da je f1 (v) + f2 (x − v) + ε = α i ¶ µ ¶ µ ¶ µ x−v x v + ∈ epi f1 + epi f2 . = f2 (x − v) + 2ε α f1 (v) + 2ε Vidimo da vrijedi {(x, α) : (f1 ⊕ f2 )(x) < α} ⊆ epi f1 + epi f2 ⊆ {(x, α) : (f1 ⊕ f2 )(x) 6 α}, a dalje ne´ce mo´ci: 43 Primjer 37 f1 (x) = ex , f2 (x) = 0, (f1 ⊕ f2 )(x) = 0, ... 5. Konveksni omota´c minimuma Ovdje ´cemo, prvo, proizvoljnoj funkciji f dodijeliti blisku joj konveksnu funkciju, uzimaju´ci u Teoremi 41, da je C = co epi f . Opet pretpostavljamo da f ima afinu minorantu ... Imamo ½ µ ¶ ¾ x co f := inf α : ∈ co epi f . (48) α SLIKA Na ovaj naˇcin moˇze se definisati operacija sa konveksnim funkcijama f1 co∨ f2 = co (f1 ∨ f2 ). Mi ´cemo kra´ce pisati f1 M f2 za ovu operaciju. Pk Neka je x = i=1 λi xi , konveksna kombinacija taˇcaka iz domena funkcije f . Pk Pk Tada je (xi , f (xi )) ∈ epi f , i i=1 λi (xi , f (xi )) = (x, i=1 λi f (xi )) ∈ co epi f , k X zbog epi f ⊆ co epi f . Sada je co f (x) 6 λi f (xi ), po definiciji, i na kraju i=1 co f (x) 6 inf ( k X i i λi f (x ) : k ∈ N, x ∈ D(f ), λ ∈ σ k−1 ,x = i=1 k X ) i λi x , . (49) i=1 Neka su sada x i ε > 0 proizvoljni. Postoji α takav da je (x, α) ∈ co epi f i Pk Pk α < co f (x) + ε. Znaˇci da je x = i=1 λi xi , f (xi ) 6 αi , i=1 λi αi = α, za odgovaraju´ce taˇcke xi i brojeve αi , λi . Slijedi k X i λi f (x ) 6 i=1 k X λi αi = α < co f (x) + ε, i=1 pa izlazi da u (41) stoji znak jednakosti. Zbog (17) (f1 M f2 )(x) = (f1 M f2 )(x) = inf x=(1−λ)u+λv,λ∈[0,1] ((1 − λ)f (u) + λf (v)) inf ((1 − λ)f (u) + λf (v)). x = (1 − λ)u + λv λ ∈ [0, 1] (50) (51) pojam konveksnih vektorskih funkcija. Za funkciju g : Rn → Rm , g = (g1 , ..., gm ) kaˇzemo da je konveksna vektorska funkcija, ako su sve komponentne funkcije gi konveksne. U tom sluˇcaju prirodno, nivoski skup {x ∈ Rn : g(x) 6 a}, a = (a1 , ..., am ) je presjek nivoskih skupova lev(gi , ai ). Poluneprekidnost i zatvorenost 44 U konveksnoj optimizaciji je vaˇzan pojam poluneprekidnosti odozdo. Opisa´cemo takve funkacije pomo´cu afinih minoranti, a koriste´ci i pojam zatvorenja funkcije. Teorema 48 Ako je funkcija f konveksna na zatvorenom konveksnom skupu C onda vrijedi cl f (x) = sup (ha, xi − α). (52) (a,α)∈Af Dokaz. Oznaˇcili sa f funkciju datu supremumom afinih minoranti funkcije f . Kako je cl epi f ⊆ epi f uvijek vrijedi f 6 cl f . Neka je cl f (x0 ) > f (x0 ), 0 0 za neki x0 ∈ C. Tada je i cl f (x0 ) > ξ = cl f (x 2)+f (x ) . Poˇsto je epi cl f zatvoren skup, imamo da postoji afina minoranta a funkcije cl f takva da je 0 0 a(x0 ) = cl f (x 2)+f (x ) . Med¯utim, to je afina minoranta i funkcije f , pa zbog f (x0 ) > a(x0 ) mora da je f (x0 ) > cl f (x0 ), ˇsto je suprotno pretpostavci. ¤ Posljedica 6 Funkcija f je konveksna i odozdo poluneprekidna na konveksnom skupu C ako i samo ako je supremum svojih afinih minoranti zatvorena. DOKAZ. Neka je vrijedi formula f (x) = sup(a,α)∈Af (ha, xi − α) Prema teoremi 47 i primjeru 21 f je konveksna. Pokaˇzimo da je i poluneprekidna odozdo. Za to je dovoljna zatvorenost nivoskih skupova (Teorema 2). Neka je xk ∈ lev (f, α) i xk → x0 . Skup C je zatvoren tako da je x0 ∈ C. Dalje, imamo redom, za sve prirodne brojeve k f (xk ) = f (xk ) 6 α, sup a(xk ) 6 α, a(xk ) 6 α. a∈Af Slijedi a(x0 ) 6 α, i x0 ∈ lev (f, α). Obratno, poluneprekidna odozdo funkcija je zatvorena, pa se u (53) piˇse f umjesto cl f . ¤ Konveksnost diferencijabilnih funkcija Sljede´ce dvije teoreme sadrˇze kriterijume konveksnosti diferencijabilnih funkcija. Uzimaju´ci u prethodnoj nejednakosti da je x = x2 i x1 umjesto x0 dobijamo ˇ (53). Staviˇ se uslov x1 ∈ int C je suviˇsan. Teorema 49 Nejednakosti ® f (x2 ) > f (x1 ) + ∇f (x1 ), x2 − x1 , 1 ∇f (x2 ) − ∇f (x1 ), x2 − x ® 1 >0 (53) (54) 2 vrijede, za sve x , x ∈ C, ako i samo ako je f je konveksna na C. Dokaz. Neka je f diferencijabilna konveksna funkcija, x1 , x2 ∈ C i λ ∈]0, 1]. 1 2 1 ))−f (x1 ) Tada iz (37) dobijamo f (x +λ(x −x 6 f (x2 ), odakle pri λ → 0+ izlazi λ (53). U drugom smjeru imamo ® f (x1 ) − f ((1 − λ)x1 + λx2 )) > ∇f ((1 − λ)x1 + λx2 ), λ(x1 − x2 ) , 45 f (x2 ) − f ((1 − λ)x1 + λx2 )) > h∇f ((1 − λ)x1 + λx2 ), (1 − λ)(x2 − x1 )i, pa mnoˇzenjem prve nejednakosti sa 1 − λ, a druge sa λ i sabiranjem izlazi definiciona nejednakost (37). Sabiranjem odgovaraju´cih strana nejednakosti (53) i nejednakosti h∇f (x2 ), x1 − x2 i 6 f (x1 ) − f (x2 ) dobija se (54). Na kraju pokaˇzimo da taˇcnost nejednakosti (54) na C povlaˇci (53). Zaista, na osnovu formule za srednju vrijednost, za neki θ ∈]0, 1[ vrijedi f (x2 ) − f (x1 ) = h∇f (x1 + θ(x2 − x1 )), x2 − x1 i. Ako vrijedi (54) imamo h∇f (x1 +θ(x2 −x1 ))−∇f (x1 ), θ(x2 −x1 )i > 0, odnosno h∇f (x1 + θ(x2 − x1 )), x2 − x1 i > h∇f (x1 ), (x2 − x1 )i, ˇsto uz prethodnu jednakost znaˇci (53). ¤ Inaˇce ova teorema moˇze se dokazati pomo´cu Teoreme ?. i ˇcinjenica da je grafik konveksne funkcije jedne promjenljive iznad tangente, odnosno da je izvod neopadaju´ca funkcija. Navedenu teoremu iskoristimo za dokaz kriterijuma konveksnosti drugog reda. Teorema 50 Neka je f neprekidna na C i dva puta neprekidno diferencijabilna na int C 6= ∅. Tada, f je konveksna na C ako i samo ako za sve x ∈ int C, v ∈ Rn h∇2 f (x)v, vi > 0. (55) Dokaz. Neka je x ∈ int C, v ∈ Rn i t > 0 takav da je x + tv ∈ C. Stavljaju´ci u (14) da je x1 = x i x2 = x + tv, dobija se ϕ00 (t) = t2 h∇2 f (x)v, vi. Konveksnost funkcije f povlaˇci konveksnost ϕ odakle izlazi ϕ00 (t) > 0, odnosno (18), za x ∈ int C, v ∈ Rn . Obratno, za svaki x1 , x2 ∈ C i neki θ ∈]0, 1[ h∇f (x2 ) − ∇f (x1 ), x2 − x1 i = h∇2 f (x2 + θ(x2 − x1 ))(x2 − x1 ), x2 − x1 i pa vidimo da (54) povlaˇci (55), tj. konveksnost funkcije f na int C. Sada zbog neprekidnosti slijedi da je ta funkcija na konveksna i na C. ¤ Primjer 38 f (x) = x11 − x22 je konveksna na C = {x ∈ R2 : x2 = 0}, ali za v = e2 je h∇2 f (x)v, vi = −2. Ovdje je int C = ∅. Primjer 39 Kob-Daglasova funkcija αn n 1 f (x) = α0 xα 1 · · · xn , x ∈ R+ , α0 < 0, α1 > 0, ..., αn > 0 je konveksna za n X αi 6 1. i=1 46 Zaista, à !2 n n 2 X X v v i ∇2 f (x)v, v = f (x) αi − αi i2 , x xi i i=1 i=1 ® tako da iz nejednakosti Koˇsi-Bunjakovskog je h∇2 f (x) v, v i > 0. n X Ako je αi > 1, f nije konveksna, jer stavljaju´ci 1 = (1, ..., 1) imamo i=1 µ f 0+1 2 ¶ n X − = α0 2 i=1 αi > α0 2−1 = ³ ´ 1 = α 2− Pni=1 αi > α 2−1 = f 0+ 0 0 ³ ´2 (1) 1 = Pnα0 . f 0+ > α20 = f (0)+f α 2 2 i=1 i f (0) + f (1) .¤ 2 f (0)+f (1) . 2 2 Subdiferencijali Imamo, prema nejednakosti (53), da za diferencijabilnu konveksnu funkciju, za fiksiran x0 ∈ C i sve x ∈ C vrijedi ® f (x) − f (x0 ) > ∇f (x0 ), x − x0 . Ovo daje mogu´cnost uopˇstavanja pojma gradijenta. Definicija 6 Subgradijent funkcije f : S → R, S ⊆ Rn u taˇcki x0 ∈ S je vektor y 0 ∈ Rn takav da za sve x ∈ S vrijedi f (x) − f (x0 ) > hy 0 , x − x0 i. (56) Skup svih subgradijenata funkcije f u x0 naziva se subdiferencijal i oznaˇcava sa ∂f (x0 ). Dakle, © ® ª ∂f (x0 ) = y 0 : f (x) − f (x0 ) > y 0 , x − x0 ∀x ∈ S . Za pozitivno homogene konveksne funkcije izdvaja se subdiferencijal u 0 : ∂h = {y ∈ Rn : hy, xi 6 h(x) ∀x}. Primjedba 14 Geometrijski, hiperravan u Rn+1 data sa xn+1 = hy 0 , x − x0 i + f (x0 ) 0 0 je hiperrvan µ oslonca ¶ za epi f u taˇcki (x , f (x )). Kako je njen vektor nory0 male a = ta hiperravan nije ortogonalna na Rn . Jasno je i obratno, −1 ako je hiperravan H(a, f (x0 ) − hy 0 , x0 i) potporna za epi f u (x0 , f (x0 )) i nev0 0 0 ertikalna, onda je y subgradijent funkcije f u x . Tada je an+1 6= 0 i y = a1 − a 1 ... ∈ ∂f (x0 ). n+1 an 47 slika Na datoj slici je grafik konveksne funkcije date sa √ ½ 1 − 1 − x2 , −1 6 x 6 0 f (x) = x 06x<1 1−x , √ Primjer 40 Za funkciju f datu sa f (x) = − x, x > 0 jedina potporna prava na nadgrafik, u (0, 0) je vertikalna, √ pa je√subdiferencijal prazan. Ovo se vidi i iz definicije: y ∈ ∂f (0), povlaˇci x − (− 0) > y(x − 0), za sve x > 0. Odavde je − √1x > y za sve x > 0, ˇsto nije mogu´ce, pa je ∂f (0) = ∅. Funkcija f je konveksna i diferencijabilna za x > 0, pa na osnovu nejednakosti (56) imamo 1 ∂f (x) = {− 2√ }. x slika Uslov ∂f (x) 6= ∅ je vaˇzan pa ´cemo ga posebno istaknuti. Definicija 7 Funkcija f je subdiferencijabilna u x0 ∈ D(f ) ako je ∂f (x0 ) 6= ∅. Izloˇzi´cemo osnovna svojstva subdiferencijala, kao i neke formule subdiferencijalnog raˇcuna. Teorema 51 Subdiferencijal je zatvoren i konveksan skup. Dokaz. Neka je ∂f (x0 ) 6= ∅. Prvi dio tvrdnje slijedi iz neprekidnosti skalarnog proizvoda u nejednakosti iz definicije. Dalje, uzmimo y 0 , y1 ∈ ∂f (x0 )®i λ ∈ [0, 1]. Kako za sve x ∈ D(f ), i za i = 0, 1 imamo f (x)−f (x0 ) > y i , x − x0 , to nakon mnoˇzenja sa 1 − λ (za i = 0), a sa λ (za i = 1), te sabiranja dobijamo ® f (x) − f (x0 ) > (1 − λ)y 0 + λy 1 , x − x0 . Dakle, (1 − λ)y 0 + λy 1 ∈ ∂f (x0 ). ¤ Vidjeli smo da ni konveksna funkcija ne mora biti subdiferencijabilna u svim taˇckama (npr. iz bd C). Za ostale taˇcke situacija je drukˇcija. Teorema 52 Neka je f konveksna funkcija i x0 ∈ int C. Tada je ∂f (x0 ) neprazan kompaktan skup. Dokaz. Za v 6= 0 postoji t0 > 0 takav da je x0 +tv ∈ C, za sve t ∈ [0, t0 ]. Skupovi x C1 =int epi f i C2 = {( ) : x = x0 + tv, ξ = f (x0 ) + tf 0 (x0 , v), t ∈ [0, t0 ]} ξ su konveksni kao interior nadgrafa konveksne funkcije, dok je C2 duˇz u Rn+1 . Prema nejednakosti (42) ovi skupovi su disjunktni. Sada po Posljedici 4. postoje a vektor ( ) 6= 0 i broj β, takvi da vrijedi α ¿µ ¶ µ ¶À ¿µ ¶ µ ¶À a x a x0 + tv , <β6 , , α ξ α f (x0 ) + tf 0 (x0 , v) 48 za sve x ∈ int C, ξ > f (x) i t ∈ [0, t0 ]. Uzimaju´ci da je x = x0 , ξ = f (x0 )+1 i t = 0 dobijamo da je α < 0. Dijeljenjem sa α, uz graniˇcni proces ξ = f (x)+ε, ε → 0+ izlazi nejednakost D a E D a E f (x) − f (x0 ) + t − , v > − , x − x0 + tf 0 (x0 , v). (57) α α Na kraju, pri t = 0, dobijamo da je − αa ∈ ∂f (x0 ). Neka je¡sada y 0 ¢subgradijent ¡ ¢ pravac. Tada, za sve® t ∈]0, t0 [ imamo f x0 + tv − f x0 > i v0 proizvoljan ® ¡ ¢ y , tv , odakle je f 0 x0 ; v > y 0 , v . Dalje slijedi sup hy, vi 6 f 0 (x0 ; v). y∈∂(x0 ) Kako je x0 ∈ int C, onda je funkcija v 7→ f 0 (x0 ; v) konveksna na Rn . Zbog neprekidnosti ona je ograniˇcena na jediniˇcnoj kugli, pa za sve subgradijente y y y ∈ ∂f (x0 ), y 6= 0 vrijedi hy, kyk i 6 f 0 (x0 ; kyk ) 6 M, tj. kyk 6 M. Znaˇci, 0 ∂f (x ) je ograniˇcen skup, a ve´c smo vidjeli da je zatvoren . ¤ Ustanovimo vezu izmed¯u subdiferencijala i jednostranih izvoda. Teorema 53 Neka je f konveksna na C ⊆ Rn , x0 ∈ int C. Tada vrijedi max hy, vi = f 0 (x0 ; v). y∈∂f (x0 ) Dokaz. Prethodna nejednakost postaje x = x0 vidimo da se maksimum dostiˇze Primjedba 15 (58) max hy, vi 6 f 0 (x0 ; v). Iz (57) za y∈∂f (x0 ) u − αa . ¤ f 0 (x; v) = S∂f (x) (v), (59) Specijalno, za pozitivno homogene funkcije imamo h(v) = h0 (0; v) = S∂h(0) (v), kra´ce h = S∂h . Teorema 54 Konveksna funkcija f je diferencijabilna u x0 ∈ int C ako i samo ako je ∂f (x0 ) jednoˇclan skup. Dokaz. Ako je ∂f (x0 ) = {y 0 }, onda je prema (58) f 0 (x0 ; v) = hy 0 , vi, za sve v ∈ Rn . Funkcija v 7→ f 0 (x0 , v) je linearna, ˇsto uz Lipˇsic neprekidnost f u x0 povlaˇci diferencijabilnost. Obratno, neka postoji ∇f (x0 ), i neka je y 0 subgradijent funkcije f u taˇcki x0 . Za sve vektore v mora biti hy 0 , vi 6 h∇f (x0 ), vi, odakle je h∇f (x0 ) − y 0 , vi > 0, pa je ∇f (x0 ) = y 0 . ¤ Za raˇcunanje subdiferencijala vaˇzna su naredna tvrd¯enja. 49 Teorema 55 (Moro-Rokafelar) Neka su f1 , f2 konveksne funkcije na skupu C sa nepraznim interiorom. Tada za sve x0 ∈ C vrijedi ∂(f1 + f2 )(x0 ) = ∂f1 (x0 ) + ∂f2 (x0 ). (60) Dokaz. Iz (f1 + f2 )0 (x0 ; v) = f10 (x0 ; v) + f20 (x0 ; v) i ...slijedi max ha, vi = a∈∂(f1 +f2 )(x0 ) max a∈(∂f1 (x0 )+∂f2 x0 ) ha, vi Primjedba 16 Za α > 0 imamo ∂(αf )(x) = α∂f (x), 0 ® 0 0 0 0 0 poˇ s0to je αf0 ®(x) − αf (x ) > y , x − x isto ˇsto i y = αz i f (x) − f (x ) > z , x−x . Poznato je da iz diferencijabilnosti konveksnih funkcija f1 i f2 ne slijedi diferencijabilnost konveksne funkcije f1 ∨ f2 u taˇckama x0 za koje je f1 (x0 ) = f2 (x0 ). Zato je, u tom sluˇcaju, potrebno odrediti, njen subdiferencijal. Teorema 56 (Dubovicki - Miljutin) Neka su f1 i f2 konveksne funkcije na konveksnom skupu C ⊆ Rn i neka je f1 (x0 ) = f2 (x0 ), x0 ∈ int C. Tada vrijedi ∂(f1 ∨ f2 )(x0 ) = ∂f1 (x0 ) ∪ ∂f2 (x0 ). (61) Dokaz (f1 ∨ f2 )0 (x0 , v) = max (f10 (x0 , v), f20 (x0 , v)) = max (λf10 (x0 , v) + (1 − 06λ61 λ)f20 (x0 , v)) = max (λ 06λ61 max max max 0 ha, vi) + (1 − λ) a∈∂f1 (x ) hλa + (1 − λ)b, vi = 06λ61 a∈∂f1 (x0 ),b∈∂f2 (x0 )) max hb, vi) = b∈∂f2 (x0 ) max c∈∂f1 (x0 )∪∂f2 (x0 ) S druge strane (f1 ∨ f2 )0 (x0 , v) = max c∈∂(f1 ∨f2 )(x0 ) hc, vi, pa na osnovu...¤ Primjer 41 Odredimo ∂h(x), ako je h(x) = |x|, x ∈ R, i ∂k · k 50 hc, vi. Za x 6= 0 funkcija f je diferencijabilna, pa je stvar jasna. Stavimo h1 (x) = −x, h2 (x) = x. Sada je h = h1 ∨ h2 , h1 (0) = h2 (0), tako da imamo ∂(h1 ∨ h2 )(0) = ∂h1 (0) ∪ ∂h2 (0) = {−1} ∪ {1} = [−1, 1]. U opˇstem sluˇcaju za h(x) = kxk, x ∈ Rn vrijedi ∂h = B. Zaista, y ∈ B, x ∈ Rn povlaˇci hy, xi 6 kxk kyk 6 kxk, odnosno nejednakost hy, x − 0i 6 kxk − k0k, pa je y ∈ ∂h. Na drugu stranu imamo y ∈ ∂h ⇒ y ∈ B, budu´ci da iz kxk > hy, xi, za sve x ∈ Rn , pri x = y slijedi 1 > kyk. Konjugovane funkcije Konjugovane funkcije smo ve´c definisali (primjer ), a ovdje ´cemo ukazati na njihov znaˇcaj. Problem minimizacije x ∈ S ⊆ Rn min f (x), je ekvivalentan sa −max (−f (x)), x ∈ S. U vezi s njima korisno je razmotriti skup problema max {hy, xi − f (x) : x ∈ S}, y ∈ Rn . Vidimo da se ovdje javlja nova funkcija vezana za f : y 7→ max (hy, xi − f (x)). x∈C koja nije niˇsta drigo do njena konjugovana funkcija. Navedimo joˇs da ako znamo funkciju f ∗ , onda je vrijednost −f ∗ (0) optimalna za dati problem minimizacije. S druge strane, u teoretskim razmatranjima, linearan dodatak hy, xi ne name´ce posebne zahtjeve. Do istog pojma se dolazi ako nas zanima najmanja realna vrijednost koju uzima α takvo da je x 7→ hy 0 , xi − α afina minoranta funkcije f na Df , odnosno da za sve x ∈ Df vrijedi hy 0 , xi − f (x) 6 α. Jasno, to je α0 = sup (hy 0 , xi − f (x)). x∈Df tako da dobijamo preslikavanje y 0 7→ α0 , koje je f ∗ . na kraju odredimo potpornu funkciju za nadgraf funkcije f . Imamo Sepi f ( y )= η sup ( x ξ )∈epif 51 (hx, yi + ξη). Jasno, ako je η > 0, onda ( Sepi f ( y )= −1 y )∈ / D(Sepif ). Uzmimo da je η = −1. Sada je η sup (hx, yi − ξ) = sup (hx, yi − f (x)) = f ∗ (y). x∈D(f ) x ∈ D(f ) ξ > f (x) . Primjedba 17 Situcija u kojoj je D(f ∗ ) = ∅ nije iskljuˇcena, ˇsto pokazuje primjer funkcije f (x) = x3 , Df = R. Ovdje je sup (yx − x3 ) = +∞, za sve x∈R y ∈ R. Primjer 42 Ako je f diferencijabilna konveksna funkcija jedne promjenljive, ˇciji izvod je invertibilan, onda vrijedi ¡ ¢ f ∗ (y) = y(f 0 )−1 (y) − f (f 0 )−1 (y) . Dovoljno je uoˇciti da je y 7→ xy − f (x) konkavna funkcija, pa se maksimum nalazi medju taˇckama za koje vrijedi x = f 0 (y). Specijalno za funkciju f (x) = ex , x ∈ R imamo f ∗ (y) = y ln y − y, y > 0. Naravno, treba vidjeti i sljede´ce: f ∗ (0) = sup(0 · x − ex ) = 0, a za y < 0 je sup(y · x − ex ) = +∞. Znaˇci Df ∗ = [0, +∞[. x x Primjer 43 Za afinu funkciju f (x) = ha, xi − β vrijedi Df ∗ = {a}, f ∗ (a) = β. Zaista, supx∈Rn (hy, xi − ha, xi + β) = supx ∈ Rn hy − a, xi + β je konaˇcan samo za y = a, dok za x = t(y − a) 6= 0 imamo supx∈Rn hy − a, xi > supt>0 tky − ak2 = +∞. Primjer 44 Neka je h pozitivno homogena funkcija na Rn . Vrijedi Dh∗ = {y ∈ Rn : hy, xi 6 h(x) ∀x ∈ Rn } = ∂h, h∗ (y) = 0. Uzmimo da je hy, x0 i > h(x0 ), za neki x0 ∈ Rn . Slijedi sup (hy, xi − h(x)) > sup(hy, αx0 i − h(αx0 )) > sup α(hy, x0 i − h(x0 )) = +∞, x∈Rn α>0 α>0 tako da y nije u Dh∗ . Neka je sada hy, xi 6 h(x), za sve x ∈ Rn Imamo 0 > sup (hy, xi − h(x)) > hy, 0i − f (0) = 0. x ∈ Rn Uzmimo specijalno ga je h = k · k. Tada je, prema primjeru 41, domen konjugovane ∂h = B, pa moˇzemo pisati k · k∗ = I B . (62) ¤ Ako je domen konjugovane funkcije neprazan moˇzemo odmah ustanoviti neka njena bitna svojstva. 52 Teorema 57 Neka je f proizvoljna funkcija za koju je Df ∗ 6= ∅. Tada je Df ∗ konveksan skup, a f ∗ zatvorena konveksna funkcija. Dokaz. Za y 1 , y 2 ∈ D(f ∗ ), λ ∈ [0, 1] vrijedi sup (h(1 − λ)y 1 + λy 2 , xi − f (x)) 6 x∈Df 6 (1 − λ) sup (hy 1 , xi − f (x)) + λ sup (hy 2 , xi − f (x)) < +∞, te je (1 − λ)y 1 + x∈Df x∈Df λy 2 ∈ D(f ∗ ), i f ∗ ((1−λ)y 1 +λy 2 ) 6 (1−λ)f ∗ (y 1 )+λf ∗ (y 2 ). Uostalom, nadgraf epi f ∗ je zatvoren i konveksan skup (Primjer 29.). ¤ Iz definicije direktno slijedi da za sve x ∈ D(f ) i sve y ∈ D(f ∗ ) vrijedi f (x) + f ∗ (y) > hx, yi. (63) Ova nejednakost se zove Fenhelova ili Jang-Fenhelova. Teorema 58 Ako je f proizvoljna, α > 0 i l invertibilno linerno preslikavanje na Rn , onda funkcije definisane izrazima zdesna su konjugovane onima ˇcije formule su slijeva. αf (x) + ha, xi + β f ◦l f (x − x0 ) αf ∗ ( y−a α )−β f ∗ ◦ (l−1 )∗ . f ∗ (y) + hy, x0 i DOKAZ. Teorema 59 (inf fi ))∗ = sup fi∗ i (64) Prirodno je definisati konjugovanu funkciju funkcije f ∗ , i ustanoviti njenu vezu sa f . Umjesto (f ∗ )∗ piˇsemo f ∗∗ , i to je bikonjugovana funkcija funkcije f . Dakle f ∗∗ (x) = sup (hx, yi − f ∗ (y)). (65) y∈Df ∗ Koriste´ci Fenhelovu nejednakost f (x) > hy, xi − f ∗ (y) na osnovu (65) dobijamo da za sve x ∈ D(f ) vrijedi f (x) > f ∗∗ (x). slike f... 53 (66) Neka je D(f ∗ ) 6= ∅. Iz Fenhelove nejednakosti slijedi da f ima afinu minorantu x 7→ ha, xi − α. Dalje je, redom, ha, xi − f (x) 6 α, a ∈ D(f ∗ ), f ∗ (a) 6 α, ha, xi − α 6 ha, xi − f c (a), odakle je sup (ha, xi − α) 6 sup (ha, xi − f ∗ (a)), a∈Af a∈D(f ) cl f (x) 6 f ∗∗ (x). (67) Odgovor na pitanje kada su funkcija i njena bikonjugovana funkcija jednake direktno izlazi iz nejednakosti (66) i (67) Teorema 60 (Fenhel-Moro) Funkcija f je odozdo poluneprekidna i konveksna na zatvorenom C ako i samo ako je f = f ∗∗ . (68) ∗∗ Dokaz. Iz jednakosti slijedi da je f konveksna, i poluneprekidna odozdo (f je konveksna i zatvorena). Obratno, iz konveksnosti i poluneprekidnosti je f = cl f. Kako joˇs imamo cl f 6 f ∗∗ 6 f, slijedi f = f ∗∗ . ¤ Veza izmed¯u subdiferencijala funkcije f i njene konjugovane funkcije data je sljede´cim tvrd¯enjima. Teorema 61 Neka je f proizvoljna funkcija i x0 ∈ Df . Tada vrijedi ® y 0 ∈ ∂f (x0 ) ⇐⇒ f ∗ (y 0 ) + f (x0 ) = y 0 , x0 , (69) ¡ ¢ y 0 ∈ ∂f (x0 ) =⇒ x0 ∈ ∂f ∗ y 0 . (70) Ako je f konveksna i zatvorena u x0 , onda vrijedi i obratna implikacija. ® Dokaz. y 0 ∈ ∂f (x0 ) povlaˇci f (x) − f (x0 ) > y 0 , x − x0 , odnosno 0 0® ® y , x − f (x0 ) > y 0 , x − f (x), ® za sve x ∈ Df , ˇsto znaˇci da je y 0 ∈ D(f ∗ ) i y 0 , x0® − f (x0 ) > f ∗¡(y 0 ). ¢ Pomo´cu Fenhelove nejednakosti dobijamo y 0 , x0 = f (x0 ) + f ∗ y 0 . Na drugu stranu, iz ove jednakosti imamo hy 0 , x0 i − f (x0 ) = f ∗ (y 0 ) > hy 0 , xi − f (x), tj. za sve x ∈ Df vrijedi hy 0 , x − x0 i 6 f (x) − f (x0 ), i y 0 ∈ ∂f (x0 ). U dokazu druge formule pod¯imo od y 0 ∈ ∂f (x0 ). Prema ve´c dokazanom je f ∗ (y 0 ) − hx0 , y 0 − yi = hy, x0 i − f (x0 ) 6 f ∗ (y). Znaˇci, za sve y ∈ Df ∗ imamo f ∗ (y) − f ∗ (y 0 ) > hx0 , y − y 0 i, tj. x0 ∈ f ∗ (y 0 ). Obratno, iz prve ekvivalencije i Moro-Fenhelove teoreme (tj. f (x0 ) = f ∗∗ (x0 )) slijedi x0 ∈ f ∗ (y 0 ) =⇒ f ∗∗ (x0 ) + f ∗ (y 0 ) = hx0 , y 0 i =⇒ f (x0 ) + f ∗ (y 0 ) = hx0 , y 0 i =⇒ y 0 ∈ ∂f (x0 ). ¤ 54 ½ 1, x = 0 , je konveksna, i ∂f (0) = ∅. 0, x ∈]0, 1] ½ 0, y 6 0 Njena konjugovana funkcija je f c (y) = , dok je ∂f c (0) = [0, 1]. y, y > 0 Uoˇcimo da f nije zatvorena u 0. Ako modifikujemo f tako da je f (x) = 0 za x > 0, onda je isto ∂f (0) = ∅, dok je domen konjugovane ] − ∞, 0], f ∗ (y) = 0, a ∂f ∗ (0) = [0, +∞[ Primjer 45 Funkcija f (x) = Primjer 46 Pomo´cu formule (69) moˇzemo da odred¯ujemo konjugovane funkcije. Tako za diferencijabilne konveksne funkcije viˇse promjenljivih vrijedi f ∗ (∇f (x)) = h∇f (x), xi − f (x). Sada, ako je C simetriˇcna PsemiD matrica reda n, q(x) = onda je konjugovana funkcija q ∗ data sa 1 2 hCx, xi, x ∈ Rn , q ∗ (Cx) = 21 hCx, xi, x ∈ Rn . U sluˇcaju da je C P D matrica, iz ∇q(x) = Cx = y dobijamo x = C−1 y, i q ∗ (y) = hy, C−1 yi − 12 hy, C−1 y, i = 12 hC−1 y, yi, y ∈ Rn . Pokaˇzimo da je Dq∗ = {Cx : x ∈ Rn } ako C jeste P semiD, ali ne i P D matrica. Zaista, iz y ∈ Dq∗ slijedi µ ¶ α2 q ∗ (y) = sup (hy, xi − f (x)) > sup hy, αx0 i − hCx0 , x0 i , 2 α∈R x∈Rn za fiksiran x0 6= 0, koji ´cemo izabrati tako da bude hCx0 , x0 i = 0. Sada je q ∗ (y) > sup αhy, x0 i, odakle proizilazi jednakost hy, x0 i = 0. Znaˇci da je y orα∈R togonalan na {x : Cx = 0}, pa se nalazi u {Cx : x ∈ Rn }. Inaˇce, po samoj definiciji, za y = Cx imamo µ ¶ 1 1 1 ∗ q (Cx) = sup hCx, vi − hCv, vi = hCx, xi − inf hC(v − x), v − xi = n 2 2 2 v∈Rn v∈R 1 hCx, xi. 2 Specijalno, za C = I dobija se rezultat za euklidsku normu. ¤ = 55 Konveksne funkcije sa vrijednostima u Posmatra´cemo sada funkcije f : Rn → R. Kaˇzemo da je takva funkcija konveksna ako je njen nadgrafik konveksan skup, ˇsto je ekvivalentno sa ¡ ¢ f (1 − λ)x1 + λx2 6 (1 − λ)α + λβ, za sve x1 , x2 ∈ Rn , α > f (x1 ), β > f (x2 ) i sve λ ∈ [0, 1]. Konveksnost funkcije sa konveksnog skupa C prenosi se na Rn tako ˇsto se na Rn \ C dodefinise sa +∞. Efektivni domen dom (f ) = {x ∈ Rn : f (x) < +∞} konveksne funkcije f je konveksan skup. Ako konveksna funkcija nije svojstvena, tj. ako nije ispunjen uslov (9) (dom f 6= ∅, −∞ ∈ / f (Rn ), onda moˇze biti konaˇcna jedino na rubu svog efektivnog domena. Zaista, ako je x ∈ int dom(f ), f (x1 ) = −∞, postoje x2 ∈ dom(f ), λ ∈ ]0, 1[, za koje je x = (1 − λ)x1 + λx2 , i pri tome vrijedi f (x) 6 (1 − λ)f (x1 ) + λf (x2 ) = −∞. Primjer jedne takve funkcije je f = sgn ·I{0} , odnosno −∞, x < 0 0, x=0 f (x) = +∞, x > 0. Primjer 47 Indikatorna funkcija nepraznog konveksnog skupa C ½ 0, x∈C IC (x) = +∞, x ∈ /C je konveksna. Vrijedi i obratno, a to je jasno s obzirom da je epi IC = C × R. Za operacije sa (konveksnim) funkcijama imamo da vrijedi IS + IT = IS∩T , IS ∨ IT = IS∩T , IS ⊕ IT = IS+T , IS M IT = IS∪T (71) Na primjer jednakost (S × R) + (T × R) = (S + T ) × R je ekvivalentna tre´coj formuli. Vektor y 0 ∈ Rn je subgradijent funkcije f u x0 ako za sve x ∈ Rn vrijedi f (x) > f (x0 ) + hy 0 , x − x0 i. Neposredno slijedi da f (x0 ) = −∞ povlaˇci ∂f (x0 ) = Rn , kao i da je f ≡ −∞. U suprotnom imamo vaˇzno tvrd¯enje, koje se dokazuje kao teorema 26. Teorema 62 Ako je konveksna funkcija f konaˇcna u taˇcki x0 onda vrijedi ∂f (x0 ) = {y 0 : f 0 (x0 ; v) > hy 0 , vi 56 ∀v}. S druge strane imamo da, ako je f (x0 ) konaˇcan i ∂f (x0 ) 6= ∅, onda je f konveksna i vrijedi (34). Konjugovana funkcija za f : Rn →] − ∞, +∞ ] definiˇse se sa f ∗ (y) = sup (hy, xi − f (x)). x∈domf Pri tome, ako f (x) 6= +∞, za neki x ∈ Rn onda je f ∗ (x) > −∞, za sve x. S druge strane, ako f ima afinu minorantu na Rn , onda je dom f ∗ 6= ∅. Drugim rijeˇcima f ∗ je sopstvena funkcija. Mi ´cemo redovno posmatrati konveksne funkcije uz navedena dva uslova. Imaju´ci ovo u vidu, kao i ... Teorema 63 Funkcija f koja nije identiˇcki +∞ i ima afinu minorantu je sopstvena, zatvorena i konveksna. Teorema 64 f ∗ (y) = Sepif (y, −1). Primjer 48 Prema primjeru 43. za linearnu funkciju l(x) = ha, xi, a 6= 0, na Rn imamo l∗ = I{a} . Primjer 49 IC∗ = SC . (72) Rezultat slijedi direktno iz definicije. Primjenjuju´ci Fenhel-Moroovu teoremu, iz prethodne formule, budu´ci da u suˇstini u Primjeru 44. imamo h∗ = I∂h , (73) dobijamo (opet) da je svaka ... h = S∂h . Primjer 50 Za zatvoren konveksan skup C vrijedi. SC∗ = IC . (74) Zaista, SC∗ = IC∗∗ = IC . Pri tome je domen ove homogene funkcije ∂SC = C, zbog (75) i (76). Primjer 51 Za funkciju Minkovskog vrijedi MC∗ = IC ◦ . (75) Poˇsto je i ovo konveksna pozitivno homogena funkcija potrebno je odrediti samo domen njene konjugovane funkcije tj. skup ∂MC . Neka prvo y ∈ / C ◦ . Tada postoji x ∈ C takav da je hx, yi > 1. Poˇsto je MC (x) 6 1, dobijamo MC∗ (y) > sup(hαx, yi − MC (αx)) = sup α(hx, yi − MC (x)) = ∞. α>0 α>0 Ako je y ∈ C ◦ onda za sve x ∈ dom MC i sve α ∈ Sx imamo h αx , yi 6 1, odakle je hx, yi − MC (x) 6 0, pa je MC∗ (y) 6 0. Dakle, ∂MC = C ◦ . 57 Teorema 65 (f1 ⊕ f2 )∗ = f1∗ + f2∗ (76) (f1 M f2 )∗ = f1∗ ∨ f2∗ (77) DC∗ = IB + SC . (78) DOKAZ. Primjer 52 Uoˇcimo da je DC = f1 ⊕ f2 , gdje je f1 (x) = kxk, a f2 (x) = IC (x). Sada je, prema prethodnoj teoremi DC∗ (y) = f1∗ (y) + f2∗ (y) = IB (y) + IC∗ (y) = IB (y) + SC (y). SS + ST = SS+T , SS ∨ ST = SS∪T , SC ⊕ SD = SS M ST = SC∩D MS ∨ MT = MS∩T , MS M MT = MS∪T MS + MT = MS¢T , MS ⊕ MT = MS∪T , NEKE PRIMJENE Dokaˇzimo neke poznate ali vaˇzne ˇcinjenice. Ako je C konveksan, zatvoren skup i 0 ∈ C tada ∗ = IC . IC ◦◦ = MC∗ ◦ = SC Iz jednakosti indikatornih funkcija slijedi jednakost skupova C i C ◦◦ . K1 i K2 zatvoren konvekni konusi, int K1 ∩ K2 6= ∅ tada vrijedi formula... I(K1 ∩K2 )◦ = SK1 ∩K2 = SK1 ⊕ SK2 = IK1◦ ⊕ IK2◦ = IK1◦ +K2◦ . Dakle, (K1 ∩ K2 )∗ = −(K1 ∩ K2 )◦ = −(K1◦ + K2◦ ) = −K1◦ + (−K2◦ )) = K1∗ + K2∗ . KONVEKSNE FUNKCIJE I EKSTREMI Konveksne funkcije imaju niz svojstava koja olakˇsavaju odred¯ivanje ekstrema: Svaki lokalni minimum je globalni minimum. Skup taˇcaka minimuma je konveksan skup, a ako je f strogo konveksna, taj skup je najviˇse jednoˇclan. 58 40. Neka je f diferencijabilna jako konveksna funkcija. Pokazati da je svaki skup L(x0 ) = {x : f (x) 6 f (x0 )} ograniˇcen, i da f ima jedinstvenu taˇcku minimuma. 11. Iz ¡ ¢ f (1 − λ)x1 + λx2 6 (1 − λ)f (x1 ) + λf (x2 ) − α(1 − λ)λkx1 − x2 k2 slijedi f ((x0 +λ(x−x0 ))−f (x0 ) 6 f (x) − f (x0 ) − α(1 − λ)kx0 − xk2 , i λ h∇f (x0 ), x0 − xi > f (x0 ) − f (x) + αkx0 − xk2 . Na osnovu nejednakosti Koˇsi-Bunjakovskog, za x, za koje je f (x) 6 f (x0 ) dobijamo kx − x0 k 6 1 k∇f (x0 )k. α Ta funkcija je neprekidna na kompaktnom skupu L(x0 ), pa ima minimum (ˇcak globalan), koji je jedinstven zbog stroge konveksnosti. Taˇcka strogog maksimuma konveksne funkcije nije u skupu int Df . x∗ je taˇcka globalnog minimuma diferencijabilne konveksne funkcije f na konveksnom skupu C ako i samo ako vrijedi h∇f (x∗ ), x − x∗ i > 0 za sve x ∈ C. (79) Ako f nije diferencijabilna prethodna nejednakost se zamjenjuje sa 0 ∈ ∂f (x∗ ). (80) Dokaˇzimo prvo tvrd¯enje. Neka je f (x∗ ) minimum funkcije f na Df ∩ B(x∗ , ε) i neka je x ∈ Df . Postoji broj λ takav da je λx + (1 − λ)x∗ ∈ B(x∗ , ε) ( npr. ε ako je x van te kugle, dovoljno je uzeti neki λ ∈] 0, kx−x ∗ k [.) Sada je, zbog ∗ ∗ konveksnosti funkcije f , f (x ) 6 f ((1 − λ)x + λx) 6 (1 − λ)f (x∗ ) + λf (x), odakle je f (x∗ ) 6 f (x) za sve x ∈ Df . Ako bi konveksna funkcija imala strogi maksimum u x∗ ∈ int Df , za neke taˇcke x1 , x2 ∈ B(x∗ , ε) ⊆ int Df bilo bi µ 1 ¶ x + x2 f (x1 ) + f (x2 ) 2x∗ = x1 + x2 , i f (x∗ ) = f 6 < f (x∗ ). 2 2 U vezi sa maksimumom konveksne funkcije navedimo sljede´ce. Ako je C ⊂ int Df kompaktan skup, onda postoji x∗ ∈ C, taˇcka globalnog maksimuma, poˇsto je f neprekidna. Kompaktan, konveksan C je konveksni omotaˇc à svojih vrhova, ! s s s X X X i i pa je x∗ = λi v , λi = 1, λi > 0. Dalje je f (x∗ ) = f λi v 6 s X i=1 i=1 s X λi f (v i ) 6 i=1 i=1 λi max i=1 i∈{1,...,s} f (v i ) = max i∈{1,...,s} max i∈{1,...,s} f (v i ) 6 f (x∗ ). Dakle, vrijedi f (v i ) = f (x∗ ), 59 tako da postoji vrh skupa C u kojem f dostiˇze maksimum na C. Posljednje tvrd¯enje slijedi direktno iz nejednakosti (53), odnosno (56). Inaˇce uslov (79) moˇzemo zamijeniti sa h∇f (x∗ ), vi > 0 za sve dopustive pravce v u x∗ . (81) Zaista, iz x∗ , x ∈ C slijedi x∗ + λ(x − x∗ ) ∈ C, za sve λ ∈]0, 1[, tako da je x − x∗ dopustiv pravac, za sve x ∈ C. Obratna implikacija je jasna. Kun - Takerova teorema Mi ´cemo problemu konveksnog programiranja (3)da dodijelimo Lagranˇzovu funkciju L(x, y) = f (x) + hy, g(x)i na skupu D × Rm +. Teorema 66 (Kun, Taker) Neka su funkcije f , gi (i ∈ J ) konveksne i neka je skup G regularan po Slejteru. Tada je dopustiva taˇcka x∗ rjeˇsenje problema (KP) ako i samo ako postoji y ∗ > 0 takav da vrijedi L(x, y ∗ ) > L(x∗ , y ∗ ) ∀x ∈ C hy ∗ , g(x∗ )i = 0. (82) (83) Dokaz. ” ⇔ ”. Neka je x ∈ G. Tada je hy ∗ , g(x∗ )i 6 0, pa imamo f (x) > f (x) + hy ∗ , g(x)i = L(x, y ∗ ). Odavde je, zbog uslova (82) i (83), f (x) > L(x∗ , y ∗ ) = f (x∗ ). Dakle, f (x) > f (x∗ ) za sve x ∈ G. ” ⇒ ” Oznaˇcimo sa Gi nivoske skupove lev (gi , 0) i definiˇsimo funkciju F1 = f + IC + IG1 + ... + IGm . Prema () x∗ je rjeˇsenje problema (KP) ako i samo ako je 0 ∈ ∂F1 (x∗ ). Za taˇcku x0 iz Slejterovog uslova vrijedi i x0 ∈ int dom f , ∈ int dom IGi , pa na osnovu Moro - Rokafelarove teoreme i Primjera dobijamo X 0 ∈ ∂f (x∗ ) + ∂IC + yi∗ y i , y i ∈ ∂gi (x∗ ). i∈J (x∗ ) Neka je vektor y ∗ takav da za preostale koordinate, tj. yi∗ za i ∈ / J ∗ , ima vrijednost 0. Samim tim je ispunjen uslov (83). Pokaˇzimo da je ispunjen i prvi uslov. U tom cilju definiˇsimo funkciju F2 : C → R, F2 (x) = L(x, y ∗ ) + IC (x). Sada je ∂F (x∗ ) = ∂f (x∗ ) + ∂IC + X i∈J (x∗ ) 60 yi∗ ∂gi (x∗ ), pa vidimo da je i 0 ∈ ∂F2 (x∗ ). Dakle, x∗ je taˇcka minimuma funkcije x 7→ F (x, y ∗ ), na skupu C. Prema tome vrijedi (82). Drugi uslov je oˇcgledan, s obzirom da je po konstrukciji yi∗ gi (x∗ ) = 0, i = 1, ..., m. (84) ¤ Ako su f i g diferencijabilne, onda imamo uslov (82) postaje ∇x L(x∗ , y ∗ ) := ∇f (x∗ ) + hy ∗ , ∇g(x∗ )i = 0. Primjer 53 Na´ci potreban i dovoljan uslov za postojanje rjeˇsenja zadatka linearnog programiranja min {hc, xi : Ax = b, x > 0}, Definicija 8 Taˇcka (x∗ , y ∗ ) ∈ C × R+ naziva se sedlasta taˇcka Lagranˇzove funkcije ako za sve (x, y) ∈ C × R+ vrijedi L(x∗ , y) 6 L(x∗ , y ∗ ) 6 L(x, y ∗ ). (85) Primjedba 18 (x∗ , y ∗ ) ∈ C × R+ je sedlasta taˇcka funkcije L ako i samo ako je x∗ ∈ G i vrijede (82) i (83). Neka je (x∗ , y ∗ ) sedlasta taˇcka funkcije L. Poˇsto vrijedi (82) preostaje da se ustanovi drugi uslov. Prije svega, uzimaju´ci u lijevoj nejednakosti f (x∗ ) + hy, g(x∗ )i 6 f (x∗ ) + hy ∗ , g(x∗ )i da je y = y ∗ + ei , redom za sve i ∈ J , dobijamo hei , g(x∗ )i 6 0, odakle je g(x∗ ) 6 0, tj. x∗ ∈ G. Sada je hy ∗ , g(x∗ )i 6 0, a pri y = 0 imamo hy ∗ , g(x∗ )i > 0. Slijedi hy ∗ , g(x∗ )i = 0. Neka sada za neki par (x∗ , y ∗ ) ∈ C × R+ vrijede tri navedena uslova. Pokaˇzimo da je ta taˇcka sedlasta. Za proizvoljan y > 0 imamo hy ∗ − y, g(x∗ )i = −hy, g(x∗ )i > 0, odnosno hy, g(x∗ )i 6 hy, g(x∗ )i. Dodaju´ci na obje strane f (x∗ ) dobija se lijeva nejednakost u (85). Sada ... Teorema 67 Neka su f i gi , i ∈ J konveksne funkcije, skup G regularan po Slejteru. Tada je x∗ taˇcka minimuma funkije f na G ako i samo ako postoji y ∗ > 0 takva da je (x∗ , y ∗ ) sedlastu taˇcka funkcije L na C × Rm +. Primjedba 19 Bez ikakvih posebnih uslova, iz postojanja sedlaste taˇcke slijedi rjeˇsivost problema minimizacije, tj. ako Lagranˇzova funkcija L ima sedlastu ∗ taˇcku (x∗ , y ∗ ) na skupu C × Rm cka globalnog minimuma funkcije + , onda je x taˇ f na G. tako da desna nejednakost u (69) postaje f (x∗ ) 6 f (x) + hy ∗ , g(x)i. 61 Kako je y ∗ > 0, g(x) 6 0 na skupu G, to je na njemu i f (x∗ ) 6 f (x). ¤ Sedlaste taˇ cke i minimaks Postojanje sedlaste taˇcke funkcije F neposredno povlaˇci jednakost min F (x, y 0 ) = max F (x0 , y), x∈X (86) y∈Y pri ˇcemu su te vrijednosti jednake F (x0 , y 0 ). Obratno, iz ove jednakosti izlazi da za sve (x, y) ∈ X × Y vrijedi F (x0 , y) 6 max F (x0 , y) = min F (x, y 0 ) 6 F (x, y 0 ), y x odakle, uzimaju´ci x = x0 , y = y 0 slijedi F (x0 , y 0 ) = max F (x0 , y). Tako dobiy jamo nejednakosti (63) iz definicije sedlaste taˇcke. Jednakost (65) navodi nas na pomisao da tada vaˇzi i jednakost min max F (x, y) = max min F (x, y), x∈X y∈Y y∈Y x∈X a da je zaista tako vidimo iz sljede´ce teoreme. Teorema 68 Funkcija F : X × Y → R, X ⊆ Rn , Y ⊆ Rm ima sedlastu taˇcku na skupu X × Y, ako i samo ako vrijedi min max F (x, y) = max min F (x, y). x∈X y∈Y (87) y∈Y x∈X Dokaz. Za sve (x, y), (x0 , y 0 ) ∈ X × Y vrijede nejednakosti sup F (x, y) > F (x, y) > inf F (x, y), x∈X y ∈ Y inf sup F (x, y) > sup inf F (x, y), x y y x sup F (x0 , y) > inf sup F (x, y) > sup inf F (x, y) > inf F (x, y 0 ). x y y y x x Ako F ima u (x0 , y 0 ) sedlastu taˇcku posljednje nejednakosti, uz (65), povlaˇce inf sup F (x, y) = sup inf F (x, y) (= F (x0 , y 0 )), x y y x tj, (66). Neka su sada, x0 i y 0 taˇcke minimuma, odnosno maksimuma odgovaraju´cih funkcija iz (66). Vrijedi max F (x0 , y) = min F (x, y 0 ), a to je (65). ¤ y x Uslovi koji obezbjed¯uju jednakost (66) sadrˇzani su u teoremama o minimaksu. Prvu od njih, za standardne simplekse i bilinearnu funkciju F (x, y) = x> Ay, dokazao je von Nojman (1928), a potom je dao i njeno uopˇstenje 1937. 62 Teorema 69 Neka je neprekidna funkcija (x, y) 7→ F (x, y) konveksna po x ∈ X, konkavna po y ∈ Y, pri ˇcemu su ovi skupovi konveksni i kompaktni. Tada vrijedi min max F (x, y) = max min F (x, y). x∈X y∈Y y∈Y x∈X Dokaz. Oznaˇcimo lijevu stranu minimaks jednakosti sa α, a desnu sa β. Zbog neprekidnosti i kompaktnosti ove vrijednosti postoje. Pokaˇzimo da je α = β. Jasno, iz F (x, y) > min F (x, y), za sve y ∈ Y, slijedi x∈X max F (x, y) > max min F (x, y) = β, y∈Y y∈Y x∈X za sve x ∈ X, pa je α = min max F (x, y) > β. x∈X y∈Y Pretpostavimo da je α > β, i definiˇsimo funkcije Fy : x 7→ F (x, y), za svaki y ∈ Y. Tada, zbog max F (x, y) > α za sve x ∈ X, presjek svih nivoskih y∈Y skupova lev (Fy , α+β 2 ) je prazan. Zbog kompaktnosti skupa X i zatvorenosti nivoskih skupova postoji konaˇcno vektora y 1 , ..., y m tako da je m \ ¡ α +β¢ lev Fyi , = ∅. 2 i=1 Samim tim, uz oznaku G = (Fy1 − α+β m 2 , ..., Fy − α+β > 2 ) vrijedi {x ∈ X : G(x) < 0} = ∅. Sve komponentne funkcije su konveksne po pretpostavci, tako da po Fan Gliksberg Hofmanovoj teoremi postoji p = (p1 , ..., pm ) 0 takav da za sve x ∈ X je µ ¶ m X ¡ ¢ α+β i pi F x, y − > 0. 2 i=1 pi Stavljaju´ci da je λi = p1 +...+p , iz konkavnosti polazne funkcije po y, za sve m x ∈ X slijedi à m ! m X X α+β i i 6 λi F (x, y ) 6 F x, λi y . 2 i=1 i=1 Odavde je α+β 6 min F x∈X 2 à x, m X ! λi y i i=1 6 max min F (x, y) = β, y∈Y x∈X odnosno α 6 β. To je u suprotnosti sa pretpostavkom α > β, pa nam preostaje jednakost. ¤ 63 ZADACI 1. Razdvojiti skupove : C1 = {x ∈ Rn : n X x2i 6 1}, C2 = {x ∈ Rn : n−1 X i=1 x2i + 1 6 xn }. i=1 2. Odrediti sve konveksne zatvorene skup C ⊆ Rn takave da vrijedi SC = k · k 3. Pokazati da skup C = co (S ∪ {e1 + e3 , e1 − e3 }), ext C, gdje je x1 S = x2 : x21 + x22 = 1 nije zatvoren u R3 . 0 4. Na´ci projekciju taˇcke x na C = {x ∈ Rn : Ax = b}. 5. Pokazati da je x ∈ C je vrh konveksnog skupa C ako i samo ako C \ {x} je konveksan. 6. Polaran skup potprostora V ⊆ Rn je njegova ortogonalna dopuna. 7. Pomo´cu polarnih skupova dokazati Farkaˇsevu teoremu. ½ 8. Skup (x, y) ∈ £1 3 , +∞ £ × £1 2 , +∞ £ ¾ 2 3 3 : x +y >x +y 4 je konveksan. 9. Svaki nivoski skup funkcije f : C −→ R C ⊆ Rn je konveksan ako i samo ako za sve x1 , x2 ∈ C i sve λ ∈ [0, 1] vrijedi f ((1 − λ)x1 + λx2 ) 6 max{f (x1 ), f (x2 )}. 99 [Fan, Gliksberg, Hofman] Neka je g = (g1 , ..., gm ) konveksna vektorska m \ funkcija na konveksnom skupu C ⊆ D(gi ). Tada vrijedi i=1 {x ∈ C : g(x) < 0} = ∅ ⇐⇒ (∃u 0)(∀x ∈ C) hu, g(x)i > 0. 10. Neka su A, G, H aritmetiˇcka, geometrijska i harmonijska sredina koordinata taˇcke x ∈ Rn . Pokazati da su x 7→ A(x), G(x), H(x) konkavne funkcije, na skupovima Rn , Rn+ , int Rn+ , redom. p 11. Pokazati da je funkcija R 3 x → f (x) = (1 + kxk ) 2 konveksna za p > 1. n 2 64 12. Pokazati da je, za ai ∈ int Rn+ , funkcija Rn+ \ {0} 3 x 7→ f (x) = m X i=1 konveksna . 1 hai , xi 13. Neka je f pozitivna i konkavna na konveksnom skupu C ⊆ Rn . Dokazati da 1 je reciproˇcna funkcija konveksna. Mogu li konveksnost i konkavnost da f zamjene uloge? 14. Ako je f konveksna na Rm , a g konveksna na Rn , onda su konveksne i funkcije (f A)(x) := f (Ax), (Ag)(y) := inf Ax=y g(x). 15. Na´ci potporne funkcije skupova: x0 + B, B1 , {x > 0 : {(x1 , x2 ) : x1 + x22 2 Pn i=1 xi = 1} i 6 0}. 16. Na´ci f1 ⊕ f2 , f1 (x) = pozitivno definitne. 1 2 hA1 x, xi, f2 (x) = 1 2 hA2 x, xi, matrice A1 , A2 su 17. Ako konveksna funkcija ima parcijalne izvode, oni su neprekidni. 18. Odrediti f ∗ ako je x − , 2 f (x) = x(2 − x), x − 2, 19. Za funkciju ½ f (x) = √ − 1 + x, x2 − 1, −2 6 x < 0 06x62 26x −1 6 x 6 0 0 6 x 6 1, odrediti konjugovanu funkciju. Uporediti njihovu diferencijabilnost i konveksnost. √ 20. Pokazati da je funkcija x 7→ f (x) = − x1 x2 konveksna na R2+ , i na´ci njenu konjugovanu funkciju. 21. Odrediti f ∗ za funkciju f : [1, +∞[×[0, +∞[−→ R, 65 f (x1 , x2 ) = x22 − p x21 − 1. 22. Neka je C = H(1; 1)∩ int Rn+ . Na´ci f ∗ za C 3 x 7→ f (x) = 23. Na´ci f ∗ funkcije f (x) = 1 p n X Pn i=1 xi ln xi . |xi |p , p > 1. i=1 24. Odrediti konjugovanu funkciju za f : Rn → R, f (x) = max {0, ha, xi + α}. 25. Na´ci konjugovanu funkciju za Rn 3 x 7→ f (x) = max kx − ai k, gdje su i=1...m a1 , ..., am ∈ Rn . 26. Neka je f = f ∗ na Rn . Tada je f (x) = 12 kxk2 . 27. Neka gradijent konveksne funkcije f ispunjava Lipˇsicov uslov na Rn . Pokazati da je f ∗ jako konveksna funkcija na skupu C ⊆ {x ∈ Rn : ∂f ∗ (x) 6= ∅}. 28. Konveksna funkcija je subdiferencijabilna u x0 ∈ C ako i samo ako postoji s > 0 takav da za sve x ∈ C vrijedi f (x0 ) 6 f (x) + skx − x0 k. 29. Dokazati da je funkcija data sa q f (x1 , ..., xn ) = x21 + ... + x2k + x4k+1 + ... + x4n konveksna na Rn , klase C 1 na Rn \ {0} i odrediti ∂f (0). 30. Na´ci subdiferencijale funkcija n promjenljivih datih izrazima : max {xi : i = 1, ..., n}, max {|xi | : i = 1, ..., n}. 31. f konveksna h : v → f 0 (x0 , v). Tada ∂f (x0 ) = ∂h(0). 66 32. Za funkciju f (x) = ||x| − 1|, x ∈ R na´ci f ∗ , f ∗∗ , ∂f, ∂f ∗ . 33. Neka je f diferencijabilna i konveksna funkcija na Rn . Moˇze li da bude inf f (x) = −∞? x>0 34. Neka je f konveksna funkcija i ∇f (x0 ) > 0 za neki x0 ∈ Rn . Pomo´cu tih vektora odrediti donju granicu vrijednosti π u problemu min f (x), h1, xi 6 1, x > 0. 35. Neka je f diferencijabilna na Rn . Tada je x∗ taˇcka njenog globalnog minimuma ako i samo ako ∇f (x∗ ) = 0, f (x∗ ) = f ∗∗ (x∗ ). 36. Na´ci min f (x), x ∈ R, f (x) = brojevi (a1 < ... < an ). Pn i=1 |x − ai |, pri ˇcemu ai su dati realni 37. Za date vektore v 1 , ..., v m ∈ Rn , na kugli x ∈ B1 , na´ci minimum funkcije f (x) = m X kx − v i k 2 . i=1 38. Na´ci projekciju taˇcke T (0, 1) na poliedar dat sistemom nejednaˇcina: x1 + 3x2 > 3, 3x1 + 2x2 > 6, −x1 + x2 6 1. 39. Na´ci min à n X ! |xi − ai | , ako je x ∈ Rn i i=1 n X xi = 0. i=1 ˇ ” RJESENJA” 1. Hiperravan H(en ; 1) razdvaja date skupove, poˇsto za sve x ∈ C1 vrijedi hen , xi 6 ken kkxk 6 1, dok za sve x ∈ C2 imamo hen , xi = xn > 1 + x21 + · · · + x2n−1 > 1. Ovdje je C1 ∩ C2 6= ∅, ali (int C1 ) ∩ C2 = ∅. 67 2. Iz supc∈ C hc, xi = kxk. slijedi hc, xi 6 kxk, za proizvoljan c ∈ C i sve x, pa uzimaju´ci c = x imamo hx, xi 6 kxk, ˇsto znaˇci da je taˇcno c ∈ C ⇒ kck 6 1, odnosno C ⊆ K(0, 1). Pokaˇzimo da je taˇcna i suprotna inkluzija. Ako postoji c0 ∈ / C, kc0 k 6 1, onda (stroga separacija) postoje i vektor a 6= 0 i broj α takvi da vrijedi ha, c0 i > α > ha, ci, za sve c ∈ C. Tada je supc∈C ha, ci 6 α < ha, c0 i 6 kakkc0 k 6 kak. Znaˇci SC (a) < kak, ˇsto ne moˇze po uslovima zadatka, tako da je C ⊇ K(0, 1). 3. ext C = {e1 + e3 , e1 − e3 } ∪ (S \ {e1 }) nije zatvoren skup. 4. PC (x) = x − A> (AA> )−1 (Ax − b) 5. x ∈ C je vrh konveksnog skupa C ako i samo ako C \ {x} je konveksan. Zaista, neka su x1 , x2 u C \ {x}, koji je konveksan. Tada je [x1 , x2 ] ⊆ C \ {x} pa x∈ / [x1 , x2 ], i x nije vrh. Ako x jeste vrh, a x1 , x2 ∈ C \ {x} su proizvoljni, tada x∈ / [x1 , x2 ] ⊆ C. Stoga je [x1 , x2 ] ⊆ C \ {x}. 6. Kao i ...hy, xi 6 0, ali i hy, −xi 6 0 za sve x ∈ V, tako da je V ◦ = V ⊥ . 7. Koristimo uz K◦◦ = K i teoreme 2. i 15. {x : Ax = b, x > 0} 6= ∅ ⇔ b ∈ {Ax : x > 0} = {Ax : x > 0}◦◦ ⇔ hb, ui 6 0 ∀ u ∈ {Ax : x > 0}◦ ⇔ hb, ui 6 0 ∀ u ∈ {y : A> y > 0} ⇔ A> y > 0 ⇒ hb, yi 6 0. Uoˇcimo da smo u suˇstini koristili ˇcinjenicu da je polaran konus konaˇcno generisanog konusa homogen konus. 8. Za funkciju f : R2 → R, f (x, y) = −x2 + x3 − y 3 + y 4 vrijedi ¿µ ¶ À 2 ® 3x − 1 0 ∇ f (x)v, v = 2 v, v = 2(3x − 1)v12 + 6(2y 2 − y)v22 . 0 6y 2 − 3y £1 £ £1 £ Matrica ∇2 f je PsemiD na , +∞ × , +∞ pa je 3 2 © £1 £ £1 £ . Znaˇci f je konveksna, ª njen nivoski skup (x, y) ∈ 3 , +∞ × 2 , +∞ : f (x, y) 6 0 , odnosno dati skup, konveksan. 9... 68 99. Skup C1 = {y ∈ Rm : g(x) < y, za neki x ∈ C} je konveksan i neprazan. Ako je skup {x ∈ C : g(x) < 0} prazan, onda 0 ne pripada skupu C1 . Prema Teoremi separacije . postoji u ∈ Rm \ {0}, takav da vrijedi hu, yi > 0. Kako za svaki fiksiran x ∈ C, i svaki realan broj ε > 0 imamo g(x) + εe ∈ C1 , to je hu, g(x) + εei > 0. Sada, pri ε → 0, dobijamo nejednakost hu, g(x)i > 0, za svaki x ∈ C. Pokaˇzimo joˇs da je u > 0. Ako bismo imali da je neki uj < 0, uzimaju´ci y k = g(x) + εe + kej , k ∈ N dobili bismo limk hu, y k i = −∞. Obratno tvrdjenje imamo kontrapozicijom na osnovu implikacije g(x0 ) < 0, u 0 ⇒ hu, g(x0 )i < 0. 1 h1, xi je na Rn je linearna funkcija. x 7→ G(x) je Kob n Daglasova funkcija, pri α = 1, αi = n1 , i = 1, n, a ona je tada konkavna. Za n int Rn+ 3 x 7→ H(x) = 1 +···+ vrijedi 1 10. A(x) = x1 xn x−2 1 ¢ 2 2 2 ¡ −3 −2 − H (x)Diag(x−3 ∇2 H(x) = 2 H 3 (x) ... x−2 1 , ..., xn ). 1 , ..., xn n n x−2 n Nejednakost h∇2 H(x)v, vi 6 0, za sve v ∈ Rn , x ∈ int Rn+ ekvivalentna je sa ³P ´2 Pn 1 Pn vi2 n vi 6 si-Bunjakovskog za i=1 x2i i=1 xi i=1 x3i , a ovo je najednakost Koˇ ¶ ³ ´ µ √1 , ..., √1 √v1 3 , ..., √vn3 . x1 xn , x1 xn 11. Za Heseovu matricu date funkcije f vrijedi, za sve x, v ∈ Rn . 2 ® ¡ ¢ p−2 ¡ ¢ ∇ f (x)v, v = p 1 + kxk2 2 1 + (p − 1)kxk2 kvk2 > 0, Konveksnost slijedi i iz ˇcinjenice da je kompozicija konveksne funkcije sa rastu´com konveksnom funkcijom takod¯e konveksna. Ovdje je prva funkcija norma, a druga p t 7→ (1 + t2 ) 2 . 12. Budu´ci da je t 7→ 1t , t > 0 konveksna funkcija, imamo da za sve αi , βi > 0, λ ∈ [0, 1] vrijedi 1 1−λ λ 6 + , (1 − λ)αi + λβi αi βi pa uz αi = hai , xi, βi = hai , yi, i = 1, ..., m, nakon sumiranja, dobijamo m X i=1 m m X X 1 1 1 6 (1 − λ) + λ , i , xi i , yi hai , (1 − λ)x + λyi ha ha i=1 i=1 ˇsto znaˇci da je f konveksna. 69 13. Koristi se ista nejednakost kao u ... Konveksnost i konkavnost ne mogu da zamjene uloge. Npr. f (x) = x2 + 1 je konveksna funkcija na R, ali f1 nije konkavna. 14... 15... −1 −1 16. (A−1 1 + A2 ) 17... 18. Za y > 1 vrijedi sup(xy − f (x)) > sup(xy − f (x)) = sup(2 + x(y − 1)) = x>2 x∈R x>2 +∞. Za y 6 1. maksimum izraza 2 + x(y − 1) je 2y. x Preostale mogu´cnosti za xy −f (x) su xy + , za−2 6 x < 0, sa maksimumom 0, 2 ili −2(y+ 12 ), i xy−x(2−x), pri 0 6 x < 2. Za posljednji izraz, p(x) = x2 +(y−2)x vrijedi p(0) = 0, p(2) = 2y. Porede´ci ove vrijednosti zakljuˇcujemo y 6 − 12 −2y − 1, c 1 0, −2 6 y 6 0 f (y) = 2y, 06y61 19. ∗ f (y) = 1 −y − , 4y 1, y2 1+ , 4 y, y 6 − 12 − 21 6 y 6 0 06y62 y>2 . f je strogo konveksna funkcija, ali nije diferencijabilna. Njena konjugovana funkcija je diferencijabilna, ali nije strogo konveksna. Uopˇste, stroga konveksnostfunkcije f povlaˇci diferencijabilnost funkcije f c . 20. Za konveksnost ove funkcije vidjeti zadatak 10., uz α = −1, n = 2, α1 = α2 = 12 . f je pozitivno homogena funkcija pa je f c (y) = 0 na D(f c ). Odredimo D(f c ) = {y ∈ R2 : hy, xi 6 f (x) ∀x ∈ R2+ }. Za sve (x1 , x2 ) ∈ R2+ i √ y = (y1 , y2 ) treba da vrijedi y1 x1 + y2 x2 6 − x1 x2 . Mora biti y1 < 0, y2 < 0, 70 pa uzimaju´ci y1 = y2 = −x1 , x1 = x2 izlazi −2y12 6 y1 , tj. −2y1 > 1. Isto je i za drugu koordinatu, pa slijedi y1 y2 > 14 . p 2 )x2 Neka su y1 , y2 < 0 i y1 y2 > 14 . Imamo 2 (−y1 )x1 +(−y > 2 (−y1 )(−y2 )x1 x2 > 2 √ √ x1 x2 , tj. y1 x1 + y2 x2 6 − x1 x2 . ½ 0, y1 < 0, y2 < 0, 4y1 y2 > 1 f ∗ (y) = +∞, inaˇce 21. Za f (x1 , x2 ) = f1 (x1 ) + f2 (x2 ), je f c (y1 , y2 ) = f1c (y1 ) + f2c (y2 ). Zadatak se svodi na odred¯ivanje konjugovane funkcije za funkciju jedne p promjenljive (uz upotrebu diferencijalnog raˇcuna). Za funkciju f1 (x1 ) = ( − x21 − 1, x1 > 1, p 0, y2 < 0 dobija se f1c (y1 ) = − y12 − 1, y1 6 −1, dok je f2c (y2 ) = za y22 4 , y2 > 0 . f2 (x2 ) = x22 , x2 > 0. 2 p y2 − y 2 − 1, y1 6 −1, y2 > 0, 1 4 f c (y1 , y2 ) = −py 2 − 1, y 6 −1, y 6 0 . 1 1 2 22... 23... 24. Za a = 0 f je konstantna, pa je D(f c ) = {0}, i f c (0) = −max{0, α}. Uzmimo da je a 6= 0, i npr. a1 6= 0. Za y ∈ [0, a], tj. y = λa, 0 6 λ 6 1 vrijedi sup{hλa, xi − f (x)} 6 max{ x sup λha, xi, ha,xi6−α sup (λ − 1)ha, xi − α} = −λα. ha,xi>−α −α Dakle, [0, a] ⊆ D(f c ),a kako za x1 = 1 e1 vrijedi hλa, x1 i − f (x1 ) = −λα, to a je f c (λa) = −λα. Dokaˇzimo joˇs da je D(f c ) = [0, a]. Neka y ∈ dom(f c )\[0, a]. Taˇcka y moˇze se strogo razdvojiti od intervala. Postoji c 6= 0 takav da je hc, yi > hc, λai za sve λ ∈ [0, 1]. Uzimaju´ci λ = 0, pa λ = 1 doα bijamo hc, yi > 0, i hc, yi > hc, ai+ , za sve vrijednosti t ve´ce od nekog t0 . Sada t ³ n α o´ je sup(hy, xi−f (x)) > sup(hy, tci−f (tc)) > sup t hy, ci − max 0, ha, ci + = t x t>t0 t>0 +∞. Zakljuˇcno f c (y) = −y, y ∈ [0, a]. 71 25... 26... 0 0 0 27. Neka su y, y 0 ∈ C, i neka je x0 ∈ ∂f ∗ (y 0 ). Tada ® y L∈ ∂f (x 0),2tj.y = 0 0 0 0 ∇f (x ). Za f vrijedi f (x) 6 f (x ) + ∇f (x ), x − x + 2 kx − x k . Zbog f (x0 ) + f c (y 0 ) = hx0 , y 0 i dobijamo hy, xi − f (x) > f c (y 0 ) + hy − y 0 , xi − L2 kx − x0 k2 . Dalje je ¾ ½ ® L c 0 0 0 2 sup {hy, xi − f (x)} > f (y ) + sup y − y , x − kx − x k . 2 x x Stavljaju´ci q(x) = L 2 kx − x0 k2 , imamo f c (y) > f c (y 0 ) + q c (y − y 0 ). Kako je q c (y) = 1 k y k2 + hy, x0 i, 2L ® 1 izlazi f c (y) > f c (y 0 )+ x0 , y − y 0 + 2L ky −y 0 k2 . za sve y ∈ C. Ova nejednakost je isto ˇsto i ¿ À 1 1 0 2 1 f c (y) − kyk2 > f c (y 0 ) − ky k + x0 − y 0 , y − y 0 , 2L 2L L tako da posmatrana funkcija ima subgradijent u taˇcki y 0 (i to x0 − L1 y 0 ) Subdiferencijabilnost funkcije u svakoj taˇcki skupa povlaˇci njenu konveksnost. 28... 29. Funkcija je konveksna ako i samo ako je njena restrikcija na svaku duˇz iz domena konveksna. Zbog neprekidnosti date funkcije dovoljno je ustanoviti konveksnost na svakom otvorenom poluprostoru. ∇2 (f · f )(x) = 2f (x)∇2 f (x) + 2(∇f (x))> ∇f (x) ® 2 + f 3 (x) ∇2 f (x)v, v = (x21 + ... + x2k + x4k+1 + ... + x4n )(v12 + ... + vk2 + 6x2k+1 vk+1 3 2 2 2 2 3 ... + 6xn vn ) − (x1 v1 + ... + xk vk + 2xk+1 vk+1 + ... + 2xn vn ) > 2(x1 + ... + x2k + 2 x4k+1 + ... + x4n )(x2k+1 vk+1 + ... + x2n vn2 ) > 0, za sve v ∈ Rn . ∇2 f je pozitivno definitna na pomenutim poluprostorima. Odredimo jednostrani izvod funkcije f u 0, u pravcu v: f (0 + tv) − f (0) = t→0+ t f + (0; v) = lim 72 q v12 + ... + vk2 . ® Pomo´cu formule y 0 ∈ ∂f (0) ⇔ f + (0; v) > y 0 v ∀ v, dobija se © ª ∂f (0) = x ∈ Rn : x21 + ... + x2k 6 1, xk+1 = ... = xn = 0 . 30. Za f (x) = max fi (x), gdje su fi konveksne, vrijedi i=1,...,n [ ∂f (x) = co ∂fi (x), J (x) = {i : fi (x) = f (x)}. i ∈ J (x) U prvom sluˇcaju je fi (x) = xi , ∇fi (x) = ei , ∂fi (x) = {∇fi (x)}, ∂f (0) = co {e1 , ..., en } = σ n . Za f (x) = kxk∞ vrijedi ∂f (0) = co n [ [−ei , ei ] = B1 (0, 1). i=1 31... 32. Funkcija f ∗ moˇze se dobiti direktno. Med¯utim, uoˇcimo da je f = f1 ∧f2 , f1 (x) = |x − 1|, f2 (x) = |x + 1|. Pri tome je D(f1∗ ) = D(f2∗ ) = [−1, 1], f1∗ (y) = y, f2∗ (y) = −y. Sada, zbog (f1 ∧ f2 )∗ = f1∗ ∨ f2∗ , imamo f ∗ (y) = max{−y, y} = |y|, y ∈ [−1, 1]. Dalje, f ∗∗ (x) = 0na intervalu [−1, 1], a za ostale vrijednosti je f cc = f . Funkcija f je diferencijabilna, osim u taˇckama: -1, 0, 1. Na primjer, ∂f (1) = [f 0 − (1), f 0 + (1)] = [0, 1], ∂f (0) = ∅. 33... 34. Zbog ∇f (x0 ) > 0, imamo da je ® ® minn ∇f (x0 ), x = ∇f (x0 ), 0 = 0. x∈σ ® ® Iz konveksnosti funkcije f na Rn slijedi f (x)−f (x0 ) > ∇f (x0 ), x − ∇f (x0 ), x0 , ® pa za sve x ∈ σn vaˇzi nejednakost f (x) − f (x0 ) > 0 − ∇f (x0 ), x0 , odnosno ® f (x) > f (x0 ) − ∇f (x0 ), x0 , 35. Neka je x∗ taˇcka minimuma funkcije f , koja je u njoj diferencijabilna. Uslov ∇f (x∗ ) = 0 je poznat. Dalje, kako je uvijek f cc = f 6 f , to je i f cc (x∗ ) 6 f (x∗ ). 73 Konstantna funkcija a : x 7→ f (x∗ ) je afina minoranta funkcije f , pa je a 6 f , i specijalno vrijedi f (x∗ ) 6 f (x∗ ), odnosno f (x∗ ) 6 f cc (x∗ ). Pretpostavimo sada da je ∇f (x∗ ) = 0, i f (x∗ ) = f cc (x∗ ), pa dokaˇzimo da je x∗ taˇcka minimuma funkcije f cc . Tada ´ce zbog f (x∗ ) = f cc (x∗ ) 6 f cc (x) 6 f (x) ∀ x ∈ Rn , x∗ da bude taˇcka minimuma funkcije f . Dalje, poˇsto je f cc konveksna funkcija dosta je dokazati da je njen gradijent u x∗ nula vektor. Dakle, za t > 0 vrijedi f cc (x∗ + tek ) − f cc (x∗ ) f (x∗ + tek ) − f (x∗ ) 6 . t t Odavde , na osnovu pretpostavke ∇ f (x∗ ) = 0 dobijamo (f cc )0+ (x∗ , ek ) 6 0. Isto je i za pravac −ek , te za sve k=1,...,n vrijedi 0 6 (−f cc )0+ (x∗ , −ek ) 6 (f cc )0+ (x∗ , ek ) 6 0, odakle slijedi ∇f cc (x∗ ) = 0. Primjedba. Ovo je uopˇstenje Fermaove teoreme. Primjetimo da za funkcije konveksne i diferencijabilne na Rn drugi uslov je ispunjen, tako da je tada f (x∗ ) = minf (x) ⇔ ∇f (x∗ ) = 0. 36. Data funkcija je konveksna, ali nije diferencijabilna pa ´cemo koristiti sljede´ce: f (x∗ ) = minf (x) ⇔ 0 ∈ ∂ f (x∗ ) Uzmimo: f (x) = je n X fk (x), fk (x) = |x − ak |. Tada je ∂f (x) = k=1 n X k=1 {−1}, [−1, 1] , ∂fk (x) = {1}, 74 x < ak x = ak x > ak . ∂fk (x), gdje Slijedi ∂f (ak ) = [2k − n − 2, 2k − n], i ∂f (x) = {2k − n}, za ak < x < ak+1 . U sluˇcaju da je n neparan vrijedi ∂f (a n+1 ) = [−1, 1], dok pri parnom n imamo 2 ∂f (a n2 ) = [−2, 0], ∂f (a n2 +1 ) = [0, 2], i ∂f (x) = {0}, za sve x ∈ (a n2 , a n2 +1 ). U svim ostalim sluˇcajevima 0 nije u subdiferencijalu. Dakle, za neparan n je x∗ = a n+1 , 2 a za parne vrijednosti skup taˇcaka minimuma je £ ¤ a n2 , a n2 +1 . 37. G = {x ∈ Rn hx, xi 6 1}, L(x, α) = m X kx − v i k2 + α(hx, xi − 1). KKT i=1 uslovi su: m X (x − v i ) + αx = 0, α(kxk2 − 1) = 0, α > 0, kxk 6 1. i=1 v1 + · · · + vm , dobijamo za prvu jednaˇcinu (m + α)x = mv 0 . m ¡ ¢ U sluˇcaju da je kv 0 k 6 1, KKT taˇcka je v 0 , 0 uz α = 0. Ako je kv 0 k > 1, α+m , tako da je onda mora biti α > 0, kxk = 1 (druga jednaˇcina) i kv 0 k = m µ 0 ¶ v , m(kv 0 k − 1) odgovaraju´ca KKT taˇcka. kv 0 k Zadatak je konveksne optimizacije pa je njegovo optimalno rjeˇsenje 0 kv 0 k 6 1 v , ∗ x = v0 , kv 0 k > 1. kv 0 k Stavljaju´ci v 0 = 38. Neka je P dati poliedar. Za traˇzenu projekciju x∗ = PP (e2 ) vrijedi q ke2 − x∗ k = min x21 + (x2 − 1)2 . x∈P Korjena funkcija strogo raste pa dovoljno je rijeˇsiti problem kvadratne minimizacije: min x21 + (x2 − 1)2 , x ∈ P. ¶ µ ¶ µ ¶ µ 8 12 21 12 21 , , y ∗ = 0, , 0, 0, 0 , PP (e2 ) = , . x∗ = 13 13 13 13 13 39... 75 LITERATURA [1 ] V.M. Alekseev, E.M. Galeev, V.M. Tihomirov. Sbornik zadaˇc po optimizacii. Nauka, Moskva, 1984. [2 ] J.M. Borwein, A.S. Lewis. Convex Analysis and Nonlinear Optimization. Springer, New York, 2000. Borwein J., Vanderwerff J. Convex functions: Constructions, characterizations and counterexamples CUP, 2010 [3 ] S. Boyd, L. Vanderberghe. Convex Optimization. Cambridge University Press, 2004. [4 ] K-H. Elster, R. Reinhardt, M. Sch¨auble, G. Donath. Einf¨ uhrung in die nichtlineare optimierung. Teubner, Leipzig, 1977. [5 ] P.M. Gruber. Convex and Discrete Geometry. Springer-Verlag, BerlinHeidelberg, 2007. [6 ] J-B. Hiriart-Urruty; C. Lemarchal. Fundamentals of convex analysis. SpringerVerlag, Berlin, 2001. [7 ] L. H¨ermander. Notions of convexity. Birkhauser, 1994 [8 ] M. Jovanovi´c. Diferencijalni raˇcun na Rn , Konveksne funkcije, Ekstremi. Prirodno-matematiˇcki fakultet, Banja Luka, 2001. Magaril-Il’yaev G.G., Tikhomirov V.M. Convex analysis: theory and applications TMM222, AMS, 2003 [9 ] M. Moszynska, Selected Topics in Convex Geometry. Birkh¨auser, boston, 2006. Niculescu C.P., Persson L.-E. Convex functions and their applications: A contemporary approach Springer, 2006 10. A. W. Roberts, D.E. Varberg. Convex functions. Academic Press, New York and London, 1973. 11. R. T. Rockafellar. Convex Analysis. Princeton, New Yersey, Princeton University Press, 1997. . Stoer Witzgal Convexity 12. A. G. Suharev, A.V. Timohov, V.V. Fedorov. Kurs metodov optimizaciji. Nauka, Moskva, 1986. [.] J. van Tiel. [.] F. Valentine. 13. F. P. Vasilev. Metodi Optimizacii. Faktorial Press, Moskva, 2002. 14. S. Vre´cica. Konveksna Analiza. Mat. fak. , Beograd, 1993 76 15. W. Weil. A Course on Convex Geometry. University of Karlsruhe, 2005. 16. R. Webster. Convexity. University Oxford Press Inc., New York, 1994. 77
© Copyright 2024 Paperzz