Nermin Okiˇci´c Vedad Paˇsi´c MATEMATIKA II 2014 Sadrˇ zaj 1 Funkcije viˇ se promjenljivih 1.1 Pojam funkcije viˇse promjenljivih . . . . . . . . . 1.1.1 Osnovni elementi preslikavanja . . . . . . . 1.1.2 Grafiˇcko predstavljanje funkcija . . . . . . 1.2 Graniˇcna vrijednost funkcije n varijabli . . . . . . 1.2.1 Pojam graniˇcne vrijednosti . . . . . . . . . 1.2.2 Simultana i uzastopna graniˇcna vrijednost 1.3 Neprekidnost funkcije n varijabli . . . . . . . . . . 2 Diferencijabilnost funkcije n varijabli 2.1 Izvod u pravcu . . . . . . . . . . . . . . . . 2.2 Parcijalni izvod i parcijalni diferencijal . . . 2.3 Gradijent . . . . . . . . . . . . . . . . . . . 2.4 Diferencijabilnost funkcija viˇse promjenljivih 2.5 Pravila diferenciranja . . . . . . . . . . . . . 2.6 Izvodi viˇseg reda, Hesseova matrica . . . . . 2.7 Diferencijali viˇseg reda . . . . . . . . . . . . 2.8 Ekstremumi funkcija viˇse promjenljivih . . . 2.8.1 Nalaˇzenje lokalnog ekstrema . . . . . 2.8.2 Nalaˇzenje globalnog ekstrema . . . . 2.8.3 Uslovni ekstrem . . . . . . . . . . . . i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2 2 5 12 12 19 23 . . . . . . . . . . . 28 28 31 38 40 51 52 62 64 65 70 74 Poglavlje 1 Funkcije viˇ se promjenljivih 1.1 1.2 1.3 Pojam funkcije viˇ se promjenljivih . . . . . . . . 2 1.1.1 Osnovni elementi preslikavanja . . . . . . . . . . . 2 1.1.2 Grafiˇcko predstavljanje funkcija . . . . . . . . . . . 5 Graniˇ cna vrijednost funkcije n varijabli . . . . . 12 1.2.1 Pojam graniˇcne vrijednosti . . . . . . . . . . . . . 12 1.2.2 Simultana i uzastopna graniˇcna vrijednost . . . . . 19 Neprekidnost funkcije n varijabli . . . . . . . . . 23 Notacija y = f (x), gdje je f : R → R, sluˇzila nam je za iskazati da je varijabla y zavisna od jedne varijable x, tojest re´ci da je y funkcija od x. Domen ovakve funkcije f bio je skup realnih brojeva (ili neki njegov podskup). Mnoge veliˇcine mogu se posmatrati u zavisnosti o viˇse varijabli, te su onda one funkcije viˇse varijabli. Naprimjer, zapremina kruˇznog cilindra je veliˇcina ovisna o polupreˇcniku osnove cilindra (r) i njegove visine (H), tj. V = πr 2 H, pa kaˇzemo da je V funkcija dvije varijable r i H. Izaberemo li notaciju za ovu funkciju sa f , tada je V = f (r, H), te imamo da je f (r, H) = πr 2 H , ( r > 0 , H > 0 ) . Pri tome su ograniˇcenja na polupreˇcnik osnove (r > 0) i visinu (H > 0) prirodni uslovi jer te veliˇcine ne mogu biti negativne, a ni nule jer takav cilindar onda ne postoji. Svaka dva tijela u univerzumu djeluju jedno na drugo silom, direktno proporcionalno njihovim masama i obrnuto proporcionalno kvadratu njihovog rastojanja (Newtonov zakon univerzalne gravitacije). Dakle, intenzitet gravitacionog privlaˇcenja (F ) izmedu tijela mase m1 i tijela mase m2 , koja se nalaze na rastojanju r, je funkcija tri varijable, F = F (m1 , m2 , r) = Gm1 m2 , m1 , m2 , r > 0 , r2 gdje je G univerzalna gravitaciona konstanta. 1 1.1. Pojam funkcije viˇse promjenljivih 1.1 Pojam funkcije viˇse promjenljivih Neka su SX ⊆ Rn i SY ⊆ Rm proizvoljni skupovi. Definicija 1.1.1 Ako svakoj taˇcki X ∈ SX po nekom zakonu ili pravilu f dodijelimo taˇcno jednu taˇcku Y ∈ SY , kaˇzemo da je sa f definisano preslikavanje ili funkcija sa SX u SY . S obzirom na domen (SX ) i kodomen (SY ) ovako definisanog preslikavanja, uobiˇcajeno se za ovakvo preslikavanje kaˇze da je vektorska funkcija (izlazni rezultat je vektor u Rm ) vektorske promjenljive (ulazna veliˇcina je vektor iz Rn ). Definicija 1.1.2 Pod realnom funkcijom n realnih promjenljivih podrazumijevamo svako preslikavanje f : Df → R, gdje je Df ⊂ Rn . Pri tome za proizvoljno X(x1 , x2 , ..., xn ) ∈ Df piˇsemo f (x1 , x2 , ..., xn ) = y ili f (X) = y . U kontekstu komentara iza prve definicije, za ovakvo preslikavanje kaˇzemo da je realna funkcija (izlazni rezultat funkcije je realan broj) vektorske promjenljive (ulazna veliˇcina je vektor iz Rn ). Kako uredena n-torka oznaˇcava taˇcku u n-dimenzionalnom euklidskom prostoru, to ´cemo ˇcesto funkciju f zvati funkcija taˇcke. Funkcija koja svakoj taˇcki trodimenzionalnog prostora dodjeljuje temperaturu u toj taˇcki, primjer je takve funkcije, ili funkcija koja prikazuje bruto nacionalni dohodak neke drˇzave. U prvom sluˇcaju domen funkcije je trodimenzionalan, dok je u drugom sluˇcaju, zbog kompleksnosti pojma ”bruto nacionalni dohodak”, mnogo ve´cih dimenzija (npr. stotinu). Bez obzira ˇsto ´cemo mi govoriti o proizvoljnom n-dimenzionalnom prostoru, naˇsi primjeri ´ce najˇceˇs´ce biti u dvije ili tri dimenzije. 1.1.1 Osnovni elementi preslikavanja U izrazu f : Df → R, skup Df nazivamo domenom funkcije f i kao i kod funkcije jedne varijable, podrazumijevamo da je to ”najˇsiri” skup taˇcaka X(x1 , x2 , ..., xn ) ∈ Rn za koje izraz f (x1 , x2 , ...xn ) ima smisla, tojest da je to neki realan broj. Realne brojeve x1 , x2 , ..., xn nazivamo nezavisne varijabe, 2 1.1. Pojam funkcije viˇse promjenljivih argumenti ili promjenljive funkcije f . Za funkciju f : R2 → R, zadatu sa z = f (x, y), kaˇzemo da je funkcija dviju nezavisnih varijabli x i y, pri ˇcemu je z zavisna varijabla. Za funkciju g : R3 → R, gdje je w = g(x, y, z), w je zavisna varijabla, a x, y, z su nezavisne varijable funkcije tri promjenljive. Domen funkcije n varijabli je proizvoljan podskup prostora Rn . On moˇze biti otvoren ili zatvoren skup i u principu se sastoji od unutraˇsnjih i rubnih taˇcaka. unutraˇsnja taˇcka b (x, y) D D rubna taˇcka (x,b y) (a) (b) Slika 1.1: Unutraˇsnja i rubna taˇcka oblasti u ravni. Unutraˇsnja taˇcka je obavezno taˇcka skupa D, dok to za rubnu taˇcku nije sluˇcaj. Taˇcka X je unutraˇsnja taˇcka skupa D ako oko nje moˇzemo opisati kuglu koja komletno leˇzi unutar skupa D (B(X, r) ⊆ D). Ako se skup D sastoji samo od unutraˇsnjih taˇcaka, onda je on otvoren skup. Taˇcka X je rubna taˇcka skupa D (X ∈ ∂D) ako svaka kugla opisana oko nje sadrˇzi i taˇcke van tog skupa. Rubne taˇcke nisu obavezno elementi skupa. Ako skup D sadrˇzi sve svoje rubne taˇcke, onda je on zatvoren skup. b b 0 1 (a) Otvorena jediniˇcna kugla, {(x, y) | x2 + y 2 < 1} 0 1 (b) Rub jediniˇcne kugle, {(x, y) | x2 + y 2 = 1} (kruˇznica) 0 1 (c) Zatvorena jediniˇcna kugla, {(x, y) | x2 + y 2 ≤ 1} Slika 1.2: Unutraˇsnje i rubne taˇcke jediniˇcne kugle u ravni. Sliˇcno intervalima na realnoj pravoj koji mogu biti otvoreni ((a, b)), zatvoreni ([a, b]) ili ni otvoreni ni zatvoreni ((a, b] ili [a, b)), i oblast u viˇsedimenzionalnom prostoru ne mora biti ni zatvorena ni otvorena. Na slici 1.2 je prikazana 3 1.1. Pojam funkcije viˇse promjenljivih situacija da ako otvorenoj kugli (a) ”dodamo” sve taˇcke ruba (b), dobijamo zatvorenu kuglu (c). Naravno, ako otvorenom skupu dodamo samo neke taˇcke ruba (ne sve), takav skup ne bi bio ni otvoren ni zatvoren. Dio prostora je ograniˇcen ako leˇzi unutar neke kugle fiksnog radijusa, u suprotnom kaˇzemo da je on neograniˇcen. Dakle, skup A ⊂ Rn je ograniˇcen ako postoji kugla B(X, r) (X ∈ Rn , r > 0), takva da je A ⊆ B(X, r). Primjeri ograniˇcenih skupova u R2 i R3 su: segment, trougao, pravougaonik, unutraˇsnjost kruga, elipsoid i sl. Neograniˇceni skupovi su npr. prava linija, kvadranti, poluravni, oktanti i sl. Primjer 1.1. Za funkciju f : Df → R, p f (x, y) = 1 − x2 − y 2 , unutraˇsnjost domena x i y su nezavisne varijable, a domen je Df = {(x, y) ∈ R2 | x2 + y 2 ≤ 1}. Domen je ograniˇcen i zatvoren skup. Df rub domena ♦ Primjer 1.2. unutraˇsnjost domena Za funkciju f : Df → R, f (x, y) = log (y − x2 ) , Df x i y su nezavisne varijable, a domen je Df = {(x, y) ∈ R2 | y > x2 }. Domen je neograniˇcen skup i u ovom primjeru on se sastoji samo od unutraˇsnjih taˇcaka. rub domena ♦ Kodomen funkcija viˇse varijabli je dio realne prave i naravno diktiran je samom funkcijom. Funkcija f (x, y) = x + y 1 f (x, y) = 2 2 p x +y +1 2 z = y−x z = log(1 − x2 − y 2) 1 z= xy z2 w= 2 x + y2 Domen R2 Kodomen R R2 (0, 1) y ≥ x2 x2 + y 2 < 1 [0, +∞) (−∞, +∞) xy 6= 0 (−∞, 0) ∪ (0, +∞) x2 + y 2 6= 0 [0, +∞) 4 1.1. Pojam funkcije viˇse promjenljivih 1.1.2 Grafiˇ cko predstavljanje funkcija U grafiˇckom predstavljanju funkcija viˇse varijabli uobiˇcajena su dva naˇcina, pomo´cu nivo linija i pomo´cu grafa. Definicija 1.1.3 Za datu funkciju f : Rn → R i realan broj c, skup L = {(x1 , x2 , ..., xn ) ∈ Rn | f (x1 , x2 , ..., xn ) = c} nazivamo nivo skup funkcije f za nivo c. Za n = 2, L nazivamo nivo kriva funkcije f , a za n = 3, kaˇzemo da je L nivo povrˇs funkcije f . Crtanje koje prikazuje nivo skupove za razliˇcite nivoe nazivamo konturno crtanje funkcije. z z Konturna linija z y z=c x y x x y Nivo linija (a) Presjek sa ravni z = c (b) Pogled sa z-ose (c) Nekoliko sjeka pre- Slika 1.3: Konturna linija grafa i njoj odgovaraju´ca nivo linija. Naprimjer, kod funkcije dvije promjenljive z = f (x, y), drˇze´ci z fiksnim, tj. stavljaju´ci f (x, y) = c, geometrijski to tumaˇcimo kao presjecanje povrˇsi f (x, y) sa ravni z = c (Slika 1.3 (a)). U presjeku (crvena linija) dobijamo sve taˇcke povrˇsi f (x, y) ˇcija je vrijednost (vrijednost zavisne promjenljive z) jednaka c i datu liniju nazivamo konturna linija (kriva). Projektovanjem konturne linije u xOy ravan dobijamo liniju koju nazivamo nivo linija (kriva). Ovo moˇzemo zamisliti kao da figuru na slici (1.3) gledamo iz neke ”daleke” taˇcke na z-osi, ˇsto vidimo na slici (1.3.(b)). Rade´ci ovaj postupak za razne c, dobijamo konturnu sliku grafa. Primjer 1.3. Neka je f : R2 → R, zadata sa f (x, y) = 4 − 2x2 − y 2. Za zadato c ∈ R, skup taˇcaka koje zadovoljavaju jednakost 4 − 2x2 − y 2 = c predstavlja nivo skup funkcije f . Jasno, ako je c > 4, taj skup je prazan 5 1.1. Pojam funkcije viˇse promjenljivih jer bi u tom sluˇcaju imali da je −2x2 − y 2 > 0, ˇsto oˇcigledno nije mogu´ce niti za jedno (x, y) ∈ R2 ; za c = 4 on se sastoji samo od jedne taˇcke, (0, 0) (rjeˇsenje jednaˇcine −2x2 − y 2 = 0 je samo jedna taˇcka (x, y) = (0, 0)); za c < 4 taj skup je elipsa sa centrom u koordinatnom poˇcetku, tj. za svako c < 4 nivo linija je predstavljena elipsom, ˇsto je prikazanao na donjoj slici (slika 1.4 desno) za nekoliko razliˇcitih nivoa (izborom vrijednosti konstante c = −2, c = −1, c =y 0 i c = 1). ♦ c = −2 c = −1 c=0 c=1 z x b (b) Nivo linije funkcije f (x, y) = 4 − 2x2 − y 2 . (a) Pogled sa z-ose Slika 1.4: Formiranje konturne slike. Primjer 1.4. Neka je f : R2 → R, zadata sa p sin x2 + y 2 f (x, y) = p . x2 + y 2 Za proizvoljnu taˇcku (x, y) na centralnoj kruˇznici x2 + y 2 = r 2 , polupreˇcnika r > 0, funkcija f (x, y) ima konstantnu vrijednost sinr r , pa ´ce nivo linije ove funkcije, kao ˇsto je prikazano na slici (1.5 (a)), biti koncentriˇcni krugovi sa centrom u koordinatnom poˇcetku. ♦ 2 1 −3 −2 −1 1 2 −1 −2 p sin x2 + y 2 Slika 1.5: Nivo linije povrˇsi f (x, y) = p . x2 + y 2 −3 6 1.1. Pojam funkcije viˇse promjenljivih Primjer nivo linija imamo u kartografiji. Naime, kada na karti, koja je dvodimenzionalni prikaz trodimenzionalnog terena, ˇzelimo prikazati planinu, onda to upravo ˇcinimo prikazom punom linijom onih taˇcaka te planine koje su na istoj nadmorskoj visini. To je prikazano na slici 1.6, gdje se ”uve´canje” nivo linija (nadmorske visine) dobija uve´canjem nadmorske visine za 100 metara. Ovim naˇcinom takode predstavljamo izobare (podruˇcja sa istim pritiskom), izoterme (podruˇcja sa istom temperaturom) i sl. 10 0 30 20 0 0 0 0 40 50 653 60 0 30 400 0 500 Slika 1.6: Prikazivanje nadmorskih visina pomo´cu nivo linija. Primjer 1.5. Posmatrajmo funkciju f : R3 → R, zadatu sa f (x, y, z) = x2 + 2y 2 + 3z 2 . Jedna nivo povrˇs ove funkcije zadata je jednaˇcinom x2 + 2y 2 + 3z 2 = 1 , ˇsto predstavlja jednaˇcinu elipsoida. Primjetimo da ako u gornjoj jednaˇcini fiksiramo z = z0 , dobijamo jednaˇcinu x2 + 2y 2 = 1 − 3z02 , a to su elipse u xOy ravni, ˇsto opravdava ˇcinjenicu da su nivo povrˇsi funkcije f elipsoidi (sliˇcno smo mogli fiksirati i varijable x i y i dobiti da su projekcije u yOz ravan i u xOz ravan takode elipse). Generalno, nivo povrˇsi date funkcije su elipsoidi x2 + 2y 2 + 3z 2 = c, gdje je c ∈ R proizvoljna konstanta. ♦ z y x Slika 1.7: Nivo povrˇsi funkcije f (x, y, z) = x2 + 2y 2 + 3z 2 (elipsoidi). Narednim slikama su prikazane neke povrˇsi (funkcije dvije varijable) zajedno sa svojim konturnim grafovima. 7 1.1. Pojam funkcije viˇse promjenljivih 4 2 2 5 0 0 -2 0 -5 -2 0 -4 -4 0 -2 2 5 4 (a) -5 (b) Slika 1.8: Nivo linije (a) i graf (b) funkcije f (x, y) = x2 y x2 + y 2 6 4 2 0.5 0 5 0.0 -0.5 -2 0 -5 -4 0 -5 -6 -6 -4 -2 0 2 4 5 6 (a) (b) Slika 1.9: Nivo linije (a) i graf (b) funkcije f (x, y) = xy x3 + y 3 6 4 2 2 1 0 5 0 -1 -2 -2 0 -5 -4 0 -5 -6 -6 -4 -2 0 2 4 5 6 (a) (b) Slika 1.10: Nivo linije (a) i graf (b) funkcije f (x, y) = sin x + cos y Kod prouˇcavanja funkcije jedne promjenljive, y = f (x), svakom smo paru (x, y) pridruˇzivali jednu taˇcku M(x, y) u realnoj ravni. Skup svih takvih taˇcaka M, ˇcinio je grafik funkcije f i on je bio predstavljen kao kriva linija u ravni. U sluˇcaju kada posmatramo funkciju dvije promjenljive z = f (x, y), grafik funkcije ´ce biti izraˇzen taˇckama M(x, y, z), dakle u trodimenzionalnom prostoru. Pri tome vrijedi 8 1.1. Pojam funkcije viˇse promjenljivih 1◦ Svaka taˇcka grafika, M(x, y, z), ima apscisu (po x-osi) i ordinatu (po y-osi) koje predstavljaju koordinate neke taˇcke X(x, y) iz domena funkcije, i aplikatu (po z-osi) koja je jednaka vrijednosti funkcije u taˇcki X(x, y). 2◦ Svaka taˇcka M(x, y, z) prostora za koju taˇcka X(x, y) pripada domenu funkcije, a aplikata z je jednaka vrijednosti funkcije u taˇcki X, pripada grafiku funkcije. z b aplikata b M apscisa ordinata b y b b X x Na osnovu reˇcenog zakljuˇcujemo da je grafik funkcije slika njene oblasti definisanosti. Ako je z = f (x, y) definisana u oblasti D ⊆ R2 , njen grafik predstavlja povrˇs u prostoru R3 , ˇcija je projekcija na xy-ravan oblast D. Definicija 1.1.4 Neka je f : Df → R, Df ⊆ Rn . Skup G = (x1 , x2 , ..., xn , xn+1 ) ∈ Rn+1 | xn+1 = f (x1 , x2 , ..., xn ) , nazivamo graf funkcije f . Primjetimo da je graf G funkcije f : Rn → R u prostoru Rn+1 , pa kao posljedicu toga imamo da smo u mogu´cnosti geometrijski predstavljati samo sluˇcajeve kada je n = 1 i tada imamo krivu koja predstavlja funkciju jedne varijable, i kada je n = 2 u kom sluˇcaju je graf povrˇs u trodimenzionalnom ˇ bi bila geometrijska interpretacija grafika funkcije 3 i viˇse prostoru. Sta promjenljivih za sada nam je nemogu´ce re´ci, s obzirom da nemamo naˇcin da prikaˇzemo uredene ˇcetvorke, petorke itd. Primjer 1.6. Graf funkcije f (x, y) = 2x2 + y 2, f : R2 → R, prestavlja skup uredenih trojki (x, y, z) ∈ R3 , koje zadovoljavaju jednakost z = 2x2 + y 2 . Da 9 1.1. Pojam funkcije viˇse promjenljivih bi smo predstavili graf ove funkcije u R3 , koristimo ideju da predstavljamo dijelove tog grafa koji leˇze iznad mreˇze linija paralelnih osama u xy-ravni. Npr., za jedno fiksirano x = x0 , skup taˇcaka koje zadovoljavaju jednaˇcinu z = 2x20 + y 2 , predstavlja parabolu koja leˇzi iznad linije x = x0 u xy-ravni. Na isti naˇcin, ako fiksiramo y = y0 , skup taˇcaka koje zadovoljavaju jednaˇcinu z = 2x2 + y02, je parabola koja leˇzi iznad linije y = y0 . Ako istovremeno nacrtamo viˇse tih parabola za razne x = x0 i y = y0 , dobijamo mreˇznu predstavu te povrˇsi (grafa) i u ovom sluˇcaju ta povrˇs je paraboloid (Slika 1.11). ♦ z x0 y0 y x Slika 1.11: Paraboloid; Graf funkcije z = 2x2 + y 2 . Primjer 1.7. Mada se za grafove mnogih funkcija moˇzemo posluˇziti idejom mreˇze, izloˇzenom u gornjem primjeru, za ve´cinu funkcija dobra slika njihovih grafova zahtjeva upotrebu raˇcunarske grafike ili eventualno mnogo umjetniˇcke vjeˇstine. Tako naprimjer, za predstavljanje grafa funkcije p sin x2 + y 2 , f (x, y) = p x2 + y 2 moˇzemo se posluˇziti konturnim crtanjem i zakljuˇciti da graf funkcije osciluje ukoliko se pomjeramo od koordinatnog poˇcetka u bilo kom pravcu, taˇcnije da sin r nivo krugovi iz konturnog crtanja rastu i opadaju sa oscilacijom , gdje je r p r = x2 + y 2. Ekvivalentno, dijelovi grafa funkcije f iznad proizvoljne linije u xy-ravni koja prolazi kroz koordinatni poˇcetak, predstavljeni su funkcijom z= sin r . r 10 1.1. Pojam funkcije viˇse promjenljivih Ovo zaista jeste dobra ideja za predstavljanje grafa funkcije f , ali iskreno govore´ci mnogi ne bi bili u stanju produkovati sliku tog grafa koja je prikazana na slici (1.12). Primjetimo takode da naˇsa funkcija nije definisana u taˇcki (0, 0) ali da ona teˇzi ka vrijednosti 1, kada taˇcka (x, y) teˇzi ka (0, 0), ˇsto je opravdano ˇcinjenicom sin r lim =1. r→0 r ♦ z y x √ 2 2 x +y √ Slika 1.12: Graf funkcije f (x, y) = . 2 2 sin x +y Ovdje treba otkloniti i nedoumicu oko funkcija oblika z = sin x (Slika 1.13 lijevo) ili z = y 2 (Slika 1.13 desno). Naime, u oba sluˇcaja podrazumijevamo da je z = z(x, y) pa grafici predstavljaju povrˇsi u prostoru, a nepojavljivanje neke od varijabli znaˇci njenu proizvoljnost u definisanosti funkcije. z z y y x x Slika 1.13: (lijevo) z = sin x, (desno) z = y 2 . Primjeri joˇs nekih funkcija dvije varijable: 11 1.2. Graniˇcna vrijednost funkcije n varijabli z z y x y x f (x, y) = (4 − x2 − y 2)e−(x 1.2 1.2.1 2 +y 2 ) f (x, y) = 10 x3 + xy 4 − x 5 e−(x 2 +y 2 ) 2 +y 2 ) + e−((x−1.225) Graniˇ cna vrijednost funkcije n varijabli Pojam graniˇ cne vrijednosti Neka je data funkcija y = f (x1 , x2 , ..., xn ) i A(a1 , a2 , ..., an ) ∈ Rn . Sa UA oznaˇcimo proizvoljnu okolinu taˇcke A i neka je L ∈ R i UL okolina taˇcke L. Definicija 1.2.1 Funkcija n nezavisnih projenljivih, f (x1 , x2 , ..., xn ) = f (X), ima u taˇcki A(a1 , a2 , ..., an ) graniˇcnu vrijednost jednaku L, ako vrijedi, 1◦ taˇcka A je taˇcka nagomilavanja domena funkcije f , 2◦ za proizvoljnu okolinu UL , postoji okolina UA , tako da se vrijednost funkcije f (X) nalazi u okolini UL za svaku taˇcku X 6= A koja se nalazi u UA . ˇ Cinjenicu da funkcija f ima u taˇcki A graniˇcnu vrijednost jednaku L, simboliˇcki zapisujemo sa lim f (X) = X→A lim (x1 ,...,xn)→(a1 ,..,an ) f (X) = lim x1 →a1 ,...,xn→an f (x1 , x2 , ..., xn ) = L . Posmatrani limes nazivamo simultani limes, a odgovaraju´cu graniˇcnu vrijednost nazivamo simultana graniˇcna vrijednost. Istaknimo da za postojanje graniˇcne vrijednosti, sama taˇcka A ne mora pripadati domenu funkcije f , ˇsto istiˇcemo prvim zahtjevom u gornjoj definiciji. Ako se za okoline UA koriste sferne okoline, onda gornju definiciju moˇzemo iskazati na sljede´ci naˇcin. 12 1.2. Graniˇcna vrijednost funkcije n varijabli Definicija 1.2.2 Funkcija f u taˇcki A ∈ Rn ima graniˇcnu vrijednost jednaku L ako vrijedi, 1◦ taˇcka A je taˇcka nagomilavanja domena funkcije f , 2◦ za proizvoljno ε > 0, postoji δ = δ(ε) > 0, takav da za sve X ! 21 n X za koje je 0 < d(X, A) < δ ⇔ (xi − ai )2 < δ, vrijedi i=1 |f (X) − L| < ε. Ukoliko koristimo kubne okoline, Definicija 1.2.1 izgleda ovako. Definicija 1.2.3 Funkcija f u taˇcki A ∈ Rn ima graniˇcnu vrijednost jednaku L ako vrijedi, 1◦ taˇcka A je taˇcka nagomilavanja domena funkcije f , 2◦ za proizvoljno ε > 0, postoji δ = δ(ε) > 0, takav da za sve X za koje je 0 < d(X, A) < δ ⇔ 0 < |xi −ai | < δ, i = 1, 2, ..., n, vrijedi |f (X) − L| < ε. Posmatrajmo neke sluˇcajeve graniˇcnog procesa za funkciju dvije promjenljive. Primjer 1.8. Naprimjer, sluˇcaj lim (x,y)→(a,b) f (x, y) = lim f (x, y) = L , x→a y→b (1.2.1) tumaˇcimo na sljede´ci naˇcin: Ako fiksiramo ε > 0, onda postoji δ = δ(ε) > 0 tako da vaˇzi |f (x, y) − L| < ε , kad p god su x i y takvi da vaˇzi |x − a| < δ i |y − b| < δ (kubna okolina), ili (x − a)2 + (y − b)2 < δ (sferna okolina). Pri tome je okolina taˇcke A(a, b), u zavisnosti od metrike data na slici, Sada nam graniˇcni proces (1.2.1) govori da je slika svakog X iz odgovaraju´ce okoline taˇcke A, u nekoj okolini broja L na z-osi. ♦ 13 1.2. Graniˇcna vrijednost funkcije n varijabli z b b X A b b+δ L ( b b b−δ ) f b+δ f a−δ a+δ XA b b−δ b a b b b b b b b b a a−δ a+δ (b) Kugla sa metrikom d2 (a) Kugla sa metrikom d∞ Primjer 1.9. Graniˇcni proces lim x → +∞ y→b f (x, y) = L , f ) tumaˇcimo na sljede´ci naˇcin: Za proizvoljno ε > 0, postoje δ = δ(ε) > 0 i M(ε) > 0 takvi da vaˇzi |f (x, y) − L| < ε, kad god su x i y takvi da je x > M i |y − b| < δ. Pri tome je okolina taˇcke A beskonaˇcni pravougaoni pojas prikazan na slici z b X b L ( b+δ b b−δ b b b b M Kao i u prethodnom primjeru, za svako X iz pravougaonog pojasa (formalno okolina taˇcke A(x → ∞, b)), vrijednost f (X) ´ce leˇzati u okolini broja L na z-osi. ♦ Sljede´ce osobine graniˇcnih vrijednosti funkcija viˇse varijabli, analogon su i iskazom i dokazom odgovaraju´cih tvrdnji za funkcije jedne varijable. Teorem 1.2.1 Neka su f, g : Rn → R i neka postoje lim f (X) = F i X→A lim g(X) = G . X→A Tada postoje i graniˇcne vrijednosti funkcija f (X) ± g(X), f (X) · g(X), 14 1.2. Graniˇcna vrijednost funkcije n varijabli f (X) g(X) (g(X) 6= 0) i kf (X) (k ∈ R) i pri tome vrijedi, 1. lim (f (X) ± g(X)) = F ± G , X→A 2. lim (f (X)g(X)) = F · G , X→A F f (X) = , X→A g(X) G 3. lim 4. lim kf (X) = kF . X→A Gornju tvrdnju treba shvatiti kao pravila izraˇcunavanja limesa funkcija viˇse varijabli. Tako naprimjer, tvrdnju pod 1. treba shvatiti da limes zbira ili razlike funkcija raˇcunamo kao zbir ili razliku limesa funkcija, tj. lim (f (X) ± g(X)) = lim f (X) ± lim g(X) , X→A X→A X→A naravno pod pretpostavkom da limesi pojedinaˇcnih funkcija postoje. Primjer 1.10. Neka je f : Rn → R zadata sa f (x1 , x2 , ..., xn ) = xk , k ∈ {1, 2, ..., n} . Ukoliko sada posmatramo graniˇcni proces kada X → A, tj. X(x1 , x2 , ..., xn ) → A(a1 , a2 , ..., an ), ˇsto u stvari znaˇci da za proizvoljno i = 1, 2, ..., n vrijedi xi → ai , tada imamo lim f (x1 , x2 , ...xn ) = X→A lim (x1 ,...,xn)→(a1 ,...,an ) xk = ak . Specijalno, ako posmatramo funkciju f (x, y) = x, onda imamo lim (x,y)→(a,b) f (x, y) = lim (x,y)→(a,b) x=a. ♦ Primjer 1.11. Neka je sada f : R3 → R, zadata sa f (x, y, z) = xyz. Koriste´ci Teorem 1.2.1 i gornji primjer, imamo lim (x,y,z)→(a,b,c) f (x, y, z) = = lim (x,y,z)→(a,b,c) lim xyz x (x,y,z)→(a,b,c) = abc . 15 lim (x,y,z)→(a,b,c) y lim (x,y,z)→(a,b,c) z 1.2. Graniˇcna vrijednost funkcije n varijabli Dakle, ako imamo da je A(1, 2, 1), tada je lim (x,y,z)→(1,2,1) xyz = 1 · 2 · 1 = 2 . ♦ Primjer 1.12. Kombinuju´ci prethodno, sada raˇcunamo lim (x,y)→(−1,2) (x2 + y 2 − 3xy) = ( ( lim (x,y)→(−1,2) y)( lim (x,y)→(−1,2) lim (x,y)→(−1,2) x)( y) − 3( lim (x,y)→(−1,2) lim (x,y)→(−1,2) x)+ x)( lim (x,y)→(−1,2) y) = (−1)(−1) + 2 · 2 − 3(−1)2 = 11 . ♦ Sva tri gornja primjera predstavljaju primjere graniˇcnih procesa posebne grupe funkcija viˇse varijabli. Naime, funkciju f : Rn → R, oblika f (x1 , x2 , ..., xn ) = cxk11 xk22 · · · xknn , gdje je c skalar, a ki (i = 1, 2, ..., n) nenegativni cijeli brojevi, nazivamo monomom ili monomijalna funkcija. Funkciju koja predstavlja sumu monoma nazivamo polinom ili polinomijalna funkcija. Za neˇsto sloˇzenije funkcije trebat ´ce nam i dodatni alat. Sljede´ci rezultat nam govori o graniˇcnom procesu kompozicije funkcije viˇse varijabli i funkcije jedne varijable. Teorem 1.2.2 Neka je f : Rn → R i h : R → R. Ako postoji graniˇcna vrijednost lim f (X) = F X→A i ako je h neprekidna funkcija, tada vrijedi lim h(f (X)) = h(F ) . X→A Primjer 1.13. Koriste´ci Teorem 1.2.2 i gornje razmatranje za polinomijalne funkcije, lagano raˇcunamo i graniˇcne procese sloˇzenijih funkcija. Neka je f : Rn → R, zadata sa q f (x1 , x2 , ..., xn ) = x21 + x22 + · · · x2n . 16 1.2. Graniˇcna vrijednost funkcije n varijabli Kako je korjena funkcija neprekidna, sada imamo r lim f (x1 , x2 , ..., xn ) = = Ili lim lim (x1 ,x2 ,...,xn)→(a1 ,a2 ,...,an ) (x1 ,x2 ,...,xn)→(a1 ,a2 ,...,an ) (x,y)→(1,1) e(x 3 −y 2 +3x2 y) (x21 + x22 + · · · x2n ) q a21 + a22 + · · · a2n . = e(lim(x,y)→(1,1) (x 3 −y 2 +3x2 y)) = e3 . U oba primjera podrazumijevamo da je taˇcka A iz domena funkcije f . ♦ Pored polinomijalnih, ˇcesto su u upotrebi i funkcije oblika f (X) = g(X) , h(X) gdje su g i h polinomijalne funkcije. Takvu funkciju nazivamo racionalna funkcija. I ovdje, ukoliko je taˇcka graniˇcnog procesa A iz domena funkcije, limes raˇcunamo jednostavno. Naime vrijedi, lim f (X) = X→A Primjer 1.14. Neka je f (x, y, z) = lim (x,y,z)→(1,−1,2) limX→A g(X) . limX→A h(X) x2 y + 5xyz . 2x2 + 3z 2 x2 y + 5xyz (x,y,z)→(1,−1,2) 2x2 + 3z 2 12 (−1) + 5 · 1 · (−1) · 2 = 2 · 12 + 3 · 22 −6 3 = =− . 14 7 f (x, y, z) = lim ♦ Primjer 1.15. lim (x,y)→(1,2) ln xy 2 2x + y 2 xy = ln lim 2 (x,y)→(1,2) 2x + y 2 2 = ln = − ln 3 . 6 ♦ 17 1.2. Graniˇcna vrijednost funkcije n varijabli Napomenimo joˇs jednom bitnost pretpostavke da je graniˇcna taˇcka u svim gornjim primjerima graniˇcnih procesa, bila taˇcka oblasti definisanosti posmatrane funkcije. Medutim, u definiciji graniˇcne vrijednosti funkcije viˇse varijabli, zahtjevalimo smo u 1◦ da je A taˇcka nagomilavanja domena funkcije, ˇsto znaˇci da graniˇcne vrijednosti moˇzemo raˇcunati i u nekim ”drugim” taˇckama. Tako naprimjer, za funkciju f (x, y) = x2 y , x2 + y 2 taˇcka A(0, 0) nije iz domena, ali jeste taˇcka nagomilavanja domena funkcije. Iako je naˇsa funkcija racionalna, ne bismo mogli primjeniti raniji postupak izraˇcunavanja limesa ove funkcije u taˇcki A jer bi to dovelo do neodredenog oblika 00 . Ipak, ako izaberemo taˇcku X dovoljno blisku taˇcki A, tj. neka je p 0 < d(X, A) = x2 + y 2 < δ = ε , za proizvoljno ε > 0, tada ´cemo imati 2 2 2 xy = |x| |y| ≤ d(X, A) d(X, A) = d(X, A) < ε . |f (x, y) − 0| = 2 x + y 2 |x2 + y 2 | d(X, A)2 Ovo na osnovu Definicije 1.2.2 znaˇci da vrijedi lim (x,y)→(0,0) f (x, y) = 0 . Za utvrdivanje egzistencije graniˇcne vrijednosti funkcije viˇse varijabli naredna tvrdnja moˇze biti od velike koristi. Teorem 1.2.3 Neka je f : Rn → R i neka postoji lim f (X) = F . X→A Tada za proizvoljan niz (Xn )n∈N , takav da Xn → A (n → ∞), vrijedi lim f (Xn ) = F . n→∞ Ovu tvrdnju moˇzemo sada primjeniti na maloprije uradeni primjer. Nax2 y ime, utvrdili smo da postoji limes funkcije f (x, y) = 2 u taˇcki A(0, 0). x + y2 18 1.2. Graniˇcna vrijednost funkcije n varijabli Na osnovu posljednje tvrdnje, posmatramo li proizvoljan niz taˇcaka (X(xn , yn ))n∈N koji konvergira ka taˇcki A(0, 0) mora vrijediti lim f (X) = lim f (Xn ) . n→∞ X→A Posmatrajmo niz (xn , yn ) = ( n1 , n1 ) (n ∈ N). Jasno je da vrijedi ( n1 , n1 ) → (0, 0) kada n → ∞. Sada imamo x2 y = lim n→∞ (x,y)→(0,0) x2 + y 2 lim 1 1 n2 n 1 n2 + 1 n2 1 =0. n→∞ 2n2 = lim Kako gornja tvrdnja daje samo potrebne, a ne i dovoljne uslove egzistencije graniˇcne vrijednosti mnogo ju je bolje koristiti u kontrapoziciji. Naime, ako postoje nizovi (Xn′ )n∈N i (Xn′′ )n∈N takvi da Xn′ → A i Xn′′ → A kada n → ∞, za koje je lim f (Xn′ ) 6= lim f (Xn′′ ) , n→∞ n→∞ tada ne postoji limes limX→A f (X). Primjer 1.16. Ispitajmo postojanje graniˇcne vrijednosti funkcije f (x, y) = xy u taˇcki A(0, 0). 2 x + y2 Posmatrajmo nizove taˇcaka n1 , n1 n∈N i n1 , − n1 n∈N . Oˇcigledno oba niza konvergiraju ka taˇcki A(0, 0). Medutim lim n→∞ 12 n 1 n n→∞ 12 n lim 1 1 nn 1 n2 = 1 n2 lim n→∞ 22 n = 1 , 2 + − n1 − n12 1 = lim =− . 1 2 n→∞ 2 + n2 n2 Dakle, graniˇcna vrijednost posmatrane funkcije u taˇcki A(0, 0) ne postoji. ♦ 1.2.2 Simultana i uzastopna graniˇ cna vrijednost Prisjetimo se da smo za funkciju f : R → R, postojanje graniˇcne vrijednosti lim f (x) = L , x→a opravdavali postojanjem i jednakoˇs´cu lijeve i desne graniˇcne vrijednosti u taˇcki a, tj. uslovom lim f (x) = L = lim f (x) . x→a− x→a+ 19 1.2. Graniˇcna vrijednost funkcije n varijabli Ukoliko jedna od ovih graniˇcnih vrijednosti u taˇcki a ne postoji, tada ne postoji ni graniˇcna vrijednost funkcije u toj taˇcki. Sliˇcno razmiˇsljanje moˇzemo primjeniti i za funkciju viˇse varijabli, ali razlika leˇzi u ˇcinjenici ˇsto ´ce sada postojati beskonaˇcno mnogo krivih po kojima se taˇcka X moˇze pribliˇzavati nekoj taˇcki A u prostoru Rn , za razliku od samo dvije mogu´cnosti u prostoru R. z y x → a− a+ ← x b b a x Slika 1.14: Prilaz taˇcki na pravoj (lijevo) i u ravni (desno) Graniˇcnu vrijednost L, definisanu u Definiciji 1.2.1, nazivamo simultana graniˇcna vrijednost funkcije f (x1 , x2 , ..., xn ). To je bio sluˇcaj kada taˇcka X(x1 , x2 , ..., xn ) teˇzi ka taˇcki A(a1 , a2 , ..., an ) tako da sve koordinate xi taˇcke X istovremeno teˇze ka odgovaraju´cim koordinatama ai taˇcke A. Medutim, graniˇcni proces moˇzemo posmatrati i tako da puˇstamo prvo jednu koordinatu da teˇzi odgovaraju´coj fiksnoj vrijednosti, a ostale drˇzimo fiksnim. Zatim puˇstamo neku drugu koordinatu da teˇzi fiksnoj vrijednosti, a preostale drˇzimo fiksnim i tako do posljednje koordinate. Na taj naˇcin bi smo posmatrali graniˇcni proces u obliku lim lim xn →a1 xn−1 →an−1 · · · lim lim f (x1 , x2 , ..., xn ) , x2 →a2 x1 →a1 i posmatrani proces nazivamo uzastopni ili sukcesivni limes funkcije. Posmatrajmo sada funkciju dvije promjenljive f (x, y). Pored simultane graniˇcne vrijednosti, prema gore reˇcenom, od interesa je posmatrati joˇs dvije graniˇcne vrijednosti, a to su L12 = lim lim f (x, y) , L21 = lim lim f (x, y) , x→a y→b y→b x→a koje nazivamo uzastopne graniˇcne vrijednosti (slika 1.15). Pri tome podrazumijevamo sljede´ce, L12 = lim lim f (x, y) , L21 = lim lim f (x, y) , x→a y→b y→b x→a odnosno, u izraˇcunavanju limesa L12 prvo raˇcunamo lim f (x, y), drˇze´ci x y→b fiksnim, a zatim od dobijenog rezultata raˇcunamo limes, puˇstaju´ci da x → a. 20 1.2. Graniˇcna vrijednost funkcije n varijabli Kod L21 princip je obrnut, prvo raˇcunamo lim f (x, y), drˇze´ci y fiksnim, a x→a onda od dobijenog posmatramo graniˇcni proces kada y → b. Primjer 1.17. Izraˇcunati uzastopne limese funkcije f (x, y) = A(2, 1). x−1 1 x−y L12 = lim lim 2 = lim 2 = . 2 x→2 x + 1 x→2 y→1 x + y 5 x−y 2−y 1 L21 = lim lim 2 = lim = . 2 2 y→1 x→2 x + y y→1 4 + y 5 x−y x2 +y 2 u taˇcki ♦ a←x b (x, y) (x, y) b y→b y→b b b (a, b) (a, b) (a) Uzastopni limes: L21 = lim lim a←x (b) Uzastopni limes: L12 = lim lim y→b x→a x→a y→b Slika 1.15: Uzastopni limesi funkcije dvije promjenljive. Veza simultane i uzastopnih graniˇcnih vrijednosti data je nerednim tvrdenjem. Teorem 1.2.4 Ako postoji simultana graniˇcna vrijednost L = lim f (x, y) x→a y→b i ako za svako y postoji graniˇcna vrijednost lim f (x, y), tada postoji i x→a uzastopna graniˇcna vrijednost L21 = lim lim f (x, y) , y→b x→a i vrijedi L = L21 . 21 1.2. Graniˇcna vrijednost funkcije n varijabli Dokaz : Ako postoji simultana graniˇcna vrijednost L, to znaˇci da za svako ε > 0, postoji δ > 0 tako da vrijedi |f (x, y) − L| < ε , kad god je |x − a| < δ i |y − b| < δ. Ako fiksiramo y0 tako da je |y0 − b| < δ, prema pretpostavci teorema, postoji lim f (x, y0 ) . x→a Kako je fiksirano y0 bilo proizvoljno, postojat ´ce i graniˇcna vrijednost lim lim f (x, y) , y→b x→a pa je L graniˇcna vrijednost funkcije F (y) = limx→a f (x, y) kada y → b, ˇcime je dokaz zavrˇsen. ♣ Formulaciju gornje teoreme moˇzemo iskazati potpuno analogno koriste´ci i graniˇcnu vrijednost L12 . Posljedice ove teoreme su: 1) Ako postoje simultana i uzastopne graniˇcne vrijednosti tada vrijedi L = L12 = L21 . 2) Ako je L12 6= L21 , onda simultana graniˇcna vrijednost L ne postoji. x−y u taˇcki O(0, 0). x+y x−y x L12 = lim lim = lim = 1 . x→0 y→0 x + y x→0 x x−y −y = lim = −1 . L21 = lim lim y→0 x→0 x + y y→0 y pa dakle L ne postoji. ♦ Primjer 1.18. Posmatrajmo funkciju f (x, y) = L12 6= L21 Primjer 1.19. f (x, y) = x cos y, x → 0 i y → +∞. Zbog ograniˇcenosti funkcije kosinus vrijedi L= lim x→0 y → +∞ x cos y = 0 . L21 = lim lim x cos y = 0 . y→+∞ x→0 L12 ne postoji jer ne postoji graniˇcna vrijednost funkcije cos y kada y → +∞. ♦ 22 1.3. Neprekidnost funkcije n varijabli 0.5 2 0.0 1 -0.5 0 -2 -1 -1 0 1 2 Slika 1.16: Primjer 1.20. f (x, y) = x2 -2 Graf funkcije f (x, y) = xy . x2 +y 2 xy , x → 0 i y → 0. + y2 xy xy = 0 = lim lim = L21 . x→0 y→0 x2 + y 2 y→0 x→0 x2 + y 2 L12 = lim lim Simultani limes ne postoji! Zaista, ako se taˇcki O(0, 0) pribliˇzavamo po pravoj x = y (tj. ako posmatramo taˇcke oblika X(x, x), a to onda znaˇci da ako X → O, onda mora x → 0), tada je x2 1 = , 2 x→0 2x 2 L = lim a ako se ka taˇcki O(0, 0) pribliˇzavamo po pravoj x = −y, tj. posmatramo taˇcke oblika X(x, −x), imamo −x2 1 =− , 2 x→0 2x 2 L = lim iz ˇcega je jasno da L ne postoji. ♦ Sa gornjim primjerima smo pokazali neke od mogu´cnosti ali i probleme kod odredivanja graniˇcnih procesa funkcija viˇse varijabli. 1.3 Neprekidnost funkcije n varijabli Kao i kod funkcije jedne varijable, neprekidnost funkcije viˇse varijabli definisana je direktno u vezi sa limesom funkcije. Pri tome, priˇcati o neprekidnosti preslikavanja ima smisla samo o taˇckama u kojima je preslikavanje definisano. 23 1.3. Neprekidnost funkcije n varijabli Definicija 1.3.1 Neka je funkcija f : Rn → R definisana u okolini taˇcke A(a1 , a2 , ..., an ). Funkcija taˇcke f je neprekidna u taˇcki A ako vrijedi lim f (X) = f (A) . X→A Iz gornje definicije vidimo da bi funkcija f bila neprekidna u taˇcki A treba biti zadovoljeno: 1◦ da postoji graniˇcna vrijednost funkcije kada X → A, 2◦ da funkcija bude definisana u taˇcki A, 3◦ da graniˇcna vrijednost funkcije u taˇcki A bude jednaka vrijednosti funkcije u taˇcki A. Definicija 1.3.2 Funkcija f je neprekidna u taˇcki A ako se za svako ε > 0 moˇze odrediti δ = δ(ε) > 0, tako da je za sve X takve da je 0 ≤ d(X, A) < δ, zadovoljeno |f (X) − f (A)| < ε . Funkcija je neprekidna u oblasti D ako je neprekidna u svakoj taˇcki te oblasti. Naravno da gornju definiciju moˇzemo posmatrati bilo sa sfernom bilo sa kubnom okolinom taˇcke A. Iz razmatranja u prethodnoj sekciji, vezana za polinomijalne i racionalne funkcije imamo sljede´ca tvrdenja. Teorem 1.3.1 Neka je f : Rn → R polinomijalna funkcija. Tada za svako A ∈ Rn vrijedi lim f (X) = f (A) , X→A tj. polinomijalna funkcija je neprekidna u svakoj taˇcki A ∈ Rn . 24 1.3. Neprekidnost funkcije n varijabli Primjer 1.21. Za polinomijalnu funkciju f (x, y) = 3x3 + 2xy − x + y posmatrajmo graniˇcni proces kada (x, y) → (0, −1). lim (x,y)→(0,−1) f (x, y) = lim (x,y)→(0,−1) (3x3 + 2xy − x + y) = −1 = f (0, −1) . Generalno, ako (x, y) → (x0 , y0 ) zbog neprekidnosti polinomijalne funkcije imamo, lim (x,y)→(x0 ,y0 ) f (x, y) = 3x30 + 2x0 y0 − x0 + y0 = f (x0 , y0 ) . ♦ Teorem 1.3.2 Ako je racionalna funkcija f definisana u taˇcki A, tada vrijedi lim f (X) = f (A) , X→A tj. racionalna funkcija je neprekidna u svakoj taˇcki svog domena. Primjer 1.22. Za funkciju f (x, y) = (x, y) → (1, 1). lim (x,y)→(1,1) f (x, y) = x+y x2 +y 2 posmatrajmo graniˇcni proces kada 1+1 x+y = = 1 = f (1, 1) . (x,y)→(1,1) x2 + y 2 12 + 12 lim Kako je Df = R2 \ (0, 0), taˇcka X(1, 1) ∈ Df , te je racionalna funkcija neprekidna u toj taˇcki. Generalno, ako taˇcka X(x0 , y0 ) ∈ Df , tada zbog neprekidnosti vrijedi lim (x,y)→(x0 ,y0 ) f (x, y) = x+y x0 + y0 = = f (x0 , y0) . (x,y)→(x0 ,y0 ) x2 + y 2 x20 + y02 lim ♦ Teorem 1.3.3 Neka su funkcije f, g : Rn → R neprekidne u taˇcki A ∈ Rn . Tada su f u toj taˇcki neprekidne i funkcije f ± g, f · g, (g(A) 6= 0) i kf (k g proizvoljan skalar iz R). 25 1.3. Neprekidnost funkcije n varijabli Teorem 1.3.4 Neka je f : Rn → R neprekidna funkcija u taˇcki A i ako je g : R → R neprekidna funkcija, tada je i g ◦ f neprekidna funkcija u taˇcki A. Primjer 1.23. Kako je funkcija g(t) = sin t neprekidna za proizvoljno t iz R i kako je funkcija p f (x, y, z) = x2 + y 2 + z 2 neprekidna za sve taˇcke (x, y, z) ∈ R3 , onda je i funkcija p h(x, y, z) = sin( x2 + y 2 + z 2 ) neprekidna u svim taˇckama iz R3 . ♦ Primjer 1.24. Prema prethodnom primjeru (samo za funkciju dvije varijable), funkcija p h(x, y) = sin( x2 + y 2 ) je neprekidna za sve (x, y) ∈ R2 . Takode je neprekidna i funkcija p g(x, y) = x2 + y 2 za sve (x, y) ∈ R2 . Zakljuˇcujemo onda da je i funkcija p sin( x2 + y 2 ) f (x, y) = p x2 + y 2 neprekidna u svakoj taˇcki iz R2 , razliˇcitoj od taˇcke A(0, 0). Medutim, p sin( x2 + y 2) sin(d(X, A)) sin t p lim f (x, y) = lim = lim = lim = 1. t→0 t X→A (x,y)→(0,0) (x,y)→(0,0) d(X, A) x2 + y 2 Dakle, prekid funkcije u taˇcki A(0, 0) je otklonjiv, tj. ako definiˇsemo novu funkciju √ sin(√ x2 +y2 ) ; (x, y) 6= (0, 0) x2 +y 2 F (x, y) = 1 ; (x, y) = (0, 0) onda je ona neprekidna u svim taˇckama (x, y) ∈ R2 . ♦ 26 1.3. Neprekidnost funkcije n varijabli Definicija 1.3.3 Linija ili povrˇs koja predstavlja skup taˇcaka prekida funkcije f naziva se linijom ili povrˇsinom prekida funkcije. Ako je funkcija f neprekidna u oblasti D, ona je neprekidna po svakoj liniji i po svakoj povrˇsi koja leˇzi u toj oblasti. Ako specijalno posmatramo prave paralelne koordinatnim osama, to onda znaˇci da je funkcija neprekidna po svakoj varijabli posebno. Medutim obrat ne vaˇzi, tj. funkcija moˇze biti neprekidna po svakoj varijabli posebno ali da ipak ima prekide. Na primjer, funkcija xy f (x, y) = 2 x + y2 je u taˇcki O(0, 0) neprekidna po svakoj varijabli, ali graniˇcna vrijednost (simultana) u taˇcki O ne postoji, tj. funkcija ima prekid u taˇcki O. Primjer 1.25. f (x, y) = x2 + y 2 = 1. ♦ ex + ey . Linija prekida ove funkcije je kruˇznica x2 + y 2 − 1 Primjer 1.26. f (x, y, z) = sfera x2 + y 2 + z 2 = 4. ♦ ln (4 − x2 1 . Povrˇs prekida funkcije je − y2 − z2) Dio o neprekidnosti zavrˇsimo sa dva vaˇzna stava, koji opet predstavljaju analogone odgovaraju´cih tvrdenja za funkcije jedne varijable. Teorem 1.3.5 Svaka funkcija n promjenljivih koja je neprekidna u zatvorenoj i ograniˇcenoj oblasti je ograniˇcena u toj oblasti. Teorem 1.3.6 Ako je f neprekidna u proizvoljnoj oblasti i ako za X1 6= X2 iz te oblasti vrijedi f (X1 ) 6= f (X2 ), tada za proizvoljno C izmedu f (X1 ) i f (X2 ), postoji taˇcka X u toj oblasti takva da je f (X) = C. 27 Poglavlje 2 Diferencijabilnost funkcije n varijabli 2.1 Izvod u pravcu . . . . . . . . . . . . . . . . . . . . 28 2.2 Parcijalni izvod i parcijalni diferencijal . . . . . 31 2.3 Gradijent . . . . . . . . . . . . . . . . . . . . . . . 38 2.4 Diferencijabilnost funkcija viˇ se promjenljivih . . 40 2.5 Pravila diferenciranja . . . . . . . . . . . . . . . . 51 2.6 Izvodi viˇ seg reda, Hesseova matrica . . . . . . . 52 2.7 Diferencijali viˇ seg reda . . . . . . . . . . . . . . . 62 2.8 Ekstremumi funkcija viˇ se promjenljivih . . . . . 64 2.8.1 Nalaˇzenje lokalnog ekstrema . . . . . . . . . . . . . 65 2.8.2 Nalaˇzenje globalnog ekstrema . . . . . . . . . . . . 70 2.8.3 Uslovni ekstrem . . . . . . . . . . . . . . . . . . . 74 U ovoj glavi govorit ´cemo o drugoj vaˇznoj osobini proizvoljnog preslikavanja, o diferencijabilnosti. Ovdje ´cemo pretpostavljati uvijek ako drugaˇcije nije naglaˇseno, da svaka taˇcka domena Df posmatranog preslikavanja, pripada tom skupu zajedno sa nekom svojom okolinom, tj. pretpostavljat ´cemo da je skup Df otvoren. U nekim razmatranjima bit ´ce neophodna i osobina povezanosti (koneksnosti) tog skupa. Za takav skup (otvoren i povezan) re´ci ´cemo da je oblast u prostoru Rn . 2.1 Izvod u pravcu Za funkciju φ : R → R, izvod u taˇcki x0 ∈ Dφ definisali smo sa φ(x0 + h) − φ(x0 ) , h→0 h φ′ (x0 ) = lim (2.1.1) i geometrijski, predstavljao je nagib tangente (tj. najbolju linearnu aproksimaciju) na krivu φ u taˇcki (x0 , φ(x0 )) ili trenutnu mjeru promjene funkcije 28 2.1. Izvod u pravcu φ(x) u odnosu na varijablu x, kada je x = x0 . Kao uvod za nalaˇzenje ovakve ”najbolje linearne aproksimacije” za funkciju f : Rn → R, pokuˇsat ´cemo iskoristiti, tj. generalizovati (2.1.1) da bi realizovali ideju ”nagiba” i ”mjere promjene” za ovakvo preslikavanje. Posmatrajmo funkciju f : R2 → R, definisanu sa f (x, y) = 4 − 2x2 − y 2 , ˇciji je graf prikazan na slici (2.1). Ukoliko ˇzelimo da vizualiziramo kretanje po ovom grafu (povrˇsi), nagib puta po kome se kre´cemo ovisi od polazne taˇcke ali i od pravca naˇseg kretanja. Naprimjer, neka je startna taˇcka P (1, 1, 1) na povrˇsi i neka je pravac kretanja odreden vektorom v~′ = (−1, −1, 3). Ovo ´ce uzrokovati kretanje direktno ka vrhu grafa i jasno je da je ”mjera promjene” rastu´ca. Medutim, ako se iz iste taˇcke kre´cemo u pravcu vektora −v~′ , onda ”silazimo niz graf”, tj. ”mjera promjene” je opadaju´ca. Obje ove mogu´cnosti naznaˇcene su na slici crvenom bojom. ~ ′ = (−1, 2, 0), vidimo da je Ako iz iste taˇcke krenemo u pravcu vektora w putanja kretanja po elipsi 2x2 + y 2 = 3 , tj. ”obilazimo” oko grafa, pa je ”nagib” bez promjene, a time i ”mjera promjene” je 0. Ova mogu´cnost kretanja je na slici prikazana zelenom bojom. Dakle, govoriti o ”nagibu” na graf funkcije f u taˇcki, zahtijeva specificirati pravac kretanja. z v~′ b x ~v X ~′ w w ~ y Slika 2.1: Izvod u pravcu Kretanju na grafu iz taˇcke P (1, 1, 1), u pravcu vektora v~′ , odgovara kretanje u domenu funkcije, iz taˇcke X u pravcu vektora ~v = (−1, −1). Analogno, 29 2.1. Izvod u pravcu ~ ′ , odgovara kretanje iz X u pravcu w kretanju u pravcu vektora w ~ = (−1, 2). Dakle, ukoliko se kre´cemo iz taˇcke X(1, 1) u pravcu vektora ~u = 1 ~v = − √ (1, 1) , ||~v|| 2 (normiranje vektora vrˇsimo iz prostog razloga ˇsto se time pravac i smjer vektora ne mijenjaju, pa ´cemo ”veliˇcinu” pomjeranja u pravcu takvog vektora diktirati sa veliˇcinom h) tada izraz f (X + h~u) − f (X) , h za proizvoljno h, ´ce predstavljati aproksimaciju nagiba na graf funkcije f u taˇcki X, u pravcu ~u. Uradimo malo raˇcuna. h h f (X + h~u) − f (X) = f 1 − √ , 1 − √ − f (1, 1) 2 2 2 2 h h = 4−2 1− √ − 1− √ −1 2 2 √ h2 = 3 − 3 1 − 2h + 2 √ √ 3h2 3h =h 3 2− . = 3 2h − 2 2 Kao ˇsto smo to radili sa funkcijama jedne varijable, puˇstaju´ci sada da h teˇzi ka 0, dobili bi smo egzaktan nagib na graf, u taˇcki A, u pravcu ~u. Iz gornjeg onda imamo √ √ f (X + h~u) − f (X) 3h lim = lim 3 2 − =3 2. h→0 h→0 h 2 √ Dakle, naˇs graf ima nagib od 3 2 (naravno da ova veliˇcina izraˇzava tangens ugla pod kojim se kre´cemo) ukoliko startujemo iz taˇcke X(1, 1), √ u pravcu vektora ~u. Sliˇcnim raˇcunom bi dobili da je u pravcu −~u nagib −3 2, odnosno u pravcu vektora w ~ 1 = √ (−1, 2) , ||w|| ~ 5 nagib je 0. 30 2.2. Parcijalni izvod i parcijalni diferencijal Definicija 2.1.1 Neka je funkcija f : Rn → R definisana u nekoj otvorenoj kugli oko taˇcke X. Za dati vektor ~u, izraz f (X + h~u) − f (X) , h→0 h Du f (c) = lim (2.1.2) ukoliko limes postoji, nazivamo izvod u pravcu, funkcije f , u pravcu vektora ~u, u taˇcki X. Primjer 2.1. Prema gornjem razmatranju, za funkciju f (x, y) = 4 − 2x2 − y 2 je √ √ Du f (1, 1) = 3 2 , D−u f (1, 1) = −3 2 , Dw f (1, 1) = 0 . ♦ 2.2 Parcijalni izvod i parcijalni diferencijal Kao ˇsto smo vidjeli iz gornjeg, za funkciju viˇse varijabli ne moˇzemo jednostavno govoriti o izvodu te funkcije, tj. moˇzemo govoriti o izvodu ali pri tome moramo znati pravac kretanja, i tada ustvari govorimo o izvodu u pravcu. Pravac u kome nalazimo izvod funkcije viˇse varijabli moˇze biti proizvoljan, ali pravci odredeni baznim vektorima prostora domena su od posebne vaˇznosti. Neka su e1 , e2 , ..., en standardni vektori baze prostora Rn , e1 = (1, 0, 0, ..., 0) , e2 = (0, 1, 0, ..., 0) · · · en = (0, 0, 0, ..., 1) . Posmatrajmo funkciju f : Rn → R f (X) = f (x1 , x2 , ..., xn ) , koja je definisana u nekoj okolini UA taˇcke A(a1 , a2 , ..., an ) ∈ Rn . Razmotrimo za trenutak funkciju g : R → R, uvedenu na sljede´ci naˇcin g(t) = f (t, x2 , x3 , ..., xn ) , tj. definiˇsemo je preko funkcije f , tako ˇsto poˇcev od druge, sve varijable drˇzimo fiksnim (ne mjenjamo ih), a samo prvu shvatimo kao varijablu. Dakle, tada je g funkcija jedne varijable pa na nju moˇzemo primjeniti jednakost (2.1.1), g(x + h) − g(x) g ′ (x) = lim . h→0 h 31 2.2. Parcijalni izvod i parcijalni diferencijal Ali tada imamo g(x1 + h) − g(x1 ) h→0 h f (x1 + h, x2 , ..., xn ) − f (x1 , x2 , ..., xn ) = lim h→0 h f ((x1 , x2 , ..., xn ) + (h, 0, ..., 0)) − f (x1 , x2 , ..., xn ) = lim h→0 h f (X + he1 ) − f (X) = lim = De1 f (X) . h→0 h g ′(x1 ) = lim Vidimo da je izvod funkcije g u taˇcki x1 u stvari izvod u pravcu, funkcije f u taˇcki X, u pravcu vektora e1 . Na isti naˇcin smo mogli fiksirati proizvoljnu k-tu promjenljivu (k = 1, 2, ..., n) funkcije f , tj. staviti da je g(t) = f (x1 , x2 , ..., xk−1 , t, xk+1 , ..., xn ) i zakljuˇciti da bi vrijedilo g ′ (xk ) = Dek f (X) . Definicija 2.2.1 Neka je funkcija f : Rn → R definisana u nekoj okolini taˇcke A i neka je ek (k ∈ {1, 2, ..., n}) k-ti vektor standardne baze u Rn . Ukoliko postoji, izvod u pravcu Dek f (A) nazivamo parcijalni izvod funkcije f po promjenljivoj xk , u taˇcki A. Naravno da smo pojam parcijalnog izvoda mogli uvesti i na mnogo formalniji naˇcin, uvode´ci pojmove priraˇstaja. Definicija 2.2.2 Neka je UA ⊆ Rn okolina taˇcke A(a1 , a2 , ..., an ) i X(x1 , x2 , ..., xn ) ∈ UA proizvoljna. Razliku △xk = xk − ak ; k = 1, 2, ..., n nazivamo priraˇstajem varijable xk , a razliku △xk f (X) = f (x1 , ..., xk + △xk , ..., xn ) − f (x1 , ..., xn ) nazivamo parcijalnim priraˇstajem funkcije f po promjenljivoj xk , u taˇcki X. 32 2.2. Parcijalni izvod i parcijalni diferencijal Na isti naˇcin moˇzemo definisati parcijalni priraˇstaj funkcije u proizvoljnoj taˇcki A(a1 , ..., an ): △xk f (A) = f (a1 , ..., ak + △xk , ..., an ) − f (a1 , ..., an ) . Primje´cujemo da parcijalni priraˇstaj funkcije n promjenljivih dobijamo tako ˇsto vrˇsimo promjenu samo jedne varijable dok ostale varijable drˇzimo fiksnim. Definicija 2.2.3 Graniˇcna vrijednost △xk f (A) f (a1 , ..., xk , ..., an ) − f (a1 , ..., an ) = lim , xk →ak △xk →0 △xk xk − ak lim naziva se parcijalnim izvodom funkcije f po promjenljivoj xk u taˇcki A. Na analogan naˇcin definiˇsemo parcijalni izvod u proizvoljnoj taˇcki △xk f (X) f (x1 , ..., xk + △xk , ..., xn ) − f (x1 , ..., xn ) = lim . △xk →0 △xk →0 △xk △xk U razliˇcitim knjigama matematiˇcke analize nalazimo razne oznake za parcijalne izvode, kao npr. ∂f fx′ k ; fxk ; i sl. . ∂xk ∂f Mi ´cemo najˇceˇs´ce koristiti oznaku ∂x , zato primjetimo da ovdje nismo kok ristili oznaˇcavanje koje smo imali kod funkcije jedne promjenljive, tj. oznaku ∂f df . Razlog za to je ˇcinjenica da izraz ∂x ni u kom sluˇcaju ne moˇzemo shvatiti dx k df kao dijeljenje (∂f sa ∂x) ˇsto je bio sluˇcaj sa dx (df = f ′ (x)dx). Tehnika odredivanja parcijalnog izvoda se ni u ˇcemu ne razlikuje od tehnike izraˇcunavanja izvoda funkcije jedne promjenljive. Pri nalaˇzenju parcijalnog izvoda po promjenljivoj xk , sve ostale promjenljive shvatamo kao konstante, a nalazimo izvod po xk , koriste´ci pravila i tablicu izvoda funkcija jedne promjenljive. lim Primjer 2.2. Za funkciju f : R2 → R, zadatu sa f (x, y) = xy, parcijalni izvodi su ∂f f (x + ∆x, y) − f (x, y) (x + ∆x)y − xy (x, y) = lim = lim =y. ∆x→0 ∆x→0 ∂x ∆x ∆x ∂f f (x, y + ∆y) − f (x, y) x(y + ∆y) − xy (x, y) = lim = lim =x. ∆y→0 ∆y→0 ∂y ∆y ∆y ♦ 33 2.2. Parcijalni izvod i parcijalni diferencijal Primjer 2.3. f (x, y) = sin(xy − y). ∂ ∂f (x, y) = sin(xy − y) ∂x ∂x ∂ = cos(xy − y) (xy − y) ∂x ∂ ∂ = cos(xy − y) (xy) − y ∂x ∂x = y cos(xy − y) . ∂ ∂f (x, y) = sin(xy − y) ∂y ∂y ∂ = cos(xy − y) (xy − y) ∂y ∂ ∂ = cos(xy − y) (xy) − y ∂y ∂y = (x − 1) cos(xy − y) . ♦ Primjer 2.4. Posmatrajmo funkciju f : R3 → R, f (x, y, z) = ln(x + yz). ∂f ∂ 1 ∂ 1 (x, y, z) = ln(x + zy) = (x + zy) = , ∂x ∂x x + zy ∂x x + yz ∂f ∂ 1 ∂ z (x, y, z) = ln(x + yz) = (x + yz) = , ∂y ∂y x + yz ∂y x + yz ∂f ∂ 1 ∂ y (x, y, z) = ln(x + yz) = (x + yz) = . ∂z ∂z x + yz ∂z x + yz Parcijalni izvodi u konkretnoj taˇcki, npr. A(1, 1, 2) bili bi 1 ∂f 2 ∂f 1 ∂f (1, 1, 2) = , (1, 1, 2) = , (1, 1, 2) = . ∂x 3 ∂y 3 ∂z 3 ♦ Primjer 2.5. f (x, y) = x . y ∂ ∂ y ∂x x − x ∂x y ∂f y−0 1 = = = , 2 2 ∂x y y y ∂ ∂ y ∂y x − x ∂y y ∂f 0−x x = = =− 2 . 2 2 ∂y y y y ♦ 34 2.2. Parcijalni izvod i parcijalni diferencijal Kod funkcije jedne varijable y = f (x), ako je x = g(t), imali smo pravilo izvoda sloˇzene funkcije (pravilo kompozicijeili lanˇcano pravilo) y = f (g(t)), koje glasi df dx df = . dt dx dt Pravilo kompozicije moramo takode imati i kod funkcija viˇse varijabli. Pokaza´cemo to pravilo za funkciju dvije varijable, a ono se lahko prenosi na funkcije sa n varijabli. Kao prvo razmotrimo sluˇcaj kada je f funkcija dviju varijabli i g funkcija jedne varijable, tojest posmatrajmo sluˇcaj kompozicije z = g(f (x, y)). z je ovisna o dvije varijable pa njene parcijalne izvode raˇcunamo po pravilu: ∂z dg ∂f ∂z dg ∂f = · , = · . ∂x df ∂x ∂y df ∂y p Primjer 2.6. Neka je f (x, y) = x2 + y 2. Ona je kompozicija polinomijalne funkcije (x2 + y 2 ) i korijene funkcije (funkcija jedne varijable). ∂f x ∂f y 1 1 = p · 2x = p , = p · 2y = p . ∂x 2 x2 + y 2 x2 + y 2 ∂y 2 x2 + y 2 x2 + y 2 ♦ Primjer 2.7. Pravilo kompozicije moˇzemo primjenjivati i u drugim situacijama. Npr. posmatrajmo ˇsemu otpornika u paralelnoj vezi. Ukupan otpor kola dat je sa R1 R2 1 1 1 1 = + + . (2.2.1) R R1 R2 R3 R3 U Dakle, ukupan otpor je funkcija tri varijable, R = R(R1 , R2 , R3 ). Ako sada ˇzelimo na´ci parcijalne izvode po Ri (i = 1, 2, 3), onda to moˇzemo uraditi izraˇcunavaju´ci otpor R eksplicitno iz formule (2.2.1) R1 R2 R3 R= . R1 R2 + R1 R3 + R2 R3 Medutim, ako lijevu stranu u (2.2.1) shvatimo kao kompoziciju racionalne funkcije ( R1 ) i naˇse funkcije R, onda direktno imamo ∂ 1 ∂ 1 ∂ 1 d R1 ∂R = R1 + R2 + R3 , dR ∂R1 ∂R1 ∂R1 ∂R1 35 2.2. Parcijalni izvod i parcijalni diferencijal odakle je − 1 1 ∂R =− 2 , 2 R ∂R1 R1 tj. R2 ∂R = 2 . ∂R1 R1 Analogno nalazimo parcijalne izvode po ostalim promjenljivima. ♦ Neka je z = f (x, y) i neka su i x i y funkcije nekog parametra t, tj. x = x(t) i y = y(t). Tada je funkcija z = f (x(t), y(t)), ustvari funkcija jedne varijable (t) i pri tome imamo: Ako su funkcije x(t) i y(t) diferencijabilne u t i ako je funkcija f diferencijabilna u taˇcki (x(t), y(t)), tada vrijedi z ∂z ∂y ∂z ∂x dz ∂z dx ∂z dy = + . dt ∂x dt ∂y dt y x dx dt dy dt t Primjer 2.8. Neka je f (x, y) = sin x + cos(xy) i neka su x = t2 i y = t3 . Tada prema pravilu kompozicije imamo ∂f dx ∂f dy df = + dt ∂x dt ∂y dt = (cos x − sin(xy)y)2t + (− sin(xy)x)3t2 = (cos t2 − t3 sin t5 )2t − 3t4 sin t5 . ♦ Primjer 2.9. Pravougaonik ima duˇzinu 6 m i ˇsirinu 4 m. U svakoj sekundi duˇzina se pove´ca za 3 m, a ˇsirina za 2 m. Odrediti promjenu povrˇsine pravougaonika u jednoj sekundi. 2m 4m x - duˇzina pravougaonika y - ˇsirina pravougaonika P - povrˇsina pravougaonika t - vrijeme P 6m 3m 36 2.2. Parcijalni izvod i parcijalni diferencijal Duˇzina i ˇsirina pravougaonika su funkcije vremena, x = x(t) i y = y(t). = 3, a promjena ˇsirine u jedinici Promjena duˇzine u jedinici vremena je dx dt dy vremena je dt = 2. Povrˇsina pravougaonika je P (x, y) = x · y, a zbog zavisnosti duˇzine i ˇsirine od vremena imamo P (x(t), y(t)) = x(t) · y(t). Izraˇcunajmo zavisnost povrˇsine o vremenu. ∂P dx ∂P dy dx dy dP = + =y +x . dt ∂x dt ∂y dt dt dt Stepen promjene povrˇsine u datom momentu je dP m2 (6, 4) = 4 · 3 + 6 · 2 = 24 . dt s ♦ Ukoliko su x i y zavisne od dvije varijable, tj. x = x(t, s) i y = y(t, s), tada pravilo kompozicije glasi: Ako funkcije x i y imaju parcijalne izvode prvog reda u taˇcki (t, s) i ako je funkcija z = f (x, y) diferencijabilna u taˇcki (x(t, s), y(t, s)), tada vrijedi z ∂z ∂y ∂z ∂x x ∂x ∂s ∂z ∂z ∂x ∂z ∂y = + , ∂t ∂x ∂t ∂y ∂t y ∂y ∂t ∂x ∂t ∂z ∂z ∂x ∂z ∂y = + . ∂s ∂x ∂s ∂y ∂s ∂y ∂s t s Primjer 2.10. Zadata je funkcija z = f (x, y) = x2 − y 2 i pri tome je x = ρ cos φ, y = ρ sin φ. Odrediti parcijalne izvode funkcije f po promjenljivima ρ i φ. ∂f ∂f ∂x ∂f ∂y = · + · = 2x cos φ + 2y sin φ ∂ρ ∂x ∂ρ ∂y ∂ρ = 2ρ(cos2 φ − sin2 φ) = 2ρ cos 2φ , ♦ ∂f ∂f ∂x ∂f ∂y = · + · = 2x(−ρ sin φ) + 2yρ cos φ ∂φ ∂x ∂φ ∂y ∂φ = −2ρ2 cos φ sin φ = −ρsin2φ . 37 2.3. Gradijent 2.3 Gradijent Mnoge fizikalne veliˇcine imaju razliˇcite vrijednosti u razliˇcitim taˇckama prostora. Na primjer, temperatura u nekoj prostoriji nije jednaka u svim taˇckama: zimi je visoka kraj izvora toplote, a niska pored otvorenog prozora. Elektriˇcno polje oko taˇckastog naboja veliko je pored naboja i smanjuje se kako se udaljavamo od naboja. Sliˇcno, gravitacijska sila koja djeluje na neki satelit zavisi od udaljenosti satelita od Zemlje. Brzina toka vode u nekom potoku velika je u uskim kanalima, a mala tamo gdje je potok ˇsirok. U svim ovim primjerima postoji neko podruˇcje prostora koje nam je posebno zanimljivo za problem koji rjeˇsavamo; u svakoj taˇcki prostora neka fizikalna veliˇcina ima svoju vrijednost. Izraz polje znaˇci ˇcesto i podruˇcje i vrijednost fizikalne veliˇcine u tom podruˇcju (npr. elektiˇcno polje, gravitacijsko polje). Ako je fizikalna veliˇcina koju promatramo skalar (npr. temperatura), tada govorimo o skalarnom polju. Ako je fizikalna veliˇcina vektor (npr. elektriˇcno polje, brzina, sila) tada govorimo o vektorskom polju. Jedna od veliˇcina koja karakteriˇse termin polja jeste pojam gradijenta. Definicija 2.3.1 Neka je funkcija f : Rn → R definisana u okolini UA taˇcke A i neka ∂f postoje ∂x (A) za sve k = 1, 2, ..., n. Vektor k ∇f (A) = ∂f ∂f ∂f (A), (A), ..., (A) ∂x1 ∂x2 ∂xn , nazivamo gradijent funkcije f u taˇcki A. U gornjoj definiciji posmatramo funkciju ˇcije su vrijednosti skalari, za koju u primjenama kaˇzemo da je skalarno polje, a definisana veliˇcina bi onda imala naziv gradijent skalarnog polja. Korisno je primjetiti to da za funkciju f : Rn → R, njen gradijent je funkcija ∇f : Rn → Rn , tj. gradijent je funkcija ˇciji je ulaz n-dimenzionalna veliˇcina (vektor), a izlazna je takode ndimenzionalni vektor. Ovakve funkcije uobiˇcajeno nazivamo vektorsko polje, a sa ˇcime ´cemo se susresti u narednim matematiˇckim izuˇcavanjima. Vektorski operator ∇ (nabla) se u dekartovom pravouglom koordinatnom sistemu (3D) definiˇse sa →∂ − ∂ ∂ ∂ →∂ − →∂ − ∇≡ , , = i + j + k . ∂x ∂y ∂z ∂x ∂y ∂z 38 2.3. Gradijent Kaˇzemo da je to vektorski operator jer on funkciji f dodjeljuje veliˇcinu ∇f , po principu → ∂f → ∂f − → ∂f − − + j + k . ∇f = i ∂x ∂y ∂z Primjer 2.11. Na osnovu Primjera 2.2, gradijent funkcije f (x, y) = xy je ∇f (x, y) = (y, x) , → − → − odnosno u konkretnoj taˇcki je, npr. ∇f (−2, 7) = (7, −2) = −2 i + 7 j . ♦ Primjer 2.12. Iz Primjera 2.4 imamo → 1 2 1 1− → 2− → 1− ∇f (1, 1, 2) = , , = i + j + k . 3 3 3 3 3 3 ♦ (x, y) = −4x , Primjer 2.13. Za funkciju f (x, y) = 4−2x2 −y 2 imamo ∂f ∂x −2y, pa je gradijent dat sa ∂f ∂f (x, y), (x, y) = (−4x, 2y) . ∇f (x, y) = ∂x ∂y ∂f (x, y) ∂y Konkretno u taˇcki O(0, 0) je ∇f (0, 0) = (0, 0) . ♦ Nije teˇsko pokazati da za gradijent vrijede sljede´ca pravila: 1. ∇(kf ) = k∇f , (k = const. ). 2. ∇(f ± g) = ∇f ± ∇g. 3. ∇(f g) = g∇f + f ∇g. f g∇f − f ∇g 4. ∇ = . g g2 Gradijent skalarnog polja iznimno je vaˇzan u fizici gdje izraˇzava vezu izmedu polja i potencijala (gravitacijska polja), odnosno sile i potencijalne energije (elektriˇcna polja). Ako se neko polje E moˇze u cijelosti opisati konkretnom funkcijom f (X) tako da je E = −∇f (X), odnosno simboliˇcki, polje = −∇(potencijal) , tada skalarnu funkciju f nazivamo njegovim potencijalom. Specijalno, ako se neka sila F moˇze napisati kao negativni gradijent neke funkcije V , tada skalarnu funkciju V nazivamo potencijalnom energijom. 39 = 2.4. Diferencijabilnost funkcija viˇse promjenljivih 2.4 Diferencijabilnost funkcija viˇse promjenljivih Neka je f : Rn → R definisana u nekoj okolini UA taˇcke A(a1 , a2 , ..., an ). Samo postojanje parcijalnih izvoda ne obezbjeduje neke bitne osobine posmatrane funkcije, ˇsto vidimo iz sljede´ceg primjera. Primjer 2.14. Posmatrajmo funkciju f : R2 → R, zadatu sa xy ; (x, y) 6= (0, 0) x2 +y 2 f (x, y) = 0 ; (x, y) = (0, 0) Nije teˇsko pokazati da je f prekidna funkcija u taˇcki (0, 0). S druge strane ona ima oba parcijalna izvoda u taˇcki (0, 0): ∂f f (h, 0) − f (0, 0) 0 (0, 0) = lim = lim = 0 , h→0 h→0 h ∂x h f (0, k) − f (0, 0) 0 ∂f (0, 0) = lim = lim = 0 . k→0 k→0 k ∂y k Dakle, parcijalni izvodi postoje u taˇcki (0, 0). a funkcija ima prekid u toj taˇcki. ♦ Jasno je dakle, da za razliku od funkcija jedne promjenljive gdje je postojanje izvoda znaˇcilo neprekidnost funkcije, postojanje parcijalnih izvoda kod funkcije viˇse varijabli ne moˇze garantovati odredene ”lijepe” osobine funkcije, nego moramo posmatrati neka svojstva koja uzimaju u obzir ponaˇsanje funkcije u ˇcitavoj okolini posmatrane taˇcke. Definicija 2.4.1 Razlika △f (A) = f (X) − f (A) ; (X ∈ UA ) , naziva se totalni priraˇstaj funkcije f u taˇcki A. Totalni priraˇstaj funkcije u taˇcki A(a1 , a2 , ..., an ) izraˇzavamo preko priraˇstaja nezavisnih promjenljivih, tj. △f (A) = f (A + △X) − f (A) = f (a1 + △x1 , ..., an + △xn ) − f (a1 , ..., an ) , ili za proizvoljnu taˇcku X(x1 , x2 , ..., xn ) sa △f (X) = f (x1 + △x1 , ..., xn + △xn ) − f (x1 , ..., xn ) . Za razliku od parcijalnog priraˇstaja gdje jednu varijablu mijenjamo, a sve druge ”drˇzimo” fiksnim, kod totalnog priraˇstaja sve varijable istovremeno ”doˇzivljavaju” neku promjenu. 40 2.4. Diferencijabilnost funkcija viˇse promjenljivih Definicija 2.4.2 Za funkciju f (X) = f (x1 , ..., xn ) definisanu u okolini taˇcke A ∈ Rn , kaˇzemo da je diferencijabilna u toj taˇcki ako vrijedi △f (A) = L(X) + ω(X)d(X, A) , gdje je L(X) = n X k=1 pk (xk − ak ) = n X k=1 pk △xk , (2.4.1) (2.4.2) linearna funkcija priraˇstaja nezavisnih promjenljivih, pk (k = 1, 2, ..., n) su realni koeficijenti, ω(X) neprekidna funkcija u taˇcki A takva da je lim ω(X) = ω(A) = 0 X→A i d(X, A) = n X k=1 rastojanje taˇcke X od taˇcke A. (xk − ak )2 ! 21 , Definicija 2.4.3 Linearnu funkciju L(X) iz (2.4.2) nazivamo totalni diferencijal funkcije f (X) u taˇcki A i oznaˇcavamo ga sa L(X) = df (X) = n X k=1 pk △xk = n X pk dxk . k=1 S obzirom na uvedeno u gornjim definicijama, ako je f : Rn → R diferencijabilna u taˇcki A ∈ Df , priraˇstaj funkcije u taˇcki A zbog (2.4.1) je oblika △f (A) = f (X) − f (A) = df (X) + ω(X)d(X, A) . Ako se taˇcka X ”pribliˇzava” sve viˇse taˇcki A, zbog lim ω(X) = 0, vidimo X→A da je priraˇstaj funkcije △f sve bolje aproksimiran diferencijalom funkcije df , tojest u blizini taˇcke A vrijedi △f (A) ≈ df (A), a to onda znaˇci da se vrijednost funkcije u taˇcki koja je blizu taˇcke A moˇze aproksimativno 41 2.4. Diferencijabilnost funkcija viˇse promjenljivih izraˇcunati sa f (X) ≈ f (A) + df (A) , ˇsto nazivamo lokalnom aproksimacijom funkcije u taˇcki. Primjer 2.15. p Koriste´ci lokalnu aproksimaciju izraˇcunati vrijednost funkcije f (x, y) = x2 + y 2 u taˇcki X0 (3.04, 3.98). Za zadatu funkciju njeni parcijalni izvodi su ∂f x ∂f y , . =p =p ∂x ∂y x2 + y 2 x2 + y 2 Iz ˇcinjenice da je △f (X0 ) ≈ df (X0) i △f (X0 ) = f (X) − f (X0 ) za taˇcku X blizu taˇcki X0 imamo q p x0 y0 2 2 x + y ≈ x20 + y02 + p 2 (x − x0 ) + p 2 (y − y0 ) . 2 x0 + y0 x0 + y02 Uzmimo da je taˇcka X0 (3, 4) i da je X(3.04, 3.98). Tada imamo ♦ p (3.04)2 + (3.98)2 ≈ 5 + 3 4 · 0.04 + · (−0.02) = 5.008 . 5 5 Teorem 2.4.1: (Potrebni uslovi diferencijabilnosti) Neka je funkcija f (X) diferencijabilna u taˇcki A. Tada vrijedi: 1. Postoji parcijalni izvod po svakoj promjenljivoj u taˇcki A. 2. Koeficijenti pk (k = 1, 2, ..., n) u izrazu za totalni diferencijal su parcijalni izvodi funkcije, tj. pk = ∂f (A) ; k = 1, 2, ..., n . ∂xk Dokaz : Ako je funkcija f diferencijabilna u taˇcki A, tada po Definiciji 2.4.2 vrijedi △f (A) = f (x1 , x2 , ..., xn ) − f (a1 , a2 , ..., an ) = n X k=1 pk △xk + ω(X)d(X, A) . Ako fiksiramo n − 1 promjenljivih x1 = a1 , ..., xk−1 = ak−1 , xk+1 = ak+1 , ..., xn = an , 42 2.4. Diferencijabilnost funkcija viˇse promjenljivih imamo △f (A) = f (a1 , ..., ak−1 , xk , ak+1, ..., an )−f (a1 , ..., ak , ..., an ) = pk △xk +ω(X)|xk −ak | , odakle je lim xk →ak △f (A) = pk + sgn(xk − ak ) lim ω(a1 , ..., ak−1 , xk , ak+1 , ..., an ) . xk →ak △xk Odavde vidimo da za proizvoljno k ∈ {1, 2, ..., n} vrijedi pk = ∂f (A) , ∂xk iz ˇcega opet vidimo da parcijalni izvodi postoje i da su oni upravo koeficijenti pk (k = 1, 2, ..., n). ♣ Na osnovu gornje teoreme vidimo da totalni diferencijal diferencijabilne funkcije f (X) ima oblik df (X) = ∂f ∂f ∂f (X)dx1 + (X)dx2 + ... + (X)dxn , ∂x1 ∂x2 ∂xn (2.4.3) ili izraˇzeno vektorski df (X) = ∇f (X) · dX , gdje je dX = (dx1 , dx2 , ..., dxn ), vektor priraˇstaja nezavisnih varijabli. Gornja veza nam ve´c pokazuje vaˇznost gradijenta funkcije, tj. diferencijal funkcije se moˇze prikazati kao skalarni produkt gradijenta funkcije i vektora priraˇstaja argumenata. U analogiji sa funkcijom jedne varijable (df (x) = f ′ (x)dx) vidimo da ulogu izvoda funkcije preuzima gradijent. Primjer 2.16. Za funkciju f (x, y) = 4 − 2x2 − y 2 , totalni diferencijal u proizvoljnoj taˇcki X(x, y) raˇcunamo tako ˇsto prvo odredimo parcijalne izvode ∂f ∂f = −4x , = −2y , ∂x ∂y a zatim iskoristimo (2.4.3) df (X) = ∂f ∂f (X)dx + (X)dy = −4xdx − 2ydy . ∂x ∂y U konkretnoj taˇcki A(−1, 2), totalni diferencijal glasi df (A) = 4dx − 4dy. ♦ 43 2.4. Diferencijabilnost funkcija viˇse promjenljivih Teorem 2.4.2 Ako je funkcija f (x1 , ..., xn ) diferencijabilna u taˇcki A, ona je i neprekidna u toj taˇcki. Dokaz : Iz diferencijabilnosti funkcije imamo △f (A) = f (X) − f (A) = L(X) + ω(X)d(X, A) , a odavde onda imamo lim (f (X) − f (A)) = lim L(X) + lim ω(X)d(X, A) = 0 X→A X→A X→A (jer je L(A) = 0). Ovo ne znaˇci niˇsta drugo do lim f (X) = f (A) , X→A tj. neprekidnost funkcije f u taˇcki A. ♣ Da neprekidnost ne povlaˇci diferencijabilnost, vidimo iz sljede´ceg primjera. Primjer 2.17. Posmatrajmo funkciju f : R2 → R, zadatu sa ( xy 2 ; (x, y) 6= (0, 0) 2 +y 2 x f (x, y) = 0 ; (x, y) = (0, 0) Data funkcija je neprekidna u taˇcki (0, 0) (ˇsto je ostavljeno ˇcitaocu za vjeˇzbu) (0, 0) = ∂f (0, 0) = 0. Medutim, f nije diferencijai ima parcijalne izvode ∂f ∂x ∂y bilna u taˇcki (0, 0). Zaista, ako bi bila diferencijabilna imali bi smo ∂f ∂f (0, 0)∆x+ (0, 0)∆y+ω(∆x, ∆y)d(X, O) , ∂x ∂y p odnosno, odavde je zbog d(X, O) = ∆x2 + ∆y 2 , ∆f (0, 0) = f (∆x, ∆y)−f (0, 0) = ω(∆x, ∆y) = ∆x∆y 2 3 (∆x2 + ∆y 2) 2 . Zbog osobine funkcije ω, moralo bi biti lim ω(X) = 0, tj. X→O lim ∆x→0,∆y→0 ∆x∆y 2 3 (∆x2 + ∆y 2 ) 2 44 =0, 2.4. Diferencijabilnost funkcija viˇse promjenljivih ˇsto nije taˇcno jer za ∆x = ∆y > 0 je ∆x∆y 2 1 = √ 9 0 , ∆x, ∆y → 0 . 2 2 (∆x2 + ∆y 2) 3 2 ♦ Uslov diferencijabilnosti u gornjoj teoremi moˇzemo zamijeniti neˇsto slabijim uslovima. Naime vrjedi, Teorem 2.4.3 Ako funkcija f (X) u nekoj oblasti D ima ograniˇcene parcijalne izvode po svakoj promjenljivoj, tada je ona neprekidna u toj oblasti. ˇ viˇse, sa joˇs bliˇzim informacijama o parcijalnim izvodima moˇzemo imati Sta joˇs preciznije informacije o funkciji. Tako specijalno vrijedi Teorem 2.4.4 Ako funkcija f (X) u oblasti D ima parcijalne izvode po svakoj promjenljivoj jednake nuli, onda je funkcija u toj oblasti konstanta. Ovo je analogon ˇcinjenici za funkciju jedne varijable, da ako je f ′ (x) = 0 za x ∈ A, da je tada f konstantna na A. Sljede´ci teorem je analogon Lagrangeovoj teoremi za funkcije jedne promjenljive (Za diferencijabilnu funkciju na intervalu (a, b), za proizvoljan [x, y] ⊂ (a, b), postoji c ∈ (x, y), tako da je f (y) − f (x) = f ′ (c)(y − x)). Teorem 2.4.5: (Lagrangeov teorem) Ako funkcija f (X) u okolini UA taˇcke A ima konaˇcne ili beskonaˇcne parcijalne izvode po svakoj promjenljivoj, tada za proizvoljno X ∈ UA postoje taˇcke X1 , X2 , ..., Xn ∈ UA , takve da je n X ∂f f (X) − f (A) = (Xk )dxk . ∂x k k=1 Iskaˇzimo sada i dovoljne uslove diferencijabilnosti. 45 2.4. Diferencijabilnost funkcija viˇse promjenljivih Teorem 2.4.6: (Dovoljni uslovi diferencijabilnosti) Ako funkcija f (X) ima u okolini taˇcke A parcijalne izvode po svakoj promjenljivoj i ako su ti parcijalni izvodi neprekidni u taˇcki A, tada je funkcija f (X) diferencijabilna u taˇcki A. Dokaz : Dokaz ´cemo jednostavnosti zapisa radi, dati za funkciju dvije promjenljive i on se lahko moˇze prenijeti na funkcije sa n promjenljivih. Na osnovu Lagrangeovog teorema, priraˇstaj funkcije f (x, y) ima oblik f (x, y) − f (a, b) = ∂f ∂f (X1 )(x − a) + (X2 )(y − b) , ∂x ∂y (2.4.4) gdje su taˇcke X(x, y), X1(ξ1 , b) i X2 (a, ξ2 ) iz okoline UA taˇcke A. Zbog pretpostavljene neprekidnosti parcijalnih izvoda, tj. neprekidnost funkcija ∂f (x, y) i ∂f (x, y) u taˇcki A(a, b), iz (2.4.4) imamo da vrijedi ∂x ∂y lim f (x, y) = f (a, b) , x→a y→b pa vaˇzi ∂f ∂f ∂f ∂f (X1 ) = (A) + ε1 (X) , (X2 ) = (A) + ε2 (X) , ∂x ∂x ∂y ∂y gdje ε1 → 0 i ε2 → 0, kada X → A. Ako posljednje dvije jednakosti pomnoˇzimo sa x − a i y − b respektivno, i tako dobijene jednakosti saberemo, dobijamo ∂f ∂f (X1 )(x − a) + (X2 )(y − b) ∂x ∂y ∂f ∂f = (A)(x − a) + (A)(y − b) + ε1 (X)(x − a) + ε2 (X)(y − b) , ∂x ∂y f (x, y) − f (a, b) = odnosno △f = df + ε1 (X)(x − a) + ε2 (X)(y − b) , iz ˇcega se, na osnovu Definicije 2.4.2, vidi da je funkcija f diferencijabilna u taˇcki A. ♣ Za funkciju koja u nekoj taˇcki ima neprekidne parcijalne izvode, re´ci ´cemo da je neprekidno diferencijabilna u toj taˇcki. Ako funkcija f zadovoljava taj uslov u svim taˇckama nekog skupa D, onda kaˇzemo da je f neprekidno 46 2.4. Diferencijabilnost funkcija viˇse promjenljivih diferencijabilna na D. Skup neprekidno diferencijabilnih funkcija na nekom skupu D oznaˇcavamo sa C 1 (D). Posmatrajmo sada f : R2 → R i neka je f neprekidno diferencijabilna funkcija u nekoj okolini UA taˇcke A(a1 , a2 ) ∈ R2 . Neka je u = (u1 , u2) proizvoljan jediniˇcni vektor i nadimo izvod u pravcu Du f (A). Na osnovu definicije izvoda u pravcu imamo f (A + hu) − f (A) h→0 h f (a1 + hu1 , a2 + hu2 ) − f (a1 , a2 ) = lim h→0 h f (a1 + hu1 , a2 + hu2 ) − f (a1 + hu1 , a2 ) + f (a1 + hu1 , a2 ) − f (a1 , a2 ) = lim h→0 h f (a1 + hu1 , a2 + hu2 ) − f (a1 + hu1 , a2 ) f (a1 + hu1 , a2 ) − f (a1 , a2 ) = lim + . h→0 h h Du f (A) = lim Za fiksno h 6= 0, definiˇsimo sada funkciju φ : R → R, sa φ(t) = f (a1 + hu1 , a2 + t) . Pretpostavka o diferencijabilnosti funkcije f daje nam diferencijabilnost funkcije φ, te imamo φ(t + s) − φ(t) s f (a1 + hu1 , a2 + t + s) − f (a1 + hu1 , a2 + t) = lim s→0 s ∂f = (a1 + hu1 , a2 + t) . ∂y φ′ (t) = lim s→0 Neka je sada α : R → R, definisana sa α(t) = φ(u2 t) = f (a1 + hu1 , a2 + tu2 ) . (2.4.5) α je diferencijabilna i na osnovu izvoda sloˇzene funkcije imamo α′ (t) = u2φ′ (tu2 ) = u2 ∂f (a1 + hu1 , a2 + tu2 ) . ∂y (2.4.6) Na osnovu teorema o srednjoj vrijednosti funkcije jedne varijable, postoji ξ ∈ (0, h), takav da vrijedi α(h) − α(0) = α′ (ξ) . h 47 2.4. Diferencijabilnost funkcija viˇse promjenljivih Stavljaju´ci sada (2.4.5) i (2.4.6) u gornju jednakost, dobijamo ∂f f (a1 + hu1 , a2 + hu2 ) − f (a1 + hu1 , a2 ) = u2 (a1 +hu1 , a2 +ξu2) . (2.4.7) h ∂y Na isti naˇcin, posmatraju´ci funkciju β : R → R, zadatu sa β(t) = f (a1 + tu1 , a2 ), imamo da vrijedi β ′(t) = u1 ∂f (a1 + tu1 , a2 ) , ∂x i opet koriste´ci teorem o srdnjoj vrijednosti, zakljuˇcili bi da postoji η ∈ (0, h), tako da je f (a1 + hu1 , a2 ) − f (a1 , a2 ) β(h) − β(0) ∂f = = β ′ (η) = u1 (a1 + ηu1 , a2 ) . h h ∂x (2.4.8) Stavljaju´ci sada (2.4.7) i (2.4.8) u izraz za Du f (A), imamo ∂f ∂f Du f (A) = lim u2 (a1 + hu1 , a2 + ξu2 ) + u1 (a1 + ηu1, a2 ) . (2.4.9) h→0 ∂y ∂x Kako su ξ, η ∈ (0, h), kada h → 0, to onda i ξ, η → 0. Iskoristivˇsi definitivno i pretpostavku o neprekidnosti parcijalnih izvoda ∂f i ∂f , raˇcunaju´ci limes u ∂x ∂y (2.4.9), dobijamo Du f (A) = u1 ∂f ∂f (a1 , a2 ) + u2 (a1 , a2 ) . ∂x ∂y (2.4.10) Generalizaciju tvrdnje iskazane u (2.4.10) iskazujemo za funkciju f : Rn → R sljede´com teoremom. Teorem 2.4.7 Neka je f : Rn → R neprekidno diferencijabilna u nekoj okolini taˇcke A ∈ Rn . Tada za proizvoljan jediniˇcni vektor u, postoji Du f (A) i vrijedi Du f (A) = ∇f (A) · u . Primjer 2.18. Neka je f : R2 → R, zadata sa f (x, y) = 4 − 2x2 − y 2 . ∇f (x, y) = (−4x, −2y), pa za vektor u = − √12 , − √12 imamo √ 1 1 Du f (1, 1) = ∇f (1, 1) · u = (−4, −2) · − √ , − √ =3 2, 2 2 48 2.4. Diferencijabilnost funkcija viˇse promjenljivih ˇsto moˇzemo potvrditi sa ranije uradenim primjerom. Sada jednostavno raˇcunamo i √ 1 1 = −3 2 . D−u f (1, 1) = ∇f (1, 1) · (−u) = (−4, −2) · √ , √ 2 2 Za vektor v = − √15 , √25 imamo 1 2 Dv f (1, 1) = (−4, −2) · − √ , √ 5 5 =0. ♦ Neka je sada u proizvoljan jediniˇcni vektor, f : Rn → R i neka je A ∈ Rn . Koriste´ci Cauchy-Schwarzovu nejednakost, moˇzemo zakljuˇciti sljede´ce, |Du f (A)| = |∇f (A) · u| ≤ ||∇f (A)|| ||u|| = ||∇f (A)|| . (2.4.11) Ovo nam govori, bukvalno ˇcitaju´ci, da je apsolutna vrijednost izvoda funkcije u pravcu u u taˇcki A, manja ili jednaka intenzitetu vektora gradijenta funkcije u toj taˇcki. Neˇsto konkretnije, ovo znaˇci da veliˇcina promjene rasta funkcije u nekoj taˇcki u proizvoljnom pravcu nikad ne prelazi duˇzinu vektora ˇ viˇse, znaju´ci osobine Cauchy-Schwarzove nejedgradijenta u toj taˇcki. Sta nakosti, jednakost u (2.4.11) ´ce se posti´ci upravo u sluˇcaju kada je vektor u kolinearan vektoru ∇f (A). Zaista, ako je ∇f (A) 6= 0, onda za vektor ∇f (A) imamo, u = ||∇f (A)|| Du f (A) = ∇f (A) · u = ∇f (A) · ∇f (A) ||∇f (A)||2 = = ||∇f (A)|| . ||∇f (A)|| ||∇f (A)|| ˇ viˇse, vrijedi D−u f (A) = −||∇f (A)||. Gornju tvrdnju iskazujemo sa, Sta Teorem 2.4.8 Neka je f : Rn → R neprekidno diferencijabilna funkcija u nekoj otvorenoj kugli koja sadrˇzi taˇcku A. Tada Du f (A) ima maksimalnu vrijednost ||∇f (A)|| kada je vektor u ort vektor vektora ∇f (A), a minimalnu vrijednost, −||∇f (A)||, kada je vektor u ort vektora −∇f (A). Dakle, gradijentni vektor pokazuje pravac i smjer maksimalne promjene rasta funkcije, odnosno negativni gradijentni vektor pokazuje pravac i smjer maksiˇ viˇse, intenzitet gradijentnog vektora malne promjene opadanja funkcije. Sta 49 2.4. Diferencijabilnost funkcija viˇse promjenljivih nam govori o veliˇcini rasta u smjeru maksimalnog rasta, odnosno njegova negativna vrijednos govori o veliˇcini opadanja funkcije u smjeru maksimalnog opadanja. Primjer 2.19. Posmatrajmo ponovo funkciju f : R2 → R zadatu sa f (x, y) = 4 − 2x2 − y 2 , za koju je ∇f (x, y) = (−4x, −2y) . Ukoliko se nalazimo u taˇcki A(1, 1) (na grafu u taˇcki (1, 1, 1)) i ˇzelimo krenuti u smjeru najve´ceg rasta funkcije f , na osnovu gornje teoreme, trebamo krenuti u pravcu vektora 2 1 ∇f (1, 1) . = −√ , −√ u= ||∇f (1, 1)|| 5 5 Ako traˇzimo pravac najbrˇzeg opadanja funkcije, onda ´ce to biti u pravcu vektora 2 1 . −u = √ , √ 5 5 ˇ viˇse, veliˇcina promjene rasta u pravcu tog vektora je Sta √ Du f (1, 1) = ||∇f (1, 1)|| = 20 , a veliˇcina opadanja je √ D−u f (1, 1) = −||∇f (1, 1)|| = − 20 . ♦ Razmotrimo joˇs jedan vaˇzan fakat vezan za gradijent funkcije. Pokaza´cemo ga za funkciju dvije varijable, a isto rezonovanje imamo za proizvoljnu funkciju f : Rn → R. Dakle, neka je data funkcija z = f (x, y) ˇciji je graf povrˇs G u prostoru R3 . Posmatrajmo poizvoljnu taˇcku P (x0 , y0 , f (x0 , y0 )) na grafu G i neka je l nivo linija na grafu G koja prolazi kroz taˇcku P . Kako je za tu liniju zadovoljeno f (x, y) = k, za neko fiksno k ∈ R, i kako je ona jednodimenzionalan objekat u prostoru, moˇzemo je parametrizovati, tj. svaku taˇcku linije l moˇzemo posmatrati kao vektorsku funkciju ~r(t) = (x(t), y(t)) za t ∈ [α, β]. Neka je t0 ona vrijednost parametra koja odgovara taˇcki P . Kako je nivo linija l na povrˇsi G, mora biti zadovoljena jednaˇcina f (x(t), y(t)) = k , za svako t ∈ [α, β] . 50 2.5. Pravila diferenciranja Diferenciranjem ove jednakosti po t, primjenom pravila kompozicije, imamo ∂f dx ∂f dy + =0. ∂x dt ∂y dt (2.4.12) Nije teˇsko vidjeti da se jednakost (2.4.12) moˇze zapisati u vektorskoj notaciji, ∂f ∂f dx dy , · , = ∇f · ~r˙ = 0 . ∂x ∂y dt dt Gornje ´ce vrijediti u proizvoljnoj taˇcki nivo linije l, tj. ∇f (x0 , y0 ) · ~r˙ (t0 ) = 0 . Dakle, vrijedi vrdnja, Teorem 2.4.9 Gradijentni vektor funkcije z = f (x1 , x2 , ..., xn ) u svakoj taˇcki nivo linije f (x1 , x2 , ..., xn ) = k, ortogonalan je na tu liniju. Na sljede´coj slici prikazano je nekoliko funkcija konturnim grafom (pomo´cu nivo linija) i odgovaraju´cim ”vektorskim poljem” (”strelice” na slici predstavljaju gradijentne vektore date funkcije u raznim taˇckama). ”Strelice” su usmjerene u pravcu najbrˇzeg rasta funkcije, a veliˇcina strelica odraˇzava brzinu promjene funkcije u tom pravcu. Takode uoˇcavamo ortogonalnost gradijentnih vektora na odgovaraju´ce nivo linije. −5 −4 −3 −2 5 5 5 5 4 4 4 4 3 3 3 3 2 2 2 2 1 1 1 −1 −1 1 2 3 4 −5 −4 −3 −2 −1 −1 1 2 3 4 5 −5 −4 −3 −2 −1 −1 1 1 2 3 4 5 −5 −4 −3 −2 −1 −1 −2 −2 −2 −2 −3 −3 −3 −3 −4 −4 −4 −4 −5 −5 −5 f (x, y) = x2 + y 2 2.5 5 f (x, y) = 1 − x2 − y 2 p f (x, y) = x2 + y 2 1 2 3 −5 f (x, y) = x2 − y 2 Pravila diferenciranja Kao ˇsto smo ve´c mogli primjetiti, pravila nalaˇzenja diferencijala funkcija viˇse varijabli ne´ce se razlikovati od tih pravila kod funkcije jedne varijabe. 51 4 5 2.6. Izvodi viˇseg reda, Hesseova matrica Teorem 2.5.1 Neka su funkcije f, g : D → R (D ⊆ Rn ) diferencijabilne u taˇcki A ∈ D i neka su a, b ∈ R proizvoljni. Tada je i funkcija af + bg diferencijabilna u taˇcki A i vrijedi d(af + bg)(A) = adf (A) + bdg(A) . Teorem 2.5.2 Neka su funkcije f, g : D → R (D ⊆ Rn ) diferencijabilne u taˇcki A ∈ D. f Tada su i funkcije f ·g i (posljednja uz uslov g(A) 6= 0) diferencijabilne g u taˇcki A i vrijedi d(f g)(A) = g(A)df (A) + f (A)dg(A) , f g(A)df (A) − f (A)dg(A) d (A) = . g (g(A))2 2.6 Izvodi viˇseg reda, Hesseova matrica Ukoliko funkcija f : Rn → R ima parcijalne izvode koji postoje na nekom ∂f otvorenom skupu U, tada za svako i ∈ {1, 2, ..., n}, ∂x je takode funkcija i ∂f ∂f sama za sebe, tj. ∂xi : Rn → R. Parcijalni izvodi funkcije ∂x , ukoliko i postoje, nazivaju se parcijalni izvodi drugog reda funkcije f . Kao i za prve parcijalne izvode i za druge parcijalne izvode postoje razne 2f oznake kao naprimjer: ∂x∂i ∂x , fx′′i xj , Dxi xj f ili jednostavno fxi xj . Mi ´cemo j se sluˇziti uglavnom prvom navedenom notacijom, ali po potrebi skra´civanja zapisa, ˇcesto ´cemo upotrebljavati i posljednju navedenu notaciju. Tako za funkciju z = f (x, y) imamo sljede´ce parcijalne izvode drugog reda, zapisane i sa prvom i sa posljednjom notacijom: ∂ ∂f ∂2f ∂ ∂f ∂2f fxx = = ; f = = yy ∂x ∂x ∂x2 ∂y ∂y ∂y 2 ∂2f ∂ ∂f ∂2f ∂ ∂f fxy = = ; fyx = = ∂y ∂x ∂x∂y ∂x ∂y ∂y∂x Tehnika nalaˇzenja parcijalnih izvoda drugog reda sadrˇzana je u simboliˇckom zapisivanju tih izvoda. Naprimjer, fxy znaˇci da od izvoda fx′ (prvi 52 2.6. Izvodi viˇseg reda, Hesseova matrica s lijeva indeks nam govori od koga pravimo parcijalni izvod) nalazimo parcijalni izvod po y (drugi indeks s lijeva nam govori po ˇcemu radimo drugi parcijalni izvod). Primjer 2.20. Odredimo parcijalne izvode drugog reda funkcije z = x2 y. Prvo odredimo parcijalne izvode prvog reda: ∂z ∂z = 2xy ; = x2 . ∂x ∂y Odredimo sada parcijalne izvode drugog reda, koriste´ci gornje objaˇsnjenje. ∂z Za nalaˇzenje fxx , uzimamo ∂x i od njega traˇzimo parcijalni izvod po x. Tako dobijamo fxx = (2xy)′x = 2y . Analogno, za fxy uzimamo prvi parcijalni izvod po x, pa od njega traˇzimo izvod po y fxy = (2xy)′x = 2x . Istu logiku koristimo kod nalaˇzenja ostala dva parcijalna izvoda drugog reda, fyx = 2x ; fyy = 0 . ♦ Primjer 2.21. z = ex 2 +y 2 fx = 2xex x2 +y 2 fxx = 2e +2x2xe x2 +y 2 fyx = 2y2xe x2 +y 2 = 4xye x2 +y 2 = 2e x2 +y 2 2 +y 2 ; fy = 2yex 2 +y 2 . (1+2x2 ) ; fxy = 2x2yex x2 +y 2 ; fyy = 2e x2+y 2 +2y2ye 2 +y 2 x2 +y 2 = 2e ♦ = 4xyex 2 +y 2 (1+2y 2) . Za funkciju f : Rn → R, parcijalne izvode fxi xj i fxj xi (i 6= j), nazivamo mjeˇsoviti parcijalni izvodi i na osnovu opisanog postupka, jasna nam je razlika istaknuta poretkom indeksa. U pokazana dva primjera primije´cujemo da su mjeˇsoviti parcijalni izvodi jednaki, fxy = fyx . Postavlja se pitanje da li je to tako u opˇstem sluˇcaju? Kao ˇsto ´cemo kasnije vidjeti taj uslov je veoma bitan, a ovdje ´cemo dati uslove pod kojima su ti parcijalni izvodi jednaki za funkciju dvije promjenljive. Prije toga, odgovor na postavljeno pitanje nam daje sljede´ci primjer. Primjer 2.22. Posmatrajmo funkciju f : R2 → R zadatu sa x2 − y 2 ; (x, y) 6= (0, 0) xy 2 f (x, y) = x + y2 0 ; (x, y) = (0, 0) 53 ; 2.6. Izvodi viˇseg reda, Hesseova matrica Tada je x4 − y 4 + 4x2 y 2 ∂f ∂f (x, y) = y , (x, y) 6= (0, 0) ; (0, 0) = 0 . 2 2 2 ∂x (x + y ) ∂x Onda je ∂2f 1 (0, 0) = lim h→0 h ∂x∂y ∂f ∂f (0, h) − (0, 0) ∂x ∂x Na sliˇcan naˇcin odreduju´ci, imamo da je −h = −1 . h→0 h = lim ∂2f (0, 0) = 1 , ∂y∂x pa oˇcigledno u opˇstem sluˇcaju mjeˇsoviti izvodi nisu jednaki. ♦ Definicija 2.6.1 Za funkciju f : Rn → R kaˇzemo da je dva puta neprekidno diferencijabilna na otvorenom skupu U ⊆ Rn , i piˇsemo f ∈ C 2 (U), ako su funkcije fxi xj neprekidne na U, za sve i, j ∈ {1, 2, ..., n}. Pod odredenim uslovima koji su dati u narednoj teoremi, mjeˇsoviti izvodi ´ce biti jednaki. Teorem 2.6.1 Neka je U ⊆ Rn otvoren skup koji sadrˇzi taˇcku A i neka je funkcija f ∈ C 2 (U). Tada vrijedi ∂2f ∂2f (A) = (A) , ∂xi ∂xj ∂xj ∂xi za sve i, j ∈ {1, 2, ..., n}. Gornje rezonovanje o parcijalnim izvodima drugog reda sada moˇzemo proˇsiriti na parcijalne izvode tre´ceg, ˇcetvrtog i viˇseg reda, kao i na funkcije tri, ˇcetiri i viˇse promjenljivih. Za funkciju dvije varijable, vidjeli smo, postoje ˇcetiri parcijalna izvoda drugog reda. Prave´ci od njih ponovo parcijalne izvode, dobijamo parcijalne izvode tre´ceg reda, kojih ´ce tada biti osam. Za funkciju tri varijable, parcijalnih izvoda drugog reda ima devet, a tre´ceg reda 27. U opˇstem sluˇcaju, funkcija f : Rn → R ima n2 parcijalnih izvoda drugog reda, od kojih onda moˇzemo formirati kvadratnu matricu reda n × n. 54 2.6. Izvodi viˇseg reda, Hesseova matrica Definicija 2.6.2 Neka svi parcijalni izvodi drugog reda funkcije f : Rn → R postoje u taˇcki c ∈ Rn . Matricu reda n × n ∂2f ∂2f ∂2f ∂2f (c) (c) (c) · · · (c) 2 ∂x2 ∂x1 ∂x3 ∂x1 ∂xn ∂x1 ∂∂x2 f1 ∂2f ∂2f ∂2f ∂x ∂x (c) (c) · · · (c) (c) 2 ∂x ∂x ∂x ∂x ∂x n 3 2 2 12 2 2 2 2 2 f ∂ f ∂ f ∂ f (c) · · · (c) (c) (c) Hf (c) = ∂x∂1 ∂x (2.6.1) ∂x2 ∂x3 ∂xn ∂x3 ∂x23 3 .. .. .. .. .. . . . . . ∂2f ∂2f ∂2f ∂2f (c) ∂x2 ∂xn (c) ∂x3 ∂xn (c) · · · ∂x2 (c) ∂x1 ∂xn n nazivamo Hesseova matrica ili Hessijan funkcije f u taˇcki c. Primjetimo da je i-ta kolona Hesseove matrice, gradijent funkcije ′ ∇fxi (c). ∂f , ∂xi tj. Primjer 2.23. Neka je f (x, y) = x2 y − xy 2 . Tada je fxx (x, y) fyx (x, y) 2y 2x − 2y Hf (x, y) = = . fxy (x, y) fyy (x, y) 2x − 2y −2x Sada naprimjer, u taˇcki A(2, 1), Hessijan glasi 2 2 Hf (2, 1) = . 2 −4 ♦ Neka je sada f : R2 → R dva puta neprekidno diferencijabilna na nekoj otvorenoj kugli B(A, r) ⊆ R2 i neka je h = (h1 , h2 ) vektor, takav da je ||h|| < r. Definiˇsimo novu funkciju ϕ : R → R, na sljede´ci naˇcin ϕ(t) = f (A + th) . (Veliˇcinu A + th shvatamo tako da se iz taˇcke A pomjerimo u pravcu vektora h, za duˇzinu t||h||) Funkcija ϕ je funkcija jedne varijable i pri tome je npr. ϕ(0) = f (A) i ϕ(1) = f (A + h). Na osnovu Taylorove teoreme za funkciju jedne varijable sada imamo 1 ϕ(1) = ϕ(0) + ϕ′ (0) + ϕ′′ (ξ) , 2 55 (2.6.2) 2.6. Izvodi viˇseg reda, Hesseova matrica gdje je ξ ∈ (0, 1). Kako je dϕ = df , koriste´ci pravilo izvoda kompozicije, imamo d (A+th) = ∇f (A+th)·h = fx (A+th)h1 +fy (A+th)h2 . dt (2.6.3) (jasno, u izrazu ∇f (A+th)·h imamo skalarno mnoˇzenje). Analogno nalazimo i drugi izvod ϕ′ (t) = ∇f (A+th)· ϕ′′ (t) = ∇ (h1 fx (A + th) + h2 fy (A + th)) · h = (h1 ∇fx (A + th) + h2 ∇fy (A + th)) · (h1 , h2 ) fxx (A + th) fxy (A + th) h1 = [h1 h2 ] . fyx (A + th) fyy (A + th) h2 (Zadnji zapis dobijamo nakon jednostavnog matriˇcnog raˇcuna). Koriste´ci sada oznake h1 h= h2 i hT = [h1 h2 ] , posljednje moˇzemo zapisati sa ϕ′′ (t) = hT Hf (A + th)h . (2.6.4) Stavljaju´ci (2.6.3) i (2.6.4) u izraz (2.6.2), dobijamo sljede´cu vezu 1 f (A + h) = ϕ(1) = f (A) + ∇f (A) · h + hT Hf (A + ξh)h . 2 Ovaj rezultat predstavlja verziju Taylorove teoreme za funkcije viˇse varijabli, koga generalizujemo sljede´com teoremom Teorem 2.6.2 Neka je f : Rn → R i neka je f ∈ C 2 (B(A, r)) (r > 0). Neka je h vektor, takav da je ||h|| < r. Tada postoji realan broj ξ ∈ (0, 1), takav da vrijedi 1 f (A + h) = f (A) + ∇f (A) · h + hT Hf (A + ξh)h . 2 (2.6.5) Uvedemo li oznake X = A+h i izraˇcunamo li Hessijan u taˇcki A, izraz (2.6.5) predstavlja polinomijalnu aproksimaciju funkcije f . 56 2.6. Izvodi viˇseg reda, Hesseova matrica Definicija 2.6.3 Neka je f : Rn → R dva puta neprekidno diferencijabilna na nekoj otvorenoj kugli oko taˇcke A. Funkciju 1 P2 (X) = f (A) + ∇f (A)(X − A) + (X − A)T Hf (A)(X − A) , 2 nazivamo Taylorov polinom drugog reda, funkcije f u taˇcki A. Primjer 2.24. Odredimo Taylorov polinom drugog reda za funkciju f (x, y) = e−2x+y , u taˇcki (0, 0). Kao prvo, nalazimo 4e−2x+y −2e−2x+y −2x+y −2x+y ∇f (x, y) = −2e ,e i Hf (x, y) = , −2e−2x+y e−2x+y odnosno ∇f (0, 0) = (−2, 1) , Hf (0, 0) = Sada imamo 4 −2 −2 1 . 1 x P2 (x, y) = f (0, 0) + ∇f (0, 0) · (x, y) + [x y]Hf (0, 0) y 2 1 4 −2 x = 1 + (−2, 1) · (x, y) + [x y] −2 1 y 2 1 4x − 2y = 1 − 2x + y + [x y] −2x + y 2 1 = 1 − 2x + y + (4x2 − 2xy − 2xy + y 2) 2 1 = 2x2 + y 2 − 2xy − 2x + y + 1 . 2 Svrha Taylorovog polinoma je da se funkcija njime dovoljno dobro aproksimira u okolini neke taˇcke. Na slici (2.2) dat je prikaz te aproksimacije iz dva ugla posmatranja, da bi se bolje uoˇcila istaknuta aproksimacija u taˇcki (0,0). ♦ U dijelu linearne algebre, koga smo izuˇcavali ranije, upoznali smo pojam simetriˇcne matrice, tj. kvadratne matrice M = [aij ]n×n za koju vrijedi M = MT , ili za ˇcije elemente vrijedi aij = aji . 57 2.6. Izvodi viˇseg reda, Hesseova matrica z z x x y y e−2x+y Slika 2.2: Aproksimacija funkcije f (x, y) = (zelena) u taˇcki (0,0), Taylorovim polinomom P2 (x, y) = 2x2 + 12 y 2 − 2xy − 2y + y + 1 (crvena) Primjer 2.25. Matrica −1 2 −2 0 , M = 2 5 −2 0 3 primjer je simetriˇcne matrice, a matrica 1 2 M= , 3 4 je primjer nesimetriˇcne matrice. ♦ Ako je f ∈ C 2 , tada na osnovu Teorema (2.6.1), imamo da su mjeˇsoviti izvodi jednaki, tj. ∂2f ∂2f = , ∂xi ∂xj ∂xj ∂xi a to ´ce onda na osnovu definicije Hessijana znaˇciti da je za svaku dva puta neprekidno diferencijabilnu funkciju, njen Hessijan simetriˇcna matrica. Neka je sada M proizvoljna simetriˇcna matrica reda n×n. Za proizvoljnu matricu vrstu x (moˇzemo re´ci i vektor x = (x1 , x2 , ..., xn )), definiˇsimo funkciju q : Rn → R na sljede´ci naˇcin q(x) = xT Mx . (2.6.6) Funkcija q je polinom drugog reda po promjenljivima x1 , x2 , ..., xn i nazivamo je kvadratna forma po promjenljivima x1 , x2 , ..., xn , a matricu M nazivamo matrica kvadratne forme q. 58 2.6. Izvodi viˇseg reda, Hesseova matrica Primjer 2.26. Neka je M= 1 2 2 1 . Kvadratnu formu dobijamo iz (2.6.6), 1 2 x1 x1 T q2 (x) = x Mx = [x1 x2 ] = [x1 +2x2 2x1 +x2 ] = x21 +x22 +4x1 x2 . 2 1 x2 x2 Za matricu kvadratna forma glasi 2 −1 1 5 1 , M = −1 1 1 2 q3 (x) = 2x21 + 5x22 + 2x23 − 2x1 x2 + 2x1 x3 + 2x2 x3 . ♦ Definicija 2.6.4 Za kvadratnu formu q(x) = xT Mx kaˇzemo da je • pozitivno poludefinitna, ako je za svako x = (x1 , x2 , ..., xn ) ∈ Rn , zadovoljeno q(x) ≥ 0. • pozitivno definitna, ako je za svako x 6= 0, zadovoljeno q(x) > 0. • negativno poludefinitna, ako je za svako x ∈ Rn , zadovoljeno q(x) ≤ 0. • negativno definitna, ako je za svako x 6= 0, zadovoljeno q(x) < 0. • indefinitna ili promjenljivog znaka, ako postoje x′ , x′′ ∈ Rn , tako da je q(x′ ) > 0 i q(x′′ ) < 0. Ako je q(x) = 0, ˇcesto kaˇzemo da je kvadratna forma nedefinitna u toj taˇcki. Primjer 2.27. Kvadratnu formu q2 iz gornjeg primjera gdje je 1 2 M= , 2 1 59 2.6. Izvodi viˇseg reda, Hesseova matrica moˇzemo zapisati q2 (x) = (x1 + x2 )2 + 2x1 x2 , pa za x = (1, 0) imamo q2 (x) = 1 > 0, a za x = (1, −1) imamo q2 (x) = −2 < 0. Na osnovu definicije, kvadratna forma q2 je indefinitna. Kvadratnu formu q3 moˇzemo nakon malo raˇcuna zapisati sa q3 (x) = (x1 + x2 + x3 )2 + (x1 − 2x2 )2 + x23 , pa je oˇcigledno ova kvadratna forma pozitivno definitna (kao suma kvadrata) odnosno, za svako x = (x1 , x2 , x3 ) 6= 0 je q3 (x) > 0. ♦ Kao ˇsto ´cemo uskoro vidjeti, od velikog je interesa imati naˇcin odredivanja definitnosti neke kvadratne forme. Najjednostavniji naˇcin bio bi obrazovati tu kvadratnu formu, a onda je svesti na neki ”pogodan” oblik iz koga ”lagano” moˇzemo ocijeniti njenu definitnost (ovo smo primjenili u posljednjem primjeru). Nadimo taj naˇcin u za nas vaˇznom sluˇcaju 2 × 2 matrice. Neka je zadata simetriˇcna matrica a b M= . b c Kvadratna forma odredena ovom matricom je a b x q(x, y) = [x y] = ax2 + 2bxy + cy 2 . b c y Ako je a 6= 0, poznatim postupkom svodenja trinoma na kanonski oblik dobijamo 2b c 2 2 q(x, y) = a x + xy + y a a ! 2 b b2 2 c 2 = a x + y − 2y + y a a a 2 b ac − b2 2 = a x+ y + y a a 2 b det(M) 2 = a x+ y + y . a a Sada imamo diskusiju: 1. Ako je a > 0 i det(M) > 0, tada je za svako (x, y) 6= (0, 0), q(x, y) > 0, tj. kvadratna forma je pozitivno definitna. 60 2.6. Izvodi viˇseg reda, Hesseova matrica 2. Ako je a < 0 i det(M) > 0, tada je za svako (x, y) 6= (0, 0), q(x, y) < 0, tj. kvadratna forma je negativno definitna. 3. Ako je det(M) < 0, tada u taˇckama (x, y) = (1, 0) i (x, y) = (− ab , 1) imamo razliˇcite znakove kvadratne forme, pa je ona indefinitna. 4. Ako je det(M) = 0, tada imamo 2 b q(x, y) = a x + y . a Ako je x = − ab y, onda je q(x, y) = 0, a u svim ostalim sluˇcajevima ona uzima znak koga ima parametar a. Dakle, q(x, y) je ili pozitivno ili negativno poludefinitan. Jasno nam je da bi ovakav postupak odredivanja definitosti kvadratnih formi, odredenih matrica viˇsih dimenzija, bio popriliˇcno teˇzak posao. Zato sljede´cim teoremom dajemo veoma jednostavan kriterij za utvrdivanje definitnosti kvadratne forme. Teorem 2.6.3: Sylvesterov kriterijum Neka je a11 a21 M = ··· an1 a12 a22 ··· an2 ··· ··· ··· ··· a1n a2n , ··· ann proizvoljna kvadratna matrica koja odreduje kvadratnu formu q : Rn → R. Oznaˇcimo sa Ai (i = 1, 2, ..., n) glavne minore matrice M, tj. a11 a12 , · · · , An = det(M) . A1 = a11 , A2 = a21 a22 Kvadratna forma q je pozitivno definitna ako i samo ako su svi glavni minori pozitivni, tj. ako vrijedi A1 > 0 , A2 > 0 , · · · , An > 0 . Kvadratna forma je negativno definitna ako i samo ako su glavni minori alternativnih znakova, tako da je A1 < 0, tj. ako vrijedi A1 < 0 , A2 > 0 , A3 < 0 , A4 > 0 , · · · 61 2.7. Diferencijali viˇseg reda Uobiˇcajeno je i za matricu M re´ci da je pozitivno definitna, negativno definitna ili indefinitna kad god je takva kvadratna forma koja je njome odredena. Primjer 2.28. Za matricu 2 −1 1 5 1 , M = −1 1 1 2 glavni minori su A1 = 2 > 0, A2 = 9 > 0 i A3 = det(M) = 9 > 0, pa je kvadratna forma odredena ovom matricom pozitivno definitna. Za matricu −2 1 M= , 1 −4 glavni minori su A1 = −2 < 0 i A2 = det(M) = 7 > 0, pa je kvadratna forma negativno definitna. Za matricu −3 1 M= , 1 2 glavni minori su A1 = −3 < 0 i A2 = det(M) = −7 < 0, pa je kvadratna forma indefinitna. ♦ 2.7 Diferencijali viˇseg reda Neka je u oblasti D definisana funkcija f (x1 , x2 , ..., xn ) koja ima neprekidne parcijalne izvode do n-tog reda. Ranije smo vidjeli da totalni diferencijal ima oblik ∂f ∂f ∂f dx1 + dx2 + ... + dxn , df = ∂x1 ∂x2 ∂xn gdje su dxi (i = 1, 2, ..., n) priraˇstaji, odnosno diferencijali nezavisnih promjenljivih. Totalni diferencijal drugog reda ili kra´ce diferencijal drugog reda, definiˇse se kao diferencijal prvog diferencijala, tj. d2 f = d(df ). ∂f ∂f ∂f 2 d f =d dx1 + dx2 + ... + dxn . ∂x1 ∂x2 ∂xn Kako je d(dxi ) = 0 za svako i = 1, 2, ..., n, to sada imamo: ∂f ∂f ∂f 2 d f =d dx1 + d dx2 + ... + d dxn , ∂x1 ∂x2 ∂xn 62 2.7. Diferencijali viˇseg reda odakle sada primjenjuju´ci formulu za diferencijal funkcije imamo d2 f = ∂2f 2 ∂2f ∂2f ∂2f 2 dx + ... + dx + 2 dx dx + ... + 2 dxn−1 dxn . 1 2 ∂x21 1 ∂x2n n ∂x1 ∂x2 ∂xn−1 ∂xn Ovaj postupak moˇzemo generalizovati na diferencijale proizvoljnog reda, tj. imamo dn+1 f = d(dn f ) , n ∈ N . Specijalno, za funkciju dvije varijable f (x, y), drugi diferencijal je dat sa ∂2f 2 ∂2f 2 ∂2f ∂2f df= dx + 2 dy + dxdy + dxdy . ∂x2 ∂y ∂x∂y ∂y∂x 2 Primjer 2.29. Odrediti drugi diferencijal funkcije f (x, y) = x3 y 2 −x2 y+2xy− 3x + 4. Odredujemo prve parcijalne izvode: ∂f ∂f = 3x2 y 2 − 2xy + 2y − 3 , = 2x3 y − x2 + 2x . ∂x ∂y Drugi parcijalni izvodi su: ∂2f ∂2f ∂2f ∂2f 2 2 2 = 6xy −2y , = 6x y−2x+2 , = 6x y−2x+2 , = 2x3 . ∂x2 ∂x∂y ∂y∂x ∂y 2 Konaˇcno, izraz za drugi diferencijal je, d2 f (x, y) = (6xy 2 − 2y)dx2 + 2(6x2 y − 2x + 2)dxdy + 2x3 dy 2 . ♦ Primjer 2.30. Odrediti drugi diferencijal funkcije g(x, y, z) = sin x + sin y + sin z. Prvi parcijalni izvodi su: ∂g ∂g ∂g = cos x , = cos y , = cos z . ∂x ∂y ∂z Drugi parcijalni izvodi su: ∂2g ∂2g ∂2g = − sin x , = − sin y , = − sin z ∂x2 ∂y 2 ∂z 2 ∂2g ∂2g ∂2g ∂2g ∂2g ∂2g = = = = = =0. ∂x∂y ∂x∂z ∂y∂x ∂y∂z ∂z∂x ∂z∂y Dakle, drugi diferencijal je d2 g = − sin xdx2 − sin ydy 2 − sin zdz 2 . ♦ 63 2.8. Ekstremumi funkcija viˇse promjenljivih 2.8 Ekstremumi funkcija viˇse promjenljivih Sada ´cemo naˇs rad iz prethodnih sekcija primjeniti na problem nalaˇzenja minimalne i maksimalne vrijednosti funkcija viˇse varijabli. Primjetit ´cemo da je tehnika odredivanja ekstremnih vrijednosti funkcije viˇse varijabli veoma sliˇcna tehnici koju smo izuˇcavali kod funkcija jedne varijable. Definicija 2.8.1 Neka je funkcija f : Rn → R, definisana na skupu Df . Kaˇzemo da funkcija f ima maksimalnu vrijednost M u taˇcki X0 , ako je f (X0 ) = M i za sve X ∈ Df vrijedi f (X) ≤ M. Kaˇzemo da funkcija f ima minimalnu vrijednost m u taˇcki X0 , ako je f (X0 ) = m i za sve X ∈ Df , vrijedi f (X) ≥ m. ˇ Cesto maksimalnu i minimalnu vrijednost funkcije, uvedene gornjom definicijom, nazivamo globalni maksimum i globalni minimum, za razliku od pojmova lokalni maksimum i minimum, koje uvodimo sljede´com definicijom. Definicija 2.8.2 Neka je f : Rn → R definisana na otvorenom skupu U. Kaˇzemo da funkcija f ima lokalnu maksimalnu vrijednost M u taˇcki X0 , ako je f (X0 ) = M i za sve X ∈ B(X0 , r), za neko r > 0, vrijedi f (X) ≤ M. Kaˇzemo da funkcija f ima lokalnu minimalnu vrijednost m u taˇcki X0 , ako je f (X0 ) = m i za sve X ∈ B(X0 , r), za neko r > 0, vrijedi f (X) ≥ m. ˇ Cesto ´cemo upotrebljavati i termin globalni ekstrem ili globalna ekstremna vrijednost, bilo da govorimo o globalnom maksimumu ili globalnom minimumu, a takode i lokalni ekstrem ili lokalna ekstremna vrijednost, kada govorimo o lokalnom maksimumu ili minimumu. Teorem 2.8.1: Teorem o ekstremnoj vrijednosti Neka je funkcija f : Rn → R neprekidna na nekom otvorenom skupu U. Ako je D ograniˇcen i zatvoren podskup skupa U, tada funkcija f dostiˇze maksimalnu i minimalnu vrijednost na skupu D. Sa gornjom teoremom imamo odliˇcan rezultat koji nam govori o egzistenciji ekstremne vrijednosti funkcije, ali ne i kako locirati tu vrijednost. 64 2.8. Ekstremumi funkcija viˇse promjenljivih Naˇs sljede´ci posao je prona´ci kriterije za lociranje taˇcaka koje su kandidati u kojima ´ce se postizati ekstremne vrijednosti, a onda i kriterije za njihovu klasifikaciju, tj. da li se u njima postiˇze ili ne postiˇze ekstrem i ako se postiˇze, koja je vrsta ekstrema, maksimum ili minimum. Primjer 2.31. Ispitati postojanje i odrediti globalnu ekstremnu vrijednost funkcije f (x, y) = x2 + y 2 na skupu D = {(x, y) ∈ R2 | x2 + 4y 2 ≤ 4}. Kako je skup D ograniˇcen i zatvoren, a funkcija f neprekidna na R2 , na osnovu Teoreme 2.8.1 zakljuˇcujemo da funkcija ima i maksimum i minimum na skupu D. ♦ 2.8.1 Nalaˇ zenje lokalnog ekstrema Za poˇcetak, posmatrajmo funkciju f : Rn → R koja je diferencijabilna na otvorenom skupu U i koja ima ekstrem u taˇcki X0 . Neka je u proizvoljan jediniˇcni vektor, tada ´ce oˇcigledno, funkcija ϕ : R → R, definisana sa ϕ(t) = f (X0 + tu) , takode imati ekstremnu vrijednost i to upravo za t = 0. Kako je ϕ funkcija jedne varijable, to onda mora biti ϕ′ (0) = 0 . (2.8.1) Ali u sekciji 2.1 smo vidjeli da ovaj izvod nije niˇsta drugo do izvod funkcije f u pravcu vektora u, tj. ϕ′ (0) = Du f (X0 ) . (2.8.2) Zakljuˇcujemo da vrijedi, ϕ′ (0) = Du f (X0 ) = ∇f (X0 ) · u = 0 . Skalarni produkt jednak je nuli ako je jedan od vektora tog produkta nulavektor ili ako su vektori ortogonalni. Ortogonalnost otpada jer gornje vrijedi za proizvoljan jediniˇcni vektor u. Koriste´ci proizvoljnost vektora u, uzmimo specijalno vektore baze. Tada imamo ∇f (X0 ) · ei = ∂f (X0 ) = 0 , ∂xi za i = 1, 2, ..., n. Ovo znaˇci da mora biti ∇f (X0 ) = 0. Primjetimo da ovo znaˇci i to da je nagib grafa funkcije f jednak 0 u taˇcki X0 , u pravcima svih baznih vektora. Medutim, to znaˇci mnogo viˇse naime, nagib grafa je 0 u svim pravcima u jer je Du f (X0 ) = ∇f (X0 ) · u. Ovo razmatranje sumiramo teoremom. 65 2.8. Ekstremumi funkcija viˇse promjenljivih Teorem 2.8.2 Neka je f : Rn → R diferencijabilna na otvorenom skupu U i neka ima lokalnu ekstremnu vrijednost u taˇcki X0 ∈ U, tada je ∇f (X0 ) = 0. Kako je totalni diferencijal funkcije jednak umnoˇsku gradijenta i diferencijala argumenta, tj. df (X) = ∂f ∂f ∂f (X)dx1 + (X)dx2 + · (X)dxn = ∇f (X) · dX , ∂x1 ∂x2 ∂xn to onda za diferencijabilnu funkciju koja ima ekstremnu vrijednost u taˇcki X0 , vrijedi df (X0) = 0 , a takvu situaciju smo imali i kod funkcije jedne varijable jer je neophodan uslov bio f ′ (x) = 0, a vrijedilo je df (x) = f ′ (x)dx. Teorem 2.8.2 nam daje neke od taˇcaka koje su kandidati za ekstreme, ali ne i sve. Naime, vrijedi. Teorem 2.8.3 [Potrebni uslovi za ekstrem] Ako funkcija f : Rn → R ima ekstrem u taˇcki X0 , tada vrijedi, ili je ∇f (X0 ) = 0 ili prvi parcijalni izvodi funkcije u taˇcki X0 ne postoje. Dakle, kandidati za ekstremnu vrijednost su sve one taˇcke u kojima je gradijent jednak 0 i sve one u kojima funkcija nije diferencijabilna. Ovo nas navodi da ove taˇcke definiˇsemo precizno. Definicija 2.8.3 Neka je f : Rn → R diferencijabilna u taˇcki X0 i neka je ∇f (X0 ) = 0. Tada taˇcku X0 nazivamo stacionarnom taˇckom funkcije f . Taˇcke u kojima funkcija f nije diferencijabilna, nazivamo singularnim taˇckama funkcije f . ˇ Cesto se za obje gore pomenute vrste taˇcaka kaˇze da su kritiˇcne taˇcke funkcije. Primjer 2.32. Funkcija f (x, y) = x2 + y 2 je diferencijabilna funkcija na R2 i ∇f (x, y) = (2x, 2y). Jedine kandidate za ekstremne vrijednosti dobijamo 66 2.8. Ekstremumi funkcija viˇse promjenljivih rjeˇsavanjem sistema 2x = 0 2y = 0 Dakle, jedina kritiˇcna taˇcka je stacionarna taˇcka X0 (0, 0). ♦ p Primjer 2.33. Za funkciju f (x, y) = x2 + y 2 , gradijent je ∇f (x, y) = ( p y ,p ). x2 + y 2 x2 + y 2 x Parcijalni izvodi ne postoje u taˇcki X0 (0, 0) i to je jedina kritiˇcna taˇcka funkcije f , i ona je singularna taˇcka. ♦ Primjer 2.34. Funkcija f (x, y) = x2 −y 2 ima gradijent ∇f (x, y) = (2x, −2y), pa je jedina kritiˇcna taˇcka, stacionarna taˇcka X0 (0, 0). ♦ Primjer 2.35. Funkcija f (x, y) = 1 − x2 − y 2 je diferencijabilna i ∇f (x, y) = (−2x, −2y). Rjeˇsavanjem sistema −2x = 0 −2y = 0 dobijamo stacionarnu taˇcku X0 (0, 0). ♦ z z z z b x b y f (x, y) = x2 + y 2 Minimum u (0,0) ∇f (0, 0) = (0, 0) x x y f (x, y) = 1 − x2 − y 2 Maksimum u (0,0) ∇f (0, 0) = (0, 0) x b b y y p f (x, y) = x2 + y 2 Minimum u (0,0) fx i fy ne postoje f (x, y) = x2 − y 2 Nema ekstrema, ∇f (0, 0) = (0, 0) Sada kada smo u mogu´cnosti utvrditi postojanje ekstremne vrijednosti funkcije (Teorem 2.8.1) i identifikovati kandidate za te vrijednosti (Teorem 2.8.3) ostaje nam prona´ci kriterije za utvrdivanje da li ti kandidati jesu ekstremi i klasificirati ih. Prisjetimo se opet funkcija jedne varijable, da je jedan od kriterija za identifikaciju lokalnih ekstrema bio test drugog izvoda. Naime, ako je c bila stacionarna taˇcka funkcije ϕ : R → R, tada ako je ϕ′′ (c) > 0, funkcija je imala minimum u c, a ako je ϕ′′ (c) < 0, funkcija je imala maksimum u taˇcki c. Taylorov polinom nam na najvidljiviji naˇcin pokazuje zaˇsto 67 2.8. Ekstremumi funkcija viˇse promjenljivih je to tako. Naprimjer, neka je c stacionarna taˇcka funkcije ϕ i neka je ϕ′′ (c) neprekidna na otvorenom intervalu koji sadrˇzi c, i neka je ϕ′′ (c) > 0. Tada za neko ε > 0, postoji interval I = (c − ε, c + ε) na kome je ϕ′′ (c) neprekidna i ϕ′′ (t) > 0, za sve t ∈ I. Na osnovu Taylorove teoreme, za proizvoljno h, takav da je |h| < ε, postoji s ∈ (c, c + h), takav da je 1 ϕ(c + h) = ϕ(c) + ϕ′ (c)h + ϕ′′ (s)h2 . 2 (2.8.3) Zbog stacionarnosti je ϕ′ (c) = 0. Takode smo imali ϕ′′ (s) > 0, pa koriste´ci to u (2.8.3) dobijamo da je za proizvoljno h, takav da je |h| < ε, zadovoljeno ϕ(c + h) > ϕ(c) , a ovo znaˇci da je u taˇcki c lokalni minimum. Veoma sliˇcno razmatranje sada moˇzemo sprovesti i za funkciju f : Rn → R. Na osnovu Teorema 2.6.2 znamo da vrijedi formula 1 f (A + h) = f (A) + ∇f (A) · h + hT Hf (A + ξh)h , 2 gdje je f dva puta neprekidno diferencijabilna funkcija u nekoj okolini taˇcke A i ξ ∈ (0, 1). Neka je sada A stacionarna taˇcka funkcije f i neka je Hesijan Hf (X) pozitivno definitna matrica u nekoj kugli B(A, r). Tada je ∇f (A) = 0, pa vrijedi 1 f (A + h) = f (A) + hT Hf (A + ξh)h , 2 a kako je joˇs A + ξh ∈ B(A, r), to je kvadratna forma hT Hf (A + ξh)h > 0. te imamo f (A + h) > f (A) , za proizvoljno h, tako da je ||h|| < r. Ali ovo onda upravo znaˇci da funkcija f ima lokalni minimum u taˇcki A. Istim argumentima bi rezonovali da smo pretpostavili negativnu definitnost Hesijana i naravno, zakljuˇcili bi da funkcija ima lokalni maksimum u taˇcki A. Ako je Hesijan indefinitan, to bi znaˇcilo da postoji proizvoljno malen h, tako da je kvadratna forma hT Hf (A + ξh)h > 0 , i takode proizvoljno malen h da je hT Hf (A + ξh)h < 0 . 68 2.8. Ekstremumi funkcija viˇse promjenljivih Ovo bi onda uzrokovalo da za neke proizvoljno malene h vrijedi f (A + h) > f (A), a istovremeno za neke druge proizvoljno malene h je f (A + h) < f (A). U ovom sluˇcaju jasno je da u taˇcki A ne moˇze biti niti lokalni minimum niti lokalni maksimum. Tada bi taˇcka A predstavljala takozvanu sedlastu taˇcku funkcije f . Na osnovu gornjeg, sada moˇzemo iskazati dovoljne uslove za ekstremnu vrijednost funkcije f : Rn → R. Teorem 2.8.4: Test druge derivacije Neka je f : Rn → R i f ∈ C 2 (U), gdje je U otvoren skup. Ako je A ∈ U stacionarna taˇcka funkcije f , tada je 1. f (A) lokalni minimum funkcije f , ako je Hf (A) pozitivno definitna matrica. 2. f (A) lokalni maksimum funkcije f , ako je Hf (A) negativno definitna matrica. 3. taˇcka A sedlasta taˇcka funkcije f , ako je Hf (A) indefinitna matrica. Ukoliko je Hf (A) nedefinitna matrica, potrebna su dodatna ispitivanja za klasifikaciju taˇcke A. Primjer 2.36. Odrediti lokalne ekstremne vrijednosti funkcije f (x, y) = xye−x Nalazimo prvo gradijent ∇f (x, y) = e−x 2 2 −y 2 (y − 2x2 y, x − 2xy 2) . 2 Kako je e−x −y > 0 za sve (x, y) ∈ R2 , ˇcinjenica da je ∇f (x, y) = (0, 0), svodi se na sistem y(1 − 2x2 ) = 0 , x(1 − 2y 2 ) = 0 . Prva jednaˇcina ´ce biti taˇcna ako je y = 0 ili x = − √12 ili x = √12 . Ako je y = 0, onda iz druge jednaˇcine vidimo da mora biti i x = 0, a time smo dobili prvu stacionarnu taˇcku M1 (0, 0). Ako je x = ± √12 , onda je druga jednaˇcina zadovoljena ako je 1 − 2y 2 = 0, odnosno ako je y = √12 ili y = − √12 , pa na taj naˇcin dobijamo joˇs ˇcetiri stacionarne taˇcke: M2 ( √12 , √12 ), M3 (− √12 , √12 ), M4 ( √12 , − √12 ) i M5 (− √12 , − √12 ). 69 2 −y 2 . 2.8. Ekstremumi funkcija viˇse promjenljivih Drugi korak u rjeˇsavanju problema ovog tipa je odredivanje hesijana funkcije −x2 −y 2 Hf (x, y) = e 4x3 y − 6xy 4x2 y 2 − 2x2 − 2y 2 + 1 2 2 2 2 4x y − 2x − 2y + 1 4y 3yx − 6xy . Sada nakon kra´ceg raˇcuna dobijamo −1 Hf (M2 ) = Hf (M5 ) = e −2 0 0 −2 . Kako je A1 = −2e−1 < 0 i −2e−1 0 A2 = det = 4e−1 > 0 , 0 −2e−1 na osnovu testa druge derivacuje zakljuˇcujemo da funkcija u taˇckama M2 i M5 ima lokalni maksimum, i pri tome je f (M2 ) = f (M5 ) = fmax = 21 e−1 . Dalje imamo 2 0 −1 Hf (M3 ) = Hf (M4 ) = e . 0 2 Sada je A1 = 2e−1 > 0 i A2 = det 2e−1 0 0 2e−1 = 4e−1 > 0 , pa opet na osnovu testa druge derivacije zakljuˇcujemo da funkcija u taˇckama M3 i M4 ima lokalni minimum i pri tome je f (M3 ) = f (M4 ) = fmin = − 12 e−1 . ˇ M1 (0, 0) u kojoj je Ostala nam je joˇs taka 0 1 Hf (M1 ) = . 1 0 Sada je A1 = 0 i A2 = −1, pa je Hesijan indefinitan, a to znaˇci da je taˇcka M1 (0, 0) sedlasta taˇcka. ♦ 2.8.2 Nalaˇ zenje globalnog ekstrema Posmatrajmo funkciju f (x) = 2 − x2 . Posmatramo li je na ˇcitavom R, ona ima lokalni maksimum u taˇcki x = 0, koji je i globalni maksimum, a globalnog minimuma nema (slika lijevo). Ako je posmatramo na skupu [−1, 2] i dalje je globalni maksimum u x = 0, ali sada je globalni minimum u taˇcki 70 2.8. Ekstremumi funkcija viˇse promjenljivih z y b x Slika 2.3: Graf funkcije f (x, y) = xye−x −2 2 −y 2 2 2 2 1 1 1 −1 −1 −2 1 2 −2 −1 −1 1 2 −2 −2 −1 −1 1 2 −2 Slika 2.4: Globalni ekstrem funkcije jedne varijable x = 2 (slika u sredini). Ako je posmatramo za vrijednosti iz [−2, −1], njen globalni minimum je u x = −2, a globalni maksimum je u x = −1 (slika desno). Dakle, globalni ekstrem funkcije direktno zavisi od podruˇcja na kom tu funkciju posmatramo. Neˇsto sliˇcno imamo i kod funkcija viˇse promjenljivih. Primjer 2.37. Odrediti globalne ekstreme funkcije f (x, y) = x2 +y 2 na skupu D = (x, y)| x2 + 4y 2 ≤ 4 . Skup D je zatvoren i ograniˇcen, pa na osnovu Teoreme 2.8.1, funkcija f dostiˇze svoju najmanju i najve´cu vrijednost. Kako je funkcija diferencijabilna (kao polinomijalna funkcija), njene jedine kritiˇcne taˇcke su stacionarne taˇcke, koje dobijamo iz uslova ∇f (x, y) = (2x, 2y) = 0 . U taˇcki (0, 0) je mogu´c lokalni ekstrem funkcije ali moramo sada posmatrati ˇsta se dogada sa naˇsom funkcijom na rubu oblasti D, tj. na skupu ∂D = (x, y)| x2 + 4y 2 = 4 . S obzirom da su na ∂D nezavisne varijable vezane relacijom x2 + 4y 2 = 4, uvode´ci polarne koordinate, tj. smjene x(t) = 2 cos t i y(t) = sin t, gje je 71 2.8. Ekstremumi funkcija viˇse promjenljivih t ∈ [0, 2π], naˇsa funkcija f postaje funkcija jedne varijable g(t) = f (x(t), y(t)) = f (2 cos t, sin t) = 4 cos2 t + sin2 t = 3 cos2 t + 1 , gdje je t ∈ [0, 2π]. Ekstremne vrijednosti funkcije g ´ce biti i ekstremne vrijednosti funkcije f . Zato posmatrajmo jednaˇcinu g ′(t) = −6 cos t sin t = 0 . i t = 2π. Dakle, pored Stacionarne taˇcke ´ce biti t = 0, t = π2 , t = π, t = 3π 2 taˇcke (0, 0) imamo joˇs ˇcetiri kandidata za globalni ekstrem, a to su taˇcke (2, 0), (0, 1), (−2, 0) i (0, −1), odredene gornjim vrijednostima za t. Izraˇcunavaju´ci sada vrijednost funkcije u svakoj od ovih pet taˇcaka, odredujemo globalne ekstreme. f (0, 0) = 0 , f (2, 0) = 4 , f (0, 1) = 1 , f (−2, 0) = 4 , f (0, −1) = 1 . Uporeduju´ci gornje vrijednosti, zakljuˇcujemo da funkcija f ima globalnu maksimalnu vrijednost 4 u taˇckama (2, 0) i (−2, 0) i globalnu minimalnu vrijednost 0 u taˇcki (0, 0). ♦ Kao ˇsto nam pokazuje upravo uradeni primjer, za funkciju zadatu na zatvorenoj i ograniˇcenoj oblasti odredivanje globalnih ekstrema se svodi na to da pronademo lokalne ekstreme i ekstreme funkcije na rubu te oblasti, a onda odredujemo ˇsta ´ce biti globalne ekstremne vrijednosti. Ako funkciju ne posmatramo na zatvorenoj i ograniˇcenoj oblasti, onda se problem odredivanja globalnih ekstrema svodi na to da pronademo lokalne ekstreme, a onda nekom metodom ispitamo da li su oni ujedno i globalni ekstremi. Posmatrajmo sljede´ci primjer. Primjer 2.38. U nekoj firmi ˇzele da naprave pravougaonu posudu bez krova, zapremine 500 m3 i da pritome utroˇse ˇsto je manje mogu´ce materijala. Oznaˇcimo sa x i y duˇzine stranica te posude u osnovi i sa z visinu te posude (sve veliˇcine su izraˇzene u metrima), tada u stvari treba prona´ci minimalnu vrijednost funkcije M ′ (x, y, z) = xy + 2xz + 2yz , pri ˇcemu zapremina mora biti xyz = 500. Izraˇzavaju´ci z iz ove jednakosti i uvrˇstavanjem u funkciju M ′ , dobijamo funkciju M(x, y) = xy + 72 1000 1000 + , y x 2.8. Ekstremumi funkcija viˇse promjenljivih kojoj treba odrediti minimalnu vrijednost na beskonaˇcnom pravougaoniku R = {(x, y)| x > 0 , y > 0} . Rjeˇsavanjem sistema ∂M ∂x ∂M ∂y 1000 =0 x2 1000 = x− 2 =0 y = y− dobijamo jedinu stacionarnu taˇcku A(10, 10). Hesijan funkcije M glasi 2000 1 3 x , HM(x, y) = 1 2000 y3 odnosno HM(10, 10) = 2 1 1 2 . Kako je det(HM(10, 10)) = 3, zakljuˇcujemo da je Hesijan pozitivno definitan, a to znaˇci da funkcija M ima lokalni minimum u taˇcki A(10, 10) i pri tome je 1000 1000 Mmin = M(10, 10) = 10 · 10 + + = 300 . 10 10 Ostaje nam ispitati da li je ovo i globalni minimum funkcije M? Ako je bilo koja varijabla manja od jedan, tj. 0 < x < 1 ili 0 < y < 1, tada je 1000 > 1000, odnosno 1000 > 1000, pa je oˇcigledno vrijednost funkcije M x y ve´ca od 300. Ako je sada x ≥ 400 i y ≥ 1, onda je xy ≥ 400, pa bi opet vrijednosti naˇse funkcije bile ve´ce od 300 (analogno i sluˇcaj y ≥ 400 i x ≥ 1). Dakle, ako posmatramo skup D = {(x, y)| 1 ≤ x ≤ 400 , 1 ≤ y ≤ 400} , izvan skupa D vrijednosti funkcije M su ve´ce od 300. Na skupu D naˇsa funkcija ima globalni minimum u taˇcki (10, 10), pa je to onda oˇcigledno globalni minimum funkcije na ˇcitavom skupu R. Ostaje samo joˇs zakljuˇciti da je tada z= 500 =5, 10 · 10 odnosno da posuda treba biti dimenzija 10×10×5, da bi imala odgovaraju´cu zapreminu i da bi imali minimalne troˇskove. ♦ 73 2.8. Ekstremumi funkcija viˇse promjenljivih 2.8.3 Uslovni ekstrem Primjer 2.38 ima neke sliˇcnosti sa Primjerom 2.37. Naime, u oba primjera smo nalazili ekstremne vrijednosti funkcije pod restrikcijom na podskup koji je manje dimenzije. U prvom primjeru smo ekstremizirali funkciju f (x, y) = x2 + y 2 sa restrikcijom na jednodimenzionalnoj elipsi x2 + 4y 2 = 4. U drugom primjeru smo ekstremizirali funkciju tri varijable M ′ (x, y, z) = xy +2xz +2yz sa restrikcijom na trodimenzionalnu povrˇs xyz = 500. U prvom smo primjeru problem rijeˇsili tako ˇsto smo parametrizovali elipsu, a zatim smo ekstremizirali funkciju jedne varijable. U drugom smo izrazili z kao funkciju od x i y, a zatim smo ekstremizirali funkciju dvije varijable. U ovoj sekciji ´cemo dati generalni metod za rjeˇsavanje oba ova ali i drugih sliˇcnih problema. U osnovnom sluˇcaju ekstremizacija, zadata je neka (diferencijabilna) funkcija f : Rn → R za koju ˇzelimo na´ci ekstremne vrijednosti. Taj problem smo rjeˇsavali nalaˇzenjem svih kritiˇcnih taˇcaka funkcije, a onda testom druge derivacije ispitivali karakter tih taˇcaka. Medutim, kao ˇsto smo vidjeli u Primjeru 2.38, nekada treba izvrˇsiti ekstremizaciju funkcije, pri ˇcemu su nezavisne varijable te funkcije vezane nekim uslovom, tj. traˇzimo ekstremnu vrijednost funkcije f (x1 , x2 , ..., xn ) = y, pri uslovu g(x1 , x2 , ..., xn ) = 0. Ovakvu vrstu ekstremizacije nazivamo uslovna ekstremizacija. Primjer 2.39. Neka treba odrediti minimum funkcije z = x2 + y 2 pri uslovu x + y = 1, tj. x2 + y 2 −→ min x+y−1 =0 . Oˇcigledni minimum funkcije, bez uslova , je u taˇcki (0, 0) i vidimo da ta ˇ geometrijski predstavlja uslov u taˇcka ne zadovoljava uslov x + y = 1. Sta gornjem problemu? Graf funkcije z = x2 + y 2 je paraboloid, a uslov x + y = 1 predstavlja jednaˇcinu ravni u R3 . Dakle, mi traˇzimo minimalnu vrijednost na paraboloidu ali samo u onim taˇckama u kojima se sijeku paraboloid (ciljna funkcija) i ravan (uslovna funkcija). Sa slike vidimo da se traˇzi minimum funkcije koja predstavlja parabolu u prostoru R3 . Zaista, koriste´ci uslovnu funkciju, moˇzemo izraziti jednu varijablu, npr. y = 1 − x, pa stavljaju´ci to u izraz ciljne funkcije imamo, z = x2 + (1 − x)2 = 2x2 − 2x + 1 , a ovo je zaista jednaˇcina parabole. Sada minimum ove funkcije nalazimo kao problem ekstremizacije funkcije jedne vaerijable. z ′ = 4x − 2, pa imamo 74 2.8. Ekstremumi funkcija viˇse promjenljivih z y x Slika 2.5: Uslovni ekstrem jednu stacionarnu taˇcku x0 = 12 . Kako je z ′′ = 4, dakle pozitivan, to u taˇcki x0 funkcija ima minimum. Izraˇcunavaju´ci y0 = 1 − x0 = 12 , zakljuˇcujemo da funkcija z = x2 + y 2 ima minimum u taˇcki ( 12 , 21 ), pri uslovu x + y = 1. ♦ Gornji primjer nam daje jedan metod za rjeˇsavanje problema uslovne ekstremizacije, ali jasno je da ´ce primjena ovog metoda biti kudikamo sloˇzenija, za malo sloˇzenije uslovne funkcije. Zato nam je u interesu imati i neki drugi metod, a najopˇstiji od svih je tzv. Lagrangeov metod, koga ´cemo sada izloˇziti. ˇ ´ce biti motivacija za ovaj metod? Posmatrajmo ponovo gornji primjer Sta i konturnu sliku grafova ciljne i uslovne funkcije (slika 2.6). Nivo linije funkcije z = x2 + y 2 predstavljaju koncentriˇcne centralne kruˇznice (x2 +y 2 = k), a uslovna funkcija zbog svog poloˇzaja (ortogonalna na xOy ravan), predstavljena je pravom linijom u xOy ravni. Na slici uoˇcavamo da prava neke od konturnih linija sijeˇce, neke nivo linije ne´ce uopˇste sje´ci ali da samo jednu nivo liniju dodiruje. Strelice na slici nam pokazuju pravce rasta ciljne funkcije (gradijentni vektor u razliˇcitim taˇckama), a time je onda odredeno da nivo linije paraboloida bliˇze koordinatnom poˇcetku, odgovaraju manjim vrijednostima funkcije (u opˇstem sluˇcaju ovo nije pravilo). Ovo onda znaˇci da upravo ona nivo linija koja se dodiruje sa uslovnom funkcijom predstavlja bitan momenat. Naime, taˇcke na onim nivo linijama koje se ne sijeku sa uslovnom funkcijom i ne mogu biti kandidati za uslovne ekstreme, a jasno je da od momenta kada prava presjeˇce jednu od nivo linija, sje´ci ´ce i svaku ”ve´cu” nivo liniju, pa dakle tu i nemoˇzemo traˇziti konaˇcnu ekstremnu vrijednost. Naravno, traˇziti nivo liniju zadate povrˇsi koja ´ce dodirivati uslovnu funkciju ne bi bio lagan posao. Zato se prisjetimo da je ugao izmedu dvije krive koje se sijeku, jednak uglu izmedu njihovih tangenti u presjeˇcnoj taˇcki. Dakle, ako se dvije linije dodiruju, onda se njihove tangente u dodirnoj taˇcki 75 2.8. Ekstremumi funkcija viˇse promjenljivih 5 4 3 2 1 −5 −4 −3 −2 −1 −1 1 2 3 4 5 −2 −3 −4 −5 Slika 2.6: Nivo linije funkcije z = x2 + y 2 sa uslovnom funkcijom x + y = 1 poklapaju, ili drugaˇcije iskazano, vektori normala na tim tangentama su paralelni. Kako je gradijentni vektor upravo onaj vektor koji je ortogonalan na nivo liniju u proizvoljnoj taˇcki, a uslov paralelnosti vektora je uslov njihove kolinearnosti, zakljuˇcujemo da mi treba da odredimo upravo one taˇcke (x, y) ∈ R2 u kojima vrijedi ∇(x2 + y 2 ) = λ∇(x + y − 1) . Zbog paralelnog pomjeranja, takvih vektora bi bilo beskonaˇcno mnogo. Medutim, mi traˇzimo taˇcke na uslovnoj krivoj koje to zadovoljavaju, tj. nalazimo taˇcke (x, y) koje zadovoljavaju ∇(x2 + y 2) = λ∇(x + y − 1) i x+y−1 =0 . Generalno, ako rjeˇsavamo problem f (X) −→ ext g(X) = 0 , rjeˇsenje ´ce biti u onim taˇckama X(x1 , x2 , ..., xn ) u kojima su zadovoljeni uslovi ∇f (X) = λ∇g(X) (2.8.4) g(X) = 0 . (2.8.5) Izloˇzeni metod se naziva Lagrangeov metod, a nova varijabla λ ∈ R koja se pojavljuje u uslovu (2.8.4), naziva se lagrangeov multiplikator. Ako uvedemo funkciju Λ(X, λ) = f (X) − λg(X) , (2.8.6) 76 2.8. Ekstremumi funkcija viˇse promjenljivih koju nazivamo Lagrangeova funkcija ili lagranˇzijan, nije teˇsko uoˇciti da su uslovi (2.8.4) i (2.8.5), ekvivalentni uslovu ∇Λ(X, λ) = 0 . (2.8.7) Zaista, nalaze´ci parcijalne izvode po promjenljivima xi (i = 1, 2, ..., n) imamo ∂f ∂g ∂Λ = −λ , i = 1, 2, ..., n . ∂xi ∂xi ∂xi Sada zbog (2.8.7), zakljuˇcujemo da je ∂g ∂f −λ =0, ∂xi ∂xi za sve i ∈ {1, 2, ..., n}, tj. vrijedi uslov (2.8.4). Kako je ∂Λ = −g(X) , ∂λ opet zbog (2.8.7) imamo g(X) = 0 , odnosno uslov (2.8.5). Na ovaj naˇcin smo praktiˇcno dali i opis postupka rjeˇsavanja uslovne ekstremizacije oblika f (X) −→ ext g(X) = 0 . 1. Prvo formiramo lagranˇzijan Λ(x1 , x2 , ..., xn , λ) = f (x1 , x2 , ..., xn ) − λg(x1 , x2 , ..., xn ) , 2. Odredujemo ∇Λ(x1 , x2 , ..., xn , λ). 3. Rjeˇsavamo jednaˇcinu ∇Λ(x1 , x2 , ..., xn , λ) = 0, tj. sistem ∂Λ ∂x1 ∂Λ ∂x2 ..... ∂Λ ∂xn ∂Λ ∂λ ∂f ∂g −λ =0 ∂x1 ∂x1 ∂f ∂g = −λ =0 ∂x2 ∂x2 .. ............................. ∂f ∂g = −λ =0 ∂xn ∂xn = = −g(x1 , x2 , ..., xn ) = 0 . 77 2.8. Ekstremumi funkcija viˇse promjenljivih Rjeˇsenja posljednjeg sistema su stacionarne taˇcke lagranˇzijana i ostaje nam joˇs samo utvrditi karakter tih taˇcaka. Primjetimo odma, da ´ce u pronadenim stacionarnim taˇckama X ∗ , biti Λ(X ∗ , λ) = f (X ∗ ) , (jer je g(X ∗) = 0) tj. ekstremi lagranˇzijana ujedno su i ekstremi naˇse ciljne funkcije. Zato za ispitivanje karaktera tih taˇcaka moˇzemo primjeniti test druge derivacije ili ispitivanjem drugog diferencijala ciljne funkcije. Naime, ako je d2 f (X ∗ ) > 0, imamo minimum, a ako je d2 f (X ∗ ) < 0 imamo maksimum ciljne funkcije sa zadatim uslovom. Ako je d2 f (X ∗ ) = 0, potrebna su dodatna ispitivanja za odredivanje karaktera te taˇcke. Primjer 2.40. Rijeˇsiti problem f (x, y) = x2 + y 2 −→ ext x+y =1 . Kao ˇsto smo rekli, formiramo prvo lagranˇzijan Λ(x, y, λ) = f (x, y) − λg(x, y) = x2 + y 2 − λ(x + y − 1) , gdje je sa g(x, y) = x + y − 1 zadata uslovna funkcija. U drugom koraku raˇcunamo gradijent lagranˇzijana ∂Λ ∂Λ ∂Λ ∇Λ(x, y, λ) = , , = (2x − λ, 2y − λ, x + y − 1) . ∂x ∂y ∂λ Sada rjeˇsavamo sistem 2x − λ = 0 2y − λ = 0 x+y−1 = 0 . Iz prve dvije jednaˇcine sistema imamo 2x = 2y, tj. x = y, pa uvrˇstavaju´ci to u tre´cu jednaˇcinu, dobijamo x = y = 12 i za ove vrijednosti je λ = 1. Dakle, imamo jednu stacioarnu taˇcku X0 12 , 12 , 1 . Posljedni korak je utvrdivanje karaktera taˇcke X0 . Raˇcunaju´ci druge parcijalne izvode, imamo d2 f (X0 ) = 2dx2 + 2dy 2 , i vidimo da je d2 f (X0 ) > 0 (kao suma kvadrata), te dakle imamo minimum funkcije f , pri uslovu g, u taˇcki 21 , 12 , i on iznosi fmin = 12 . ♦ 78 2.8. Ekstremumi funkcija viˇse promjenljivih Primjer 2.41. Odrediti na kruˇznici k : (x − 1)2 + (y − 2)2 = 1 najbliˇzu i najdalju taˇcku od koordinatnog poˇcetka. X2 3 b 2 1 −2 −1 −1 b X1 b 1 2 3 Problem moˇzemo rijeˇsiti jednostavno, povlaˇce´ci pravu odredenu taˇckama (0, 0) i (1, 2), i nalaze´ci njen presjek sa zadatom kruˇznicom. Rijeˇsimo problem ipak na ”teˇzi” naˇcin. Razmiˇsljajmo ovako: ako opiˇsemo centralnu kruˇznicu proizvoljnog polupreˇcnika r, onda ona na sebi sadrˇzi sve one taˇcke koje su na istom odstojanju r od koodinatnog poˇcetka. ”Naduvajmo” neku malu centralnu kruˇznicu, sve do momenta njenog dodira sa zadatom kruˇcnicom k. Taˇcka dodira ´ce upravo biti najbliˇza taˇcka koordinatnom poˇcetku. Ako nastavimo ”naduvavanje”, kruˇznice ´ce sje´ci kruˇznicu k ali tu nemamo taˇcaka koje su najbliˇze ili najdalje jer su sve one dalje od prve dodirne taˇcke, a naduvavanjem dobijamo sve dalje i dalje taˇcke. Ovo naravno vrijedi do momenta kada ponovo dobijemo kruˇznicu koja dodirne kruˇznicu k (velika crvena kruˇznica). Cijeli opisani postupak nas navodi da problem postavimo ovako: nadimo minimum i maksimum funkcije f (x, y) = x2 + y 2 (to su centralne kruˇznice ˇcije polupreˇcnike traˇzimo) pri uslovu (x − 1)2 + (y − 2)2 = 1 (na ovoj kruˇznici traˇzimo najbliˇzu i najdalju taˇcku). Dakle, rjeˇsavamo x2 + y 2 −→ ext (x − 1)2 + (y − 2)2 = 1 . Lagranˇzijan problema je Λ(x, y, λ) = x2 + y 2 − λ((x − 1)2 + (y − 2)2 − 1), a njegov gradijent, ∇Λ = (2x−2λ(x−1), 2y −2λ(y −1), (x−1)2 + (y −2)2 −1). Rjeˇsavamo sistem 2x − 2λ(x − 1) = 0 2y − 2λ(y − 1) = 0 2 (x − 1) + (y − 2)2 − 1 = 0 . Stacionarne taˇcke su X1 1 + √15 , 2 + √25 i X2 1 − √15 , 2 − √25 . Prostom provjerom zakljuˇcujemo da funkcija u ovim taˇckama ima najve´cu i najmanju vrijednost, odnosno da su to najdalja i najbliˇza taˇcka koordinatnom poˇcetku, na kruˇznici k. 79 2.8. Ekstremumi funkcija viˇse promjenljivih Vratimo se na opasku ”teˇzi” naˇcin rjeˇsavanja. Postavimo problem da na proizvoljnoj liniji g(x, y) = 0 nademo najbliˇzu ili najdalju taˇcku od koordinatnog poˇcetka. Sada onaj ”lakˇsi” naˇcin uopˇste nemoˇzemo primjeniti, a ovaj ”teˇzi” funkcioniˇse. Dakle, on je univerzalnijeg karaktera i kao takav mnogo bolji naˇcin. Npr. na´ci na grafu funkcije y = x2 + x + 1 taˇcku najbliˇzu koordinatnom poˇcetku. ♦ U prethodna dva primjera vidjeli smo kako funkcioniˇse Lagrangeov metod, pri ˇcemu smo imali samo jedno oganiˇcenje, a time i jednu dodatnu varijablu problema. Naravno da ograniˇcenja moˇze biti i viˇse, medutim metod se bitno ne´ce mijenjati. Naime, neka je zadat problem sa dva ograniˇcenja. f (x1 , x2 , ..., xn ) −→ ext h(x1 , x2 , ..., xn ) = 0 , g(x1 , x2 , ..., xn ) = 0 . Formiramo lagranˇzijan, tako da svakom ograniˇcenju pridruˇzimo po jedan lagrangeov multiplikator, Λ(x1 , x2 , ..., xn , λ, µ) = f (x1 , x2 , ..., xn )−λh(x1 , x2 , ..., xn )−µg(x1 , x2 , ..., xn ) . Nalaˇzenjem gradijenta lagranˇzijana, postavljamo sistem ∂Λ ∂f ∂g ∂h = −λ −µ = 0 , i = 1, 2, ..., n ∂xi ∂xi ∂xi ∂xi ∂Λ = g(x1 , x2 , ..., xn ) = 0 ∂λ ∂Λ = h(x1 , x2 , ..., xn ) = 0 , ∂µ ˇcijim rjeˇsavanjem dobijamo stacionarne taˇcke problema. Kao i u sluˇcaju jednog ograniˇcenja, nekim od poznatih postupaka odredimo karakter stacionarnih taˇcaka. U opˇstem sluˇcaju, ako imamo k ograniˇcenja gi (x1 , x2 , ..., xn ) = 0, postupak je isti, a lagranˇzijan je Λ(X, λ) = f (X) − k X λi gi (X) , λ = (λ1 , λ2 , ..., λk ) . i=1 Primjer 2.42. Rijeˇsimo problem f (x, y, z) = 4y − 2z −→ ext 80 2.8. Ekstremumi funkcija viˇse promjenljivih 2x − y − z − 2 = 0 , x2 + y 2 − 1 = 0 . Za egzistenciju rjeˇsenja gornjeg problema pozivamo se na Teorem 2.8.1. Zaista, zbog drugog ograniˇcenja, oˇcigledno je da vrijedi 0 ≤ x, y ≤ 1, a iz prvog ograniˇcenja onda zakljuˇcujemo da je −3 ≤ z ≤ 0, pa je skup na kome traˇzimo ekstremne vrijednosti funkcije ograniˇcen i zatvoren. Lagranˇzijan glasi Λ(x, y, z, λ, µ) = 4y − 2z − λ(2x − y − z − 2) − µ(x2 + y 2 − 1) . Nalazimo parcijalne izvode lagranˇzijana ∂Λ ∂x ∂Λ ∂y ∂Λ ∂z ∂Λ ∂λ ∂Λ ∂µ = −2λ − 2µx = 4 − λ − 2µy = −2 − λ = −2x + y + z + 2 = −x2 − y 2 + 1 . Sistem koga rjeˇsavamo ima pet nepoznatih (x, y, z, λ, µ) i pet jednaˇcina −2λ − 2µx 4 + λ − 2µy −2 + λ −2x + y + z + 2 −x2 − y 2 + 1 = = = = = 0 0 0 0 0. Iz tre´ce jednaˇcine direktno slijedi λ = 2. Ubacuju´ci to u prvu i drugu jednaˇcinu, dobijamo 2 3 x=− , y= . µ µ Stavljaju´ci ove rezultate u petu jednaˇcinu, imamo √ 4 9 13 + = = 1 =⇒ µ = ± 13 . µ2 µ2 µ2 81 2.8. Ekstremumi funkcija viˇse promjenljivih √ Sada imamo dva sluˇcaja. Za µ = 13, x = − √213 i y = √313 . Iskoristimo li i ˇcetvrtu jednaˇcinu, dobijamo z = −2− √713 . Time smo dobili prvu stacionarnu taˇcku √ 2 3 7 X1 (x, y, z, λ, µ) = X1 (− √ , √ , −2 − √ , 2, 13) . 13 13 13 √ Analogno, za sluˇcaj µ = − 13, dobijamo stacionarnu taˇcku √ 2 3 7 X2 ( √ , − √ , −2 + √ , 2, − 13) . 13 13 13 Lahko se sada provjerava da u taˇcki X1 imamo maksimum 26 fmax = f (X1 ) = 4 + √ , 13 a minimum u taˇcki X2 26 fmin = f (X2 ) = 4 − √ . 13 ♦ 82
© Copyright 2024 Paperzz