Introduzione ai metodi agli elementi finiti per problemi differenziali ellittici Alessandra Sestini May 9, 2014 1 Introduzione In queste note si indicher`a con Ω un dominio in IRd (aperto, non vuoto) che assumeremo limitato e connesso, mentre si indicher`a con ∂Ω la sua frontiera. 2 2.1 Formulazione variazionale di un problema differenziale ai limiti lineare Un problema modello monodimensionale In questo caso senza perdita di generalit`a possiamo assumere Ω = I := (0 , 1) e siamo interessati a determinare una soluzione u dell’equazione differenziale −u00 + σu = f in I , (1) che verifichi anche delle condizioni assegnate agli estremi, dove f e σ sono due funzioni assegnate, con σ ≥ 0 . In particolare le condizioni agli estremi possono essere di Dirichlet, u(0) = g0 , u(1) = g1 , (2) u0 (0) = g00 , u0 (1) = g10 . (3) u(0) = g0 , u0 (1) = g10 . (4) di Neumann o miste, 1 Si noti che l’ipotesi σ ≥ 0 garantisce l’unicit`a della soluzione purch`e si evitino le condizioni di Neumann quando σ ≡ 0 . Per dimostrare questo (riferendoci qui esplicitamente al problema di Dirichlet) basta far vedere che, se z `e tale che −z 00 + σz = 0 e z(0) = z(1) = 0 , allora risulta z ≡ 0 . Questo si vede subito moltiplicando ambo i membri dell’equazione differenziale per z stesso e integrando in I . Infatti, integrando per parti, si ottiene che Z 1 Z 1 0 2 σ(x) z 2 (x)dx = 0 , (z ) (x)dx + 0 0 la quale, anche se fosse se σ ≡ 0, considerando che deve essere z(0) = z(1) = 0, implica che z ≡ 0 . Osserviamo poi che condizioni agli estremi non omogenee possono essere sostituite dalle analoghe omogenee senza perdita di generalit`a. Infatti basta considerare il problema differenziale verificato da uˆ := u − Rg dove Rg `e un polinomio di grado 1 (2 per le Neumann pure) che dicesi rilevamento dei dati sul bordo in quanto verifica le condizioni agli estremi, per esempio Rg (x) := g0 (1 − x) + g1 x nel caso di condizioni di Dirichelet e, −ˆ u00 + σˆ u = (f − σRg ) in I Per quanto riguarda la regolarit`a, si osservi che, se f , σ ∈ C k [0 , 1] , allora u ∈ C k+2 ([0 , 1]) . Siamo per`o interessati a risolvere il problema differenziale anche in ipotesi di minore regolarit`a dei dati, richiedendo in particolare solo che f ∈ L2 (I) e che σ ∈ L∞ (I) e quindi lo riformuliamo in forma debole andando a moltiplicare l’equazione differenziale in (1) per una funzione test v ∈ V (spazio funzionale di Hilbert opportuno) e integrando per parti in modo da ottenere Z 1 Z 1 0 0 0 1 −[u v]|0 + (u (x)v (x) + σ(x)u(x)v(x)) dx = f (x)v(x)dx , ∀v ∈ V . 0 0 Di fatto, riferendoci al caso di dati agli estremi omogenei, siamo interessati a scegliere V in modo che gli integrali che appaiono nella suddetta formula siano tutti finitamente calcolabili e anche in modo che sparisca il primo addendo a sinistra del segno di uguaglianza. Se stiamo considerando il problema di Dirichlet, si sceglie allora V = H01 (Ω) e si va a risolvere il seguente problema variazionale, Z 1 Z 1 0 0 trovare u ∈ V | (u v + σuv) dx = v f dx , ∀v ∈ V . (5) 0 0 2 Nel caso del problema di Neumann (con σ 6= 0), si pu`o invece semplicemente assumere V = H 1 (Ω) mentre nel caso del problema misto si usa V = {v ∈ H 1 (Ω) | v(a) = 0} . Si osservi il diverso trattamento di condizioni di Dirichlet e di condizioni di Neumann ma anche che in ogni caso V risulta essere un sottospazio dello spazio di Hilbert H 1 (Ω). Osserviamo che, nelle sole ipotesi che f ∈ L2 (I) e che σ ∈ L∞ (I), si pu`o comunque dimostrare che u ∈ H 2 (I) . Integrando allora per parti (in senso contrario a quanto fatto prima), si verifica allora che in questo caso quello che si pu`o dire `e che la soluzione del problema variazionale (5) verifica le condizioni omogeneee assegnate agli estremi e risolve l’equazione differenziale in senso variazionale, ossia si ha che Z 1 (−u00 + σu − f ) v dx = 0 , ∀v ∈ V . (6) 0 Infatti se si integra per parti il primo addendo dell’integrale a sinistra in (5) si ottiene che Z 1 0 1 u v|0 − (u00 − σ u + f ) v dx = 0 , ∀v ∈ V . (7) 0 Se quindi v ∈ V = H01 (I) (7) risulta sicuramente verificata e quindi ha senso dire che la soluzione del problema variazionale per il caso di Dirichlet omogeneo `e soluzione debole del problema differenziale ai limiti assegnato. La cosa pu`o in effetti essere generalizzata anche al caso in cui si considerino condizioni ai limiti omogenee miste o di Neumann. Riferendoci per esempio al problema misto, questo significa che bisogna prima far vedere che u0 (1) = 0 (utilizzare a tale scopo una funzione test v polinomiale tale che v(1) 6= 0, v(0) = 0 e tale che l’integrale in (7) si annulli). La seguente proposizione completa quanto ora asserito. Proposizione 1. Supponiamo che f , σ ∈ C 0 [0 , 1], e che u ∈ C 2 [0 , 1], sia la corrispondente soluzione del problema variazionale in (5) per il caso omogeneo misto. Allora si ha che u `e soluzione del corrsipondente problema differenziale (soluzione forte). Dimostrazione : Dobbiamo far vedere che in I risulta u00 − σu + f = 0 e che u0 (1) = 0 in quanto gi`a si sa che u(0) = 0 per come `e definito V. Ora utilizzando l’integrazione per parti in senso inverso, dalla formulazione variazionale si ottiene la (7). Se per assurdo non fosse w := u00 − σu + f = 0 3 in I, trattandosi di una funzione continua esisterebbe [c , d] ⊂ [0 , 1] tale che w ha in [c , d] segno costante non nullo. Posto allora (x − c)2 (d − x)2 , se x ∈ [c , d] , v(x) = 0, altrimenti , R1 essendo v ∈ V e tale che v(0) = 0, avremmo che 0 wv dx = 0 , il che `e assurdo in quanto in [c , d] si ha che wv ha segno costante non nullo e fuori da tale sottointervallo `e nulla. Quindi dobbiamo concludere che w = 0 in I che a sua volta implica che la (7) diventa semplicemente u0 (1)v(1) = 0, ∀v ∈ V, da cui segue che u0 (1) = 0 . Il problema variazionale (5) pu`o essere formalmente riscritto come segue, trovare u ∈ V | a(u, v) = F (v) , ∀v ∈ V , (8) dove a : V × V → IR `e la seguente forma bilineare (simmetrica), Z 1 a(u, v) := (u0 v 0 + σuv) dx , 0 e F : V → IR `e il seguente seguente funzionale lineare, Z 1 v f dx . F (v) := 0 La formulazione (8) dicesi formulazione astratta del problema differenziale in forma debole. Ora risulta essere un risultato importante di analisi funzionale il cosiddetto Lemma di Lax–Milgram che asserisce che se la forma bilineare a `e continua e coerciva nello spazio di Hilbert V , ossia esistono due costanti C ≥ α > 0 tali che, ∀u, v ∈ V risulta |a(u, v)| ≤ Ckuk1 kvk1 , e |a(u, u)| ≥ αkuk21 , e il funzionale lineare F `e limitato ( il che significa che esiste una costante K > 0 tale che, ∀v ∈ V risulta |F (v)| ≤ Kkvk1 ) allora il problema variazionale (8) ammette una e una sola soluzione. Anche nel caso pluridimensionale che considereremo nel seguito saremo quindi interessati a poter riscrivere formalmente la formulazione debole del problema differenziale considerato in questa forma, in modo da avvalerci di questo importante Lemma. 4 Le ipotesi di regolarit`a assunte per f e per σ consentono di verificare agevolmente la continuit`a della forma a e la limitatezza di F mentre la coercivit`a nel caso in cui si consideri il problema di Dirichlet e non esista una costante σ0 > 0 tale che σ ≥ σ0 quasi ovunque in Ω, richiede l’uso della cosiddetta disuguaglainza di Poincar´e valida appunto in H01 (Ω), kvkL2 (Ω) ≤ CΩ |v|1 ∀v ∈ H01 (Ω) , (9) dove CΩ `e una costante che dipende solo dal dominio. Da questa disuguaglianza possiamo infatti dedurre che `e anche kvk1 ≤ (1 + CΩ )|v|1 la quale quindi implica che |a(u, u)| ≥ |u|21 ≥ 1 kuk21 . (1 + CΩ )2 In tutti gli altri casi si dimostra la coercivit`a di a solo sotto l’ipotesi aggiuntiva che esista una costante σ0 > 0 tale che σ > σ0 quasi ovunque in Ω. 2.2 Caso bidimensionale: problema di Poisson Consideriamo sul dominio limitato e connesso Ω ⊂ IR2 il seguente problema detto di Poisson −4u = f , in Ω , u = gD in ΓD , (10) ∂u = gN in ΓN , ∂n ◦ ◦ dove ∂Ω = ΓD ∪ ΓN , ΓD ∩ ΓN = ∅, e dove gD , gN sono i dati assegnati sul bordo e f `e una funzione assegnata definita su Ω. Se ΓN = ∅ o ΓD = ∅ il problema `e detto rispettivamente di Dirichlet o di Neumann, mentre nel caso generale `e detto problema con condizioni miste. Notiamo che il problema di Neumann non ha unicit`a di soluzione in quanto se si aggiunge una costante ad una soluzione si ottiene sempre una soluzione e che inoltre occorre assumere la seguente condizione di compatibilit`a sui dati, Z Z − gN dγ = f (x) dx , ∂Ω Ω che deriva dal teorema della divergenza considerando che 4u = ∇·(∇u) . Allo scopo di assicurare unicit`a di soluzione e di non aver bisogno di condizioni 5 di compatibilit`a sui dati, nel seguito consideremo soltanto il problema di Dirichlet o il problema misto. Osserviamo che, anche se f ∈ C 0 (Ω) e gD ∈ C 2 (ΓD ), gN ∈ C 1 (ΓN ), non `e detto che u ∈ C 2 (Ω). Se per esempio Ω = (0 , 1)2 , ΓN = ∅ e si scelgono gD nulla e f costante e uguale a 1, si verifica facilmente che, mentre in Ω il laplaciano di u deve essere −1, si ha che esso nei quattro corner del dominio deve annullarsi. In generale quindi, anche se i dati sono super regolari come in questo esempio, dovremo accontentarci di cercare u in C 0 (Ω) ∩ C 2 (Ω). Tuttavia siamo interessati a risolvere il problema anche in ipotesi di minor regolarit`a dei dati e quindi dobbiamo dapprima intenderlo in forma variazionale in modo che abbia senso assumere f ∈ L2 (Ω). Per quanto riguarda la regolarit`a della soluzione si tenga comunque presente che, anche supponendo di avere condizioni al contorno di Dirichlet omogenee, a differenza di quanto detto per il caso monodimensio- nale, se f ∈ L2 (Ω) non `e detto che esista u ∈ H 2 (Ω) tale che in senso variazionale risulti −4u = f. Infatti `e stato dimostrato che una tale u ∈ H 2 (Ω) esiste solo se ∂Ω `e sufficientemente regolare, il che significa o che si tratta di una curva chiusa regolare (quindi senza spigoli o cuspidi) o di una poligonale chiusa tale che Ω risulti convesso. In questi casi si dimostra anzi che f ∈ H s (Ω) ⇒ u ∈ H s+2 (Ω) e kukH s+2 (Ω) ≤ Ckf kH s (Ω) . Si noti che comunque per il problema misto, anche quando ∂Ω `e regolare, non vale pi` u il suddetto risultato, si pu`o avere cio`e una perdita di regolarit`a. Per tutti questi motivi, siamo allora interessati a risolvere il problema differenziale in senso debole ricercandone la soluzione in H 1 (Ω). Prima di considerare la forma debole del problema misto generale, consideriamo il caso particolare in cui ΓN = ∅ e gD = 0 (problema di Dirichlet omogeneo), con f ∈ L2 (Ω). Osserviamo che, supponendo che gli integrali coinvolti siano calcolabili, dalla (10) deriva che Z Z − v 4u dx = v f dx . Ω Ω Dal teorema della divergenza, considerando che v4u = ∇ · (v∇u) − ∇u · ∇v , si ha quindi Z Z Z ∂u dγ = v f dx . (11) ∇u · ∇v dx − v Ω Ω ∂Ω ∂n 6 Poich´e vogliamo ricercare la funzione u nello stesso spazio funzionale V dove prendiamo le funzioni test v, tenendo presente le condizioni di Dirichlet omogenee, scegliamo V = H01 (Ω) e quindi otteniamo la seguente formulazione, Z Z trovare u ∈ V | ∇u · ∇v dx = v f dx ∀v ∈ V . (12) Ω Ω Notiamo che la suddetta formulazione pu`o essere anche scritta in modo astratto come in (8), dove ora, a : V × V → IR `e la seguente forma bilineare, Z a(u, v) := ∇u · ∇v dx , Ω e F : V → IR `e il seguente seguente funzionale lineare, Z F (v) := v f dx . Ω Verificare che la Rforma a `e continua `e semplice. a(u, v) =< u, v >1 − Ω uv dx , si ha che Infatti, essendo |a(u, v)| ≤ kuk1 kvk1 + kukL2 (Ω) kvkL2 (Ω) ≤ 2kuk1 kvk1 . Anche verificare che il funzionale F risulta limitato `e semplice. Infatti, usando la disuguaglianza di Cauchy-Schwarz in L2 (Ω), si ottiene che |F (v)| ≤ kf kL2 (Ω) kvkL2 (Ω) ≤ kf kL2 (Ω) kvk1 . Per verificare la coercivit`a di a invece abbiamo bisogno di ricordare la validit`a della disuguaglianza di Poincar´e riportata in (9). Dal Lemma di Lax–Milgram possiamo quindi concludere che anche in questo caso esiste ed `e unica la soluzione del problema (8). Se consideriamo il problema di Dirichlet non omogeneo o pi` u in generale il problema misto, dalla (11) arriveremmo alla seguente formulazione, Z Z Z trovare u ∈ VD | ∇u · ∇v dx = vgN dγ + v f dx ∀v ∈ V , Ω ΓN Ω dove V := HΓ1D := {v ∈ H 1 (Ω) | v|ΓD = 0} , e dove VD := {v ∈ H 1 (Ω) | v|ΓD = gD } . 7 (13) Circa la regolarit`a dei dati, si richiede sempre che f ∈ L2 (Ω), che gn ∈ L2 (ΓN ) e che gD sia ”sufficientemente regolare” in ΓD . Si noti che u|ΓD e v|ΓD devono essere in generale intese nel senso della traccia (vedi appendice). Tuttavia non siamo soddisfatti di questa formulazione in quanto, per usare Lax-Milgram, abbiamo bisogno che le funzioni test v e la funzione ricercata u appartengano allo stesso spazio di Hilbert (si osservi che VgD non `e neanche uno sottospazio di H 1 (Ω)). Allora definiamo uˆ := u − Rg , dove Rg `e una funzione di H 1 (Ω), detta rilevamento del dato di Dirichlet al bordo , che ha gD come traccia su ΓD , ossia tale che γΓD (Rg ) = gD e quindi si ha γΓD (ˆ u) = 0 (che per brevit`a scriveremo semplicemente uˆ|ΓD = 0) 1 . Riformuliamo quindi il problema debole in termini di uˆ, Z Z Z trovare uˆ ∈ V | ∇ˆ u · ∇v dx = vgN dγ+ (v f − ∇v · ∇Rg ) dx , ∀v ∈ V, Ω ΓN Ω dove V `e sempre definito come in (13) ed `e quindi un sottospazio di H 1 (Ω). Il problema debole `e quindo sempre scrivibile formalmente come in (8), dove la forma bilineare `e sempre la stessa considerata per il problema di Dirichlet omogeneo e il funzionale lineare F `e ora definito come segue, Z Z F (v) := v f dx + vgN dγ − a(v, Rg ) . Ω ΓN Si noti che dalla propriet`a in (29) dell’operatore di traccia discende che anche questo funzionale `e limitato. Infatti ||F (v)| ≤ kf kL2 (Ω) kvkL2 (Ω) + kv|ΓN kL2 (ΓN ) kgN kL2 (ΓN ) + kRg k1 kvk1 ≤ (kf kL2 (Ω) + C0 kgN kL2 (ΓN ) + kRg k1 ) kvk1 Osservazione 1. Nel problema misto le condizioni di Neumann vengono dette naturali in quanto appaiono esplicitamente nella formulazione del problema variazionale mentre quelle di Dirichlet sono dette essenziali in quanto concorrono alla determinazione dello spazio funzionale di Hilbert V nel quale il problema differenziale viene formulato in forma debole. Nel caso del problema puro di Dirichlet, omogeneo e non, V = H01 (Ω). 1 Si noti che, per assicurare l’esistenza di Rg , dobbiamo assumere che gD ∈ H 1/2 (ΓD ) ⊂ L (ΓD ) (vedi appendice). 2 8 Osservazione 2. Costruire un rilevamento Rg del dato di Dirichlet gD pu`o in effetti non essere semplice. Tale compito risulter`a per`o molto pi` u semplice nell’ambito dell’approssimazione numerica, dove si costruisce soltanto un rilevamento di un’approssimazione di gD . Osservazione 3. La forma bilineare associata alla formulazione debole di un problema di Poisson risulta anche simmetrica. Ci`o sar`a utile in fase di risoluzione numerica. 2.3 Un problema bidimensionale pi` u generale Consideriamo ora il seguente problema −∇ · (µ ∇u) + σu = f , in Ω , u = gD in ΓD , ∂u = gN in ΓN , µ ∂n (14) dove, al solito gD e gN sono i dati assegnati sul bordo, rispettivamente di Dirichlet e di Neumann, f ∈ L2 (Ω) e dove µ , σ ∈ L∞ (Ω) sono anch’esse funzioni assegnate con µ(x) ≥ µ0 > 0 e σ(x) ≥ σ0 > 0 q.o. in Ω. Notiamo che l’ipotesi su σ garantisce l’unicit`a della soluzione anche per il problema di Neumann puro in questo caso. Circa la regolarit`a dei dati sul bordo, come per Poisson si richiede che gN ∈ L2 (ΓN ) e che gD sia in ΓD un po’ pi` u regolare (vedi quanto detto nella sottosezione precedente). Per arrivare alla formulazione debole di questo problema si procede come prima moltiplicando ambo i membri dell’equazione differenziale per la funzone test v e utilizzando quindi il teorema della divergenza. Si ottiene quindi, Z Z Z ∂u dγ = v f dx , (µ ∇u · ∇v + σ u v) dx − vµ ∂n Ω Ω ∂Ω che riscriviamo scindendo ΓD da ΓN , Z Z Z Z ∂u (µ ∇u · ∇v + σ u v) dx − vµ dγ = v f dx , + v gN dγ . ∂n Ω ΓD Ω ΓN Al solito poniamo poi uˆ := u − RgD e riscriviamo formalmente il problema come in (8) in termini della funzione incognita uˆ, dove lo spazio di Hilbert in cui si lavora `e sempre il V definito in (13) e ora R a(u, v) := Ω (µ ∇u · ∇v + σ u v) dx , F (v) := R v f dx + Ω R 9 ΓN v gN dγ − a(Rg , v) . Si tratta quindi di determinare uˆ ∈ V tale che a(ˆ u, v) = F (v) , ∀v ∈ V . La forma bilineare a cos`ı modificata `e ancora continua e coerciva grazie alle ipotesi assunte sulle funzioni µ e σ. Infatti, indicando con µM e σM due costanti positive che rispettivamente maggiorano q.o. in Ω le funzioni µ e σ, si ha |a(u, v)| ≤ µM | < u, v >1 +kukL2 (Ω) | kvkL2 (Ω) | + σM kukL2 (Ω) kvkL2 (Ω) ≤ (2µM + σM ) kuk1 kvk1 . Inoltre si ha a(u, u) ≥ µ0 |u|21 + σ0 kuk2L2 (Ω) ≥ min{µ0 , σ0 } kuk21 . Il funzionale F `e ovviamente ancora lineare ed esso `e pure limitato essendo, grazie a (29), ||F (v)| ≤ kf kL2 (Ω) kvkL2 (Ω) + kv|ΓN kL2 (ΓN ) kgN kL2 (ΓN ) + (µ M + σM ) kRg k1 kvk1 ≤ kf kL2 (Ω) + C0 kgN kL2 (ΓN ) + (2µM + σM ) kRg k1 kvk1 . Si conclude quindi che sotto le ipotesi assunte per le funzioni µ e σ anche la forma debole di questo problema ammette una e una sola soluzione. Osservazione 4. Quando la forma a `e continua e corciva sulla spazio di Hilbert V e il funzionale F `e ivi lineare e limitato, l’unica soluzione u del problema astratto (8) verifica la seguente disuguaglianza, kukV ≤ 1 kF kV 0 . α (15) Infatti si ha αkuk2V ≤ a(u, u) = F (u) ≤ |F (u)| ≤ kF kV 0 kukV . 3 Metodo di Galerkin Numericamente ci accontentiamo di determinare un’approssimazione uh ∈ Vh della soluzione u ∈ V del problema debole (8), dove Vh `e un sottospazio di V di dimensione finita Nh + 1. Notiamo che qui h rappresenta uno scalare positivo tale che, quando h → 0, si ha che corrispondentemente Nh → +∞. Naturalmente la cosa ha un senso se innanzi tutto l’approssimazione uh esiste ed `e unica per ogni h fissato e inoltre risulta che uh → u quando h tende a 0. 10 Nel metodo di Galerkin, fissato il sottospazio Vh di V, uh viene determinata come soluzone del seguente problema, trovare uh ∈ Vh | a(uh , vh ) = F (vh ) ∀vh ∈ Vh , (16) Notiamo che, essendo Vh un sottospazio di V, anch’esso `e uno spazio di Hilbert rispetto al prodotto scalare definito in V e quindi si pu`o ancora utilizzare il lemma di Lax-Milgram per concludere che esiste ed `e unica anche la soluzione uh ∈ Vh di (16). Al fine di determinare costruttivamente uh , osserviamo che, se {ϕj (·), j = 0, . . . , Nh } definisce una base per Vh , si ha che (16) `e verificato sse si ha che a(uh , ϕi ) = F (ϕi ) , ∀ϕi , i = 0, . . . , Nh . Ponendo allora uh (·) = Nh X uj ϕj (·) si ottiene che deve essere j=0 Nh X uj a(ϕj , ϕi ) = F (ϕi ) , i = 0, . . . , Nh . j=0 Queste Nh = 1 condizioni, essendo lineari nelle atrettante incognite uj , j = 0, . . . , Nh , possono essere quindi compattamente riscritte come il seguente sistema lineare quadrato, Au = f , (17) dove si `e posto , u := (u0 , · · · , uNh )T , f := (F (ϕ0 ), · · · , F (ϕNh ))T , e dove Ai,j := (a(ϕj , ϕi )) . La matrice A dicesi matrice di rigidezza o anche matrice di stiffness mentre il vettore f dicesi vettore di carico. Riguardo alla matrice A si noti che, essendo la forma a coerciva, segue che A `e definita positiva, ossia ∀x ∈ IRn con x 6= 0, risulta xT Ax > 0 . Infatti, tenendo in considerazione T come `e definita A e la bilinearit` PNah della forma a, si ottieneT che x Ax =2 a(wh , wh ), dove si `e posto wh = j=1 xj ϕj . Segue quindi che x Ax ≥ αkwh k1 con α > 0 (coefficiente di coercivit`a) e wh 6= 0. Le definita positivit`a assicura quindi effettivamente l’esistenza e l’unicit`a della soluzione uh . Se poi la forma bilineare a `e anche simmetrica, come accade per i problemi ellittici esaminati, la A risulta essere sdp e quindi ci si pu`o avvantaggiare di ci`o per la risoluzione del sistema lineare in (17). Osserviamo che (8) e (16) implicano la seguente propriet`a di ortogonalit`a della differenza u − uh rispetto allo spazio Vh , a(u − uh , vh ) = 0 , ∀vh ∈ Vh . 11 Inoltre, analogamente a quanto fatto per ottenere la disuguaglianza (15), si pu`o dimostrare che la norma di uh rimane limitata superiormente al tendere di h a zero in quanto 1 kuh kV ≤ kF kV 0 . α Dimostriamo ora il seguente importante risultato, Teorema 1. La soluzione uh di (16) verifica la seguente disuguaglianza, ku − uh kV ≤ M infvh ∈Vh ku − vh kV , ∀vh ∈ Vh , α dove u `e la soluzione di (8) e α e M sono rispettivamente le costanti di coercivit`a e di continuit`a della forma bilineare a. Dimostrazione : Osserviamo innanzi tutto che αku − uh k2V ≤ a(u − uh , u − uh ) = a(u − uh , u − vh ) + a(u − uh , vh − uh ), ∀vh ∈ Vh . Ma, per la propriet`a di ortogonalit`a di u − uh , il secondo addendo `e zero. Quindi, dalla continuit`a di a si deduce che αku − uh k2V ≤ M ku − uh kV ku − vh kV , da cui discende la tesi. L’importanza di questo risultato `e insita nel fatto che se nello spazio Vh al tendere di h a zero si approssima sempre meglio u ∈ V (il che significa che l’inf a destra nella suddetta disuguaglianza tende a zero), allora anche l’errore di approssimazione ku − uh kV tender`a a zero e avremo che l’ordine di approssimazione (infinitesimo rispetto a h) con cui uh approssima u sar`a analogo a quello della migliore approssimazione di u in Vh . 4 Il metodo degli elementi finiti Come abbiamo visto nel paragrafo precedente, per completare la risoluzione numerica di un problema ellittico in forma debole utilizzando Galerkin, abbiamo bisogno di fissare lo spazio Vh e di scegliere una base in esso. Vediamo in questa sezione come questo viene fatto utilizzando il metodo degli elementi finiti, riferendoci in particolare ad elementi finiti cosiddetti lagrangiani. Ci occuperemo esplicitamente solo del caso 1D e del caso 2D. 12 4.1 Caso 1D: scelta di Vh e delle basi Assumiamo quindi qui Ω = I = (a , b) ⊂ IR e ricordiamo che in tal caso ¯ . Fissata una partizione ∆h di (a , b), ossia un insieme si ha H 1 (I) ⊂ C 0 (I) di ascisse xi , i = 0, . . . , N tali che a = x0 < x1 < · · · < xN −1 < xN = b , poniamo Ii := (xi−1 , xi ) , hi := xi − xi−1 , i = 1, . . . , N e h := max hi . i=1,...,N Con questa notazione, nel metodo degli elementi finiti, fissato r > 0 ∈ IN , si sceglie Vh come segue, Vh := {vh ∈ Xhr | vh verifica le cond. di Diric. omogenee assegnate} , dove Xhr indica lo spazio delle splines generalizzate di grado r definite sulla partizione ∆h e che nei nodi devono solo essere continue, Xhr := {vh ∈ C 0 ([a , b]) | vh |Ik ∈ Πr , k = 1, . . . , N } . Come sappiamo tale spazio ha dimensione N (r + 1) − (N − 1) = N r + 1 e effettivamente esso costituisce una scelta ammissibile in quanto Xhr ⊂ H 1 (Ω) . Infatti ogni funzione vh ∈ Xhr `e continua in [a , b] ed `e tale che vh0 ∈ L2 (I), essendo vh0 ∈ C(Ik ), k = 1, . . . , N e con un salto finito in ciascun nodo interno. Naturalmente in questo spazio potremmo usare la base delle B-splines definita usando il vettore esteso dei nodi (introducendo quindi nodi interni multipli tutti con molteplicit`a r). Facendo per`o qui riferimento all’implementazione pi` u comune del metodo degli elementi finiti, andremo ad utilizzare una base diversa, per definire la quale introduciamo la seguente partizione allargata Y ⊃ ∆ di (a , b) , N Y := ∪ yi,k , con yi,k := xk−1 + i k=1 hk , i = 0, . . . , r , (num. locale) r dove hk = xk − xk−1 . Si osservi che la partizione allargata Y `e ottenuta aggiungendo a ∆ altre (r − 1) ascisse equispaziate a distanza hk /r in ogni sottointervallo Ik . Si osservi inoltre che ]Y = N r+1 e che nel caso particolare r = 1 si ha che Y = ∆ . Come si diceva, la partizione Y viene utilizzata per definire una base {ϕi , i = 0, . . . , N r} lagrangiana di Xhr , ossia tale che ϕi (yj ) = δi,j , i, j = 0, . . . , N r , 13 (18) dove δij indica il δ di Kronecker. e dove le ascisse di Y sono state rinumerate globalmente, ossia si `e posto yj := yi,k , k := 1 + b rj c , i := j + r − rk , j = 0, . . . , N r − 1 , yN r := yr,N (num. globale) . (19) Queste funzioni, grazie a (18), risultano essere sicuramente linearmente indipendenti. Inoltre esse si determinano facilmente utilizzando la loro rappresentazione polinomiale a tratti. Infatti φj deve essere identicamente nulla in I¯k se yj ∈ / I¯k mentre, se yj ∈ I¯k e in particolare si ha yj = yi,k , essa deve necessariamente coincidere con il polinomio di Lagrange definito utilizzando le r + 1 ascisse ys,k , s = 0, . . . , r . Se quindi yj ∈ Y \ ∆, la corrispondente ϕj sar`a diversa da zero solo in quel sottointervallo Ik cui appartiene yj . Se invece yj ∈ ∆, allora essa sar`a diversa da zero in quei due sottointervalli contigui che condividono yj come estremo (ad eccezione naturalmente del caso y0 = x0 = a e yN r = xN = b). Per capire meglio come sono definite queste funzioni, analizziamo in dettaglio i casi r = 1 e r = 2. Se r = 1 abbiamo detto che Y = ∆ e quindi avremo che ϕi sar`a la funzione continua lineare a tratti sulla partizione ∆ (spline classica) che vale 1 in xi e che vale 0 in tutti gli altri punti della partizione ∆ il cui grafico `e quello della funzione a tettuccio con supporto [xi−1 , xi+1 ]. Essa `e quindi definibile a tratti come segue, x−x i−1 xi −xi−1 se x ∈ [xi−1 , xi ) , xi+1 −x ϕi (x) := se x ∈ [xi , xi+1 ) , x −x 0i+1 altrimenti . In questo caso quindi tutte le funzioni di base (escluse la prima e l’ultima) hanno come supporto due sottointervalli consecutivi. Se invece r = 2, si ha che, quando j = 2k − 1 (dispari), ϕj `e diversa da zero solo in Ik e risulta definibile a tratti come segue, ( (x−yj−1 )(x−yj+1 ) se x ∈ [xk−1 , xk ) , (yj −yj−1 )((yj −yj+1 ) j = 2k − 1 (dispari) . ϕj (x) := 0 altrimenti . Quando invece j = 2k (pari), si ha che ϕj `e diversa da zero sia in Ik che in 14 Ik+1 e essa risulta definibile a tratti (x−y )(x−y ) j−2 j−1 (yj −yj−2 )((yj −yj−1 ) (x−yj+1 )(x−yj+2 ) ϕj (x) := (yj −yj+1 )((yj −yj+2 ) 0 come segue, se x ∈ [xk−1 , xk ) , se x ∈ [xk , xk+1 ) , altrimenti . j = 2k (pari) . In generale, per come `e definita la numerazione globale si ha che, se yj = yi,k con j non multiplo di r, allora ϕj 6= 0 nel solo sottointervallo Ik e risulta (k) ϕj |Ik = Li,r , (k) dove Li,r indica l’ i–esimo polinomio di Lagrange di grado r definito usando le ascisse (uniformi) di Y appartenenti ad Ik . Se invece j `e multiplo di r, essa risulta non nulla sia in Ik , con k definito come in (19), che nel precedente (k) (k−1) sottointervallo, con ϕj |Ik = L0,r e ϕj |Ik−1 = Lr,r . Ora, se per ogni sottointervallo Ik si definisce il mapping lineare x = mk (ξ) : [0 , 1] → Ik , mk (ξ) = xk−1 + ξhk , si ha che (k) Lj,r (x) = `j,r (ξ) , avendo indicato con `j,r (ξ), j = 0, . . . , r i polinomi di Lagrange di grado r e nodi 0 = ξ0 < ξ1 < · · · < ξr−1 < ξr = 1 con ξj = j/r, j = 0, . . . , r, ossia r Y rξ − i `j,r (ξ) = , j = 0, . . . , r . j−i i=0,i6=j Facendo allora riferimento al problema ellittico considerato in Sezione 2.1, avremo quindi per la matrice di rigidezza che N Z X Ai,j = ϕ0j (x) ϕ0i (x) + σ(x)ϕj (x) ϕi (x) dx i, j = 1, . . . , N r + 1. k=1 Ik Si osservi innanzi tutto che A `e simmetrica, il che implica che si possono sostanzialmente dimezzare i calcoli supponendo per esempio i ≥ j. L’assemblaggio della matrice A comunque viene usualmente fatto element–by–element: inizializzata A a zero, per ogni sottointervallo Ik si calcolano tutti gli integrali Z k Ii,j := ϕ0j (x) ϕ0i (x) + σ(x)ϕj (x) ϕi (x) dx , Ik 15 che sono non nulli ossia per quelle coppie di indici i e j tali che esistono dei corrispondenti indici 0 ≤ si ≤ r e 0 ≤ sj ≤ r tali che yi = ysi ,k e yj = ysj ,k (limitandosi per la simmetria a quelli per cui si ≥ sj ). Si tratta quindi in tutto di (r + 2)(r + 1)/2 integrali da calcolare su ogni Ik . Utilizzando la sostituzione lineare x = mk (ξ), per ciascuno di tali sottointervalli si ha che k Ii,j = 1 I1 (sj , si ) + hk I0k (sj , si ) , hk dove, per s1 , s2 = 0, . . . , r, si pone R1 I1 (s1 , s2 ) := 0 `0s1 ,r (ξ) `0s2 ,r (ξ) dξ , R1 I0k (s1 , s2 ) := 0 σ(mk (ξ)) `s1 ,r (ξ) `s2 ,r (ξ) dξ . Osserviamo per`o che solo I1 (s1 , s2 ) non dipende dall’intervallo Ik e il suo calcolo consiste nel calcolo dell’integrale di un polinomio. Il calcolo di I0k (s1 , s2 ) richiede invece in generale l’uso di formule di quadratura. Anche il vettore di carico f viene assemblato procedendo element–by– element e tale assemblaggio richiede su ogni sottointervallo Ik il calcolo delle seguenti quantit`a, Z 1 k If (s1 ) := hk f (mk (ξ)) `si ,r (ξ) dξ , s1 = 0, . . . , r , 0 dove Ifk (si ) deve essere accumulata in f (i), essendo yi = ysi ,k . 4.2 Caso 1D: convergenza di uh a u Naturalmente la scelta dello spazio Vh risulta adeguata solo se infvh ∈Vh ku − vh kV → 0 , quando h → 0 , dove u ∈ V ⊆ H 1 (Ω) `e la soluzione di (8) che, nelle ipotesi assunte per f e per σ sappiamo in effetti appartenere almeno ad H 2 (I). Dobbiamo quindi fare vedere che questo `e vero se si sceglie Vh coincidente con lo spazio delle splines generalizzate Xhr considerato nella sezione precedente. Ci`o si dimostra facendo vedere che lim ku − Phr k1 = 0 , h→0 16 dove Phr indica la funzione di Xhr che interpola u nell’insieme delle ascisse prima indicato con Y. Infatti si ha che infvh ∈Vh ku − vh kV ≤ ku − Phr k1 . Si noti che u ∈ C 0 [a , b] e che l’interpolante Phr ∈ Xhr `e univocamente definita. Per come `e definito Xhr si ha che Phr | Ik risulta essere il polinomio di grado r che interpola u sulle r + 1 ascisse equispaziate yi,k , i = 0, . . . , r appartenenti a Ik , ossia r X (k) r Ph (x) = u(yi,k ) Li,r (x) , ∀x ∈ Ik . i=0 Avendo i polinomi di Lagrange somma costante uguale a 1, si pu`o scrivere u(x) − Phr (x) = r X (k) (u(x) − u(yi,k )) Li,r (x) , ∀x ∈ Ik , i=0 e quindi ottenere |u(x) − Phr (x)| ≤ Λr ω(u, hk ) , ∀x ∈ Ik , P (k) dove Λr := k ri=0 |Li,r |k∞,[a,b] `e la costante di Lebesgue (a nodi equispaziati in Ik e per il grado r) e ω(u, h) `e il modulo di continuit`a della funzione u che tende a zero per h che tende a zero, essendo u continua. Dato che per ascisse uniformi la costante di Lebesgue Λr non dipende da k ma solo dal grado r Pr (infatti si ha che Λr = k i=0 |`i,r | k∞,[0,1] ), si pu`o allora concludere che max |u(x) − Phr (x)| ≤ Λr ω(u, h) . x∈[a , b] Questo ovviamente garantisce la convergenza di Phr ad u nella norma uniforme di C 0 [a , b] . Ma vediamo ora l’ordine di convergenza con cui Phr tende ad u al tendere di h a zero nella norma di H 1 (I), ricordando che u appartiene almeno a H 2 (I). A tale scopo si dimostra il seguente teorema, Teorema 2. Sia I = (a , b) e u ∈ H r+1 (I), r ≥ 1 . Allora esistono due costanti C0,r e C1,r indipendenti da u e da h tali che |u − Phr |H 1 (I) ≤ C1,r hr |u|H r+1 (I) , ku − Phr kL2 (I) ≤ C0,r hr+1 |u|H r+1 (I) . 17 (20) Dimostrazione : Facciamo la dimostrazione solo nel caso r = 1, ricordando che in tal caso, essendo il dominio monodimensionale, si ha che u ∈ C 1 (I) . Se quindi poniamo e := u − Ph1 , abbiamo che e ∈ C 1 (Ik ) e, essendo e(xi ) = 0, i = 0, . . . , N, si ha che per il teorema di Rolle esistono zk ∈ Ik , k = 1, . . . , N tali che e0 (zk ) = 0 . Questo ci permette di scrivere Z x Z x 00 0 e (s)ds = u00 (s) ds , ∀x ∈ Ik , e (x) = zk zk che implica che xk Z 0 |e (x)| ≤ |u00 (s)|ds , ∀x ∈ Ik . xk−1 Usando la disuguaglianza di Cauchy–Schwarz in L2 (Ik ) per le funzioni 1 e |u00 |, si ottiene quindi, 1/2 |e0 (x)| ≤ hk Z xk !1/2 (u00 (s))2 ds , ∀x ∈ Ik . (21) xk−1 A sua volta si ha quindi allora che Z xk Z 0 2 2 (e (x)) dx ≤ h xk−1 xk (u00 (s))2 ds , xk−1 dove hk `e stato maggiorato con h . Sommando su k e e elevando a 1/2 ambo i membri si ottiene allora la prima disuguaglianza in (20) ponendo C1,1 = 1. Dobbiamo ora maggiorare e(x). Per fare questo si nota che Z x e(x) = e0 (s)ds , ∀x ∈ Ik , xk−1 e quindi, dalla (21), si ottiene che Z xk |e(x)| ≤ 3/2 |e0 (x)|dx ≤ hk Z xk−1 xk !1/2 (u00 (s))2 ds , ∀x ∈ Ik . xk−1 Quindi, quadrando e maggiorando di nuovo hk con h si ottiene Z xk Z xk 2 4 (e(x)) dx ≤ h (u00 (s))2 ds . xk−1 xk−1 18 Infine, sommando su k e e elevando poi a 1/2 ambo i membri si ottiene la seconda disuguaglianza in (20) ponendo ancora C0,1 = 1. Per quanto prima detto, questo teorema implica allora che, se la soluzione u del nostro problema variazionale appartiene a H r+1 (I) con r ≥ 1 e si usano elementi finiti proprio di grado r, allora esiste una costante indipendente da h e da u tale che ku − uh kH 1 (I) ≤ Chr |u|H r+1 (I) . Si pu`o inoltre dimostrare che se u ∈ H s+1 (I) con s ≥ 1 e si usano elementi finiti di grado r > s si ha soltanto ku − uh kH 1 (I) ≤ Chs |u|H s+1 (I) . Da questo si deduce che non conviene utilizzare elementi finiti di grado r > s. Si noti che nell’approccio classico qui analizzato non si contempla la possibilit`a di utilizzare come Vh uno spazio di splines con regolarit`a globale maggiore di C 0 . 4.3 Caso 2D: scelta di Vh e delle basi Nel caso bidimensionale, dato che si intende utilizzare sempre delle polinomiali a tratti, occorre preliminarmente fissare una suddivisione del dominio Ω che ci limitiamo qui a considerare poligonale (o precedentemente approssimato con un poligono). Come suddivisione ci limitiamo a considerare una triangolazione Th , ossia un insieme finito di triangoli K ⊂ Ω non degeneri tali che ◦ ◦ • ∀K1 , K2 ∈ Th distinti si ha K 1 ∩ K 2 = ∅ , • nessun K ∈ Th pu`o avere un vertice nell’interno del lato di un altro triangolo , • ¯, ∪ K=Ω K∈Th che costituisce comunque la scelta pi` u duttile. Il parametro h che si associa alla triangolazione risulta essere il massimo dei diametri hK di ciascun triangolo. Nel considerare una famiglia F di triangolazioni (si considerano in ¯ con h decrescente), richiederemo comunque che F genere triangolazioni di Ω √ sia regolare, ossia che esista una costante δ ≥ 3 indipendente da h tale che hk ≤ δ, ρK ∀K ∈ Th , 19 ∀Th ∈ F , dove ρK denota il diametro del cerchio inscritto √ nel traingolo K (detto anche sfericit`a del triangolo) (si noti che se δ = 3 si sta chiedendo che tutti i triangoli siano equilateri). Ontre che considerare famiglie di triangolazioni regolari in genere si assume anche l’ipotesi che F sia quasi–uniforme ossia che esita ina costante 1 ≥ τ > 0, tale che hk ≥ hτ , ∀K ∈ Th , ∀Th ∈ F , Fissata Th ∈ F definiremo allora ¯ | vh |K ∈ Π2r , Xhr := {vh ∈ C 0 (Ω) ∀K ∈ Th } , dove Π2r indica lo spazio dei polinomi bivariati di grado minore o uguale a r, con (r + 1)(r + 2) . Dr := dim(Π2r ) = 2 Si osservi che la restrizione di una delle funzioni di Xhr ad un lato della triangolazione risulta essere un polinomio monovariato sempre di grado r. Inoltre, cos`ı come nel caso monovariato, possiamo facilmente verificare che Xhr ⊂ H 1 (Ω). Ora siamo interessati a utilizzare sempre una base ϕi , i = 0, . . . , Nh di Xhr che sia lagrangiana, ossia per la quale esiste un opportuno insieme Y di punti distinti di Ω tali che ϕi (Pj ) = δi,j , i, j = 0, . . . , Nh , dove Nh + 1 indica sempre la dimensione dello spazio Xhr . Naturalmente, al solito avremo che ϕi |K ≡ 0 se Pi ∈ / K e quindi ogni ϕi sar`a diversa da zero solo in quei triangoli cui appartiene Pi . Il caso pi` u semplice (e spesso usato) si ha per r = 1. Infatti in tal caso Y coincide con l’insieme dei vertici della triangolazione. Nel caso generale si pone invece Y := ∪ Yr,K , K∈Th dove Yr,K indica l’insieme dei punti di r–base su K (vedi appendice B) e dove Nh +1 = ]Y. Si noti che se Pi `e interno a un triangolo K, la corrispondente ϕi risulta non nulla solo in K, se esso `e interno ad un lato della triangolazione ϕi `e non nulla solo nei due triangoli che condividono quel lato e se invece `e un vertice ϕi sar`a non nulla in tutti quei triangoli che hanno quel vertice in comune (almeno 3 se `e un vertice interno). In ogni caso occorrer`a numerare i punti distinti di Y e risulta essere non banale trovare una numerazione che rende meno ampia possibile la banda della matrice di rigidezza. In generale a priori la si classifica solo come una matrice sparsa. 20 Naturalmente se Pi , Pj ∈ K ∈ Th , dovremo calcolare il contributo su K all’elemento Ai,j della matrice di rigidezza, ossia il seguente integrale (riferendoci per esempio al problema ellittico pi` u generale), Z µ(X)∇ϕi (X) · ∇ϕj (X) + σ(X)ϕi (X)ϕj (X) dX . K Ora anche per i triangoli `e possibile individuare una trasformazione liˆ :K ˆ → K che mappa in K il master K, ˆ ossia il triangolo di neare mK (X) ˆ di coordinate (1, 0) e in riferimento con vertici in Aˆ di coordinate (0, 0) in B Cˆ di coordinate(0, 1). Tale trasformazione si scrive come segue, ˆ := MK X ˆ + A, X = mK (X) dove MK `e la seguente matrice 2 × 2 , MK = (B − A , C − A) , essendo A, B e C i tre vertici del triangolo K. Si osservi che le coordinate baricentriche Λ = (λ0 , λ1 , λ2 ) di un punto X del piano rispetto a K sono ˆ rispetto a K. ˆ uguali a quelle del corrispondente punto X Ora ϕi |K che ϕj |K coincidono rispettivamente con i polinomi di Lagrange associati al punto base ad esse corrispondente. Esisteranno quindi due multiindici I e J, con |I| = |J| = r, tali che ϕi |K = LI,r e ϕj |K = LJ,r . Usando la trasformazione lineare appena definita possiamo scrivere che ∇ϕi (X) = 1 ˆ M c ∇LI,r (X), det(MK ) K dove MKc indica la matrice dei cofattori della matrice MK . Questo implica che il suddetto integrale pu`o essere trasformato nella seguente quantit`a, R 1 c c ˆ ˆ ¯ µ(mK (X)) (MK ∇LI,r ) · (MK ∇LJ,r ) dX + det(MK ) K . R ˆ ˆ det(MK ) K¯ σ(mK (X))LI,r LJ,r dX , Si osservi che in questa formula det(MK ) svolge il ruolo che svolgeva hk nel caso unidimensionale. Infatti |det(MK )| = 2Area(K) . Si osservi inoltre che, anche se µ `e costante, a differenza di quanto accadeva nel caso monodimensionale, il primo integrale dipende comunque da K a causa di MKc e quindi non si pu`o fare una volta per tutte. 21 4.4 Caso 2D: convergenza di uh a u Come per il caso monodimensionale, occorre maggiorare infvh ∈Vh ku − vh kV con una quantit`a che va a zero quando h va a zero per poter dire che con il metodo degli elementi finiti `e assicurata la convergenza. A tale scopo anche nel caso bidimensionale si maggiora la suddetta quantit `a con ku − Phr k1 , dove Phr ∈ Xhr indica l’interpolante di u nei punti di Y che `e univocamente definita (vedi appendice B). Per tale funzione infatti `e possibile dimostrare il seguente teorema del quale si riporta solo l’enunciato, ¯ e sia Th ∈ F. Teorema 3. Sia F una famiglia di triangolazioni regolari di Ω r+1 Se u ∈ H (Ω), con r ≥ 1, allora esistono due constanti positive Ci , r, i = 0, 1 dipendenti da δ tali che |u − Phr |H 1 (I) ≤ C1,r hr |u|H r+1 (I) , ku − Phr kL2 (I) ≤ C0,r hr+1 |u|H r+1 (I) . (22) Da questo teorema infatti discende che (nelle ipotesi da esso assunte) esiste C positiva (sempre dipendente da δ) tale che ku − uh k1 ≤ M C hr |u|H r+1 (Ω) . α Si noti che come nel caso monodimensionale se u ∈ H s+1 con s < r si pu`o solo dire che esiste una costante positiva C tale che ku − uh k1 ≤ 5 M C hs |u|H s+1 (Ω) . α Condizionamento della matrice di rigidezza Per i problemi ellittici 1D e 2D considerati, nell’ ipotesi di quasi–uniformit`a e, per il caso 2D anche di regolarit`a della triangolazione, si pu`o determinare un bound superiore per il numero di condizionamento in norma 2 della matrice di rigidezza A. Per determinare tale bound occorre avvalersi per`o di due risultati validi nel Vh scelto e nelle ipotesi fatte sulla triangolazione. Il primo `e la cosiddetta disuguaglianza inversa, k∇vh kL2 (Ω) ≤ C ∗ h−1 kvh kL2 (Ω) , ∀vh ∈ Vh , (dove C ∗ indica una costante indipendente da h). Inoltre occorre prima dimostrare il seguente lemma (la cui dimostrazione `e per`o qui omessa), 22 Lemma 1. Esistono due costanti C2 ≥ C1 > 0 indipendenti da h tali che, C1 hd |v|2 ≤ kvh k2L2 (Ω) ≤ C2 hd |v|2 , ∀vh ∈ Vh , (23) essendo d ≤ 3 la dimensione spaziale, v = (v0 , · · · , vNh )T ∈ IRNh +1 il vettore P h tale che vh = N j=0 vj ϕj e indicando con |v| la sua norma eucliedea. Siamo allora in grado di dimostrare il seguente teorema, Teorema 4. Indicato con κ2 (A) il numero di condizionamento in norma 2 della matrice di rigidezza del metodo degli elementi finiti per i problemi ellittici esaminati, si ha che esiste una costante Cr dipendente dal grado r degli elementi finiti utilizzati tale che κ2 (A) ≤ Cr h−2 . Dimostrazione : Essendo la A sdp, essa ha tutti autovalori reali e positivi e si ha che λmax , κ2 (A) = λmin dove λmax e λmin denotano rispettivamente il pi` u grande e pi` u piccolo degli autovalori di A. Ora, se λh `e un qualsiasi autovalore di A si sa che esso pu`o essere scritto nella forma vT Av , λh = vT v dove v indica un autovettore relativo a λh . Ma d’altra parte, per PNhcome `e T definita la matrice A si ha che v Av = a(vh , vh ) , dove vh = j=0 vj ϕj . Quindi dalla coercivit`a e dalla continuit`a della forma bilineare discende che kvh k21 kvh k21 α ≤ λh ≤ M . |v|2 |v|2 Usando la disuguaglianza inversa in Vh si ha d’altra parte che kvh kL2 (Ω) ≤ kvh k1 ≤ (1 + C ∗ ) h−1 kvh kL2 (Ω) , e quindi ne deriva che α kvh k2L2 (Ω) |v|2 ∗ 2 −2 ≤ λh ≤ M (1 + C ) h 23 kvh k2L2 (Ω) |v|2 . Questa, combinata alla (23),implica a sua volta che αC1 hd ≤ λh ≤ M (1 + C ∗ )2 h−2 C2 hd . Da queste due disuguaglianze deriva che κ2 (A) = λmax M (1 + C ∗ )2 h−2 C2 ≤ , λmin αC1 che conclude la dimostrazione. Il peggioramento del numero di condizionamento al decrescere di h implica che, tanto pi` u si vuole essere accurati, tanto pi` u diventa problematica la risoluzione del sistema lineare cui si perviene con il metodo degli elementi finiti. Si ricordi che se per esempio si usa il metodo del gradiente coniugato per la sua risoluzione, la velocit`a di convergenza decresce al crescere di κ2 (A). Per tale metodo `e quindi particolarmente utile usare delle tecniche di precondizionamento. 6 Cenni di analisi isogeometrica Un interessante recente campo di ricerca riguarda l’impiego di spazi di funzioni tipicamente utilizzati nel CAD in combinazione con il metodo degli elementi finiti. In tale contesto l’obiettivo `e quello di utilizzare gli stessi spazi di funzioni sia per la descrizione del bordo del dominio Ω che per approssimare la soluzione stessa del problema differenziale. Dato che usualmente la descrizione di geometrie nel CAD viene fatta mediante splines o mediante la loro estensione razionale, fondamentalmente ci`o significa utilizzare spazi di funzioni spline invece che semplici polinomiali a tratti con regolarit`a soltanto C 0 . Questo modo di procedere innanzi tutto consente di rappresentare esattamente il bordo del dominio aumentando l’accuratezza del metodo discreto quando il problema differenziale `e formulato su un dominio non poligonale. Inoltre `e stato verificato che l’impiego di spazi discreti Vh con regolarit`a maggiore di C 0 pu`o garantire il raggiungimento di soluzioni numeriche pi` u stabili, in particolare quando si ha a che fare con problemi con soluzioni regolari che invitano all’uso di gradi pi` u alti. Naturalmente va detto che, mentre nel caso monodimensionale lo spazio S delle splines `e uno spazio ben noto e univocamente definito (una volta ovviamente precisato grado e nodi), la sua estensione al caso bidimensionale/pluridimensionale risulta non ancora standard se si fa riferimento al caso generale. Essa diviene invece standard se si 24 considera la loro generalizzazione tensor-product che presuppone comunque la loro definizione su domini parametrici a topologia rettangolare. Al fine di superare o comunque rendere meno grave questo drawback, sono tuttora in sviluppo varie linee di ricerca. 25 7 Appendice A In questa sezione si introducono le definizioni e gli enunciati dei teoremi di analisi funzionale cui viene fatto riferimento in queste note. 7.1 Gli spazi Lp (Ω), 1 ≤ p ≤ +∞ Si tratta di spazi di funzioni definite su Ω che sono tutti spazi di Banach (ciascuno rispetto alla sua norma) e che nel caso da noi assunto di Ω limitato sono annidati nel senso che, se q > p ≥ 1 si ha L∞ (Ω) ⊂ Lq (Ω) ⊂ Lp (Ω) ⊂ L1 (Ω) . Se p < +∞ si ha: Z p L (Ω) := {v : Ω → IR | |v(x)|p dx < +∞} Ω e che, conseguentemente, la norma di v ∈ Lp (Ω) `e definita come segue, Z p |v(x)| dx kvkLp (Ω) := 1/p . Ω In particolare L2 (Ω) `e uno spazio di Hilbert rispetto al prodotto scalare Z < v , w >L2 (Ω) := v(x) w(x) dx . Ω Inoltre si ha che L∞ (Ω) := {v : Ω → IR | |v(x)| < +∞ q.o. in Ω} e kvkL∞ (Ω) := sup{|v(x)| , q.o. in Ω} . 7.2 Derivate nel senso delle distribuzioni Vogliamo qui introdurre una generalizzazione del concetto di derivata che, fra l’altro, ci permetter`a di definire la derivata (nel senso delle distribuzioni appunto) per una qualsiasi f ∈ L2 (Ω) (funzione a quadrato sommabile). 26 Ma andiamo per ordine e definiamo innanzi tutto lo spazio delle distribuzioni che indicheremo con D0 (Ω) come lo spazio duale dello spazio D(Ω) := {φ : Ω → IR | φ ha supp. comp. in Ω e `e inf. deriv. in Ω} Abbiamo quindi che D0 (Ω) `e lo spazio dei funzionali lineari e continui definiti sulle funzioni di D(Ω). Ora possiamo osservare che L2 (Ω) `e isomorfo a un sottospazio proprio di D0 (Ω). Infatti `e possibile identificare ogni f ∈ L2 (Ω) con la distribuzione Tf tale che Z f (x) φ(x)dx . Tf (φ) := Ω Notiamo che per brevit`a spesso si identifica f ∈ L2 (Ω) con la distibuzione Tf ad essa associata. Con tale abuso di linguaggio possiamo quindi anche dire che L2 (Ω) `e un sottospazio di D0 (Ω). Il fatto che si tratti di un sottospazio proprio si dimostra facendo vedere che non `e possibile trovare f ∈ L2 (Ω) tale che δa = f, (nel senso quindi di δa = Tf ,) dove δa ∈ D0 (Ω), a ∈ Ω, `e detta distribuzione di Dirac ed `e definita come segue: δa (φ) := φ(a) . ∂T di una distribuzione T come quella disDefiniamo quindi la derivata ∂x i tribuzione tale che ∂T ∂φ (φ) := −T ( ). (24) ∂xi ∂xi In particolare avremo quindi che, se f ∈ L2 (Ω), si ha Z ∂φ ∂Tf (φ) = − f (x) dx . ∂xi ∂xi Ω (25) Dalla definizione in (24) si deduce innanzi tutto che le distribuzioni sono infinitamente derivabili (nel senso delle distribuzioni!) e per recursione si ottiene che, se α ∈ INd `e un multiindice assegnato, ∀T ∈ D0 (Ω) risulta Dα T (φ) = (−1)|α| T (Dα φ) , P |α| dove si ricorda che |α| := di=1 αi e Dα φ :=, ∂ α1 x∂1 ···∂φαd xd . Osserviamo poi che l’espressione in (25) implica che, se f ∈ C 1 (Ω), al∂T lora ∂xfi = T ∂f che implica che in questo caso la derivata nel senso delle ∂xi 27 distribuzioni coincide con la derivata classica. Infatti usando il teorema di Green e considerando che ogni φ ∈ D(Ω) ha supporto compatto in Ω, si ha che Z ∂f ∂φ (x) + f (x) (x)dx = 0 φ(x) ∂xi ∂xi Ω che implica che Z ∂Tf ∂f (φ) = φ(x) dx = T ∂f (φ) . ∂xi ∂xi ∂xi Ω Se per`o si sa solo che f sta in L2 (Ω) non `e neanche detto che esista g ∈ ∂T L2 (Ω) tale che Tg = ∂xfi , cio`e, in altre parole, la derivata nel senso delle distribuzioni di una funzione di L2 (Ω) non necessariamente `e una funzione di L2 (Ω). Questo si verifica in modo costruttivo, considerando la funzione monovariata di Heaviside H(x) : IR → IR, 1 se x > 0 , H(x) = (26) 0 altrimenti. Tale funzione appartiene naturalmente a L2 (Ω), Ω ⊂ IR, essendo Ω limitato per ipotesi. Se Ω = (a , b) con a < 0 < b, avremo Z b Z b dφ dφ dφ dTH (φ) = −TH ( ) = − H(x) (x) = − dx = φ(0) = δ0 (φ) . dx dx dx a 0 dx Essendo quindi 7.3 dTH dx = δ0 , segue che dTH dx ∈ / L2 (Ω). Gli spazi di Sobolev H m (Ω) Il fatto che la derivata nel senso delle distribuzioni di una funzione di L2 (Ω) non necessariamente appartenga ad L2 (Ω), ci porta quindi ad introdurre un sottospazio di L2 (Ω) che viene detto spazio di Sobolev H 1 (Ω), H 1 (Ω) := {f ∈ L2 (Ω)| ∂f ∈ L2 (Ω), i = 1, . . . , d} , ∂xi (27) dove le derivate devono essere intese nel senso delle distribuzioni. Si noti che H 1 (Ω) `e uno spazio di Hilbert rispetto al prodotto scalare Z f g + ∇f · ∇g dx , < f , g >1 := Ω 28 che induce la norma Z kf k1 = 2 2 1/2 f + |∇f | dx . Ω E’ anche possibile definire una seminorma in H 1 (Ω) che talvolta viene utilizzata in certi teoremi, Z 1/2 2 |f |1 = |∇f | dx . Ω Dal punto di vista della regolarit`a puntuale, si dimostra che se d = 1 e Ω = (a , b) (caso monodimensionale), allora H 1 (Ω) ⊂ C 0 (Ω). Questo per`o non `e pi` u vero se d > 1. Si noti anche che pu`o succedere che si possa scrivere ` ¯ = ∪K ¯ j con Kj ∩ Ks = ∅ se j 6= s, e che risulti che una funzione f ∈ Ω / j=1 H 1 (Ω) sebbene sia f ∈ H 1 (Kj ), j = 1, . . . , ` . Basti pensare alla funzione di Heaviside. In effetti si dimostra che se f ∈ H 1 (Kj ), j = 1, . . . , ` e si ha anche ¯ , allora si pu`o concludere che f ∈ H 1 (Ω) . che f ∈ C 0 (Ω) La definizione di H 1 (Ω) pu`o essere generalizzata per definire lo spazio di Sobolev H m (Ω), dove H m (Ω) := {f ∈ L2 (Ω)| Dα f ∈ L2 (Ω), |α| ≤ m} , (28) Pd α dove α = (α1 , . . . , αd ) ∈ INd `e un multiindice, |α| := i=1 αi e D f := |α| ∂ f m 1 2 α , e naturalmente si ha H (Ω) ⊂ · · · ⊂ H (Ω) ⊂ L (Ω) . Il prodotto α ∂x 1 ···x d 1 d scalare in H m (Ω) `e definito come segue, Z X (f , g) := Dα f Dα g dx Ω |α|≤m Seminorma e norma in H m (Ω) sono quindi rispettivamente definite come segue, 1/2 Z X |f |m := (Dα f )2 dx Ω |α|=m kf km Z := 1/2 X (Dα f )2 dx Ω |α|≤m 29 7.4 Traccia su ∂Ω di funzioni di H m (Ω) Se d > 1 e u ∈ H 1 (Ω), abbiamo visto che non necessariamente u `e continua in Ω. Occorre allora precisare cosa si intende per ”restrizione di u a ∂Ω”, supponendo comunque ∂Ω sufficientemente regolare. A tale scopo ci viene in aiuto il teorema di traccia che asserisce che, ∀m ≥ 1, esiste una e una sola applicazione lineare e continua γ0 : H m (Ω) → L2 (∂Ω) tale che, ∀v ∈ H m (Ω) ∩ C 0 (Ω) risulta γ0 (v) = v|∂Ω . La continuit`a di γ0 implica che esiste una costante C0 tale che, ∀u ∈ H m (Ω) si ha kγ0 (u)kL2 (∂Ω) ≤ C0 kukm . (29) Si noti che il risultato resta valido se si considera ΓD ⊂ ∂Ω, invece di ∂Ω, purch`e ΓD abbia misura non nulla. In tal caso usualmente si indica l’operatore di traccia con γΓD (operatore di traccia ristretta). Osservazione 5. L’operatore γΓD non `e suriettivo in L2 (ΓD ) . Si indica allora con H 1/2 (ΓD ), il sottospazio di L2 (ΓD ) definito come segue, H 1/2 (ΓD ) := {g ∈ L2 (ΓD ) | ∃v ∈ H 1 (Ω) : γΓD (v) = g} . Tale spazio ha propriet`a di regolarit`a intermedie fra quelle di H 1 (ΓD ) e di L2 (ΓD ) , essendo H 1 (ΓD ) ⊂ H 1/2 (ΓD ) ⊂ L2 (ΓD ) . Mediante l’operatore di traccia γ0 possiamo definire il seguente sottospazio di H 1 (Ω), H01 (Ω) := {v ∈ H 1 (Ω)| γ0 (v) = 0} (30) Nel caso quindi della formulazione debole del problema di Poisson o anche della sua generalizzazione considerata, la condizione di Dirichlet u|ΓD = gD deve essere intesa come γΓD (u) = gD , con gD dato assegnato tale che gD ∈ H 1/2 (ΓD ) . 8 Appendice B In questa sezione diamo la definizione di simplesso in IRd , introduciamo le coordinate baricentriche relative ad un simplesso fissato e utilizziamo queste grandezze per studiare il problema dell’interpolazione polinomiale bivariata. 30 8.1 Simplessi e coordinate baricentriche Dato un insieme di d + 1 punti Pi , i = 0, . . . , d appartenenti allo spazio affine E d associato a IRd , se non esiste alcul iperpiano di IRd cui essi appartengono, il loro inviluppo convesso (convex hull) dicesi simplesso di IRd del quale i punti Pi costituiscono i vertici. Nel caso d = 1 avremo quindi un segmento, nel caso d = 2 un triangolo e nel caso d = 3 un tetraedro. Fissato un simplesso K ⊂ E d , possiamo introdurre un nuovo sistema di coordinate dette coordinate baricentriche da esso indotte per individuare univocamente ciascun punto P ∈ E d . Se indichiamo sempre con P il vettore di IRd le cui componenti sono le d coordinate cartesiane di P in E d , la (d+1)– pla di reali Λ := (λ0 , . . . , λd ), tale che P= d X λi Pi , i=0 d X λi = 1 , i=0 definisce le coordinate baricentriche di P. Si ha quindi che le coordinate baricentriche di un punto del quale si conoscono le coordinate cartesiane si trovano risolvndo un sistema lineare di (d + 1) equazioni in altrettante incognite la cui matrice dei coefficienti A risulta effettivamente non singolare nell’ipotesi fatta che si abbia a che fare con un simplesso non degenere, essendo |det(A)| = |det([P1 − P0 , · · · , Pd − P0 ])| . In particolare quindi le coordinate baricentriche di Pi sono tutte nulle ad eccezione della i–esima che `e 1 mentre le coordinate baricentriche di punti sul segmento che congiunge Pi a Pj sono tutte nulle ad eccezione di λi e λj . Inoltre i punti interni a K sono tutti e soli quei punti di E d che hanno tutte le coordinate baricentriche positive. Le coordinate baricentrice hanno inoltre nei casi d = 2, 3 un’interessante interpretazione geometrica. Per d = 2 |λi | rappresenta infatti il rapporto fra l’area del triangolo avente come vertici P e i due vertici di K diversi da Pi e l’area di K. Analogamente per d = 3 essa rappresenta il rapporto fra i volumi del tetraedro avente per vertici P e i tre vertici di K diversi da Pi e il volume di K. 8.2 Interpolazione polinomiale bivariata Si osservi che, a differenza del caso monovariato, se in IR2 si prendono Dr punti distinti non `e detto che sia univocamente individuato il polinomio appartenente a Π2r che assume in questi punti dei valori assegnati. Si pensi per 31 esempio al caso lineare in cui D1 = 3 e come base si possono usare i monomi 1, x, y. Se si assegnano tre punti distinti tutti sull’asse x per esempio, avremo da risolvere un sistemino lineare 3 × 3 la cui matrice dei coefficienti `e singolare. Questo ci porta a definire unisolvente un insieme di Dr punti in IR2 per il quale esiste ed `e unico il polinomio di Π2r che interpola in essi una qualsiasi funzione (bivariata) continua (diciamo nella convex hull di tali punti). Si noti che se si prendono in un triangolo K i Dr punti distinti PJ , con J multiindice tale che |J| = r, aventi coordinate baricentriche Jr , si ottiene un insieme unisolvente in quanto `e possibile individuare una corrispondente base di Π2r lagrangiana, ossia Dr polinomi bivariati LI,r con I multiindice di modulo |I| = r, tali che LI,r (PJ ) = 0 se J 6= I e tali che LI,r (PI ) = 0 . Tali polinomi, sono detti appunto di Lagrange e, essendo per costruzione linearmente indipendenti, formano una base di Π2r . Vediamo come sono definiti per r = 1, 2, 3. r r r r r r = 1, = 2, = 2, = 3, = 3, = 3, I I I I I I = (1, 0, 0) = (2, 0, 0) = (1, 1, 0) , = (3, 0, 0) = (2, 1, 0) = (1, 1, 1) LI (Λ) LI (Λ) LI (Λ) LI (Λ) LI (Λ) LI (Λ) = λ0 , = λ0 (2λ0 − 1) , = 4λ0 λ1 , = 21 λ0 (3λ0 − 1)(3λ0 − 2) , = 29 λ0 λ2 (3λ0 − 1) , = 27λ0 λ1 λ2 . Ogni polinomio p ∈ Π2r si pu`o quindi rappresentare nella base di Lagrange come, X p(·) = pJ LJ,r (·) . |J|=r Se si vuole che il polinomio interpoli una funzione f nei punti PJ , |J| = r, si deve quindi prendere pJ = f (Pj ) . Chiameremo insieme di r–base sul triangolo K e indicheremo con Yr,K l’insieme dei suddetti Dr punti (aventi rispetto a K coordinate baricentriche Jr , |J| = r). References [1] S. C. Brenner, L. Ridgway Scott (1994), The mathematical theory of Finite Element Methods, Spriger Verlag, New York. 32 [2] A. Quarteroni (2008), Modellistica Numerica per Problemi Differenziali, quarta edizione, Springer–Verlag, Milano. [3] J. A. Cottrell, T. J. R. Hughes, Y. Bazilevs (2009), Isogeometric Analysis. Toward Integration of CAD and FEA, J. Wiley & Sons eds. 33
© Copyright 2025 Paperzz