Dispense CAN 13/14: terza parte

Introduzione ai metodi agli elementi finiti per
problemi differenziali ellittici
Alessandra Sestini
May 9, 2014
1
Introduzione
In queste note si indicher`a con Ω un dominio in IRd (aperto, non vuoto) che
assumeremo limitato e connesso, mentre si indicher`a con ∂Ω la sua frontiera.
2
2.1
Formulazione variazionale di un problema
differenziale ai limiti lineare
Un problema modello monodimensionale
In questo caso senza perdita di generalit`a possiamo assumere Ω = I := (0 , 1)
e siamo interessati a determinare una soluzione u dell’equazione differenziale
−u00 + σu = f in I ,
(1)
che verifichi anche delle condizioni assegnate agli estremi, dove f e σ sono
due funzioni assegnate, con σ ≥ 0 . In particolare le condizioni agli estremi
possono essere di Dirichlet,
u(0) = g0 , u(1) = g1 ,
(2)
u0 (0) = g00 , u0 (1) = g10 .
(3)
u(0) = g0 , u0 (1) = g10 .
(4)
di Neumann
o miste,
1
Si noti che l’ipotesi σ ≥ 0 garantisce l’unicit`a della soluzione purch`e si evitino
le condizioni di Neumann quando σ ≡ 0 . Per dimostrare questo (riferendoci
qui esplicitamente al problema di Dirichlet) basta far vedere che, se z `e tale
che −z 00 + σz = 0 e z(0) = z(1) = 0 , allora risulta z ≡ 0 . Questo si vede
subito moltiplicando ambo i membri dell’equazione differenziale per z stesso
e integrando in I . Infatti, integrando per parti, si ottiene che
Z 1
Z 1
0 2
σ(x) z 2 (x)dx = 0 ,
(z ) (x)dx +
0
0
la quale, anche se fosse se σ ≡ 0, considerando che deve essere z(0) = z(1) =
0, implica che z ≡ 0 .
Osserviamo poi che condizioni agli estremi non omogenee possono essere
sostituite dalle analoghe omogenee senza perdita di generalit`a. Infatti basta
considerare il problema differenziale verificato da uˆ := u − Rg dove Rg `e
un polinomio di grado 1 (2 per le Neumann pure) che dicesi rilevamento
dei dati sul bordo in quanto verifica le condizioni agli estremi, per esempio
Rg (x) := g0 (1 − x) + g1 x nel caso di condizioni di Dirichelet e,
−ˆ
u00 + σˆ
u = (f − σRg ) in I
Per quanto riguarda la regolarit`a, si osservi che, se f , σ ∈ C k [0 , 1] , allora
u ∈ C k+2 ([0 , 1]) . Siamo per`o interessati a risolvere il problema differenziale
anche in ipotesi di minore regolarit`a dei dati, richiedendo in particolare solo
che f ∈ L2 (I) e che σ ∈ L∞ (I) e quindi lo riformuliamo in forma debole
andando a moltiplicare l’equazione differenziale in (1) per una funzione test
v ∈ V (spazio funzionale di Hilbert opportuno) e integrando per parti in
modo da ottenere
Z 1
Z 1
0
0
0
1
−[u v]|0 +
(u (x)v (x) + σ(x)u(x)v(x)) dx =
f (x)v(x)dx , ∀v ∈ V .
0
0
Di fatto, riferendoci al caso di dati agli estremi omogenei, siamo interessati a
scegliere V in modo che gli integrali che appaiono nella suddetta formula siano
tutti finitamente calcolabili e anche in modo che sparisca il primo addendo
a sinistra del segno di uguaglianza. Se stiamo considerando il problema di
Dirichlet, si sceglie allora V = H01 (Ω) e si va a risolvere il seguente problema
variazionale,
Z 1
Z 1
0 0
trovare u ∈ V |
(u v + σuv) dx =
v f dx , ∀v ∈ V .
(5)
0
0
2
Nel caso del problema di Neumann (con σ 6= 0), si pu`o invece semplicemente
assumere V = H 1 (Ω) mentre nel caso del problema misto si usa V = {v ∈
H 1 (Ω) | v(a) = 0} . Si osservi il diverso trattamento di condizioni di Dirichlet
e di condizioni di Neumann ma anche che in ogni caso V risulta essere un
sottospazio dello spazio di Hilbert H 1 (Ω).
Osserviamo che, nelle sole ipotesi che f ∈ L2 (I) e che σ ∈ L∞ (I), si pu`o
comunque dimostrare che u ∈ H 2 (I) . Integrando allora per parti (in senso
contrario a quanto fatto prima), si verifica allora che in questo caso quello
che si pu`o dire `e che la soluzione del problema variazionale (5) verifica le
condizioni omogeneee assegnate agli estremi e risolve l’equazione differenziale
in senso variazionale, ossia si ha che
Z 1
(−u00 + σu − f ) v dx = 0 , ∀v ∈ V .
(6)
0
Infatti se si integra per parti il primo addendo dell’integrale a sinistra in (5)
si ottiene che
Z 1
0 1
u v|0 −
(u00 − σ u + f ) v dx = 0 , ∀v ∈ V .
(7)
0
Se quindi v ∈ V = H01 (I) (7) risulta sicuramente verificata e quindi ha
senso dire che la soluzione del problema variazionale per il caso di Dirichlet
omogeneo `e soluzione debole del problema differenziale ai limiti assegnato.
La cosa pu`o in effetti essere generalizzata anche al caso in cui si considerino
condizioni ai limiti omogenee miste o di Neumann. Riferendoci per esempio
al problema misto, questo significa che bisogna prima far vedere che u0 (1) =
0 (utilizzare a tale scopo una funzione test v polinomiale tale che v(1) 6=
0, v(0) = 0 e tale che l’integrale in (7) si annulli). La seguente proposizione
completa quanto ora asserito.
Proposizione 1. Supponiamo che f , σ ∈ C 0 [0 , 1], e che u ∈ C 2 [0 , 1],
sia la corrispondente soluzione del problema variazionale in (5) per il caso
omogeneo misto. Allora si ha che u `e soluzione del corrsipondente problema
differenziale (soluzione forte).
Dimostrazione : Dobbiamo far vedere che in I risulta u00 − σu + f = 0
e che u0 (1) = 0 in quanto gi`a si sa che u(0) = 0 per come `e definito V.
Ora utilizzando l’integrazione per parti in senso inverso, dalla formulazione
variazionale si ottiene la (7). Se per assurdo non fosse w := u00 − σu + f = 0
3
in I, trattandosi di una funzione continua esisterebbe [c , d] ⊂ [0 , 1] tale che
w ha in [c , d] segno costante non nullo. Posto allora
(x − c)2 (d − x)2 , se x ∈ [c , d] ,
v(x) =
0,
altrimenti ,
R1
essendo v ∈ V e tale che v(0) = 0, avremmo che 0 wv dx = 0 , il che `e assurdo
in quanto in [c , d] si ha che wv ha segno costante non nullo e fuori da tale
sottointervallo `e nulla. Quindi dobbiamo concludere che w = 0 in I che a
sua volta implica che la (7) diventa semplicemente u0 (1)v(1) = 0, ∀v ∈ V, da
cui segue che u0 (1) = 0 .
Il problema variazionale (5) pu`o essere formalmente riscritto come segue,
trovare u ∈ V | a(u, v) = F (v) , ∀v ∈ V ,
(8)
dove a : V × V → IR `e la seguente forma bilineare (simmetrica),
Z 1
a(u, v) :=
(u0 v 0 + σuv) dx ,
0
e F : V → IR `e il seguente seguente funzionale lineare,
Z 1
v f dx .
F (v) :=
0
La formulazione (8) dicesi formulazione astratta del problema differenziale in forma debole. Ora risulta essere un risultato importante di analisi
funzionale il cosiddetto Lemma di Lax–Milgram che asserisce che se la forma
bilineare a `e continua e coerciva nello spazio di Hilbert V , ossia esistono due
costanti C ≥ α > 0 tali che, ∀u, v ∈ V risulta
|a(u, v)| ≤ Ckuk1 kvk1 , e |a(u, u)| ≥ αkuk21 ,
e il funzionale lineare F `e limitato ( il che significa che esiste una costante K >
0 tale che, ∀v ∈ V risulta |F (v)| ≤ Kkvk1 ) allora il problema variazionale
(8) ammette una e una sola soluzione. Anche nel caso pluridimensionale
che considereremo nel seguito saremo quindi interessati a poter riscrivere
formalmente la formulazione debole del problema differenziale considerato in
questa forma, in modo da avvalerci di questo importante Lemma.
4
Le ipotesi di regolarit`a assunte per f e per σ consentono di verificare
agevolmente la continuit`a della forma a e la limitatezza di F mentre la coercivit`a nel caso in cui si consideri il problema di Dirichlet e non esista una
costante σ0 > 0 tale che σ ≥ σ0 quasi ovunque in Ω, richiede l’uso della
cosiddetta disuguaglainza di Poincar´e valida appunto in H01 (Ω),
kvkL2 (Ω) ≤ CΩ |v|1 ∀v ∈ H01 (Ω) ,
(9)
dove CΩ `e una costante che dipende solo dal dominio. Da questa disuguaglianza possiamo infatti dedurre che `e anche kvk1 ≤ (1 + CΩ )|v|1 la quale
quindi implica che
|a(u, u)| ≥ |u|21 ≥
1
kuk21 .
(1 + CΩ )2
In tutti gli altri casi si dimostra la coercivit`a di a solo sotto l’ipotesi
aggiuntiva che esista una costante σ0 > 0 tale che σ > σ0 quasi ovunque in
Ω.
2.2
Caso bidimensionale: problema di Poisson
Consideriamo sul dominio limitato e connesso Ω ⊂ IR2 il seguente problema
detto di Poisson

 −4u = f , in Ω ,
u
= gD in ΓD ,
(10)
 ∂u
= gN in ΓN ,
∂n
◦
◦
dove ∂Ω = ΓD ∪ ΓN , ΓD ∩ ΓN = ∅, e dove gD , gN sono i dati assegnati sul
bordo e f `e una funzione assegnata definita su Ω. Se ΓN = ∅ o ΓD = ∅ il
problema `e detto rispettivamente di Dirichlet o di Neumann, mentre nel caso
generale `e detto problema con condizioni miste. Notiamo che il problema di
Neumann non ha unicit`a di soluzione in quanto se si aggiunge una costante ad
una soluzione si ottiene sempre una soluzione e che inoltre occorre assumere
la seguente condizione di compatibilit`a sui dati,
Z
Z
−
gN dγ =
f (x) dx ,
∂Ω
Ω
che deriva dal teorema della divergenza considerando che 4u = ∇·(∇u) . Allo
scopo di assicurare unicit`a di soluzione e di non aver bisogno di condizioni
5
di compatibilit`a sui dati, nel seguito consideremo soltanto il problema di
Dirichlet o il problema misto.
Osserviamo che, anche se f ∈ C 0 (Ω) e gD ∈ C 2 (ΓD ), gN ∈ C 1 (ΓN ), non
`e detto che u ∈ C 2 (Ω). Se per esempio Ω = (0 , 1)2 , ΓN = ∅ e si scelgono
gD nulla e f costante e uguale a 1, si verifica facilmente che, mentre in Ω il
laplaciano di u deve essere −1, si ha che esso nei quattro corner del dominio
deve annullarsi. In generale quindi, anche se i dati sono super regolari come
in questo esempio, dovremo accontentarci di cercare u in C 0 (Ω) ∩ C 2 (Ω).
Tuttavia siamo interessati a risolvere il problema anche in ipotesi di minor
regolarit`a dei dati e quindi dobbiamo dapprima intenderlo in forma variazionale in modo che abbia senso assumere f ∈ L2 (Ω). Per quanto riguarda
la regolarit`a della soluzione si tenga comunque presente che, anche supponendo di avere condizioni al contorno di Dirichlet omogenee, a differenza di
quanto detto per il caso monodimensio- nale, se f ∈ L2 (Ω) non `e detto che
esista u ∈ H 2 (Ω) tale che in senso variazionale risulti −4u = f. Infatti `e
stato dimostrato che una tale u ∈ H 2 (Ω) esiste solo se ∂Ω `e sufficientemente
regolare, il che significa o che si tratta di una curva chiusa regolare (quindi
senza spigoli o cuspidi) o di una poligonale chiusa tale che Ω risulti convesso.
In questi casi si dimostra anzi che
f ∈ H s (Ω) ⇒ u ∈ H s+2 (Ω) e kukH s+2 (Ω) ≤ Ckf kH s (Ω) .
Si noti che comunque per il problema misto, anche quando ∂Ω `e regolare,
non vale pi`
u il suddetto risultato, si pu`o avere cio`e una perdita di regolarit`a.
Per tutti questi motivi, siamo allora interessati a risolvere il problema differenziale in senso debole ricercandone la soluzione in H 1 (Ω).
Prima di considerare la forma debole del problema misto generale, consideriamo il caso particolare in cui ΓN = ∅ e gD = 0 (problema di Dirichlet
omogeneo), con f ∈ L2 (Ω). Osserviamo che, supponendo che gli integrali
coinvolti siano calcolabili, dalla (10) deriva che
Z
Z
−
v 4u dx =
v f dx .
Ω
Ω
Dal teorema della divergenza, considerando che v4u = ∇ · (v∇u) − ∇u · ∇v ,
si ha quindi
Z
Z
Z
∂u
dγ =
v f dx .
(11)
∇u · ∇v dx −
v
Ω
Ω
∂Ω ∂n
6
Poich´e vogliamo ricercare la funzione u nello stesso spazio funzionale V dove
prendiamo le funzioni test v, tenendo presente le condizioni di Dirichlet omogenee, scegliamo V = H01 (Ω) e quindi otteniamo la seguente formulazione,
Z
Z
trovare u ∈ V |
∇u · ∇v dx =
v f dx ∀v ∈ V .
(12)
Ω
Ω
Notiamo che la suddetta formulazione pu`o essere anche scritta in modo astratto come in (8), dove ora, a : V × V → IR `e la seguente forma bilineare,
Z
a(u, v) :=
∇u · ∇v dx ,
Ω
e F : V → IR `e il seguente seguente funzionale lineare,
Z
F (v) :=
v f dx .
Ω
Verificare che la Rforma a `e continua `e semplice.
a(u, v) =< u, v >1 − Ω uv dx , si ha che
Infatti, essendo
|a(u, v)| ≤ kuk1 kvk1 + kukL2 (Ω) kvkL2 (Ω) ≤ 2kuk1 kvk1 .
Anche verificare che il funzionale F risulta limitato `e semplice. Infatti, usando la disuguaglianza di Cauchy-Schwarz in L2 (Ω), si ottiene che
|F (v)| ≤ kf kL2 (Ω) kvkL2 (Ω) ≤ kf kL2 (Ω) kvk1 .
Per verificare la coercivit`a di a invece abbiamo bisogno di ricordare la validit`a
della disuguaglianza di Poincar´e riportata in (9).
Dal Lemma di Lax–Milgram possiamo quindi concludere che anche in
questo caso esiste ed `e unica la soluzione del problema (8).
Se consideriamo il problema di Dirichlet non omogeneo o pi`
u in generale
il problema misto, dalla (11) arriveremmo alla seguente formulazione,
Z
Z
Z
trovare u ∈ VD |
∇u · ∇v dx =
vgN dγ + v f dx ∀v ∈ V ,
Ω
ΓN
Ω
dove
V := HΓ1D := {v ∈ H 1 (Ω) | v|ΓD = 0} ,
e dove
VD := {v ∈ H 1 (Ω) | v|ΓD = gD } .
7
(13)
Circa la regolarit`a dei dati, si richiede sempre che f ∈ L2 (Ω), che gn ∈ L2 (ΓN )
e che gD sia ”sufficientemente regolare” in ΓD . Si noti che u|ΓD e v|ΓD devono
essere in generale intese nel senso della traccia (vedi appendice).
Tuttavia non siamo soddisfatti di questa formulazione in quanto, per usare
Lax-Milgram, abbiamo bisogno che le funzioni test v e la funzione ricercata u
appartengano allo stesso spazio di Hilbert (si osservi che VgD non `e neanche
uno sottospazio di H 1 (Ω)). Allora definiamo
uˆ := u − Rg ,
dove Rg `e una funzione di H 1 (Ω), detta rilevamento del dato di Dirichlet al
bordo , che ha gD come traccia su ΓD , ossia tale che γΓD (Rg ) = gD e quindi
si ha γΓD (ˆ
u) = 0 (che per brevit`a scriveremo semplicemente uˆ|ΓD = 0) 1 .
Riformuliamo quindi il problema debole in termini di uˆ,
Z
Z
Z
trovare uˆ ∈ V |
∇ˆ
u · ∇v dx =
vgN dγ+ (v f − ∇v · ∇Rg ) dx , ∀v ∈ V,
Ω
ΓN
Ω
dove V `e sempre definito come in (13) ed `e quindi un sottospazio di H 1 (Ω).
Il problema debole `e quindo sempre scrivibile formalmente come in (8), dove
la forma bilineare `e sempre la stessa considerata per il problema di Dirichlet
omogeneo e il funzionale lineare F `e ora definito come segue,
Z
Z
F (v) :=
v f dx +
vgN dγ − a(v, Rg ) .
Ω
ΓN
Si noti che dalla propriet`a in (29) dell’operatore di traccia discende che anche
questo funzionale `e limitato. Infatti
||F (v)| ≤
kf kL2 (Ω) kvkL2 (Ω) + kv|ΓN kL2 (ΓN ) kgN kL2 (ΓN ) + kRg k1 kvk1 ≤
(kf kL2 (Ω) + C0 kgN kL2 (ΓN ) + kRg k1 ) kvk1
Osservazione 1. Nel problema misto le condizioni di Neumann vengono
dette naturali in quanto appaiono esplicitamente nella formulazione del problema variazionale mentre quelle di Dirichlet sono dette essenziali in quanto
concorrono alla determinazione dello spazio funzionale di Hilbert V nel quale
il problema differenziale viene formulato in forma debole. Nel caso del problema puro di Dirichlet, omogeneo e non, V = H01 (Ω).
1
Si noti che, per assicurare l’esistenza di Rg , dobbiamo assumere che gD ∈ H 1/2 (ΓD ) ⊂
L (ΓD ) (vedi appendice).
2
8
Osservazione 2. Costruire un rilevamento Rg del dato di Dirichlet gD pu`o
in effetti non essere semplice. Tale compito risulter`a per`o molto pi`
u semplice
nell’ambito dell’approssimazione numerica, dove si costruisce soltanto un rilevamento di un’approssimazione di gD .
Osservazione 3. La forma bilineare associata alla formulazione debole di
un problema di Poisson risulta anche simmetrica. Ci`o sar`a utile in fase di
risoluzione numerica.
2.3
Un problema bidimensionale pi`
u generale
Consideriamo ora il seguente problema

 −∇ · (µ ∇u) + σu = f , in Ω ,
u
= gD in ΓD ,
 ∂u
= gN in ΓN ,
µ ∂n
(14)
dove, al solito gD e gN sono i dati assegnati sul bordo, rispettivamente di
Dirichlet e di Neumann, f ∈ L2 (Ω) e dove µ , σ ∈ L∞ (Ω) sono anch’esse
funzioni assegnate con µ(x) ≥ µ0 > 0 e σ(x) ≥ σ0 > 0 q.o. in Ω. Notiamo
che l’ipotesi su σ garantisce l’unicit`a della soluzione anche per il problema di
Neumann puro in questo caso. Circa la regolarit`a dei dati sul bordo, come
per Poisson si richiede che gN ∈ L2 (ΓN ) e che gD sia in ΓD un po’ pi`
u regolare
(vedi quanto detto nella sottosezione precedente).
Per arrivare alla formulazione debole di questo problema si procede come
prima moltiplicando ambo i membri dell’equazione differenziale per la funzone test v e utilizzando quindi il teorema della divergenza. Si ottiene quindi,
Z
Z
Z
∂u
dγ =
v f dx ,
(µ ∇u · ∇v + σ u v) dx −
vµ
∂n
Ω
Ω
∂Ω
che riscriviamo scindendo ΓD da ΓN ,
Z
Z
Z
Z
∂u
(µ ∇u · ∇v + σ u v) dx −
vµ
dγ =
v f dx , +
v gN dγ .
∂n
Ω
ΓD
Ω
ΓN
Al solito poniamo poi uˆ := u − RgD e riscriviamo formalmente il problema
come in (8) in termini della funzione incognita uˆ, dove lo spazio di Hilbert
in cui si lavora `e sempre il V definito in (13) e ora
R
a(u, v) := Ω (µ ∇u · ∇v + σ u v) dx ,
F (v)
:=
R
v f dx +
Ω
R
9
ΓN
v gN dγ − a(Rg , v) .
Si tratta quindi di determinare uˆ ∈ V tale che a(ˆ
u, v) = F (v) , ∀v ∈ V .
La forma bilineare a cos`ı modificata `e ancora continua e coerciva grazie alle
ipotesi assunte sulle funzioni µ e σ. Infatti, indicando con µM e σM due
costanti positive che rispettivamente maggiorano q.o. in Ω le funzioni µ e σ,
si ha
|a(u, v)| ≤ µM | < u, v >1 +kukL2 (Ω) | kvkL2 (Ω) | + σM kukL2 (Ω) kvkL2 (Ω) ≤
(2µM + σM ) kuk1 kvk1 .
Inoltre si ha
a(u, u) ≥ µ0 |u|21 + σ0 kuk2L2 (Ω) ≥ min{µ0 , σ0 } kuk21 .
Il funzionale F `e ovviamente ancora lineare ed esso `e pure limitato essendo,
grazie a (29),
||F (v)| ≤
kf kL2 (Ω) kvkL2 (Ω) + kv|ΓN kL2 (ΓN ) kgN kL2 (ΓN ) + (µ
M + σM ) kRg k1 kvk1 ≤
kf kL2 (Ω) + C0 kgN kL2 (ΓN ) + (2µM + σM ) kRg k1 kvk1 .
Si conclude quindi che sotto le ipotesi assunte per le funzioni µ e σ anche la
forma debole di questo problema ammette una e una sola soluzione.
Osservazione 4. Quando la forma a `e continua e corciva sulla spazio di
Hilbert V e il funzionale F `e ivi lineare e limitato, l’unica soluzione u del
problema astratto (8) verifica la seguente disuguaglianza,
kukV ≤
1
kF kV 0 .
α
(15)
Infatti si ha αkuk2V ≤ a(u, u) = F (u) ≤ |F (u)| ≤ kF kV 0 kukV .
3
Metodo di Galerkin
Numericamente ci accontentiamo di determinare un’approssimazione uh ∈ Vh
della soluzione u ∈ V del problema debole (8), dove Vh `e un sottospazio di
V di dimensione finita Nh + 1. Notiamo che qui h rappresenta uno scalare
positivo tale che, quando h → 0, si ha che corrispondentemente Nh → +∞.
Naturalmente la cosa ha un senso se innanzi tutto l’approssimazione uh esiste
ed `e unica per ogni h fissato e inoltre risulta che uh → u quando h tende a 0.
10
Nel metodo di Galerkin, fissato il sottospazio Vh di V, uh viene determinata
come soluzone del seguente problema,
trovare uh ∈ Vh | a(uh , vh ) = F (vh ) ∀vh ∈ Vh ,
(16)
Notiamo che, essendo Vh un sottospazio di V, anch’esso `e uno spazio di Hilbert
rispetto al prodotto scalare definito in V e quindi si pu`o ancora utilizzare il
lemma di Lax-Milgram per concludere che esiste ed `e unica anche la soluzione
uh ∈ Vh di (16). Al fine di determinare costruttivamente uh , osserviamo che,
se {ϕj (·), j = 0, . . . , Nh } definisce una base per Vh , si ha che (16) `e verificato
sse si ha che
a(uh , ϕi ) = F (ϕi ) , ∀ϕi , i = 0, . . . , Nh .
Ponendo allora uh (·) =
Nh
X
uj ϕj (·) si ottiene che deve essere
j=0
Nh
X
uj a(ϕj , ϕi ) = F (ϕi ) , i = 0, . . . , Nh .
j=0
Queste Nh = 1 condizioni, essendo lineari nelle atrettante incognite uj , j =
0, . . . , Nh , possono essere quindi compattamente riscritte come il seguente sistema lineare quadrato,
Au = f ,
(17)
dove si `e posto , u := (u0 , · · · , uNh )T , f := (F (ϕ0 ), · · · , F (ϕNh ))T , e dove
Ai,j := (a(ϕj , ϕi )) . La matrice A dicesi matrice di rigidezza o anche matrice
di stiffness mentre il vettore f dicesi vettore di carico. Riguardo alla matrice
A si noti che, essendo la forma a coerciva, segue che A `e definita positiva, ossia
∀x ∈ IRn con x 6= 0, risulta xT Ax > 0 . Infatti, tenendo in considerazione
T
come `e definita A e la bilinearit`
PNah della forma a, si ottieneT che x Ax =2
a(wh , wh ), dove si `e posto wh = j=1 xj ϕj . Segue quindi che x Ax ≥ αkwh k1
con α > 0 (coefficiente di coercivit`a) e wh 6= 0. Le definita positivit`a assicura
quindi effettivamente l’esistenza e l’unicit`a della soluzione uh . Se poi la forma
bilineare a `e anche simmetrica, come accade per i problemi ellittici esaminati,
la A risulta essere sdp e quindi ci si pu`o avvantaggiare di ci`o per la risoluzione
del sistema lineare in (17).
Osserviamo che (8) e (16) implicano la seguente propriet`a di ortogonalit`a
della differenza u − uh rispetto allo spazio Vh ,
a(u − uh , vh ) = 0 , ∀vh ∈ Vh .
11
Inoltre, analogamente a quanto fatto per ottenere la disuguaglianza (15), si
pu`o dimostrare che la norma di uh rimane limitata superiormente al tendere
di h a zero in quanto
1
kuh kV ≤ kF kV 0 .
α
Dimostriamo ora il seguente importante risultato,
Teorema 1. La soluzione uh di (16) verifica la seguente disuguaglianza,
ku − uh kV ≤
M
infvh ∈Vh ku − vh kV , ∀vh ∈ Vh ,
α
dove u `e la soluzione di (8) e α e M sono rispettivamente le costanti di
coercivit`a e di continuit`a della forma bilineare a.
Dimostrazione : Osserviamo innanzi tutto che αku − uh k2V ≤ a(u − uh , u −
uh ) = a(u − uh , u − vh ) + a(u − uh , vh − uh ), ∀vh ∈ Vh . Ma, per la propriet`a
di ortogonalit`a di u − uh , il secondo addendo `e zero. Quindi, dalla continuit`a
di a si deduce che αku − uh k2V ≤ M ku − uh kV ku − vh kV , da cui discende la
tesi.
L’importanza di questo risultato `e insita nel fatto che se nello spazio Vh
al tendere di h a zero si approssima sempre meglio u ∈ V (il che significa
che l’inf a destra nella suddetta disuguaglianza tende a zero), allora anche
l’errore di approssimazione ku − uh kV tender`a a zero e avremo che l’ordine
di approssimazione (infinitesimo rispetto a h) con cui uh approssima u sar`a
analogo a quello della migliore approssimazione di u in Vh .
4
Il metodo degli elementi finiti
Come abbiamo visto nel paragrafo precedente, per completare la risoluzione
numerica di un problema ellittico in forma debole utilizzando Galerkin, abbiamo bisogno di fissare lo spazio Vh e di scegliere una base in esso. Vediamo
in questa sezione come questo viene fatto utilizzando il metodo degli elementi
finiti, riferendoci in particolare ad elementi finiti cosiddetti lagrangiani. Ci
occuperemo esplicitamente solo del caso 1D e del caso 2D.
12
4.1
Caso 1D: scelta di Vh e delle basi
Assumiamo quindi qui Ω = I = (a , b) ⊂ IR e ricordiamo che in tal caso
¯ . Fissata una partizione ∆h di (a , b), ossia un insieme
si ha H 1 (I) ⊂ C 0 (I)
di ascisse xi , i = 0, . . . , N tali che a = x0 < x1 < · · · < xN −1 < xN = b ,
poniamo Ii := (xi−1 , xi ) , hi := xi − xi−1 , i = 1, . . . , N e
h := max hi .
i=1,...,N
Con questa notazione, nel metodo degli elementi finiti, fissato r > 0 ∈ IN ,
si sceglie Vh come segue,
Vh := {vh ∈ Xhr | vh verifica le cond. di Diric. omogenee assegnate} ,
dove Xhr indica lo spazio delle splines generalizzate di grado r definite
sulla partizione ∆h e che nei nodi devono solo essere continue,
Xhr := {vh ∈ C 0 ([a , b]) | vh |Ik ∈ Πr , k = 1, . . . , N } .
Come sappiamo tale spazio ha dimensione N (r + 1) − (N − 1) = N r + 1 e
effettivamente esso costituisce una scelta ammissibile in quanto Xhr ⊂ H 1 (Ω) .
Infatti ogni funzione vh ∈ Xhr `e continua in [a , b] ed `e tale che vh0 ∈ L2 (I),
essendo vh0 ∈ C(Ik ), k = 1, . . . , N e con un salto finito in ciascun nodo interno.
Naturalmente in questo spazio potremmo usare la base delle B-splines
definita usando il vettore esteso dei nodi (introducendo quindi nodi interni
multipli tutti con molteplicit`a r). Facendo per`o qui riferimento all’implementazione pi`
u comune del metodo degli elementi finiti, andremo ad utilizzare
una base diversa, per definire la quale introduciamo la seguente partizione
allargata Y ⊃ ∆ di (a , b) ,
N
Y := ∪ yi,k , con yi,k := xk−1 + i
k=1
hk
, i = 0, . . . , r , (num. locale)
r
dove hk = xk − xk−1 . Si osservi che la partizione allargata Y `e ottenuta
aggiungendo a ∆ altre (r − 1) ascisse equispaziate a distanza hk /r in ogni
sottointervallo Ik . Si osservi inoltre che ]Y = N r+1 e che nel caso particolare
r = 1 si ha che Y = ∆ . Come si diceva, la partizione Y viene utilizzata per
definire una base {ϕi , i = 0, . . . , N r} lagrangiana di Xhr , ossia tale che
ϕi (yj ) = δi,j , i, j = 0, . . . , N r ,
13
(18)
dove δij indica il δ di Kronecker. e dove le ascisse di Y sono state rinumerate
globalmente, ossia si `e posto
yj
:= yi,k , k := 1 + b rj c , i := j + r − rk , j = 0, . . . , N r − 1 ,
yN r := yr,N (num. globale) .
(19)
Queste funzioni, grazie a (18), risultano essere sicuramente linearmente indipendenti. Inoltre esse si determinano facilmente utilizzando la loro rappresentazione polinomiale a tratti. Infatti φj deve essere identicamente nulla
in I¯k se yj ∈
/ I¯k mentre, se yj ∈ I¯k e in particolare si ha yj = yi,k , essa deve
necessariamente coincidere con il polinomio di Lagrange definito utilizzando
le r + 1 ascisse ys,k , s = 0, . . . , r . Se quindi yj ∈ Y \ ∆, la corrispondente
ϕj sar`a diversa da zero solo in quel sottointervallo Ik cui appartiene yj . Se
invece yj ∈ ∆, allora essa sar`a diversa da zero in quei due sottointervalli contigui che condividono yj come estremo (ad eccezione naturalmente del caso
y0 = x0 = a e yN r = xN = b).
Per capire meglio come sono definite queste funzioni, analizziamo in dettaglio i casi r = 1 e r = 2. Se r = 1 abbiamo detto che Y = ∆ e quindi
avremo che ϕi sar`a la funzione continua lineare a tratti sulla partizione ∆
(spline classica) che vale 1 in xi e che vale 0 in tutti gli altri punti della
partizione ∆ il cui grafico `e quello della funzione a tettuccio con supporto
[xi−1 , xi+1 ]. Essa `e quindi definibile a tratti come segue,
 x−x
i−1

 xi −xi−1 se x ∈ [xi−1 , xi ) ,
xi+1 −x
ϕi (x) :=
se x ∈ [xi , xi+1 ) ,
x
−x

 0i+1
altrimenti .
In questo caso quindi tutte le funzioni di base (escluse la prima e l’ultima)
hanno come supporto due sottointervalli consecutivi.
Se invece r = 2, si ha che, quando j = 2k − 1 (dispari), ϕj `e diversa da
zero solo in Ik e risulta definibile a tratti come segue,
(
(x−yj−1 )(x−yj+1 )
se x ∈ [xk−1 , xk ) ,
(yj −yj−1 )((yj −yj+1 )
j = 2k − 1 (dispari) .
ϕj (x) :=
0
altrimenti .
Quando invece j = 2k (pari), si ha che ϕj `e diversa da zero sia in Ik che in
14
Ik+1 e essa risulta definibile a tratti
 (x−y )(x−y )
j−2
j−1

 (yj −yj−2 )((yj −yj−1 )
(x−yj+1 )(x−yj+2 )
ϕj (x) :=
(yj −yj+1 )((yj −yj+2 )


0
come segue,
se x ∈ [xk−1 , xk ) ,
se x ∈ [xk , xk+1 ) ,
altrimenti .
j = 2k (pari) .
In generale, per come `e definita la numerazione globale si ha che, se
yj = yi,k con j non multiplo di r, allora ϕj 6= 0 nel solo sottointervallo Ik e
risulta
(k)
ϕj |Ik = Li,r ,
(k)
dove Li,r indica l’ i–esimo polinomio di Lagrange di grado r definito usando
le ascisse (uniformi) di Y appartenenti ad Ik . Se invece j `e multiplo di r, essa
risulta non nulla sia in Ik , con k definito come in (19), che nel precedente
(k)
(k−1)
sottointervallo, con ϕj |Ik = L0,r e ϕj |Ik−1 = Lr,r .
Ora, se per ogni sottointervallo Ik si definisce il mapping lineare x =
mk (ξ) : [0 , 1] → Ik ,
mk (ξ) = xk−1 + ξhk ,
si ha che
(k)
Lj,r (x) = `j,r (ξ) ,
avendo indicato con `j,r (ξ), j = 0, . . . , r i polinomi di Lagrange di grado r e
nodi 0 = ξ0 < ξ1 < · · · < ξr−1 < ξr = 1 con ξj = j/r, j = 0, . . . , r, ossia
r
Y
rξ − i
`j,r (ξ) =
, j = 0, . . . , r .
j−i
i=0,i6=j
Facendo allora riferimento al problema ellittico considerato in Sezione 2.1,
avremo quindi per la matrice di rigidezza che
N Z
X
Ai,j =
ϕ0j (x) ϕ0i (x) + σ(x)ϕj (x) ϕi (x) dx i, j = 1, . . . , N r + 1.
k=1
Ik
Si osservi innanzi tutto che A `e simmetrica, il che implica che si possono
sostanzialmente dimezzare i calcoli supponendo per esempio i ≥ j. L’assemblaggio della matrice A comunque viene usualmente fatto element–by–element:
inizializzata A a zero, per ogni sottointervallo Ik si calcolano tutti gli integrali
Z
k
Ii,j :=
ϕ0j (x) ϕ0i (x) + σ(x)ϕj (x) ϕi (x) dx ,
Ik
15
che sono non nulli ossia per quelle coppie di indici i e j tali che esistono dei
corrispondenti indici 0 ≤ si ≤ r e 0 ≤ sj ≤ r tali che yi = ysi ,k e yj = ysj ,k
(limitandosi per la simmetria a quelli per cui si ≥ sj ). Si tratta quindi in
tutto di (r + 2)(r + 1)/2 integrali da calcolare su ogni Ik . Utilizzando la
sostituzione lineare x = mk (ξ), per ciascuno di tali sottointervalli si ha che
k
Ii,j
=
1
I1 (sj , si ) + hk I0k (sj , si ) ,
hk
dove, per s1 , s2 = 0, . . . , r, si pone
R1
I1 (s1 , s2 ) := 0 `0s1 ,r (ξ) `0s2 ,r (ξ) dξ ,
R1
I0k (s1 , s2 ) := 0 σ(mk (ξ)) `s1 ,r (ξ) `s2 ,r (ξ) dξ .
Osserviamo per`o che solo I1 (s1 , s2 ) non dipende dall’intervallo Ik e il
suo calcolo consiste nel calcolo dell’integrale di un polinomio. Il calcolo di
I0k (s1 , s2 ) richiede invece in generale l’uso di formule di quadratura.
Anche il vettore di carico f viene assemblato procedendo element–by–
element e tale assemblaggio richiede su ogni sottointervallo Ik il calcolo delle
seguenti quantit`a,
Z 1
k
If (s1 ) := hk
f (mk (ξ)) `si ,r (ξ) dξ , s1 = 0, . . . , r ,
0
dove Ifk (si ) deve essere accumulata in f (i), essendo yi = ysi ,k .
4.2
Caso 1D: convergenza di uh a u
Naturalmente la scelta dello spazio Vh risulta adeguata solo se
infvh ∈Vh ku − vh kV → 0 ,
quando h → 0 ,
dove u ∈ V ⊆ H 1 (Ω) `e la soluzione di (8) che, nelle ipotesi assunte per f
e per σ sappiamo in effetti appartenere almeno ad H 2 (I). Dobbiamo quindi
fare vedere che questo `e vero se si sceglie Vh coincidente con lo spazio delle
splines generalizzate Xhr considerato nella sezione precedente. Ci`o si dimostra
facendo vedere che
lim ku − Phr k1 = 0 ,
h→0
16
dove Phr indica la funzione di Xhr che interpola u nell’insieme delle ascisse
prima indicato con Y. Infatti si ha che
infvh ∈Vh ku − vh kV ≤ ku − Phr k1 .
Si noti che u ∈ C 0 [a , b] e che l’interpolante Phr ∈ Xhr `e univocamente definita.
Per come `e definito Xhr si ha che Phr | Ik risulta essere il polinomio di grado r
che interpola u sulle r + 1 ascisse equispaziate yi,k , i = 0, . . . , r appartenenti
a Ik , ossia
r
X
(k)
r
Ph (x) =
u(yi,k ) Li,r (x) , ∀x ∈ Ik .
i=0
Avendo i polinomi di Lagrange somma costante uguale a 1, si pu`o scrivere
u(x) −
Phr (x)
=
r
X
(k)
(u(x) − u(yi,k )) Li,r (x) ,
∀x ∈ Ik ,
i=0
e quindi ottenere
|u(x) − Phr (x)| ≤ Λr ω(u, hk ) ,
∀x ∈ Ik ,
P
(k)
dove Λr := k ri=0 |Li,r |k∞,[a,b] `e la costante di Lebesgue (a nodi equispaziati
in Ik e per il grado r) e ω(u, h) `e il modulo di continuit`a della funzione u che
tende a zero per h che tende a zero, essendo u continua. Dato che per ascisse
uniformi la costante di Lebesgue
Λr non dipende da k ma solo dal grado r
Pr
(infatti si ha che Λr = k i=0 |`i,r | k∞,[0,1] ), si pu`o allora concludere che
max |u(x) − Phr (x)| ≤ Λr ω(u, h) .
x∈[a , b]
Questo ovviamente garantisce la convergenza di Phr ad u nella norma uniforme
di C 0 [a , b] .
Ma vediamo ora l’ordine di convergenza con cui Phr tende ad u al tendere
di h a zero nella norma di H 1 (I), ricordando che u appartiene almeno a
H 2 (I). A tale scopo si dimostra il seguente teorema,
Teorema 2. Sia I = (a , b) e u ∈ H r+1 (I), r ≥ 1 . Allora esistono due
costanti C0,r e C1,r indipendenti da u e da h tali che
|u − Phr |H 1 (I) ≤ C1,r hr |u|H r+1 (I) ,
ku − Phr kL2 (I) ≤ C0,r hr+1 |u|H r+1 (I) .
17
(20)
Dimostrazione : Facciamo la dimostrazione solo nel caso r = 1, ricordando
che in tal caso, essendo il dominio monodimensionale, si ha che u ∈ C 1 (I) .
Se quindi poniamo e := u − Ph1 , abbiamo che e ∈ C 1 (Ik ) e, essendo e(xi ) =
0, i = 0, . . . , N, si ha che per il teorema di Rolle esistono zk ∈ Ik , k = 1, . . . , N
tali che e0 (zk ) = 0 . Questo ci permette di scrivere
Z x
Z x
00
0
e (s)ds =
u00 (s) ds , ∀x ∈ Ik ,
e (x) =
zk
zk
che implica che
xk
Z
0
|e (x)| ≤
|u00 (s)|ds ,
∀x ∈ Ik .
xk−1
Usando la disuguaglianza di Cauchy–Schwarz in L2 (Ik ) per le funzioni 1 e
|u00 |, si ottiene quindi,
1/2
|e0 (x)| ≤ hk
Z
xk
!1/2
(u00 (s))2 ds
,
∀x ∈ Ik .
(21)
xk−1
A sua volta si ha quindi allora che
Z xk
Z
0
2
2
(e (x)) dx ≤ h
xk−1
xk
(u00 (s))2 ds ,
xk−1
dove hk `e stato maggiorato con h . Sommando su k e e elevando a 1/2
ambo i membri si ottiene allora la prima disuguaglianza in (20) ponendo
C1,1 = 1. Dobbiamo ora maggiorare e(x). Per fare questo si nota che
Z x
e(x) =
e0 (s)ds , ∀x ∈ Ik ,
xk−1
e quindi, dalla (21), si ottiene che
Z
xk
|e(x)| ≤
3/2
|e0 (x)|dx ≤ hk
Z
xk−1
xk
!1/2
(u00 (s))2 ds
,
∀x ∈ Ik .
xk−1
Quindi, quadrando e maggiorando di nuovo hk con h si ottiene
Z xk
Z xk
2
4
(e(x)) dx ≤ h
(u00 (s))2 ds .
xk−1
xk−1
18
Infine, sommando su k e e elevando poi a 1/2 ambo i membri si ottiene la
seconda disuguaglianza in (20) ponendo ancora C0,1 = 1.
Per quanto prima detto, questo teorema implica allora che, se la soluzione
u del nostro problema variazionale appartiene a H r+1 (I) con r ≥ 1 e si usano
elementi finiti proprio di grado r, allora esiste una costante indipendente da
h e da u tale che
ku − uh kH 1 (I) ≤ Chr |u|H r+1 (I) .
Si pu`o inoltre dimostrare che se u ∈ H s+1 (I) con s ≥ 1 e si usano elementi
finiti di grado r > s si ha soltanto
ku − uh kH 1 (I) ≤ Chs |u|H s+1 (I) .
Da questo si deduce che non conviene utilizzare elementi finiti di grado r > s.
Si noti che nell’approccio classico qui analizzato non si contempla la possibilit`a di utilizzare come Vh uno spazio di splines con regolarit`a globale maggiore di C 0 .
4.3
Caso 2D: scelta di Vh e delle basi
Nel caso bidimensionale, dato che si intende utilizzare sempre delle polinomiali a tratti, occorre preliminarmente fissare una suddivisione del dominio
Ω che ci limitiamo qui a considerare poligonale (o precedentemente approssimato con un poligono). Come suddivisione ci limitiamo a considerare una
triangolazione Th , ossia un insieme finito di triangoli K ⊂ Ω non degeneri
tali che
◦
◦
• ∀K1 , K2 ∈ Th distinti si ha K 1 ∩ K 2 = ∅ ,
• nessun K ∈ Th pu`o avere un vertice nell’interno del lato di un altro
triangolo ,
•
¯,
∪ K=Ω
K∈Th
che costituisce comunque la scelta pi`
u duttile. Il parametro h che si associa
alla triangolazione risulta essere il massimo dei diametri hK di ciascun triangolo. Nel considerare una famiglia F di triangolazioni (si considerano in
¯ con h decrescente), richiederemo comunque che F
genere triangolazioni di Ω
√
sia regolare, ossia che esista una costante δ ≥ 3 indipendente da h tale che
hk
≤ δ,
ρK
∀K ∈ Th ,
19
∀Th ∈ F ,
dove ρK denota il diametro del cerchio inscritto
√ nel traingolo K (detto anche
sfericit`a del triangolo) (si noti che se δ = 3 si sta chiedendo che tutti i
triangoli siano equilateri).
Ontre che considerare famiglie di triangolazioni regolari in genere si assume anche l’ipotesi che F sia quasi–uniforme ossia che esita ina costante
1 ≥ τ > 0, tale che
hk ≥ hτ ,
∀K ∈ Th ,
∀Th ∈ F ,
Fissata Th ∈ F definiremo allora
¯ | vh |K ∈ Π2r ,
Xhr := {vh ∈ C 0 (Ω)
∀K ∈ Th } ,
dove Π2r indica lo spazio dei polinomi bivariati di grado minore o uguale a r,
con
(r + 1)(r + 2)
.
Dr := dim(Π2r ) =
2
Si osservi che la restrizione di una delle funzioni di Xhr ad un lato della
triangolazione risulta essere un polinomio monovariato sempre di grado r.
Inoltre, cos`ı come nel caso monovariato, possiamo facilmente verificare che
Xhr ⊂ H 1 (Ω). Ora siamo interessati a utilizzare sempre una base ϕi , i =
0, . . . , Nh di Xhr che sia lagrangiana, ossia per la quale esiste un opportuno
insieme Y di punti distinti di Ω tali che ϕi (Pj ) = δi,j , i, j = 0, . . . , Nh , dove
Nh + 1 indica sempre la dimensione dello spazio Xhr . Naturalmente, al solito
avremo che ϕi |K ≡ 0 se Pi ∈
/ K e quindi ogni ϕi sar`a diversa da zero solo
in quei triangoli cui appartiene Pi . Il caso pi`
u semplice (e spesso usato) si
ha per r = 1. Infatti in tal caso Y coincide con l’insieme dei vertici della
triangolazione. Nel caso generale si pone invece
Y := ∪ Yr,K ,
K∈Th
dove Yr,K indica l’insieme dei punti di r–base su K (vedi appendice B) e dove
Nh +1 = ]Y. Si noti che se Pi `e interno a un triangolo K, la corrispondente ϕi
risulta non nulla solo in K, se esso `e interno ad un lato della triangolazione
ϕi `e non nulla solo nei due triangoli che condividono quel lato e se invece `e
un vertice ϕi sar`a non nulla in tutti quei triangoli che hanno quel vertice in
comune (almeno 3 se `e un vertice interno). In ogni caso occorrer`a numerare
i punti distinti di Y e risulta essere non banale trovare una numerazione che
rende meno ampia possibile la banda della matrice di rigidezza. In generale
a priori la si classifica solo come una matrice sparsa.
20
Naturalmente se Pi , Pj ∈ K ∈ Th , dovremo calcolare il contributo su K
all’elemento Ai,j della matrice di rigidezza, ossia il seguente integrale (riferendoci per esempio al problema ellittico pi`
u generale),
Z
µ(X)∇ϕi (X) · ∇ϕj (X) + σ(X)ϕi (X)ϕj (X) dX .
K
Ora anche per i triangoli `e possibile individuare una trasformazione liˆ :K
ˆ → K che mappa in K il master K,
ˆ ossia il triangolo di
neare mK (X)
ˆ di coordinate (1, 0) e in
riferimento con vertici in Aˆ di coordinate (0, 0) in B
Cˆ di coordinate(0, 1). Tale trasformazione si scrive come segue,
ˆ := MK X
ˆ + A,
X = mK (X)
dove MK `e la seguente matrice 2 × 2 ,
MK = (B − A , C − A) ,
essendo A, B e C i tre vertici del triangolo K. Si osservi che le coordinate
baricentriche Λ = (λ0 , λ1 , λ2 ) di un punto X del piano rispetto a K sono
ˆ rispetto a K.
ˆ
uguali a quelle del corrispondente punto X
Ora ϕi |K che ϕj |K coincidono rispettivamente con i polinomi di Lagrange
associati al punto base ad esse corrispondente. Esisteranno quindi due multiindici I e J, con |I| = |J| = r, tali che ϕi |K = LI,r e ϕj |K = LJ,r . Usando
la trasformazione lineare appena definita possiamo scrivere che
∇ϕi (X) =
1
ˆ
M c ∇LI,r (X),
det(MK ) K
dove MKc indica la matrice dei cofattori della matrice MK . Questo implica
che il suddetto integrale pu`o essere trasformato nella seguente quantit`a,
R
1
c
c
ˆ
ˆ
¯ µ(mK (X)) (MK ∇LI,r ) · (MK ∇LJ,r ) dX +
det(MK )
K
.
R
ˆ
ˆ
det(MK ) K¯ σ(mK (X))LI,r LJ,r dX ,
Si osservi che in questa formula det(MK ) svolge il ruolo che svolgeva hk nel
caso unidimensionale. Infatti |det(MK )| = 2Area(K) . Si osservi inoltre che,
anche se µ `e costante, a differenza di quanto accadeva nel caso monodimensionale, il primo integrale dipende comunque da K a causa di MKc e quindi
non si pu`o fare una volta per tutte.
21
4.4
Caso 2D: convergenza di uh a u
Come per il caso monodimensionale, occorre maggiorare infvh ∈Vh ku − vh kV
con una quantit`a che va a zero quando h va a zero per poter dire che con il
metodo degli elementi finiti `e assicurata la convergenza. A tale scopo anche
nel caso bidimensionale si maggiora la suddetta quantit `a con ku − Phr k1 ,
dove Phr ∈ Xhr indica l’interpolante di u nei punti di Y che `e univocamente
definita (vedi appendice B). Per tale funzione infatti `e possibile dimostrare
il seguente teorema del quale si riporta solo l’enunciato,
¯ e sia Th ∈ F.
Teorema 3. Sia F una famiglia di triangolazioni regolari di Ω
r+1
Se u ∈ H (Ω), con r ≥ 1, allora esistono due constanti positive Ci , r, i =
0, 1 dipendenti da δ tali che
|u − Phr |H 1 (I) ≤ C1,r hr |u|H r+1 (I) ,
ku − Phr kL2 (I) ≤ C0,r hr+1 |u|H r+1 (I) .
(22)
Da questo teorema infatti discende che (nelle ipotesi da esso assunte)
esiste C positiva (sempre dipendente da δ) tale che
ku − uh k1 ≤
M
C hr |u|H r+1 (Ω) .
α
Si noti che come nel caso monodimensionale se u ∈ H s+1 con s < r si pu`o
solo dire che esiste una costante positiva C tale che
ku − uh k1 ≤
5
M
C hs |u|H s+1 (Ω) .
α
Condizionamento della matrice di rigidezza
Per i problemi ellittici 1D e 2D considerati, nell’ ipotesi di quasi–uniformit`a e,
per il caso 2D anche di regolarit`a della triangolazione, si pu`o determinare un
bound superiore per il numero di condizionamento in norma 2 della matrice
di rigidezza A. Per determinare tale bound occorre avvalersi per`o di due
risultati validi nel Vh scelto e nelle ipotesi fatte sulla triangolazione. Il primo
`e la cosiddetta disuguaglianza inversa,
k∇vh kL2 (Ω) ≤ C ∗ h−1 kvh kL2 (Ω) ,
∀vh ∈ Vh ,
(dove C ∗ indica una costante indipendente da h). Inoltre occorre prima
dimostrare il seguente lemma (la cui dimostrazione `e per`o qui omessa),
22
Lemma 1. Esistono due costanti C2 ≥ C1 > 0 indipendenti da h tali che,
C1 hd |v|2 ≤ kvh k2L2 (Ω) ≤ C2 hd |v|2 ,
∀vh ∈ Vh ,
(23)
essendo d ≤ 3 la dimensione spaziale, v = (v0 , · · · , vNh )T ∈ IRNh +1 il vettore
P h
tale che vh = N
j=0 vj ϕj e indicando con |v| la sua norma eucliedea.
Siamo allora in grado di dimostrare il seguente teorema,
Teorema 4. Indicato con κ2 (A) il numero di condizionamento in norma
2 della matrice di rigidezza del metodo degli elementi finiti per i problemi
ellittici esaminati, si ha che esiste una costante Cr dipendente dal grado r
degli elementi finiti utilizzati tale che
κ2 (A) ≤ Cr h−2 .
Dimostrazione : Essendo la A sdp, essa ha tutti autovalori reali e positivi
e si ha che
λmax
,
κ2 (A) =
λmin
dove λmax e λmin denotano rispettivamente il pi`
u grande e pi`
u piccolo degli
autovalori di A. Ora, se λh `e un qualsiasi autovalore di A si sa che esso pu`o
essere scritto nella forma
vT Av
,
λh =
vT v
dove v indica un autovettore relativo a λh . Ma d’altra parte, per
PNhcome `e
T
definita la matrice A si ha che v Av = a(vh , vh ) , dove vh = j=0 vj ϕj .
Quindi dalla coercivit`a e dalla continuit`a della forma bilineare discende che
kvh k21
kvh k21
α
≤ λh ≤ M
.
|v|2
|v|2
Usando la disuguaglianza inversa in Vh si ha d’altra parte che
kvh kL2 (Ω) ≤ kvh k1 ≤ (1 + C ∗ ) h−1 kvh kL2 (Ω) ,
e quindi ne deriva che
α
kvh k2L2 (Ω)
|v|2
∗ 2 −2
≤ λh ≤ M (1 + C ) h
23
kvh k2L2 (Ω)
|v|2
.
Questa, combinata alla (23),implica a sua volta che
αC1 hd ≤ λh ≤ M (1 + C ∗ )2 h−2 C2 hd .
Da queste due disuguaglianze deriva che
κ2 (A) =
λmax
M (1 + C ∗ )2 h−2 C2
≤
,
λmin
αC1
che conclude la dimostrazione.
Il peggioramento del numero di condizionamento al decrescere di h implica che, tanto pi`
u si vuole essere accurati, tanto pi`
u diventa problematica
la risoluzione del sistema lineare cui si perviene con il metodo degli elementi
finiti. Si ricordi che se per esempio si usa il metodo del gradiente coniugato per la sua risoluzione, la velocit`a di convergenza decresce al crescere di
κ2 (A). Per tale metodo `e quindi particolarmente utile usare delle tecniche di
precondizionamento.
6
Cenni di analisi isogeometrica
Un interessante recente campo di ricerca riguarda l’impiego di spazi di funzioni tipicamente utilizzati nel CAD in combinazione con il metodo degli elementi finiti. In tale contesto l’obiettivo `e quello di utilizzare gli stessi spazi
di funzioni sia per la descrizione del bordo del dominio Ω che per approssimare la soluzione stessa del problema differenziale. Dato che usualmente la
descrizione di geometrie nel CAD viene fatta mediante splines o mediante la
loro estensione razionale, fondamentalmente ci`o significa utilizzare spazi di
funzioni spline invece che semplici polinomiali a tratti con regolarit`a soltanto
C 0 . Questo modo di procedere innanzi tutto consente di rappresentare esattamente il bordo del dominio aumentando l’accuratezza del metodo discreto
quando il problema differenziale `e formulato su un dominio non poligonale.
Inoltre `e stato verificato che l’impiego di spazi discreti Vh con regolarit`a maggiore di C 0 pu`o garantire il raggiungimento di soluzioni numeriche pi`
u stabili,
in particolare quando si ha a che fare con problemi con soluzioni regolari che
invitano all’uso di gradi pi`
u alti. Naturalmente va detto che, mentre nel
caso monodimensionale lo spazio S delle splines `e uno spazio ben noto e
univocamente definito (una volta ovviamente precisato grado e nodi), la sua
estensione al caso bidimensionale/pluridimensionale risulta non ancora standard se si fa riferimento al caso generale. Essa diviene invece standard se si
24
considera la loro generalizzazione tensor-product che presuppone comunque
la loro definizione su domini parametrici a topologia rettangolare. Al fine di
superare o comunque rendere meno grave questo drawback, sono tuttora in
sviluppo varie linee di ricerca.
25
7
Appendice A
In questa sezione si introducono le definizioni e gli enunciati dei teoremi di
analisi funzionale cui viene fatto riferimento in queste note.
7.1
Gli spazi Lp (Ω), 1 ≤ p ≤ +∞
Si tratta di spazi di funzioni definite su Ω che sono tutti spazi di Banach
(ciascuno rispetto alla sua norma) e che nel caso da noi assunto di Ω limitato
sono annidati nel senso che, se q > p ≥ 1 si ha
L∞ (Ω) ⊂ Lq (Ω) ⊂ Lp (Ω) ⊂ L1 (Ω) .
Se p < +∞ si ha:
Z
p
L (Ω) := {v : Ω → IR |
|v(x)|p dx < +∞}
Ω
e che, conseguentemente, la norma di v ∈ Lp (Ω) `e definita come segue,
Z
p
|v(x)| dx
kvkLp (Ω) :=
1/p
.
Ω
In particolare L2 (Ω) `e uno spazio di Hilbert rispetto al prodotto scalare
Z
< v , w >L2 (Ω) :=
v(x) w(x) dx .
Ω
Inoltre si ha che
L∞ (Ω) := {v : Ω → IR | |v(x)| < +∞ q.o. in Ω}
e
kvkL∞ (Ω) := sup{|v(x)| , q.o. in Ω} .
7.2
Derivate nel senso delle distribuzioni
Vogliamo qui introdurre una generalizzazione del concetto di derivata che,
fra l’altro, ci permetter`a di definire la derivata (nel senso delle distribuzioni
appunto) per una qualsiasi f ∈ L2 (Ω) (funzione a quadrato sommabile).
26
Ma andiamo per ordine e definiamo innanzi tutto lo spazio delle distribuzioni che indicheremo con D0 (Ω) come lo spazio duale dello spazio
D(Ω) := {φ : Ω → IR | φ ha supp. comp. in Ω e `e inf. deriv. in Ω}
Abbiamo quindi che D0 (Ω) `e lo spazio dei funzionali lineari e continui
definiti sulle funzioni di D(Ω). Ora possiamo osservare che L2 (Ω) `e isomorfo a
un sottospazio proprio di D0 (Ω). Infatti `e possibile identificare ogni f ∈ L2 (Ω)
con la distribuzione Tf tale che
Z
f (x) φ(x)dx .
Tf (φ) :=
Ω
Notiamo che per brevit`a spesso si identifica f ∈ L2 (Ω) con la distibuzione
Tf ad essa associata. Con tale abuso di linguaggio possiamo quindi anche dire
che L2 (Ω) `e un sottospazio di D0 (Ω). Il fatto che si tratti di un sottospazio
proprio si dimostra facendo vedere che non `e possibile trovare f ∈ L2 (Ω) tale
che δa = f, (nel senso quindi di δa = Tf ,) dove δa ∈ D0 (Ω), a ∈ Ω, `e detta
distribuzione di Dirac ed `e definita come segue:
δa (φ) := φ(a) .
∂T
di una distribuzione T come quella disDefiniamo quindi la derivata ∂x
i
tribuzione tale che
∂T
∂φ
(φ) := −T (
).
(24)
∂xi
∂xi
In particolare avremo quindi che, se f ∈ L2 (Ω), si ha
Z
∂φ
∂Tf
(φ) = −
f (x)
dx .
∂xi
∂xi
Ω
(25)
Dalla definizione in (24) si deduce innanzi tutto che le distribuzioni sono
infinitamente derivabili (nel senso delle distribuzioni!) e per recursione si
ottiene che, se α ∈ INd `e un multiindice assegnato, ∀T ∈ D0 (Ω) risulta
Dα T (φ) = (−1)|α| T (Dα φ) ,
P
|α|
dove si ricorda che |α| := di=1 αi e Dα φ :=, ∂ α1 x∂1 ···∂φαd xd .
Osserviamo poi che l’espressione in (25) implica che, se f ∈ C 1 (Ω), al∂T
lora ∂xfi = T ∂f che implica che in questo caso la derivata nel senso delle
∂xi
27
distribuzioni coincide con la derivata classica. Infatti usando il teorema di
Green e considerando che ogni φ ∈ D(Ω) ha supporto compatto in Ω, si ha
che
Z
∂f
∂φ
(x) + f (x)
(x)dx = 0
φ(x)
∂xi
∂xi
Ω
che implica che
Z
∂Tf
∂f
(φ) =
φ(x)
dx = T ∂f (φ) .
∂xi
∂xi
∂xi
Ω
Se per`o si sa solo che f sta in L2 (Ω) non `e neanche detto che esista g ∈
∂T
L2 (Ω) tale che Tg = ∂xfi , cio`e, in altre parole, la derivata nel senso delle
distribuzioni di una funzione di L2 (Ω) non necessariamente `e una funzione
di L2 (Ω). Questo si verifica in modo costruttivo, considerando la funzione
monovariata di Heaviside H(x) : IR → IR,
1 se x > 0 ,
H(x) =
(26)
0 altrimenti.
Tale funzione appartiene naturalmente a L2 (Ω), Ω ⊂ IR, essendo Ω limitato
per ipotesi. Se Ω = (a , b) con a < 0 < b, avremo
Z b
Z b
dφ
dφ
dφ
dTH
(φ) = −TH ( ) = −
H(x) (x) = −
dx = φ(0) = δ0 (φ) .
dx
dx
dx
a
0 dx
Essendo quindi
7.3
dTH
dx
= δ0 , segue che
dTH
dx
∈
/ L2 (Ω).
Gli spazi di Sobolev H m (Ω)
Il fatto che la derivata nel senso delle distribuzioni di una funzione di L2 (Ω)
non necessariamente appartenga ad L2 (Ω), ci porta quindi ad introdurre un
sottospazio di L2 (Ω) che viene detto spazio di Sobolev H 1 (Ω),
H 1 (Ω) := {f ∈ L2 (Ω)|
∂f
∈ L2 (Ω), i = 1, . . . , d} ,
∂xi
(27)
dove le derivate devono essere intese nel senso delle distribuzioni.
Si noti che H 1 (Ω) `e uno spazio di Hilbert rispetto al prodotto scalare
Z
f g + ∇f · ∇g dx ,
< f , g >1 :=
Ω
28
che induce la norma
Z
kf k1 =
2
2
1/2
f + |∇f | dx
.
Ω
E’ anche possibile definire una seminorma in H 1 (Ω) che talvolta viene
utilizzata in certi teoremi,
Z
1/2
2
|f |1 =
|∇f | dx
.
Ω
Dal punto di vista della regolarit`a puntuale, si dimostra che se d = 1 e
Ω = (a , b) (caso monodimensionale), allora H 1 (Ω) ⊂ C 0 (Ω). Questo per`o
non `e pi`
u vero se d > 1. Si noti anche che pu`o succedere che si possa scrivere
`
¯ = ∪K
¯ j con Kj ∩ Ks = ∅ se j 6= s, e che risulti che una funzione f ∈
Ω
/
j=1
H 1 (Ω) sebbene sia f ∈ H 1 (Kj ), j = 1, . . . , ` . Basti pensare alla funzione di
Heaviside. In effetti si dimostra che se f ∈ H 1 (Kj ), j = 1, . . . , ` e si ha anche
¯ , allora si pu`o concludere che f ∈ H 1 (Ω) .
che f ∈ C 0 (Ω)
La definizione di H 1 (Ω) pu`o essere generalizzata per definire lo spazio di
Sobolev H m (Ω), dove
H m (Ω) := {f ∈ L2 (Ω)| Dα f ∈ L2 (Ω), |α| ≤ m} ,
(28)
Pd
α
dove α = (α1 , . . . , αd ) ∈ INd `e un multiindice, |α| :=
i=1 αi e D f :=
|α|
∂ f
m
1
2
α , e naturalmente si ha H (Ω) ⊂ · · · ⊂ H (Ω) ⊂ L (Ω) . Il prodotto
α
∂x 1 ···x d
1
d
scalare in H m (Ω) `e definito come segue,
Z X
(f , g) :=
Dα f Dα g dx
Ω |α|≤m
Seminorma e norma in H m (Ω) sono quindi rispettivamente definite come
segue,

1/2
Z X
|f |m := 
(Dα f )2 dx 
Ω |α|=m
kf km

Z

:=
1/2
X
(Dα f )2 dx 
Ω |α|≤m
29
7.4
Traccia su ∂Ω di funzioni di H m (Ω)
Se d > 1 e u ∈ H 1 (Ω), abbiamo visto che non necessariamente u `e continua
in Ω. Occorre allora precisare cosa si intende per ”restrizione di u a ∂Ω”,
supponendo comunque ∂Ω sufficientemente regolare. A tale scopo ci viene
in aiuto il teorema di traccia che asserisce che, ∀m ≥ 1, esiste una e una
sola applicazione lineare e continua γ0 : H m (Ω) → L2 (∂Ω) tale che, ∀v ∈
H m (Ω) ∩ C 0 (Ω) risulta γ0 (v) = v|∂Ω . La continuit`a di γ0 implica che esiste
una costante C0 tale che, ∀u ∈ H m (Ω) si ha
kγ0 (u)kL2 (∂Ω) ≤ C0 kukm .
(29)
Si noti che il risultato resta valido se si considera ΓD ⊂ ∂Ω, invece di
∂Ω, purch`e ΓD abbia misura non nulla. In tal caso usualmente si indica
l’operatore di traccia con γΓD (operatore di traccia ristretta).
Osservazione 5. L’operatore γΓD non `e suriettivo in L2 (ΓD ) . Si indica allora con H 1/2 (ΓD ), il sottospazio di L2 (ΓD ) definito come segue,
H 1/2 (ΓD ) := {g ∈ L2 (ΓD ) | ∃v ∈ H 1 (Ω) : γΓD (v) = g} .
Tale spazio ha propriet`a di regolarit`a intermedie fra quelle di H 1 (ΓD ) e di
L2 (ΓD ) , essendo H 1 (ΓD ) ⊂ H 1/2 (ΓD ) ⊂ L2 (ΓD ) .
Mediante l’operatore di traccia γ0 possiamo definire il seguente sottospazio
di H 1 (Ω),
H01 (Ω) := {v ∈ H 1 (Ω)| γ0 (v) = 0}
(30)
Nel caso quindi della formulazione debole del problema di Poisson o anche
della sua generalizzazione considerata, la condizione di Dirichlet u|ΓD = gD
deve essere intesa come γΓD (u) = gD , con gD dato assegnato tale che gD ∈
H 1/2 (ΓD ) .
8
Appendice B
In questa sezione diamo la definizione di simplesso in IRd , introduciamo le
coordinate baricentriche relative ad un simplesso fissato e utilizziamo queste
grandezze per studiare il problema dell’interpolazione polinomiale bivariata.
30
8.1
Simplessi e coordinate baricentriche
Dato un insieme di d + 1 punti Pi , i = 0, . . . , d appartenenti allo spazio affine
E d associato a IRd , se non esiste alcul iperpiano di IRd cui essi appartengono,
il loro inviluppo convesso (convex hull) dicesi simplesso di IRd del quale i
punti Pi costituiscono i vertici. Nel caso d = 1 avremo quindi un segmento,
nel caso d = 2 un triangolo e nel caso d = 3 un tetraedro.
Fissato un simplesso K ⊂ E d , possiamo introdurre un nuovo sistema
di coordinate dette coordinate baricentriche da esso indotte per individuare
univocamente ciascun punto P ∈ E d . Se indichiamo sempre con P il vettore
di IRd le cui componenti sono le d coordinate cartesiane di P in E d , la (d+1)–
pla di reali Λ := (λ0 , . . . , λd ), tale che
P=
d
X
λi Pi ,
i=0
d
X
λi = 1 ,
i=0
definisce le coordinate baricentriche di P. Si ha quindi che le coordinate
baricentriche di un punto del quale si conoscono le coordinate cartesiane
si trovano risolvndo un sistema lineare di (d + 1) equazioni in altrettante
incognite la cui matrice dei coefficienti A risulta effettivamente non singolare nell’ipotesi fatta che si abbia a che fare con un simplesso non degenere,
essendo |det(A)| = |det([P1 − P0 , · · · , Pd − P0 ])| . In particolare quindi le
coordinate baricentriche di Pi sono tutte nulle ad eccezione della i–esima che
`e 1 mentre le coordinate baricentriche di punti sul segmento che congiunge
Pi a Pj sono tutte nulle ad eccezione di λi e λj . Inoltre i punti interni a
K sono tutti e soli quei punti di E d che hanno tutte le coordinate baricentriche positive. Le coordinate baricentrice hanno inoltre nei casi d = 2, 3
un’interessante interpretazione geometrica. Per d = 2 |λi | rappresenta infatti il rapporto fra l’area del triangolo avente come vertici P e i due vertici
di K diversi da Pi e l’area di K. Analogamente per d = 3 essa rappresenta
il rapporto fra i volumi del tetraedro avente per vertici P e i tre vertici di K
diversi da Pi e il volume di K.
8.2
Interpolazione polinomiale bivariata
Si osservi che, a differenza del caso monovariato, se in IR2 si prendono Dr
punti distinti non `e detto che sia univocamente individuato il polinomio appartenente a Π2r che assume in questi punti dei valori assegnati. Si pensi per
31
esempio al caso lineare in cui D1 = 3 e come base si possono usare i monomi
1, x, y. Se si assegnano tre punti distinti tutti sull’asse x per esempio, avremo
da risolvere un sistemino lineare 3 × 3 la cui matrice dei coefficienti `e singolare. Questo ci porta a definire unisolvente un insieme di Dr punti in IR2 per
il quale esiste ed `e unico il polinomio di Π2r che interpola in essi una qualsiasi
funzione (bivariata) continua (diciamo nella convex hull di tali punti).
Si noti che se si prendono in un triangolo K i Dr punti distinti PJ , con
J multiindice tale che |J| = r, aventi coordinate baricentriche Jr , si ottiene
un insieme unisolvente in quanto `e possibile individuare una corrispondente
base di Π2r lagrangiana, ossia Dr polinomi bivariati LI,r con I multiindice di
modulo |I| = r, tali che LI,r (PJ ) = 0 se J 6= I e tali che LI,r (PI ) = 0 . Tali
polinomi, sono detti appunto di Lagrange e, essendo per costruzione linearmente indipendenti, formano una base di Π2r . Vediamo come sono definiti per
r = 1, 2, 3.
r
r
r
r
r
r
= 1,
= 2,
= 2,
= 3,
= 3,
= 3,
I
I
I
I
I
I
= (1, 0, 0)
= (2, 0, 0)
= (1, 1, 0) ,
= (3, 0, 0)
= (2, 1, 0)
= (1, 1, 1)
LI (Λ)
LI (Λ)
LI (Λ)
LI (Λ)
LI (Λ)
LI (Λ)
= λ0 ,
= λ0 (2λ0 − 1) ,
= 4λ0 λ1 ,
= 21 λ0 (3λ0 − 1)(3λ0 − 2) ,
= 29 λ0 λ2 (3λ0 − 1) ,
= 27λ0 λ1 λ2 .
Ogni polinomio p ∈ Π2r si pu`o quindi rappresentare nella base di Lagrange
come,
X
p(·) =
pJ LJ,r (·) .
|J|=r
Se si vuole che il polinomio interpoli una funzione f nei punti PJ , |J| = r, si
deve quindi prendere pJ = f (Pj ) .
Chiameremo insieme di r–base sul triangolo K e indicheremo con Yr,K l’insieme
dei suddetti Dr punti (aventi rispetto a K coordinate baricentriche Jr , |J| =
r).
References
[1] S. C. Brenner, L. Ridgway Scott (1994), The mathematical theory of
Finite Element Methods, Spriger Verlag, New York.
32
[2] A. Quarteroni (2008), Modellistica Numerica per Problemi
Differenziali, quarta edizione, Springer–Verlag, Milano.
[3] J. A. Cottrell, T. J. R. Hughes, Y. Bazilevs (2009), Isogeometric
Analysis. Toward Integration of CAD and FEA, J. Wiley & Sons eds.
33