notes

Analyse harmonique dyadique : une
introduction
Aline Bonami
[email protected]
Ces notes sont une incitation, pour les probabilistes, à s'intéresser à l'analyse réelle. Pour les analystes, leur but est de montrer à quel point les probabilités jouent un rôle central dans l'analyse réelle, qu'il s'agisse de construire
des contre-exemples avec des méthodes aléatoires ou d'y trouver les raisons
pour lesquelles on s'est intéressé à tel ou tel problème. L'analyse harmonique
dyadique joue un rôle évident de passerelle. Le développement prodigieux des
inégalités à poids autour de la conjecture
A2
donne la possibilité d'illustrer
ces convergences entre les deux domaines avec des résultats très récents.
Il y a de nombreux textes qui permettent aux spécialistes de trouver
une présentation exhaustive (par exemple le texte de Cristina Pereyra dans
Contemporary Maths. Ce n'est pas le but de celui-ci, qu'il faut plutôt voir
comme une introduction à la théorie de Calderón-Zygmund à poids entraînant le lecteur dans une sorte de promenade qui lui permet de s'initier à
quelques méthodes d'analyse réelle dans des situations simples.
Il s'agit d'une version provisoire, mise en ligne après l'école de recherche
d'Abidjan. Elles seront complétés ultérieurement, en particulier par une bibliographie
1.
Fonction maximale et convergence presque partout
Notre point de départ est le théorème de Hardy-Littlewood, relatif à la fonction maximale de Hardy-Littlewood, dénie dès que f est
localement intégrable sur Rd par
Z
1
|f (y)| dy
M f (x) = sup
x∈Q |Q| Q
où le supremum est pris sur tous les cubes (à côtés parallèles aux axes)
contenant x.
La fonction maximale intervient naturellement dans beaucoup de
problèmes. Le premier exemple d'application est le théorème de diérentiation de Lebesgue, qui permet d'armer que si f est localement
intégrable alors, presque partout,
Z
1
(1)
f (x) = lim
f (y) dy.
r→0 |B(x, r)| B(x,r)
Ici B(x, r) désigne la boule de centre x et de rayon r.
1
2
La propriété cruciale de l'opérateur M est l'inégalité faible L1 du
théorème maximal.
(théorème maximal) [HardyLittlewoodWiener]
M est de type faible (1, 1) c'est-à-dire
Théorème 1.1.
ckf kL1
.
λ
De plus M est de type fort (p, p), 1 < p < ∞. Plus précisément,
cp
(2)
kM f k p ≤
kf k p .
L
L
p−1
|{M f > λ}| ≤
Ici |A| désigne la mesure de l'ensemble mesurable A pour la mesure
de Lebesgue.
Les constantes c dépendent de la dimension. La détermination des
meilleures constantes est encore en partie inconnue. Voir le blog de Tao
http ://terrytao.wordpress.com/2011/05/21/steins-spherical-maximaltheorem/
Exercice 1. Montrer que, quelle que soit la fonction φ positive sur
l'espace mesuré (X, µ), on a la formule
Z ∞
Z
dt
p
tp µ({x ∈ X : φ(x) > t}) .
φ dµ = p
t
0
X
Exercice 2. Montrer que l'inégalité faible (1, 1) entraîne l'inégalité
forte (p, p). Indication : on pourra écrire f = g + h avec g = f 1|f |>λ/2
et en déduire que
{M f > λ} ⊂ {M g > λ/2}.
Exercice 3. Montrer que si f est la fonction indicatrice de la boule
unité centrée en 0, alors M f (x) ≥ c|x|−d à l'inni. En déduire qu'il
n'y a pas d'inégalité forte (1, 1). En déduire que la plus petite constante
dans l'inégalité
(3)
est supérieure à
l'autre).
kM f k
Lp
c
p−1
≤ Akf k
Lp
(les constantes c peuvent changer d'une ligne à
L'exercice 2 donne un cas particulier du théorème de Marcinkiewicz,
que nous énonçons maintenant.
Si T est un opérateur (linéaire, sous-linéaire) qui est
de type faible (p0 , q0 ) et de type faible (p1 , q1 ), avec 1 ≤ p0 ≤ q0 ≤ ∞ et
Théorème 1.2.
3
1 ≤ p1 ≤ q1 ≤ ∞, alors T est de type fort (p, q) pour tout p ∈ (p0 , p1 )
si p et q sont tels que
1
t
1−t
=
+
p
p0
p1
1
t
1−t
=
+
.
q
q0
q1
Rappelons que les hypothèses et conclusions peuvent encore s'écrire
q
c kf k 0
Hypothèses : µ({x ∈ X : |T f (x)| > λ}) ≤ 0 λq0 p0 ;
µ({x ∈ X : |T f (x)| > λ}) ≤
c1 kf kqp11
.
λq1
Conclusion : kf kq ≤ ckf kp .
Nous allons montrer le théorème de diérentiation de Lebesgue à partir du théorème maximal, que nous démontrerons plus tard. Il s'agit
d'une démonstration modèle, qui sert de modèle à de nombreuses démonstrations.
Démonstration du théorème de diérentiation de Lebesgue
Soit f une fonction localement intégrable. Nous allons montrer qu'il
existe un ensemble Lf dit ensemble de Lebesgue dont le complémentaire est de mesure 0 et tel que
Z
1
(4)
f (x) = lim
f (y) dy
x ∈ Lf
r→0 |B(x, r)| B(x,r)
Nous allons même montrer un résultat plus fort, l'existence de Lf tel
que
Z
1
|f (y) − f (x)| dy = 0
x∈
/ Lf .
(5)
lim
r→0 |B(x, r)| B(x,r)
Comme la conclusion est locale (elle ne dépend que des valeurs de f
autour du point considéré), nous pouvons supposer f intégrable. Nous
dénissons
Z
1
Aλ = {x : lim sup
|f (y) − f (x)| dy > λ}
λ ≥ 0.
|B(x, r)| B(x,r)
r→0
On veut montrer que |A0 | = 0. Comme A0 = ∪j A1/j il sut de montrer
que |Aλ | = 0 pour tout λ > 0. Il est important de remarquer que (5) est
satisfait quand f est continue. Or le sous-espace des fonctions continues
est dense dans L1 . Si f ∈ L1 (Rd ) est une fonction quelconque, pour
ε > 0 donné on peut l'écrire f = g + h avec g continue et khkL1 (Rd ) < ε.
Comme la limite supérieure d'une somme est inférieure ou égale à la
4
somme des limites supérieures, et comme la limite pour g vaut 0,
Z
1
lim sup
|f (y) − f (x)| dy
|B(x, r)| B(x,r)
r→0
R
1
≤ lim sup |B(x,r)|
|h(y) − h(x)| dy.
B(x,r)
r→0
Nous avons immédiatement, pour x ∈ Aλ ,
Z
1
(6)
λ < sup
|h(y) − h(x)| dy
r>0 |B(x, r)| B(x,r)
Z
1
≤ |h(x)| + sup
(7)
|h(y)| dy.
r>0 |B(x, r)| B(x,r)
Le second terme est déni comme la fonction maximale, mais avec des
boules centrées en x à la place des cubes contenant x. Or la boule
B(x, r) est incluse dans un cube qui centré en x et de volume (2r)d =
κd |B(x, r)|. Ce second terme est donc majoré par κd M h(x). On en
déduit que
|Aλ | ≤ |{x ∈ Rd : κd M h(x) > λ/2}| + |{x ∈ Rd : |h(x)| > λ/2}|
On utilise ensuite l'inégalité maximale pour le nouveau premier terme,
l'inégalité de Tchebychev pour le second :
Z
2(κd c + 1)
2(κd c + 1)
|h(x)| dx ≤
ε
|Aλ | ≤
λ
λ
Rd
En faisant tendre ε vers 0 on obtient que |Aλ | = 0.
2.
Cubes dyadiques, théorème maximal dyadique
Un intervalle dyadique de R est un intervalle [2−k n, 2−k (n + 1)), avec
n, k ∈ Z. Le paramètre k (ou, suivant les cas, 2−k est appelé paramètre
d'échelle. On note D l'ensemble des intervalles dyadiques et Dk le sous
ensemble constitué des intervalles I ∈ Dk tels que |I| = 2−k .
Les propriétés suivantes sont très faciles à montrer :
A l'échelle k les intervalles dyadiques forment une partition de R.
D est invariant par la dilatation x 7→ 2x. Autrement dit, si I est
un intervalle dyadique, alors 2I est aussi un intervalle dyadique,
et réciproquement.
Chaque intervalle dyadique I est réunion disjointe de deux intervalles de l'échelle moitié.
Si I, I 0 sont deux intervalles dyadiques, alors l'un est inclus dans
l'autre ou bien les deux intervalles sont disjoints.
Ces propriétés impliquent le lemme suivant.
5
Soit L une collection d'intervalles dyadiques I de taille
bornée. Si Lmax désigne la sous-collection des intervalles dyadiques
maximaux pour l'inclusion, alors ceux-ci sont deux à deux disjoints
et tout intervalle de L est inclus dans un intervalle de Lmax .
Lemme 2.1.
On dénit dans Rd les cubes dyadiques comme des produits d'intervalles dyadiques de la même longueur. Il est facile de voir que les
propriétés précédentes s'étendent à plusieurs dimensions.
On dénit la fonction maximale dyadique par
Z
1
D
M f (x) = sup
|f (y)| dy
x∈Q |Q| Q
où le supremum est pris sur tous les cubes dyadiques Q contenant x.
Cette fonction maximale est a priori plus petite, mais on peut contrôler la fonction maximale en termes de celle-ci grâce à la propriété suivante (qui n'a été observée sous cette forme qu'assez récemment !).
Notons tout d'abord Dα , pour α ∈ {0, 1/3}d , la collection des cubes
2−k ([0, 1)d + j + (−1)k α), avec k ∈ Z et j ∈ Zd . La famille Dα possède
toutes les propriétés que nous avons énoncées pour la famille des cubes
dyadiques.
Tout cube Q d'arête ` est inclus dans un cube Q0 d'échelle
k appartenant à une des familles Dα et tel que 2k ≤ 6`.
Lemme 2.2.
Démonstration. Nous allons faire uniquement la preuve en dimension 1.
Soit k tel que 2−k−1 ≤ 3` < 2−k . Si l'intervalle I ne contient aucun point
de la forme 2−k j , alors il est tout entier contenu dans un cube dyadique
classique de taille 2−k < 6`. Supposons que I contienne un point de la
forme 2−k j . Alors il ne contient aucun point de la forme 2−k (j ± 1/3).
Il est donc contenu dans un intervalle de la seconde famille.
Nous pouvons maintenant démontrer une inégalité qui est meilleure
que l'inégalité maximale dyadique, et pour laquelle la constante vaut
1:
Z
D
(8)
λ|{M f > λ}| ≤
|f (x)|dx.
M D f >λ
Démonstration. Soit A = {M D f > λ}. On peut aussi écrire A comme
l'union des cubes dyadiques Q tels que
Z
1
|f (x)|dx > λ.
|Q| Q
R
|f (x)|dx
Ces cubes sont de volume borné par
, donc bornés, et on peut
λ
utiliser le lemme 2.1. Autrement dit A est l'union disjointe de cubes
6
dyadiques Qj qui satisfont la même propriété et donc pour lesquels
Z
1
|Qj | <
|f (x)|dx.
λ Qj
On conclut en faisant la somme en j .
Exercice 4.
Déduire de (8) que
Z
Z
p
D p
|M D f |p−1 |f |dx.
|M f | dx ≤
p−1
On utilisera l'exercice 1.
En déduire l'inégalité de type fort (p, p) avec la constante
p
.
p−1
Le premier corollaire du théorème maximal dyadique est le théorème
maximal grâce au lemme 2.2, qui permet d'écrire la fonction maximale
comme somme de deux fonctions maximales dyadiques.
D'autre part on voit que démonstration est géométrique et n'utilise
pas les propriétés spéciques de la mesure de Lebesgue. Elle s'étend à
une mesure de Radon quelconque. Il sut, pour cela, de commencer
par s'intéresser à la fonction
Z
1
D
sup
|f (y)| dy
MN f (x) =
x∈Q,|Q|≤2dN |Q| Q
puis de faire tendre N vers +∞.
3.
Martingales dyadiques et autres, convergence des
martingales
Donnons tout d'abord quelques notations. Si Q est un cube dyadique,
on note D(Q) (resp. Dk (Q)) la sous-famille des cubes dyadiques inclus
dans Q (resp. des cubes dyadiques de l'échelle 2−k ). On parle aussi de
la k -ième génération.
Pour reconnaître une martingale, on va se limiter à considérer les
fonctions dénies sur un cube dyadique. Par commodité on se limitera
à la dimension 1 et on prendra l'intervalle I0 = [0, 1). On appelle Fn
la tribu engendrée par les intervalles de Dn (I0 ). Les tribus Fn sont
croissantes et engendrent la tribu borélienne. On va reconnaître en
les moyennes d'une fonction f sur les intervalles dyadiques l'espérance
conditionnelle de la v. a. identiée à f par rapport à la tribu Fn . Plus
précisément,sur un intervalle I de la n-ième génération,
Z
1
E(f |Fn ) =
f (x)dx.
|I| I
7
On rappelle que E(g|Fn ) est Fn -mesurable et possède la propriété caractéristique, parmi les fonctions Fn -mesurables, que, quelle que soit la
fonction h Fn -mesurable
E(E(g|Fn )h) = E(gh).
On reconnaît en la fonction maximale dyadique (restreinte à l'intervalle
I0 ) la fonction maximale au sens des martingales :
Z
1
sup
f (y) dy = sup |E(f |Fn )|(x) = f ∗ (x).
n
x∈I,I∈D(I0 ) |I| I
(Attention, les deux notions ne coïncident que pour les fonctions positives).
L'inégalité que nous avons démontrée correspond à l'inégalité de
Doob pour f positive :
Z
∗
f.
(9)
λP(f > λ) ≤
f ∗ >λ
La démonstration classique en est la suivante : on considère le temps
d'arrêt τ = inf{n; E(f |Fn ) > λ} de sorte que l'évènement f ∗ > λ
coïncide avec l'évènement τ < ∞. Nous allons utiliser les notations
classiques de la théorie des martingales : E(f |Fn ) = fn , et fτ = fn
lorsque τ = n. Il en résulte
que fRτ ≥ λ lorsque τ < ∞. Pour conclure il
R
sut de montrer que τ <∞ fτ = τ <∞ f , ce qui découle de la propriété
caractéristique de l'espérance conditionnelle que nous avons rappelée.
On peut voir la technique utilisée pour les cubes dyadiques de sélection des cubes maximaux comme une technique de temps d'arrêt.
Plus généralement, si on a une suite croissante de tribus Fn sur un
espace de probabilité, on dit que la suite (fn ) dénit une martingale
intégrable si chaque fn est Fn mesurable, si E(fn+1 |Fn ) = fn , et si
supn≥0 E|fn | < ∞. Un cas particulier de martingale est donné par une
fonction f intégrable telle que fn = E(f |Fn ) où f est une fonction intégrable. On peut alors démontrer que la martingale converge de manière
analogue à ce que nous avons fait pour le théorème de diérentiation
de Lebesgue. Mais une martingale n'est pas en général donné ainsi (il
est nécessaire et susant que la martingale soit équi-intégrable). Le cas
dyadique est donné par les moyennes d'une mesure qui est éventuellement non absolument continue par rapport à la mesure de Lebesgue,
qui converge p.p. vers sa dérivée de Radon Nikodym par rapport à
celle-ci.
8
Montrer que si f est dans Lp , avec 1 < p < ∞, alors
fn tend vers f dans Lp . (On pourra utiliser le théorème de Lebesgue,
le majorant étant donné par la fonction maximale).
Exercice 5.
4.
Variables aléatoires de Bernoulli, fonctions de Haar
et inégalité de Khintchine
Les martingales dyadiques peuvent être vues d'une autre manière.
Rappelons tout d'abord qu'une v.a. de Bernoulli (centrée) est une
v. a. qui prend les valeurs −1 et 1 avec probabilité 1/2. Il y a plusieurs manières de considérer une suite innie de v. a. de Bernoulli
indépendantes.
Le groupe Ω = {−1, +1}N est un groupe abélien compact, muni de
la mesure produit dω . Si on considère pour Xj la j -ième fonction
coordonnée, alors les Xj sont indépendantes et sont des v. a. de
Bernoulli. On ajoute X0 = 1.
Les fonctions de Rademacher, qui sont dénies sur [0, 1) (muni
de la mesure de Lebesgue) par rn (t) = sgn sin(2n πt), sont orthogonales et sont de Bernoulli. On peut voir qu'elles sont indépendantes. On ajoute r0 = 1.
Soit une suite (Yn ) de v. a. gaussiennes centrées réduites indépendantes. Alors la suite Xn = sgn Yn forme une suite de Bernoulli
indépendantes.
On peut
dénir rn (t) à partir du développement en base 2 de
Pencore
εn
t : si t = n>0 2n , les développements avec uniquement des 1 à partir
d'un certain rang étant exclus, alors rn (t) = 1 si εn = 0, alors que
rn (t) = −1 sinon.
Le développement dyadique d'un nombre permet de passer de [0, 1) à
{−1, +1}N et de faire se correspondre les fonctions coordonnées d'une
part, les fonctions de Rademacher d'autre part. Ainsi tout énoncé
relatif aux martingales dyadiques peut s'interpréter en termes
de v. a. de Bernoulli.
La tribu Fn peut aussi être vue comme la tribu engendrée par X0 , · · · , Xn .
A partir des fonctions de Rademacher on peut construire une base
2
de LP
([0, 1)) qui présente des analogies avec la base de Fourier : si
j
n= ∞
j=1 εj 2 avec εj ∈ {0, 1} (il y a évidemment un nombre ni de
1), alors la fonction de Walsh wn prend pour valeur le produit des
rj pour lesquels εj vaut 1.
Une autre base a des propriétés remarquables, la base de Haar.
Pour tout intervalle dyadique I , on note I− et I+ les deux intervalles
dyadiques moitié qui le composent. Alors
9

1
1 
−1
hI (x) = p
|I|  0
x ∈ I−
x ∈ I+ .
x∈
/I
Les fonctions de Haar (hI )I∈D forment une base de
L (R). Les fonctions de Haar (hI )I∈D(I0 ) , complétées par 1I0 , forment
une base de L2 (I0 ).
Théorème 4.1.
2
Démonstration. Le fait que ce soit des systèmes orthonormaux est élémentaire. La complétion est une conséquence du théorème de diérentiation de Lebesgue dyadique (ou du théorème de convergence des
martingales). Montrons-le pour L2 (I0 ). Soit I un sous-intervalle dyadique de I0 . On calcule immédiatement les produits scalaires

√|I| 0

I ⊂ I−0


|I |
h1I , 1I0 i = |I|,
h1I , hI 0 i =
− √|I| 0
I ⊂ I−0 .

|I |


0
sinon
On vérie que pour ces fonctions particulières de L2 (I0 ) on a bien
X
f = hf, 1I0 i +
hf, hI 0 ihI 0 .
I0
C'est également vrai pour toute combinaison linéaire de celles-ci, donc
pour toutes les fonctions Fn mesurables. Mais toute fonction f est
limite dans L2 des fn , ce qui permet de conclure.
La base de Haar est la base d'ondelettes la plus simple. Elle est très
utilisée en traitement du signal ou de l'image.
Du fait que hI est orthogonal à toutes les fonctions Fn mesurables,
on déduit que
X
fn+1 − fn =
hf, hI ihI .
I∈Dn (I0 )
Ainsi
tout énoncé relatif aux martingales dyadiques peut s'in-
terpréter en termes de la base de Haar.
Nous allons terminer cette section par l'inégalité de Khintchine :
Théorème 4.2. Soit Xj une suite de v. a. de Bernoulli indépendantes,
P 2
P
X0 = 1. Alors, si
aj < ∞, la somme
aj Xj , qui converge dans L2
p
est aussi convergente dans L pour tout p < ∞ et
X
X
E|
aj Xj |p ≤ Cpp/2 (
a2j )p/2 .
10
Il y a beaucoup de démonstrations de cet énoncé fondamental. La
démonstration qui donne la meilleure constante est due à Haagerup.
Nous allons ici le déduire du cas gaussien.
Démonstration. Nous commençons par démontrer cette inégalité sur
les sommes nies. Soit Yj une suite de v. a. gaussiennes centrées réduites indépendantes, Y0 = 1. On peut supposer
p que Xn = sgn Yn . On
peut même vérier aisément que E(Yn |F) = π4 Xn , où F est la tribu
engendrée par les Xj . Du fait de l'inégalité de Jensen, valable pour
les espérances
conditionnelles, il sut de montrer l'inégalité pour la
PN
somme 0 aj Yj . Mais celle-ci est une gaussienne centrée de variance
PN 2
0 aj . Or le moment d'ordre p d'une gaussienne centrée réduite est
égal à
Z ∞
1
2
√
|t|p e−t /2 dt.
2π −∞
On le calcule aisément en fonction de la fonction Γ et on trouve une
majoration en Cpp/2 .
Pour passer aux sommes innies on utilise le fait que si une suite
converge dans L2 vers f et est majorée en norme par C dans Lp , alors
f est dans Lp , de norme majorée par C .
Montrer que la limite n'est pas bornée en général. Soit
X la somme innie. En utilisant
la même
P
√ démonstration, montrer que
exp λX 2 est intégrable si λ a2j < 1/ π .
Exercice 6.
Corollaire 4.3.
X0 = 1. Alors
Soit Xj une suite de v. a. de Bernoulli indépendantes,
N
X
X
2 1/2
(
aj ) ≤ c sup E aj X j .
N
0
Pour la démonstration il sut de considérer les sommes nies. On
utilise ensuite la log-convexité des moments (conséquence de l'inégalité
de Hölder) :
EZ 2 ≤ (EZ)α (EZ 4 )1−α
si on choisit α de sorte que 2 = α + 4(1 − α) donc α = 2/3. On utilise
ensuite l'inégalité de Khintchine.
Nous allons tout de suite donner une application de l'inégalité de
Khintchine.
Soit T un opérateur borné sur LP (X, dµ), de norme
kT k. Alors l'opérateur s'étend en un opérateur borné sur Lp (X, CN )
avec une norme indépendante de N par la formule
Te(f1 , · · · , fN ) = (T (f1 ), · · · , T (fN )).
Théorème 4.4.
11
Démonstration. Il s'agit de montrer que
X
X
k(
|T fj |2 )1/2 kp ≤ CkT kk(
|fj |2 )1/2 kp
avec C une constante qui ne dépend que de p. Mais
Z 1 X
X
2 p/2
|fj (x)| ) '
|
rj (t)fj (x)|p
0
du fait de l'inégalité de Khintchine (ou son corollaire). Donc
Z Z 1 X
Z X
p
p
|
rj (t)fj (x)|p dµ(x).
|
rj (t)T fj (x)| dµ ≤ kT k
X
X
0
On intègre en t, on change l'ordre des intégrations et on utilise les
inégalités de Khintchine pour conclure.
5.
Transformée de Hilbert et opérateurs de
Calderón-Zygmund
La transformée de Hilbert est le prototype d'un opérateur intégral
singulier. Il est donné formellement sur R par
Z
Z
1
f (y)
f (y)
Hf (x) = v. p.
dy = lim1
dy.
π
x−y
ε→0 π |x−y|>ε x − y
1
C'est la convolution avec la distribution v. p. πx
, qui est bien dénie
1
lorsqu'on la teste sur des fonctions de classe C à support compact. Le
lemme suivant est fondamental quant à son étude :
1
a pour transformée de Fourier la
La distribution v. p. πx
fonction −i sgn. Comme conséquence,
Lemme 5.1.
(10)
d(ξ) = −i sgn ξ fb(ξ).
Hf
1
Une manière de démontrer le lemme est d'écrire que x × v. p. πx
= π1 ,
dont la transformée de Fourier est δπ0 . Comme la dérivation côté Fourier
provient d'une multiplication par −2πix, la transformée de Fourier de
1
1
v. p. πx
a pour dérivée −2iδ0 . On conclut en remarquant que v. p. πx
,
et donc aussi sa transformée de Fourier.
Exercice 7. Montrer que la transformée de Hilbert est un opérateur
unitaire sur L2 . Montrer que l'image d'une fonction de L1 ∩ L2 n'est
pas dans L1 si l'intégrale de f n'est pas nulle.
On aurait pu dénir plus facilement la transformée de Hilbert à partir de (10) puisque cette formule permet de dénir la transformée de
Hilbert d'une fonction de L2 (dont la transformée de Fourier est dans
12
L2 de même norme du fait de l'identité de Plancherel. Mais avec la notion d'opérateur intégral singulier c'est la première dénition que nous
souhaitons généraliser. Dans beaucoup d'applications les opérateurs ne
sont pas invariants par translation, ils ne se présentent pas comme des
convolutions.
On appelle noyau de Calderón-Zygmund toute fonction K mesurable
dans Rd × Rd en dehors de la diagonale pour laquelle il existe deux
constantes positives C et δ telles que
C
|K(x, y)| ≤
,
|x − y|d
C|x − x0 |δ
|x − y|d+δ
C|y − y 0 |δ
|K(x, y) − K(x, y 0 )| ≤
|x − y|n+δ
0
lorsque x 6= y et la condition max(|x − x |, |y − y 0 | ≤ 21 |x − y|, ≤ 21 |x − y|
est réalisée.
|K(x, y) − K(x0 , y)| ≤
Exercice 8. Montrer que le noyau de la transformée de Hilbert est de
Calderón-Zygmund.
Un opérateur est dit opérateur de Calderón-Zygmund de noyau
K s'il est borné dans L2 et s'il est associé au noyau K au sens suivant :
Z
ZZ
g(x)T (f )(x) dx =
g(x)K(x, y)f (y) dy dx
lorsque f et g sont des fonctions régulières dont les supports sont disjoints.
Le théorème principal, dont un des ingrédients est le théorème maximal, est le suivant :
Théorème 5.2. Soit T un opérateur de Calderón-Zygmund. Alors T
est de type faible (1, 1) et de type fort (p, p).
La démonstration est tout à fait classique. Nous donnerons une démonstration analogue dans le cas des martingales dyadiques.
Nous allons montrer très rapidement comment la transformée de Hilbert intervient dans l'étude des processus gaussiens stationnaires et a
mené Szegö à s'intéresser aux inégalités à poids.
Relations avec les processus stationnaires : on considère un processus Gaussien stationnaire discret, c'est-à-dire une suite de v. a. gaussiennes centrées Yn telles que les covariances E(Yj Yk ) ne dépendent que
de la diérence j − k . La suite r, telle que
E(Yj Yk ) = r(j − k)
13
est symétrique
dénie positive : quelle que soit la suite nie (ξj ), la
P
quantité j,k r(j − k)ξj ξk est positive. D'après le théorème de Bochner
(ou de Herglotz), il existe une mesure dµ positive 2π périodique telle
que
Z 2π
e−int dµ(t).
r(n) =
0
On veut savoir s'il y a une prédiction possible. Comme
Z 2π
e−ijt eikt dµ(t)
E(Yj Yk ) =
0
au lieu de projeter sur le passé dans l'espace des gaussiennes on projette
sur l'espace des fonctions 2π périodiques ne faisant intervenir que des
fréquences négatives dans l'espace L2 (dµ). Mais cette projection est
bornée dans L2 (dµ) si et seulement si l'opérateur H per l'est, où celui-ci
est déni par le fait que les coecients de Fourier de f et H per (f ) sont
liés par
cn (H per (f )) = −i sgn(n)cn (f ).
C'est l'analogue de la transformée de Hilbert dans le cadre périodique.
On aurait pu aussi bien se placer dans le cadre de processus continus et
trouver alors la transformée de Hilbert. Helson et Szegö ont donné en
1965 une étonnante caractérisation des mesures dµ à l'aide de méthodes
d'analyse complexe : dµ = wdx et w = exp(u + H per v), où u et v
sont bornés, |u| < π/2. A partir des années 70, on a trouvé d'autres
méthodes et d'autres types de caractérisation.
6.
Inégalités à poids précisées pour la fonction maximale
Soit w une fonction positive localement intégrable dans Rd . On dit
que w est un poids de la classe Ap , 1 < p < ∞ si
p−1
Z
Z
1
1
1
− p−1
(11) [w]Ap = sup
w(y) dy
w(y)
dy
<∞
|Q| Q
|Q| Q
Q
On dit que w est un poids de la classe A1 s'il existe une constante
K telle que
Z
1
w(y) dy ≤ K inf w,
(12)
Q
|Q| Q
et nous noterons dans ce cas [w]A1 la plus petite constante possible.
Exercice 9.
Montrer (inégalité de Jensen) que
1≤p≤q
=⇒
[w]Aq ≤ [w]Ap
i.e.
Ap ⊂ Aq .
14
Le théorème suivant a été une avancée majeure. Il est dû sous sa
première forme à Muckenhoupt (1972). Avec les constantes données ici
il est dû à Buckley (1993). La démonstration que nous en donnons a
été trouvée par Lerner (2008). Pour simplier les notations, on note
w(Q) la mesure de Q relative à la mesure à poids wdx. L'espace Lp
pour la mesure à poids wdx est noté Lp (w).
Théorème 6.1.
valentes :
Soit 1 < p < ∞. Les conditions suivantes sont équi-
(a) w ∈ Ap .
(b) Il existe une constante K telle que pour tout cube Q et toute fonction
f positive
p
Z
Z
1
(13)
f (y) dy w(Q) ≤ [w]Ap
f (y)p w(y)dy
|Q| Q
Q
(c) M est de type faible (p, p) dans Lp (w). De plus
Z
p
(14)
λ
w(x)dx ≤ cd [w]Ap kf kLp (w) .
M f >λ
(d) M est borné sur Lp (w). De plus
(15)
kM kLp (w) ≤
1
cn p
,
[w]Ap−1
p
p−1
Démonstration. Il est clair que (b) est équivalent à (a) si la constante
est supposée égale à 1 dans (13). En eet, si (13) est satisfait avec
1
la constante A à la place de [w]Ap , en prenant f = 1Q w− p−1 , on voit
que w est dans Ap et [w]Ap ≤ A. Réciproquement, si w est dans Ap , il
résulte de l'inégalité de Hölder que
p
p
Z
Z
1
1
1/p −1/p
f dy w(Q) =
fw w
dy w(Q)
|Q| Q
|Q| Q
Z
f (y)p w(y)dy.
≤ [w]Ap
Q
Les autres conditions nécessaires s'obtiennent facilement si on n'essaie pas d'optimiser les constantes : si M est de type fort, alors M
est de type faible. De plus,
si M est de type faible, comme, sur Q, on
R
1
a l'inégalité M f > |Q|
f
dy
, l'inégalité traduisant le fait que l'opéQ
rateur est de type faible (1, 1) donne immédiatement l'inégalité (13)
avec même constante. On montre donc non seulement ainsi toutes les
conditions nécessaires, mais aussi que le fait que la croissance en [w]Ap
de la constante de (14) est optimale.
15
Montrons (c) et (d). Nous avons vu qu'il susait de considérer le
cas dyadique. On suppose donc maintenant que la condition Ap porte
uniquement sur les cubes dyadiques et que la fonction maximale a
été remplacée par la fonction maximale dyadique. Le point clé est le
fait qu'on a aussi bien des théorèmes maximaux lorsque la mesure de
Lebesgue est remplacée par une mesure à poids. On notera σ(x) =
1
w(x)− p−1 et Mw , Mσ les deux opérateurs maximaux correspondants.
Plus précisément, par exemple,
Z
1
Mw f (x) = sup
|f (y)|w(y)dy.
x∈Q w(Q) Q
Nous ne prenons ici que les cubes dyadiques.
Montrons l'inégalité faible (14) pour f > 0. L'inégalité (16) peut
encore se lire
p
Z
Z
1
1
f dy ≤ [w]Ap
f (y)p w(y)dy ≤ [w]Ap Mw (f (x)p )
|Q| Q
w(Q) Q
lorsque x ∈ Q. Comme ceci a lieu pour tout Q contenant x, on en
déduit que
M D f (x)p ≤ [w]Ap Mw (f (x)p ).
L'inégalité faible découle immédiatement de l'inégalité forte pour Mw .
Montrons l'inégalité forte (15). On commence par écrire
1
|Q|
Z
f ≤ [w]
Q
1
p−1
Ap
|Q| 1
w(Q) σ(Q)
Z
f
1
p−1 p−1
.
Q
Quel que soit x ∈ Q, on a
1
σ(Q)
Z
f ≤ Mσ (f σ −1 )(x),
Q
d'où il découle que
1
|Q|
Z
f ≤ [w]
Q
1
p−1
Ap
1
≤ [w] p−1
Ap
1
≤ [w] p−1
Ap
1
p−1 p−1
|Q|
−1
inf Mσ (f σ )
w(Q) Q
1
Z p−1 p−1
1
−1
Mσ (f σ )
w(Q) Q
1
p−1 p−1
−1
−1
Mw w
Mσ (f σ )
(x).
16
Comme cette inégalité a lieu quel que soit le cube contenant x, il en
résulte que
1
p−1 p−1
1
p−1
D
−1
−1
M f ≤ [w]
Mσ (f σ )
Mw w
.
Ap
Pour conclure on commence par utiliser le théorème maximal pour Mw
p
avec l'exposant de Lebesgue p0 = p−1
: on en déduit que
! p1
p
Z p−1 p−1
1
1
kM D f kLp (w) ≤ [w] p−1 p p−1
w−1 Mσ (f σ −1 )
.
wdx
Ap
p
On reconnait σ en w− p−1 w et on utilise le théorème maximal pour Mσ
et pour l'exposant p. On conclut aisément que
1
1
1
p
ep
kM D f kLp (w) ≤
[w] p−1 p p−1 kf kLp (w) ≤
[w] p−1 kf kLp (w) .
p − 1 Ap
p − 1 Ap
Au facteur e près, c'est optimal pour l'inégalité sans poids.
7.
Optimalité du théorème de Buckley et méthode
d'extrapolation de Rubio de Francia
Nous allons suivre Luque, Pérez et Rela pour montrer que le théorème (6.1) est optimal. Plus précisément, nous allons montrer que
Proposition 7.1. Soit p > 1 donné et soit ψ : [1, ∞) → (0, ∞) une
fonction croissante telle que, quel que soit le poids w ∈ Ap et quel que
soit la fonction f positive,
kM f kLp (w) ≤ ψ([w]Ap )kf kLp (w) .
1
Alors il existe des constantes c, c0 telle que ψ(t) ≥ ct p−1 pour t > c0 .
On peut dénir la fonction ψ comme
!
ψ(t) =
sup
sup
w∈Ap ; [w]Ap ≤t
f ∈Lp (w) ; kf kLp (w) =1
kM f kLp (w) .
Démonstration. Pour simplier les notations nous allons supposer que
p = 2, mais la démonstration générale est la même. Nous supposons
donc que, quel que soit le poids w ∈ Ap et quel que soit la fonction f
positive,
(16)
kM f kL2 (w) ≤ ψ([w]A2 )kf kL2 (w) .
Nous allons maintenant utiliser la lettre p pour un exposant variable
inférieur à 2 et que nous ferons tendre vers 1. Rappelons que la plus
petite constante dans l'inégalité maximale (3), que nous notons kM kp ,
17
c
peut être minorée par p−1
. On en déduit qu'il existe pour chaque p > 1
c
une fonction f positive de norme 1 dans Lp et telle que kM f kp ≥ p−1
.
Nous allons maintenant utiliser l'algorithme d'itération de Rubio de
Francia en posant, pour h dans Lp ,
∞
X
1 M k (h)
R(h) =
.
2k kM kkp
k=0
Il est clair qu'on a les propriétés suivantes :
h ≤ R(h)
kR(h)kLp ≤ 2 khkLp ,
[R(h)]A1 ≤ 2 kM kp .
On prend pour poids la fonction w = (Rf )p−2 ), où f est la fonction
choisie au préalable, et on calcule
p
p1
Z p
p
kM f )kLp =
(M f )(Rf ) 2 −1 ) (Rf )p(1− 2 ) dx .
Après utilisation de l'inégalité de Hölder pour les exposants conjugués
2
et (1 − p2 )−1 , on trouve la majoration
p
Z
21 Z
1− p2
2
p−2
p
kM f )kLp ≤
(M f ) (Rf ) dx
(Rf ) dx
.
Après utilisation de (16) pour le poids w choisi, on obtient
Z
21 Z
1− p2
2
p−2
p
f (Rf ) dx
(Rf ) dx
kM f )kLp ≤ ψ([w]A2 )
.
Les propriétés de Rf et le fait que f soit de norme 1 entraînent que
c
ψ([w]A2 ) ≥
.
p−1
Maintenant, en utilisant l'inégalité de Jensen puisque 2 − p < 1, on
trouve que
[w]A2
1 Z
1 Z
p−2
2−p
= sup
(Rf ) dx
(Rf ) dx
|Q| Q
|Q| Q
Q
1 Z
2−p 1 Z
2−p
−1
≤ sup
(Rf ) dx
(Rf )dx
|Q| Q
|Q| Q
Q
C
≤ [Rf ]2−p
.
A2 ≤ [Rf ]A2 ≤ 2kM kp ≤
p−1
Finalement, si on pose t =
C
,
p−1
on a ψ(t) ≥ c0 t.
18
La méthode de Rubio de Francia est très ecace. Elle permet en
particulier de montrer que pour les opérateurs de Calderón- Zygmund
les inégalités Lp sont conséquences des inégalités à poids pour un seul
exposant de Lebesgue p0 , ceci à condition de les avoir pour tout poids
de la classe Ap0 .
La méthode utilisée dans le dernier théorème permet d'obtenir de
nombreuses bornes inférieures, voir [?].
8.
Retour aux martingales
Nous allons tout d'abord montrer que la méthode de Lerner pour
démontrer le théorème de Buckley s'adapte au cas des martingales.
Nous considérons uniquement le cas p = 2 pour simplier, et l'inégalité
forte. Le théorème maximal en toute généralité pour les martingales
a été démontré en 1986 par Jawerth. La démonstration de Lerner est
plus simple en même temps qu'elle donne la constante optimale.
On suppose donnée une suite croissante de tribus Fn sur un espace
de probabilité (Ω, P). La condition A2 pour un poids Z s'écrit dans ce
contexte :
(17)
[Z]A2 = sup E(Z|Fn )E(Z −1 |Fn ) < ∞.
n
On a alors la proposition suivante :
Soit (fn = E(f |Fn ) une martingale positive, f ∗ sa
fonction maximale. Alors
Proposition 8.1.
E((f ∗ )2 Z) ≤ 16[Z]2A2 E((f 2 Z).
Démonstration. Nous l'esquissons seulement. Si on reprend la preuve
du théorème de Buckley, ce qu'il nous faut c'est une majoration ponctuelle de la fonction maximale f ∗ en termes des deux fonctions maximales MZ et MU , où on a remplacé la loi de probabilité initiale par la
loi ZdP et la loi U dP, avec U = Z −1 . Il s'agit donc de montrer que
h i
∗
f ≤ [Z]A2 MZ U MU (f Z) ,
la démonstration étant ensuite identique. Mais de la dénition de l'espérance conditionnelle (avec des notations évidentes pour les nouvelles
probabilités) on déduit que
E(f |Fn ) = E(U |Fn )EU (f Z|Fn )
et, pour les mêmes raisons,
1 = E(Z|Fn )EZ (U |Fn ).
19
On en déduit que
E(f |Fn ) = E(U |Fn )E(Z|Fn )EZ (U EU (f Z|Fn )|Fn ).
On a donc la majoration
E(f |Fn ) ≤ [Z]A2 EZ (U MU (f Z)|Fn ).
On passe au supremum pour conclure.
Nous allons maintenant dénir les transformées de martingales, à
la fois en général et plus spéciquement pour les martingales dyadiques.
Etant donnée une suite vn de fonctions Fn−1 mesurables (suite prévisible) la fonction v0 étant constante, on dénit l'opérateur Tv comme
l'opérateur qui à la martingale (fn )n≥0 fait correspondre la martingale
(gn ) dénie par les égalités
g0 = v 0 f 0
gn − gn−1 = vn (fn − fn−1 ),
n ≥ 1.
La suite dn = fn −fn−1 est appelée suite des diérences de la martingale.
On pose d0 = f0 . Le fait que (fn ) est une martingale se traduit par le
fait que
E(dn |Fn−1 ) = 0.
Avec ces notations on voit immédiatement que la n-ième diérence de
Tv f est donnée par vn dn .
On a le lemme suivant :
L'opérateur Tv est borné dans L2 si (et seulement si) la
suite vn est bornée.
Lemme 8.2.
C'est une conséquence immédiate du fait que
X
kf k22 = sup kfn k22 =
E(d2n ).
n≥0
On démontre tout d'abord la formule lorsque dn = 0 à partir d'un
certain rang. C'est alors une conséquence du fait que les dn sont orthogonaux :
E(dn dn+k ) = E(E(dn dn+k |Fn )) = E(dn E(dn+k |Fn )) = 0.
Exercice 10. Montrer que la condition est nécessaire pour les martingales dyadiques.
Pour les martingales dyadiques de l'intervalle I0 , il est facile de voir
les transformées de martingales dans la base de Haar : soit I un intervalle de la n-ième génération. La fonction vn est constante sur I . Si αI
20
est sa valeur sur I , on a Tv (hI ) = αI hI . Pour une fonction f dans L2
quelconque,
X
Tv (f ) =
αI hf, hI ihI + α0 1I0 .
I
Cette transformation est ce qu'on appelle un multiplicateur de Haar.
Son nom est dû au fait qu'elle se diagonalise dans la base de Haar. On
dénit de la même manière un multiplicateur de Haar sur R entier.
Nous noterons plutôt Tα la transformation dans ce cas. A nouveau le
théorème principal, dont un des ingrédients est le théorème maximal,
est le suivant :
Soit Tv une transformée de martingale, avec supn |vn | ≤
1. Alors Tv est de type faible (1, 1) et de type fort (p, p).
Théorème 8.3.
Ce théorème est essentiellement dû à Burkholder. Il sut de montrer l'inégalité faible (1, 1). La démonstration générale comporte des
dicultés liées aux sauts de la martingale dans le cas général. Nous
allons le montrer dans le cas dyadique. Plus précisément nous allons
considérer un multiplicateur de Haar dans R donné par la suite αI telle
que |αI | ≤ 1.
Démonstration. Il sut de montrer que
|{Tα f ≥ λ}| ≤ Ckf kL1
lorsque f possède seulement un nombre ni de termes non nuls dans la
base de Haar. La propriété spécique de Tα est la suivante :
Si φ est à support dans I et d'intégrale nulle, alors
2
Tα (φ) =
I 0 ⊂I αI 0 hI 0 est à support dans I et de norme L majorée
par celle de φ.
Lemme 8.4.
P
Le point-clé est la décomposition de Calderón-Zygmund de la
fonction f . On suppose donné λ > 0. On rappelle que l'ensemble des
points x ∈ I pour lesquels la fonction maximale dyadique de f est
supérieure à λ est la réunion des intervalles dyadiques maximaux Ij
pour lesquels
Z
w > λ|Ij |.
Ij
Mais, par maximalité, on a aussi que
Z
w ≤ 2λ|Ij |.
Ij
Donc, si on pose f = g + b (ou encore f = fτ + (f − fτ )) avec
21
g(x) =
1
|Ij |
Rf (x)
f (y)dy
Ij
si x
n'appartient à aucun des Ij
.
si x ∈ Ij
Alors |g| ≤ 2λ et Tα b est à support dans la réunion des Ij , c'est-à-dire
dans l'ensemble où M D f > λ. Donc
1
|{Tα f ≥ λ}| ≤ |{M D f ≥ λ}| + |{Tα g ≥ λ}| ≤ kf k1 .
λ
On a utilisé le fait que
k{Tα gk2 ≤ 2λkgk1 ≤ λkf k1 .
En utilisant le théorème de Khintchine on en déduit immédiatement
que
X
k(
E(d2n ))1/2 kp ≤ Cp kf kp .
n≥0
P
La quantité ( n≥0 E(d2n ))1/2 est la
gale.
9.
fonction carrée de la martin-
Retour sur les conditions
Ap
Le but de cette section est de donner un aperçu d'autres aspects de
la théorie de Calderón-Zygmund. Une des propriétés importantes des
poids Ap est le fait qu'un tel poids w satisfait à des inégalité de Hölder
inverses : il existe r > 1 tel que
1/r
Z
Z
1
c
r
w
w.
≤
|Q| Q
|Q| Q
C'est une propriété fondamentale, due à Gehring, qui joue en particulier
un rôle important dans la théorie des fonctions quasi-conformes. Nous
allons montrer une propriété de ce type, avec une valeur de r explicite,
quand w est dans la classe A1 , qui est, rappelons-le, plus petite. Nous
suivons Lerner, Ambrosi et Pérez (2008) qui donnent des constantes
très précises. Ces résultats ont depuis été améliorés avec des versions
Ap .
Proposition 9.1.
Soit w un poids sur Rd tel que
M D w ≤ [w]A1 w.
Alors, si r = 1 + 1/(2d+1 [w]A1 ), on a l'inégalité pour tout cube dyadique
1/r
Z
Z
1
2[w]A1
r
w
≤
w.
|Q| Q
|Q| Q
22
Démonstration. Nous considérerons pour simplier uniquement le cas
d = 1 mais la démonstration est la même en dimension supérieure. Nous
revenons au théorème maximal pour la mesure wdx et pour la fonction
w dans l'intervalle dyadique I . On suppose que λ est plus grand que la
moyenne hwiI de w sur I . On rappelle que l'ensemble des points x ∈ I
pour lesquels la fonction maximale dyadique de w (restreinte à I ) est
supérieure à λ est la réunion des intervalles dyadiques maximaux Ij
pour lesquels
Z
w > λ|Ij |.
Ij
Mais, par maximalité, on a aussi que
Z
w ≤ 2λ|Ij |.
Ij
Donc
Z
MID w>λ
On calcule
Z
Z
D
δ
(MI w) wdx = δ
I
0
wdx ≤ 2|MID w > λ|.
∞
λδ−1
Z
!
w dλ
MID >λ
Z
Z
1
2δ
δ+1
≤
+
(M D w)δ+1 dx.
( wdx)
|I|δ I
δ+1 I I
Avec le choix proposé pour δ on peut faire passer le second terme du
membre de droite à gauche et conclure.
A compléter