Analyse harmonique dyadique : une introduction Aline Bonami [email protected] Ces notes sont une incitation, pour les probabilistes, à s'intéresser à l'analyse réelle. Pour les analystes, leur but est de montrer à quel point les probabilités jouent un rôle central dans l'analyse réelle, qu'il s'agisse de construire des contre-exemples avec des méthodes aléatoires ou d'y trouver les raisons pour lesquelles on s'est intéressé à tel ou tel problème. L'analyse harmonique dyadique joue un rôle évident de passerelle. Le développement prodigieux des inégalités à poids autour de la conjecture A2 donne la possibilité d'illustrer ces convergences entre les deux domaines avec des résultats très récents. Il y a de nombreux textes qui permettent aux spécialistes de trouver une présentation exhaustive (par exemple le texte de Cristina Pereyra dans Contemporary Maths. Ce n'est pas le but de celui-ci, qu'il faut plutôt voir comme une introduction à la théorie de Calderón-Zygmund à poids entraînant le lecteur dans une sorte de promenade qui lui permet de s'initier à quelques méthodes d'analyse réelle dans des situations simples. Il s'agit d'une version provisoire, mise en ligne après l'école de recherche d'Abidjan. Elles seront complétés ultérieurement, en particulier par une bibliographie 1. Fonction maximale et convergence presque partout Notre point de départ est le théorème de Hardy-Littlewood, relatif à la fonction maximale de Hardy-Littlewood, dénie dès que f est localement intégrable sur Rd par Z 1 |f (y)| dy M f (x) = sup x∈Q |Q| Q où le supremum est pris sur tous les cubes (à côtés parallèles aux axes) contenant x. La fonction maximale intervient naturellement dans beaucoup de problèmes. Le premier exemple d'application est le théorème de diérentiation de Lebesgue, qui permet d'armer que si f est localement intégrable alors, presque partout, Z 1 (1) f (x) = lim f (y) dy. r→0 |B(x, r)| B(x,r) Ici B(x, r) désigne la boule de centre x et de rayon r. 1 2 La propriété cruciale de l'opérateur M est l'inégalité faible L1 du théorème maximal. (théorème maximal) [HardyLittlewoodWiener] M est de type faible (1, 1) c'est-à-dire Théorème 1.1. ckf kL1 . λ De plus M est de type fort (p, p), 1 < p < ∞. Plus précisément, cp (2) kM f k p ≤ kf k p . L L p−1 |{M f > λ}| ≤ Ici |A| désigne la mesure de l'ensemble mesurable A pour la mesure de Lebesgue. Les constantes c dépendent de la dimension. La détermination des meilleures constantes est encore en partie inconnue. Voir le blog de Tao http ://terrytao.wordpress.com/2011/05/21/steins-spherical-maximaltheorem/ Exercice 1. Montrer que, quelle que soit la fonction φ positive sur l'espace mesuré (X, µ), on a la formule Z ∞ Z dt p tp µ({x ∈ X : φ(x) > t}) . φ dµ = p t 0 X Exercice 2. Montrer que l'inégalité faible (1, 1) entraîne l'inégalité forte (p, p). Indication : on pourra écrire f = g + h avec g = f 1|f |>λ/2 et en déduire que {M f > λ} ⊂ {M g > λ/2}. Exercice 3. Montrer que si f est la fonction indicatrice de la boule unité centrée en 0, alors M f (x) ≥ c|x|−d à l'inni. En déduire qu'il n'y a pas d'inégalité forte (1, 1). En déduire que la plus petite constante dans l'inégalité (3) est supérieure à l'autre). kM f k Lp c p−1 ≤ Akf k Lp (les constantes c peuvent changer d'une ligne à L'exercice 2 donne un cas particulier du théorème de Marcinkiewicz, que nous énonçons maintenant. Si T est un opérateur (linéaire, sous-linéaire) qui est de type faible (p0 , q0 ) et de type faible (p1 , q1 ), avec 1 ≤ p0 ≤ q0 ≤ ∞ et Théorème 1.2. 3 1 ≤ p1 ≤ q1 ≤ ∞, alors T est de type fort (p, q) pour tout p ∈ (p0 , p1 ) si p et q sont tels que 1 t 1−t = + p p0 p1 1 t 1−t = + . q q0 q1 Rappelons que les hypothèses et conclusions peuvent encore s'écrire q c kf k 0 Hypothèses : µ({x ∈ X : |T f (x)| > λ}) ≤ 0 λq0 p0 ; µ({x ∈ X : |T f (x)| > λ}) ≤ c1 kf kqp11 . λq1 Conclusion : kf kq ≤ ckf kp . Nous allons montrer le théorème de diérentiation de Lebesgue à partir du théorème maximal, que nous démontrerons plus tard. Il s'agit d'une démonstration modèle, qui sert de modèle à de nombreuses démonstrations. Démonstration du théorème de diérentiation de Lebesgue Soit f une fonction localement intégrable. Nous allons montrer qu'il existe un ensemble Lf dit ensemble de Lebesgue dont le complémentaire est de mesure 0 et tel que Z 1 (4) f (x) = lim f (y) dy x ∈ Lf r→0 |B(x, r)| B(x,r) Nous allons même montrer un résultat plus fort, l'existence de Lf tel que Z 1 |f (y) − f (x)| dy = 0 x∈ / Lf . (5) lim r→0 |B(x, r)| B(x,r) Comme la conclusion est locale (elle ne dépend que des valeurs de f autour du point considéré), nous pouvons supposer f intégrable. Nous dénissons Z 1 Aλ = {x : lim sup |f (y) − f (x)| dy > λ} λ ≥ 0. |B(x, r)| B(x,r) r→0 On veut montrer que |A0 | = 0. Comme A0 = ∪j A1/j il sut de montrer que |Aλ | = 0 pour tout λ > 0. Il est important de remarquer que (5) est satisfait quand f est continue. Or le sous-espace des fonctions continues est dense dans L1 . Si f ∈ L1 (Rd ) est une fonction quelconque, pour ε > 0 donné on peut l'écrire f = g + h avec g continue et khkL1 (Rd ) < ε. Comme la limite supérieure d'une somme est inférieure ou égale à la 4 somme des limites supérieures, et comme la limite pour g vaut 0, Z 1 lim sup |f (y) − f (x)| dy |B(x, r)| B(x,r) r→0 R 1 ≤ lim sup |B(x,r)| |h(y) − h(x)| dy. B(x,r) r→0 Nous avons immédiatement, pour x ∈ Aλ , Z 1 (6) λ < sup |h(y) − h(x)| dy r>0 |B(x, r)| B(x,r) Z 1 ≤ |h(x)| + sup (7) |h(y)| dy. r>0 |B(x, r)| B(x,r) Le second terme est déni comme la fonction maximale, mais avec des boules centrées en x à la place des cubes contenant x. Or la boule B(x, r) est incluse dans un cube qui centré en x et de volume (2r)d = κd |B(x, r)|. Ce second terme est donc majoré par κd M h(x). On en déduit que |Aλ | ≤ |{x ∈ Rd : κd M h(x) > λ/2}| + |{x ∈ Rd : |h(x)| > λ/2}| On utilise ensuite l'inégalité maximale pour le nouveau premier terme, l'inégalité de Tchebychev pour le second : Z 2(κd c + 1) 2(κd c + 1) |h(x)| dx ≤ ε |Aλ | ≤ λ λ Rd En faisant tendre ε vers 0 on obtient que |Aλ | = 0. 2. Cubes dyadiques, théorème maximal dyadique Un intervalle dyadique de R est un intervalle [2−k n, 2−k (n + 1)), avec n, k ∈ Z. Le paramètre k (ou, suivant les cas, 2−k est appelé paramètre d'échelle. On note D l'ensemble des intervalles dyadiques et Dk le sous ensemble constitué des intervalles I ∈ Dk tels que |I| = 2−k . Les propriétés suivantes sont très faciles à montrer : A l'échelle k les intervalles dyadiques forment une partition de R. D est invariant par la dilatation x 7→ 2x. Autrement dit, si I est un intervalle dyadique, alors 2I est aussi un intervalle dyadique, et réciproquement. Chaque intervalle dyadique I est réunion disjointe de deux intervalles de l'échelle moitié. Si I, I 0 sont deux intervalles dyadiques, alors l'un est inclus dans l'autre ou bien les deux intervalles sont disjoints. Ces propriétés impliquent le lemme suivant. 5 Soit L une collection d'intervalles dyadiques I de taille bornée. Si Lmax désigne la sous-collection des intervalles dyadiques maximaux pour l'inclusion, alors ceux-ci sont deux à deux disjoints et tout intervalle de L est inclus dans un intervalle de Lmax . Lemme 2.1. On dénit dans Rd les cubes dyadiques comme des produits d'intervalles dyadiques de la même longueur. Il est facile de voir que les propriétés précédentes s'étendent à plusieurs dimensions. On dénit la fonction maximale dyadique par Z 1 D M f (x) = sup |f (y)| dy x∈Q |Q| Q où le supremum est pris sur tous les cubes dyadiques Q contenant x. Cette fonction maximale est a priori plus petite, mais on peut contrôler la fonction maximale en termes de celle-ci grâce à la propriété suivante (qui n'a été observée sous cette forme qu'assez récemment !). Notons tout d'abord Dα , pour α ∈ {0, 1/3}d , la collection des cubes 2−k ([0, 1)d + j + (−1)k α), avec k ∈ Z et j ∈ Zd . La famille Dα possède toutes les propriétés que nous avons énoncées pour la famille des cubes dyadiques. Tout cube Q d'arête ` est inclus dans un cube Q0 d'échelle k appartenant à une des familles Dα et tel que 2k ≤ 6`. Lemme 2.2. Démonstration. Nous allons faire uniquement la preuve en dimension 1. Soit k tel que 2−k−1 ≤ 3` < 2−k . Si l'intervalle I ne contient aucun point de la forme 2−k j , alors il est tout entier contenu dans un cube dyadique classique de taille 2−k < 6`. Supposons que I contienne un point de la forme 2−k j . Alors il ne contient aucun point de la forme 2−k (j ± 1/3). Il est donc contenu dans un intervalle de la seconde famille. Nous pouvons maintenant démontrer une inégalité qui est meilleure que l'inégalité maximale dyadique, et pour laquelle la constante vaut 1: Z D (8) λ|{M f > λ}| ≤ |f (x)|dx. M D f >λ Démonstration. Soit A = {M D f > λ}. On peut aussi écrire A comme l'union des cubes dyadiques Q tels que Z 1 |f (x)|dx > λ. |Q| Q R |f (x)|dx Ces cubes sont de volume borné par , donc bornés, et on peut λ utiliser le lemme 2.1. Autrement dit A est l'union disjointe de cubes 6 dyadiques Qj qui satisfont la même propriété et donc pour lesquels Z 1 |Qj | < |f (x)|dx. λ Qj On conclut en faisant la somme en j . Exercice 4. Déduire de (8) que Z Z p D p |M D f |p−1 |f |dx. |M f | dx ≤ p−1 On utilisera l'exercice 1. En déduire l'inégalité de type fort (p, p) avec la constante p . p−1 Le premier corollaire du théorème maximal dyadique est le théorème maximal grâce au lemme 2.2, qui permet d'écrire la fonction maximale comme somme de deux fonctions maximales dyadiques. D'autre part on voit que démonstration est géométrique et n'utilise pas les propriétés spéciques de la mesure de Lebesgue. Elle s'étend à une mesure de Radon quelconque. Il sut, pour cela, de commencer par s'intéresser à la fonction Z 1 D sup |f (y)| dy MN f (x) = x∈Q,|Q|≤2dN |Q| Q puis de faire tendre N vers +∞. 3. Martingales dyadiques et autres, convergence des martingales Donnons tout d'abord quelques notations. Si Q est un cube dyadique, on note D(Q) (resp. Dk (Q)) la sous-famille des cubes dyadiques inclus dans Q (resp. des cubes dyadiques de l'échelle 2−k ). On parle aussi de la k -ième génération. Pour reconnaître une martingale, on va se limiter à considérer les fonctions dénies sur un cube dyadique. Par commodité on se limitera à la dimension 1 et on prendra l'intervalle I0 = [0, 1). On appelle Fn la tribu engendrée par les intervalles de Dn (I0 ). Les tribus Fn sont croissantes et engendrent la tribu borélienne. On va reconnaître en les moyennes d'une fonction f sur les intervalles dyadiques l'espérance conditionnelle de la v. a. identiée à f par rapport à la tribu Fn . Plus précisément,sur un intervalle I de la n-ième génération, Z 1 E(f |Fn ) = f (x)dx. |I| I 7 On rappelle que E(g|Fn ) est Fn -mesurable et possède la propriété caractéristique, parmi les fonctions Fn -mesurables, que, quelle que soit la fonction h Fn -mesurable E(E(g|Fn )h) = E(gh). On reconnaît en la fonction maximale dyadique (restreinte à l'intervalle I0 ) la fonction maximale au sens des martingales : Z 1 sup f (y) dy = sup |E(f |Fn )|(x) = f ∗ (x). n x∈I,I∈D(I0 ) |I| I (Attention, les deux notions ne coïncident que pour les fonctions positives). L'inégalité que nous avons démontrée correspond à l'inégalité de Doob pour f positive : Z ∗ f. (9) λP(f > λ) ≤ f ∗ >λ La démonstration classique en est la suivante : on considère le temps d'arrêt τ = inf{n; E(f |Fn ) > λ} de sorte que l'évènement f ∗ > λ coïncide avec l'évènement τ < ∞. Nous allons utiliser les notations classiques de la théorie des martingales : E(f |Fn ) = fn , et fτ = fn lorsque τ = n. Il en résulte que fRτ ≥ λ lorsque τ < ∞. Pour conclure il R sut de montrer que τ <∞ fτ = τ <∞ f , ce qui découle de la propriété caractéristique de l'espérance conditionnelle que nous avons rappelée. On peut voir la technique utilisée pour les cubes dyadiques de sélection des cubes maximaux comme une technique de temps d'arrêt. Plus généralement, si on a une suite croissante de tribus Fn sur un espace de probabilité, on dit que la suite (fn ) dénit une martingale intégrable si chaque fn est Fn mesurable, si E(fn+1 |Fn ) = fn , et si supn≥0 E|fn | < ∞. Un cas particulier de martingale est donné par une fonction f intégrable telle que fn = E(f |Fn ) où f est une fonction intégrable. On peut alors démontrer que la martingale converge de manière analogue à ce que nous avons fait pour le théorème de diérentiation de Lebesgue. Mais une martingale n'est pas en général donné ainsi (il est nécessaire et susant que la martingale soit équi-intégrable). Le cas dyadique est donné par les moyennes d'une mesure qui est éventuellement non absolument continue par rapport à la mesure de Lebesgue, qui converge p.p. vers sa dérivée de Radon Nikodym par rapport à celle-ci. 8 Montrer que si f est dans Lp , avec 1 < p < ∞, alors fn tend vers f dans Lp . (On pourra utiliser le théorème de Lebesgue, le majorant étant donné par la fonction maximale). Exercice 5. 4. Variables aléatoires de Bernoulli, fonctions de Haar et inégalité de Khintchine Les martingales dyadiques peuvent être vues d'une autre manière. Rappelons tout d'abord qu'une v.a. de Bernoulli (centrée) est une v. a. qui prend les valeurs −1 et 1 avec probabilité 1/2. Il y a plusieurs manières de considérer une suite innie de v. a. de Bernoulli indépendantes. Le groupe Ω = {−1, +1}N est un groupe abélien compact, muni de la mesure produit dω . Si on considère pour Xj la j -ième fonction coordonnée, alors les Xj sont indépendantes et sont des v. a. de Bernoulli. On ajoute X0 = 1. Les fonctions de Rademacher, qui sont dénies sur [0, 1) (muni de la mesure de Lebesgue) par rn (t) = sgn sin(2n πt), sont orthogonales et sont de Bernoulli. On peut voir qu'elles sont indépendantes. On ajoute r0 = 1. Soit une suite (Yn ) de v. a. gaussiennes centrées réduites indépendantes. Alors la suite Xn = sgn Yn forme une suite de Bernoulli indépendantes. On peut dénir rn (t) à partir du développement en base 2 de Pencore εn t : si t = n>0 2n , les développements avec uniquement des 1 à partir d'un certain rang étant exclus, alors rn (t) = 1 si εn = 0, alors que rn (t) = −1 sinon. Le développement dyadique d'un nombre permet de passer de [0, 1) à {−1, +1}N et de faire se correspondre les fonctions coordonnées d'une part, les fonctions de Rademacher d'autre part. Ainsi tout énoncé relatif aux martingales dyadiques peut s'interpréter en termes de v. a. de Bernoulli. La tribu Fn peut aussi être vue comme la tribu engendrée par X0 , · · · , Xn . A partir des fonctions de Rademacher on peut construire une base 2 de LP ([0, 1)) qui présente des analogies avec la base de Fourier : si j n= ∞ j=1 εj 2 avec εj ∈ {0, 1} (il y a évidemment un nombre ni de 1), alors la fonction de Walsh wn prend pour valeur le produit des rj pour lesquels εj vaut 1. Une autre base a des propriétés remarquables, la base de Haar. Pour tout intervalle dyadique I , on note I− et I+ les deux intervalles dyadiques moitié qui le composent. Alors 9 1 1 −1 hI (x) = p |I| 0 x ∈ I− x ∈ I+ . x∈ /I Les fonctions de Haar (hI )I∈D forment une base de L (R). Les fonctions de Haar (hI )I∈D(I0 ) , complétées par 1I0 , forment une base de L2 (I0 ). Théorème 4.1. 2 Démonstration. Le fait que ce soit des systèmes orthonormaux est élémentaire. La complétion est une conséquence du théorème de diérentiation de Lebesgue dyadique (ou du théorème de convergence des martingales). Montrons-le pour L2 (I0 ). Soit I un sous-intervalle dyadique de I0 . On calcule immédiatement les produits scalaires √|I| 0 I ⊂ I−0 |I | h1I , 1I0 i = |I|, h1I , hI 0 i = − √|I| 0 I ⊂ I−0 . |I | 0 sinon On vérie que pour ces fonctions particulières de L2 (I0 ) on a bien X f = hf, 1I0 i + hf, hI 0 ihI 0 . I0 C'est également vrai pour toute combinaison linéaire de celles-ci, donc pour toutes les fonctions Fn mesurables. Mais toute fonction f est limite dans L2 des fn , ce qui permet de conclure. La base de Haar est la base d'ondelettes la plus simple. Elle est très utilisée en traitement du signal ou de l'image. Du fait que hI est orthogonal à toutes les fonctions Fn mesurables, on déduit que X fn+1 − fn = hf, hI ihI . I∈Dn (I0 ) Ainsi tout énoncé relatif aux martingales dyadiques peut s'in- terpréter en termes de la base de Haar. Nous allons terminer cette section par l'inégalité de Khintchine : Théorème 4.2. Soit Xj une suite de v. a. de Bernoulli indépendantes, P 2 P X0 = 1. Alors, si aj < ∞, la somme aj Xj , qui converge dans L2 p est aussi convergente dans L pour tout p < ∞ et X X E| aj Xj |p ≤ Cpp/2 ( a2j )p/2 . 10 Il y a beaucoup de démonstrations de cet énoncé fondamental. La démonstration qui donne la meilleure constante est due à Haagerup. Nous allons ici le déduire du cas gaussien. Démonstration. Nous commençons par démontrer cette inégalité sur les sommes nies. Soit Yj une suite de v. a. gaussiennes centrées réduites indépendantes, Y0 = 1. On peut supposer p que Xn = sgn Yn . On peut même vérier aisément que E(Yn |F) = π4 Xn , où F est la tribu engendrée par les Xj . Du fait de l'inégalité de Jensen, valable pour les espérances conditionnelles, il sut de montrer l'inégalité pour la PN somme 0 aj Yj . Mais celle-ci est une gaussienne centrée de variance PN 2 0 aj . Or le moment d'ordre p d'une gaussienne centrée réduite est égal à Z ∞ 1 2 √ |t|p e−t /2 dt. 2π −∞ On le calcule aisément en fonction de la fonction Γ et on trouve une majoration en Cpp/2 . Pour passer aux sommes innies on utilise le fait que si une suite converge dans L2 vers f et est majorée en norme par C dans Lp , alors f est dans Lp , de norme majorée par C . Montrer que la limite n'est pas bornée en général. Soit X la somme innie. En utilisant la même P √ démonstration, montrer que exp λX 2 est intégrable si λ a2j < 1/ π . Exercice 6. Corollaire 4.3. X0 = 1. Alors Soit Xj une suite de v. a. de Bernoulli indépendantes, N X X 2 1/2 ( aj ) ≤ c sup E aj X j . N 0 Pour la démonstration il sut de considérer les sommes nies. On utilise ensuite la log-convexité des moments (conséquence de l'inégalité de Hölder) : EZ 2 ≤ (EZ)α (EZ 4 )1−α si on choisit α de sorte que 2 = α + 4(1 − α) donc α = 2/3. On utilise ensuite l'inégalité de Khintchine. Nous allons tout de suite donner une application de l'inégalité de Khintchine. Soit T un opérateur borné sur LP (X, dµ), de norme kT k. Alors l'opérateur s'étend en un opérateur borné sur Lp (X, CN ) avec une norme indépendante de N par la formule Te(f1 , · · · , fN ) = (T (f1 ), · · · , T (fN )). Théorème 4.4. 11 Démonstration. Il s'agit de montrer que X X k( |T fj |2 )1/2 kp ≤ CkT kk( |fj |2 )1/2 kp avec C une constante qui ne dépend que de p. Mais Z 1 X X 2 p/2 |fj (x)| ) ' | rj (t)fj (x)|p 0 du fait de l'inégalité de Khintchine (ou son corollaire). Donc Z Z 1 X Z X p p | rj (t)fj (x)|p dµ(x). | rj (t)T fj (x)| dµ ≤ kT k X X 0 On intègre en t, on change l'ordre des intégrations et on utilise les inégalités de Khintchine pour conclure. 5. Transformée de Hilbert et opérateurs de Calderón-Zygmund La transformée de Hilbert est le prototype d'un opérateur intégral singulier. Il est donné formellement sur R par Z Z 1 f (y) f (y) Hf (x) = v. p. dy = lim1 dy. π x−y ε→0 π |x−y|>ε x − y 1 C'est la convolution avec la distribution v. p. πx , qui est bien dénie 1 lorsqu'on la teste sur des fonctions de classe C à support compact. Le lemme suivant est fondamental quant à son étude : 1 a pour transformée de Fourier la La distribution v. p. πx fonction −i sgn. Comme conséquence, Lemme 5.1. (10) d(ξ) = −i sgn ξ fb(ξ). Hf 1 Une manière de démontrer le lemme est d'écrire que x × v. p. πx = π1 , dont la transformée de Fourier est δπ0 . Comme la dérivation côté Fourier provient d'une multiplication par −2πix, la transformée de Fourier de 1 1 v. p. πx a pour dérivée −2iδ0 . On conclut en remarquant que v. p. πx , et donc aussi sa transformée de Fourier. Exercice 7. Montrer que la transformée de Hilbert est un opérateur unitaire sur L2 . Montrer que l'image d'une fonction de L1 ∩ L2 n'est pas dans L1 si l'intégrale de f n'est pas nulle. On aurait pu dénir plus facilement la transformée de Hilbert à partir de (10) puisque cette formule permet de dénir la transformée de Hilbert d'une fonction de L2 (dont la transformée de Fourier est dans 12 L2 de même norme du fait de l'identité de Plancherel. Mais avec la notion d'opérateur intégral singulier c'est la première dénition que nous souhaitons généraliser. Dans beaucoup d'applications les opérateurs ne sont pas invariants par translation, ils ne se présentent pas comme des convolutions. On appelle noyau de Calderón-Zygmund toute fonction K mesurable dans Rd × Rd en dehors de la diagonale pour laquelle il existe deux constantes positives C et δ telles que C |K(x, y)| ≤ , |x − y|d C|x − x0 |δ |x − y|d+δ C|y − y 0 |δ |K(x, y) − K(x, y 0 )| ≤ |x − y|n+δ 0 lorsque x 6= y et la condition max(|x − x |, |y − y 0 | ≤ 21 |x − y|, ≤ 21 |x − y| est réalisée. |K(x, y) − K(x0 , y)| ≤ Exercice 8. Montrer que le noyau de la transformée de Hilbert est de Calderón-Zygmund. Un opérateur est dit opérateur de Calderón-Zygmund de noyau K s'il est borné dans L2 et s'il est associé au noyau K au sens suivant : Z ZZ g(x)T (f )(x) dx = g(x)K(x, y)f (y) dy dx lorsque f et g sont des fonctions régulières dont les supports sont disjoints. Le théorème principal, dont un des ingrédients est le théorème maximal, est le suivant : Théorème 5.2. Soit T un opérateur de Calderón-Zygmund. Alors T est de type faible (1, 1) et de type fort (p, p). La démonstration est tout à fait classique. Nous donnerons une démonstration analogue dans le cas des martingales dyadiques. Nous allons montrer très rapidement comment la transformée de Hilbert intervient dans l'étude des processus gaussiens stationnaires et a mené Szegö à s'intéresser aux inégalités à poids. Relations avec les processus stationnaires : on considère un processus Gaussien stationnaire discret, c'est-à-dire une suite de v. a. gaussiennes centrées Yn telles que les covariances E(Yj Yk ) ne dépendent que de la diérence j − k . La suite r, telle que E(Yj Yk ) = r(j − k) 13 est symétrique dénie positive : quelle que soit la suite nie (ξj ), la P quantité j,k r(j − k)ξj ξk est positive. D'après le théorème de Bochner (ou de Herglotz), il existe une mesure dµ positive 2π périodique telle que Z 2π e−int dµ(t). r(n) = 0 On veut savoir s'il y a une prédiction possible. Comme Z 2π e−ijt eikt dµ(t) E(Yj Yk ) = 0 au lieu de projeter sur le passé dans l'espace des gaussiennes on projette sur l'espace des fonctions 2π périodiques ne faisant intervenir que des fréquences négatives dans l'espace L2 (dµ). Mais cette projection est bornée dans L2 (dµ) si et seulement si l'opérateur H per l'est, où celui-ci est déni par le fait que les coecients de Fourier de f et H per (f ) sont liés par cn (H per (f )) = −i sgn(n)cn (f ). C'est l'analogue de la transformée de Hilbert dans le cadre périodique. On aurait pu aussi bien se placer dans le cadre de processus continus et trouver alors la transformée de Hilbert. Helson et Szegö ont donné en 1965 une étonnante caractérisation des mesures dµ à l'aide de méthodes d'analyse complexe : dµ = wdx et w = exp(u + H per v), où u et v sont bornés, |u| < π/2. A partir des années 70, on a trouvé d'autres méthodes et d'autres types de caractérisation. 6. Inégalités à poids précisées pour la fonction maximale Soit w une fonction positive localement intégrable dans Rd . On dit que w est un poids de la classe Ap , 1 < p < ∞ si p−1 Z Z 1 1 1 − p−1 (11) [w]Ap = sup w(y) dy w(y) dy <∞ |Q| Q |Q| Q Q On dit que w est un poids de la classe A1 s'il existe une constante K telle que Z 1 w(y) dy ≤ K inf w, (12) Q |Q| Q et nous noterons dans ce cas [w]A1 la plus petite constante possible. Exercice 9. Montrer (inégalité de Jensen) que 1≤p≤q =⇒ [w]Aq ≤ [w]Ap i.e. Ap ⊂ Aq . 14 Le théorème suivant a été une avancée majeure. Il est dû sous sa première forme à Muckenhoupt (1972). Avec les constantes données ici il est dû à Buckley (1993). La démonstration que nous en donnons a été trouvée par Lerner (2008). Pour simplier les notations, on note w(Q) la mesure de Q relative à la mesure à poids wdx. L'espace Lp pour la mesure à poids wdx est noté Lp (w). Théorème 6.1. valentes : Soit 1 < p < ∞. Les conditions suivantes sont équi- (a) w ∈ Ap . (b) Il existe une constante K telle que pour tout cube Q et toute fonction f positive p Z Z 1 (13) f (y) dy w(Q) ≤ [w]Ap f (y)p w(y)dy |Q| Q Q (c) M est de type faible (p, p) dans Lp (w). De plus Z p (14) λ w(x)dx ≤ cd [w]Ap kf kLp (w) . M f >λ (d) M est borné sur Lp (w). De plus (15) kM kLp (w) ≤ 1 cn p , [w]Ap−1 p p−1 Démonstration. Il est clair que (b) est équivalent à (a) si la constante est supposée égale à 1 dans (13). En eet, si (13) est satisfait avec 1 la constante A à la place de [w]Ap , en prenant f = 1Q w− p−1 , on voit que w est dans Ap et [w]Ap ≤ A. Réciproquement, si w est dans Ap , il résulte de l'inégalité de Hölder que p p Z Z 1 1 1/p −1/p f dy w(Q) = fw w dy w(Q) |Q| Q |Q| Q Z f (y)p w(y)dy. ≤ [w]Ap Q Les autres conditions nécessaires s'obtiennent facilement si on n'essaie pas d'optimiser les constantes : si M est de type fort, alors M est de type faible. De plus, si M est de type faible, comme, sur Q, on R 1 a l'inégalité M f > |Q| f dy , l'inégalité traduisant le fait que l'opéQ rateur est de type faible (1, 1) donne immédiatement l'inégalité (13) avec même constante. On montre donc non seulement ainsi toutes les conditions nécessaires, mais aussi que le fait que la croissance en [w]Ap de la constante de (14) est optimale. 15 Montrons (c) et (d). Nous avons vu qu'il susait de considérer le cas dyadique. On suppose donc maintenant que la condition Ap porte uniquement sur les cubes dyadiques et que la fonction maximale a été remplacée par la fonction maximale dyadique. Le point clé est le fait qu'on a aussi bien des théorèmes maximaux lorsque la mesure de Lebesgue est remplacée par une mesure à poids. On notera σ(x) = 1 w(x)− p−1 et Mw , Mσ les deux opérateurs maximaux correspondants. Plus précisément, par exemple, Z 1 Mw f (x) = sup |f (y)|w(y)dy. x∈Q w(Q) Q Nous ne prenons ici que les cubes dyadiques. Montrons l'inégalité faible (14) pour f > 0. L'inégalité (16) peut encore se lire p Z Z 1 1 f dy ≤ [w]Ap f (y)p w(y)dy ≤ [w]Ap Mw (f (x)p ) |Q| Q w(Q) Q lorsque x ∈ Q. Comme ceci a lieu pour tout Q contenant x, on en déduit que M D f (x)p ≤ [w]Ap Mw (f (x)p ). L'inégalité faible découle immédiatement de l'inégalité forte pour Mw . Montrons l'inégalité forte (15). On commence par écrire 1 |Q| Z f ≤ [w] Q 1 p−1 Ap |Q| 1 w(Q) σ(Q) Z f 1 p−1 p−1 . Q Quel que soit x ∈ Q, on a 1 σ(Q) Z f ≤ Mσ (f σ −1 )(x), Q d'où il découle que 1 |Q| Z f ≤ [w] Q 1 p−1 Ap 1 ≤ [w] p−1 Ap 1 ≤ [w] p−1 Ap 1 p−1 p−1 |Q| −1 inf Mσ (f σ ) w(Q) Q 1 Z p−1 p−1 1 −1 Mσ (f σ ) w(Q) Q 1 p−1 p−1 −1 −1 Mw w Mσ (f σ ) (x). 16 Comme cette inégalité a lieu quel que soit le cube contenant x, il en résulte que 1 p−1 p−1 1 p−1 D −1 −1 M f ≤ [w] Mσ (f σ ) Mw w . Ap Pour conclure on commence par utiliser le théorème maximal pour Mw p avec l'exposant de Lebesgue p0 = p−1 : on en déduit que ! p1 p Z p−1 p−1 1 1 kM D f kLp (w) ≤ [w] p−1 p p−1 w−1 Mσ (f σ −1 ) . wdx Ap p On reconnait σ en w− p−1 w et on utilise le théorème maximal pour Mσ et pour l'exposant p. On conclut aisément que 1 1 1 p ep kM D f kLp (w) ≤ [w] p−1 p p−1 kf kLp (w) ≤ [w] p−1 kf kLp (w) . p − 1 Ap p − 1 Ap Au facteur e près, c'est optimal pour l'inégalité sans poids. 7. Optimalité du théorème de Buckley et méthode d'extrapolation de Rubio de Francia Nous allons suivre Luque, Pérez et Rela pour montrer que le théorème (6.1) est optimal. Plus précisément, nous allons montrer que Proposition 7.1. Soit p > 1 donné et soit ψ : [1, ∞) → (0, ∞) une fonction croissante telle que, quel que soit le poids w ∈ Ap et quel que soit la fonction f positive, kM f kLp (w) ≤ ψ([w]Ap )kf kLp (w) . 1 Alors il existe des constantes c, c0 telle que ψ(t) ≥ ct p−1 pour t > c0 . On peut dénir la fonction ψ comme ! ψ(t) = sup sup w∈Ap ; [w]Ap ≤t f ∈Lp (w) ; kf kLp (w) =1 kM f kLp (w) . Démonstration. Pour simplier les notations nous allons supposer que p = 2, mais la démonstration générale est la même. Nous supposons donc que, quel que soit le poids w ∈ Ap et quel que soit la fonction f positive, (16) kM f kL2 (w) ≤ ψ([w]A2 )kf kL2 (w) . Nous allons maintenant utiliser la lettre p pour un exposant variable inférieur à 2 et que nous ferons tendre vers 1. Rappelons que la plus petite constante dans l'inégalité maximale (3), que nous notons kM kp , 17 c peut être minorée par p−1 . On en déduit qu'il existe pour chaque p > 1 c une fonction f positive de norme 1 dans Lp et telle que kM f kp ≥ p−1 . Nous allons maintenant utiliser l'algorithme d'itération de Rubio de Francia en posant, pour h dans Lp , ∞ X 1 M k (h) R(h) = . 2k kM kkp k=0 Il est clair qu'on a les propriétés suivantes : h ≤ R(h) kR(h)kLp ≤ 2 khkLp , [R(h)]A1 ≤ 2 kM kp . On prend pour poids la fonction w = (Rf )p−2 ), où f est la fonction choisie au préalable, et on calcule p p1 Z p p kM f )kLp = (M f )(Rf ) 2 −1 ) (Rf )p(1− 2 ) dx . Après utilisation de l'inégalité de Hölder pour les exposants conjugués 2 et (1 − p2 )−1 , on trouve la majoration p Z 21 Z 1− p2 2 p−2 p kM f )kLp ≤ (M f ) (Rf ) dx (Rf ) dx . Après utilisation de (16) pour le poids w choisi, on obtient Z 21 Z 1− p2 2 p−2 p f (Rf ) dx (Rf ) dx kM f )kLp ≤ ψ([w]A2 ) . Les propriétés de Rf et le fait que f soit de norme 1 entraînent que c ψ([w]A2 ) ≥ . p−1 Maintenant, en utilisant l'inégalité de Jensen puisque 2 − p < 1, on trouve que [w]A2 1 Z 1 Z p−2 2−p = sup (Rf ) dx (Rf ) dx |Q| Q |Q| Q Q 1 Z 2−p 1 Z 2−p −1 ≤ sup (Rf ) dx (Rf )dx |Q| Q |Q| Q Q C ≤ [Rf ]2−p . A2 ≤ [Rf ]A2 ≤ 2kM kp ≤ p−1 Finalement, si on pose t = C , p−1 on a ψ(t) ≥ c0 t. 18 La méthode de Rubio de Francia est très ecace. Elle permet en particulier de montrer que pour les opérateurs de Calderón- Zygmund les inégalités Lp sont conséquences des inégalités à poids pour un seul exposant de Lebesgue p0 , ceci à condition de les avoir pour tout poids de la classe Ap0 . La méthode utilisée dans le dernier théorème permet d'obtenir de nombreuses bornes inférieures, voir [?]. 8. Retour aux martingales Nous allons tout d'abord montrer que la méthode de Lerner pour démontrer le théorème de Buckley s'adapte au cas des martingales. Nous considérons uniquement le cas p = 2 pour simplier, et l'inégalité forte. Le théorème maximal en toute généralité pour les martingales a été démontré en 1986 par Jawerth. La démonstration de Lerner est plus simple en même temps qu'elle donne la constante optimale. On suppose donnée une suite croissante de tribus Fn sur un espace de probabilité (Ω, P). La condition A2 pour un poids Z s'écrit dans ce contexte : (17) [Z]A2 = sup E(Z|Fn )E(Z −1 |Fn ) < ∞. n On a alors la proposition suivante : Soit (fn = E(f |Fn ) une martingale positive, f ∗ sa fonction maximale. Alors Proposition 8.1. E((f ∗ )2 Z) ≤ 16[Z]2A2 E((f 2 Z). Démonstration. Nous l'esquissons seulement. Si on reprend la preuve du théorème de Buckley, ce qu'il nous faut c'est une majoration ponctuelle de la fonction maximale f ∗ en termes des deux fonctions maximales MZ et MU , où on a remplacé la loi de probabilité initiale par la loi ZdP et la loi U dP, avec U = Z −1 . Il s'agit donc de montrer que h i ∗ f ≤ [Z]A2 MZ U MU (f Z) , la démonstration étant ensuite identique. Mais de la dénition de l'espérance conditionnelle (avec des notations évidentes pour les nouvelles probabilités) on déduit que E(f |Fn ) = E(U |Fn )EU (f Z|Fn ) et, pour les mêmes raisons, 1 = E(Z|Fn )EZ (U |Fn ). 19 On en déduit que E(f |Fn ) = E(U |Fn )E(Z|Fn )EZ (U EU (f Z|Fn )|Fn ). On a donc la majoration E(f |Fn ) ≤ [Z]A2 EZ (U MU (f Z)|Fn ). On passe au supremum pour conclure. Nous allons maintenant dénir les transformées de martingales, à la fois en général et plus spéciquement pour les martingales dyadiques. Etant donnée une suite vn de fonctions Fn−1 mesurables (suite prévisible) la fonction v0 étant constante, on dénit l'opérateur Tv comme l'opérateur qui à la martingale (fn )n≥0 fait correspondre la martingale (gn ) dénie par les égalités g0 = v 0 f 0 gn − gn−1 = vn (fn − fn−1 ), n ≥ 1. La suite dn = fn −fn−1 est appelée suite des diérences de la martingale. On pose d0 = f0 . Le fait que (fn ) est une martingale se traduit par le fait que E(dn |Fn−1 ) = 0. Avec ces notations on voit immédiatement que la n-ième diérence de Tv f est donnée par vn dn . On a le lemme suivant : L'opérateur Tv est borné dans L2 si (et seulement si) la suite vn est bornée. Lemme 8.2. C'est une conséquence immédiate du fait que X kf k22 = sup kfn k22 = E(d2n ). n≥0 On démontre tout d'abord la formule lorsque dn = 0 à partir d'un certain rang. C'est alors une conséquence du fait que les dn sont orthogonaux : E(dn dn+k ) = E(E(dn dn+k |Fn )) = E(dn E(dn+k |Fn )) = 0. Exercice 10. Montrer que la condition est nécessaire pour les martingales dyadiques. Pour les martingales dyadiques de l'intervalle I0 , il est facile de voir les transformées de martingales dans la base de Haar : soit I un intervalle de la n-ième génération. La fonction vn est constante sur I . Si αI 20 est sa valeur sur I , on a Tv (hI ) = αI hI . Pour une fonction f dans L2 quelconque, X Tv (f ) = αI hf, hI ihI + α0 1I0 . I Cette transformation est ce qu'on appelle un multiplicateur de Haar. Son nom est dû au fait qu'elle se diagonalise dans la base de Haar. On dénit de la même manière un multiplicateur de Haar sur R entier. Nous noterons plutôt Tα la transformation dans ce cas. A nouveau le théorème principal, dont un des ingrédients est le théorème maximal, est le suivant : Soit Tv une transformée de martingale, avec supn |vn | ≤ 1. Alors Tv est de type faible (1, 1) et de type fort (p, p). Théorème 8.3. Ce théorème est essentiellement dû à Burkholder. Il sut de montrer l'inégalité faible (1, 1). La démonstration générale comporte des dicultés liées aux sauts de la martingale dans le cas général. Nous allons le montrer dans le cas dyadique. Plus précisément nous allons considérer un multiplicateur de Haar dans R donné par la suite αI telle que |αI | ≤ 1. Démonstration. Il sut de montrer que |{Tα f ≥ λ}| ≤ Ckf kL1 lorsque f possède seulement un nombre ni de termes non nuls dans la base de Haar. La propriété spécique de Tα est la suivante : Si φ est à support dans I et d'intégrale nulle, alors 2 Tα (φ) = I 0 ⊂I αI 0 hI 0 est à support dans I et de norme L majorée par celle de φ. Lemme 8.4. P Le point-clé est la décomposition de Calderón-Zygmund de la fonction f . On suppose donné λ > 0. On rappelle que l'ensemble des points x ∈ I pour lesquels la fonction maximale dyadique de f est supérieure à λ est la réunion des intervalles dyadiques maximaux Ij pour lesquels Z w > λ|Ij |. Ij Mais, par maximalité, on a aussi que Z w ≤ 2λ|Ij |. Ij Donc, si on pose f = g + b (ou encore f = fτ + (f − fτ )) avec 21 g(x) = 1 |Ij | Rf (x) f (y)dy Ij si x n'appartient à aucun des Ij . si x ∈ Ij Alors |g| ≤ 2λ et Tα b est à support dans la réunion des Ij , c'est-à-dire dans l'ensemble où M D f > λ. Donc 1 |{Tα f ≥ λ}| ≤ |{M D f ≥ λ}| + |{Tα g ≥ λ}| ≤ kf k1 . λ On a utilisé le fait que k{Tα gk2 ≤ 2λkgk1 ≤ λkf k1 . En utilisant le théorème de Khintchine on en déduit immédiatement que X k( E(d2n ))1/2 kp ≤ Cp kf kp . n≥0 P La quantité ( n≥0 E(d2n ))1/2 est la gale. 9. fonction carrée de la martin- Retour sur les conditions Ap Le but de cette section est de donner un aperçu d'autres aspects de la théorie de Calderón-Zygmund. Une des propriétés importantes des poids Ap est le fait qu'un tel poids w satisfait à des inégalité de Hölder inverses : il existe r > 1 tel que 1/r Z Z 1 c r w w. ≤ |Q| Q |Q| Q C'est une propriété fondamentale, due à Gehring, qui joue en particulier un rôle important dans la théorie des fonctions quasi-conformes. Nous allons montrer une propriété de ce type, avec une valeur de r explicite, quand w est dans la classe A1 , qui est, rappelons-le, plus petite. Nous suivons Lerner, Ambrosi et Pérez (2008) qui donnent des constantes très précises. Ces résultats ont depuis été améliorés avec des versions Ap . Proposition 9.1. Soit w un poids sur Rd tel que M D w ≤ [w]A1 w. Alors, si r = 1 + 1/(2d+1 [w]A1 ), on a l'inégalité pour tout cube dyadique 1/r Z Z 1 2[w]A1 r w ≤ w. |Q| Q |Q| Q 22 Démonstration. Nous considérerons pour simplier uniquement le cas d = 1 mais la démonstration est la même en dimension supérieure. Nous revenons au théorème maximal pour la mesure wdx et pour la fonction w dans l'intervalle dyadique I . On suppose que λ est plus grand que la moyenne hwiI de w sur I . On rappelle que l'ensemble des points x ∈ I pour lesquels la fonction maximale dyadique de w (restreinte à I ) est supérieure à λ est la réunion des intervalles dyadiques maximaux Ij pour lesquels Z w > λ|Ij |. Ij Mais, par maximalité, on a aussi que Z w ≤ 2λ|Ij |. Ij Donc Z MID w>λ On calcule Z Z D δ (MI w) wdx = δ I 0 wdx ≤ 2|MID w > λ|. ∞ λδ−1 Z ! w dλ MID >λ Z Z 1 2δ δ+1 ≤ + (M D w)δ+1 dx. ( wdx) |I|δ I δ+1 I I Avec le choix proposé pour δ on peut faire passer le second terme du membre de droite à gauche et conclure. A compléter
© Copyright 2025 Paperzz