Introduction aux formes modulaires

INTRODUCTION AUX FORMES MODULAIRES
GAËTAN CHENEVIER
Leçon à l’École Normale Supérieure (4h), mars 2015
Introduction
Les formes modulaires sont des fonctions holomorphes sur le demi-plan de Poincaré qui se transforment de
manière particulière sous l’action du groupe modulaire SL2 (Z). Elles interviennent de façon plus ou moins
naturelle dans plusieurs domaines assez différents des mathématiques : théorie des fonctions elliptiques,
théorie des formes quadratiques à coefficients entiers, théorie des représentations unitaires du groupe de
Lie SL2 (R), fonctions L et représentations du groupe de Galois absolu de Q... Elles ont aussi été ont été
l’objet de plusieurs conjectures célèbres, comme la conjecture de Ramanujan ou la conjecture de ShimuraTaniyama-Weil. Aborder chacun de ces thèmes dans une si courte leçon est bien entendu impossible. Aussi,
l’objectif que nous avons choisi est de montrer par des exemples que les coefficients de Fourier des formes
modulaires renferment des informations arithmétiques intéressantes. En particulier, nous verrons comment
utiliser des formes modulaires pour déterminer le nombre des représentations d’un entier comme somme
de 8 carrés (Jacobi). On rapporte qu’Eichler aurait dit un jour que les formes modulaires constituent la
5ème opération de l’arithmétique (après l’addition, la soustraction, la multiplication et la division). Certains
exemples, on l’espère !, illustreront la pensée d’Eichler.
Table des matières
Introduction
1
1.
Action de SL2 (Z) sur le demi-plan de Poincaré
2
2.
Formes modulaires pour SL2 (Z)
4
3.
Sur les zéros des formes modulaires
5
4.
Quelques q-développements
8
5.
La fonction ϑ de Jacobi
10
6.
Formes modulaires pour un sous-groupe de SL2 (Z)
12
7.
Le ϑ-groupe est de congruence
13
8.
Sommes de 8 carrés
14
Références : R. Busam & E. Freitag, Funktionentheorie,
Henri Cartan, Théorie élémentaire des fonctions analytiques d’une ou plusieurs variables complexes,
Jean-Pierre Serre, Cours d’arithmétique,
Goro Shimura, Introduction to the arithmetic theory of automorphic functions.
.
1
2
GAËTAN CHENEVIER
1. Action de SL2 (Z) sur le demi-plan de Poincaré
1.1. Rappelons que pour tout corps K le groupe GL2 (K) agit naturellement sur K 2 , puis sur l’ensemble
P1 (K) des droites vectorielles de ce dernier. Une application linéaire préservant toutes les droites étant une
homothétie, cette action se factorise en une action fidèle du groupe quotient PGL2 (K) de GL2 (K) par K × .
On pose
a
b = K
K
{∞}.
Cet ensemble s’identifie à P1 (K) en envoyant tout élément z ∈ K sur la droite engendrée par
symbole ∞ sur celle engendrée par
1
0
z
1
, et le
. Par transport de structure, on en déduit une action de GL2 (K)
b que l’on notera (γ, z) 7→ γz. Concrètement, si γ désigne l’élément
sur K,
est tel que cz + d 6= 0, on constate les égalités
z
az + b
(1)
γ
=
= (cz + d)
1
cz + d
az+b
cz+d
1
a
c
b
d
de GL2 (K), et si z ∈ K
,
et l’on retrouve la formule bien connue γz = az+b
cz+d . De plus, si on a c 6= 0 (resp. c = 0) alors on a γ ∞ = a/c et
b sont appelées homographies, et forment donc
γ (−d/c) = ∞ (resp. d 6= 0 et γ ∞ = ∞). Ces bijections
de K
a b
un sous-groupe isomorphe à PGL2 (K). Par exemple 0 1 correspond à l’homographie “affine” z 7→ a z +b
et
0
0
−1
1
à l’inversion z 7→ −1/z.
a b
Pour utilisation future, mentionnons que l’élément γ =
de GL2 (K) étant donné, l’application
c d
z 7→ cz + d, K → K, sera notée j(γ, z). La formule (1) ci-dessus montre la relation dite de “cocycle” :
j(γγ 0 , z) = j(γ, γ 0 z)j(γ 0 , z),
valable pour tout γ, γ 0 ∈ GL2 (K) et tout z ∈ K.
b n’est autre que la sphère de Riemann. Le sous-groupe
1.2. Ces rappels s’appliquent à K = C, auquel cas C
b ainsi donc son complémentaire
GL2 (R) ⊂ GL2 (C) agit par restriction sur cette sphère, en préservant R,
C − R. Cet ouvert de C a deux composantes connexes, l’une d’elles étant l’ouvert
H = {τ ∈ C, Im τ > 0},
appelé demi-plan de Poincaré. Si γ est l’élément
a
c
b
d
de GL2 (R), et si z ∈ C − R, alors on a cz + d 6= 0
et un calcul immédiat montre l’égalité
(2)
Im γz = det γ
Im z
.
|cz + d|2
En particulier, l’action par homographies du groupe SL2 (R) préserve le demi-plan de Poincaré. L’action des
homographies de la forme aτ + b avec a ∈ R>0 et b ∈ R, montre que l’action de SL2 (R) sur H est transitive.
Nous n’en aurons pas besoin, mais signalons que l’on vérifierait sans difficulté que le stabilisateur de l’élément
∼
i ∈ H est le sous-groupe SO2 (R) usuel, et donc que γ 7→ γ i induit une bijection SL2 (R)/SO2 (R) → H.
Ces homographies ont des propriétés géométriques remarquables, particulièrement lumineuses lorsqu’on
les étudie du point de vue de la géométrie hyperbolique (où nous ne nous aventurerons pas !). Par exemple,
notons C l’ensemble des parties de H qui sont soit de la forme Re τ = a (droites verticales), soit un demicercle de centre dans R. Alors SL2 (R) préserve C. Pour le voir, il suffit d’observer que les éléments de C
sont exactement les parties non vides de H de la forme α + β Re τ + γ |τ |2 = 0 avec (α, β, γ) ∈ R3 − {0}.
La vérification de l’assertion précédente est alors un simple exercice ; il suffit même de le vérifier pour les
homographies τ 7→ τ + λ et τ 7→ −1/τ , auquel cas c’est immédiat.
INTRODUCTION AUX FORMES MODULAIRES
Analysons l’action du sous-groupe Γ = SL2 (Z) sur H. Deux
0 −1
1
S=
et T =
1 0
0
0 −1
i.e. S τ = −1/τ et T τ = τ + 1. On a S2 = −I2 et ST = 1 1
1.3.
3
éléments importants de ce groupe sont
1
,
1
, ainsi donc que l’identité (ST)3 = −I2 .
On a S i = i et STρ = −1/(ρ + 1) = ρ où ρ = e2iπ/3 . On pose F = {τ ∈ H, |Re τ | ≤
1
2
et |τ | ≥ 1}.
Figure 1. Le pavage de H par la Γ-orbite de F
Théorème 1.4.
(i) Pour tout τ ∈ H, l’orbite Γτ rencontre F.
(ii) Si τ et τ 0 sont deux points distincts de F tels que Γτ = Γτ 0 alors :
– soit Re τ = ± 21 et τ 0 = τ ± 1,
– soit |τ | = 1 et τ 0 = −1/τ .
(iii) Si τ ∈ F alors le stabilisateur de τ dans Γ est {±1}, sauf si τ = i (resp. τ = ρ, −ρ2 ), auquel cas
c’est le sous-groupe engendré par S (resp. ST).
Soit τ ∈ H. La forme quadratique R2 → R, (c, d) 7→ |c τ + d|2 est définie positive, elle
admet donc un minimum sur Z2 − {0}. D’après la formule (2), il y a donc un sens à considérer l’ensemble
E ⊂ Γτ des éléments τ 0 tels que Im τ 0 est maximal. Il est invariant par τ 0 7→ τ 0 + 1, de sorte qu’il existe
0
τ 0 ∈ E tel que |Re τ 0 | ≤ 1. Mais −1/τ 0 ∈ Γτ et Im(−1/τ 0 ) = Imτ
, donc |τ 0 | ≥ 1. Ainsi, τ 0 ∈ Γτ ∩ F.
|τ 0 |2
Observons que cette démonstration montre en fait Gτ ∩ F =
6 ∅ où G désigne le sous-groupe de Γ engendré
par S et T.
Démonstration —
Pour montrer (ii) et (iii), considérons τ, τ 0 ∈ F (non nécessairement distincts) tels que Im τ 0 ≥ Im τ et
tels que τ 0 = γτ où
a b
γ=
∈ SL2 (Z).
c d
On a alors |c τ + d| ≤ 1. En particulier, |c Im τ | ≤ 1 et donc |c| ≤ 1. Si c = 0 alors d = a = ±1 et donc ±γ est
une puissance de T et on est dans le premier cas du (ii). Sinon on peut supposer c = 1, quitte à remplacer
γ par −γ. On voit sur le dessin que |τ + d| ≤ 1 entraîne |τ | = 1, et que l’on est dans l’un des cas suivants :
1. τ 6= ρ, −ρ2 et d = 0. Dans ce cas, b = −1 et τ 0 = a − 1/τ puis a = 0 car |Re(−1/τ )| < 1/2. Ainsi, γ = S
et τ 0 = τ = i.
τ0
2. τ = ρ et d = 0, −1. Si d = 0 on a encore b = −1 et τ 0 = a − 1/ρ = a − ρ2 . Cela montre que soit
= −ρ2 , a = 0 et γ = ±S, soit τ 0 = τ , a = −1 et γ = (ST)2 .
3. Le cas τ = −ρ2 et d = 0, 1 se traite de manière similaire au cas 2.
4
GAËTAN CHENEVIER
Soit E l’ensemble des τ ∈ F tels que l’on ait soit Re τ = 12 , soit |τ | = 1 et Re τ > 0. Soit F 0 = F − E. Les
points (i) et (ii) du théorème ci-dessus montrent que pour tout τ ∈ H, l’orbite Γτ rencontre F 0 en un et un
seul point. On dit aussi que F 0 est un domaine fondamental de l’action de Γ sur H.
Corollaire 1.5. Γ est engendré par S et T.
Il ne serait pas difficile de démontrer ce corollaire de manière directe en utilisant des
opérations sur les lignes et les colonnes. Déduisons-le plutôt du théorème. Soit G le sous-groupe de Γ engendré
par S et T. Soit τ un point de l’intérieur de F. Soit γ ∈ Γ. D’après la démonstration du (i) ci-dessus (dernière
remarque), il existe g ∈ G tel que g −1 γτ ∈ F. Ainsi, g −1 γ ∈ SL2 (Z) fixe τ , c’est donc ±I2 d’après le (iii).
Au final, on a γ ∈ G car −I2 = S2 ∈ G.
Démonstration —
2. Formes modulaires pour SL2 (Z)
L’application (f, γ) 7→ (τ 7→ f (γτ )) définit une action à droite du groupe SL2 (R) sur le C-espace vectoriel
des fonctions H → C, c’est même une représentation linéaire. Plus généralement, si k ∈ Z, f : H → C et
γ ∈ SL2 (R), on définit une fonction f|k γ : H → C en posant
f|k γ (τ ) = j(γ, τ )−k f (γτ ).
Cela a un sens car j(γ, τ ) 6= 0 pour tout γ ∈ SL2 (R) et tout τ ∈ H. On vérifie immédiatement que la relation
de cocyle satisfaite par j équivaut à dire que (f, γ) 7→ f|k γ est une action à droite de SL2 (R) sur l’espace des
fonctions H → C, appelée action de poids k. L’action précédente en est alors le cas particulier k = 0.
Proposition-Définition 2.1. Une fonction f : H → C est dite faiblement modulaire de poids k ∈ Z si
aτ + b
a b
k
) = (cτ + d) f (τ )
∀τ ∈ H, ∀
∈ SL2 (Z)
f(
c d
cτ + d
ou ce qui revient au même si f (τ + 1) = f (τ ) et f (−1/τ ) = τ k f (τ ) pour tout τ ∈ H.
Par définition, f est faiblement modulaire si f est fixée par Γ pour l’action de poids k.
Comme Γ est engendré par S et T (corollaire 1.5), il est équivalent de demander que f est fixée par S et T.
Démonstration —
Notons O(H) l’espace vectoriel des fonctions holomorphes H → C. Les homographies de H étant des
transformations biholomorphes, l’action de poids k de SL2 (R) préserve le sous-espace O(H).
Définition 2.2. Une forme modulaire de poids k ∈ Z est une fonction holomorphe f : H → C telle que :
(i) f est faiblement modulaire de poids k,
(ii) f (τ ) admet une limite finie quand Im τ −→ +∞ ; on la note f (∞).
L’ensemble des formes modulaires de poids k est un sous-espace de O(H). Suivant Serre, nous le noterons
Mk . Les relations S2 = −I2 et f|k − I2 = (−1)k f montrent que si f ∈ Mk alors f = (−1)k f , de sorte que
Mk = 0 si k est impair. Les fonctions constantes sont modulaires de poids 0 : nous verrons plus loin que ce
sont les seules. Un premier exemple intéressant de forme modulaire est donné par les séries d’Eisenstein.
P
Proposition 2.3. Soit k ≥ 4 un entier pair. La série (m,n)∈Z2 −{0} (mτ 1+n)k est absolument convergente
sur H ; on note Gk (τ ) sa somme. Alors Gk ∈ Mk et Gk (∞) = 2ζ(k). En particulier Gk 6= 0.
Fixons A, B ∈ R>0 et notons DA,B l’ensemble des τ ∈ H tels que Im τ > A et |Re τ | < B.
Vérifions qu’il existe un réel C > 0 tel que pour tout (µ, ν) ∈ R2 − {0} et tout τ ∈ DA,B alors
Démonstration —
|µτ + ν| > C sup(|µ|, |ν|).
INTRODUCTION AUX FORMES MODULAIRES
5
Soit τ ∈ DA,B . D’une part, on a |τ − λ| > A pour tout λ ∈ R. D’autre part, le cône {λx, x ∈ DA,B , λ ∈ R}
a pour frontière les droites vectorielles engendrées respectivement par B + iA et −B + iA. En particulier, il
existe δ > 0 tel que |λτ + 1| > δ pour tout λ ∈ R. Ainsi, C = Min(A, δ) convient.
Si s ≥ 1, il y a exactement 8s couples (m, n) ∈ Z2 tels que sup(|m|, |n|) = s. On en déduit la majoration
X
1 X 8s
1
< k
k
|mτ + n|
C
sk
2
s≥0
(m,n)∈Z −{0}
pour tout τ ∈ DA,B . Ainsi, la série de l’énoncé est normalement convergente sur DA,B . En particulier,
Gk (τ ) est une fonction holomorphe de τ . Par converge absolue de Gk (τ ), les bijections (m, n) 7→ (m, n +
m) et (m, n) 7→ (n, −m) de Z2 − {0} entraînent les identités Gk (τ + 1) = Gk (τ ) et Gk (−1/τ ) = τ k Gk (τ )
pour tout τ ∈ H.
Enfin, faisons tendre Im τ vers l’infini quand τ ∈ D1,1 . La fonction τ 7→ (mτ 1+n)k tend vers 0 ou n1k selon
que m = 0 ou non. Par convergence uniforme de Gk sur D1,1 , on peut intervertir limite et sommation et l’on
obtient que Gk (τ ) → 2ζ(k). On conclut par 1-périodicité de Gk .
1
Gk ∈ Mk (série d’Eisenstein “normalisée”), de sorte que l’on ait
Si k ≥ 4 est pair, on pose Ek = 2ζ(k)
Ek (∞) = 1. Bien entendu, cette définition a un sens puisque ζ(k) 6= 0. L’application Mk → C, f 7→ f (∞),
est une application linéaire. Son noyau, noté Sk , est le sous-espace des formes modulaires paraboliques
(“cuspidal” en anglais). Si k ≥ 4, il est donc engendré par les éléments de la forme f − f (∞)Ek .
Corollaire 2.4. Pour tout entier pair k ≥ 4, on a Mk = Sk ⊕ C Ek .
Observons que si f ∈ Mk et g ∈ Mk0 alors f g ∈ Mk+k0 . On peut donc fabriquer tout un tas de formes
modulaires à l’aide des séries d’Eisenstein. Par exemple, si r et s sont des entiers ≥ 0 alors Er4 Es6 ∈ M4r+6s .
Théorème 2.5. Soit k ∈ Z. L’espace Mk admet pour base les Er4 Es6 , avec (r, s) ∈ N2 vérifiant 4r + 6s = k.
Observons d’abord que si f ∈ Mk alors f (i) = f|k S (i) = i−k f (i). Ainsi, f (i) = 0 si k 6≡ 0 mod 4. De
même f (ρ) = 0 si k 6≡ 0 mod 3. En particulier, E6 (i) = 0 et E4 (ρ) = 0. Nous démontrerons E4 (i) 6= 0 dans
la section suivante (pouvez-vous le démontrer directement ?) et que la famille de l’énoncé est génératrice :
admettons-le pour l’instant. Vérifions ici qu’elle est libre.
Soit A > 0 assez grand tel que |E4 − 1| et |E6 − 1| soient tous deux < 1 pour tout τ dans l’ouvert
Ω = {τ ∈ H, Im τ > A}. Les fonctions E4 et E6 possèdent donc respectivement des racines 4èmes et 6èmes
holomorphes sur cet ouvert, disons e et f , qui ne s’annulent pas. Toute relation de dépendance linéaire
P
r/4 (k−r)/6
entre les Er4 Es6 est de la forme kr=0 λr E4 E6
= 0 avec par convention λr = 0 quand r 6≡ 0 mod 4 ou
Pk
P
r
k−r
k − r 6≡ 0 mod 6. Cela s’écrit aussi r=0 λr e f
= 0, puis kr=0 λr ( fe )r = 0. Si les λr ne sont pas tous
nuls, la fonction e/f ne prend donc qu’un nombre fini de valeurs : elle est constante par connexité de Ω. En
l’élevant à la puissance 12 on trouve que E34 et E26 sont (non trivialement) proportionnelles sur cet ouvert,
et donc partout sur H, ce qui est absurde en regardant leurs valeurs en i. Définition 2.6. (Fonction ∆ de Jacobi) La fonction ∆ =
de poids 12.
1
3
2
1728 (E4 −E6 )
est une forme modulaire parabolique
L’apparition du facteur 1728 sera expliquée plus loin. D’après ce que nous avons dit ci-dessus, ∆ 6= 0 car
1
∆(i) = 1728
E4 (i)3 .
3. Sur les zéros des formes modulaires
3.1. q-développement d’une forme modulaire. Observons que si z ∈ C alors |e2iπz | = e−2πImz . Soit
D = {z ∈ C, |z| < 1}. On considère l’application
q : H −→ D − {0}, τ 7→ e2iπτ .
∼
Cette application induit une bijection hTi\H → D − {0}. Autrement dit, si f : H → C est telle que
f (τ + 1) = f (τ ), il existe une unique fonction fe : D − {0}, τ 7→ e2iπτ , telle que f (τ ) = fe(q).
6
GAËTAN CHENEVIER
Soit f : H → C telle que f (τ + 1) = f (τ ). Observons que f est une fonction holomorphe si, et seulement
si, fe est une fonction holomorphe sur D − {0}. En effet, pour tout τ0 ∈ H, l’application q induit un bijection
bi-holomorphe entre le voisinage ouvert {τ ∈ H, Re(τ − τ0 ) < 1/2} de τ0 dans H, et le voisinage ouvert
D − R≤0 e2iπτ0 (un inverse s’obtient en considérant une branche du logarithme complexe). Si f est holomorphe
il y a donc équivalence entre :
– f (τ ) admet une limite quand Im τ −→ ∞,
– |f (τ )| est bornée sur {τ ∈ H, Im τ > 1},
– |fg
(q)| est bornée au voisinage de q = 0,
– fe se prolonge en une fonction holomorphe sur tout D,
– fe admet un développement en série entière en 0 de rayon de convergence ≥ 1.
(L’implication assertion 3 ⇒ assertion 4 est le lemme de prolongement de Riemann). Cela justifie à la
proposition-définition suivante.
Proposition-Définition 3.2. Soit f ∈ Mk . La forme f admet un unique développement
X
f (τ ) =
an (f ) qn ,
n≥0
avec an (f ) ∈ C pour tout entier n ≥ 0, normalement convergent sur toute partie de H de la forme Im τ > A,
A ∈ R>0 . Ce développement est appelé développement de Fourier, ou q-développement, de la forme f , et les
an (f ) sont ses coefficients de Fourier. On a a0 (f ) = f (∞).
Comme nous le verrons, et de manière un peu surprenante, la suite des coefficients de Fourier de chaque
forme modulaire est en général d’un intérêt arithmétique considérable.
3.3. Formule k/12. Soient f ∈ Mk et P ∈ H. On note vP (f ) l’ordre d’annulation de f au point P et eP le
cardinal du stabilisateur de P dans SL2 (Z)/{±I2 }. Ces deux quantités, des entiers ≥ 0, ne dépendent que
de la Γ-orbite de P (pour eP , cela vient de la non annulation des j(γ, τ ) quand γ ∈ Γ et τ ∈ H). De plus,
d’après le théorème 1.4 (iii) on a ei = 2, eρ = 3, et si P n’est pas dans l’orbite de i ou ρ alors eP = 1. On
note aussi v∞ (f ) l’ordre d’annulation de fe en 0.
Proposition 3.4. (Formule k/12) Soient k ∈ Z et f ∈ Mk non nulle. On a la relation
X vP (f )
k
= .
v∞ (f ) +
eP
12
P ∈Γ\H
Toutes les quantités de cette égalité sont positives, et il fait partie de l’énoncé que la somme de gauche
est en fait une somme finie. Le lecteur préférant voir d’abord comment utiliser cette formule, et par exemple
terminer la démonstration du théorème 2.5, peut commencer par lire la sous-section suivante.
Soit f ∈ Mk non nulle. Rappelons que la Γ-orbite de tout zéro de f rencontre le domaine
F. Si r est un réel > 0 posons Ωr = {τ ∈ H, Im τ > r}. La fonction fe étant holomorphe en 0, il existe
r > 0 tel que f n’admet pas de zéro dans Ωr . La partie F − Ωr étant compacte, la fonction holomorphe f
n’y admet qu’un nombre fini de zéros (qui sont isolés). Cela montre que le nombre des Γ-orbites de points
constituées de zéros de f est fini (et donc que la somme apparaissant dans la formule k/12 a tous ses termes
nuls sauf au plus un nombre fini d’entre eux).
Démonstration —
Considérons le contour C indiqué par la figure 2. Sur cette figure, les zéros éventuels de f qui sont dans
∂F − {i, ρ, −ρ2 } et de partie réelle 1/2 (resp. de module 1) sont notés λ (resp. µ). En particulier, ce contour
ne contient aucun zéro de f . On suppose que chaque portion de cercle dessinée est de rayon suffisamment
petit de sorte que le disque bordé ne contienne que le point indiqué pour éventuel zéro (i.e i, ρ, −ρ2 , l’un
des λ, λ + 1, ou l’un des µ, −1/µ). Nous noterons γXY le chemin portion de C allant de X à Y (dans ce
opp
opp
sens). Le chemin γD0 E est par définition le chemin T γAB
. De même, on a choisi γC 0 D = S γB
0 C . Enfin, on
INTRODUCTION AUX FORMES MODULAIRES
7
suppose que γEA est de partie imaginaire r suffisament grande de sorte qu’aucun zéro de f ne soit de partie
imaginaire > r. L’existence d’un tel contour est justifiée par le paragraphe précédent (zéros isolés).
Figure 2. Le chemin d’intégration dans la démonstration de la formule k/12
0
f (τ )
La formule des résidus appliquée à la 1-forme méromorphe df
f = f (τ ) dτ s’écrit donc
Z 0
X
f (τ )
1
dτ =
vP (f )
2iπ C f (τ )
P
la somme portant sur les Γ-orbites de zéros de f ne contenant ni i ni ρ. Examinons maintenant les contributions des diverses portions du contour. Les fonctions f et f 0 étant T-invariantes on observe d’abord
Z
Z
Z
f 0 (τ )
f 0 (τ )
f 0 (τ )
dτ =
dτ = −
dτ.
γAB f (τ )
T γAB f (τ )
γD0 E f (τ )
Le chemin ω(t) := e2iπγEA (t) est un cercle de centre 0 dans D faisant un tour dans le sens indirect. On a
alors
Z
Z e0
1
f 0 (τ )
1
f (q)
dτ =
dq = −v∞ (f ).
2iπ γEA f (τ )
2iπ ω f (q)
En effet, la première égalité est un simple changement de variables, et la seconde est le théorème des résidus
appliqué à fe, sachant que par hypothèse 0 est le seul zéro éventuel de fe dans le disque de D bordé par ω.
0
0
De plus, par modularité de f on a ff = − τk + (ff◦S)
◦S , de sorte que
Z
Z
Z
f 0 (τ )
1
k
f 0 (τ )
1
dτ = −
dτ +
dτ,
2iπ γB0 C f (τ )
2iπ γB0 C τ
S γB 0 C f (τ )
0
avec rappelons-le S γB 0 C = γCopp
0 D . Lorsque le point B tend vers ρ, C tend vers i, et lorsque les portions de
R
cercles autour des points notés µ sont de rayon tendant vers 0, alors l’intégrale de chemin 1i γ 0 dτ
τ tends
B C
2π
π
0
vers l’angle orienté défini par ρ, 0 et i, i.e. −( 2π
3 − 4 ) = − 6 . De même, lorsque B et B tendent vers ρ
R
0
(τ )
π
\0
alors l’intégrale de chemin 1i γ 0 ff (τ
) dτ tend vers l’angle orienté B i B = − 6 multiplié par vρ (f ). Enfin,
BB
R
0 (τ )
lorsque C et C 0 tendent vers i alors l’intégrale de chemin 1i γ 0 ff (τ
) dτ tend vers −πvρ (f ). On conclut en
CC
mettant toutes ces identités bout à bout.
8
GAËTAN CHENEVIER
3.5. Conséquences de la formule k/12. La première conséquence évidente de la formule k/12 est l’annulation Mk = 0 si k < 0. De plus, on a Sk = 0 si k < 12, car v∞ (f ) ≥ 1 si f ∈ Sk − {0}. En particulier, on
a donc M0 = C 1 (les constantes). Séparant les orbites de i et ρ des autres, la formule k/12 s’écrit aussi
X
1
k
1
vP (f ) = ,
(3)
v∞ (f ) + vi (f ) + vρ (f ) +
2
3
12
P
la somme portant sur les Γ-orbites de points de H distinctes de Γi et Γρ. En particulier on a M2 = 0 car
chaque terme de gauche est soit > 1/6, soit nul. On a donc montré le :
Corollaire 3.6.
(i) Si k < 0 ou k = 2 alors Mk = 0.
(ii) M0 = C 1 et si k = 4, 6, 8, 10 alors Mk = C Ek .
k
Appliquons la formule (3) à k = 4 et f = E4 . Dans ce cas on a 12
= 31 , mais l’annulation évidente
E4 (ρ) = 0 entraîne 13 vρ (f ) ≥ 1/3. Ainsi, la seule Γ-orbite de points qui sont des zéros de E4 est celle de ρ.
En particulier, cela démontre la non-nullité annoncée
E4 (i) 6= 0,
1
3
1728 E4 (i) .
puis ∆ 6= 0 car on a ∆(i) =
Appliquant maintenant (3) à k = 12 et f = ∆, on en déduit que ∆
ne s’annule pas sur H et que l’inégalité v∞ (∆) ≥ 1 est une égalité. En particulier, si k est quelconque et si
f
est une forme modulaire de poids k − 12. On a démontré le corollaire suivant.
f ∈ Sk alors la fonction ∆
Corollaire 3.7.
(i) La fonction ∆ ne s’annule pas sur H et l’on a v∞ (∆) = 1.
(ii) Si k ∈ Z alors Sk = ∆ Mk−12 . En particulier, S12 = C ∆ est de dimension 1.
Démontrons enfin que Mk est engendré par les Er4 Es6 , où r, s sont des entiers ≥ 0 tels que 4r + 6s = k.
D’après le corollaire 3.6, on peut supposer k ≥ 4. On procède par récurrence sur k. Observons que k étant
pair ≥ 4, il existe des entiers positifs r, s tels que k = 4r + 6s : on a soit k ≡ 0 mod 4, soit k ≡ 6 mod 4
et k ≥ 6. Un tel couple (r, s) étant fixé, observons que pour tout f ∈ Mk alors f − f (∞)Er4 Es6 ∈ Sk . Mais
1
Sk = ∆Mk−12 d’après le corollaire 3.7, et ∆ = 1728
(E34 − E26 ). Cela termine la démonstration, ainsi donc que
celle du théorème 2.5. Les corollaires 3.6 et 3.7 entraînent également immédiatement le corollaire suivant :
Corollaire 3.8. Supposons k ≥ 0 pair. La dimension de Sk vaut [k/12] si k 6≡ 2 mod 12, [k/12] − 1 sinon.
4. Quelques q-développements
P
4.1. Séries d’Eisenstein. Si k ∈ Z et n ≥ 1 est un entier, on pose σk (n) = d|n dk . On rappelle que les
P
t
nombres de Bernoulli sont définis par la série formelle et −1
= n≥0 Bn!n tn . L’identité suivante est essentiellement due à Euler.
P
Proposition 4.2. Soit k un entier pair ≥ 4. On a Ek = 1 − B2kk n≥0 σk−1 (n)qn .
Démonstration —
(4)
Rappelons qu’Euler a démontré que pour tout z ∈ C − Z, on a
X
1
1
1
π
= +
(
+ )
tan πz
z
z−n n
n∈Z−{0}
Justifions brièvement cette identité. Notons g(z) la série de fonctions de droite et posons f (z) =
|z| ≤ r et |n| > r alors l’inégalité
|
π
tan πz .
Si
1
1
|z|
r
+ |=
≤
z−n n
|n||z − n|
|n|(|n| − r)
montre que la série de fonctions méromorphes g(z) converge normalement sur tout compact de C. C’est
donc une fonction méromorphe sur C, holomorphe sur C − Z, dont les pôles en les entiers sont simples de
résidu 1. La fonction f a les même propriétés que g, de sorte que f − g est holomorphe sur C. Mais f et
INTRODUCTION AUX FORMES MODULAIRES
9
g, et donc f − g, sont 1-périodiques et impaires (c’est un exercice pour g). Pour en déduire que f − g est
nulle il suffit d’après Liouville de montrer que f et g restent bornées quand Imτ → ∞. C’est clair pour f .
Pour g, on observe que q g(τ ) → 0 quand Im(τ ) → +∞, d’où l’on tire que ge est holomorphe en 0 (lemme de
prolongement de Riemann), ce qui conclut.
Si τ ∈ H on a le développement évident tanππτ = iπ q+1
q−1 = iπ + 2iπ
fois par rapport à τ la formule d’Euler, on trouve l’identité
(2iπ)k
X
nk−1 qn = (−1)k (k − 1)!
n≥0
X
n∈Z
P
n
n≥0 q .
Soit k ≥ 1. En dérivant k − 1
1
.
(τ + n)k
Supposons k pair ≥ 4. On applique cette identité à mτ pour tout m entier ≥ 1, ce qui a pour effet de
remplacer q par qm , et on fait la somme (la convergence absolue du terme de droite ayant déjà été vérifiée).
On en déduit, pour k ≥ 4 pair :
(2iπ)k X
1
σk−1 (n)qn .
Gk (τ ) = ζ(k) +
2
(k − 1)!
n≥0
Pour conclure, on utilise une identité fameuse due à Euler :
ζ(k) = −
(2iπ)k
Bk .
2k!
En fait, cette formule est aussi conséquence de l’identité (4). En effet, cette dernière dérivée k − 1 fois s’écrit
(
X
2iπ
1
1
− )(k−1) = (−1)k−1 (k − 1)!
.
−1 z
(z + n)k
e2iπz
n6=0
Par définition des nombres de Bernoulli on a
conclut par évaluation en z = 0.
2iπ
e2iπz −1
−
1
z
=
P
n Bn n−1
n≥1 (2iπ) n! z
au voisinage de z = 0. On
Observons que le q-développement de Ek est à coefficients dans Q. Mieux, E4 et E6 sont à coefficients
entiers, comme le montre le tableau suivant. Ainsi, le théorème 2.5 entraîne que Sk possède une C-base
constituée de formes modulaires à coefficients entiers, un phénomène inattendu.
k
− B2kk
2
4
6
8
10
12
14
16
−24 240 −504 480 −264 65520/691 −24 16320/3617
4.3. La magie des formes modulaires. En guise d’exemple, considérons E24 . C’est un élément de M8 =
C E8 (Corollaire 3.6). Comme E24 (∞) = E8 (∞) = 1, on a nécessairement
E24 = E8 .
Cette identité est tout à fait non triviale ! En effet, une fois les coefficients de Fourier égalisés elle s’écrit
σ7 (n) = σ3 (n) + 120
n−1
X
σ3 (m)σ3 (m − n),
∀ n ≥ 1.
m=1
Par exemple, 1 + 27 = 129 = 1 + 23 + 120. Cette méthode de raisonnement est de portée très générale, et
nous en verrons d’autres applications spectaculaires dans la suite.
10
GAËTAN CHENEVIER
1
(E34 − E26 ), combinée aux q-développements de E4 et E6 , permet
4.4. La fonction ∆. La formule ∆ = 1728
d’exprimer les coefficients de Fourier de ∆. On trouve (en notant 1728 = 3 · 240 + 2 · 504)
∆ = q − 24 q2 + 252 q3 + · · ·
Théorème 4.5. (Jacobi) ∆ = q
Q
n≥1 (1
− qn )24 .
Pour une démonstration, voir le livre de Serre référencé. Les coefficients de Fourier an (∆) de ∆ sont notés
τ (n) : c’est la fonction τ de Ramanujan. Elle possède une riche histoire, sur laquelle nous reviendrons dans
les exposés.
5. La fonction ϑ de Jacobi
5.1. L’identité de Poisson. Considérons la fonction d’une variable réelle t > 0 définie par la somme
X
2
θ(t) =
e−tπn .
n∈Z
Cette série (à termes positifs) est bien évidemment convergente, et fonction décroissante de t > 0. Elle
satisfait l’équation fonctionnelle curieuse suivante, due à Poisson, que nous allons d’abord démontrer.
Proposition 5.2. Pour tout réel t > 0 on a θ(1/t) =
√
t θ(t).
On rappelle que l’espace de Schwartz S(R) est l’espace des fonctions f : R → C de classe C ∞ telles que
pour tous entiers n, m ≥ 1, on ait xn f (m) (x) → 0 quand |x| −→ ∞. Si f ∈ S(R), f est en particulier
R
sommable de sorte que sa transformée de Fourier fb : R → C, y 7→ R f (x)e−2iπxy dx, est bien définie.
P
P
Lemme 5.3. (Formule de Poisson) Pour tout f ∈ S(R) on a n∈Z f (n) = n∈Z fb(n).
P
Soit ψ(x) = m∈Z f (x + m). Cette série de fonctions converge normalement sur tout
segment, ainsi que toutes ses dérivées, par hypothèse sur f . Elle définit donc une fonction C ∞ et 1-périodique
de la variable réelle x. Ses coefficients de Fourier sont donnés par la formule
Z 1
X Z m+1
−2iπnx
cn =
ψ(x)e
dx =
f (x)e−2iπnx dx = fb(n).
Démonstration —
0
m∈Z m
L’intervertion somme/intégrale est bien sûr loisible car f est sommable sur R. La fonction ψ étant C ∞ , sa
P
série de Fourier n∈Z fb(n)e2iπnx est absolument convergente vers ψ(x) pour tout x ∈ R. On conclut en
prenant x = 0, et montrons au passage que les deux sommes de l’énoncé sont absolument convergentes. 2
Lemme 5.4. Si t ∈ R>0 , la fonction x 7→ ft (x) = e−πtx est dans S(R), et vérifie
1
fbt (y) = √ f1/t (y) ∀y ∈ R.
t
L’assertion ft ∈ S(R) est facile, et laissée au lecteur. Un simple changement de variables
√
2
montre fbt (y) = √1t fb1 (y/ t). Il suffit donc de démontrer fb1 = f1 , i.e. que x 7→ e−πx est égale à sa tranformée
de Fourier. C’est un fait bien connu dû à Gauss. Donnons un argument. On constate que
Z
∂ b
2
f1 (y) = i (e−πx )0 e−2iπxy dx = −2πy fb1 (y)
∂y
R
R
2
2
−πy
d’où l’on tire fb1 (y) = e
I, avec I = fb1 (0) = R e−πx dx. Mais Gauss a démontré I = 1 : par exemple par
R
R∞
2
2π
passage aux coordonnées polaires on a l’identité I2 = 0 dθ 0 e−πr rdr = 1, et I > 0.
Démonstration —
Pour conclure la démonstration de la proposition 5.2, il suffit d’appliquer la formule de Poisson à la fonction
ft . Mentionnons que cette identité de Poisson est l’ingrédient clé dans la démonstration par Riemann de
l’équation fonctionnelle de la fonction ζ(s).
INTRODUCTION AUX FORMES MODULAIRES
11
5.5. La fonction Θ de Jacobi. Jacobi a introduit une variante à deux variables de la fonction θ : si z ∈ C
et τ ∈ H, il pose
X
2
Θ(z ; τ ) =
eiπτ n +2iπnz .
n∈Z
Cette série est manifestement normalement convergente sur toute partie de C×H de la forme {(z, τ ), Im z >
A, Im τ > B}, où A ∈ R et B ∈ R>0 . Cela justifie la définition, et montre que la fonction (z, τ ) 7→ Θ(z ; τ )
est holomorphe en chacune de ses variables, l’autre étant fixée (et même en les deux variables si l’on sait
ce que cela signifie). On observe que si t > 0 alors Θ(0, it) = θ(t) : on retrouve la fonction précédente sur
l’axe imaginaire, quand z = 0. Des manipulations évidentes montrent que la fonction Θ(z ; τ ) satisfait les
équations fonctionnelles suivantes :
Θ(z + 1 ; τ ) = Θ(z ; τ )
Θ(z + τ ; τ ) = e−iπτ −2iπz Θ(z ; τ ).
et
Ainsi, à τ fixé, ces formules expriment le comportement de la fonction z 7→ Θ(z ; τ ) par rapport au réseau
Z + τ Z de C ; leur application originale est d’ailleurs à la construction de fonctions méromorphes sur C
invariantes par un tel réseau. Leur dépendance en la variable τ , que l’on peut voir comme paramétrant le
réseau Z + τ Z, est encore plus remarquable :
Théorème 5.6. Pour tout z ∈ C et tout τ ∈ H, on a les relations
√
2
Θ(z ; τ + 2) = Θ(z ; τ )
et
Θ(z ; −1/τ ) = −iτ e2iπτ z Θ(τ z ; τ ).
√
Dans cette formule la notation −iτ désigne la racine carrée de −iτ dont la partie réelle est > 0.
L’identité Θ(z ; τ + 2) = Θ(z ; τ ) est immédiate.√Pour la seconde, on applique la formule
de Poisson à la fonction du lemme suivant, dans lequel le complexe −iτ pour τ ∈ H est à prendre au même
2
sens que dans l’énoncé du théorème. On obtient Θ(z ; τ ) = (−iτ )−1/2 e−iπz /τ Θ(z/τ ; −1/τ ). On conclut en
remplaçant z par τ z.
Démonstration —
Lemme 5.7. Si z ∈ C et τ ∈ H, la fonction x 7→ eiπτ x
y 7→ √
2 +2iπzx
est dans S(R), et de transformée de Fourier
iπ
1
2
e− τ (x−z) .
−iτ
2
Posons gτ (x) = eiπτ x . La transformée de Fourier de x 7→ gτ (x)e2iπzx étant y 7→ gbτ (y −z),
on peut supposer z = 0. Fixons y ∈ R. On veut démontrer l’égalité
Démonstration —
1
g−1/τ (y).
gbτ (y) = √
−iτ
Lorsque τ = it avec t réel > 0, c’est exactement le lemme 5.4. D’après le principe des zéros isolés, il suffit
donc de vérifier que les deux termes de cette
√ égalité sont des fonctions holomorphes de la variable τ dans
H. C’est clair pour τ 7→ g−1/τ (y) et τ 7→ −iτ (cette dernière est une racine carrée continue de la fonction
τ 7→ −iτ qui ne s’annule pas sur H). En ce qui concerne l’intégrale à paramètre τ 7→ gτ (y), cela se déduit
2
2
de l’holomorphie de τ 7→ gτ (x) pour tout x ∈ R et de l’inégalité |eiπτ x | ≤ e−π Im τ x .
5.8. La fonction ϑ. Notons J ⊂ SL2 (Z) le sous-groupe engendré par les éléments T2 et S. Certains auteurs
appellent J le “ϑ-groupe”. Notons ϑ : H → C la fonction
X
2
ϑ(τ ) = Θ(0 ; τ ) =
eiπτ n .
n∈Z
Elle est non identiquement nulle car ϑ(it) = θ(t) > 0 si t est un réel > 0.
Corollaire 5.9. Il existe un unique morphisme de groupes χ : J → {±1, ±i} tel que χ(S) = −i et χ(T2 ) = 1.
De plus, pour tout γ ∈ J on a la relation ϑ2 |1 γ = χ(γ) ϑ2 .
12
GAËTAN CHENEVIER
La proposition 5.6 entraîne ϑ2 |1 S = −i ϑ2 et aussi ϑ2 |1 T2 = ϑ2 . Autrement dit, la fonction
ϑ2 est vecteur propre pour l’action de poids 1 de S et T2 , de valeurs propres respectives −i et 1. Ces éléments
engendrant J, on en déduit d’une part l’existence et l’unicité de χ comme dans l’énoncé, et d’autre part la
seconde assertion.
Démonstration —
Observons que l’existence même d’un morphisme χ : J → C∗ tel que χ(S) = −i et χ(T2 ) = 1 n’était
pas du tout évidente à priori ! Ainsi, la fonction ϑ2 apparaît comme une forme modulaire généralisée, en un
sens que nous préciserons dans la partie suivante. Avant d’en arriver là, observons que l’on a manifestement
P
2
ϑ(2τ ) = n∈Z qn , de sorte que pour tout entier k ≥ 1 on a la relation
X
X
2
2
rk (n)qn
qn1 +···+nk =
ϑk (2τ ) =
n≥0
(n1 ,...,nk )∈Zk
P
où rk (n) désigne le nombre de k-uples (n1 , . . . , nk ) ∈ Zk tels que n = ki=1 n2i . Autrement dit, comme série
en q, la fonction ϑk (2τ ) n’est rien d’autre que la série génératrice du nombre des façons d’écrire un entier
n ≥ 0 comme somme de k carrés d’entiers. C’est le point de départ du lien entre formes quadratiques entières
et formes modulaires.
ee
5.10. ... et ses compagnons ϑe et ϑ.
Jacobi a également introduit les fonctions H −→ C :
e )=
ϑ(τ
X
(−1)n eiπτ n
n∈Z
2
et
X
iπτ X n(n+1)
2
ee
q 2 .
ϑ(τ
)=
eiπτ (n+1/2) = e 4
n∈Z
n∈Z
iπτ
ee
e ) = Θ(1/2 ; τ ) et ϑ(τ
Par définition, on a donc ϑ(τ
) = e 4 Θ(τ /2 ; τ ). Elles sont reliées à ϑ par les formules
1
ee
e ) = ϑ(τ + 1) et ϑ(τ
ϑ(1 − 1/τ ).
ϑ(τ
)= √
−iτ
(Pour la première utiliser n2 ≡ n mod 2 et pour la seconde appliquer l’identité de Jacobi à z = 1/2.)
6. Formes modulaires pour un sous-groupe de SL2 (Z)
Dans cette partie, Γ désigne un sous-groupe de SL2 (Z). Un caractère de Γ est un morphisme de groupes
Γ → C∗ .
Définition 6.1. Soient k ∈ Z et χ un caractère de Γ. Une forme modulaire de poids k et de caractère χ
pour le groupe Γ est une fonction holomorphe f : H → C telle que :
(i) f|k γ = χ(γ)f pour tout γ ∈ Γ,
(ii) pour tout γ ∈ SL2 (Z), la fonction (f|k γ)(τ ) admet une limite finie quand Im τ −→ ∞.
Lorsque χ est le caractère trivial, on parle simplement de forme modulaire de poids k pour le groupe Γ.
On note Mk (Γ, χ) ⊂ O(H) le sous-espace des formes modulaires de poids k et caractère χ ; on pose aussi
Mk (Γ) = Mk (Γ, 1). Par exemple, Mk = Mk (SL2 (Z)). Discutons un peu la seconde condition. Observons que
si une fonction f satisfait la condition (i), alors pour tout γ 0 ∈ Γ, γ ∈ SL2 (Z), et m ∈ Z on a
(f|k ± γ 0 γTm )(τ ) = ±χ(γ 0 ) (f|k γ) (τ + m).
Ainsi, f|k ±γ 0 γTm admet une limite quand Im τ → +∞ si, et seulement si, f|k γ a cette propriété. Autrement
dit, pour vérifier la condition (ii) il suffit de le faire pour un ensemble de représentants γ des doubles classes
Γ\SL2 (Z)/h±I2 , Ti.
Remarque 6.2. Bien que nous ne l’utiliserons pas, mentionnons que la condition (ii) admet une signib On
fication plus claire s’il on introduit les pointes de H (“cusps” en anglais). Ce sont les éléments de Q.
b avec hT, ±I2 i pour stabilisateur de ∞. L’ensemble
vérifie que le groupe SL2 (Z) agit transitivement sur Q,
b La condition (ii) précise le comporΓ\SL2 (Z)/h±I2 , Ti s’identifie alors à l’ensemble des orbites de Γ sur Q.
tement de f (τ ) lorsque τ tend vers chacune des pointes selon le filtre des disques tangents à la pointe.
INTRODUCTION AUX FORMES MODULAIRES
13
Lorsque l’on suppose que le groupe Γ est d’indice fini dans SL2 (Z), et que le caractère χ est d’image finie,
on dispose d’une majoration intéressante de la dimension de Mk (Γ, χ). Si le caractère χ est d’image finie,
on appelle ordre de χ le plus petit entier e ≥ 1 tel que χe = 1. Tout sous-groupe fini de C∗ étant cyclique,
on a bien sûr e = |χ(Γ)|.
Proposition 6.3. Supposons Γ d’indice fini m dans SL2 (Z) et le caractère χ d’image finie. On a
km
+1
dim Mk (Γ, χ) ≤
12
pour tout entier k ≥ 0. De plus, on a Mk (Γ, χ) = 0 si k < 0.
Commençons par quelques remarques. La formule évidente f|k γ × g|k0 γ = (f g)|k+k0 γ entraîne que si
f ∈ Mk (Γ, χ) et g ∈ Mk (Γ, χ0 ) alors f g ∈ Mk+k0 (Γ, χχ0 ). On en déduit que si χe = 1 et f ∈ Mk (Γ, χ) alors
f e ∈ Mke (Γ). Pour la même raison, on constate que si f ∈ Mk (Γ) et γ ∈ SL2 (Z), alors f|k γ ne dépend que
de la classe γ de γ dans Γ\SL2 (Z), nous la noterons f|k γ. En particulier, si f ∈ Mk (Γ) il y a un sens à poser
Y
f|k x.
Norme f =
x∈Γ\SL2 (Z)
Lemme 6.4. Supposons Γ d’indice fini m dans SL2 (Z), k ∈ Z et f ∈ Mk (Γ). Alors Norme f ∈ Mkm . De
plus, Norme f = 0 si, et seulement si, f = 0.
Norme f est une fonction holomorphe sur H, qui admet une limite quand Im τ −→ ∞
par hypothèses sur f . Si γ ∈ SL2 (Z), la multiplication à droite par γ sur l’ensemble fini Γ\SL2 (Z) est
bien entendu bijective, de sorte (Norme f )|mk γ = Norme f . On a montré Norme f ∈ Mmk . Par intégrité de
l’anneau des fonctions holomorphes sur le connexe H (i.e. par le principe des zéros isolés), Norme f = 0
entraîne qu’il existe γ ∈ SL2 (Z) tel que f|k γ = 0, puis f = (f|k γ )|k γ −1 = 0.
Démonstration —
o
(de la proposition 6.3) Soit N un entier ≥ 0 tel que N > mk
12 . Soit P ⊂ F une partie
arbitraire de l’intérieur de F telle que |P | = N . Considérons l’application linéaire
Démonstration —
Mk (Γ, χ) → CP , f 7→ (f (p))p∈P .
Il suffit de démontrer qu’elle est injective pour en déduire la proposition. Soient f dans son noyau et e l’ordre
de χ. D’après le lemme ci-dessus, la fonction g = Norme f e est dans Mekm . De plus, g est produit de f e par
une fonction holomorphe, et s’annule donc en chacun des N points de P avec un ordre d’annulation ≥ e. La
formule k/12, appliquée à la forme g de poids ekm, montre donc g = Norme f e = 0, puis f e = f = 0.
Remarque 6.5. Lorsque k 6= 1, le théorème de Riemann-Roch permet de donner une formule exacte pour
la dimension de Mk (Γ), en fonction d’un petit nombre d’invariants associés à Γ : voir le livre de Shimura
référencé. Il n’existe pas en revanche de description générale des Mk (Γ) qui soit aussi explicite que celle
obtenue pour Γ = SL2 (Z) et χ = 1 : chaque groupe Γ a son histoire. Nous examinerons ci-après le cas Γ = J.
7. Le ϑ-groupe est de congruence
Si N ≥ 1 est un entier on dispose d’un morphisme de groupes εN : SL2 (Z) → SL2 (Z/N Z) obtenu en
réduisant les coefficients modulo N . Le noyau de ce morphisme est un sous-groupe noté Γ(N ) et appelé
sous-groupe de congruence principal de niveau N . Il est un distingué et d’indice fini dans SL2 (Z). On dit
qu’un sous-groupe Γ ⊂ SL2 (Z) est de congruence s’il existe un entier N ≥ 1 tel que Γ(N ) ⊂ Γ.
Il ne serait pas difficile de démontrer que εN est surjectif, et qu’il induit donc un isomorphisme
∼
[ = {0, 1, ∞} a trois éléments,
SL2 (Z)/Γ(N ) → SL2 (Z/N Z). Vérifions-le pour N = 2. L’ensemble Z/2Z
[ donné par l’action par homographies
et l’on dispose d’un homomorphisme h : SL2 (Z/2Z) → S(Z/2Z)
(§1.1). Il injectif car la seule homothétie de SL2 (Z/2Z) est I2 . Les éléments h ε2 (S) et h ε2 (T) sont deux
[ on
transpositions, la première fixant le point 1, la seconde le point ∞. Ces dernières engendrant S(Z/2Z),
en déduit que h est un isomorphisme et que ε2 est surjectif.
14
GAËTAN CHENEVIER
Proposition 7.1.
(i) J = Γ(2) ∪ S Γ(2). En particulier, on a Γ(2) ⊂ J, et J est de congruence.
(ii) Les éléments 1, T et TS forment un système de représentants de J\SL2 (Z). En particulier, J est
d’indice 3 dans SL2 (Z).
(iii) Pour tout τ ∈ H, il existe g ∈ J tel que gτ ∈ F ∪ TF ∪ TSF.
Vérifions d’abord le (iii). Observons que F ∪ T F ∪ TS F est l’ensemble des τ ∈ H
tels que −1/2 ≤ Re τ ≤ 3/2, |τ | ≥ 1 et |τ − 2| ≥ 1 (figure 1.3). Comme les élément S et ST2 , d’homographies
associées τ 7→ −1/τ et τ 7→ −1/(τ − 2) sont dans J, l’argument de maximalité donné dans la démonstration
du théorème 1.4 (i) démontre le (iii).
Démonstration —
Montrons maintenant le (ii). Choisissons un point τ dans l’intérieur de F (ou simplement, qui n’est pas
dans la SL2 (Z)-orbite de i ou ρ). Rappelons que d’après le théorème 1.4, les seuls éléments γ ∈ SL2 (Z) tels
que γτ ∈ F sont ±I2 . Soit γ ∈ SL2 (Z). D’après le (iii) appliqué à γτ , il existe g ∈ J tel que gγτ soit dans
F, T F ou TS F. Ainsi, le théorème 1.4 entraine ±gγ = I2 , T ou TS. Comme −I2 = S2 ∈ J on a montré
SL2 (Z) = J ∪ J T ∪ J TS.
[ sur 1 (resp. 0,
Cette réunion est disjointe. En effet, si g ∈ J (resp. JT, JTS) alors ε2 (g −1 ) envoie 1 ∈ Z/2Z
∞). Cela termine la démonstration du (ii), et démontre que J est l’ensemble des éléments γ ∈ SL2 (Z) tels
que ε2 (γ) fixe 1. Autrement dit, on a J = Γ(2) ∪ S Γ(2).
Figure 3. Le domaine F ∪ T F ∪ TS F
8. Sommes de 8 carrés
Observons que d’après la proposition 7.1, les classes des éléments 1 et
1 −1
TS =
1 0
recouvrent J\SL2 (Z)/h±Ti. Ainsi, si une fonction holomorphe f : H → C satisfait la condition (i), elle
satisfait (ii) si et seulement si les fonctions f (τ ) et (f|k TS)(τ ) = τ −k f (1 − 1/τ ) admettent toutes deux des
limites quand Im τ → ∞. Pour des raisons de clarté, et tout en s’imposant une certaine prudence, ces limites
seront notées respectivement f (∞) et f (1), si elles existent. Soit χ : J → C∗ le caractère introduit au §5.8.
Proposition 8.1. La fonction ϑ2 est modulaire de poids 1 et caractère χ pour J. De plus, on a
Plus précisément, ϑ2 |1 TS (τ ) = −i e
iπτ
2
ϑ2 (∞) = 1 et ϑ2 (1) = 0.
P
n2 +n
ee 2
( n∈Z q 2 )2 = −i ϑ(τ
) .
INTRODUCTION AUX FORMES MODULAIRES
15
Démonstration — Compte tenu du corollaire 5.9, la seule chose qu’il reste à démontrer est l’assertion sur
les limites. Il est évident que ϑ(τ ) → 1 quand Im τ → +∞. Par définition, on a ϑ2 |1 TS(τ ) = τ −1 ϑ2 (1 − 1/τ ).
On conclut par la relation déjà vue au §5.10 :
ee
(−iτ )−1/2 ϑ(1 − 1/τ ) = ϑ(τ
).
(i) Pour tout entier k ≥ 0, on a ϑ2k ∈ Mk (J, χk ).
ee 8
(ii) (Jacobi) On a l’identité (ϑ ϑe ϑ)
= 28 ∆. En particulier, ϑ ne s’annule pas sur H.
Corollaire 8.2.
D’après la proposition 8.1, ϑ2 ∈ M1 (J, χ). Le (i) en est une conséquence immédiate.
Pour le (ii), on constate que le terme de gauche est Norme ϑ8 au sens du §5.10. On observe que c’est un
élément non nul de S12 dont le coefficient de Fourier en q est 28 ; la présence du 2 vient de la relation
iπτ
iπτ
ee
ϑ(τ
) = 2 e 4 + O(e 2 ) quand Im τ → ∞. D’après la proposition 3.7, c’est nécessairement 28 ∆.
Démonstration —
On a Ek ∈ Mk (J) car Mk ⊂ Mk (J) pour tout k ∈ Z. Comme Ek = Ek|k TS, on a de plus Ek (∞) = Ek (1) =
1. La construction de séries d’Eisenstein effectuée pour SL2 (Z) admet des variantes pour les groupes de
congruences. Nous nous contenterons d’illustrer ce phénomène dans le cas du groupe J.
Proposition 8.3. Soit k ≥ 4 un entier pair. La série
convergente sur H ; on note
Enfin, on a
G∗k (τ )
sa somme. On a
G∗k
1
(m,n)∈Z2 −{0},m≡n mod 2 (mτ +n)k
Mk (J), G∗k (∞) = 21−k ζ(k) et
P
est absolument
∈
G∗k (1) = 2ζ(k).
2k−1 ∗
Bk X
Gk (τ ) = 1 −
(−1)n σk−1 (n) eiπnτ .
ζ(k)
2k
n≥1
On procède de manière strictement identique à la démonstration de la proposition 4.2.
La convergence absolue de G∗k (τ ) ainsi que son invariance par l’action de poids k de J est claire. De même,
Gk (τ ) tend vers 21−k ζ(k) quand Im τ −→ ∞. On constate enfin que
Démonstration —
X
τ −k Gk (1 − 1/τ ) =
(m,n)∈Z2 −{0},m≡n mod 2
1
=
((m + n)τ − m)k
X
(m,n)∈Z2 −{0}
1
,
(2mτ + n)k
qui tend vers 2ζ(k) quand Im τ −→ +∞. Pour le dernier point, on peut procéder comme dans la démonstration de la proposition 4.2. Mieux, on peut le déduire du q-développement de Ek en observant la relation
(immédiate !) G∗k (τ ) = 2−k Gk ( τ +1
2 ).
Si k est pair > 2, on pose E∗k =
c’est une application linéaire.
Proposition 8.4.
2k−1 ∗
ζ(k) Gk .
On considère également u : Mk (J) −→ C × C, f 7→ (f (∞) , f (1)) ;
(i) Si k > 2 est pair, l’application u est surjective.
(ii) M4 (J) est de dimension 2 engendré par E4 et E∗4 .
La proposition précédente entraîne u(Ek ) = (1, 1) et u(E∗k ) = (1, 2k ), d’où la surjectivité
de u. Le groupe J est d’indice 3 dans SL2 (Z) (Prop. 7.1). La proposition 6.3 entraîne que M4 (J) est de
dimension ≤ 2. On conclut car il contient E4 et E∗4 , et u(Ek ) et u(E∗k ) ne sont pas proportionnels.
Démonstration —
16
GAËTAN CHENEVIER
1
(16 E4 − E∗4 ). En particulier, si r8 (n) désigne le
Théorème 8.5. (Jacobi, 1829) On a l’identité ϑ8 = 15
P
8
nombre de (n1 , . . . , n8 ) ∈ Z8 tels que i=1 n2i = n, on a la relation
X
(−1)n−d d3 .
r8 (n) = 16
d|n
Démonstration —
Les propositions 8.1 et 8.4 montrent qu’il existe a, b ∈ C tels que ϑ8 = aE4 + bE∗4 et
u(ϑ8 ) = (1, 0) = (a + b, a + 16b).
−1
On trouve (a, b) = ( 16
15 , 15 ). Étant donné que 240 = 15 · 16, on a donc
X
X
σ3 (n)(16 q2n − (−1)n qn ).
r8 (n)qn = ϑ8 (2τ ) = 1 + 16
n≥1
n≥0
qn
Si n est impair, le coefficient de
dans la somme ci-dessus estP
σ3 (n). Si n est pair, il s’agit plutôt de
−σ3 (n) + 16 σ3 (n/2). Mais comme dans ce cas on a 16 σ3 (n/2) = 2 2|d|n d3 , on a aussi la relation −σ3 (n) +
P
16 σ3 (n/2) = d|n (−1)d d3 .
En particulier, si p est un nombre premier impair on a simplement r8 (p) = 16 (p3 + 1). Par exemple pour
p = 3 on a r8 (3) = 23 C38 = 82 · 7 ... qui vaut bien 16 · 28. De même, 25 · C58 + 8 · 7 · 22 = 2016 = 16 (53 + 1) ( !).
On obtient bien d’autres formules fabuleuses pour les sommes de 8k carrés en étudiant plus généralement
M4k (J). Un ingrédient clé, maintenant à notre portée, est alors le suivant :
Théorème 8.6.
(i) Si k ≡ 0 mod 4, l’espace Mk (J) est de dimension k4 +1. Il admet pour base les Er4 (E∗4 )s
avec r + s = k/4.
(ii) Si k 6≡ 0 mod 4 alors Mk (J, χk ) = ϑ2 Mk−1 (J, χk−1 ).
Montrons le (i). La famille de l’énoncé est libre par un argument semblable (en plus
simple) à celui de la proposition 2.5. Elle est de cardinal k4 + 1. On conclut car dim Mk (J) ≤ k4 + 1 d’après
la proposition 6.3, le groupe J étant d’indice 3 dans SL2 (Z). Pour démontrer le (ii), il suffit de démontrer
que si f ∈ Mk (J, χk ) avec k 6≡ 0 mod 4 alors g(τ )e−iπτ /2 admet une limite quand Im τ tends vers +∞, où
g = f|k TS. En effet, étant donné que ϑ(τ ) ne s’annule pas dans H (Corollaire 8.2 (ii)), la proposition 8.1
permet de conclure f /ϑ2 ∈ Mk−1 (J, χk−1 ). Mais TSTS−1 T−1 = −ST−1 SS−1 T−1 = −ST−2 est un élément
de J de caractère i, et de sorte que g(τ + 1) = ik g(τ ), ce qui conclut.
Démonstration —
Pour aller plus loin, il nous resterait à définir une série d’Eisenstein vivant dans Mk (J, χk ) avec k non
nécessairement ≡ 0 mod 4. C’est particulièrement difficile pour des raisons de convergence lorsque k = 2, et
pire encore lorsque k = 1. Cela permettrait de démontrer par exemple les formules célèbres, valables pour
tout n ≥ 1,
X
X
r2 (n) = 4
ψ(d), r4 (n) = 8
d3 .
d|n
4-d|m
La première est due à Gauss ; dans cette formule ψ(d) = 0 si d est pair, 1 si d ≡ 1 mod 4 et −1 sinon.
Il en existe une autre une preuve très simple utilisant l’arithmétique de Z[i]. La seconde est due à Jacobi.
De même, il en existe une preuve relativement simple utilisant l’arithmétique des quaternions de Hurwitz.
Mentionnons enfin que Gauss a également trouvé une formule pour r3 (n), d’apparence assez différente, dont
l’établissement pourrait par exemple être obtenu par les principes étudiés ici si l’on avait introduit les formes
modulaires de poids “demi-entier”. Enfin, il existe des formules raisonnablement simples pour rk (n) pour tout
k ≤ 10.