Download Report

UNIVERSIDAD DE BUENOS AIRES
Facultad de Ciencias Exactas y Naturales
Departamento de Matem´
atica
Tesis de Licenciatura
El Teorema de Roth
Juan Manuel Menconi
Director: Rom´
an Sasyk
Marzo 2015
´Indice
Introducci´
on
iii
Cap´ıtulo 1. El camino hacia el teorema de Roth
1. Los teoremas de Dirichlet y Liouville
2. El trabajo de Thue
3. Teorema de Roth y generalizaciones
1
1
5
10
Cap´ıtulo 2. El Teorema de Roth
1. Comentarios sobre el enunciado del teorema de Roth
2. Reducci´
on a aproximaciones simultaneas de enteros algebraicos
3. Preliminares
4. Construcci´
on del polinomio auxiliar
5. El indice es grande
6. Lema de Roth
7. Prueba del teorema de Roth
13
13
15
17
23
25
30
38
Cap´ıtulo 3. Aplicaciones
1. Sobre el desarrollo decimal de n´
umeros algebraicos
2. El problema de Waring
3. Ecuaciones Diof´
anticas
41
41
42
43
Cap´ıtulo 4. El Teorema del Subespacio
1. El Teorema del Subespacio
2. Aproximaciones Simultaneas y Algebraicas de grado acotado
3. La version p-adica del Teorema del Subespacio
4. Sobre la complejidad de n´
umeros algebraicos
51
51
53
55
57
Appendix A.
Alturas
61
Bibliograf´ıa
63
Appendix.
i
Introducci´
on
Una de las preguntas b´
asicas de la Teor´ıa de Aproximaciones Diof´anticas es
investigar las aproximaciones racionales a un n´
umero real. Uno de los principales
objetivos de esta teor´ıa es comparar, por un lado, la distancia entre un n´
umero real
α y un n´
umero racional p/q, y por el otro, el denominador q de la aproximaci´on.
Mientras m´
as chico sea |α − p/q| en comparaci´on con q, se dir´a que la aproximaci´on
racional ser´
a mejor. En 1844, Liouville fue el primero en observar que en el caso de
n´
umeros algebraicos, no se podr´an conseguir aproximaciones racionales tan buenas
como uno desee; si α es un n´
umero algebraico de grado d ≥ 2, existir´a una constante
positiva C, que solo depende de α, tal que
α − pq ≥ qCd
para todo n´
umero racional p/q, con q > 01.
En 1909, una mejora notable en el Teorema de Liouville fue obtenida por el
matem´
atico noruego Axel Thue, durante su investigaci´on sobre la finitud del conjunto de soluciones de ciertas ecuaciones Diof´anticas. Thue prob´o que si α es un
n´
umero algebraico de grado d ≥ 2, para todo k > d/2 + 1 existe una constante
C(α, k) > 0, tal que
C(α,k)
α − pq ≥ qk
para todo n´
umero racional p/q, con q > 0. Como consecuencia de este resultado,
Thue prob´
o que la Ecuaci´
on de Thue
F (X, Y ) = m,
con F ∈ Z[X, Y ] un polinomio homog´eneo de grado d con al menos 3 factores
lineales sobre C no proporcionales, posee finitas soluciones enteras x, y, para toda
constantes fija no nula m.
Luego del trabajo de matem´aticos como Siegel, Dyson, Gelfond, Schneider y
Mahler, en 1955 Roth prob´
o que la proposici´on anterior sigue siendo valida para
k > 2. Una forma equivalente y quiz´as mas cl´asica de enunciar este teorema es
la siguiente; si α es un n´
umero algebraico de grado d ≥ 2, para todo ε > 0 la
inecuaci´
on
α − p ≤ 1
(0.1)
q q d+ε
posee finitas soluciones racionales p/q, con q > 0. A partir de un resultado cl´asico
de Dirichlet2, el resultado de Roth es esencialmente el mejor posible.
1Gracias a este resultado, Liouville fue capaz de probar la existencia de n´
umeros
trascendentes.
2Si se toma ε = 0, existen infinitas soluciones racionales
iii
iv
´
INTRODUCCION
Desde los trabajos de Siegel, este resultado ha pasado por varias mejoras sucesivas. Desde la extensi´
on a aproximaciones en un cuerpo de n´
umeros K, a la
consideraci´
on de valores absolutos p-´adicos. En este trabajo estudiaremos el teorema de Roth bajo estas generalizaciones y algunas de sus respectivas aplicaciones,
entre otras cosas, a la teor´ıa de ecuaciones diof´anticas.
La exposici´
on aqu´ı presentada seguir´a la dada en el libro de Hindry y Silverman [15], con ligeras modificaciones, que nos permitir´an llegar a un resultado m´as
general, como el presentado en los libros de Lang [18] y Bombieri y Gubler [4].
CAP´ITULO 1
El camino hacia el teorema de Roth
1. Los teoremas de Dirichlet y Liouville
Uno de los problemas fundamentales en la teor´ıa de Aproximaciones Diof´anticas
consiste en comprender que tan bien se puede aproximar a un n´
umero real por medio
de n´
umeros racionales o m´
as generalmente n´
umeros algebraicos. La completitud de
na
Q en R nos asegura que si α ∈ R, la diferencia |α − pq | puede hacerse tan peque˜
como queramos para alg´
un pq adecuado. Si bien esta respuesta es v´alida, no resulta
completamente satisfactoria. Reformulemos nuestra pregunta a tratar de entender
con qu´e precisi´
on podemos aproximar a α por medio de racionales, es decir, lograr
que esta diferencia sea chica sin que p y q sean muy grandes. Por ejemplo, dado
α ∈ R, podemos intentar responder para que valores ε > 0 la inecuaci´on
α − pq ≤ q1ε
posee infinitas soluciones racionales pq ∈ Q con q > 0. Mientras mayor sea ε,
m´
as precisa ser´
a la aproximaci´on. Comprender esta pregunta para un n´
umero real
nos permitir´
a establecer si dicho n´
umero es racional o irracional, o si es algebraico
o trascendente. T´ecnicas de Aproximaciones Diofanticas han sido aplicadas para
resolver problemas de Inecuaciones Diof´anticas, Ecuaciones Diof´anticas, Geometria
Diof´
antica y Teor´ıa de Trascendencia, algunos de los cuales mencionaremos en este
trabajo. Nuestro objetivo principal ser´a probar el teorema de Roth, cuya versi´on
original estableces que si α es un n´
umero algebraico, dado ε > 0 la desigualdad
1
α − pq ≤ q2+ε
posee finitas soluciones racionales.
Como punto de partida hacia la prueba del teorema de Roth y el estudio de las
aproximaciones diof´
anticas, probaremos el siguiente teorema, debido a Dirichlet.
Teorema 1.1. Sean α un n´
umero irracional y Q un entero > 1. Entonces
existen enteros p y q, con 1 ≤ q ≤ Q tal que
1
.
α − pq ≤ qQ
´ n. Consideremos los Q + 1 n´
Demostracio
umeros reales
qα − [qα] con q = 0, 1, . . . , Q.
Como α es irracional, estos son Q + 1 n´
umeros distintos en el intervalo [0, 1]. Dividiendo el intervalo en Q subintervalos de longitud 1/Q, el principio del palomar
asegura que podremos encontrar dos enteros 0 ≤ q1 < q2 ≤ Q tal que
|(q1 α − [q1 α]) − (q2 α − [q2 α])| ≤
Por lo tanto
1
1
Q.
2
1. EL CAMINO HACIA EL TEOREMA DE ROTH
[q2 α]−[q1 α]
q2 −q1 − α ≤
1
(q2 −q1 )Q .
Tomamos entonces, p = [q2 α] − [q1 α] y q = q2 − q1 ≤ Q.
Corolario 1. 1Sea α ∈ R irracional. Entonces la inecuaci´
on
α − p ≤ 1
(1.1)
q q2
posee infinitas soluciones
p
q
con q > 0.
´ n. Tomemos por ejemplo Q = 2 en el teorema anterior, entonces
Demostracio
existen enteros p y q, con 1 ≤ q ≤ Q tal que |α − p/q| ≤ 1/qQ, en particular
|α − p/q| ≤ 1/q 2 . Como α es irracional, |α − p/q| =
6 0 con lo cual existe Q0 > 1 tal
0
que 1/Q < |α − p/q|. Volviendo a aplicar el teorema para Q0 obtenemos un nuevo
racional p0 /q 0 que aproxima de la misma forma y es distinto de p/q pues
|α − p0 /q 0 | ≤ 1/(q 0 Q0 ) ≤ 1/Q0 < |α − p/q|.
Repitiendo esto sucesivamente, obtenemos el resultado deseado.
´ n 1. Este corolario fue mejorado por Hurwitz.
Observacio
Teorema 1.2 (Hurwitz 1891). Sea α ∈ R irracional entonces existen infinitos
n´
umeros racionales pq con q > 0 que cumplen
|α − pq | <
√1 .
5q 2
√
Hurwitz adem´
as prob´
o que para α = 21 ( 5 − 1), esta constante es optima, es
√
decir, no podemos tomar una constante mayor a 5 en el denominador2.
Observar, que el Corolario 1 resulta falso si α es racional. Pues supongamos
que α = a/b, si p/q 6= α, aq − pb ser´a un n´
umero entero no nulo entonces
p a p aq − pb 1
(1.2)
α − q = b − q = bq ≥ bq .
Si p/q cumple adem´
as (1.1), entonces se tendr´a que q ≤ b. Por lo tanto hay finitos
racionales que la cumplen.
Obtenemos as´ı, una forma de distinguir los n´
umeros racionales de los irracionales en funci´
on de c´
omo pueden ser aproximados. Resumimos este comentario
en el siguiente teorema.
Teorema 1.3. Sea α ∈ R, entonces α es irracional si y solo si
α − pq ≤ q12
posee infinitas soluciones racionales.
La observaci´
on hecha en (1.2) puede verse de la siguiente forma. Sea α un
n´
umero algebraico de grado 1, es decir, α = a/b un n´
umero racional. Entonces
existe una constante c(α) = 1/b tal que
1Este resultado ya hab´ıa sido obtenido por medio de la teor´ıa de Series de Farey y tambi´
en
por medio de la teor´ıa de fracciones continuas, principalmente desarrollada por Euler y Lagrange.
La nueva demostraci´
on dada por Dirichlet permiti´
o generalizarlo a aproximaciones simultaneas.
Ver por ejemplo [29] Capitulo II
2Una prueba de este resultado aparece en [29] Capitulo I.
1. LOS TEOREMAS DE DIRICHLET Y LIOUVILLE
α − pq ≥
1
bq
=
c(α)
q
para todo
p
q
3
6= α.
Si consideramos ahora el caso en el que α es un n´
umero cuadr´atico, dado que estos
poseen desarrollo en fracci´
on continua peri´odico, se sabe que existe una constante
c = c(α) > 0 tal que
α − pq ≥ qc2
para todo racional pq . Liouville observ´o que una desigualdad de este estilo era v´alida
para n´
umeros algebraicos de grado d y por lo tanto existe un l´ımite para la rapidez
con la cual podemos aproximar n´
umeros algebraicos por medio de racionales.
Teorema 1.4 (Liouville 1844-51).
tonces existe c = c(α) > 0 tal que
α −
(1.3)
para todo racional
p
q
Sea α ∈ R algebraico de grado d ≥ 2, en
p c
> d
q
q
con q > 0.
´ n. Sea f (x) ∈ Z[x], gr(f ) = d tal que f (α) = 0, es decir, f es un
Demostracio
m´
ultiplo entero del polinomio minimal de α. Por lo tanto, dado pq ∈ Q, como f es
Pd
irreducible sobre Q se tiene que f no se anula en pq . Entonces si f (x) = i=0 ai xi ,
q d f ( pq ) =
Pd
i=0
ai pi q d−i
es un n´
umero entero no nulo y por tanto ≥ 1 lo que implica que
|f ( pq )| ≥
1
qd
Si |α − pq | > 1, (1.3) se cumple trivialmente tomando c = 1. Supongamos
entonces que |α − pq | ≤ 1. Por medio del desarrollo de Taylor de f (x) alrededor de
α se tendr´
a que
d
d
i i−1 p X
p p X
p
f ( ) = bi α −
bi α −
= α − q q
q
q
i=1
i=1
< α −
! d
p X
|bi | = α −
q
i=1
p 0
c
q
Por lo tanto,
1
qd
< α − pq c0 .
Tomando c = min(1/c0 , 1) obtenemos (1.3) para todo p/q.
´ n 2. El teorema sigue siendo v´
Observacio
alido si α es un n´
umero complejo
no real, no necesariamente algebraico, ya que
|Im(α)|
α − pq ≥ |Im(α)| ≥ qd
para cualquier n´
umero racional pq ; donde Im(α) denota la parte imaginaria de α y
d es cualquier entero positivo.
4
1. EL CAMINO HACIA EL TEOREMA DE ROTH
Liouville obtuvo as´ı una condici´on necesaria que deben cumplir los n´
umeros
algebraicos de grado d. Gracias a esto, logro probar la existencia de los n´
umeros
trascendentes y dar infinitos3 ejemplos de ellos. Lo que necesitamos es encontrar un
n´
umero que no cumpla (1.3) para ninguna constante c > 0 y ning´
un entero d > 0.
Dado que estamos pidiendo que esto no se cumpla para ning´
un d > 0 alcanza con
tomar c = 1. En definitiva, tenemos el siguiente resultado.
Teorema 1.5. Sea α ∈ R y supongamos que para todo entero d > 1 existe un
n´
umero racional pq tal que
α − pq ≤ q1d .
Entonces α resulta trascendente.
En funci´
on de lo que queremos, no es dif´ıcil construir
un n´
umero que cumpla
P
1
esta condici´
on. Consideremos el n´
umero ξ =
,
conocido
como conn≥1 10n!
stante de Liouville. Dicho n´
umero es trascendente pues sea d > 1 y tomamos
Pd
p = 10d! n≥1 101n! y q = 10d! entonces
X
∞
1
1
1
1
9
1
1
1
1
ξ − p =
< (d+1)!
+
+ 2 ... =
< (d+1)! < d .
(d+1)!
q
10n!
1
10
10
10
q
10
10
10
n>d
M´
as en general,
´ n 1.
Proposicio
X ak
es un n´
umero trascendente para todo b ∈ Z, b ≥ 2 y
bk!
k≥1
1 ≤ ak ≤ b − 1.
A partir del teorema de Dirichlet vimos que es posible decidir si un n´
umero es
racional o irracional si sabemos para que valores ε > 0 se cumple que la inecuaci´on
α − pq < q1ε
posee infinitas soluciones racionales pq ∈ Q con q > 0. Resulta entonces natural
intentar caracterizar a los n´
umeros irracionales en funci´on del conocimiento de
estos exponente. Se define el exponente de aproximaci´on de un n´
umero α, tambi´en
llamado medida de irracionalidad, como el menor valor µ(α) para el cual, dado
ε > 0, la inecuaci´
on
1
α − pq < qµ(α)+ε
posee finitas soluciones racionales pq ∈ Q con q > 0. Si no existe ning´
un µ con esta
4
propiedad, diremos que µ(α) = ∞ . Como consecuencia del teorema de Dirichlet,
tenemos que µ(α) ≥ 2 si α es irracional. A partir de (1.2) se tiene que µ(a/b) ≤ 1.
De hecho se puede ver que µ( ab ) = 1 pues dado q > 0 entero, la fracci´on de
denominador q m´
as cercana a a/b cumple que |a/b − p/q| ≤ 1/2q < 1/q.
El teorema de Liouville establece que si α es un n´
umero algebraico de grado d,
entonces µ(α) ≤ d. Pues si ε > 0 y p/q es soluci´on a |α − p/q| < 1/q d+ε se tiene
que
3De hecho exhibi´
o una cantidad no numerables de n´
umeros trascendentes. La teor´ıa de
Cantor sobre cardinalidad y su demostraci´
on de la existencia y no numerabilidad de los n´
umeros
trascendentes es 30 a˜
nos posterior al teorema de Liouville.
4Estos n´
umeros suelen llamarse, n´
umeros de Liouville. Los n´
umeros de Proposici´
on 1, y en
particular la constantes de Liouville, pertenecen a este conjunto de n´
umeros.
2. EL TRABAJO DE THUE
≤ α − pq <
c
qd
5
1
.
q d+ε
Lo que implica que q debe estar acotado, probando asi que µ(α) ≤ d.
La primer mejora en el caso de n´
umeros algebraicos fue obtenida por Thue [32]
en 1909, quien prob´
o que µ(α) ≤ 12 d+1. El trabajo de Thue es de suma importancia,
no solo por sus aplicaciones, sino tambi´en porque su procedimiento para establecer
este resulto fue la base para los trabajos subsiguientes en este campo. En 1921
Siegel [25] prob´
o que
√
d
µ(α) ≤ min s +
< 2 d, 5
s∈N
s+1
y conjetur´
o que para cualquier n´
umero algebraico, independientemente del grado,
deber´ıa valer µ(α) = 2. En √
1947 Dyson [11] e independientemente Gelfond [14] en
1952 probaron que µ(α) ≤ 2d. La conjetura de Siegel fue finalmente probada en
1955 por Roth [23], trabajo por el cual le fue otorgada la medalla Fields en 1958.
Teorema 1.6 (Roth 1955). Sea α un n´
umero real algebraico de grado d ≥ 2.
Entonces para todo ε > 0, la desigualdad
1
α − pq < q2+ε
posee finitas soluciones racionales
p
q
con q > 0.
El teorema de Roth puede formularse de cualquiera de las siguientes formas
equivalentes
´ n 2. Sea α un n´
Proposicio
umero algebraico real de grado d ≥ 2 entonces son
equivalentes:
(1) Para todo ε > 0 existe una constante c(α, ε) > 0 tal que
|α − pq | >
para todo pq ∈ Q, con q > 0;
(2) Para todo ε > 0, la desigualdad
|α − pq | <
c(α,ε)
q 2+ε
1
q 2+ε
p
q
posee finitas soluciones ∈ Q y q > 0
(3) Para todo ε > 0, C > 0, la desigualdad
C
|α − pq | < q2+ε
posee finitas soluciones
p
q
∈ Q y q > 0.
2. El trabajo de Thue
Si bien intentar caracterizar los n´
umeros reales por medio de su exponente
de aproximaci´
on puede ser considerado una forma de justificar los avances antes
mencionados o quizas el hecho de que obtener mejoras en el exponente para la cota
de Liouville producir´ıa nuevos ejemplos de n´
umeros trascendentes, se podr´ıa decir
que las motivaciones que dieron origen a la b´
usqueda de estas mejoras fueron el
estudio de las ecuaciones diof´anticas. Thue observ´o que a una soluci´on entera de
una cierta ecuaci´
on diof´
antica se le pod´ıa asociar una muy buena aproximaci´on
hacia un n´
umero algebraico definido por dicha ecuaci´on.
5El hecho de que este exponente sea de orden o(d) en lugar de d fue de suma importancia
en la prueba de Siegel, del teorema que establece que toda curva de genero g ≥ 1 posee finitas
soluciones enteras(al menos para el caso g = 1).
6
1. EL CAMINO HACIA EL TEOREMA DE ROTH
Veamos un ejemplo, supongamos que queremos resolver la siguiente ecuaci´on
sobre los enteros
(1.4)
X 3 − Y 3 = 5.
Una posible forma de hacerlo es factorizando el polinomio considerado de la siguiente forma
(1.5)
X 3 − Y 3 = (X − Y )(X 2 + XY + Y 2 ).
Si (x, y) es una soluci´
on entera de (1.4), entonces cada uno de los factores de (1.5)
resulta ser un n´
umero entero. Dado que en los enteros hay factorizaci´on u
´nica x − y
ser´
a igual a alguno de los factores de 5. Por ejemplo, si suponemos que x − y = 5,
resulta que x − 5 = y con lo cual x2 + x(x − 5) + (x − 5)2 = 1 obtenemos as´ı una
ecuaci´
on de grado 2 a la cual le podemos calcular sus ra´ıces y conseguir as´ı las
soluciones a nuestra ecuaci´
on en el caso x − y = 5. Haciendo lo mismo para todos
los factores de 5 obtendremos todas las soluciones de la ecuaci´on en cuesti´on.
Que sucede ahora si modificamos ligeramente nuestra ecuaci´on por
(1.6)
X 3 − 2Y 3 = 5.
Si intentamos proceder de la misma forma que en el caso anterior encontramos
que no podremos factorizar al polinomio X 3 − 2Y 3 sobre Z[X, Y ]. Dado que en el
caso anterior estas t´ecnicas funcionaron a la perfecci´on, intentemos hacer lo mismo
permitiendo la aparici´
on de coeficientes no necesariamente enteros. Sea ζ una ra´ız
cubica de la unidad entonces
√ √ √ X 3 − 2Y 3 = X − 3 2Y X − ζ 3 2Y X − ζ 2 3 2Y .
Sea ahora (x, y) ∈ Z2 una soluci´on de (1.6), con y 6= 0, entonces
√
√
√ 3
3
x
x
x
2 3
2
2
2 = y53 .
−
−
ζ
−
ζ
y
y
y
√
El segundo
y tercer factor de este producto est´an acotados inferiormente pues ζ 3 2
√
3
y ζ 2 2 son n´
umeros complejos no reales, con lo cual estar´an lejos de cualquier
n´
umero racional x/y. Esto nos dice que podremos encontrar una constante C > 0
independiente de (x, y) tal que
x √
− 3 2 ≤ C .
(1.7)
y
|y|3
Por lo tanto, toda soluci´
on (x, y)
da lugar a una muy
√ a nuestra ecuaci´on (1.6), √
3
buena aproximaci´
on racional de 3 2. Luego,
si
probamos
que
2 no posee infinitas
√
3
aproximaciones de este estilo, es decir, µ( 2) < 3, se tendr´a que nuestra ecuaci´on
posee finitas soluciones enteras.
√
Por medio de la desigualdad del teorema de Liouville, se obtuvo que µ( 3 2) ≤ 3.
Lo√cual no nos ayuda en nada en este caso. Como se dijo, Thue logro probar que
µ( 3 2) ≤ 3/2 + 1 = 2, 5 < 3, lo que implica en este ejemplo que (1.7) posee finitas
soluciones racionales y por lo tanto nuestra ecuaci´on (1.6) posee finitas soluciones
enteras.
Antes de seguir con la mejora de Thue del teorema de Liouville, veamos la
importancia de este tipo de resultado y c´omo se utiliza para probar la finitud de
soluciones de ciertas ecuaciones diof´anticas.
Teorema 1.7. Sea F (X, Y ) ∈ Z[X, Y ] un polinomio homog´eneo de grado d
con al menos tres factores lineales no proporcionales sobre C. Sea m ∈ Z un entero
2. EL TRABAJO DE THUE
7
fijo no nulo, entonces la ecuaci´
on
(1.8)
F (X, Y ) = m
posee finitas soluciones con x, y ∈ Z.
Ecuaciones de este estilo, son llamadas ecuaciones de Thue.
´ n. Asumamos primero que F es irreducible sobre Z[X, Y ] o
Demostracio
equivalentemente, f (X) = F (X, 1) es irreducible sobre Q[X]. Sea
f (X) = a.(X − α1 ).(X − α2 ) . . . (X − αd ),
con a ∈ Z , αi ∈ C. Como F (X, Y ) = Y d .f ( X
Y ) se obtiene la siguiente descomposici´
on
X
X
m
X
− α1 .
− α2 . . .
− αd = d .
(1.9)
a
Y
Y
Y
Y
Supongamos que tenemos infinitas soluciones (xn , yn ) de (1.8), podemos adem´as
suponer yn 6= 0 pues solo hay finitas soluciones bajo esas condiciones. Se tendr´a
entonces que |yn | → ∞ y por lo tanto, tomando a partir de (1.9) obtendremos que,
xn
yn → αj para algun cero de f (X). Los factores
xn
yn − αi con i 6= j, resultaran acotados inferiormente para todo n ∈ N. Luego tendremos
que
xn
C
yn − αi ≤ |y|
d
para todo n ∈ N, para alguna constante C > 0. Por el teorema de Thue, sabemos
que esto es imposible pues d ≥ 3, llegando as´ı a una contradicci´on.
En general, sea F (X, Y ) = a.F1 (X, Y )e1 . . . Fr (X, Y )er , con Fi (X, Y ) los factores no constantes irreducibles en ∈ Z[X, Y ] de F , que resultan homog´eneos, y
e1 , . . . , er enteros positivos. Podemos suponer que Y no divide a F pues en ese
caso, se tendr´ıa que si (x, y) es soluci´on de la ecuaci´on de Thue, y deber´a ser uno
de los finitos divisores de m y como para cada uno de estos hay finitas opciones
para x, se tendr´
a que (1.8) en este caso posee finitas soluciones.
Toda soluci´
on entera (x, y) de (1.8) resulta soluci´on de un sistema de la forma
Fj (X, Y ) = mj para j = 1, . . . , r,
con mj divisores de m. Por lo tanto, si asumimos que (1.8) posee infinitas soluciones,
dado que hay finitos de estos sistemas, por el principio del palomar alguno de ellos
tendr´
a infinitas soluciones. Sean (xn , yn ) infinitas soluciones enteras de uno de estos
sistemas, que podemos suponer yn 6= 0. Por el mismo argumento mencionado en
el caso anterior tenemos que xynn tiende a alg´
un cero de Fj (Xj , 1) para cada j, y
como estos son coprimos entre s´ı, se tendr´a que r = 1. Como F posee al menos tres
factores lineales distintos, gr(F1 ) ≥ 3. Por el caso anterior, llegamos a un absurdo
pues el sistema F1 (X, Y ) = m1 posee finitas soluciones enteras.
8
1. EL CAMINO HACIA EL TEOREMA DE ROTH
Los siguientes ejemplos sencillos muestran que las hip´otesis impuestas sobre f
no pueden ser excluidas del enunciado. La ecuaci´on (x + y)n = 1 posee infinitas
2
2 n
soluciones para todo n ∈ N; mientras que la ecuaci´
1 se cumple
√ on (x − 2y √) =
2
para los pares (xm , ym ) ∈ Z definidos por xm + 2ym = (3 + 2 2)m con m ∈ Z.
Recordemos la demostraci´on de µ(α) ≤ d, a partir del teorema de Liouville,
para α un n´
umero algebraico de grado d. Separaremos la demostraci´on en 3 pasos,
con el fin de mostrar que dicha estructura se mantiene en las demostraciones de los
teoremas de Thue y Roth, como ha sido notado por varios autores.
Supongamos que α es un n´
umero algebraico de grado d > 1 y sea k > d tal que
1
p (1.10)
α − q < |q|k
posee infinitas soluciones racionales.
Paso I- Construcci´
on del polinomio auxiliar.
Construimos un polinomio no nulo f (X) con coeficientes enteros que tenga a
α como ra´ız. En el caso del Teorema de Liouville tomamos f (X) como un m´
ultiplo
entero del polinomio minimal de α.
Paso II- f se anula en puntos racionales muy cercanos a α.
Sea pq un n´
umero racional que cumple (1.10). Como f posee coeficiente enteros
se cumple que
p N
f ( q ) = |q|
d
con N un n´
umero entero positivo. Por otro lado, via la expresi´on de Taylor de f
alrededor de α se obtiene una constante c > 0 tal que
p f ( q ) < c α − pq < c |q|1k .
Tomando q suficientemente grande, pues suponemos que hay infinitos, y usando
que k > d se tendr´
a que N es un n´
umero entero no negativo que cumple
1
N < c |q|k−d
< 1.
Por lo tanto, si q es suficientemente grande debe ser f ( pq ) = 0.
Paso III- El polinomio f , no se anula en un punto racional.
Para el polinomio f construido, podremos elegir pq de forma tal que q sea
grande, para que siga valiendo II, y pq no sea ra´ız de f . Dado que f un m´
ultiplo
del minimal de α, resulta irreducible sobre Q[X], por lo tanto, este paso resulta
sumamente sencillo en este caso.
A partir del paso II y III obtenemos una contradicci´on, probando as´ı lo que
quer´ıamos.
Un primer intento de mejorar esto ser´ıa tomar un polinomio distinto, por ejemplo, que tenga a α como ra´ız de multiplicidad m´as grande que 1. Supongamos que
tomamos g(X) un polinomio con coeficientes enteros tal que α es ra´ız de multiplicidad l. Como g posee finitas ra´ıces, el paso III seguir´a valiendo si tomamos
q suficientemente grandes. En el paso II, por medio de la expresi´on de Taylor
alrededor de p/q obtendr´ıamos una cota del estilo
l
p p
N
)
=
(
<
c
−
α
< c |q|1kl ,
f
gr(g)
q
q
|q|
para los p/q que cumplen (1.10), con c una constante positiva que depende de g.
Por lo tanto,
c
N < |q|kl−gr(g)
.
2. EL TRABAJO DE THUE
9
Podremos asegurar que N = 0, si tomamos q suficientemente grande, para los k que
cumplan kl − gr(g) > 0. Queremos entonces que el cociente gr(g)
sea lo m´as chico
l
posible, en particular buscamos que sea menor a d, para que esto sea realmente
una mejora. Pero resulta que como α es ra´ız de multiplicidad l de g y este es
un polinomio con coeficientes enteros, entonces f l divide a g, con f el polinomio
≥ d. Vemos
minimal de α. Por lo tanto debe ser gr(g) ≥ gr(f l ) = ld, es decir, gr(g)
l
de esta forma que el mejor exponente que podemos conseguir v´ıa este m´etodo es el
obtenido por Liouville.
Thue tuvo la idea de considerar polinomios en dos variables f (X, Y ) ∈ Z[X, Y ]
para mejorar el resultado de Liouville, en particular, utiliz´o polinomios de la forma
f (X, Y ) = p(X) + Y q(X). A continuaci´on daremos una breve descripci´on de los
pasos para demostrar el teorema de Thue y motivar algunas ideas que usaremos a
lo largo de la prueba del teorema de Roth. Sea α algebraico de grado d ≥ 3(pues
el caso 2 ya est´
a comprendido) y supongamos que |α − p/q| < q −k posee infinitas
soluciones.
Paso I- Construcci´
on del polinomio.
Thue propuso construir un polinomio f (X, Y ) de la forma antes mencionada
tal que h(X) = f (X, α) posea una raiz de multiplicidad grande. La construcci´on
es de la siguiente manera. Si el polinomio f (X, Y ) posee grado total r6, habr´a que
determinar como mucho 2r + 1 coeficientes. Que h(X) posea un cero de orden s
∂ s−1 f
∂f
(α, α) = . . . = ∂X
en α es equivalente a que f (α, α) = ∂X
s−1 (α, α) = 0. Cada una
de estas ecuaciones, terminar´
a siendo una ecuaci´on lineal con los coeficientes de f
como inc´
ongnitas y con cuerpo de base Q[α]. Escribiendo cada potencia αn con n ≥
d como combinaci´
on Q lineal de las potencias 1, α, . . . , αd−1 , nuestras ecuaciones
se transformaran en una combinaci´on lineal de 1, α, . . . , αd−1 cuyos coeficientes
son ecuaciones lineales en nuestras inc´ognitas con coeficientes sobre Q. Por lo
tanto, como 1, α, . . . , αd−1 son Q linealmente independientes, cada una de estas
s ecuaciones ser´
a equivalente a d ecuaciones lineales sobre Q con inc´ognitas, los
coeficientes de f . En total tendremos sd ecuaciones lineales y 2r + 1 inc´ognitas.
Podremos obtener una soluci´
on no nula si logramos que sd < 2r + 1, por ejemplo
si tomamos r/s ≈ 21 d. Esto sugiere la mejora obtenida por Thue.
Paso II- El polinomio se anula en valores racionales cercamos a (α, α).
Al igual que en el Teorema de Liouville, tomemos pq una muy buena aproximaci´
on de α y mediante la f´
ormula de Taylor tratemos de llegar a que f ( pq , pq ) = 0.
Se tiene que
Pr
Pr
i
j
f (X, Y ) = i=s bi (X − α) + j=0 cJ (X − α) (Y − α)
Nos gustar´ıa llegar a algo del estilo
s
|f ( pq , pq )| < B α − pq .
j
El problema de esto es que el aporte de los monomios (X − α) (Y − α) al evaluarlos
s
en ( pq , pq ), no es semejante al aportado por (X − α) . La forma de Thue para
solucionar esto fue tomar dos aproximaciones racionales distintas ( pq11 , pq22 ) de forma
tal que q2 ≈ q1s . Por lo tanto pq22 − α < q1k ≈ q1ks que es similar a lo que aporta
2
1
s
p1
q1 − α . De esta forma lograremos obtener una desigualdad del estilo
6La mayor de las sumas de las potencias de todos los monomios no nulos.
10
1. EL CAMINO HACIA EL TEOREMA DE ROTH
p1 p2 f ( q1 , q2 ) ≤
B
,
q1sk
con B una constante que depende de las coeficientes de f . Mientras que por otro
lado tendremos que
p1 p2 N
.
f ( q1 , q2 ) = qrNq2 ≈ qr+s
1
1
Al igual que en el teorema de Liouville llegaremos a que N = 0 y por lo tanto
f ( pq11 , pq22 ) = 0, tomando q1 y q2 suficientemente grande si sk − (r + s) > 0 o lo que
es lo mismo r/s + 1 < k. Como dijimos que tomar´ıamos r/s ≈ 21 d se obtiene el
resultado de Thue, 12 d + 1 < k. Esto ser´a posible si logramos tambi´en tener control
sobre la constante B. Esta constante depende del valor las derivadas de f en (α, α)
que depender´
a del valor de los coeficientes de f . El polinomio f , se obtuvo a partir
de la existencia de soluciones de un sistema de ecuaciones lineales. Para poder tener
control sobre el tama˜
no de la soluci´on, Thue us´o un argumento que se basa en el
principio del palomar que permite controlar el tama˜
no de la soluci´on en funci´on del
tama˜
no de las ecuaciones. Para tener m´as control sobre los coeficientes
del sistema
∂if
de ecuaciones, por ejemplo, se pueden reemplazar las ecuaciones ∂X
i (α, α) = 0
s−1
∂
f
por las ecuaciones i!1 ∂X
as chicos, ya que se
s−1 (α, α) = 0 que poseen coeficientes m´
efectur´
an simplificaciones.
Paso III- El polinomio f no se anula en la aproximaci´on racional ( pq11 , pq22 ).
En el teorema de Liouville, este paso resultaba trivial pues un polinomio en
una variable posee finitas ra´ıces racionales. Cuando consideramos m´as variables,
este paso se vuelve el m´
as dif´ıcil de todos. De hecho no podremos asegurar que f
no se anula, sino que una derivada de orden chico no se anula en ( pq11 , pq22 ), es decir,
f posee orden de anulaci´
on chico en dicho punto. El resultado del paso II seguir´a
siendo v´
alido para las derivadas y se ver´a que el orden de anulaci´on de f en ( pq11 , pq22 )
es grande en comparaci´
on con el orden obtenido en este paso. Llegando as´ı a una
contradicci´
on.
∂f
Supongamos que tanto f como ∂X
se anulan en ( pq11 , pq22 ). Esto significa que
P ( pq11 ) + Q( pq11 ) pq22 = 0
P 0 ( pq11 ) + Q0 ( pq11 ) pq22 = 0.
Eliminando p2 /q2 de estas ecuaciones obtenemos que
P ( pq11 )Q0 ( pq11 ) − P 0 ( pq11 )Q( pq11 ) = 0.
Por lo tanto el determinante Wronskiano
W (X) = p(X)q 0 (X) − p0 (X)q(X),
aparece naturalmente si asumimos que algunas derivadas se anulan. El analisis
del tama˜
no de los coeficientes de W nos permitir´a obtener cota para el orden de
anulaci´
on de f en la aproximaci´on racional considerada.
Siegel trabaj´
o con polinomios en dos variables m´as generales, y lo mismo
hicieron Dyson y Gelfond. Ya era sabido que usar polinomios en m´as variables
permitir´ıa mejorar el exponente de aproximaci´on. Roth fue capaz de superar las
dificultades del paso III cuando se consideraban m´as variables.
3. Teorema de Roth y generalizaciones
Como ya ha sido mencionado, el teorema de Roth es el siguiente
3. TEOREMA DE ROTH Y GENERALIZACIONES
11
Teorema 1.8 (Roth 1955). Sea α un n´
umero real algebraico de grado d ≥ 2.
Entonces para todo ε > 0, la desigualdad
α − p < 1
(1.11)
q q 2+ε
posee finitas soluciones racionales
p
q
con q > 0.
Este teorema puede ser generalizado en diferentes direcciones. Ya en 1920,
cuando Siegel [25]√prob´
o que el exponente d/2 + 1 probado por Thue pod´ıa ser
reemplazado por 2 d, tambi´en logro generalizar este resultado para la aproximaci´on
de un n´
umero algebraico sobre un cuerpo de n´
umeros K.
Teorema 1.9 (Siegel 1920). Sea K un cuerpo de n´
umeros y sea α un n´
umero
algebraico sobre K de grado d ≥ 2. Entonces para todo ε > 0, la desigualdad
|α − β| < Λ(β)21√d+ε
posee finitas soluciones con β ∈ K.
Donde Λ(β) representa el m´aximo de los valores absolutos de los coeficientes
del polinomio irreducible primitivo sobre Z que anula a β. En realidad Sigel prob´o
que el exponente d/2+1 pod´ıa ser reemplazado por
√
d
s(d) = min s +
< 2 d.
0≤s≤d
s+1
Otro tipo de generalizaci´
on fue hecha por Mahler [17] en 1931 cuando introdujo
las aproximaciones diophanticas p-adicas.
Teorema 1.10 (Mahler 1932). Sea f (X) un polinomio irreducible de grado
d ≥ 3 con coeficientes racionales. Sean p1 , . . . , pn n´
umeros primos distintos, y sean
α0 , α1 , . . . , αn respectivamente una raiz real, p1 -adica, . . ., pn -´
adica de f (X). Sea
ε > 0 entonces
n
o
n
p Y
1
√
min 1, α0 − min 1, |p − qαt |pt ≤
2 d+ε
q t=1
max {|p|, |q|}
posee finitas soluciones racionales p/q.
√
De hecho, Mahler tambi´en prob´o que el exponente 2 d pod´ıa ser reemplazado
por el ya mencionado exponente s(d) del teorema de Siegel. A partir de sus trabajos
en aproximaciones p-´
adicas, Mahler obtuvo como resultado la finitud de la cantidad
de soluciones de la ecuaci´
on de Thue en S-enteros(enteros cuyos factores primos
est´
an restringidos a un conjunto finito de primos S). Mahler tambi´en prob´o la
finitud de la llamada ecuaci´
on de Thue-Mahler
F (x, y) = pa1 1 . . . pann
donde F es un polinomio homog´eneo en Z[x, y] con al menos 3 factores lineales
distintos x − αi y, p1 , . . . , pn primos fijos, a ser resuelta en x, y ∈ Z y a1 , . . . , an
enteros positivos.
La generalizaci´
on del teorema de Thue sobre un cuerpo de n´
umeros K y finitos
valores absolutos sobre K fue llevada a cabo por Parry [20] en 1950. El an´alogo
del teorema de Roth sobre cuerpos de n´
umeros fue llevado a cabo por LeVeque [19]
en 1956 y la generalizaci´
on del teorema de Thue sobre los n´
umeros p-´adicos con el
exponente del teorema de Roth, es debida a Ridout[22] en 1958.
La formulaci´
on general del teorema de Roth sobre cuerpos de n´
umeros es la
siguiente y ser´
a la probada en esta tesis.
12
1. EL CAMINO HACIA EL TEOREMA DE ROTH
Teorema 1.11. Sea K un cuerpo de n´
umeros, S ⊂ MK un conjunto finito
de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido
¯ Para cada υ ∈ S, sea αυ ∈ K.
¯ Dado ε > 0,
extendido de alguna forma a K.
entonces existen finitos β ∈ K que satisfacen la inecuaci´
on
Y
1
.
min {kβ − αυ kυ , 1} ≤
HK (β)2+ε
υ∈S
Por ejemplo, si tomamos K = Q, S = {| |∞ } el valor absoluto usual sobre Q y
α un n´
umero algebraico sobre Q obtenemos que la inecuacion
n
o
1
min 1, |α − pq | ≤ max{|x|,|y|}
2+ε
posee finitas soluciones racionales p/q. Esta versi´on es equivalente a la versi´on
cl´
asica del Teorema de Roth anteriormente mencionada.
CAP´ITULO 2
El Teorema de Roth
1. Comentarios sobre el enunciado del teorema de Roth
Haremos a continuaci´
on algunos comentarios respecto al enunciado del teorema
de Roth. Recordemos primero el teorema en cuestion:
Teorema 2.1. Sea K un cuerpo de n´
umeros, S ⊂ MK un conjunto finito
de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido
¯ Para cada υ ∈ S, sea αυ ∈ K.
¯ Dado ε > 0,
extendido de alguna forma a K.
entonces existen finitos β ∈ K que satisfacen la inecuaci´
on
Y
1
.
(2.1)
min {kβ − αυ kυ , 1} ≤
HK (β)2+ε
υ∈S
(1) Podemos reemplazar el lado derecho de (2.1) por C/HK (β)2+ε , con C > 0
una constante fija. Supongamos que β satisface la desigualdad modificada.
Entonces si consideramos los β que adem´as cumplen C/HK (β)2+ε/2 ≤ 1
tendremos que
Y
C
C
1
min {kβ − αυ kυ , 1} ≤
=
.
≤
2+ε/2 H (β)2+ε/2
HK (β)2+ε
H
(β)
K
K
υ∈S
1
,
HK (β)2+ε/2
los cuales son finitos por el teorema de Roth. Como solo descartamos un
conjunto de β con altura acotada, es decir, un conjunto finito, concluimos
que este resultado es equivalente al teorema de Roth.
¯ corre(2) Dado de que toda extensi´on de un valor absoluto υ sobre K a K,
¯ en la completaci´on K¯υ . Podremos ver a los
sponde a un embedding de K
αυ como elementos de Kυ algebraicos sobre K. En efecto, tendremos la
siguiente versi´
on del teorema de Roth.
(2.2)
Teorema 2.2. Sea K un cuerpo de n´
umeros, S ⊂ MK un conjunto
finito de valores absolutos sobre K. Para cada υ ∈ S, sea αυ ∈ Kυ
algebraico sobre K. Dado ε > 0, entonces existen finitos β ∈ K que
satisfacen la inecuaci´
on
Y
1
.
min {kβ − αυ kυ , 1} ≤
HK (β)2+ε
υ∈S
Veamos que este teorema se deduce del teorema de Roth.
¯ una clausura algebraica de K, K
¯ υ una clausura algebraica
Sea K
de Kυ para cada υ ∈ S y | |υ la extensi´on de υ a Kυ que se extiende
¯ υ . Para cada υ ∈ S sea fυ ∈ K[X] el polinomio
de forma u
´nica a K
¯ Como K
¯υ
minimal de αυ sobre K. Consideremos α
˜ υ una ra´ız de fυ en K.
13
14
2. EL TEOREMA DE ROTH
¯ υ /K que
es algebraicamente cerrado, el embedding συ : K(˜
αυ )/K → K
¯
manda α
˜ υ a αυ , puede ser extendido a K. Consideremos entonces | |0υ la
¯ dada por |x|0 = |συ (x)|υ . Si β ∈ K, entonces
extensi´
on de υ a K
υ
|β − α
˜ υ |0υ = |β − αυ |υ .
Por lo tanto, una soluci´on de (2.2) cumple que
Y
1
0
,
min kβ − α
˜ υ kυ , 1 ≤
HK (β)2+ε
υ∈S
las cuales sabemos que son finitas por la validez del teorema de Roth.
Queda as´ı probada lo enunciado. De una forma similar puede verse que
de hecho este enunciado es equivalente al teorema de Roth.
(3) Si α y α0 son dos elementos distintos algebraicos sobre K y β se acerca
a α respecto de υ, entonces β estar´a lejos de α0 . Por lo tanto, podemos
considerar distintos n´
umeros algebraicos para un mismo valor absoluto.
(4) No hay raz´
on por la cual no podamos permitirle a β tender a infinito,
es decir, podemos tomar αυ = ∞ y reemplazar el termino sin sentido
k∞ − βkυ por k1/βkυ . Podemos entonces agregarle a la condici´on de
aproximaci´
on del lado izquierdo un producto de la forma
Y
min {k1/βkυ , 1}.
υ∈S
Esta versi´
on del teorema se puede reducir a la anterior tomando una
transformaci´
on proyectiva T (β) = (aβ + b)/(cβ + d), a, b, c, d ∈ Z, tal
que T (αυ ) es siempre finito y aplicando el teorema con T (αυ ) y T (β).
Dado que HK (T (β)) >><< H(β). Esto ultimo se debe a partir de
las siguientes propiedades de la altura : HK (A) = HK (1/A), HK (A +
B) ≤ 2.HK (A)HK (B) y HK (A.B) ≤ HK (A)HK (B); se concluye que
˜ K (β) para alguna constante C.
˜ Esto se debe a que T
HK (T (β)) ≤ CH
es una composici´
on de traslaciones, rotaciones e inversiones, y en este
caso es facil ver la desigualdad. Para probar lo afirmado, consideremos T (z) = az+b
z+d a, b, d ∈ Z tal que T (αυ ) 6= ∞ para todo υ ∈ S,es
decir, αυ 6= −d. Veremos que para todo υ ∈ S, existe una constante
C = Cυ,T > 0 tal que
(2.3)
min {1, kT (αυ ) − T (β)kυ } ≤ C min {1, kαυ − βkυ } .
Para simplificar la notaci´on, lo probaremos para el valor absoluto no normalizado | |υ , pues solo habr´a que elevar a la potencia nυ -esima. Notaremos | | = | |υ y α = αυ .
Caso 1. α 6= ∞
Supongamos β cumple que |β + d| ≥ |α + d|/2 entonces
|T (α) − T (β)| =
|ad−b||α−β|
|α+d||β+d|
≤
2|ad−b||α−β|
|α+d|2
= C1 |α − β|.
Luego, (2.3) es v´
alida para estos β tomando C = C1 .
Consideremos ahora los β que cumplen |β + d| ≤ |α + d|/2. Si la
afirmaci´
on es falsa para estos β, entonces para cada N ∈ N existe βN bajo
estas condiciones tal que
N. min {1, |α − βN |} ≤ min {1, |T (α) − T (βN )|}.
Ademas tenemos que
´ A APROXIMACIONES SIMULTANEAS DE ENTEROS ALGEBRAICOS
2. REDUCCION
15
|α − βN | ≥ |α + d| − |d + βN | ≥ |α + d| − |α + d|/2 = |α + d|/2,
luego para todo N ,
N min {1, |α + d|/2} ≤ N min {1, |α − βN |} < min {1, |T (α) − T (βN )|} ≤
1.
Tomando N suficientemente grande llegamos a un absurdo. Por lo
tanto, existe una constante C2 tal que (2.3) es v´alida para estos β tambien. Tomando C como el m´aximo de estas dos constantes obtenemos lo
buscado.
Caso 2. α = ∞
Sea β tal que |β + d| ≥ 1 entonces
|β| ≤ |β + d| + |d| ≤ |β + d| + |d||β + d| = |β + d|(1 + |d|).
Por lo tanto,
0 1
0
|T (α) − T (β)| = | ad−b
β+d | ≤ C | β | = C |α − β|.
Luego (2.3) se cumple para estos β, tomando C = C 0 .
Sea ahora β tal que |β + d| ≤ 1. En particular, tenemos que
|β| ≤ |β + d| + |d| ≤ 1 + |d|.
Nuevamente, si (2.3) es falso en este caso, construimos una sucesi´on βN
como antes. Por lo tanto,
N min {1, 1/(1 + |d|)} ≤ N min {1, 1/|β||} = N min {1, |α − β||} ≤
min {1, |T (αυ ) − T (β)|} ≤ 1.
Se sigue entonces como en el caso anterior.
2. Reducci´
on a aproximaciones simultaneas de enteros algebraicos
Antes de comenzar con la prueba del teorema de Roth, haremos dos simplificaciones. La primera de ellas, que ser´a de utilidad t´ecnica para simplificar notaci´on
y cantidad de ´ındices, establece que es suficiente probar el teorema para el caso de
enteros algebraicos.
´ n 1. Si el teorema de Roth es verdadero para enteros algebraicos,
Afirmacio
entonces es verdadero para n´
umeros algebraicos arbitrarios.
´ n. Lo probaremos por el contrarec´ıproco. Para cada υ ∈ S, sea
Demostracio
αυ un n´
umero algebraico y supongamos que el teorema de Roth es falso para los
elementos {αυ }υ∈S y alg´
un ε > 0. Tenemos entonces infinitos β ∈ K que satisfacen
(2.1). Para cada β, existe al menos un subconjunto de S, digamos S 0 , tal que
Y
Y
kβ − αυ kυ =
min {kβ − αυ kυ , 1}
υ∈S 0
υ∈S
(descartando todos o algunos de los υ ∈ S que cumplen min {kβ − αυ kυ , 1} = 1 ).
Como S posee finitos subconjuntos y los β son infinitos, quiz´as reemplazando S
por un subconjunto, podremos suponer que existen infinitos β ∈ K para los cuales
Y
υ∈S
kβ − αυ kυ ≤
1
.
HK (β)2+ε
16
2. EL TEOREMA DE ROTH
Para cada αυ , existe Dυ ∈ N tal que Dυ αυ es entero algebraico. Existe entonces
D > 0 entero, por ejemplo el producto de todos los Dυ , tal que Dαυ es entero
algebraico para todo υ ∈ S. Consideremos los β ∈ K soluci´on de (2.1) tal que
HK (β) > HK (D)1+6/ε . Hay infinitos de ellos pues solo descartamos un conjunto
de altura acotada. A partir de la definici´on de altura se tiene que Hk (Dβ) ≤
HK (D)HK (β). Adem´
as,
Y
Y
kDkυ ≤
max {kDkυ , 1} ≤ HK (D).
υ∈S
υ∈S
Por lo tanto
Y
Y
Y
Y
min {kDβ − Dαυ kυ , 1} ≤
kDβ − Dαυ kυ =
kDkυ
kβ − αυ kυ ≤
υ∈S
υ∈S
υ∈S
υ∈S
1
HK (D)
HK (D)
.
≤
=
HK (β)2+ε
HK (β)2+ε/2 HK (β)2+ε/2
HK (D)
1
1
.
=
.
(HK (Dβ)/HK (D))2+ε/2 (HK (D)1+6/ε )ε/2
HK (Dβ)2+ε/2
Se obtiene as´ı que el teorema de Roth es falso para los enteros algebraicos {Dαυ }υ∈S ,
con ε0 = ε/2.
Q
La segunda simplificaci´
on reemplazara la condici´on de que el producto kαυ − βk
sea peque˜
no por la m´
as sencilla condici´on de cada una de las diferencias kαυ − βk
sea peque˜
na. Esta idea de reducir el trabajo a considerar aproximaciones simultaneas es debida a Mahler, quien fue el primero en considerar aproximaciones sobre
varios valores absolutos.
Teorema 2.3. Sea K un cuerpo de n´
umeros, S ⊂ MK un conjunto finito
de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido
¯ Para cada υ ∈ S, sea αυ ∈ K.
¯ Sea ε > 0 y sea
extendido de alguna forma a K.
X
ξ : S → [0, 1] una funci´
on que cumple
ξυ = 1.
υ∈S
Entonces existen finitos β ∈ K que satisfacen
(2.4)
min {kαυ − βk , 1} ≤
1
HK (β)(2+ε)ξυ
para todo υ ∈ S.
Veamos que este teorema es equivalente al teorema de Roth.
Teorema 2.4. El teorema 2.3 es equivalente al teorema de de Roth.
´ n. Supongamos que el teorema de Roth es cierto. Sea ξ : S →
Demostracio
[0, 1] como en el enunciado P
y sea β ∈ K que cumple (2.4). Multiplicando las
desigualdades y usando que υ ξυ = 1 se tiene entonces que β cumple (2.1). Aplicando el teorema de Roth concluimos que hay finitas posibilidades para β, como se
quer´ıa ver.
Supongamos ahora que el teorema sobre aproximaciones simultaneas es verdadero. Para cada β ∈ K que cumple (2.1) y para cada υ ∈ S, se define el n´
umero
real λυ (β) ≥ 0 mediante
min {kαυ − βkυ , 1} =
1
.
HK (β)(2+ε)λυ (β)
3. PRELIMINARES
17
Para que λυ (β) este un´ıvocamente determinado, supondremos que HK (β) 6= 1, pues
como mucho estamos eliminando finitas
soluciones. Multiplicando sobre υ ∈ S y
P
comparando con (2.1) se tiene que υ∈S λυ (β) ≥ 1.
2+ε
. Observar que µ > 1. Sea A
Para simplificar la notaci´
on, llamemos µ = 2+ε/2
un entero de forma tal que
A (µ − 1) > s.
Utilizando repetidas veces el hecho de que [x + y] ≤ [x] + [y] + 1, se tendr´a
P
P
A + s ≤ Aµ ≤
υ∈S Aµλυ (β) + 1 ≤
υ∈S [Aµλυ (β)] + s,
entonces
A≤
P
υ∈S
[Aµλυ (β)].
Por lo tanto, existen enteros bυ (β) tal que
0 ≤ bυ (β) ≤ [Aµλυ (β)] ≤ Aµλυ (β) y
X
bυ (β) = A.
υ∈S
Consideramos el conjunto de funciones
ξ : S → [0, 1] con ξυ =
aυ
A,
aυ ∈ Z, aυ ≥ 0, y
P
υ∈S
aυ = A,
este conjunto resulta finito y ser´a denotado por Ω.
Por lo tanto, la funci´
on ξ : S → [0, 1] definida por ξυ = bυ (β)/A pertenece al
conjunto Ω. Adem´
as, como (2 + ε/2)ξυ ≤ (2 + ε)λυ (β), se tendr´a que
min {kαυ − βkυ , 1} ≤
1
H(β)(2+ε/2)ξυ
para todo υ ∈ S.
Se concluye as´ı que para cada β ∈ K, que cumple (roth) existe al menos una
funci´
on ξ ∈ Ω para la cual cumple (2.4). Por hip´otesis, para cada ξ hay finitos
β, por lo tanto, como Ω posee finitos elementos, se concluye que * posee finitas
soluciones β ∈ K.
3. Preliminares
En esta secci´
on probaremos varios resultados preliminares que ser´a utilizados
a lo largo de la prueba del teorema de Roth. Empezaremos con un estudio sobre el
tama˜
no de los coeficientes de polinomios en varias variables.
Sea k un cuerpo y k[X1 , . . . , Xn ] el anillo de polinomios en n variables, abreviaremos i = (i1 , . . . , in ) y m = (m1 , . . . , mn ) ∈ Zn≥0 y notaremos
mn
1
xm = xm
1 . . . xn
y
Y
n m
mj
=
,
i
ij
j=1
donde entendemos que mi = 0 si m < i.
´ n 1. Sea k un cuerpo. Para cada i, se define el operador lineal ∂i
Definicio
sobre el anillo de polinomios k[X1 , . . . , Xn ] como
m m−i
m
∂i x =
x
.
i
18
2. EL TEOREMA DE ROTH
Tambi´en podremos notar ∂i = ∂i1 ...in . Observar que este operador est´a bien
definido en cualquier cuerpo pues los binomios son n´
umeros enteros. Adem´as, si el
cuerpo tiene caracter´ıstica cero vale la igualdad
1
∂ i1 +...+in
i1 !i2 !...in ! ∂xi1 ...∂xinn
1
∂i P =
P.
Los operadores diferenciales est´an normalizados de esta forma para simplificar
lo m´
as posible los factores comunes que aparecen cuando diferenciamos un polinomio.
´ n 2. Sea P ∈ C[X1 , . . . , Xm ] un polinomio con coeficientes compleDefinicio
jos, definimos la altura de P como
|P |=m´
aximo de los valores absolutos de los coeficientes de P .
Lema 1. Sea P (X1 , . . . , Xm ) ∈ Z[X1 , . . . , Xm ] un polinomio con coeficientes
enteros, y sea i = (i1 , . . . , im ) una m-upla de enteros no negativos. Las siguientes
afirmaciones son validas
(1) ∂i P ∈ Z[X1 , . . . , Xm ]
(2) Si grXh (P ) ≤ rh para todo 1 ≤ h ≤ m, entonces |∂i P | ≤ 2r1 +...+rm |P |
´ n. Sea
Demostracio
r1
X
P (X1 , . . . , Xm ) =
...
rm
X
jm
Cj1 ...jm X1j1 . . . Xm
jm =0
j1 =0
con Cj1 ...jm ∈ Z. Diferenciando P obtenemos
r1
rm
X
X
j1
jm
jm −im
∂i1 ,...,im P =
...
Cj1 ,...,jm
...
.
X1j1 −i1 . . . Xm
i
i
1
m
j =0
j =0
1
m
Como los n´
umeros combinatorios son enteros, queda probado 1).
Para probar 2), recordemos la estimaci´on de los n´
umeros combinatorios dada
por
X
j j
j
≤
= (1 + 1)j = 2j
i
k
k=0
Por lo tanto, se tendr´
a que
|∂i1 ...im P | = max Cj1 ...jm
j1
i1
...
jm im ≤ max |Cj1 ...jm | .max
r1 +...+rm
|P |.2
2j1 +...+jm ≤
.
Estos operadores tienen otras ventajas como por ejemplo que la formula de
Taylor queda expresada de forma m´as concisa. Sea a = (a1 , . . . , an ) ∈ k n entonces,
X
P (X1 , . . . , Xn ) =
∂i P (a)(x − a)i
i
La formula de Leibniz de la derivada del producto es tambi´en m´as sencilla
P
∂n (P1 (X)P2 (X) . . . Ps (X)) = j1 +...+js =n ∂j1 P1 (X) . . . ∂js Ps (X).
El u
´nico aspecto negativo de estos operadores es que no satisfacen la formula de
composici´
on que si poseen los diferenciales cl´asicos, por el contrario se tiene
∂i ∂j P = j+i
i ∂i+j P .
3. PRELIMINARES
19
A continuaci´
on, definiremos una noci´on de orden de anulaci´on para polinomios en
varias variables que ser´
a fundamental en la prueba del teorema de Roth.
´ n 3. Sea k un cuerpo, P (X1 , . . . , Xm ) ∈ k[X1 , . . . , Xm ] un poliDefinicio
nomio, (α1 , . . . , αm ) ∈ k m y sea (r1 , . . . , rm ) ∈ Zm
ındice de P
>0 . Se define el ´
respecto a (r1 , . . . , rm ) en (α1 , . . . , αm ) como
i1
im
Ind(P ; r1 , . . . , rm ; α1 , . . . , αm ) = min
+ ... +
|∂i P (α1 , . . . , αm ) 6= 0 .
i
r1
rm
Si P es el polinomio nulo definimos su ´ındice como ∞. Cuando (r1 , . . . , rm )
y (α1 , . . . , αm ) est´en fijos, o se entiendan sin ambiguedad por contexto, notaremos
Ind P .
Si bien los ri no tienen a priori ninguna conexi´on con los grados de P , en la
pr´
actica solo aplicaremos esta noci´on para polinomios con gradoXi ≤ ri . Se cumple
adem´
as que Ind P ≥ 0, y la igualdad se cumple si y solo si P (α1 , . . . , αm ) 6= 0. En
el caso de polinomios de una variable, si gr(f ) = r entonces
Ind(f ; r; α) = multrα (f ) ,
cociente que ya hab´ıa aparecido en el primer intento de generalizar el teorema
de Liouville. El siguiente lema justificara que el ´ındice es una forma de medir el
orden de anulacion, en particular, 2) y 3) dir´an que el ´ındice es una valuaci´on en
k[X1 , . . . , Xm ].
Lema 2. Sean P y P 0 ∈ k[X1 , . . . , Xm ] polinomios, y fijemos (r1 , . . . , rm ) ∈
y α = (α1 , . . . , αm ) ∈ k m . Entonces, el ´ındice respecto de (r1 , . . . , rm ) en el
punto α = (α1 , . . . , αm ) cumple las siguientes propiedades:
(1) Ind(∂i1 ...im P ) ≥ Ind P − ri11 + . . . + rim
m
Zm
>0
(2) Ind(P + P 0 ) ≥ min {Ind P, Ind P 0 }
(3) Ind(P P 0 ) = Ind P + Ind P 0
´ n. 1) Sea Q = ∂i P . Por definici´on de ´ındice, tomamos j =
Demostracio
(j1 , . . . , jm ) tal que ∂j Q(α) 6= 0 e Ind Q = rj11 + . . . + rjm
. Entonces ∂j Q(α) 6= 0
m
implica que ∂i+j P (α) 6= 0. Por lo tanto, por definici´on de ´ındice,
j1 +i1
r1
+ ... +
jm +im
rm
≥ Ind P
con lo cual
Ind(∂i P ) =
j1
r1
+ ... +
jm
rm
≥ Ind P −
i1
r1
+ ... +
im
rm
.
2)Sea j = (j1 , . . . , jm ) tal que ∂j (P + P 0 )(α) 6= 0 e Ind(P + P 0 ) =
Por linealidad de la derivada, ∂j P (α) 6= 0 o ∂j P 0 (α) 6= 0, entonces
j1
r1
+ ... +
jm
rm
≥ Ind(P ) o
j1
r1
+ ... +
jm
rm
j1
r1
+ . . . + rjm
.
m
≥ Ind(P 0 ).
Consecuentemente,
Ind(P + P 0 ) =
j1
r1
+ ... +
jm
rm
≥ min {Ind P, Ind P 0 } .
3)Sea j = (j1 , . . . , jm ) tal que ∂j (P P 0 )(α) 6= 0 e Ind(P P 0 ) =
Usando la regla del producto, tenemos que
X
∂j (P P 0 ) =
∂i P.∂i0 P 0 .
i+i0 =j
j1
r1
+ ... +
jm
rm .
20
2. EL TEOREMA DE ROTH
Luego existen i = (i1 , . . . , im ), i0 = (i01 , . . . , i0m ) con i + i0 = j tal que ∂i P (α) 6= 0 y
∂i0 P 0 (α) 6= 0. Entonces
Ind P ≤
i1
r1
+ ... +
im
rm
y Ind P 0 ≤
i01
r1
+ ... +
i0m
rm .
Sumando estas inecuaciones obtenemos que Ind P + Ind P 0 ≤ Ind(P P 0 ).
Para ver la desigualdad opuesta, consideremos todas las m-uplas i = (i1 , . . . , im )
m
X
ih
y ∂i P (α) 6= 0. Sea i la menor de ellas respecto del orden
tal que Ind P =
rh
h=1
lexicogr´
afico. Es decir, si i es una de estas m-uplas, distinta de i entonces existe
0
1 ≤ k ≤ m tal que ih = ih para todo 1 ≤ h < k e ih < ih . Similarmente elegimos i
0
m
X
ih
la menor m-upla respecto del orden lexicogr´afico para P 0 tal que Ind P =
rh
h=1
0
y ∂i0 P (α) 6= 0, y definimos j = i + i .Entonces
∂j (P P 0 )(α) = ∂i P (α)∂i0 P 0 (α) 6= 0
0
pues todas las dem´
as son cero por elecci´on de i e i .Luego obtenemos que
0
m
m
X
X
jh
ih + ih
Ind(P P ) ≤
=
= Ind P + Ind P 0 ,
rh
rh
0
h=1
h=1
lo que nos da la otra desigualdad, completando la prueba del enunciado.
Al igual que en el teorema de Thue, la construcci´on del polinomio ser´a llevada
acabo a partir de la existencia de soluciones de un sistema de ecuaciones lineales
sobre Z. Para eso tendremos que contar la cantidad de ecuaciones que obtenemos al
imponer condiciones sobre el ´ındice del polinomio. El siguiente lema combinatorio,
lidia con este problema. Una versi´on similar a este lema ya habia sido probada
por Schneider [31] en 1936. El lema aqu´ı enunciado es el mismo al publicada en el
trabajo original de Roth cuya demostraci´on es debida a Davenport.
Lema 3. Supongamos que r1 , . . . , rm son enteros positivos, y sea λ > 0, entonces el n´
umero de m-uplas (j1 , . . . , jm ) ∈ Zm tal que
0 ≤ jh ≤ rh (h = 1, . . . , m) y rj11 + . . . + rjm
≤ 12 (m − λ)
m
es como mucho 2m1/2 λ−1 (r1 + 1) . . . (rm + 1)
´ n. Probaremos el lema por induci´on en m. Si m = 1 el resultado
Demostracio
es valido pues el n´
umero de enteros j1 que satisfacen
0 ≤ j1 ≤ r1 y j1 ≤ 1/2(1 − λ)r1
es cero si λ > 1 y si λ ≤ 1, dado que el conjunto tiene como mucho r1 + 1 elementos
se tiene que r1 + 1 ≤ λ1 2(r1 + 1).
Sea ahora m > 1 y supongamos que el resultado es v´alido para m − 1. Podemos
suponer adem´
as que λ > 2m1/2 ya que caso contrario, el lema es v´alido pues hay
como mucho (r1 + 1) . . . (rm + 1) m-uplas. Para cada valor de jm , la condici´on
que se le pide a j1 , . . . , jm−1 , es de la misma naturaleza que nuestro problema
solo que en m − 1 lugares en lugar de m y con λ reemplazado por λ0 tal que
1/2(m − 1 − λ0 ) = 1/2(m − λ) − jm /rm , es decir, λ0 = λ − 1 + 2jm /rm . Observar
3. PRELIMINARES
21
que λ0 > 0 ya que λ > 2m1/2 > 1. La cantidad de m-uplas va a ser menor o igual
a la cantidad de (m − 1)-uplas para cada valor fijo 0 ≤ jm ≤ rm , y por hip´otesis
inductiva, el total de m-uplas ser´a menor o igual que
rm
X
jm
2(m − 1)1/2
(r1 + 1) . . . (rm−1 + 1)
λ − 1 + 2jm /rm
=0
Bastara entonces probar que
r
X
1
< λ−1 (m − 1)−1/2 m1/2 (r + 1)
λ − 1 + 2j/r
j=0
para todo entero positivo r y m, con λ > 2m1/2 .
Supongamos que r es par, y reemplazando j por 21 r + k, obtenemos que
r
2
X
k=− r2
r
2
X
1
= λ−1 +
λ + 2k/r
k=1
λ−1 + 2λ
r
1
1
+
λ + 2k/r λ − 2k/r
r
r
2
X
2
X
k=1
1
= λ−1 + 2λ−1
2
λ −1
k=1
−1
=λ
+
2
X
2λ
k=1
1
≤
λ2 − 4k 2 /r2
1
λ−1 (r + 1)
≤
1 − λ−2
1 − λ−2
−2
como λ > 2m
entonces 1 − λ > 1 − 1/4m−1 > (1 − m−1 )1/2 se obtiene lo
buscado.
Si ahora r es impar, realizando el cambio j = (r − 1)/2 + k se obtiene que
1/2
r+1
r+1
2
X
2
X
1
=
λ + (2k − 1)/r
k=− r−1
2
k=1
1
1
+
λ + (2k − 1)/r λ − (2k − 1)/r
=
r+1
2λ
2
X
k=1
1
λ(r + 1)
λ−1 (r + 1)
<
=
.
λ2 − (2k − 1)2 /r2
λ2 − 1
1 − λ−2
Es posible dar una interpretaci´on probabil´ıstica de este teorema. Si elegimos
al azar un m-upla (j1 , . . . , jm ) con 0 ≤ jh ≤ rP
h , entonces el valor esperado de jh /rh
ser´
a 1/2 y por lo tanto el valor esperado de
jh /rh ser´a de m/2.
Si α es un entero algebraico de grado d sobre Q, entonces todo elemento del
anillo Z[α] se puede escribir de manera u
´nica como combinaci´on Z lineal de la base
1, α, . . . , αd−1 . El siguiente lema nos dir´a que tan grande ser´an los coordenadas de
las potencias de α en esta base y as´ı obtener cierto control sobre el tama˜
no de los
coeficientes que aparecer´
an en nuestro sistema de ecuaciones lineales.
Lema 4. Sea α un entero algebraico cuyo polinomio minimal es P (x) = xn +
(l)
(l)
an−1 xn−1 + . . . + a0 . Para cada entero l ≥ 0 existen enteros a0 , . . . , an−1 tal que
(l)
(l)
(l)
αl = an−1 αn−1 + . . . + a1 α + a0
y vale que
(l)
|aj | ≤ (1 + |P |)l
j = 0, . . . , n − 1
´ n. Procederemos por inducci´on. Para l ≤ n el teorema es trivial.
Demostracio
Supongamos entonces que el teorema es cierto para l − 1
22
2. EL TEOREMA DE ROTH
(l−1)
(l−1)
(l−1)
(l−1)
(l−1)
αl = αl−1 α = (an−1 αn−1 + . . . + a1
α + a0
)α = an−1 αn + . . . + a1
α2 +
(l−1)
(l−1)
(l−1) 2
(l−1)
a0
α = an−1 (−an−1 αn−1 − . . . − a1 α − a0 ) + . . . + a1
α + a0
α=
(l−1)
(l−1)
(l−1)
(l−1)
(l−1)
n−1
(an−2 − an−1 an−1 )α
+ . . . + (a0
− a1 an−1 )α − a0 an−1
Se tiene entonces que para j = n − 1, . . . , 1
(l)
(l−1)
(l−1)
|aj | = |aj−1 − aj an−1 | ≤ (1 + |P |)l−1 (1 + |aj |) ≤ (1 + |P |)l
y
(l)
(l−1)
|a0 | = |a0 an−1 | ≤ |P |(1 + |P |)l−1 ≤ (1 + |P |)l .
El siguiente lema sistematiza el uso de Thue del principio del palomar para dar
una cota superior a la soluci´
on de un sistema de ecuaciones lineales. Siegel fue el
primero en formalizar estas ideas, es por eso que el lema lleva su nombre, a veces
tambi´en llamando lema de Thue-Siegel.
Lema 5 (Lema de Siegel). Sean aij , i = 1, . . . , m , j = 1, . . . , n enteros no todos
nulos, acotados por A > 0 y supongamos n > m. Entonces el sistema homog´eneo
(2.5)
a11 x1
..
.
+
am1 x1
+
···
..
.
···
+
a1n xn
..
.
=
0
..
.
+ amn xn
=
0
admite una soluci´
on entera no trivial x = (x1 , . . . , xn ) tal que
m (2.6)
max |xi | ≤ (nA) n−m
i
´ n. Dado que por hip´otesis tenemos m´as inc´ognitas que ecuaDemostracio
ciones, siempre existe una soluci´on racional no nula y multiplicando por una constante adecuada, obtenemos una soluci´on entera no nula.
Sea H un entero positivo y consideremos el conjunto
T := {x ∈ Zn | 0 ≤ xi ≤ H, i = 1, . . . , n}.
La cantidad de puntos enteros en T es (H + 1)n pues para cada variable tenemos
H + 1 posibilidades.
Sea F : Rn → Rm la transformaci´on lineal dada por F (x) = (L1 (x), . . . , Ln (x))
donde Lj = aj1 x1 + · · · + ajn xn .
Si x ∈ T , se tiene que −Bj H ≤ Lj (x) ≤ Cj H donde −Bj y Cj son la suma de
los coeficientes negativos y positivos de Lj , respectivamente. Dado que Bj + Cj ≤
nA, cada Lj (x) pertenece a un intervalo de longitud ≤ nAH. Por lo tanto, cada
Lj (x) toma como mucho nAH +1 valores, lo que implica que #F (T ) ≤ (nAH +1)m .
Si H es tal que
(nAH + 1)m < (H + 1)n
esto nos diria que F no puede ser inyectiva, entonces existir´ıan x0 6= x00 tal que
˜ = x0 − x00 , se tiene que F (˜
˜
F (x0 ) = F (x00 ). Tomando x
x) = 0. Por lo tanto, x
resulta soluci´
on entera no nula del sistema homog´eneo. Observar que |˜
xi | ≤ H ya
n
que x0 y x00 pertenecen
a T ⊂m[0, H] ).
n−m
Basta elegir H = (nA)
pues entonces
´ DEL POLINOMIO AUXILIAR
4. CONSTRUCCION
23
(nAH +1)m < (nA(H +1))m = (nA)m (H +1)m ≤ (H +1)n−m (H +1)m = (H +1)n .
El siguiente lema es b´
asicamente el hecho de que no existen enteros entre 0 y 1.
Seg´
un Mahler, en un cuerpo que posea una formula del producto y una desigualdad
de este estilo ser´
a posible desarrollar una teor´ıa de aproximaciones diof´anticas.
Lema 6. Sea K un cuerpo de n´
umeros, α ∈ K ∗ , y sea S ⊂ MK un subconjunto
de valores absolutos sobre K. Entonces
Y
1
min {kαkυ , 1} ≥
.
HK (α)
υ∈S
HK (α) =
Y
´ n.
Demostracio
Y
max {kαkυ , 1} =
kαkυ .max 1,
1
kαkυ
=
υ∈MK
υ∈MK Y
Y
Y
1
1
1
max 1,
=
≥
.
kαkυ
min {1, kαkυ }
min {1, kαkυ }
υ∈MK
υ∈MK
υ∈S
4. Construcci´
on del polinomio auxiliar
En esta secci´
on probaremos el an´alogo al Paso I, descripto en la demostraci´on
del teorema de Liouville y el teorema de Thue. Construiremos un polinomio
P (X1 , . . . , Xm ) con coeficientes enteros de un tama˜
no razonablemente chico que
tendr´
a cada m-upla (αυ , . . . , αυ ) como ceros de orden grande, seg´
un nuestra noci´on
de orden de anulaci´
on. Como ya ha sido mencionado, la construcci´on ser´a llevada
a cabo a partir de una soluci´
on no trivial de un sistema de ecuaciones lineales con
coeficientes enteros.
Teorema 2.5. Sean α1 , . . . , αs enteros algebraico, cada uno de grado ds sobre
Q. Sea ε > 0, y sea m un entero que cumple
!2
s
X
(2.7)
m > 16
dj ε−2 .
t=1
Sean r1 , . . . , rm enteros positivos. Entonces existe un polinomio P (X1 , . . . , Xm ) no
nulo con coeficientes enteros tal que
(1) P tiene grado ≤ rh en la variable Xh .
(2) El indice de P respecto de (r1 , . . . , rm ) en (αt , . . . , αt ) es tal que
Ind(P ) ≥ m
2 (1 − ε) para todo 1 ≤ t ≤ s.
r1 +...+rm
(3) |P | ≤ B
, con B = B(α1 , . . . , αs ) una constante que solo depende
de α1 , . . . , αs .
´ n. La prueba consistir´a en considerar los coeficientes de P como
Demostracio
inc´
ongnitas que deber´
an cumplir un sistema de ecuaciones lineales homog´eneas
provenientes de la condici´
on 2), el cual tendr´a m´as ecuaciones que inc´ongnitas,
probando as´ı la existencia de dicho polinomio.
Escribamos a P como
r1
rm
X
X
jm
,
P (X1 , . . . , Xm ) =
...
Cj1 ...jm X1j1 . . . Xm
j1 =0
jm =0
24
2. EL TEOREMA DE ROTH
donde Cj1 ...jm son enteros a determinar para que se cumpla 2). El n´
umero total de
coeficientes es
N = (r1 + 1) . . . (rm + 1).
Para cada m-upla (i1 , . . . , im ) se tiene que
r1
rm
X
X
j1
jm
jm −im
∂i1 ...im P =
...
Cj1 ...jm
...
X1j1 −i1 . . . Xm
.
i
i
1
m
j =0
j =0
1
m
Para que valga 2), para todo αt debe cumplirse que
∂i1 ...im P (αt , . . . , αt ) = 0 para todo (i1 , . . . , im ) con
m
X
m
ih
< (1 − ε).
rh
2
h=0
Para disminuir la cantidad de ´ındices en las cuentas siguientes, llamemos α, a
cualquiera de estos enteros algebraicos y sea d a su grado. Evaluando en (α, . . . , α)
y usando el Lema 4 para escribir las potencias de α como combinaci´on lineal de
1, α, . . . , αd−1 , obtenemos que
rm
r1
X
X
j1
jm j1 −i1 +...+jm −im
=
...
Cj1 ...jm
∂i1 ...im P (α, . . . , α) =
...
α
i
im
1
j1 =0
jm =0
!
X
rm
r1
d−1
X
X
j1
jm
j1 −i1 +...+jm −im k
Cj1 ...jm
...
...
ak
α
=
i1
im
j1 =0
k=0
 jm =0

rm
r1
d−1
X
X
X
j1
jm j1 −i1 +...+jm −im  k

...
Cj1 ...jm
...
α
a
i
im k
1
j =0
j =0
k=0
1
m
Como 1, α, . . . , αd−1 son linealmente independientes, ∂i1 ...im P (α, . . . , α) ser´a cero
si y solo si
rm
r1
X
X
j1
jm j1 −i1 +...+jm −im
Cj1 ...jm
...
...
a
=0
i1
im k
j =0
j =0
1
m
para 0 ≤ k ≤ d − 1. Estas son d ecuaciones lineales homog´eneas con coeficientes
enteros para cada m-upla (i1 , . . . , im ) tal que
m
X
m
1
ih
< (1 − ε) = (m − εm)
rh
2
2
h=0
Seg´
un Lema 3 con λ = εm, la cantidad total de ecuaciones M 0 ser´a
M 0 ≤ 2dm−1/2 ε−1 (r1 + 1) . . . (rm + 1) = 2dm−1/2 ε−1 N .
Dado que queremos que esto suceda para todo αt , la cantidad total de ecuaciones
M ser´
a
!
s
X
N
M ≤2
dt m−1/2 ε−1 N ≤ ,
2
t=1
5. EL INDICE ES GRANDE
25
donde la ultima desigualdad es v´alida por la hip´otesis hecha sobre m.
Por lo tanto, tenemos M ecuaciones lineales homog´eneas con coeficientes enteros en N inc´
ongnitas. Aplicaremos ahora el Lema de Siegel para as´ı obtener
una cota sobre la altura de nuestro polinomio. Para esto, necesitamos tener una
(l)
estimaci´
on de los coeficientes de las ecuaciones. Por Lema 4 sabemos que |ak | ≤
(1 + |Q|)l , con Q el polinomio minimal sobre Q del α considerado. Consecuentemente podemos estimar los coeficientes del sistema lineal por
j1 −i1 +...+jm −im j1
m
ak
i1 . . . jim
≤ 2j1 +...+jm (|Q| + 1)j1 +...+jm ≤ (2|Q| + 2)r1 +...+rm .
Esta cota, nos sirve para las ecuaciones que provienen de considerar un solo α. Con
lo cual, la cota que se obtiene de considerar todos los αt ser´a el m´aximo de todas
estas. Digamos A = max |Qt | donde Qt es el polinomio minimal de αt , entonces los
coeficientes de nuestro sistema estar´an acotados por (2A+2)r1 +...+rm . Aplicando el
lema de Siegel a nuestro sistema obtenemos que los coeficientes de P est´an acotados
por
M
|P | ≤ (N (2A + 2)r1 +...+rm ) N −M ≤ N (2A + 2)r1 +...+rm ≤
2r1 +...+rm (2A + 2)r1 +...+rm = B(α1 , . . . , αs )r1 +...+rm
con B(α1 , . . . , αs ) = 4A + 4. La segunda desigualdad se debe a que
M ≤ N2 .
M
N −M
≤ 1 pues
5. El indice es grande
Una vez que tenemos el polinomio con coeficientes de tama˜
no ”chico” y orden
grande en (αυ , . . . , αυ ), debemos mostrar ahora que si las aproximaciones β1 , . . . , βm
son lo suficientemente cercanas a los αυ , entonces el polinomio deber´a de anularse
con orden alto en (β1 , . . . , βm ).
Ilustraremos este fen´
omeno con polinomios de una variable. Sea entonces β =
p/q un n´
umero racional, P (X) ∈ Z[X] un polinomio con coeficientes enteros, de
los cuales tenemos alguna especie de control y P se anula con orden grande en un
n´
umero α. Pidamos por ejemplo
grP (X) = r,
Ind(P ; r; α) =
multi(P,α)
r
≥ 12 , |P | ≤ B(α)r ,
y supongamos que p/q es una buena aproximaci´on de α, es decir, |p/q−α| ≤ q −(2+ε) .
La expresi´
on de Taylor de P alrededor de α ser´a
P
Pr
P (X) = i=0 ∂i P (α)(X − α)i = i≥r/2 ∂i P (α)(X − α)i .
Evaluando en p/q obtenemos que
i
p P
P ( q ) ≤ i≥r/2 ∂i P (α) pq − α .
Recordando el lema 1 y usando que |P | ≤ B(α)r podremos estimar el tama˜
no de las
derivadas en α. Como ∂i P es un polinomio de grado como mucho r y coeficientes
acotados por |∂i P | se tiene que
r
r
|∂i P (α)| ≤ r|∂i P | max {1, |α|} ≤ 2r .2r .B(α)r max {1, |α|} = C(α)r
Por lo tanto, tendremos que
r/2
r/2 r
p 1
2C
≤ (2C)r q2+ε
= q1+ε/2
.
P ( q ) ≤ rC r pq − α
Por otro lado, si P (X) no se anula en p/q, P (p/q) es una fracci´on no nula con
denominador q r y por lo tanto P (p/q) ≥ 1/q r . Entonces tendremos que
26
2. EL TEOREMA DE ROTH
1
qr
r
2C
,
≤ P ( pq ) ≤ q1+ε/2
lo que implica que q ≤ (2C)2/ε . Esto nos da una cota para q, si asumimos que
p/q no es ra´ız de P (X). Por lo tanto, si nuestras aproximaciones son de altura
suficientemente grande P (X) se anulara en ellas. Un argumento similar funcionara
para las derivadas ∂j P . Por lo tanto, con las hip´otesis correctas impuestas sobres
las alturas de las aproximaciones, podremos probar que P (X) se anula con orden
grande en p/q.
Por lo tanto, para generalizar este argumento y poder probar lo deseado necesitaremos tener cierto control sobre la altura de las derivadas del polinomio construido, evaluado en n´
umeros algebraicos.
Lema 7. Sea P ∈ Z[X1 , . . . , Xm ] tal que grXh (P ) ≤ rh , y sea β = (β1 , . . . , βm )
una m-upla de n´
umeros algebraicos en un cuerpo de n´
umeros K. Entonces para
toda m-upla j = (j1 , . . . , jm ) de enteros no negativos se cumple que
m
Y
HK (∂j P (β)) ≤ 4(r1 +...+rm )[K:Q] HK (P )
HK (βh )rh .
h=1
´ n. Sea (j1 , . . . , jm ) una m-upla de enteros no negativos. Sea
Demostracio
T (X1 , . . . , Xm ) = ∂j1 ...jm P (X1 , . . . , Xm ). Por lema 1 sabemos que T posee coeficientes enteros acotados por
|T | ≤ 2r1 +...+rm |P |.
∞
Consideremos υ ∈ MK
cualquier valor absoluto arquimediano. Usando la desigualdad triangular y el hecho de que T posee como mucho (r1 + 1) . . . (rm + 1) ≤
2r1 +...+rm coeficientes, cada uno de ellos acotados por |T | se tiene que
r
|T (β1 , . . . , βm )|υ ≤ (r1 + 1) . . . (rm + 1) |T |max {|β1 |υ , 1} 1 . . . max {|βm |υ , 1}
r
r
4r1 +...+rm |P | max {|β1 |υ , 1} 1 . . . max {|βm |υ , 1} m .
rm
≤
0
es algun valor absoluto noarquimediano, usando la deSimilarmente, si υ ∈ MK
sigualdad triangular noarquimediana, el hecho de que T posee coeficientes enteros
y recordando que |n|υ ≤ 1 ∀n ∈ Z se tiene que
r
rm
|T (β1 , . . . , βm )|υ ≤ max {|β1 |υ , 1} 1 . . . max {|βm |υ , 1}
.
Elevando estas desigualdades a la potencia nυ -esima(nυ = [Kυ : Qυ ]), multiplicandolas sobre todos los υ ∈ MK , se obtiene que
Y
(r1 +...+rm )nυ
4
HK (T (β1 , . . . , βm )) ≤
r n
r n
|P | max {|β1 |υ , 1} 1 υ . . . max {|βm |υ , 1} m υ ×
nυ
∞
υ∈MK
Y
0
υ∈MK
(r1 +...+rm )[K:Q]
4
r 1 nυ
max {|β1 |υ , 1}
. . . max {|βm |υ , 1}
rm nυ
=
HK (P ) HK (β1 )r1 . . . HK (βm )rm
(Observar que como P posee coeficientes enteros, HK (P ) = |P |[K:Q] ).
5. EL INDICE ES GRANDE
27
Lema 8. Sean r1 , . . . , rm enteros positivos y P ∈ Z[X1 , . . . , Xm ] un polinomio
con coeficientes enteros tal que grXh ≤ rh .Sea K un cuerpo de n´
umeros, S ⊂ MK
un conjunto finito de valores absolutos sobre K y asumamos que cada valor absoluto
¯ Para cada υ ∈ S, sea αυ ∈ K
¯ y sea
en S ha sido extendido de alguna forma a K.
θυ = Ind(P ; r1 , . . . , rm ; αυ , . . . , αυ ). Sea θ = minυ∈S {θυ }. Sea 0 < δ < 1 una
constante y elijamos 0 < θ0 < θ.
Sea
P
ξ : S → [0, 1] una funci´
on tal que ξ∈S ξv = 1.
Supongamos que β1 , . . . , βm ∈ K cumplen que
kβυ − αυ kυ ≤ HK (βυ 1)(2+δ)ξυ para todo υ ∈ S y para todo 1 ≤ h ≤ m.
Definamos D := min {HK (βh )rh }, y sea j = (j, . . . , jm ) una m-upla de enteros no
Pm
negativos tal que h=1 rjhh ≤ θ0 . Entonces
Y
kT (β1 , . . . , βm )kυ ≤
υ∈S
!(r1 +...+rm )[K:Q]
16
Y
HK (P ) D−(2+δ)(θ−θ0 ) .
max {|αυ |υ , 1}
υ∈S
´ n. Sea υ ∈ S y j = (j1 , . . . , jm ) como en el enunciado y T =
Demostracio
∂j P . Estimaremos k∂j P (β1 , . . . , βm )kυ mediante la expresion de Taylor de T alrededor de (αυ , . . . , αυ ). Sea i = (i1 , . . . , im ) una m-upla de enteros no negativos.
De la misma forma en la que se obtuvieron las cotas para |T (β1 , . . . , βm )|υ en
el lema anterior, se tiene que, si υ es arquimediano entonces
|∂i1 ...im T (αυ , . . . , αυ )|υ ≤ |T |(4max {|αυ |υ , 1})r1 +...+rm ≤
|P |(8max {|αυ |υ , 1})r1 +...+rm ,
mientras que si υ es noarquimediano se tendr´a que
r1 +...+rm
|∂i1 ...im T (α, . . . , α)|υ ≤ max {|α|υ , 1}
.
Por Lema 2, podemos acotar inferiormente el ´ındice de T respecto de (r1 , . . . , rm )
en (αυ , . . . , αυ ), se tiene entonces que
Pm
Ind(T ; r1 , . . . , rm ; αυ , . . . , αυ ) = Ind∂j1 ...jm P ≥ IndP − h=1 rjhh ≥ θυ − θ0 .
Por lo tanto, si escribimos la expresi´on de Taylor de T alrededor de (αυ , . . . , αυ ),
muchos de los t´erminos ser´
an ceros. Entonces
P∗
T (X1 , . . . , Xm ) =
∂i1 ...im T (αυ , . . . , αυ )(X1 − αυ )i1 . . . (Xm − αυ )im ,
P∗
quiere decir que se suma sobre las m-uplas (i1 , . . . , im ) tal que ri11 + . . . + rim
≥
m
θυ − θ0 . Sea (i1 , . . . , im ) una de estas m-uplas entonces
|β1 − αυ |iυ1 . . . |βm − αυ |iυm ≤
1
(HK (β1 )i1 ...HK (βm )im )(2+δ)ξυ /nυ
,
el denominador podr´
a ser acotado por
i1
im
HK (β1 )i1 . . . HK (βm )im = (HK (β1 )r1 ) r1 . . . (HK (β1 )rm ) rm ≥ Dθυ −θ0 .
Por lo tanto, para toda m-uplas (i1 , . . . , im ) tal que
que
i1
r1
+ ... +
im
rm
≥ θυ − θ0 vale
28
2. EL TEOREMA DE ROTH
|β1 − αυ |iυ1 . . . |βm − αυ |iυm ≤
1
D (2+δ)(θυ −θ0 )ξυ /nυ
.
Sea υ ∈ S, arquimediano, si evaluamos la expresi´on de Taylor en (β1 , . . . , βm ),
usando que los βh son pr´
oximos a αυ y la desigualdad triangular, obtenemos que
∗
X
|∂i1 ...im T (αυ , . . . , αυ )|υ |β1 − αυ |iυ1 . . . |βm − αυ |iυm ≤
(r1 + 1) . . . (rm + max
|β1 − α|iυ1υ . . . |βm − αυ |iυm ≤
1). max {|∂i1 ...im T (αυ , . . . , αυ )|υ } . i
|T (β1 , . . . , βm )|υ ≤
i1 ...im
1
r1
+...+ rim
≥θυ −θ0
m
2r1 +...+rm max {|∂i1 ...im T (αυ , . . . , αυ )|υ }
i1 ...im
1
D(2+δ)(θυ −θ0 )ξυ /nυ
≤
1
≤
D(2+δ)(θυ −θ0 )ξυ /nυ
1
|P |(16max {|αυ |υ , 1})r1 +...+rm (2+δ)(θ−θ )ξ /n .
0 υ
υ
D
|P |(16max {|αυ |υ , 1})r1 +...+rm
Mientras que si υ ∈ S, es noarquimediano, por la desigualdad triangular noarquimediana se tendr´
a
1
≤
D(2+δ)(θυ −θ0 )ξυ /nυ
1
.
(2+δ)(θ−θ )ξ /n
r1 +...+rm
|T (β1 , . . . , βm )|υ ≤ max {|αυ |υ , 1}
max {|αυ |υ , 1}
r1 +...+rm
D
0
υ
υ
Elevando estas desigualdades
a la potencia nυ -esima, multiplicando, recordando
P
que nυ ≤ [K : Q] y que
ξυ = 1, conseguimos
Y
kT (β1 , . . . , βm )kυ ≤
υ∈S
!(r1 +...+rm )[K:Q]
16
Y
max {|αυ |υ , 1}
HK (P ) D−(2+δ)(θ−θ0 ) .
υ∈S
Veremos ahora que con las hip´otesis adecuadas sobre las alturas de las aproximaciones consideradas, podremos concluir que el orden de anulaci´on de nuestro
polinomio sobre ellas ser´
a elevado. En efecto, tenemos la siguiente proposici´on.
´ n 3. Sea 0 < δ < 1 una constante dada, y sea ε tal que
Proposicio
δ
.
(2.8)
0<ε<
22
Sea K un cuerpo de n´
umeros, S ⊂ MK un conjunto finito de valores absolutos sobre
K y asumamos que cada valor absoluto en S ha sido extendido de alguna forma
¯ Para cada υ ∈ S, sea αυ ∈ K
¯ de grado dυ , sea m un entero tal que m >
a K.
Ps
2 −2
16 ( t=1 dj ) ε , sean r1 , . . . , rm enteros positivos dados y sea P (X1 , . . . , Xm ) ∈
Z[X1 , . . . , Xm ] el polinomio del Teorema 2.5.
Sea
P
ξ : S → [0, 1] una funci´
on tal que ξ∈S ξv = 1.
Supongamos que β1 , . . . , βm ∈ K cumplen que
1
(2.9)
kαυ − βυ kυ ≤
HK (βυ )(2+δ)ξυ
5. EL INDICE ES GRANDE
29
para todo υ ∈ S y para todo 1 ≤ h ≤ m. Supongamos adem´
as que
1+ε
max {HK (βh )rh } ≤ min {HK (βh )rh }
(2.10)
1≤h≤m
1≤h≤m
y que existe una constante C = C({αυ }υ∈S , δ, K) tal que
C ≤ HK (βh )
(2.11)
para todo 1 ≤ h ≤ m. Entonces el ´ındice de P respecto de (r1 , . . . , rm ) en
(β1 , . . . , βm ) cumple
Ind P ≥ εm.
´ n. Sea j = (j1 , . . . , jm ) una m-upla de enteros no negativos tal
Demostraci
o
Pm
que h=1 jh /rh ≤ εm, y seaQB = B {αυ }υ∈S la cota para |P | que proviene del
Teorema 2.5 y notemos M = υ∈S max {|αυ |υ , 1}. Veremos que ∂j P (β1 , . . . , βm ) =
0. Aplicaremos el lema 8 sobre el polinomio P , tomando θ0 = εm. Observar que
θ ≥ m
2 (1 − ε) y dado que ε < 1/22, se cumple que θ0 < θ, por lo tanto estamos
bajo las hip´
otesis del Lema 8 obteniendo as´ı que
Y
(r1 +...+rm )[K:Q]
k∂j P (β1 , . . . , βm )kυ ≤
(16M )
HK (P )
D(2+δ)(θ−θ0 )
υ∈S
≤
(r +...+r )[K:Q]
m
(16BM ) 1
m
D(2+δ)( 2 (1−ε)−εm)
.
Por otro lado, por lema 7 se tiene que
(r1 +...+rm )[K:Q]
HK (∂j P (β1 , . . . , βm )) ≤ 4
(r1 +...+rm )[K:Q]
(4B)
HK (P )
m
Y
HK (βh )rh ≤
h=1
(r1 +...+rm )[K:Q]
Dm(1+ε) ≤ (16BM )
Dm(1+ε) .
Por la desigualdad de Liouville(Lema 6) se tiene que o bien ∂j P (β1 , . . . , βm ) = 0
o bien
Q
−1
.
υ∈S k∂j P (β1 , . . . , βm )kυ ≥ HK (∂j P (β1 , . . . , βm ))
Veamos que esto u
´ltimo contradice nuestras hip´otesis. Asumiendo entonces que
∂j P (β1 , . . . , βm ) 6= 0, la desigualdad de Liouville implica que
Dm((1+δ/2)(1−3ε)−(1+ε)) ≤ (16BM )2(r1 +...+rm )[K:Q] .
Como asumimos que δ < 1 y ε < δ/22, se tiene
(1 + 2δ )(1 − 3ε) − (1 + ε) =
δ
2
− 4ε − 23 εδ >
δ
2
−
4
22 δ
−
3
44 δ
=
δ
4
y entonces
max1≤h≤m {HK (βh )rh } ≤ D1+ε ≤ (16BM )8(r1 +...+rm )[K:Q](1+ε)/(δm) .
Sea j tal que rj = maxm
h=1 rh , se deduce que
HK (βh ) ≤ (16BM )8[K:Q](1+ε)/δ .
Eligiendo C = C({αυ }υ∈S , δ, K) suficientemente grande,por ejemplo C = (16BM )8[K:Q]((8/δ)+4/11) ,
se consigue la contradicci´
on deseada.
30
2. EL TEOREMA DE ROTH
6. Lema de Roth
Ya fue mencionado que ni bien consideramos m´as de una variable, probar la no
anulaci´
on del polinomio P o alguna de sus derivadas en el punto de aproximaci´on
(β1 , . . . , βm ) resulta ser el paso m´as dif´ıcil de todos. En esta secci´on explicaremos
el argumento propuesto por Roth para solucionar las dificultades del Paso III. En
la secci´
on anterior probamos que si P se anula con orden grande en (αυ , . . . , αυ )
entonces tambi´en se anulara con orden alto en (β, . . . , β). Aqu´ı mostraremos que
de hecho, no es posible para P anularse con orden grande en (β, . . . , β).
Consideremos el caso de polinomios en una variable para ilustrar una de las
dificultades que aparecen.
Sea P (X) ∈ Z[X] un polinomio de grado a lo sumo r,con coeficientes enteros
acotados por |P | ≤ B r . Notemos por I = Ind(P ; r; p/q) = multi(P ; p/q)/r el
´ındice de P en algun n´
umero racional p/q. Tendremos entonces que (X − p/q)rI
divide a P . Como P posee coeficientes enteros, el Lema de Gauss1 asegura que
(qX − p)rI divide a P . Dado que q rI divide al coeficiente principal de P y prI
divide al termino constantes de P , se tiene que
max {|p|, |q|}
rI
≤ |P | ≤ B r
por lo tanto
IndP = I ≤
logB
logH(p/q) .
Esto muestra que IndP ser´
a chico si H(p/q) es relativamente grande comparado
con B.
Cuando el polinomio considerado P posee m´as de una variable, este argumento de divisibilidad ya no funciona. Veamos a continuaci´on algunas de las
ideas utilizadas por Thue, quien considero polinomios de dos variables de la forma
P (X, Y ) = f (X) + g(X)Y . Notemos por I al ´ındice de P respecto de (r, 1) en
(β1 , β2 ). Tenemos entonces, por definici´on de ´ındice que
∂i,0 P (β1 , β2 ) = ∂i f (β1 ) + ∂i g(β1 )β2 = 0 para todo i/r ≤ I.
Como ha sido previamente comentado, el determinante Wronskiano, que es un
polinomio de una variable, aparece naturalmente cuando tratamos de probar que
P no puede anularse con orden grande en (β1 , β2 ). Sea entonces
W (X) = f (X)∂1 g(X) − g(X)∂1 f (X).
Diferenciando W k veces, se ve que vale
P
∂k W = i+j=k (∂i f ∂j+1 g − ∂j+1 f ∂i g).
Por lo mencionado m´
as arriba tenemos que si i ≤ rI y j + 1 ≤ rI, entonces
∂i,0 P (β1 , β2 ) = ∂i f (β1 ) + ∂i g(β1 )β2 = 0
y
∂j+1,0 P (β1 , β2 ) = ∂j+1 f (β1 ) + ∂j+1 g(β1 )β2 = 0.
Si eliminamos β2 de estas ecuaciones obtenemos
∂i f (β1 )∂j+1 g(β1 ) − ∂j+1 f (β1 )∂i g(β1 ) = 0 para todo i ≤ rI y j ≤ rI − 1.
Se sigue que ∂k W (β1 ) = 0 para todo k ≤ rI − 1, lo que significa que el ´ındice de
W respecto de r en β1 cumple
IndW ≥ IndP − 1r .
1El lema de Gauss asegura que si un polinomio con coeficientes enteros se factoriza en Q[X],
entonces se factoriza en Z[X].
6. LEMA DE ROTH
31
Si estimamos el tama˜
no de |W |, mediante el mismo razonamiento utilizado en el
caso de una variable, conseguir´ıamos una cota superior para IndW y por lo tanto
una cota superior para IndP . Al igual que el caso de una variable, si imponemos las
hip´
otesis necesarias sobre las alturas de las aproximaciones, tendremos que IndP
no podr´
a ser muy grande.
Roth utiliza un argumento inductivo sobre la cantidad de variables y mediante
el uso de Wronskianos generalizados2 logra factorizar uno de estos Wronskianos de
m variables en un producto de la forma v(X1 , . . . , Xm−1 )u(Xm ) para poder aplicar
la hip´
otesis inductiva sobre estos.
´ n 4. Sea i = (i1 , . . . , im ), definimos el orden del operador diferencial
Definicio
∆i =
∂ i1 +...+im
i
im
∂X11 ...∂Xm
como orden(∆i ) = i1 + . . . + im .
´ n 5. Sea k un cuerpo de caracter´ıstica cero y φ1 , . . . , φr ∈ k(X) funDefinicio
ciones racionales. Un Wronskiano generalizado de φ1 , . . . , φr es un determinante
de la forma
det((∆i φj )1≤i,j≤r ),
donde ∆1 , . . . , ∆r son operadores diferenciales, con orden(∆i ) ≤ i − 1
i−1
∂
asico de las funciones
Si m = 1 y ∆i = ∂X
i−1 se recupera el Wronskiano cl´
racionales φ1 , . . . , φr ∈ k(X)
i−1
∂
W (φ1 , . . . , φr ) = det ∂X
i−1 φj .
Un Teorema cl´
asico establece que las funciones φ1 , . . . , φr son linealmente independientes sobre k si y solo si W (φ1 , . . . , φr ) 6= 0. Veremos que un resultado de esta
´ındole es v´
alido en m´
as variables.
Lema 9. Sea k un cuerpo de caracteristica cero y φ1 , . . . , φr ∈ k(X) funciones
racionales. Si φ1 , . . . , φr son linealmente independientes sobre k entonces existe un
Wronskiano generalizado de φ1 , . . . , φr no nulo.
´ n. La prueba ser´a por inducci´on en r. Si r = 1, el u
Demostracio
´nico Wronskiano generalizado es ∆1 φ1 = φ1 ya que el unico operador diferencial de orden 0
es la identidad. Por lo tanto, en el caso r = 1, el lema dice que φ1 es linealmente
independiente sobre k si y solo si φ1 es no nula.
Supongamos que el lema es verdadero para cualquier conjunto de r − 1 funciones racionales linealmente independiente sobre k y sean φ1 , . . . , φr k-linealmente
independientes. Sea λ ∈ k(X1 , . . . , Xm ) una funci´on racional no nula, las funciones λφ1 , . . . , λφr siguen siendo linealmente independientes sobre k. Observar que
cualquier Wronskiano generalizado det(∆i (λφj )) de λφ1 , . . . , λφr es una k(X1 , . . . , Xm )combinacion lineal de Wronskianos generalizados de φ1 , . . . , φr ( donde los coeficientes ser´
an funciones racionales en las derivadas parciales de λ). Para probar
el lema, ser´
a suficiente probar que existe un wronskiano generalizado no nulo de
λφ1 , . . . , λφr para un λ apropiado. Si tomamos λ = φ−1
1 , podremos suponer que
φ1 = 1.
Como r > 1, φ1 = 1 y φ2 son linealmente independiente, con lo cual φ2 no
∂φ2
es una constante. Entonces ∂X
6= 0 para algun j. Sin p´erdida de generalidad,
J
∂φ2
podemos suponer que ∂X1 6= 0.
2Herramienta utilizada con anterioridad por Siegel.
32
2. EL TEOREMA DE ROTH
Sea V el k-espacio vectorial generado por φ1 , . . . , φr y definamos el k-subespacio
vectorial de V
n
o
∂φ
W = φ ∈ V | ∂X
=
0
, y sea t = dimW .
1
Observar que φ1 ∈ W y φ2 ∈
/ W , entonces 1 ≤ t ≤ r − 1. Sean ψ1 , . . . , ψr funciones
racionales tal que ψ1 , . . . , ψt es base de W y ψ1 , . . . , ψr es base de V . Por hip´otesis
inductiva, existen operadores ∆∗1 , . . . , ∆∗t operadores diferenciales tal que
det(∆∗i ψj ) 6= 0
con 1 ≤ i, j ≤ t y orden(∆∗i ) ≤ i − 1.
Afirmo que las funciones racionales
dientes, pues si ct+1 , . . . , cr ∈ k tal que
∂ψt+1
∂ψr
∂X1 , . . . , ∂X1
∂ψr
t+1
0 = ct+1 ∂ψ
∂X1 + . . . + cr ∂X1 =
son k-linealmente indepen-
∂
∂X1 (ct+1 ψt+1
+ . . . + cr ψ),
entonces ct+1 = . . . = cr = 0 pues el subespacio generado por ψt+1 , . . . , ψr posee
intersecci´
on nula con W . Aplicando hip´otesis inductiva nuevamente, obtenemos
que existen operadores ∆∗t+1 , . . . , ∆∗r operadores diferenciales tal que
∂ψ
det(∆∗i ∂Xj1 ) 6= 0
con t + 1 ≤ i, j ≤ r y orden(∆∗i ) ≤ i − r − 1.
Definimos operadores ∆i para 1 ≤ i ≤ r como
 ∗
si
1≤i≤t
 ∆i
∆i =
 ∗ ∂
∆i ∂X1 si t + 1 ≤ i ≤ k
Notar que orden(∆i ) ≤ i − 1 y ademas
∂ψ
∆i ψj = ∆∗i ∂Xj1 = ∆∗i 0 = 0
para
1 ≤ j ≤ t y t + 1 ≤ i ≤ r.
Se tiene entonces que
 ∗
∆i ψ j
det((∆i ψj )1≤i,j≤r ) = det 
0
∆∗i ψj
∂ψ
∆∗i ∂Xj1

 = det(∆∗i ψj )det(∆∗i ∂ψj )
∂X1
Por lo tanto, existe un Wronskiano generalizado no nulo de ψ1 , . . . , ψt .Pero
como las funcionesPφ1 , . . . , φr y ψ1 , . . . , ψt son base del mismo k-espacio vectorial,
se tiene que ψj = l ajl φl con (ajl ) matriz sobre k, inversible. Se tiene entonces
P
P
0 6= det(∆i ψj ) =det(∆i ( l ajl φl )) =det( l ajl ∆i (φl )) =det(ajl ) det(∆i φl ) 6= 0,
y consecuentemente det(∆i φl ) 6= 0, lo que concluye la prueba del lema.
Antes de empezar con la demostraci´on del lema de Roth, recordemos
la definici´on
P
de altura de un polinomio que usaremos en el lema. Sea f = i∈I ai xi un polinomio en varias variables sobre un cuerpo de n´
umeros K, sea nυ = [Kυ : Qυ ] y
|f |υ = maxi∈I |ai |υ , entonces
X
1
h(f ) = log H(f ) =
nυ log |f |υ
[K : Q]
υ∈MK
6. LEMA DE ROTH
33
¯ 1 , . . . , Xm ] un polinomio con
Lema 10. Sea m un entero positivo y P ∈ Q[X
coeficientes algebraicos y grXh ≤ rh . Sea β = (β1 , . . . , βm ) una m-upla de n´
umeros
algebraicos. Sea η > 0 un n´
umero real fijo tal que
m
rh+1
(2.12)
≤ η 2 −1 para todo 1 ≤ h ≤ m − 1,
rh
y
(2.13)
m
η2
−1
min {rh log H(βh )} ≥ logH(P ) + 4mr1 .
1≤h≤m
Entonces el ´ındice de P respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) cumple
Ind P ≤ 2mη.
Dado que siempre se tiene que IndP ≤ m, podremos suponer que η < 1/2,
pues de otra forma el resultado se cumplir´a trivialmente.
La prueba ser´
a por inducci´on en m, el n´
umero de variables. Para simplificar la
notaci´
on, llamaremos K a un cuerpo de n´
umeros que contenga a todos los βh y los
coeficientes de P . Y sea d = [K, Q].
Probemos el caso m = 1. Para simplificar notaci´on, escribamos β = β1 y r = r1 .
Sea l el orden de anulaci´
on de P (X) en β, entonces P (X) = (X − β)l Q(X), con
Q(β) 6= 0. Adem´
as Ind P respecto de r en β es igual a l/r. Usando la desigualdad
de Gelfand, tenemos que
H(β)rInd P = H(β)l = H(X − β)l ≤ H(X − β)l H(Q) ≤ H(P )2r ,
lo que implica
Ind P ≤
log H(P )+rlog2
rlog H(β)
≤η
usando hip´otesis (2.13).
Lo que demuestra el caso m = 1.
´ n 3. La cota aqu´ı obtenida es mejor que la enunciada. ConObservacio
seguimos una cota igual a η, en lugar de 2η, y solo usamos que ηrlog H(β) ≥
log H(P ) + rlog2 en lugar de ≥ log H(P ) + 4r. Esta observaci´
on ser´
a usada en el
paso inductivo con m = 1.
Supongamos ahora, que el lema de Roth es cierto para polinomios de grado
menor a m y lo probaremos para P (X1 , . . . , Xm ) un polinomio en m variables.
Sea
rm
r1 X
r2
X
X
jm
...
Cj1 ...jm X1j1 . . . Xm
P (X1 , . . . , Xm ) =
j1 =0 j2 =0
jm =0
¯ Dado que
con Cj1 ...jm ∈ Q.
P (X1 , . . . , Xm ) =
rm
X
con
estilo
r1
X

jm =0
Cj01 ...jm−1

j1 =0

rm−1
X
...
Cj01 ,...,jm−1 X1j1
...X
jm−1 
jm
Xm
,
jm−1 =0
¯ siempre ser´a posible escribir al polinomio como una suma del
∈ Q,
P (X1 , . . . , Xm ) =
k
X
ϕj (X1 , . . . , Xm−1 )ψj (Xm ),
j=1
¯ Desde ahora,
donde ϕ1 , . . . , ϕk y ψ1 , . . . , ψk son polinomios con coeficientes en Q.
tomemos una descomposici´
on con k m´ınimo. En particular, k ≤ rm + 1.
¯
La minimalidad de k, implica que tanto ϕ1 , . . . , ϕk como ψ1 , . . . , ψk , son Q¯
linealmente independientes. Pues de no serlo, existir´an c1 , . . . , ck ∈ Q , no todos
34
2. EL TEOREMA DE ROTH
nulos, tal que c1 ϕ1 + · · · + ck ϕk = 0. Supongamos sin p´erdida de generalidad que
ck 6= 0, entonces
k−1
X
cj
P (X1 , . . . , Xm ) =
ϕj . ψj − ψk ,
ck
j=1
lo que contradice la minimalidad de k. Similarmente, se prueba que ψ1 , . . . , ψk son
¯
linealmente independientes sobre Q.
Por Lema 9, se tiene que existe un determinante Wronskiano generalizado no
nulo, digamos
∂ i−1
1
6= 0 con 1 ≤ i, j ≤ k,
U (Xm ) = det (i−1)!
i−1 ψj (Xm )
∂X
m
y tambi´en existen operadores
∆0i =
1
∂ i1 +...+im−1
i1 !...im−1 ! ∂X i1 ...∂X im−1
1
m−1
para
1 ≤ i ≤ k,
con orden(∆0i ) = i1 + . . . + im−1 ≤ i − 1 ≤ k − 1 ≤ rm . Tal que
V (X1 , . . . , Xm−1 ) := det(∆0i ϕj ) 6= 0
con 1 ≤ i, j ≤ k.
Definimos al polinomio W (X1 , . . . , Xm ) por
1
∂ j−1
0
W (X1 , . . . , Xm ) := det (j−1)!
∆
P
=
j−1
i
∂Xm
!
k
X
1
∂ j−1
det
(∆0i ϕr )
ψ
= V (X1 , . . . , Xm−1 )U (Xm ) 6= 0.
j−1 r
(j − 1)! ∂Xm
r=1
Por lo tanto, el uso de los determinantes Wronskianos nos permite obtener un
polinomio W fuertemente relacionado con P y factorizarlo como el producto de
polinomios en menos variables. Por hip´otesis inductiva, lograremos obtener cotas
superiores para los ´ındices de U y V , lo que derivara en una cota para W . Dado
que W es un polinomio en P y sus derivadas, podremos conseguir una cota inferior
para el ´ındice de W en funci´
on del ´ındice de P .
Observar que W ∈ K[X1 , . . . , Xm ] y dado que U y V no comparten variables,
a partir de la definici´
on de altura se tendr´a que h(U ) + h(V ) = h(W ).
Para poder aplicar el lema de Roth, necesitaremos cotas para los grados y las
alturas de U y V .
´ n 2. Las siguientes estimaciones son validas
Afirmacio
(1) grXm (U ) ≤ krm y grXj (V ) ≤ krj para todo 1 ≤ j ≤ m − 1.
(2) h(U ) + h(V ) = h(W ) ≤ k(h(P ) + 4r1 )
´ n. (1) En efecto, los determinantes que definen a U y V son de
Demostracio
tama˜
no k y cada entrada posee grado a lo sumo rj respecto de Xj .
(2) Desarrollando el determinante que define a W por columnas tenemos que
W =
X
(−1)sg(π)
π
k
Y
∆0i ∂π(i) P .
i=1
Por definici´
on de altura,
X
1
h(W ) =
nυ log
[K : Q]
υ∈MK
!
k
X
Y
sg(π)
0
∆i ∂π(i) P .
(−1)
π
i=1
υ
6. LEMA DE ROTH
35
Si υ es arquimediano se tiene que |f1 + . . . + fr |υ ≤ r max |fj |υ , mientras que si υ
es no-arquimediano |f1 + . . . + fr |υ ≤ max |fj |υ . Aplicando estas propiedades a la
suma sobre las permutaciones obtenemos que
k
Y
X
1
0
nυ max log ∆i ∂π(i) P + log(k!).
h(W ) ≤
π
[K : Q]
i=1
υ∈MK
υ
El lema de Gauss establece que si υ es no-arquimediano entonces |f.g|υ = |f |υ |g|υ ,
mientras que si υ es arquimediano por la desigualdad de Gelfand, |f1 . . . fr |υ ≤
2d |f1 |υ . . . |fr |υ con d la suma de los grados parciales de f1 . . . fr . Aplic´andolos a
nuestra desigualdad obtenemos que
h(W ) =
k
X
X
1
nυ max
log ∆0i ∂π(i) P υ + k(r1 + . . . + rm ) log 2 + log(k!).
π
[K : Q]
i=1
υ∈MK
Si υ es no-arquimediano entonces ∆0i ∂π(i) P υ ≤ |P |υ mientras que en el caso arqi 0
umediano ∆i ∂π(i) P υ ≤ 2r1 +...+rm |P |υ . Esto implica que
h(W ) ≤
k
X
(h(P ) + (r1 + . . . + rm ) log 2) + k(r1 + . . . + rm ) log 2 + log(k!) =
i=1
kh(P ) + k(r1 + . . . + rm )2 log 2 + log(k!).
Por hip´
otesis,
m−1
r1 + . . . + rm ≤ r1 (1 + η 0 + . . . + η 0m−1 ) con η 0 = η 2
.
Dado que η ≤ 1/2 y que m ≥ 2, se tiene que η 0 ≤ 1/4 y r1 + . . . + rm ≤ 4/3 r1 . Por
otro lado,
log(k!)
k
≤ log(k) ≤ k − 1 ≤ rm ≤ 21 r1 ,
y por lo tanto,
h(W ) ≤ k h(P ) +
4
3 2log2
+
1
2
r1 ≤ k(h(P ) + 4r1 ).
Observar que la constante 4 puede ser reemplazada por la constante m´as chica
4
1
on ser´a utilizada m´as adelante.
3 2 log2 + 2 ≈ 2, 35. Esta observaci´
Ahora usaremos inducci´
on para acotar el ´ındice de U ,V y W .
´ n 3. Si el lema de Roth es verdadero para menos de m variables,
Afirmacio
entonces
m−1
Ind(U ; rm ; βm ) ≤ kη 2
y Ind(V ; r1 , . . . , rm−1 ; β1 , . . . , βm−1 ) ≤ 2k(m − 1)η 2 ;
y por lo tanto el ´ındice de W respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) cumple
que
Ind W = Ind(U ; rm ; βm ) + Ind(V ; r1 , . . . , rm−1 ; β1 , . . . , βm−1 ) ≤
m−1
kη 2
+ 2k(m − 1)η 2 .
36
2. EL TEOREMA DE ROTH
´ n. Queremos aplicar el lema de Roth para V , que es un poliDemostracio
nomio en m0 = m−1 variables, con rj0 = krj y η 0 = η 2 . Verifiquemos que se cumplen
las hip´
otesis del lema. Se tiene que grXj (V ) ≤ rj0 por Afirmaci´on 2. Condici´on 2.12
se cumple pues
0
rj+1
rj0
=
rj+1
rj
m−1
≤ η2
m0 −1
= η 02
.
Veamos que vale la condici´
on (2.13),
m−1
rj0 h(βj ) = krj h(βj ) ≥ kη −2
m0 −1
(h(P ) + 4mr1 ) = kη 0−2
(h(P ) + 4mr1 ).
Dado que h(V ) ≤ h(W ) ≤ k(h(P ) + 4r1 ) obtenemos que k(h(P ) + 4r1 ) ≥ h(V ) +
4m0 kr1 . Por lo tanto, se verifican todas las hip´otesis del lema. Entonces la hip´otesis
inductiva asegura que
0
Ind(V ; r1 , . . . , rm−1 ; β1 , . . . , βm−1 ) = kInd(V ; r10 , . . . , rm−1
; β1 , . . . , βm−1 ) ≤
0 0
2
k(2m η ) = 2k(m − 1)η .
m−1
Para aplicar el lema de Roth al polinomio de una variable a U , con η 00 = η 2
0
, por Afirmaci´on 2. Como m = 1, la
y r00 = krm . Tenemos que grXm (U ) ≤ rm
primer condici´
on 2.12 es vacia, con lo cual solo hay que verificar (2.13). Para ver
esto, usaremos la versi´
on mejorada del lema de Roth en una variable, Comentario
3. Entonces
h(U ) + r00 log2 ≤ k(h(P ) + c1 r1 ) + krm log2 ≤ k(h(P ) + c1 r1 ) + k 21 r1 log2 ≤
m−1
k(h(P ) + 4r1 ) ≤ kη 2
rm h(βm ) = η 00 r00 h(βm ).
(donde c1 = 4/3 2log2 + 1/2 ≈ 2, 35 y c1 + 1/2 log2 < 4). Como las hipotesis se
cumplen, aplicamos lema de Roth para una variable y obtenemos
m−1
Ind(P ; rm ; βm )(U ) = kInd(P ; r00 ; βm )(U ) ≤ kη 00 = kη 2
.
El siguiente paso ser´
a relacionar el ´ındice de W con el ´ındice de P . A partir
de la definici´
on de W , se sigue que si P se anula con orden alto en (β1 , . . . , βm ),
lo mismo pasara con los coeficientes de la matriz que define a W y entonces W
tambi´en poseer´
a orden alto. A continuaci´on, cuantificaremos esta observaci´on.
´ n 4. Se tiene que
Afirmacio
rm
IndW ≥ k2 min IndP, (IndP )2 − k rm−1
.
´ n. Estimaremos primero el ´ındice de los coeficientes de la matriz
Demostracio
que define W respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ). Recordar que orden(∆0i ) =
i1 + . . . + im−1 ≤ i − 1 ≤ k − 1 ≤ rm y r1 ≥ r2 ≥ . . .; aplicando Lema 2 tendremos
que
∂ j−1
1
= Ind ∂i1 ,...,im−1 ,j−1 P ≥
Ind ∆0i (j−1)!
j−1 P
∂X
m
i1 +...+im−1
j−1
rm
IndP − ri11 − · · · − rim−1
− j−1
− j−1
rm ≥ IndP −
rm−1
rm ≥ Ind(P ) − rm−1 − rm .
m−1
Desarrollando el determinante que define a W por columnas se tiene que
W =
k
X
Y
(−1)sg(π)
∆0i ∂π(i) P .
π
i=1
6. LEMA DE ROTH
37
Observemos que W es suma de productos de k elementos, uno de cada columna,
los cuales son de la forma ∂i1 ...,im−1 ,j−1 P . Por Lema 2 se tiene que el indice de W
es mayor o igual al m´ınimo de los ´ındices de cada uno de los sumandos, es decir,
(
!)
k
Y
0
IndW ≥ min Ind
∆i ∂π(i) P
.
π
i=1
Aplicando nuevamente Lema 2, se tiene que el ´ındice de un producto es igual a la
suma de los ´ındices de cada factor, y dado que cada sumando del desarrollo del
determinante tiene un representante de cada columna se obtiene as´ı que
IndW ≥
k
X
j=1
min
i1 ,...,im−1
Ind ∂i1 ,...,im−1 ,j−1 P .
Sustituyendo en esta desigualdad la cota obtenida m´as arriba para Ind ∂i1 ...,im−1 ,j−1 P ,
en los casos en los que sea positivo, obtenemos que
o
n
Pk
rm
− j−1
IndW ≥ j=1 max Ind(P ) − rm−1
rm , 0 ≥
n
o
Pk
j−1
m
max
Ind(P
)
−
,
0
− rkr
.
j=1
rm
m−1
Por lo tanto, para probar nuestra afirmaci´on, ser´a suficiente ver que
k X
j−1
k
Ind(P ) −
≥ min IndP, (IndP )2 .
rm
2
j=1
Separaremos en dos casos.
Caso 3. IndP ≥
k−1
rm
En este caso tendremos que
k X
j−1
(k − 1)k
k
Ind(P ) −
= kIndP −
≥ IndP .
rm
2rm
2
j=1
Caso 4. IndP ≤
k−1
rm
Sea N = [rm IndP ], con lo cual nuestra suposici´on implica que N ≤ k − 1.
Entonces nuestra inecuaci´
on en cuesti´on resulta
N
+1
X
j−1
N (N + 1)
Ind(P ) −
= (N + 1).IndP −
=
r
2rm
m
j=1
[rm IndP ]
1
1
k
(N + 1). IndP −
≥ (N + 1). IndP ≥ rm IndP. IndP ≥ (IndP )2
2rm
2
2
2
si tenemos que k ≤ rm .
Si llegara a pasar que k = rm + 1, la cantidad que queremos acotar ser´a
N
+1 X
j−1
N (N + 1)
q(N ) :=
Ind(P ) −
= (N + 1)IndP −
.
r
2rm
m
j=1
Observar que q(N ) es cuadr´
atica en N . Por definici´on de N , es este caso tendremos
(k − 1)IndP − 1 ≤ N ≤ (k − 1)IndP .
38
2. EL TEOREMA DE ROTH
Calculando el valor de q en los extremos de la desigualdad se puede ver a partir de
un calculo directo que
q((k − 1)IndP − 1) = q((k − 1)IndP ) =
(k−1)(IndP )2 +IndP
2
.
Por lo tanto, como q como funci´on cuadratica posee coeficiente principal negativo,
q(N ) ≥
(k−1)(IndP )2 +IndP
2
≥
k(IndP )2
,
2
donde la u
´ltima desigualdad se debe a que bajo nuestras suposiciones, IndP ≤ 1.
Se completa as´ı la afirmaci´
on hecha.
Estamos ahora en condiciones de terminar la prueba del lema de Roth. Dado
que IndP ≤ m por definici´
on de ´ındice, Afirmaci´on 4 implica que
)2
krm
,
IndW + rm−1 ≥ k2 min IndP, (IndP )2 ≥ k(IndP
2m
mientras que por Afirmaci´
on 3 se tiene que
IndW +
krm
rm−1
m−1
≤ 2k(m − 1)η 2 + kη 2
+
krm
rm−1
≤ k(2(m − 1)η 2 + 2η 2
2
m−1
).
2
Por lo tanto, comparando estas desigualdades obtenemos que (IndP ) ≤ 4η m2 , lo
que implica IndP ≤ 2mη.
7. Prueba del teorema de Roth
Probaremos a continuaci´
on el teorema de Roth. La versi´on que demostraremos
ser´
a la obtenida luego de aplicar las reducciones probadas al principio del capitulo.
Observar que se ha cambiado δ en lugar de ε y que se reemplazara la condici´on de
aproximaci´
on min {kαυ − βkυ , 1} por la condici´on m´as fuerte kαυ − βkυ .
Teorema 2.6. Sea K un cuerpo de n´
umeros, S ⊂ MK un conjunto finito
de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido
¯ Para cada υ ∈ S, sea αυ ∈ K
¯ un entero algebraico.
extendido de alguna forma a K.
Sea δ > 0 y sea
X
ξ : S → [0, 1] una funci´
on que cumple
ξυ = 1.
υ∈S
Entonces existen finitos β ∈ K que satisfacen
(2.14)
kαυ − βkυ ≤
1
HK (β)(2+δ)ξυ
para todo υ ∈ S.
´ n. Para probar el teorema, supondremos que hay infinitas soluDemostracio
ciones y llegaremos a una contradicci´on. Probarlo para δ m´as chico que alguna
constante solo har´
a el resultado m´as fuerte, asumiremos entonces 0 < δ < 1. Dado
que necesitaremos hacer referencia a las condiciones del Teorema 2.5, Proposici´on
3 y Lema 10, haremos una lista de dichas condiciones para que la lectura de la
demostraci´
on sea m´
as sencilla. La constante B = B(αυ ; υ ∈ S) esta definida en
Teorema 2.5 y la constante C = C({αυ }υ∈S , δ, K) es la definida en Proposici´on 3:
Ps
2
Teorema 2.5 (2.7) m > 16 ( t=1 dυ ) ε−2 .
r1 +...+rm
Teorema 2.5-(3) |P | ≤ B
.
δ
Proposicion 3 (2.8) 0 < ε < 22
.
Proposicion 3 (2.9) kαυ − βυ kυ ≤ HK (βυ 1)(2+δ)ξυ .
7. PRUEBA DEL TEOREMA DE ROTH
39
Proposicion 3 (2.10) D := min1≤h≤m {HK (βh )rh } ≤ max1≤h≤m {HK (βh )rh } ≤
D1+ε .
Proposicion 3 (2.11) C ≤ HK (βh ).
Lema 10 (2.12) rh+1 ≤ ωrh .
Lema 10 (2.13) logH(P ) + 4mr1 ≤ ω log D.
Elegiremos los par´
ametros
ε, m, ω, β1 , . . . , βm , r1 , . . . , rm , P (X1 , . . . , Xm )
en el siguiente orden
(1) Tomemos ε tal que 0 < ε < δ/22. En particular ε cumple (2.8); notar
ademas que ε < 1/22 < 1.
Ps
2
(2) Elijamos m un entero tal que m > 16 ( t=1 dυ ) ε−2 donde dυ es el grade
m−1
de αυ . Entonces (2.7) se cumple. Definimos ω = ω(m, ε) = (ε/4)2
. Lo
−m+1
2
que implica que 2ω
= ε/2 < ε.
(3) Como estamos asumiendo que (2.14) posee infinitas soluciones en K, dado
que K posee finitos elementos de altura acotada, podemos elegir β1 ∈ K
cuya altura cumple
H(β1 ) ≥ C y log H(β1 ) ≥
m(logB+4)
.
ω
(4) Luego elegimos sucesivamente β2 , . . . , βm soluciones de (2.14) que satisfagan
HK (βh+1 )ω ≥ HK (βh )2 para todo 1 ≤ h < m.
En particular, como ω < 1, se tendr´a que HK (βh ) ≥ HK (β1 ). Es decir, la
sucesi´
on HK (βh ) ser´
a creciente, y (2.11) se cumplir´a por la elecci´on hecha
en (3).
(5) Sea r1 un entero que cumpla HK (β1 )ωr1 ≥ HK (βm )2 .
(6) Queremos elegir enteros r2 , . . . , rm de forma tal que todos los HK (βh )rh
sean aproximadamente iguales. Definimos r2 , . . . , rm como los enteros
m l
m
l
r1 logH(β1 )
1 logHK (β1 )
=
.
rh = rlogH
(β
)
logH(β
)
K
h
h
Para verificar la condici´on (2.10), calculamos
r1 logH(β1 )
≤ rh logH(βh ) por definicion de rh y dte ≥ t
≤ r1 logH(β1 ) + logH(βh ) definicion de rh y dte ≤ t + 1
≤ r1 logH(β1 ) + logH(βm ) puse HK (βh ) es creciente a partir de (4)
≤ (1 + ε)r1 logH(β1 ) por la eleccion de r1 en (5).
Exponenciando obtenemos (2.10).
(2.12)
Verificamos ahora la condici´on
r1 logH(β1 )
r1 logH(β1 )
rh+1
=
/
≤
rh logH(βh+1 )
logH(βh )
r1 logH(β1 )
r1 logH(β1 )
logH(βh )
logH(β1 )
+1 /
=
+
≤
logH(βh+1 )
logH(βh )
logH(βh+1 ) r1 logH(β1 )
ω ω
+ = ω.
2
2
40
2. EL TEOREMA DE ROTH
(7) Dado que m fue elegido para cumplir (2.7), aplicamos Teorema 2.5 para
producir un polinomio P (X1 , . . . , Xm ) con coeficientes enteros tal que
grXh P ≤ rh y cumpla |P | ≤ B r1 +...+rm .
(8) Ya hemos verificado que las condiciones (2.8),(2.9), (2.10) y (2.11) se
cumplen, entonces aplicando Proposicion 3 obtenemos que el ´ındice de
P respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) cumple
IndP ≥ mε.
(9) Para poder aplicar el lema de Roth, nos falta verificar (2.13). En efecto,
como
logD = min1≤h≤m {rh logH(βh )} = r1 logH(β1 )
se tiene que
log|P |+4mr1
logD
≤
(r1 +...+rm )logB(α)+4mr1
logD
≤
m(logB+4)
logH(β1 )
≤ ω.
Esto completa la verificaci´on de las hip´otesis del lema de Roth tomando
−m+1
η = ω2
= ε/4, entonces se concluye que el ´ındice de P respecto de
(r1 , . . . , rm ) en (β1 , . . . , βm ) satisface
IndP ≤ 2mη = mε/2.
Obtenemos as´ı una cota superior e inferior para el ´ındice de P que se contradicen. As´ı se completa la demostraci´on del teorema de Roth.
CAP´ITULO 3
Aplicaciones
1. Sobre el desarrollo decimal de n´
umeros algebraicos
A continuaci´
on veremos un ejemplo sencillo sobre c´omo utilizar el Teorema de
Roth para estudiar el desarrollo decimal de n´
umeros algebraicos, lo que derivara
en un criterio de trascendencia. El Teorema de Liouville visto en el Capitulo 1,
implica que si {an } es una sucesi´on creciente de enteros positivos que cumple liminf
an+1
umero
an = ∞, entonces el n´
X 1
n
10an
resulta trascendente. Veamos que podemos reemplazar la condici´on = ∞ por > 1.
Sea S 0 un conjunto finitos de primos. Diremos que un n´
umero racional β = a/b
con (a, b) = 1, es un S 0 -entero, si el denominador es divisible solamente por primos
de S 0 . Recordando la f´
ormula del producto
!
n
o
n
o −1
Y
Y
H(β) =
max 1, |β|p =
min 1, |β|p
,
p
p
y usando que H(β) = H(1/β) se tiene que en particular si β es un S 0 -entero,
entonces
−1

n
o
Y
H(β) = 
min 1, 1/ |β|p  .
p∈S 0
Sea α un n´
umero algebraico. Si aplicamos el teorema de Roth (segun el comentario (4) hecho en la secci´on 1 del capitulo 2) en el caso K = Q, S = S 0 ∪ ∞,
α∞ = α, αp = ∞ para todo p ∈ S 0 , se obtiene que dado ε > 0, existen finitos β ∈ Q
para los cuales
n
o
Y
1
min {1, |α − β|}
min 1, 1/ |β|p <
.
2+ε
H(β)
0
p∈S
Usando el comentario anterior, se concluye que la desigualdad
(3.1)
|α − β| <
1
H(β)1+ε
posee finitas soluciones en S 0 -enteros.
Una consecuencia de este hecho es que la expresi´on decimal de un n´
umero
algebraico no puede tener bloques de ceros “muy grandes”. M´as precisamente, sea
0.a1 a2 . . . la expresi´
on decimal de un n´
umero algebraico, y para cada n definamos
l(n) como el m´ınimo l ≥ 0 tal que an+l 6= 0; entonces l(n) = o(n) con n → ∞.
Pues consideremos β = 0, a1 . . . an con an 6= 0, entonces
41
42
3. APLICACIONES
α−β =
X
i≥n+l(n)
X 1
ai
9
1
≤
= n+l(n) .
i
i
n+l(n)
10
10
10
10
i≥0
Por lo tanto, para no entrar en contradicci´on con (3.1), para todo ε > 0, debe valer
que l(n) < εn, para n suficientemente grande.
En particular, si {an } es una sucesi´on creciente de enteros positivos que no
cumpla an+1 − an = o(n), por ejemplo si liminf aan+1
> 1, el n´
umero
n
X 1
10an
n
resulta trascendente. Por ejemplo, podemos tomar an = 2n . Esto es solo un caso
sencillo de un resultado obtenido por Ferenczi y Mauduit [13], que esencialmente
establece que si la expresi´
on en base b ≥ 2 de un n´
umero contiene infinitas potencias
(2+ε) de bloques (esto es un bloque seguido de sigo mismo y luego por su comienzo,
de tama˜
no relativo al menos ε), a distancia del origen no mucho m´as grande que
la longitud del bloque considerado, el n´
umero resulta trascendente. Veremos en
el capitulo siguiente un resultado m´as fuerte que este que se obtiene a partir de
Teorema del Subespacio, una generalizaci´on multidimensional del Teorema de Roth.
2. El problema de Waring
En 1770, Lagrange prob´
o un problema de Diofanto, el cual asegura que todo
entero positivo puede ser escrito como suma de 4 cuadrados. El mismo a˜
no, Waring
afirmo, sin demostraci´
on, que todo entero positivo se pod´ıa escribir como suma de
9 cubos, 19 potencias cuartas y en general como s potencias k-esimas para alg´
un s.
Se define el n´
umero g(k) como el menor entero tal que todo entero positivo se puede
escribir como la suma de como mucho g(k) potencias k-esimas positivas. En 1909
Hilbert prob´
o que en generaljg(k) k
< ∞. Como fue observado
por J.A.Euler(hijo de
j k
k k
k
2 − 1 requiere 32
− 1 potencias 2k y 2k − 1
Leonhard Euler), el n´
umero 23
j k
k
potencias 1k para su representacion, probando asi que g(k) ≥ 2k + 32
− 2.
Luego del tabajo de Hardy, Littlewood, y Vinogradov en el problema de Waring,
se prob´
o que para algun entero c(k), que pod´ıa ser calculado en funci´on de k, todo
entero podr´ıa ser escrito como suma de menos de g(k) potencias k-esimas. Por
lo tanto, q
´ue realizar finitos c´alculos para probar que todo entero menor a c(k)
podr´ıa ser escrito con a lo sumo g(k) potencias k-esimas. Este trabajo fue llevado a
cabo en una serie de papers por Dickson, Pillai, Rubugunday, y Niven, entre otros
matem´
aticos. Todos estos trabajos se reducen en el siguiente teorema:
Teorema 3.1. Sea k ≥ 6, si la siguiente inecuaci´
on se verifica
k $ k %! $ k %
3
3
3
−
+
≤ 2k ,
(3.2)
2k .
2
2
2
j k
k
entonces g(k) = 2k + 23
− 2. Mientras que si,
j k j k
k
k
k
2k . 23 − 32
+ 32
> 2k ,
j k j k j k j k
k
k
k
k
si definimos N (k) = 23
. 43
+ 32
+ 43
se tiene que
j k j k
k
k
g(k) = 32
+ 43
+ 2k − 3 si 2k < N (k),
o
´
3. ECUACIONES DIOFANTICAS
g(k) =
j
3 k
2
k
+
j
4 k
3
k
43
+ 2k − 2 si 2k = N (k).
Mahler prob´
oj usando
la versi´on p-adica del teorema de Roth dada por Ridiout
k k
que g(k) = 2k + 32
− 2 para todo k suficientemente grande.
Apliquemos el teorema tomando K = Q, S = {∞, 2, 3}, α∞ = 1, α2 = ∞,
α3 = 0, y sea β = 3k /(n.2k ) con n = 23 . Se tiene que |α2 − β|2 = 2−k |n|2 ,
|α3 − β| = 3−k |n|−1
on
3 . Por lo tanto, por el teorema de Roth, la inecuaci´
−2−ε
|α∞ − β|∞ |α2 − β|2 |α3 − β|3 = |1 − 3k /(n.2k )|.2−k |n|2 .3−k |n|−1
3 < H(β)
posee finitas soluciones sobre k. En particular, usando que |n|2 ≤ 1 y que por
definici´
on de altura, 3k |n|3 ≤ H(β). Se tendr´a que la desigualdad m´as fina
k
−2−ε
|1 − 3k /(n.2k )|.2−k .3−k |n|−1
3 < (3 |n|3 )
tambi´en posee finitas soluciones sobre k. Despejando, multiplicando por n y usando
que (2/3)k .n ≥ 1 y que 1 ≥ |n|3 , se tendr´a que la inecuaci´on
l m
k
3 k
− 32 ≥ 3−εk
2
es v´
alida para todos salvo un n´
umeros finitos de enteros positivos k, para cualquier
ε > 0 fijo. Si tomamos ε = log(4/3)/log 3, y usando que esta desigualdad
j implica
k
k
(3.2), deducimos el teorema de Mahler, que asegura que g(k) = 2k + 32
−2
para todo entero k suficientemente grande. Debido a la inefectividad del teorema
de Roth, sigue siendo un problema abierto determinar efectivamente un k0 para el
cual el resultado sea v´
alido para k ≥ k0 .
3. Ecuaciones Diof´
anticas
Ya hemos mencionado que gran parte de esta teor´ıa se ha desarrollado con
el fin de resolver ciertas ecuaciones diof´anticas o al menos poder determinar la
finitud de su conjunto de soluciones. Como fue mostrado en el Cap´ıtulo 1, con
su resultado sobre aproximaciones diof´anticas, Thue fue capaz de probar que que
llamada Ecuaci´
on de Thue,
F (X, Y ) = m,
posee finitas soluciones enteras, si F es un polinomio homog´eneo irreducible sobre
Q[X, Y ] con coeficientes enteros y m un entero no negativo.
Probaremos ahora un resultado m´as general utilizando el teorema de Roth sobre
Q y el valor absoluto usual. Recordemos que en este caso el teorema de Roth es
equivalente a que si α es algebraico de grado d ≥ 3, y k > 2, entonces existe una
constante c(α, k) > 0 tal que
|α − ξ| ≥ c(α, k)H(ξ)k ,
para todo ξ ∈ Q. Para d = 1 o 2, el teorema de Liouville asegura que una desigualdad de este estilo sigue valiendo.
Un polinomio homog´eneo F (X, Y ) ∈ Z[X, Y ] se dir´a libre de cuadrados si no
es divisible por G(X, Y )2 para algun polinomio homog´eneo G ∈ Z[X, Y ].
Teorema 3.2. Sea F (X, Y ) ∈ Z[X, Y ] un polinomio homog´eneo libre de cuadrados de grado d ≥ 3. Entonces para todo k > 2 existe una constante c(F, k) > 0 tal
que para par de enteros (x, y) con F (x, y) 6= 0 se tiene que
(3.3)
d−k
|F (x, y)| ≥ c(F, k) max {|x|, |y|}
.
44
3. APLICACIONES
Si F posee grado d ≤ 2, el teorema es verdadero trivialmente ya que |F (x, y)| ∈
Z, luego ≥ 1.
´ n. Se probara la desigualdad solo para los pares de enteros (x, y)
Demostracio
con |y| ≥ |x|. Intercambiando los roles de x e y, con el mismo argumento se prueba
la desigualdad para los pares (x, y) con |x| > |y|.
Luego, nos restringiremos al caso en el que |y| ≥ |x| y F no es divisible por Y .
Si F es divisible por Y , tendremos que F = Y.F1 , con F1 ∈ Z[X, Y ] un polinomio
homog´eneo libre de cuadrados de grado d − 1 ≥ 2, el cual no es divisible por Y .
Por lo tanto, si la desigualdad se cumple para F1 con d − 1 en lugar de d, se cumple
autom´
aticamente para F .
Supongamos entonces que F es un polinomio homog´eneo de grado d ≥ 2, libre
de cuadrados, que no es divisible por Y . Luego F (X, Y ) = a0 X d + a1 X d−1 Y +
· · · + ad Y d , a0 6= 0, y entonces,
F (X, Y ) = a0 (X − α1 Y ) . . . (X − αd Y )
con α1 , . . . , αd distintos, pues F es libre de cuadrados. Sea (x, y) un par de enteros
con F (x, y) 6= 0 y |y| ≥ |x|. Como y 6= 0, sea ξ := x/y. Observar que |y| =
max {|x|, |y|} ≥ H(ξ)(con igualdad si mcd(x, y) = 1). Sea i el ´ındice para el cual
|ξ − αi | = minj=1,...,d |ξ − αj |.
Por el teorema de Roth, tendremos que existe una constante c(αi , k) tal que
−k
|ξ − αi | ≥ c(αi , k)H(ξ)−k ≥ c(αi , k) max {|x|, |y|}
.
Para j 6= i, se tiene que
|αi − αj | ≤ |αi − ξ| + |ξ − αj | ≤ 2|ξ − αj |
lo que implica que
|ξ − αj | ≥ 21 |αi − αj |.
Por lo tanto,
Qd
Qd
d
|F (x, y)| = |y|d .|a0 | j=1 |ξ − αj | = max {|x|, |y|} |a0 | j=1 |ξ − αj | ≥
Q
d−k
d−k
= c0 (αi , k) max {|x|, |y|}
.
c(αi , k)|a0 | j6=i 12 |αi − αj | . max {|x|, |y|}
Tomando el m´ınimo sobre las constantes c0 (αi , k) para i = 1, . . . , d, obtenemos el
resultado deseado.
Corolario 2. Sea F (X, Y ) un polinomio homog´eneo en Z[X, Y ] libre de cuadrados de grado d ≥ 3, y sea G(X, Y ) ∈ Z[X, Y ] un polinomio de grado total ≤ d − 3.
Entonces existen finitas pares (x, y) ∈ Z2 tal que F (x, y) = G(x, y) y F (x, y) 6= 0.
P
´ n. Sea G(X, Y ) = i+j≤d−3 aij X i Y j , entonces si (x, y) ∈ Z se
Demostracio
tendr´
a que
P
i+j
d−3
|G(x, y)| ≤ (i+j≤d−3) |aij | max {|x|, |y|}
≤ C1 . max {|x|, |y|} .
Sea (x, y) ∈ Z tal que F (x, y) 6= 0 y F (x, y) = G(x, y) entonces
|F (x, y)| = |G(x, y)| ≤ C1 max {|x|, |y|}
d−3
.
´
3. ECUACIONES DIOFANTICAS
45
Sea 2 < k < 3, entonces por el teorema anterior, existe C2 > 0 tal que para todo
(x, y) con F (x, y) 6= 0,
|F (x, y)| ≥ C2 max {|x|, |y|}
d−k
.
Por lo tanto,
max {|x|, |y|}
3−k
≤ C3 ,
como 3 − k > 0, concluimos lo deseado.
Si tomamos G(x, y) = m 6= 0, obtenemos nuevamente la Ecuaci´on de Thue.
La condici´
on F (x, y) 6= 0 es necesaria pues si F y G posee alg´
un factores lineal
en com´
un, con coeficientes racionales, habr´a infinitas soluciones tal que F (x, y) =
G(x, y) = 0.
Siegel fue el primero en probar un teorema de aproximaciones racionales sobre
cuerpos de n´
umeros algebraicos, lo que le permit´ıo llegar a resultados m´as generales
y probar la finitud de soluciones de ciertas ecuaciones sobre el anillo de enteros de
un cuerpo de n´
umeros. Podemos generalizar la ecuaci´on de Thue en este contexto.
De hecho, podremos considerar otro tipo de ecuaciones diof´anticas que tambi´en
posee finitas soluciones. En lo que sigue K ser´a un cuerpo de n´
umeros y RK su
anillo de enteros.
´ n 4. Las siguientes afirmaciones son equivalentes
Proposicio
• (M) Para todo cuerpo de n´
umeros K y todo elemento no nulo k ∈ K, la
ecuaci´
on de Mordell
Y 2 = X3 + k
posee finitas soluciones (x, y) ∈ RK × RK .
• (E) Para todo cuerpo de n´
umeros K y todo polinomio f ∈ K[X] de grado
3 con tres ra´ıces complejas distintas, la ecuaci´
on el´ıptica
Y 2 = f (X)
posee finitas soluciones (x, y) ∈ RK × RK .
• (HE) Para todo cuerpo de n´
umeros K y todo polinomio f ∈ K[X] de
grado al menos 3 con ra´ıces complejas simples, la ecuaci´
on hiperel´ıptica
2
Y = f (X)
posee finitas soluciones (x, y) ∈ RK × RK .
• (SE) Para todo cuerpo de n´
umeros K, todo entero m ≥ 3 y todo polinomio
f ∈ K[X] con al menos dos ra´ıces complejas distintas cuyos ordenes de
multiplicidad son coprimos con m, la ecuaci´
on superel´ıptica
m
Y = f (X)
posee finitas soluciones (x, y) ∈ RK × RK .
• (T) Para todo cuerpo de n´
umeros K, para todo elemento no nulo k ∈ K y
elementos α1 , . . . , αn en K con # {α1 , . . . , αn } ≥ 3, la ecuaci´
on de Thue
(X − α1 Y ) . . . (X − αn Y ) = k
posee finitas soluciones (x, y) ∈ RK × RK .
• (S) Para todo cuerpo de n´
umeros K y elementos a1 , a2 ∈ K no nulos, la
ecuaci´
on de Siegel
a1 U + a2 V = 1
46
3. APLICACIONES
∗
∗
posee finitas soluciones (u, v) ∈ RK
× RK
.
Cada una de estas afirmaciones es un teorema: Mordell prob´o (M) en el caso
de n´
umeros enteros, y Thue lo hizo con (T), las primeras cuatro resultados son
un caso particular del Teorema de Siegel sobre finitud de soluciones en el anillo de
enteros de un cuerpo de n´
umeros para curvas F (X, Y ) = 0 que poseen genero al
menos uno.
Veremos c´
omo se utiliza el Teorema de Roth para probar la finitud de la
ecuaci´
on de Siegel. De hecho probaremos un resultado m´as general debido a
Mahler quien fue el primero en trabajar con aproximaciones en cuerpos p-´adicos.
Luego probaremos como deducir la finitud de soluciones enteras en caso de curvas
hiperel´ıpticas. Para una prueba completa de la equivalencia entre estos enunciados
el lector se puede dirigir a [34].
En lo que sigue, S ⊂ MK ser´a un subconjunto finito de valores absolutos sobre
K que contiene a todos los valores absolutos arquimedianos y notaremos por RS al
anillo de S-enteros
RS = {x ∈ K| |x|υ ≤ 1 ∀ υ ∈
/ S}.
El Teorema de Dirichlet sobre las unidades de RK establece que el rango del grupo
de unidades del anillo de enteros de un cuerpo de n´
umeros es igual a r1 + r2 − 1,
con r1 la cantidad de embedding reales de K en C y 2.r2 la cantidad de embeddings
no reales. En el caso de S-enteros, este teorema sigue valiendo y el rango RS ser´a
igual a r1 + r2 − 1 + |S|.
Teorema 3.3 (Siegel-Mahler). Sea K/Q un cuerpo de n´
umeros, sea S ⊂ MK
un subconjunto finito de valores absolutos sobre K que contiene a todos los valores
absolutos arquimedianos, sea RS el anillo de S-enteros de K y sean a, b ∈ K ∗ .
Entonces la ecuaci´
on
(3.4)
aU + bV = 1
tiene solo finitas soluciones en S-unidades U, V ∈ RS
´ n. Sea m un entero fijo, suficientemente grande(alcanzara con
Demostracio
tomar m = 2#S + 1). El teorema de S-unidades de Dirichlet implica que el grupo
m
cociente RS∗ / (RS∗ ) es finito. Sea c1 , . . . , cr un conjunto de representantes. Entonces toda soluci´
on (U, V ) de (3.4) se puede escribir de la forma
U = ci X m
V = cj Y m
para algun X, Y ∈ RS∗ y algun ci , cj , y por lo tanto (X, Y ) es soluci´on de la ecuaci´on
aci X m + bcj Y m = 1.
Como hay finitas elecciones posibles para ci y cj , ser´a suficiente probar que para
α, β ∈ K ∗ , la ecuaci´
on
αX m + βY m = 1
tiene finitas soluciones con X, Y ∈ RS∗ .
Supongamos por el contrario, que poseemos infinitas soluciones para una ecuaci´on
de este estilo. Como el conjunto S es finito, por el principio del palomar podremos
encontrar un valor absoluto ω ∈ S, para el cual la ecuaci´on αX m + βY m = 1 posee
infinitas soluciones (X, Y ) y adem´as
´
3. ECUACIONES DIOFANTICAS
47
kY kω = max {kY kυ |υ ∈ S}.
Sea γ una ra´ız m-esima de -β/α, que luego ser´a determinada apropiadamente.
Entonces
Y X
Xm
β
1
Xm
m
=
+
−
γ
=
=
−
ζγ
,
αY m
Ym
α
Ym
Y
ζ∈µm
donde el producto est´
a tomado sobre todas las ra´ıces m-esimas de la unidad. Dado
que hay infinitas soluciones, Y tiene valor absoluto no acotado con lo cual alguno
de los factores del producto ser´a chico. De hecho, solo uno de ellos podr´a ser chico.
En efecto, si ζ, ζ 0 ∈ µm son ra´ıces m-´esimas de la unidad distintas, usando la
desigualdad triangular tendremos que
X
− ζγ + X − ζ 0 γ ≥ |ζ 0 γ − ζγ| ≥ C1 .
Y
Y
ω
ω
Donde la constante C1 = C1 (α, β, S, m) es independiente de X e Y . Por esta
desigualdad, en el producto, todos salvo quiz´as uno de los factores deben ser mayores
a C1 /2. Entonces
m−1
Y X
X
C1
1
− ζγ ≥ min − ζγ .
=
m
ζ∈µm Y
|αY |ω
Y
2
ω
ω
ζ∈µm
Por lo tanto, existe una constante C2 = C2 (α, β, S, m) tal que
X
1
− ζγ m ≥ C2 min .
ζ∈µ
Y
kY kω
m
ω
Para cada solucion (X, Y ), existir´a al menos una ra´ız m-´esima de la unidad ζ,
que alcanza el m´ınimo del lado derecho de la inecuaci´on anterior. Como estamos
suponiendo que tenemos infinitas soluciones y hay finitas ra´ıces m-esimas, entonces
podemos suponer que hay infinitas soluciones X, Y ∈ RS∗ de la ecuaci´on αX m +
βY m = 1 que cumplen
X
1
.
≥
C
−
ζγ
2
m
Y
kY kω
ω
Esto nos dice que X/Y es una buena aproximaci´on de ζγ. Para poder aplicar el
m
Teorema de Roth, necesitamos relacionar kY kω con la altura de X/Y .
El valor absoluto ω fue elegido para maximizar kY kυ . Como ademas kY kυ = 1
para todo υ ∈
/ S, se tiene que
!1/#S
!1/#S
Y
Y
kY kω = max kY kυ ≥
kY kυ
=
kY kυ
≥ HK (Y )1/#S .
υ∈S
υ∈S
υ∈MK
Recordando propiedades elementales de la altura, H(x+y) ≤ 2H(x)H(y), H(xy) ≤
H(x)H(y), HK (x) = H(x)[K:Q] , y usando que (X, Y ) es soluci´on de αX m + βY m =
1
m
β
β
1
[K:Q]
HK X
HK ( Y1m )HK ( α1 )HK ( α
).
Y m = HK αY m − α ≤ 2
Tomando ra´ız m-esima y usando que HK (T m ) = HK (T )m , se tiene que existe una
constante C3 = C3 (α, β, S, m) tal que
48
3. APLICACIONES
HK (X/Y ) ≤ C3 HK (1/Y ) = C3 HK (Y ).
Utilizando la cota obtenida anteriormente para HK (Y ), se tendr´a que si llamamos
1/#S
C4 = C3
, entonces
kY kω ≥ C4 HK (X/Y )1/#S .
Se concluye que existe una constante C5 = C5 (α, β, S, m, K) = 1/C2 C4m para la
cual
X
C5
− ζγ ,
≥
m/#S
Y
H (X/Y )
K
ω
por suposici´
on, posee infinitas soluciones X, Y ∈ RS∗ . Recordando que podemos
tomar m = 2#S + 1, el teorema de Roth nos dice que esto es un absurdo, llegando
as´ı a la contradicci´
on deseada.
Teorema 3.4. Sea K/Q un cuerpo de n´
umeros, sea S ⊂ MK un subconjunto
finito de valores absolutos sobre K que contiene a todos los valores absolutos arquimedianos y sea RS el anillo de S-enteros de K. Sea f (X) ∈ K[X] un polinomio
de grado al menos 3 con ra´ıces distintas(sobre K). Entonces la ecuaci´
on
2
Y = f (X)
posee finitas soluciones en S-enteros X, Y ∈ RS .
´ n. Primero observemos que es posible reemplazar K por una
Demostracio
extensi´
on finita L, en la cual f (X) se factorice linealmente. En efecto, supongamos que el teorema es v´
alido bajo estas condiciones y sea f (X) un polinomio en
K[X]. Sea L una extensi´
on finita de K en la cual f (X) se factoriza linealmente.
Consideremos S 0 el conjunto de valores absolutos sobre L que consiste de todas las
extensiones a L de los valores absolutos en S, es decir, todos los valores absolutos en
L que estan arriba de algun valor absoluto de S. Como L/K es una extensi´on finita
de cuerpos de n´
umeros, cada valor absoluto de S posee finitas extensiones. Luego
S 0 resulta finito y posee todos los valores absolutos arquimedianos de L. Dado que
RSK ⊂ RSL0 se concluye que la validez del teorema para L y S 0 , implica la validez
para K y S.
Notar que mientras m´
as grande sea S, m´as fuerte ser´a el resultado del teorema.
Por lo tanto, probar el teorema para un conjunto de valores absolutos m´as grande
no afectara la conclusi´
on buscada. Ya vimos que podemos suponer que f (X) se
factoriza linealmente en K, entonces tenemos que
f (X) = a(X − α1 ) . . . (X − αn ) con α1 , . . . , αn ∈ K.
Por hip´
otesis, n ≥ 3 y los αi son todos distintos.
Incrementaremos el tama˜
no de S para que se satisfagan las siguientes condiciones
(1) a ∈ RS∗ .
(2) αi − αj ∈ RS∗ para todo i 6= j.
(3) RS es un anillo de ideales principales.
Recordemos que para todo x ∈ K, |x|υ = 1 salvo finitos υ ∈ MK . Por lo tanto,
agregando finitos valores absolutos a S, la condicion (1) y (2) ser´an v´alidas. Para
ver (3), recordar que el grupo de clases de RS es finito, por lo tanto es suficiente
agregar a S un primo de cada clase de ideales.
´
3. ECUACIONES DIOFANTICAS
49
Sea (X, Y ) ∈ RS2 una soluci´on de la ecuaci´on Y 2 = f (X). Veamos que el ideal
(X − αi )RS es el cuadrado de un ideal en RS . Sea p un ideal primo de RS , entonces
p solo puede dividir como mucho a uno de los ideales (X − αi )RS pues sino divide a
dos de ellos, dividir´
a a (αi − αj )RS lo cual contradice (2). A partir de (1), tenemos
que p no puede dividir a aRS . Por lo tanto, se sigue de la la factorizaci´on de f (X),
que si p divide a uno de los ideales (X −αi )RS , el orden de p debe ser par. Entonces
existen ideales ai ⊂ RS tal que
(X − αi )RS = a2i para todo 1 ≤ i ≤ n.
Por propiedad (3) tenemos que RS es un anillo de ideales principales, entonces
ai = (Zi )RS , para algun Zi ∈ RS . Por lo tanto existe una unidad Ui ∈ RS∗ tal que
X − αi = Ui Zi2 , para todo 1 ≤ i ≤ n.
Extendemos K a un cuerpo L, adjunt´andole todas las ra´ıces cuadradas de
elementos de RS∗ . Por el teorema de S-unidades de Dirichlet, el grupo RS∗ es finitamente generado, por lo tanto RS∗ /(RS∗ )2 es finito, entonces L/K ser´a una extensi´on
finta pues estara generado por las ra´ıces cuadradas de un conjunto de representantes de RS∗ /(RS∗ )2 . Sea T ⊂ ML el conjunto de lugares que est´an arriba de los
elementos de S. Como L/K es finita, T resulta finito. En L, cada Ui resulta un
cuadrado, digamos Ui = Vi2 . Entonces se tiene que X − αi = (Vi Zi )2 = Wi2 para
algun Wi ∈ RT . Considerando la diferencia de dos de estas igualdades tenemos que
αi − αj = Wi2 − Wj2 = (Wi − Wj )(Wi + Wj ).
Por (2), el lado izquierdo de esta ecuaci´on esta en RT∗ , mientras que cada uno de
los factores de la derecha est´
an en RT . Por lo tanto, cada uno de estos factores
debe ser una unidad,
Wi − Wj , Wi + Wj ∈ RT∗ para todo i 6= j.
Como f (X) posee grado al menos 3, podemos escribir la siguiente identidad(a
veces llamada identidad de Siegel)
W1 −W2
W1 −W3
+
W2 −W3
W1 −W2
= 1.
Cada uno de los t´erminos del lado derecho posee finitas opciones por teorema*(Sunit equation). Similarmente, la identidad
W1 +W2
W1 −W3
+
W3 +W2
W3 −W1
=1
y el teorema* nos dice que cada uno de los t´erminos en esta ecuaci´on posee finitas
opciones. Se sigue que hay solo finitos valores posibles para la cantidad
W1 −W2 W1 +W2
W1 −W3 . W1 −W3
=
W12 −W22
(W1 −W3 )2
=
α2 −α1
(W1 −W3 )2 .
Por lo tanto, tambi´en habr´
a finitos valores posibles para W1 − W3 , lo que implica
finitos valores posibles para
α3 −α1
1
1
2 (W1 − W3 ) + W1 −W3 = 2 ((W1 − W3 ) + (W1 + W3 )) = W1 ,
y entonces finitos valores posibles para α1 + W12 = X. Finalmente, para cada valor
de X, hay como mucho 2 valores posibles para Y . Lo que completa la prueba de la
finitud de las soluciones de Y 2 = f (X) con X, Y ∈ RS .
CAP´ITULO 4
El Teorema del Subespacio
1. El Teorema del Subespacio
El Teorema del Subespacio, probado por Schmidt en 1972, es una generalizaci´on
multidimensional del Teorema de Roth y fue originalmente desarrollado para el estudio de las aproximaciones de n´
umeros algebraicos por medio de n´
umeros algebraicos
de grado acotado y la norm form equation(una clase de ecuaciones diof´anticas que
incluyen a las ecuaciones de Thue). Este teorema, involucra sistema de inecuaciones en formas lineales. Es importante mencionar que esta no es una generalizaci´
on rutinaria, sino que nuevas dificultades aparecen a lo largo de prueba, las
cuales fueron resueltas por Schmidt al introducir nuevas ideas de la Geometr´ıa de
N´
umeros. Puede verse una prueba del teorema en [29], [12] se basa principalmente
en la referencia anterior pero posee varias simplificaciones. Una prueba del teorema
en su versi´
on m´
as general puede encontrarse en [4].
Sea
n
un
entero
positivo
y r ≤ n. Diremos que las formas lineales L1 =
Pn
Pn
j=1 a1j xj , . . . , Lr =
j=1 arj xj con aij ∈ C son linealmente dependientes si
existen c1 , . . . , cr ∈ C, no todos nulos, tal que c1 L1 +. . .+cr Lr ≡ 0. Caso contrario,
diremos que son linealmente independientes. Es facil ver que, si r = n, L1 , . . . , Ln
son linealmente independientes si y solo si det(L1 , . . . , Ln ) = det(aij ) 6= 0.
La norma de x = (x1 , . . . , xn ) ∈ Zn esta dada por kxk := max {|x1 |, . . . , |xn |}.
Teorema 4.1 (Schmidt, 1972). Sea n ≥ 2, y sean L1 (X), . . . , Ln (X), n formas
lineales en las variables X = (X1 , . . . , Xn ), linealmente independientes, con coefiumero finito de subespacios
cientes en Q. Sean C > 0 y ε > 0, entonces existe un n´
lineales propios T1 , . . . , Th de Qn tal que el conjunto de soluciones de
(4.1)
|L1 (x) · · · Ln (x)| < C kxk
−ε
x ∈ Zn ,
est´
a contenido en T1 ∪ · · · ∪ Th .
El Teorema del Subespacio puede reformularse en una forma m´as geom´etrica de
la siguiente manera. La topolog´ıa del Subespacio (noci´on introducida por Schmidt)
en Qn es la topolog´ıa cuyos conjuntos cerrados son uniones finitas de subespacioes
lineales de Qn . Entonces, el Teorema 4.1 establece que para todo C > 0 y ε > 0, el
conjunto de soluciones de (4.1) no es denso en Qn con respecto a la topolog´ıa del
Subespacio.
Veamos que el Teorema del Subepacio implica el Teorema de Roth. Recordemos
que la altura de ξ ∈ Q es H(ξ) = max {|x|, |y|}, con ξ = x/y, x,y ∈ Z, mcd(x, y) = 1.
Corolario 3 (Teorema de Roth). Sea α ∈ Q y C > 0, k > 2. Entonces la
inecuaci´
on
(4.2)
|α − ξ| ≤ CH(ξ)−k
posee finitas soluciones.
51
ξ∈Q
52
4. EL TEOREMA DEL SUBESPACIO
´ n. Sea ξ = x/y una soluci´on de (4.2), con x,y ∈ Z, mcd(x, y) =
Demostracio
1. Sea ε > 0 tal que k = 2 + ε. Multiplicando (4.2) por y 2 obtenemos
|y(x − αy)| ≤ Cy 2 max {|x|, |y|}
−2−ε
−ε
≤ C. max {|x|, |y|}
Dado que las formas lineales Y y X − αY son linealmente independientes, podemos
aplicar el Teorema del Subespacio. Se sigue entonces que los pares de enteros
(x, y) ∈ Z2 , con mcd(x, y) = 1 tal que ξ = x/y es soluci´on de (4.2), est´an contenidos
en una uni´
on finita de subespacios propios de Q2 , es decir, subespacios lineales
de dimensi´
on uno. Los subespacios uno dimensionales de Q2 consisten en todos
los puntos de la forma λ(x0 , y0 ) con λ ∈ Q y (x0 , y0 ) puede tomarse en Z2 con
mcd(x0 , y0 ) = 1. Por lo tanto, ξ = x0 /y0 , esta un´ıvocamente determinado por el
subespacio.
El Teorema del Subespacio establece que el conjunto de soluciones de (4.1) esta
contenido en finitos subespacios lineales propios de Qn . En este caso, logramos ver
que de hecho existen finitas soluciones. Algo similar ocurrir´a siempre que consideremos n = 2. Si tenemos una soluci´on no nula x0 ∈ Zn tal que L1 (x0 ) = 0, entonces
λ.x0 ser´
a soluci´
on de (4.1) para todo λ ∈ Z. Por lo tanto, tendremos as´ı infinitas
soluciones de (4.1). Para evitar este tipo de construcci´on, consideremos
(4.3)
0 < |L1 (x) · · · Ln (x)| < C|x|−ε
x ∈ Zn ,
En el caso n = 2, el conjunto de soluciones de (4.3) ser´a de hecho finito.
Lema 11. Sea Li = ai1 X + αi2 , para i = 1, 2, dos formas lineales linealmente
on
independientes con coeficientes en Q. Sea C > 0, ε > 0. Entonces la inecuaci´
(4.4)
0 < |L1 (x)L2 (x)| ≤ C kxk
−ε
en x ∈ Z2
posee finitas soluciones.
´ n. Por el Teorema del Subespacio, las soluciones de (4.4) pertenecen
Demostracio
a un n´
umero finito de subespacios lineales de dimensi´on 1 de Q2 . Cada uno de estos subespacios T se puede representar de la forma T = {λ(x0 , y0 )|λ ∈ Q} donde
(x0 , y0 ) ∈ Z2 se puede elegir de forma tal que mcd(x0 , y0 ) = 1. Observar que
λ(x0 , y0 ) ∈ Z2 si y solo si λ ∈ Z. Si L1 (x0 , y0 )L2 (x0 , y0 ) = 0, entonces (4.4)
no posee soluciones en T . Supongamos que L1 (x0 , y0 )L2 (x0 , y0 ) 6= 0. Entonces
λ(x0 , y0 )es soluci´
on de (4.4) si y solo si
−ε
0 < λ2 |L1 (x0 , y0 )L2 (x0 , y0 )| ≤ C|λ|−ε k(x0 , y0 )k
−ε
Por lo tanto, |λ|2+ε ≤ C|L1 (x0 , y0 )L2 (x0 , y0 )|−1 k(x0 , y0 )k
tado.
.
. Es decir, λ esta aco
Si n ≥ 3, (4.3) puede tener infinitas soluciones, como muestra el siguiente
ejemplo. Sea 0 < ε < 1 y consideremos la inecuaci´on
√
√
√
√
√
√
−ε
(4.5) 0 < |(x1 + 2x2 + 3x3 )(x1 − 2x2 + 3x3 )(x1 − 2x2 − 3x3 )| ≤ kxk
en x = (x1 , x2 , x3 ) ∈ Z3 . Observar que las 3 formas lineales consideradas son
linealmente independientes.
Consideremos las uplas de enteros x = (x1 , x2 , x3 ) ∈ Z3 con x3 = 0, x1 .x2 6= 0.
Para estos x, kxk = max {|x1 |, |x2 |}. Por el teorema de Dirichlet, existen infinitos
racionales x1 /x2 tal que
2. APROXIMACIONES SIMULTANEAS Y ALGEBRAICAS DE GRADO ACOTADO
√
2−
x1 x2 53
≤ |x2 |2 .
Para estas soluciones x = (x1 , x2 , 0), dado que
√
√
|x1 /x2 | ≤ |x2 |2 + 2 ≤ 1 + 2,
√
entonces kxk = max {|x1 |, |x2 |} ≤ (1 + 2)|x2 |. Por lo tanto, para los puntos
considerados,
√
√
√
√
√
√
+
3x
)(x
−
2x
+
3x
)(x
−
2x
−
3x3 )| =
0√
< |(x1 + 2x
2
3
1
2
3
1
2
√
√
√ 3
−1
−ε
−1 2
2
|(x1 + 2x2 )(x1 − 2x2 ) | ≤ (1 + 2) kxk .(x2 ) ≤ (1 + 2) kxk ≤ kxk ,
si kxk es suficientemente grande. Por lo tanto, (4.5) posee infinitas soluciones en
el subespacio {x3 = 0}. De la misma forma se prueba que hay infinitas soluciones
en los subespacios {x1 = 0}, {x2 = 0} y con un poco m´as de trabajo ver que (4.5)
posee finitas soluciones con x1 x2 x3 6= 0.
Mencionaremos a continuaci´on una versi´on mejorada del Teorema del Subespacio, probada por Vojta [33] en 1989.
Teorema 4.2. Sean L1 , . . . , Ln formas lineales linealmente independientes en
n variables, con coeficientes en Q. Entonces existe un conjunto finito de subespacios
lineales de Qn efectivamente determinables T1 , . . . , Tl . Tal que para todo ε > 0, el
conjunto de soluciones de
−ε
|L1 (x) . . . Ln (x)| ≤ kxk
en x ∈ Zn
est´
a contenido en T1 , . . . , Tn , salvo por un conjunto finito de soluciones que pueden
depender de ε.
2. Aproximaciones Simultaneas y Algebraicas de grado acotado
El siguiente teorema de Dirichlet de 1842, generaliza al probado en el capitulo
1. Su prueba es similar y puede leerse en [29].
Teorema 4.3. Sean α1 , . . . , αn n´
umeros reales Q-linealmente independientes.
Entonces para alguna constantes C > 0, la inecuaci´
on
−n+1
|α1 x1 + . . . + αn xn | ≤ C kxk
en x ∈ Zn
posee infinitas soluciones.
En 1970, Schmidt prob´
o que el exponente -n+1 no puede ser reemplazado por
ning´
un n´
umero m´
as chico si α1 , . . . , αn son algebraicos.
Teorema 4.4. Sean α1 , . . . , αn n´
umeros algebraicos. Para toda C > 0 y ε > 0,
la inecuacion
(4.6)
0 < |α1 x1 + . . . + αn xn | ≤ C kxk
−n+1−ε
en x = (x1 , . . . , xn ) ∈ Zn
posee finitas soluciones.
´ n. Procederemos por inducci´on en n. El caso n = 1 resulta
Demostracio
trivial. Sea n > 1 y supongamos que el teorema es cierto para n − 1. Podemos
asumir que al menos uno de los coeficientes α1 , . . . , αn es no nulo pues sino, no
habr´ıa soluciones. Asumamos entonces que α1 6= 0. Para cada soluci´on x de (4.6)
se tiene que
(4.7)
|(α1 x1 + . . . + αn xn )x2 . . . xn | ≤ C kxk
−ε
.
Dado que el conjunto de formas lineales {α1 X1 + . . . + αn Xn , X2 , . . . , Xn } es linealmente independiente, el teorema del subespacio asegura que existen finitos subespacios lineales propios de Qn , T1 , . . . , Tt , que contienen las soluciones de (4.7).
54
4. EL TEOREMA DEL SUBESPACIO
Sea T uno de estos subespacios, y consideremos a1 X1 + . . . + an Xn una forma
lineal que se anula completamente en T . Sin perdida de generalidad, podemos
suponer que an 6= 0. Podemos entonces expresar a Xn como combinacion lineal de
X1 , . . . , Xn . Se tendr´
a que existen β1 , . . . , βn−1 n´
umeros algebraicos para los cuales
α1 X1 + . . . + αn Xn = β1 X1 + . . . + βn−1 Xn−1 sobre T . Por lo tanto, toda soluci´on
x de (4.6) con x ∈ T ,cumple que
−n+1−ε
0 < |β1 x1 + . . . + βn−1 xn−1 | ≤ C kxk
≤ max(|x1 |, . . . , |xn−1 |)−n+2−ε =
−n+1−ε
kx0 k
,
con x0 = (x1 , . . . , xn−1 ). Por hip´otesis inductiva, esta desigualdad posee finitas
soluciones en x0 ∈ Zn−1 . Por lo tanto, (4.6) tiene finitas soluciones con x en T .
Como hay finitos subespacios posibles, completamos as´ı la prueba del teorema. En el trabajo sobre aproximaciones diof´anticas de Siegel [25], adem´as de considerar las aproximaciones de n´
umeros algebraicos por medio de n´
umeros algebraicos en un cuerpo de n´
umeros fijo, tambien estudio la aproximaci´on por medio
de n´
umeros algebraico de grado acotado. Si bien los argumentos de Roth se generalizaron bien en el primer caso, no admitieron una extensi´on similar para el segundo
problema. El siguiente corolario se debe a Schmidt [30]. En este corolario, si ξ es
un n´
umero algebraico, H(ξ) denotara al m´aximo de los valores absolutos de los
coeficientes del polinomio minimal de ξ en Z[X].
Corolario 4. Sea α un n´
umero algebraico. Para todo entero d ≥ 1 y ε > 0,
existen finitos n´
umeros algebraicos ξ de grado d tal que
(4.8)
|α − ξ| < H(ξ)−d−1−ε .
´ n. Sea ξ un n´
Demostracio
umero algebraico de grado d que satisface (4.8).
Dado que α posee solo finitos conjugados, podemos asumir que ξ no es uno de
ellos. Sea f (X) = xd+1 X d + . . . + x1 ∈ Z[X] el polinomio minimal de ξ sobre
Z. Se tiene que si x = (x1 , . . . , xd+1 ) entonces H(ξ) = kxk, ademas f (α) 6= 0.
A partir del desarrollo de Taylor o el teorema del valor medio, obtenemos que
|f (α)| ≤ C(α, d)|α − ξ|H(ξ). Entonces
0 < |x1 + x2 α + . . . + xd+1 αd | = |f (α)| ≤ C(α, d)|α − ξ|H(ξ) <
−d−ε
C(α, d)H(ξ)−d−ε = C(α, d) kxk
.
Por el teorema anterior, existen solo finitos x ∈ Zd+1 que cumplen esta desigualdad.
Esto implica que hay solo finitos ξ algebraicos de grado d que cumple (4.8).
En particular, dados d ≥ 1 y ε > 0 existir´an finitos n´
umeros algebraicos ξ de
grado a lo sumo d para los cuales valga (4.8). Pues hay finitos para cada d0 ≤ d ya
que
0
|α − ξ| < H(ξ)−d−1−ε ≤ H(ξ)−d −1−ε .
Si d = 1, este resultado se reduce al Teorema de Roth. Un resultado m´as d´ebil,
con d + 1 + ε reemplazado por 2d + ε fue probado por Wirsing [35] por medio de
un m´etodo distinto.
Un problema abierto es encontrar el mejor exponente κd para el cual la inecuaci´
on
|α − ξ| < H(ξ)−κd +ε
3. LA VERSION P-ADICA DEL TEOREMA DEL SUBESPACIO
55
posee infinitas soluciones reales algebraicas ξ de grado como mucho d, para todo
ε > 0 fijo y todo α real que no es algebraico de grado como mucho d, para alguna
constante c dependiente de α y ε. Si d = 1 y α es irracional, el teorema de Dirichlet
prueba que κ1 = 2(incluso con ε = 0). Si d = 2 y α no es racional ni cuadr´atico
irracional, Davenport y Schmidt [9] probaron que κ2 = 3(incluso con ε = 0). Para
d ≥ 3 este resultado esta abierto y no se sabe cual podr´ıa ser una respuesta correcta.
Respecto al problema de aproximanciones por medio de enteros algebraicos,
Davenport y Schmidt [10] probaron que la inecuaci´on
|α − ξ| ≤ cH(ξ)−2
posee infinitas soluciones en enteros algebraicos ξ de grado como mucho 2 para
alguna constante c = c(α), si α es irracional. Adem´as, el exponente es ´optimo si α
es irracional cuadratico. Para el caso d = 3, probaron que si α no es algebraico de
grado como mucho 2, entonces la inecuaci´on
|α − ξ| ≤ cH(ξ)−(3+
√
5)/2
posee infinitas soluciones con ξ entero algebraico de grado como mucho 3. Pasaron
m´
as de 30 a˜
nos hasta que en 2003 Roy [24] construyo un numero trascendente real
α y una constantes c > 0 tal que
|α − ξ| ≥ cH(xi)−(3+
√
5)/2
para todo entero algebraico ξ de grado como mucho 3.
3. La version p-adica del Teorema del Subespacio
Al igual que para el Teorema de Roth, existe una version p-´adica del Teorema
del Subespacio. Esta fue probada por Schlickewei [27], [28].
Teorema 4.5 (Schlickewei). Sea n ≥ 2,X = (X1 , . . . , Xn ), p1 , . . . , ps finitos
n´
umeros primos distintos y tomemos una extensi´
on de cada valor absoluto p-adico
a Q. Sean L1,∞ (X), . . . , Ln,∞ (X) formas lineales linealmente independientes, con
coeficientes algebraicos. Para cada primo pj sean L1,pj (X), . . . , Ln,pj (X) formas
lineales linealmente independientes, con coeficientes algebraicos. Dado ε > 0, entonces existe un n´
umero finito de subespacios lineales propios T1 , . . . , Th de Qn tal
que el conjunto de soluciones de
(4.9)
|L1,∞ (x) · · · Ln,∞ (x)|
s
Y
−ε
|L1,pj (x) · · · Ln,pj (x)|pj < kxk
x ∈ Zn ,
j=1
esta contenido en T1 ∪ · · · ∪ Th .
La siguiente generalizaci´
on del Teorema del Subespacio es debida a Vojta y ser´a
u
´til en algunas aplicaciones. Sean L1 , . . . , Lr formas lineales con coeficientes en C en
variables X1 , . . . , Xn , con r ≥ n. Diremos que L1 , . . . , Lr , estan en posici´on general
si cada subconjunto de cardinal ≤ n de {L1 , . . . , Lr } es linealmente independiente.
Teorema 4.6. Ses S un conjunto finito de primos, incluyendo p = ∞ y
tomemos una extensi´
on de cada valor absoluto p-adico a Q. Para cada p ∈ S
sea rp ≥ n y sean L1,p (X), . . . , Lrp ,p (X) formas lineales en las variables X =
(X1 , . . . , Xn ), en posici´
on general, con coeficientes algebraicos. Sea C > 0 y ε > 0,
entonces existe un n´
umero finito de subespacios lineales propios T1 , . . . , Th de Qn
56
4. EL TEOREMA DEL SUBESPACIO
tal que el conjunto de soluciones de
(4.10)
Y
r −n−ε
|L1,p (x) · · · Lrp ,p (x)|p < C kxk ∞
x ∈ Zn con mcd(x1 , . . . , xn ) = 1,
p∈S
est´
a contenido en T1 ∪ · · · ∪ Th .
Para probar esta versi´
on del teorema, usaremos el siguiente lema el cual se
deduce a partir de la equivalencia de normas en Cn .
Lema 12. Sean M1 , . . . , Mn formas lineales linealmente independientes en las
variables X1 , . . . , Xn con coeficientes complejos. Entonces existe una constante
C > 0 tal que
kxk ≤ C max {|M1 (x)|, . . . , |Mn (x)|} para todo x ∈ Cn .
´ n del Teorema. Partimos al conjunto de soluciones x ∈ Zn
Demostracio
de (4.10) en un n´
umero finito de clases dependiendo en cuales de las n cantidades
sobre |L1,p (x)|p · · · |Lrp ,p (x)|p para cada p ∈ S. Ser´a suficiente probar que las
soluciones en cada una de estas clases pertenece a un n´
umero finito de subespacios
lineales propios de Qn .
Sin p´erdida de generalidad, consideremos las soluciones x ∈ Zn de (4.10) para
las cuales |L1,p (x)|p · · · |Ln,p (x)|p son los menores entre |L1,p (x)|p · · · |Lrp ,p (x)|p
para cada p ∈ S.
Por el lema anterior, para i = n + 1, . . . , r∞ , dado que L1,∞ , . . . , Ln−1,∞ , Li,∞
son linealmente independientes, existe una constante Ci > 0 tal que para todas las
soluciones x consideradas,
(4.11)
kxk ≤ Ci max {|L1,∞ (x)|∞ , . . . , |Ln−1,∞ (x)|∞ , |Li,∞ (x)|∞ } = Ci |Li,∞ (x)|∞ .
Sea ahora p ∈ S, p 6= ∞. Dado que solo estamos considerando soluciones para las
cuales el mcd es igual a 1, para cada soluci´on x = (x1 , . . . , xn ) en consideraci´on,
existe un ´ındice k para el cual |xk |p = 1. Para cada i = n + 1, . . . , rp , como
L1,p , . . . , Ln−1,p , Li,p son linealmente independientes, general al espacio de formas
lineales en Q, se tiene que existen constantes α1 , . . . , αn tal que
Xk = α1 L1,p + . . . + αn−1 Ln−1,p + αn Li,p .
Por la desigualdad triangular fuerte, obtenemos
(4.12)
1 = |xk |p ≤ max |αj |p |Lj,p (x)|p ≤ Ci,p |Li,p (x)|p
j=1,...,n
para alguna constante Ci,p . Juntando (4.11), (4.12) con (4.10) obtenemos
Y
|L1,∞ (x) · · · Ln,∞ (x)|∞
|L1,p (x) · · · Ln,p (x)|p ≤
p∈S,p6=∞
C 0 |L1,∞ (x) · · · Ln,∞ (x)|∞ .
|Ln+1,∞ (x)|∞
|Lr∞ ,∞ (x)|∞
...
kxk
kxk
r∞ −n−ε
≤ C.C 0 kxk
. kxk
−(r∞ −n)
Y
p∈S,p6=∞
e kxk−ε .
=C
|L1,p (x) · · · Lrp ,p (x)|p
´
4. SOBRE LA COMPLEJIDAD DE NUMEROS
ALGEBRAICOS
57
Por lo tanto, por el Teorema del Subespacio p-´adico, los x en consideraci´on
pertenecen a finitos subespacios lineales propios de Qn .
Utilizaremos esta versi´
on del Teorema para probar la finitud de las soluciones
de la ecuaci´
on de Thue-Mahler.
Teorema 4.7 (Mahler, 1933). Sea F (X, Y ) ∈ Z[X, Y ] un polinomio homog´eneo
libre de cuadrados de grado n ≥ 3 y sean p1 , . . . , ps . Entonces la ecuaci´
on
(4.13)
|F (x, y)| = pz11 . . . pzss en x, y, z1 , . . . , zs ∈ Z con mcd(x, y) = 1,
posee finitas soluciones.
En la prueba del teorema utilizaremos el siguiente lema, que es una consecuencias sencilla de la formula del producto en Q.
Lema 13. Sea u ∈ Q. Entonces u = ±pz11 . . . pzss para ciertos enteros z1 , . . . , zs
si y solo si |u|.|u|p1 . . . |u|ps = 1.
´ n. Si F (1, 0) 6= 0 entonces F se factoriza de la forma a0 (X − α1 Y ) . . . (X − αn Y )
Demostracio
con α1 , . . . , αn distintos, mientras que si F (1, 0) = 0, F se factoriza como a0 Y (X − α1 Y ) . . . (X − αn−1 Y )
con α1 , . . . , αn−1 distintos. En ambos casos, F es el producto de n formas lineales
en dos variables en posici´
on general.
Sea ε tal que 0 < ε < n − 2. Entonces por el lema anterior, para cada soluci´on
(x, y, z1 , . . . , zs ) de (4.13) se tendr´a que
Qs
n−2−ε
|F (x, y)| . j=1 |F (x, y)|pj = 1 ≤ max {|x|, |y|}
.
Por teorema (subespa p adico), el conjunto de soluciones (x, y) ∈ Z2 de est´a desigualdad esta contenido en la uni´on de finitos subespacios uno dimensionales de
Q2 . Cada uno de estos subespacios contiene solo dos soluciones con mcd(x, y) = 1.
Por lo tanto, (4.13) posee finitas soluciones.
4. Sobre la complejidad de n´
umeros algebraicos
Vimos en el cap´ıtulo anterior, como utilizar el teorema de Roth para obtener
informaci´
on sobre el desarrollo decimal de n´
umeros algebraicos y resultados de
trascendencia. En 2004, Adamczewski, Bugeaud y F.Luca [2], aplicaron la version p-adica del Teorema del Subespacio para obtener un criterio combinatorio de
trascendencia. Luego Adamczewski y Bugeaud aplicaron este criterio para obtener
informaci´
on sobre la complejidad de n´
umeros algebraicos.
Teorema 4.8. Sea b un n´
umero entero b ≥ 2. Sea α ∈ R y sea 0, a1 a2 a3 . . .
el desarrollo de α en base b. Supongamos que existe un n´
umero real positivo ε y
infinitas 3-uplas de n´
umeros enteros positivos (j, k, l) tal que
(4.14)
aj+i = aj+k+i , i = 1, . . . , l,
y
(4.15)
l ≥ ε (j + k) , l ≤ k
entonces α es o bien racional o trascendente.
Lo que nos est´
an diciendo las hip´otesis del teorema es que existen bloques de
tama˜
no l arbitrariamente grande, que ocurren dos veces muy cerca del inicio del
desarrollo b-ario de α.
58
4. EL TEOREMA DEL SUBESPACIO
´ n. Para hacer la notaci´on m´as sencilla, asumamos que α ∈
Demostracio
(0, 1). Observemos que dentro de todas las uplas (j, k, l) que cumplen (4.14), (4.15),
los k’s son no acotados. Si lo fueran, los l’s tambi´en lo serian por (4.15) y por (4.14)
los j’s tambi´en, contradiciendo el hecho de que hay infinitas uplas. Sea entonces
(j1 , k1 , l1 ) , (j2 , k2 , l2 ) , . . . una sucesi´on infinita de 3-uplas de enteros positivos que
satisfacen (4.14), (4.15) y k1 < k2 < . . ., km → ∞.
Supondremos que α es algebraico y veamos que de hecho es racional. Definamos
el n´
umero racional
αm = a1 a2 . . . ajm ajm+1 . . . ajm +km ajm+1 . . . ajm +km ajm+1 . . . ajm +km . . .
con pre-periodo a1 a2 . . . ajm y periodo ajm+1 . . . ajm +km . A partir de un c´alculo
directo con la serie que define la expresi´on b-aria de αm , obtenemos que existe un
entero pm tal que
αm =
pm
.
bjm (bkm −1)
Por (4.14) tenemos que
α = a1 a2 . . . ajm ajm+1 . . . ajm +km ajm+1 . . . ajm +lm . . .,
con lo cual α y αm tienen, al menos los primeros jm + km + lm digitos en com´
un.
Luego
1
pm
| < jm +km +lm .
(4.16)
|α − αm | = |α − jm km
b (b − 1)
b
Multiplicando por bjm (bkm − 1) y usando (4.15), obtenemos que
−lm /(jm +km )
−ε
(4.17)
|bjm +km α − bjm α − pm | < bjm +km
≤ bjm +km
.
Definamos ahora la informaci´on para aplicar el teorema del subespacio. Consideremos las formas lineales linealmente independientes con coeficientes reales algebraicos:
L1,∞ (X) = X1 , L1,∞ (X) = X2 , L1,∞ (X) = αX1 − αX2 − X3 .
Sea S el conjunto de primos que dividen a b. Para cada primo p ∈ S, consideremos
la formas lineales, linealmente independientes con coeficientes enteros
L1,p (X) = X1 , L1,p (X) = X2 , L1,p (X) = X3
A partir de la f´
ormula del producto y (4.17) obtenemos que para x = bjm +km , bjm , pm ,
3
Y
i=1
|Li,∞ (x)|.
3
YY
|Li,p (x)|p ≤ |bjm +km α − bjm α − pm | ≤ bjm +km
−ε
≤ kxk
−ε
p∈S i=1
Por lo tanto, por el Teorema del Subespacio, el conjunto de uplas bjm +km , bjm , pm ,
m ≥ 1, esta contenido en una uni´on finita de subespacios lineales propios de Q3 .
Luego infinitas uplas pertenecen a alguno de estos subespacios. Llamemos a ese
subespacio T . Sean z1 , z2 , z3 enteros tal que la forma lineal z1 X1 + z2 X2 + z3 X3 se
anula ´ıntegramente en T , entonces
z1 bjm +km + z2 bjm + z3 pm = 0,
para infinitos m. Dividiendo por bjm (bkm − 1) obtenemos que
´
4. SOBRE LA COMPLEJIDAD DE NUMEROS
ALGEBRAICOS
59
km
z1 (bkbm −1) + z2 bkm1−1 + z3 αm = 0.
Si hacemos tender m a infinito, dado que ten´ıamos km → ∞ y αm → α por (4.16)
obtenemos
z1 + z3 α = 0,
es decir, α ∈ Q como quer´ıamos ver.
Sea b ≥ 2 un n´
umero entero, entonces la expresi´on b-adica de cualquier n´
umero
racional es eventualmente peri´odica. Si α es un n´
umero algebraico de grado > 1,
poco se sabe sobre la expresi´on b-adica de dicho n´
umero. Desde los trabajos de
Borel [8], se cree que los n´
umeros algebraicos comparten la misma propiedad que
casi todos los n´
umeros reales. Recordemos que un n´
umero real α se dice normal
en base b, si para todo entero positivo n, cualquier combinaci´on de longitud n a
partir de los d´ıgitos {0, 1, . . . , b − 1} ocurre en el desarrollo b-ario de α con igual
frecuencia, es decir 1/bn . Muy poco se sabe sobre este tema, por ejemplo,√ni siquiera
se sabe si el digito 7 aparece infinitas veces en el desarrollo decimal de 2.
Una posible forma de medir la complejidad de la expresi´on de un n´
umero irracional en base b es la complejidad por bloques. Sea α un n´
umero real, b ≥ 2
un entero, y n un entero positivo. Notaremos por p(n, α, b) la cantidad de bloques
distintos de longitud n que aparecen en la expresi´on b-adica de α, es decir,
p(n, α, b) = | {ak ak+1 . . . ak+n−1 |k = 1, 2, . . .} |.
Obviamente se tiene que 1 ≤ p(n, α, b) ≤ bn
En [1] se prueba una versi´on similar al siguiente lema combinatorio
Lema 14. Sea α un n´
umero real y b ≥ 2 un entero. Supongamos que la funci´
on
de complejidad p(n, α, b) cumple que
p(n, α, b)
lim inf
< ∞.
n→∞
n
Entonces existe ε > 0 e infinitas uplas (j, k, l) que cumplen (4.14) y (4.15).
Combinando esto con el resultado anterior, se obtiene el siguiente teorema
Teorema 4.9 (Adamczewski y Bugeaud, 2007). Si α es un n´
umero algebraico
irracional real, entonces
p(n, α, b)
=∞
lim
n→∞
n
De hecho el resultado es m´as fuerte que el reci´en enunciado. En el mismo
trabajo, tambi´en se prueban resultado similares sobre complejidad del desarrollo
de Hensel de n´
umeros p-´
adicos y un criterio de trascendencia para n´
umeros p-´adicos.
APPENDIX A
Alturas
Recordar que un valor absoluto sobre un cuerpo K es una funci´on real
| | : K → [0, ∞)
que cumple las siguientes 3 propiedades
1: |x| = 0 ⇔ x = 0.
2: |xy| = |x||y|.
3: |x + y| ≤ |x| + |y|.
El valor absoluto se dir´
a no-arquimediano si cumple la condici´on m´as fuerte
3’: |x + y| ≤ max {|x|, |y|}.
Si 30 falla para alg´
un valor de x,y ∈ K se dice que el valor absoluto es Arquimediano.
El valor absoluto usual sobre Q es un valor absoluto arquimediano. Para cada
n´
umero primo p hay un valor absoluto no-arquimediano asociado. Para cada x ∈ Q,
sea ordp (x) el u
´nico entero tal que x se escribe de la forma
x = pordp (x) . ab con a, b ∈ Z y p 6 |ab.
(Si x = 0, definimos ordp (x) = ∞ por convenci´on.) Se define el valor absoluto
p-adico como
|x|p = p−ordp (x) .
El conjunto de valores absolutos est´andar sobre Q ser´a notado por MQ , el cual
consistir´
a en el valor absoluto arquimediano | |∞ y los valores absolutos p-adicos
| |p para cada n´
umero primo p.
El conjunto de valores absolutos est´andar sobre un cuerpo de n´
umeros K ser´a
el conjunto MK que consiste de los valores absolutos sobre K cuya restricci´on a Q
∞
pertenece a MQ . Notaremos por MK
al conjunto de valores absolutos arquimedi0
anos en MK y similarmente MK al conjunto de valores absolutos no-arquimedianos
en K.
Para simplificar la notaci´
on, notaremos al valor absoluto υ ∈ MK como | |υ .
Sea K 0 /K una estensi´
on de cuerpos de n´
umeros y sean υ ∈ MK , ω ∈ MK 0
valores absolutos. Diremos que ω divide a υ(o que ω esta sobre υ) y notaremos ω|υ
si la restriccion de ω a K es υ. Para cada valor absoluto υ sobre K, notaremos Kυ
a la completacion de K respecto de υ. Sobre Q tenemos que Qυ = R si υ = ∞ es
el valor absoluto arquimediano y Qυ = Qp si υ es el valor absoluto p-adico.
´ n 5. Sea K 0 /K una estensi´
Proposicio
on de cuerpos de n´
umeros y sean υ ∈
MK . Entonces
X
[Kω0 : Kυ ] = [K 0 : K]
ω∈MK 0 ,ω|υ
´ n 6. Sea υ ∈ MK un valor absoluto sobre un cuerpo de n´
Definicio
umeros K.
Se define el grado local de υ como el n´
umero
61
62
A. ALTURAS
nυ = [Kυ : Qυ ].
El valor absoluto normalizado asociado a υ ser´
a
kxkυ = |x|nυ υ .
´ n 6. Sea K un cuerpo de n´
Proposicio
umeros y sea x ∈ K ∗ . Entonces
Y
kxkυ = 1.
υ∈MK
´ n 7. Sea α ∈ K, definiremos la altura (multiplicativa) relativa a K
Definicio
como
Q
HK (α) = υ∈MK max {kxkυ , 1}.
La altura (logaritmica) relativa a K como
hK (α) = log HK (α)
´ n 8. Sea α ∈ Q, se define la altura absoluta (multiplicativa) de α
Definicio
como
H(α) = HK (α)1/[K:Q] ,
donde K es un cuerpo de n´
umeros que contiene a α. La altura absoluta(logaritmica)
ser´
a
1
h(α) = log H(α) = [K:Q]
hK (α).
P
´ n 9. Sea f = i∈I ai xi un polinomio en varias variables sobre un
Definicio
cuerpo de n´
umeros K. Se define la norma de Gauss de f respecto al valor absoluto
υ como
|f |υ = maxi∈I |ai |υ
Definimos la altura (proyectiva) relativa a K y absoluta de f como
Q
HK (f ) = υ∈MK |f |nυ υ y hK (f ) = log HK (f )
y
X
Y
1
nυ log |f |υ .
H(f ) =
|f |nυ υ /[K:Q] y h(f ) = log H(f ) =
[K : Q]
υ∈MK
υ∈MK
Lema 15 (Lema de Gauss). Sea f1 , . . . , fr polinomios sobre K, entonces
|f1 . . . fr |υ = |f1 |υ . . . |fr |υ para todo valor absoluto no-arquimediano υ
´ n 7 (Desigualdad de Gelfand). Sean f1 , . . . , fr ∈ C[X1 , . . . , Xm ].
Proposicio
Entonces
Qr
d1 +...+dm
|f1 . . . . .fr |,
i=1 |fi | ≤ 2
para todo valor absoluto arquimediano, donde grXj (f1 . . . . .fr ) ≤ dj . En particular
se tiene que
r
Y
H(fi ) ≤ 2d1 +...+dm .H(f1 . . . . .fr ).
i=1
Bibliograf´ıa
[1] B. Adamczewski and Y. Bugeaud, On the complexity of algebraic numbers. I. Expansions in
integer bases, Ann. of Math. (2) 165 (2007), no. 2, 547–565. MR2299740 (2008a:11130)
[2] B. Adamczewski, Y. Bugeaud and F. Luca, Sur la complexit´
e des nombres alg´
ebriques, C. R.
Math. Acad. Sci. Paris 339 (2004), no. 1, 11–14. MR2075225 (2005g:11033)
[3] A. Baker, Transcendental number theory, Cambridge Univ. Press, London, 1975. MR0422171
(54 #10163)
[4] E. Bombieri and W. Gubler, Heights in Diophantine geometry, New Mathematical Monographs, 4, Cambridge Univ. Press, Cambridge, 2006. MR2216774 (2007a:11092)
[5] E. Bombieri and A. J. van der Poorten, Some quantitative results related to Roth’s theorem,
J. Austral. Math. Soc. Ser. A 45 (1988), no. 2, 233–248. MR0951583 (89i:11075)
[6] E. Bombieri, On the Thue-Siegel-Dyson theorem, Acta Math. 148 (1982), 255–296.
MR0666113 (83m:10052)
[7] E. Bombieri, D. C. Hunt and A. J. van der Poorten, Determinants in the study of Thue’s
method and curves with prescribed singularities, Experiment. Math. 4 (1995), no. 2, 87–96.
MR1377411 (97b:11092)
√
´ Borel, Sur les chiffres d´
[8] E.
ecimaux de 2 et divers probl`
emes de probabilit´
es en chaˆıne, C.
R. Acad. Sci. Paris 230 (1950), 591–593. MR0034544 (11,605d)
[9] H. Davenport and W. M. Schmidt, Approximation to real numbers by quadratic irrationals,
Acta Arith. 13 (1967/1968), 169–176. MR0219476 (36 #2558)
[10] H. Davenport and W. M. Schmidt, Approximation to real numbers by algebraic integers,
Acta Arith. 15 (1968/1969), 393–416. MR0246822 (40 #91)
[11] F. J. Dyson, The approximation to algebraic numbers by rationals, Acta Math. 79 (1947),
225–240. MR0023854 (9,412h)
[12] B. Edixhoven and J.-H. Evertse (eds), Diophantine approximation and abelian varieties,
Lecture Notes in Mathematics, 1566, Springer, Berlin, 1993. MR1288998 (95g:11061)
[13] S. Ferenczi and C. Mauduit, Transcendence of numbers with a low complexity expansion, J.
Number Theory 67 (1997), no. 2, 146–161. MR1486494 (98m:11079)
[14] A. O. Gelfond, Transcendental and algebraic numbers, Translated from the first Russian
edition by Leo F. Boron, Dover, New York, 1960. MR0111736 (22 #2598)
[15] M. Hindry and J. H. Silverman, Diophantine geometry, Graduate Texts in Mathematics, 201,
Springer, New York, 2000. MR1745599 (2001e:11058)
[16] K. Mahler, Lectures on diophantine approximations. Part I, Prepared from the notes by R.
P. Bambah of my lectures given at the University of Notre Dame in the Fall of 1957, Univ.
Notre Dame Press, Notre Dame, Ind, 1961. MR0142509 (26 #78)
[17] K. Mahler, Zur Approximation algebraischer Zahlen. I, Math. Ann. 107 (1933), no. 1, 691–
730. MR1512822
[18] S. Lang, Fundamentals of Diophantine geometry, Springer, New York, 1983. MR0715605
(85j:11005)
[19] W. J. LeVeque, Topics in number theory. Vols. 1 and 2, Addison-Wesley Publishing Co.,
Inc., Reading, MA, 1956. MR0080682 (18,283d)
[20] C. J. Parry, The p-adic generalisation of the Thue-Siegel theorem, Acta Math. 83 (1950),
1–100. MR0037875 (12,320d)
[21] D. Ridout, Rational approximations to algebraic numbers, Mathematika 4 (1957), 125–131.
MR0093508 (20 #32)
[22] D. Ridout, The p-adic generalization of the Thue-Siegel-Roth theorem, Mathematika 5 (1958),
40–48. MR0097382 (20 #3851)
63
64
BIBLIOGRAF´IA
[23] K. F. Roth, Rational approximations to algebraic numbers, Mathematika 2 (1955), 1–20;
corrigendum, 168. MR0072182 (17,242d)
[24] D. Roy, Approximation to real numbers by cubic algebraic integers. II, Ann. of Math. (2)
158 (2003), no. 3, 1081–1087. MR2031862 (2004k:11110)
[25] C. Siegel, Approximation algebraischer Zahlen, Math. Z. 10 (1921), no. 3-4, 173–213.
MR1544471
[26] J. H. Silverman, The arithmetic of elliptic curves, Graduate Texts in Mathematics, 106,
Springer, New York, 1986. MR0817210 (87g:11070)
[27] H. P. Schlickewei, Die p-adische Verallgemeinerung des Satzes von Thue-Siegel-Roth-Schmidt,
J. Reine Angew. Math. 288 (1976), 86–105. MR0422166 (54 #10158)
[28] H. P. Schlickewei, On products of special linear forms with algebraic coefficients, Acta Arith.
31 (1976), no. 4, 389–398. MR0429784 (55 #2794)
[29] W. M. Schmidt, Diophantine approximation, Lecture Notes in Mathematics, 785, Springer,
Berlin, 1980. MR0568710 (81j:10038)
[30] W. M. Schmidt, Simultaneous approximation to algebraic numbers by rationals, Acta Math.
125 (1970), 189–201. MR0268129 (42 #3028)
¨
[31] T. Schneider, Uber
die Approximation algebraischer Zahlen, Journal f¨
ur die reine und angewandte Mathematik 175 (1936): 182–192.
¨
[32] A. Thue, Uber
Ann¨
aherungswerte algebraischer Zahlen, J.reine angew. Math. 135 (1909),
284–305.
[33] P. Vojta, A refinement of Schmidt’s subspace theorem, Amer. J. Math. 111 (1989), no. 3,
489–518. MR1002010 (90f:11054)
[34] M. Waldschmidt, Diophantine equations and transcendental methods(written by Noriko Hirata). In Transcendental numbers and related topics, RIMS Kokyuroku, Kyoto, 599 (1986),
no. 8,82–94.
[35] E. A. Wirsing, On approximations of algebraic numbers by algebraic numbers of bounded degree, in 1969 Number Theory Institute (Proc. Sympos. Pure Math., Vol. XX, State Univ. New
York, Stony Brook, N.Y., 1969), 213–247, Amer. Math. Soc., Providence, RI. MR0319929
(47 #8470)