UNIVERSIDAD DE BUENOS AIRES Facultad de Ciencias Exactas y Naturales Departamento de Matem´ atica Tesis de Licenciatura El Teorema de Roth Juan Manuel Menconi Director: Rom´ an Sasyk Marzo 2015 ´Indice Introducci´ on iii Cap´ıtulo 1. El camino hacia el teorema de Roth 1. Los teoremas de Dirichlet y Liouville 2. El trabajo de Thue 3. Teorema de Roth y generalizaciones 1 1 5 10 Cap´ıtulo 2. El Teorema de Roth 1. Comentarios sobre el enunciado del teorema de Roth 2. Reducci´ on a aproximaciones simultaneas de enteros algebraicos 3. Preliminares 4. Construcci´ on del polinomio auxiliar 5. El indice es grande 6. Lema de Roth 7. Prueba del teorema de Roth 13 13 15 17 23 25 30 38 Cap´ıtulo 3. Aplicaciones 1. Sobre el desarrollo decimal de n´ umeros algebraicos 2. El problema de Waring 3. Ecuaciones Diof´ anticas 41 41 42 43 Cap´ıtulo 4. El Teorema del Subespacio 1. El Teorema del Subespacio 2. Aproximaciones Simultaneas y Algebraicas de grado acotado 3. La version p-adica del Teorema del Subespacio 4. Sobre la complejidad de n´ umeros algebraicos 51 51 53 55 57 Appendix A. Alturas 61 Bibliograf´ıa 63 Appendix. i Introducci´ on Una de las preguntas b´ asicas de la Teor´ıa de Aproximaciones Diof´anticas es investigar las aproximaciones racionales a un n´ umero real. Uno de los principales objetivos de esta teor´ıa es comparar, por un lado, la distancia entre un n´ umero real α y un n´ umero racional p/q, y por el otro, el denominador q de la aproximaci´on. Mientras m´ as chico sea |α − p/q| en comparaci´on con q, se dir´a que la aproximaci´on racional ser´ a mejor. En 1844, Liouville fue el primero en observar que en el caso de n´ umeros algebraicos, no se podr´an conseguir aproximaciones racionales tan buenas como uno desee; si α es un n´ umero algebraico de grado d ≥ 2, existir´a una constante positiva C, que solo depende de α, tal que α − pq ≥ qCd para todo n´ umero racional p/q, con q > 01. En 1909, una mejora notable en el Teorema de Liouville fue obtenida por el matem´ atico noruego Axel Thue, durante su investigaci´on sobre la finitud del conjunto de soluciones de ciertas ecuaciones Diof´anticas. Thue prob´o que si α es un n´ umero algebraico de grado d ≥ 2, para todo k > d/2 + 1 existe una constante C(α, k) > 0, tal que C(α,k) α − pq ≥ qk para todo n´ umero racional p/q, con q > 0. Como consecuencia de este resultado, Thue prob´ o que la Ecuaci´ on de Thue F (X, Y ) = m, con F ∈ Z[X, Y ] un polinomio homog´eneo de grado d con al menos 3 factores lineales sobre C no proporcionales, posee finitas soluciones enteras x, y, para toda constantes fija no nula m. Luego del trabajo de matem´aticos como Siegel, Dyson, Gelfond, Schneider y Mahler, en 1955 Roth prob´ o que la proposici´on anterior sigue siendo valida para k > 2. Una forma equivalente y quiz´as mas cl´asica de enunciar este teorema es la siguiente; si α es un n´ umero algebraico de grado d ≥ 2, para todo ε > 0 la inecuaci´ on α − p ≤ 1 (0.1) q q d+ε posee finitas soluciones racionales p/q, con q > 0. A partir de un resultado cl´asico de Dirichlet2, el resultado de Roth es esencialmente el mejor posible. 1Gracias a este resultado, Liouville fue capaz de probar la existencia de n´ umeros trascendentes. 2Si se toma ε = 0, existen infinitas soluciones racionales iii iv ´ INTRODUCCION Desde los trabajos de Siegel, este resultado ha pasado por varias mejoras sucesivas. Desde la extensi´ on a aproximaciones en un cuerpo de n´ umeros K, a la consideraci´ on de valores absolutos p-´adicos. En este trabajo estudiaremos el teorema de Roth bajo estas generalizaciones y algunas de sus respectivas aplicaciones, entre otras cosas, a la teor´ıa de ecuaciones diof´anticas. La exposici´ on aqu´ı presentada seguir´a la dada en el libro de Hindry y Silverman [15], con ligeras modificaciones, que nos permitir´an llegar a un resultado m´as general, como el presentado en los libros de Lang [18] y Bombieri y Gubler [4]. CAP´ITULO 1 El camino hacia el teorema de Roth 1. Los teoremas de Dirichlet y Liouville Uno de los problemas fundamentales en la teor´ıa de Aproximaciones Diof´anticas consiste en comprender que tan bien se puede aproximar a un n´ umero real por medio de n´ umeros racionales o m´ as generalmente n´ umeros algebraicos. La completitud de na Q en R nos asegura que si α ∈ R, la diferencia |α − pq | puede hacerse tan peque˜ como queramos para alg´ un pq adecuado. Si bien esta respuesta es v´alida, no resulta completamente satisfactoria. Reformulemos nuestra pregunta a tratar de entender con qu´e precisi´ on podemos aproximar a α por medio de racionales, es decir, lograr que esta diferencia sea chica sin que p y q sean muy grandes. Por ejemplo, dado α ∈ R, podemos intentar responder para que valores ε > 0 la inecuaci´on α − pq ≤ q1ε posee infinitas soluciones racionales pq ∈ Q con q > 0. Mientras mayor sea ε, m´ as precisa ser´ a la aproximaci´on. Comprender esta pregunta para un n´ umero real nos permitir´ a establecer si dicho n´ umero es racional o irracional, o si es algebraico o trascendente. T´ecnicas de Aproximaciones Diofanticas han sido aplicadas para resolver problemas de Inecuaciones Diof´anticas, Ecuaciones Diof´anticas, Geometria Diof´ antica y Teor´ıa de Trascendencia, algunos de los cuales mencionaremos en este trabajo. Nuestro objetivo principal ser´a probar el teorema de Roth, cuya versi´on original estableces que si α es un n´ umero algebraico, dado ε > 0 la desigualdad 1 α − pq ≤ q2+ε posee finitas soluciones racionales. Como punto de partida hacia la prueba del teorema de Roth y el estudio de las aproximaciones diof´ anticas, probaremos el siguiente teorema, debido a Dirichlet. Teorema 1.1. Sean α un n´ umero irracional y Q un entero > 1. Entonces existen enteros p y q, con 1 ≤ q ≤ Q tal que 1 . α − pq ≤ qQ ´ n. Consideremos los Q + 1 n´ Demostracio umeros reales qα − [qα] con q = 0, 1, . . . , Q. Como α es irracional, estos son Q + 1 n´ umeros distintos en el intervalo [0, 1]. Dividiendo el intervalo en Q subintervalos de longitud 1/Q, el principio del palomar asegura que podremos encontrar dos enteros 0 ≤ q1 < q2 ≤ Q tal que |(q1 α − [q1 α]) − (q2 α − [q2 α])| ≤ Por lo tanto 1 1 Q. 2 1. EL CAMINO HACIA EL TEOREMA DE ROTH [q2 α]−[q1 α] q2 −q1 − α ≤ 1 (q2 −q1 )Q . Tomamos entonces, p = [q2 α] − [q1 α] y q = q2 − q1 ≤ Q. Corolario 1. 1Sea α ∈ R irracional. Entonces la inecuaci´ on α − p ≤ 1 (1.1) q q2 posee infinitas soluciones p q con q > 0. ´ n. Tomemos por ejemplo Q = 2 en el teorema anterior, entonces Demostracio existen enteros p y q, con 1 ≤ q ≤ Q tal que |α − p/q| ≤ 1/qQ, en particular |α − p/q| ≤ 1/q 2 . Como α es irracional, |α − p/q| = 6 0 con lo cual existe Q0 > 1 tal 0 que 1/Q < |α − p/q|. Volviendo a aplicar el teorema para Q0 obtenemos un nuevo racional p0 /q 0 que aproxima de la misma forma y es distinto de p/q pues |α − p0 /q 0 | ≤ 1/(q 0 Q0 ) ≤ 1/Q0 < |α − p/q|. Repitiendo esto sucesivamente, obtenemos el resultado deseado. ´ n 1. Este corolario fue mejorado por Hurwitz. Observacio Teorema 1.2 (Hurwitz 1891). Sea α ∈ R irracional entonces existen infinitos n´ umeros racionales pq con q > 0 que cumplen |α − pq | < √1 . 5q 2 √ Hurwitz adem´ as prob´ o que para α = 21 ( 5 − 1), esta constante es optima, es √ decir, no podemos tomar una constante mayor a 5 en el denominador2. Observar, que el Corolario 1 resulta falso si α es racional. Pues supongamos que α = a/b, si p/q 6= α, aq − pb ser´a un n´ umero entero no nulo entonces p a p aq − pb 1 (1.2) α − q = b − q = bq ≥ bq . Si p/q cumple adem´ as (1.1), entonces se tendr´a que q ≤ b. Por lo tanto hay finitos racionales que la cumplen. Obtenemos as´ı, una forma de distinguir los n´ umeros racionales de los irracionales en funci´ on de c´ omo pueden ser aproximados. Resumimos este comentario en el siguiente teorema. Teorema 1.3. Sea α ∈ R, entonces α es irracional si y solo si α − pq ≤ q12 posee infinitas soluciones racionales. La observaci´ on hecha en (1.2) puede verse de la siguiente forma. Sea α un n´ umero algebraico de grado 1, es decir, α = a/b un n´ umero racional. Entonces existe una constante c(α) = 1/b tal que 1Este resultado ya hab´ıa sido obtenido por medio de la teor´ıa de Series de Farey y tambi´ en por medio de la teor´ıa de fracciones continuas, principalmente desarrollada por Euler y Lagrange. La nueva demostraci´ on dada por Dirichlet permiti´ o generalizarlo a aproximaciones simultaneas. Ver por ejemplo [29] Capitulo II 2Una prueba de este resultado aparece en [29] Capitulo I. 1. LOS TEOREMAS DE DIRICHLET Y LIOUVILLE α − pq ≥ 1 bq = c(α) q para todo p q 3 6= α. Si consideramos ahora el caso en el que α es un n´ umero cuadr´atico, dado que estos poseen desarrollo en fracci´ on continua peri´odico, se sabe que existe una constante c = c(α) > 0 tal que α − pq ≥ qc2 para todo racional pq . Liouville observ´o que una desigualdad de este estilo era v´alida para n´ umeros algebraicos de grado d y por lo tanto existe un l´ımite para la rapidez con la cual podemos aproximar n´ umeros algebraicos por medio de racionales. Teorema 1.4 (Liouville 1844-51). tonces existe c = c(α) > 0 tal que α − (1.3) para todo racional p q Sea α ∈ R algebraico de grado d ≥ 2, en p c > d q q con q > 0. ´ n. Sea f (x) ∈ Z[x], gr(f ) = d tal que f (α) = 0, es decir, f es un Demostracio m´ ultiplo entero del polinomio minimal de α. Por lo tanto, dado pq ∈ Q, como f es Pd irreducible sobre Q se tiene que f no se anula en pq . Entonces si f (x) = i=0 ai xi , q d f ( pq ) = Pd i=0 ai pi q d−i es un n´ umero entero no nulo y por tanto ≥ 1 lo que implica que |f ( pq )| ≥ 1 qd Si |α − pq | > 1, (1.3) se cumple trivialmente tomando c = 1. Supongamos entonces que |α − pq | ≤ 1. Por medio del desarrollo de Taylor de f (x) alrededor de α se tendr´ a que d d i i−1 p X p p X p f ( ) = bi α − bi α − = α − q q q q i=1 i=1 < α − ! d p X |bi | = α − q i=1 p 0 c q Por lo tanto, 1 qd < α − pq c0 . Tomando c = min(1/c0 , 1) obtenemos (1.3) para todo p/q. ´ n 2. El teorema sigue siendo v´ Observacio alido si α es un n´ umero complejo no real, no necesariamente algebraico, ya que |Im(α)| α − pq ≥ |Im(α)| ≥ qd para cualquier n´ umero racional pq ; donde Im(α) denota la parte imaginaria de α y d es cualquier entero positivo. 4 1. EL CAMINO HACIA EL TEOREMA DE ROTH Liouville obtuvo as´ı una condici´on necesaria que deben cumplir los n´ umeros algebraicos de grado d. Gracias a esto, logro probar la existencia de los n´ umeros trascendentes y dar infinitos3 ejemplos de ellos. Lo que necesitamos es encontrar un n´ umero que no cumpla (1.3) para ninguna constante c > 0 y ning´ un entero d > 0. Dado que estamos pidiendo que esto no se cumpla para ning´ un d > 0 alcanza con tomar c = 1. En definitiva, tenemos el siguiente resultado. Teorema 1.5. Sea α ∈ R y supongamos que para todo entero d > 1 existe un n´ umero racional pq tal que α − pq ≤ q1d . Entonces α resulta trascendente. En funci´ on de lo que queremos, no es dif´ıcil construir un n´ umero que cumpla P 1 esta condici´ on. Consideremos el n´ umero ξ = , conocido como conn≥1 10n! stante de Liouville. Dicho n´ umero es trascendente pues sea d > 1 y tomamos Pd p = 10d! n≥1 101n! y q = 10d! entonces X ∞ 1 1 1 1 9 1 1 1 1 ξ − p = < (d+1)! + + 2 ... = < (d+1)! < d . (d+1)! q 10n! 1 10 10 10 q 10 10 10 n>d M´ as en general, ´ n 1. Proposicio X ak es un n´ umero trascendente para todo b ∈ Z, b ≥ 2 y bk! k≥1 1 ≤ ak ≤ b − 1. A partir del teorema de Dirichlet vimos que es posible decidir si un n´ umero es racional o irracional si sabemos para que valores ε > 0 se cumple que la inecuaci´on α − pq < q1ε posee infinitas soluciones racionales pq ∈ Q con q > 0. Resulta entonces natural intentar caracterizar a los n´ umeros irracionales en funci´on del conocimiento de estos exponente. Se define el exponente de aproximaci´on de un n´ umero α, tambi´en llamado medida de irracionalidad, como el menor valor µ(α) para el cual, dado ε > 0, la inecuaci´ on 1 α − pq < qµ(α)+ε posee finitas soluciones racionales pq ∈ Q con q > 0. Si no existe ning´ un µ con esta 4 propiedad, diremos que µ(α) = ∞ . Como consecuencia del teorema de Dirichlet, tenemos que µ(α) ≥ 2 si α es irracional. A partir de (1.2) se tiene que µ(a/b) ≤ 1. De hecho se puede ver que µ( ab ) = 1 pues dado q > 0 entero, la fracci´on de denominador q m´ as cercana a a/b cumple que |a/b − p/q| ≤ 1/2q < 1/q. El teorema de Liouville establece que si α es un n´ umero algebraico de grado d, entonces µ(α) ≤ d. Pues si ε > 0 y p/q es soluci´on a |α − p/q| < 1/q d+ε se tiene que 3De hecho exhibi´ o una cantidad no numerables de n´ umeros trascendentes. La teor´ıa de Cantor sobre cardinalidad y su demostraci´ on de la existencia y no numerabilidad de los n´ umeros trascendentes es 30 a˜ nos posterior al teorema de Liouville. 4Estos n´ umeros suelen llamarse, n´ umeros de Liouville. Los n´ umeros de Proposici´ on 1, y en particular la constantes de Liouville, pertenecen a este conjunto de n´ umeros. 2. EL TRABAJO DE THUE ≤ α − pq < c qd 5 1 . q d+ε Lo que implica que q debe estar acotado, probando asi que µ(α) ≤ d. La primer mejora en el caso de n´ umeros algebraicos fue obtenida por Thue [32] en 1909, quien prob´ o que µ(α) ≤ 12 d+1. El trabajo de Thue es de suma importancia, no solo por sus aplicaciones, sino tambi´en porque su procedimiento para establecer este resulto fue la base para los trabajos subsiguientes en este campo. En 1921 Siegel [25] prob´ o que √ d µ(α) ≤ min s + < 2 d, 5 s∈N s+1 y conjetur´ o que para cualquier n´ umero algebraico, independientemente del grado, deber´ıa valer µ(α) = 2. En √ 1947 Dyson [11] e independientemente Gelfond [14] en 1952 probaron que µ(α) ≤ 2d. La conjetura de Siegel fue finalmente probada en 1955 por Roth [23], trabajo por el cual le fue otorgada la medalla Fields en 1958. Teorema 1.6 (Roth 1955). Sea α un n´ umero real algebraico de grado d ≥ 2. Entonces para todo ε > 0, la desigualdad 1 α − pq < q2+ε posee finitas soluciones racionales p q con q > 0. El teorema de Roth puede formularse de cualquiera de las siguientes formas equivalentes ´ n 2. Sea α un n´ Proposicio umero algebraico real de grado d ≥ 2 entonces son equivalentes: (1) Para todo ε > 0 existe una constante c(α, ε) > 0 tal que |α − pq | > para todo pq ∈ Q, con q > 0; (2) Para todo ε > 0, la desigualdad |α − pq | < c(α,ε) q 2+ε 1 q 2+ε p q posee finitas soluciones ∈ Q y q > 0 (3) Para todo ε > 0, C > 0, la desigualdad C |α − pq | < q2+ε posee finitas soluciones p q ∈ Q y q > 0. 2. El trabajo de Thue Si bien intentar caracterizar los n´ umeros reales por medio de su exponente de aproximaci´ on puede ser considerado una forma de justificar los avances antes mencionados o quizas el hecho de que obtener mejoras en el exponente para la cota de Liouville producir´ıa nuevos ejemplos de n´ umeros trascendentes, se podr´ıa decir que las motivaciones que dieron origen a la b´ usqueda de estas mejoras fueron el estudio de las ecuaciones diof´anticas. Thue observ´o que a una soluci´on entera de una cierta ecuaci´ on diof´ antica se le pod´ıa asociar una muy buena aproximaci´on hacia un n´ umero algebraico definido por dicha ecuaci´on. 5El hecho de que este exponente sea de orden o(d) en lugar de d fue de suma importancia en la prueba de Siegel, del teorema que establece que toda curva de genero g ≥ 1 posee finitas soluciones enteras(al menos para el caso g = 1). 6 1. EL CAMINO HACIA EL TEOREMA DE ROTH Veamos un ejemplo, supongamos que queremos resolver la siguiente ecuaci´on sobre los enteros (1.4) X 3 − Y 3 = 5. Una posible forma de hacerlo es factorizando el polinomio considerado de la siguiente forma (1.5) X 3 − Y 3 = (X − Y )(X 2 + XY + Y 2 ). Si (x, y) es una soluci´ on entera de (1.4), entonces cada uno de los factores de (1.5) resulta ser un n´ umero entero. Dado que en los enteros hay factorizaci´on u ´nica x − y ser´ a igual a alguno de los factores de 5. Por ejemplo, si suponemos que x − y = 5, resulta que x − 5 = y con lo cual x2 + x(x − 5) + (x − 5)2 = 1 obtenemos as´ı una ecuaci´ on de grado 2 a la cual le podemos calcular sus ra´ıces y conseguir as´ı las soluciones a nuestra ecuaci´ on en el caso x − y = 5. Haciendo lo mismo para todos los factores de 5 obtendremos todas las soluciones de la ecuaci´on en cuesti´on. Que sucede ahora si modificamos ligeramente nuestra ecuaci´on por (1.6) X 3 − 2Y 3 = 5. Si intentamos proceder de la misma forma que en el caso anterior encontramos que no podremos factorizar al polinomio X 3 − 2Y 3 sobre Z[X, Y ]. Dado que en el caso anterior estas t´ecnicas funcionaron a la perfecci´on, intentemos hacer lo mismo permitiendo la aparici´ on de coeficientes no necesariamente enteros. Sea ζ una ra´ız cubica de la unidad entonces √ √ √ X 3 − 2Y 3 = X − 3 2Y X − ζ 3 2Y X − ζ 2 3 2Y . Sea ahora (x, y) ∈ Z2 una soluci´on de (1.6), con y 6= 0, entonces √ √ √ 3 3 x x x 2 3 2 2 2 = y53 . − − ζ − ζ y y y √ El segundo y tercer factor de este producto est´an acotados inferiormente pues ζ 3 2 √ 3 y ζ 2 2 son n´ umeros complejos no reales, con lo cual estar´an lejos de cualquier n´ umero racional x/y. Esto nos dice que podremos encontrar una constante C > 0 independiente de (x, y) tal que x √ − 3 2 ≤ C . (1.7) y |y|3 Por lo tanto, toda soluci´ on (x, y) da lugar a una muy √ a nuestra ecuaci´on (1.6), √ 3 buena aproximaci´ on racional de 3 2. Luego, si probamos que 2 no posee infinitas √ 3 aproximaciones de este estilo, es decir, µ( 2) < 3, se tendr´a que nuestra ecuaci´on posee finitas soluciones enteras. √ Por medio de la desigualdad del teorema de Liouville, se obtuvo que µ( 3 2) ≤ 3. Lo√cual no nos ayuda en nada en este caso. Como se dijo, Thue logro probar que µ( 3 2) ≤ 3/2 + 1 = 2, 5 < 3, lo que implica en este ejemplo que (1.7) posee finitas soluciones racionales y por lo tanto nuestra ecuaci´on (1.6) posee finitas soluciones enteras. Antes de seguir con la mejora de Thue del teorema de Liouville, veamos la importancia de este tipo de resultado y c´omo se utiliza para probar la finitud de soluciones de ciertas ecuaciones diof´anticas. Teorema 1.7. Sea F (X, Y ) ∈ Z[X, Y ] un polinomio homog´eneo de grado d con al menos tres factores lineales no proporcionales sobre C. Sea m ∈ Z un entero 2. EL TRABAJO DE THUE 7 fijo no nulo, entonces la ecuaci´ on (1.8) F (X, Y ) = m posee finitas soluciones con x, y ∈ Z. Ecuaciones de este estilo, son llamadas ecuaciones de Thue. ´ n. Asumamos primero que F es irreducible sobre Z[X, Y ] o Demostracio equivalentemente, f (X) = F (X, 1) es irreducible sobre Q[X]. Sea f (X) = a.(X − α1 ).(X − α2 ) . . . (X − αd ), con a ∈ Z , αi ∈ C. Como F (X, Y ) = Y d .f ( X Y ) se obtiene la siguiente descomposici´ on X X m X − α1 . − α2 . . . − αd = d . (1.9) a Y Y Y Y Supongamos que tenemos infinitas soluciones (xn , yn ) de (1.8), podemos adem´as suponer yn 6= 0 pues solo hay finitas soluciones bajo esas condiciones. Se tendr´a entonces que |yn | → ∞ y por lo tanto, tomando a partir de (1.9) obtendremos que, xn yn → αj para algun cero de f (X). Los factores xn yn − αi con i 6= j, resultaran acotados inferiormente para todo n ∈ N. Luego tendremos que xn C yn − αi ≤ |y| d para todo n ∈ N, para alguna constante C > 0. Por el teorema de Thue, sabemos que esto es imposible pues d ≥ 3, llegando as´ı a una contradicci´on. En general, sea F (X, Y ) = a.F1 (X, Y )e1 . . . Fr (X, Y )er , con Fi (X, Y ) los factores no constantes irreducibles en ∈ Z[X, Y ] de F , que resultan homog´eneos, y e1 , . . . , er enteros positivos. Podemos suponer que Y no divide a F pues en ese caso, se tendr´ıa que si (x, y) es soluci´on de la ecuaci´on de Thue, y deber´a ser uno de los finitos divisores de m y como para cada uno de estos hay finitas opciones para x, se tendr´ a que (1.8) en este caso posee finitas soluciones. Toda soluci´ on entera (x, y) de (1.8) resulta soluci´on de un sistema de la forma Fj (X, Y ) = mj para j = 1, . . . , r, con mj divisores de m. Por lo tanto, si asumimos que (1.8) posee infinitas soluciones, dado que hay finitos de estos sistemas, por el principio del palomar alguno de ellos tendr´ a infinitas soluciones. Sean (xn , yn ) infinitas soluciones enteras de uno de estos sistemas, que podemos suponer yn 6= 0. Por el mismo argumento mencionado en el caso anterior tenemos que xynn tiende a alg´ un cero de Fj (Xj , 1) para cada j, y como estos son coprimos entre s´ı, se tendr´a que r = 1. Como F posee al menos tres factores lineales distintos, gr(F1 ) ≥ 3. Por el caso anterior, llegamos a un absurdo pues el sistema F1 (X, Y ) = m1 posee finitas soluciones enteras. 8 1. EL CAMINO HACIA EL TEOREMA DE ROTH Los siguientes ejemplos sencillos muestran que las hip´otesis impuestas sobre f no pueden ser excluidas del enunciado. La ecuaci´on (x + y)n = 1 posee infinitas 2 2 n soluciones para todo n ∈ N; mientras que la ecuaci´ 1 se cumple √ on (x − 2y √) = 2 para los pares (xm , ym ) ∈ Z definidos por xm + 2ym = (3 + 2 2)m con m ∈ Z. Recordemos la demostraci´on de µ(α) ≤ d, a partir del teorema de Liouville, para α un n´ umero algebraico de grado d. Separaremos la demostraci´on en 3 pasos, con el fin de mostrar que dicha estructura se mantiene en las demostraciones de los teoremas de Thue y Roth, como ha sido notado por varios autores. Supongamos que α es un n´ umero algebraico de grado d > 1 y sea k > d tal que 1 p (1.10) α − q < |q|k posee infinitas soluciones racionales. Paso I- Construcci´ on del polinomio auxiliar. Construimos un polinomio no nulo f (X) con coeficientes enteros que tenga a α como ra´ız. En el caso del Teorema de Liouville tomamos f (X) como un m´ ultiplo entero del polinomio minimal de α. Paso II- f se anula en puntos racionales muy cercanos a α. Sea pq un n´ umero racional que cumple (1.10). Como f posee coeficiente enteros se cumple que p N f ( q ) = |q| d con N un n´ umero entero positivo. Por otro lado, via la expresi´on de Taylor de f alrededor de α se obtiene una constante c > 0 tal que p f ( q ) < c α − pq < c |q|1k . Tomando q suficientemente grande, pues suponemos que hay infinitos, y usando que k > d se tendr´ a que N es un n´ umero entero no negativo que cumple 1 N < c |q|k−d < 1. Por lo tanto, si q es suficientemente grande debe ser f ( pq ) = 0. Paso III- El polinomio f , no se anula en un punto racional. Para el polinomio f construido, podremos elegir pq de forma tal que q sea grande, para que siga valiendo II, y pq no sea ra´ız de f . Dado que f un m´ ultiplo del minimal de α, resulta irreducible sobre Q[X], por lo tanto, este paso resulta sumamente sencillo en este caso. A partir del paso II y III obtenemos una contradicci´on, probando as´ı lo que quer´ıamos. Un primer intento de mejorar esto ser´ıa tomar un polinomio distinto, por ejemplo, que tenga a α como ra´ız de multiplicidad m´as grande que 1. Supongamos que tomamos g(X) un polinomio con coeficientes enteros tal que α es ra´ız de multiplicidad l. Como g posee finitas ra´ıces, el paso III seguir´a valiendo si tomamos q suficientemente grandes. En el paso II, por medio de la expresi´on de Taylor alrededor de p/q obtendr´ıamos una cota del estilo l p p N ) = ( < c − α < c |q|1kl , f gr(g) q q |q| para los p/q que cumplen (1.10), con c una constante positiva que depende de g. Por lo tanto, c N < |q|kl−gr(g) . 2. EL TRABAJO DE THUE 9 Podremos asegurar que N = 0, si tomamos q suficientemente grande, para los k que cumplan kl − gr(g) > 0. Queremos entonces que el cociente gr(g) sea lo m´as chico l posible, en particular buscamos que sea menor a d, para que esto sea realmente una mejora. Pero resulta que como α es ra´ız de multiplicidad l de g y este es un polinomio con coeficientes enteros, entonces f l divide a g, con f el polinomio ≥ d. Vemos minimal de α. Por lo tanto debe ser gr(g) ≥ gr(f l ) = ld, es decir, gr(g) l de esta forma que el mejor exponente que podemos conseguir v´ıa este m´etodo es el obtenido por Liouville. Thue tuvo la idea de considerar polinomios en dos variables f (X, Y ) ∈ Z[X, Y ] para mejorar el resultado de Liouville, en particular, utiliz´o polinomios de la forma f (X, Y ) = p(X) + Y q(X). A continuaci´on daremos una breve descripci´on de los pasos para demostrar el teorema de Thue y motivar algunas ideas que usaremos a lo largo de la prueba del teorema de Roth. Sea α algebraico de grado d ≥ 3(pues el caso 2 ya est´ a comprendido) y supongamos que |α − p/q| < q −k posee infinitas soluciones. Paso I- Construcci´ on del polinomio. Thue propuso construir un polinomio f (X, Y ) de la forma antes mencionada tal que h(X) = f (X, α) posea una raiz de multiplicidad grande. La construcci´on es de la siguiente manera. Si el polinomio f (X, Y ) posee grado total r6, habr´a que determinar como mucho 2r + 1 coeficientes. Que h(X) posea un cero de orden s ∂ s−1 f ∂f (α, α) = . . . = ∂X en α es equivalente a que f (α, α) = ∂X s−1 (α, α) = 0. Cada una de estas ecuaciones, terminar´ a siendo una ecuaci´on lineal con los coeficientes de f como inc´ ongnitas y con cuerpo de base Q[α]. Escribiendo cada potencia αn con n ≥ d como combinaci´ on Q lineal de las potencias 1, α, . . . , αd−1 , nuestras ecuaciones se transformaran en una combinaci´on lineal de 1, α, . . . , αd−1 cuyos coeficientes son ecuaciones lineales en nuestras inc´ognitas con coeficientes sobre Q. Por lo tanto, como 1, α, . . . , αd−1 son Q linealmente independientes, cada una de estas s ecuaciones ser´ a equivalente a d ecuaciones lineales sobre Q con inc´ognitas, los coeficientes de f . En total tendremos sd ecuaciones lineales y 2r + 1 inc´ognitas. Podremos obtener una soluci´ on no nula si logramos que sd < 2r + 1, por ejemplo si tomamos r/s ≈ 21 d. Esto sugiere la mejora obtenida por Thue. Paso II- El polinomio se anula en valores racionales cercamos a (α, α). Al igual que en el Teorema de Liouville, tomemos pq una muy buena aproximaci´ on de α y mediante la f´ ormula de Taylor tratemos de llegar a que f ( pq , pq ) = 0. Se tiene que Pr Pr i j f (X, Y ) = i=s bi (X − α) + j=0 cJ (X − α) (Y − α) Nos gustar´ıa llegar a algo del estilo s |f ( pq , pq )| < B α − pq . j El problema de esto es que el aporte de los monomios (X − α) (Y − α) al evaluarlos s en ( pq , pq ), no es semejante al aportado por (X − α) . La forma de Thue para solucionar esto fue tomar dos aproximaciones racionales distintas ( pq11 , pq22 ) de forma tal que q2 ≈ q1s . Por lo tanto pq22 − α < q1k ≈ q1ks que es similar a lo que aporta 2 1 s p1 q1 − α . De esta forma lograremos obtener una desigualdad del estilo 6La mayor de las sumas de las potencias de todos los monomios no nulos. 10 1. EL CAMINO HACIA EL TEOREMA DE ROTH p1 p2 f ( q1 , q2 ) ≤ B , q1sk con B una constante que depende de las coeficientes de f . Mientras que por otro lado tendremos que p1 p2 N . f ( q1 , q2 ) = qrNq2 ≈ qr+s 1 1 Al igual que en el teorema de Liouville llegaremos a que N = 0 y por lo tanto f ( pq11 , pq22 ) = 0, tomando q1 y q2 suficientemente grande si sk − (r + s) > 0 o lo que es lo mismo r/s + 1 < k. Como dijimos que tomar´ıamos r/s ≈ 21 d se obtiene el resultado de Thue, 12 d + 1 < k. Esto ser´a posible si logramos tambi´en tener control sobre la constante B. Esta constante depende del valor las derivadas de f en (α, α) que depender´ a del valor de los coeficientes de f . El polinomio f , se obtuvo a partir de la existencia de soluciones de un sistema de ecuaciones lineales. Para poder tener control sobre el tama˜ no de la soluci´on, Thue us´o un argumento que se basa en el principio del palomar que permite controlar el tama˜ no de la soluci´on en funci´on del tama˜ no de las ecuaciones. Para tener m´as control sobre los coeficientes del sistema ∂if de ecuaciones, por ejemplo, se pueden reemplazar las ecuaciones ∂X i (α, α) = 0 s−1 ∂ f por las ecuaciones i!1 ∂X as chicos, ya que se s−1 (α, α) = 0 que poseen coeficientes m´ efectur´ an simplificaciones. Paso III- El polinomio f no se anula en la aproximaci´on racional ( pq11 , pq22 ). En el teorema de Liouville, este paso resultaba trivial pues un polinomio en una variable posee finitas ra´ıces racionales. Cuando consideramos m´as variables, este paso se vuelve el m´ as dif´ıcil de todos. De hecho no podremos asegurar que f no se anula, sino que una derivada de orden chico no se anula en ( pq11 , pq22 ), es decir, f posee orden de anulaci´ on chico en dicho punto. El resultado del paso II seguir´a siendo v´ alido para las derivadas y se ver´a que el orden de anulaci´on de f en ( pq11 , pq22 ) es grande en comparaci´ on con el orden obtenido en este paso. Llegando as´ı a una contradicci´ on. ∂f Supongamos que tanto f como ∂X se anulan en ( pq11 , pq22 ). Esto significa que P ( pq11 ) + Q( pq11 ) pq22 = 0 P 0 ( pq11 ) + Q0 ( pq11 ) pq22 = 0. Eliminando p2 /q2 de estas ecuaciones obtenemos que P ( pq11 )Q0 ( pq11 ) − P 0 ( pq11 )Q( pq11 ) = 0. Por lo tanto el determinante Wronskiano W (X) = p(X)q 0 (X) − p0 (X)q(X), aparece naturalmente si asumimos que algunas derivadas se anulan. El analisis del tama˜ no de los coeficientes de W nos permitir´a obtener cota para el orden de anulaci´ on de f en la aproximaci´on racional considerada. Siegel trabaj´ o con polinomios en dos variables m´as generales, y lo mismo hicieron Dyson y Gelfond. Ya era sabido que usar polinomios en m´as variables permitir´ıa mejorar el exponente de aproximaci´on. Roth fue capaz de superar las dificultades del paso III cuando se consideraban m´as variables. 3. Teorema de Roth y generalizaciones Como ya ha sido mencionado, el teorema de Roth es el siguiente 3. TEOREMA DE ROTH Y GENERALIZACIONES 11 Teorema 1.8 (Roth 1955). Sea α un n´ umero real algebraico de grado d ≥ 2. Entonces para todo ε > 0, la desigualdad α − p < 1 (1.11) q q 2+ε posee finitas soluciones racionales p q con q > 0. Este teorema puede ser generalizado en diferentes direcciones. Ya en 1920, cuando Siegel [25]√prob´ o que el exponente d/2 + 1 probado por Thue pod´ıa ser reemplazado por 2 d, tambi´en logro generalizar este resultado para la aproximaci´on de un n´ umero algebraico sobre un cuerpo de n´ umeros K. Teorema 1.9 (Siegel 1920). Sea K un cuerpo de n´ umeros y sea α un n´ umero algebraico sobre K de grado d ≥ 2. Entonces para todo ε > 0, la desigualdad |α − β| < Λ(β)21√d+ε posee finitas soluciones con β ∈ K. Donde Λ(β) representa el m´aximo de los valores absolutos de los coeficientes del polinomio irreducible primitivo sobre Z que anula a β. En realidad Sigel prob´o que el exponente d/2+1 pod´ıa ser reemplazado por √ d s(d) = min s + < 2 d. 0≤s≤d s+1 Otro tipo de generalizaci´ on fue hecha por Mahler [17] en 1931 cuando introdujo las aproximaciones diophanticas p-adicas. Teorema 1.10 (Mahler 1932). Sea f (X) un polinomio irreducible de grado d ≥ 3 con coeficientes racionales. Sean p1 , . . . , pn n´ umeros primos distintos, y sean α0 , α1 , . . . , αn respectivamente una raiz real, p1 -adica, . . ., pn -´ adica de f (X). Sea ε > 0 entonces n o n p Y 1 √ min 1, α0 − min 1, |p − qαt |pt ≤ 2 d+ε q t=1 max {|p|, |q|} posee finitas soluciones racionales p/q. √ De hecho, Mahler tambi´en prob´o que el exponente 2 d pod´ıa ser reemplazado por el ya mencionado exponente s(d) del teorema de Siegel. A partir de sus trabajos en aproximaciones p-´ adicas, Mahler obtuvo como resultado la finitud de la cantidad de soluciones de la ecuaci´ on de Thue en S-enteros(enteros cuyos factores primos est´ an restringidos a un conjunto finito de primos S). Mahler tambi´en prob´o la finitud de la llamada ecuaci´ on de Thue-Mahler F (x, y) = pa1 1 . . . pann donde F es un polinomio homog´eneo en Z[x, y] con al menos 3 factores lineales distintos x − αi y, p1 , . . . , pn primos fijos, a ser resuelta en x, y ∈ Z y a1 , . . . , an enteros positivos. La generalizaci´ on del teorema de Thue sobre un cuerpo de n´ umeros K y finitos valores absolutos sobre K fue llevada a cabo por Parry [20] en 1950. El an´alogo del teorema de Roth sobre cuerpos de n´ umeros fue llevado a cabo por LeVeque [19] en 1956 y la generalizaci´ on del teorema de Thue sobre los n´ umeros p-´adicos con el exponente del teorema de Roth, es debida a Ridout[22] en 1958. La formulaci´ on general del teorema de Roth sobre cuerpos de n´ umeros es la siguiente y ser´ a la probada en esta tesis. 12 1. EL CAMINO HACIA EL TEOREMA DE ROTH Teorema 1.11. Sea K un cuerpo de n´ umeros, S ⊂ MK un conjunto finito de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido ¯ Para cada υ ∈ S, sea αυ ∈ K. ¯ Dado ε > 0, extendido de alguna forma a K. entonces existen finitos β ∈ K que satisfacen la inecuaci´ on Y 1 . min {kβ − αυ kυ , 1} ≤ HK (β)2+ε υ∈S Por ejemplo, si tomamos K = Q, S = {| |∞ } el valor absoluto usual sobre Q y α un n´ umero algebraico sobre Q obtenemos que la inecuacion n o 1 min 1, |α − pq | ≤ max{|x|,|y|} 2+ε posee finitas soluciones racionales p/q. Esta versi´on es equivalente a la versi´on cl´ asica del Teorema de Roth anteriormente mencionada. CAP´ITULO 2 El Teorema de Roth 1. Comentarios sobre el enunciado del teorema de Roth Haremos a continuaci´ on algunos comentarios respecto al enunciado del teorema de Roth. Recordemos primero el teorema en cuestion: Teorema 2.1. Sea K un cuerpo de n´ umeros, S ⊂ MK un conjunto finito de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido ¯ Para cada υ ∈ S, sea αυ ∈ K. ¯ Dado ε > 0, extendido de alguna forma a K. entonces existen finitos β ∈ K que satisfacen la inecuaci´ on Y 1 . (2.1) min {kβ − αυ kυ , 1} ≤ HK (β)2+ε υ∈S (1) Podemos reemplazar el lado derecho de (2.1) por C/HK (β)2+ε , con C > 0 una constante fija. Supongamos que β satisface la desigualdad modificada. Entonces si consideramos los β que adem´as cumplen C/HK (β)2+ε/2 ≤ 1 tendremos que Y C C 1 min {kβ − αυ kυ , 1} ≤ = . ≤ 2+ε/2 H (β)2+ε/2 HK (β)2+ε H (β) K K υ∈S 1 , HK (β)2+ε/2 los cuales son finitos por el teorema de Roth. Como solo descartamos un conjunto de β con altura acotada, es decir, un conjunto finito, concluimos que este resultado es equivalente al teorema de Roth. ¯ corre(2) Dado de que toda extensi´on de un valor absoluto υ sobre K a K, ¯ en la completaci´on K¯υ . Podremos ver a los sponde a un embedding de K αυ como elementos de Kυ algebraicos sobre K. En efecto, tendremos la siguiente versi´ on del teorema de Roth. (2.2) Teorema 2.2. Sea K un cuerpo de n´ umeros, S ⊂ MK un conjunto finito de valores absolutos sobre K. Para cada υ ∈ S, sea αυ ∈ Kυ algebraico sobre K. Dado ε > 0, entonces existen finitos β ∈ K que satisfacen la inecuaci´ on Y 1 . min {kβ − αυ kυ , 1} ≤ HK (β)2+ε υ∈S Veamos que este teorema se deduce del teorema de Roth. ¯ una clausura algebraica de K, K ¯ υ una clausura algebraica Sea K de Kυ para cada υ ∈ S y | |υ la extensi´on de υ a Kυ que se extiende ¯ υ . Para cada υ ∈ S sea fυ ∈ K[X] el polinomio de forma u ´nica a K ¯ Como K ¯υ minimal de αυ sobre K. Consideremos α ˜ υ una ra´ız de fυ en K. 13 14 2. EL TEOREMA DE ROTH ¯ υ /K que es algebraicamente cerrado, el embedding συ : K(˜ αυ )/K → K ¯ manda α ˜ υ a αυ , puede ser extendido a K. Consideremos entonces | |0υ la ¯ dada por |x|0 = |συ (x)|υ . Si β ∈ K, entonces extensi´ on de υ a K υ |β − α ˜ υ |0υ = |β − αυ |υ . Por lo tanto, una soluci´on de (2.2) cumple que Y 1 0 , min kβ − α ˜ υ kυ , 1 ≤ HK (β)2+ε υ∈S las cuales sabemos que son finitas por la validez del teorema de Roth. Queda as´ı probada lo enunciado. De una forma similar puede verse que de hecho este enunciado es equivalente al teorema de Roth. (3) Si α y α0 son dos elementos distintos algebraicos sobre K y β se acerca a α respecto de υ, entonces β estar´a lejos de α0 . Por lo tanto, podemos considerar distintos n´ umeros algebraicos para un mismo valor absoluto. (4) No hay raz´ on por la cual no podamos permitirle a β tender a infinito, es decir, podemos tomar αυ = ∞ y reemplazar el termino sin sentido k∞ − βkυ por k1/βkυ . Podemos entonces agregarle a la condici´on de aproximaci´ on del lado izquierdo un producto de la forma Y min {k1/βkυ , 1}. υ∈S Esta versi´ on del teorema se puede reducir a la anterior tomando una transformaci´ on proyectiva T (β) = (aβ + b)/(cβ + d), a, b, c, d ∈ Z, tal que T (αυ ) es siempre finito y aplicando el teorema con T (αυ ) y T (β). Dado que HK (T (β)) >><< H(β). Esto ultimo se debe a partir de las siguientes propiedades de la altura : HK (A) = HK (1/A), HK (A + B) ≤ 2.HK (A)HK (B) y HK (A.B) ≤ HK (A)HK (B); se concluye que ˜ K (β) para alguna constante C. ˜ Esto se debe a que T HK (T (β)) ≤ CH es una composici´ on de traslaciones, rotaciones e inversiones, y en este caso es facil ver la desigualdad. Para probar lo afirmado, consideremos T (z) = az+b z+d a, b, d ∈ Z tal que T (αυ ) 6= ∞ para todo υ ∈ S,es decir, αυ 6= −d. Veremos que para todo υ ∈ S, existe una constante C = Cυ,T > 0 tal que (2.3) min {1, kT (αυ ) − T (β)kυ } ≤ C min {1, kαυ − βkυ } . Para simplificar la notaci´on, lo probaremos para el valor absoluto no normalizado | |υ , pues solo habr´a que elevar a la potencia nυ -esima. Notaremos | | = | |υ y α = αυ . Caso 1. α 6= ∞ Supongamos β cumple que |β + d| ≥ |α + d|/2 entonces |T (α) − T (β)| = |ad−b||α−β| |α+d||β+d| ≤ 2|ad−b||α−β| |α+d|2 = C1 |α − β|. Luego, (2.3) es v´ alida para estos β tomando C = C1 . Consideremos ahora los β que cumplen |β + d| ≤ |α + d|/2. Si la afirmaci´ on es falsa para estos β, entonces para cada N ∈ N existe βN bajo estas condiciones tal que N. min {1, |α − βN |} ≤ min {1, |T (α) − T (βN )|}. Ademas tenemos que ´ A APROXIMACIONES SIMULTANEAS DE ENTEROS ALGEBRAICOS 2. REDUCCION 15 |α − βN | ≥ |α + d| − |d + βN | ≥ |α + d| − |α + d|/2 = |α + d|/2, luego para todo N , N min {1, |α + d|/2} ≤ N min {1, |α − βN |} < min {1, |T (α) − T (βN )|} ≤ 1. Tomando N suficientemente grande llegamos a un absurdo. Por lo tanto, existe una constante C2 tal que (2.3) es v´alida para estos β tambien. Tomando C como el m´aximo de estas dos constantes obtenemos lo buscado. Caso 2. α = ∞ Sea β tal que |β + d| ≥ 1 entonces |β| ≤ |β + d| + |d| ≤ |β + d| + |d||β + d| = |β + d|(1 + |d|). Por lo tanto, 0 1 0 |T (α) − T (β)| = | ad−b β+d | ≤ C | β | = C |α − β|. Luego (2.3) se cumple para estos β, tomando C = C 0 . Sea ahora β tal que |β + d| ≤ 1. En particular, tenemos que |β| ≤ |β + d| + |d| ≤ 1 + |d|. Nuevamente, si (2.3) es falso en este caso, construimos una sucesi´on βN como antes. Por lo tanto, N min {1, 1/(1 + |d|)} ≤ N min {1, 1/|β||} = N min {1, |α − β||} ≤ min {1, |T (αυ ) − T (β)|} ≤ 1. Se sigue entonces como en el caso anterior. 2. Reducci´ on a aproximaciones simultaneas de enteros algebraicos Antes de comenzar con la prueba del teorema de Roth, haremos dos simplificaciones. La primera de ellas, que ser´a de utilidad t´ecnica para simplificar notaci´on y cantidad de ´ındices, establece que es suficiente probar el teorema para el caso de enteros algebraicos. ´ n 1. Si el teorema de Roth es verdadero para enteros algebraicos, Afirmacio entonces es verdadero para n´ umeros algebraicos arbitrarios. ´ n. Lo probaremos por el contrarec´ıproco. Para cada υ ∈ S, sea Demostracio αυ un n´ umero algebraico y supongamos que el teorema de Roth es falso para los elementos {αυ }υ∈S y alg´ un ε > 0. Tenemos entonces infinitos β ∈ K que satisfacen (2.1). Para cada β, existe al menos un subconjunto de S, digamos S 0 , tal que Y Y kβ − αυ kυ = min {kβ − αυ kυ , 1} υ∈S 0 υ∈S (descartando todos o algunos de los υ ∈ S que cumplen min {kβ − αυ kυ , 1} = 1 ). Como S posee finitos subconjuntos y los β son infinitos, quiz´as reemplazando S por un subconjunto, podremos suponer que existen infinitos β ∈ K para los cuales Y υ∈S kβ − αυ kυ ≤ 1 . HK (β)2+ε 16 2. EL TEOREMA DE ROTH Para cada αυ , existe Dυ ∈ N tal que Dυ αυ es entero algebraico. Existe entonces D > 0 entero, por ejemplo el producto de todos los Dυ , tal que Dαυ es entero algebraico para todo υ ∈ S. Consideremos los β ∈ K soluci´on de (2.1) tal que HK (β) > HK (D)1+6/ε . Hay infinitos de ellos pues solo descartamos un conjunto de altura acotada. A partir de la definici´on de altura se tiene que Hk (Dβ) ≤ HK (D)HK (β). Adem´ as, Y Y kDkυ ≤ max {kDkυ , 1} ≤ HK (D). υ∈S υ∈S Por lo tanto Y Y Y Y min {kDβ − Dαυ kυ , 1} ≤ kDβ − Dαυ kυ = kDkυ kβ − αυ kυ ≤ υ∈S υ∈S υ∈S υ∈S 1 HK (D) HK (D) . ≤ = HK (β)2+ε HK (β)2+ε/2 HK (β)2+ε/2 HK (D) 1 1 . = . (HK (Dβ)/HK (D))2+ε/2 (HK (D)1+6/ε )ε/2 HK (Dβ)2+ε/2 Se obtiene as´ı que el teorema de Roth es falso para los enteros algebraicos {Dαυ }υ∈S , con ε0 = ε/2. Q La segunda simplificaci´ on reemplazara la condici´on de que el producto kαυ − βk sea peque˜ no por la m´ as sencilla condici´on de cada una de las diferencias kαυ − βk sea peque˜ na. Esta idea de reducir el trabajo a considerar aproximaciones simultaneas es debida a Mahler, quien fue el primero en considerar aproximaciones sobre varios valores absolutos. Teorema 2.3. Sea K un cuerpo de n´ umeros, S ⊂ MK un conjunto finito de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido ¯ Para cada υ ∈ S, sea αυ ∈ K. ¯ Sea ε > 0 y sea extendido de alguna forma a K. X ξ : S → [0, 1] una funci´ on que cumple ξυ = 1. υ∈S Entonces existen finitos β ∈ K que satisfacen (2.4) min {kαυ − βk , 1} ≤ 1 HK (β)(2+ε)ξυ para todo υ ∈ S. Veamos que este teorema es equivalente al teorema de Roth. Teorema 2.4. El teorema 2.3 es equivalente al teorema de de Roth. ´ n. Supongamos que el teorema de Roth es cierto. Sea ξ : S → Demostracio [0, 1] como en el enunciado P y sea β ∈ K que cumple (2.4). Multiplicando las desigualdades y usando que υ ξυ = 1 se tiene entonces que β cumple (2.1). Aplicando el teorema de Roth concluimos que hay finitas posibilidades para β, como se quer´ıa ver. Supongamos ahora que el teorema sobre aproximaciones simultaneas es verdadero. Para cada β ∈ K que cumple (2.1) y para cada υ ∈ S, se define el n´ umero real λυ (β) ≥ 0 mediante min {kαυ − βkυ , 1} = 1 . HK (β)(2+ε)λυ (β) 3. PRELIMINARES 17 Para que λυ (β) este un´ıvocamente determinado, supondremos que HK (β) 6= 1, pues como mucho estamos eliminando finitas soluciones. Multiplicando sobre υ ∈ S y P comparando con (2.1) se tiene que υ∈S λυ (β) ≥ 1. 2+ε . Observar que µ > 1. Sea A Para simplificar la notaci´ on, llamemos µ = 2+ε/2 un entero de forma tal que A (µ − 1) > s. Utilizando repetidas veces el hecho de que [x + y] ≤ [x] + [y] + 1, se tendr´a P P A + s ≤ Aµ ≤ υ∈S Aµλυ (β) + 1 ≤ υ∈S [Aµλυ (β)] + s, entonces A≤ P υ∈S [Aµλυ (β)]. Por lo tanto, existen enteros bυ (β) tal que 0 ≤ bυ (β) ≤ [Aµλυ (β)] ≤ Aµλυ (β) y X bυ (β) = A. υ∈S Consideramos el conjunto de funciones ξ : S → [0, 1] con ξυ = aυ A, aυ ∈ Z, aυ ≥ 0, y P υ∈S aυ = A, este conjunto resulta finito y ser´a denotado por Ω. Por lo tanto, la funci´ on ξ : S → [0, 1] definida por ξυ = bυ (β)/A pertenece al conjunto Ω. Adem´ as, como (2 + ε/2)ξυ ≤ (2 + ε)λυ (β), se tendr´a que min {kαυ − βkυ , 1} ≤ 1 H(β)(2+ε/2)ξυ para todo υ ∈ S. Se concluye as´ı que para cada β ∈ K, que cumple (roth) existe al menos una funci´ on ξ ∈ Ω para la cual cumple (2.4). Por hip´otesis, para cada ξ hay finitos β, por lo tanto, como Ω posee finitos elementos, se concluye que * posee finitas soluciones β ∈ K. 3. Preliminares En esta secci´ on probaremos varios resultados preliminares que ser´a utilizados a lo largo de la prueba del teorema de Roth. Empezaremos con un estudio sobre el tama˜ no de los coeficientes de polinomios en varias variables. Sea k un cuerpo y k[X1 , . . . , Xn ] el anillo de polinomios en n variables, abreviaremos i = (i1 , . . . , in ) y m = (m1 , . . . , mn ) ∈ Zn≥0 y notaremos mn 1 xm = xm 1 . . . xn y Y n m mj = , i ij j=1 donde entendemos que mi = 0 si m < i. ´ n 1. Sea k un cuerpo. Para cada i, se define el operador lineal ∂i Definicio sobre el anillo de polinomios k[X1 , . . . , Xn ] como m m−i m ∂i x = x . i 18 2. EL TEOREMA DE ROTH Tambi´en podremos notar ∂i = ∂i1 ...in . Observar que este operador est´a bien definido en cualquier cuerpo pues los binomios son n´ umeros enteros. Adem´as, si el cuerpo tiene caracter´ıstica cero vale la igualdad 1 ∂ i1 +...+in i1 !i2 !...in ! ∂xi1 ...∂xinn 1 ∂i P = P. Los operadores diferenciales est´an normalizados de esta forma para simplificar lo m´ as posible los factores comunes que aparecen cuando diferenciamos un polinomio. ´ n 2. Sea P ∈ C[X1 , . . . , Xm ] un polinomio con coeficientes compleDefinicio jos, definimos la altura de P como |P |=m´ aximo de los valores absolutos de los coeficientes de P . Lema 1. Sea P (X1 , . . . , Xm ) ∈ Z[X1 , . . . , Xm ] un polinomio con coeficientes enteros, y sea i = (i1 , . . . , im ) una m-upla de enteros no negativos. Las siguientes afirmaciones son validas (1) ∂i P ∈ Z[X1 , . . . , Xm ] (2) Si grXh (P ) ≤ rh para todo 1 ≤ h ≤ m, entonces |∂i P | ≤ 2r1 +...+rm |P | ´ n. Sea Demostracio r1 X P (X1 , . . . , Xm ) = ... rm X jm Cj1 ...jm X1j1 . . . Xm jm =0 j1 =0 con Cj1 ...jm ∈ Z. Diferenciando P obtenemos r1 rm X X j1 jm jm −im ∂i1 ,...,im P = ... Cj1 ,...,jm ... . X1j1 −i1 . . . Xm i i 1 m j =0 j =0 1 m Como los n´ umeros combinatorios son enteros, queda probado 1). Para probar 2), recordemos la estimaci´on de los n´ umeros combinatorios dada por X j j j ≤ = (1 + 1)j = 2j i k k=0 Por lo tanto, se tendr´ a que |∂i1 ...im P | = max Cj1 ...jm j1 i1 ... jm im ≤ max |Cj1 ...jm | .max r1 +...+rm |P |.2 2j1 +...+jm ≤ . Estos operadores tienen otras ventajas como por ejemplo que la formula de Taylor queda expresada de forma m´as concisa. Sea a = (a1 , . . . , an ) ∈ k n entonces, X P (X1 , . . . , Xn ) = ∂i P (a)(x − a)i i La formula de Leibniz de la derivada del producto es tambi´en m´as sencilla P ∂n (P1 (X)P2 (X) . . . Ps (X)) = j1 +...+js =n ∂j1 P1 (X) . . . ∂js Ps (X). El u ´nico aspecto negativo de estos operadores es que no satisfacen la formula de composici´ on que si poseen los diferenciales cl´asicos, por el contrario se tiene ∂i ∂j P = j+i i ∂i+j P . 3. PRELIMINARES 19 A continuaci´ on, definiremos una noci´on de orden de anulaci´on para polinomios en varias variables que ser´ a fundamental en la prueba del teorema de Roth. ´ n 3. Sea k un cuerpo, P (X1 , . . . , Xm ) ∈ k[X1 , . . . , Xm ] un poliDefinicio nomio, (α1 , . . . , αm ) ∈ k m y sea (r1 , . . . , rm ) ∈ Zm ındice de P >0 . Se define el ´ respecto a (r1 , . . . , rm ) en (α1 , . . . , αm ) como i1 im Ind(P ; r1 , . . . , rm ; α1 , . . . , αm ) = min + ... + |∂i P (α1 , . . . , αm ) 6= 0 . i r1 rm Si P es el polinomio nulo definimos su ´ındice como ∞. Cuando (r1 , . . . , rm ) y (α1 , . . . , αm ) est´en fijos, o se entiendan sin ambiguedad por contexto, notaremos Ind P . Si bien los ri no tienen a priori ninguna conexi´on con los grados de P , en la pr´ actica solo aplicaremos esta noci´on para polinomios con gradoXi ≤ ri . Se cumple adem´ as que Ind P ≥ 0, y la igualdad se cumple si y solo si P (α1 , . . . , αm ) 6= 0. En el caso de polinomios de una variable, si gr(f ) = r entonces Ind(f ; r; α) = multrα (f ) , cociente que ya hab´ıa aparecido en el primer intento de generalizar el teorema de Liouville. El siguiente lema justificara que el ´ındice es una forma de medir el orden de anulacion, en particular, 2) y 3) dir´an que el ´ındice es una valuaci´on en k[X1 , . . . , Xm ]. Lema 2. Sean P y P 0 ∈ k[X1 , . . . , Xm ] polinomios, y fijemos (r1 , . . . , rm ) ∈ y α = (α1 , . . . , αm ) ∈ k m . Entonces, el ´ındice respecto de (r1 , . . . , rm ) en el punto α = (α1 , . . . , αm ) cumple las siguientes propiedades: (1) Ind(∂i1 ...im P ) ≥ Ind P − ri11 + . . . + rim m Zm >0 (2) Ind(P + P 0 ) ≥ min {Ind P, Ind P 0 } (3) Ind(P P 0 ) = Ind P + Ind P 0 ´ n. 1) Sea Q = ∂i P . Por definici´on de ´ındice, tomamos j = Demostracio (j1 , . . . , jm ) tal que ∂j Q(α) 6= 0 e Ind Q = rj11 + . . . + rjm . Entonces ∂j Q(α) 6= 0 m implica que ∂i+j P (α) 6= 0. Por lo tanto, por definici´on de ´ındice, j1 +i1 r1 + ... + jm +im rm ≥ Ind P con lo cual Ind(∂i P ) = j1 r1 + ... + jm rm ≥ Ind P − i1 r1 + ... + im rm . 2)Sea j = (j1 , . . . , jm ) tal que ∂j (P + P 0 )(α) 6= 0 e Ind(P + P 0 ) = Por linealidad de la derivada, ∂j P (α) 6= 0 o ∂j P 0 (α) 6= 0, entonces j1 r1 + ... + jm rm ≥ Ind(P ) o j1 r1 + ... + jm rm j1 r1 + . . . + rjm . m ≥ Ind(P 0 ). Consecuentemente, Ind(P + P 0 ) = j1 r1 + ... + jm rm ≥ min {Ind P, Ind P 0 } . 3)Sea j = (j1 , . . . , jm ) tal que ∂j (P P 0 )(α) 6= 0 e Ind(P P 0 ) = Usando la regla del producto, tenemos que X ∂j (P P 0 ) = ∂i P.∂i0 P 0 . i+i0 =j j1 r1 + ... + jm rm . 20 2. EL TEOREMA DE ROTH Luego existen i = (i1 , . . . , im ), i0 = (i01 , . . . , i0m ) con i + i0 = j tal que ∂i P (α) 6= 0 y ∂i0 P 0 (α) 6= 0. Entonces Ind P ≤ i1 r1 + ... + im rm y Ind P 0 ≤ i01 r1 + ... + i0m rm . Sumando estas inecuaciones obtenemos que Ind P + Ind P 0 ≤ Ind(P P 0 ). Para ver la desigualdad opuesta, consideremos todas las m-uplas i = (i1 , . . . , im ) m X ih y ∂i P (α) 6= 0. Sea i la menor de ellas respecto del orden tal que Ind P = rh h=1 lexicogr´ afico. Es decir, si i es una de estas m-uplas, distinta de i entonces existe 0 1 ≤ k ≤ m tal que ih = ih para todo 1 ≤ h < k e ih < ih . Similarmente elegimos i 0 m X ih la menor m-upla respecto del orden lexicogr´afico para P 0 tal que Ind P = rh h=1 0 y ∂i0 P (α) 6= 0, y definimos j = i + i .Entonces ∂j (P P 0 )(α) = ∂i P (α)∂i0 P 0 (α) 6= 0 0 pues todas las dem´ as son cero por elecci´on de i e i .Luego obtenemos que 0 m m X X jh ih + ih Ind(P P ) ≤ = = Ind P + Ind P 0 , rh rh 0 h=1 h=1 lo que nos da la otra desigualdad, completando la prueba del enunciado. Al igual que en el teorema de Thue, la construcci´on del polinomio ser´a llevada acabo a partir de la existencia de soluciones de un sistema de ecuaciones lineales sobre Z. Para eso tendremos que contar la cantidad de ecuaciones que obtenemos al imponer condiciones sobre el ´ındice del polinomio. El siguiente lema combinatorio, lidia con este problema. Una versi´on similar a este lema ya habia sido probada por Schneider [31] en 1936. El lema aqu´ı enunciado es el mismo al publicada en el trabajo original de Roth cuya demostraci´on es debida a Davenport. Lema 3. Supongamos que r1 , . . . , rm son enteros positivos, y sea λ > 0, entonces el n´ umero de m-uplas (j1 , . . . , jm ) ∈ Zm tal que 0 ≤ jh ≤ rh (h = 1, . . . , m) y rj11 + . . . + rjm ≤ 12 (m − λ) m es como mucho 2m1/2 λ−1 (r1 + 1) . . . (rm + 1) ´ n. Probaremos el lema por induci´on en m. Si m = 1 el resultado Demostracio es valido pues el n´ umero de enteros j1 que satisfacen 0 ≤ j1 ≤ r1 y j1 ≤ 1/2(1 − λ)r1 es cero si λ > 1 y si λ ≤ 1, dado que el conjunto tiene como mucho r1 + 1 elementos se tiene que r1 + 1 ≤ λ1 2(r1 + 1). Sea ahora m > 1 y supongamos que el resultado es v´alido para m − 1. Podemos suponer adem´ as que λ > 2m1/2 ya que caso contrario, el lema es v´alido pues hay como mucho (r1 + 1) . . . (rm + 1) m-uplas. Para cada valor de jm , la condici´on que se le pide a j1 , . . . , jm−1 , es de la misma naturaleza que nuestro problema solo que en m − 1 lugares en lugar de m y con λ reemplazado por λ0 tal que 1/2(m − 1 − λ0 ) = 1/2(m − λ) − jm /rm , es decir, λ0 = λ − 1 + 2jm /rm . Observar 3. PRELIMINARES 21 que λ0 > 0 ya que λ > 2m1/2 > 1. La cantidad de m-uplas va a ser menor o igual a la cantidad de (m − 1)-uplas para cada valor fijo 0 ≤ jm ≤ rm , y por hip´otesis inductiva, el total de m-uplas ser´a menor o igual que rm X jm 2(m − 1)1/2 (r1 + 1) . . . (rm−1 + 1) λ − 1 + 2jm /rm =0 Bastara entonces probar que r X 1 < λ−1 (m − 1)−1/2 m1/2 (r + 1) λ − 1 + 2j/r j=0 para todo entero positivo r y m, con λ > 2m1/2 . Supongamos que r es par, y reemplazando j por 21 r + k, obtenemos que r 2 X k=− r2 r 2 X 1 = λ−1 + λ + 2k/r k=1 λ−1 + 2λ r 1 1 + λ + 2k/r λ − 2k/r r r 2 X 2 X k=1 1 = λ−1 + 2λ−1 2 λ −1 k=1 −1 =λ + 2 X 2λ k=1 1 ≤ λ2 − 4k 2 /r2 1 λ−1 (r + 1) ≤ 1 − λ−2 1 − λ−2 −2 como λ > 2m entonces 1 − λ > 1 − 1/4m−1 > (1 − m−1 )1/2 se obtiene lo buscado. Si ahora r es impar, realizando el cambio j = (r − 1)/2 + k se obtiene que 1/2 r+1 r+1 2 X 2 X 1 = λ + (2k − 1)/r k=− r−1 2 k=1 1 1 + λ + (2k − 1)/r λ − (2k − 1)/r = r+1 2λ 2 X k=1 1 λ(r + 1) λ−1 (r + 1) < = . λ2 − (2k − 1)2 /r2 λ2 − 1 1 − λ−2 Es posible dar una interpretaci´on probabil´ıstica de este teorema. Si elegimos al azar un m-upla (j1 , . . . , jm ) con 0 ≤ jh ≤ rP h , entonces el valor esperado de jh /rh ser´ a 1/2 y por lo tanto el valor esperado de jh /rh ser´a de m/2. Si α es un entero algebraico de grado d sobre Q, entonces todo elemento del anillo Z[α] se puede escribir de manera u ´nica como combinaci´on Z lineal de la base 1, α, . . . , αd−1 . El siguiente lema nos dir´a que tan grande ser´an los coordenadas de las potencias de α en esta base y as´ı obtener cierto control sobre el tama˜ no de los coeficientes que aparecer´ an en nuestro sistema de ecuaciones lineales. Lema 4. Sea α un entero algebraico cuyo polinomio minimal es P (x) = xn + (l) (l) an−1 xn−1 + . . . + a0 . Para cada entero l ≥ 0 existen enteros a0 , . . . , an−1 tal que (l) (l) (l) αl = an−1 αn−1 + . . . + a1 α + a0 y vale que (l) |aj | ≤ (1 + |P |)l j = 0, . . . , n − 1 ´ n. Procederemos por inducci´on. Para l ≤ n el teorema es trivial. Demostracio Supongamos entonces que el teorema es cierto para l − 1 22 2. EL TEOREMA DE ROTH (l−1) (l−1) (l−1) (l−1) (l−1) αl = αl−1 α = (an−1 αn−1 + . . . + a1 α + a0 )α = an−1 αn + . . . + a1 α2 + (l−1) (l−1) (l−1) 2 (l−1) a0 α = an−1 (−an−1 αn−1 − . . . − a1 α − a0 ) + . . . + a1 α + a0 α= (l−1) (l−1) (l−1) (l−1) (l−1) n−1 (an−2 − an−1 an−1 )α + . . . + (a0 − a1 an−1 )α − a0 an−1 Se tiene entonces que para j = n − 1, . . . , 1 (l) (l−1) (l−1) |aj | = |aj−1 − aj an−1 | ≤ (1 + |P |)l−1 (1 + |aj |) ≤ (1 + |P |)l y (l) (l−1) |a0 | = |a0 an−1 | ≤ |P |(1 + |P |)l−1 ≤ (1 + |P |)l . El siguiente lema sistematiza el uso de Thue del principio del palomar para dar una cota superior a la soluci´ on de un sistema de ecuaciones lineales. Siegel fue el primero en formalizar estas ideas, es por eso que el lema lleva su nombre, a veces tambi´en llamando lema de Thue-Siegel. Lema 5 (Lema de Siegel). Sean aij , i = 1, . . . , m , j = 1, . . . , n enteros no todos nulos, acotados por A > 0 y supongamos n > m. Entonces el sistema homog´eneo (2.5) a11 x1 .. . + am1 x1 + ··· .. . ··· + a1n xn .. . = 0 .. . + amn xn = 0 admite una soluci´ on entera no trivial x = (x1 , . . . , xn ) tal que m (2.6) max |xi | ≤ (nA) n−m i ´ n. Dado que por hip´otesis tenemos m´as inc´ognitas que ecuaDemostracio ciones, siempre existe una soluci´on racional no nula y multiplicando por una constante adecuada, obtenemos una soluci´on entera no nula. Sea H un entero positivo y consideremos el conjunto T := {x ∈ Zn | 0 ≤ xi ≤ H, i = 1, . . . , n}. La cantidad de puntos enteros en T es (H + 1)n pues para cada variable tenemos H + 1 posibilidades. Sea F : Rn → Rm la transformaci´on lineal dada por F (x) = (L1 (x), . . . , Ln (x)) donde Lj = aj1 x1 + · · · + ajn xn . Si x ∈ T , se tiene que −Bj H ≤ Lj (x) ≤ Cj H donde −Bj y Cj son la suma de los coeficientes negativos y positivos de Lj , respectivamente. Dado que Bj + Cj ≤ nA, cada Lj (x) pertenece a un intervalo de longitud ≤ nAH. Por lo tanto, cada Lj (x) toma como mucho nAH +1 valores, lo que implica que #F (T ) ≤ (nAH +1)m . Si H es tal que (nAH + 1)m < (H + 1)n esto nos diria que F no puede ser inyectiva, entonces existir´ıan x0 6= x00 tal que ˜ = x0 − x00 , se tiene que F (˜ ˜ F (x0 ) = F (x00 ). Tomando x x) = 0. Por lo tanto, x resulta soluci´ on entera no nula del sistema homog´eneo. Observar que |˜ xi | ≤ H ya n que x0 y x00 pertenecen a T ⊂m[0, H] ). n−m Basta elegir H = (nA) pues entonces ´ DEL POLINOMIO AUXILIAR 4. CONSTRUCCION 23 (nAH +1)m < (nA(H +1))m = (nA)m (H +1)m ≤ (H +1)n−m (H +1)m = (H +1)n . El siguiente lema es b´ asicamente el hecho de que no existen enteros entre 0 y 1. Seg´ un Mahler, en un cuerpo que posea una formula del producto y una desigualdad de este estilo ser´ a posible desarrollar una teor´ıa de aproximaciones diof´anticas. Lema 6. Sea K un cuerpo de n´ umeros, α ∈ K ∗ , y sea S ⊂ MK un subconjunto de valores absolutos sobre K. Entonces Y 1 min {kαkυ , 1} ≥ . HK (α) υ∈S HK (α) = Y ´ n. Demostracio Y max {kαkυ , 1} = kαkυ .max 1, 1 kαkυ = υ∈MK υ∈MK Y Y Y 1 1 1 max 1, = ≥ . kαkυ min {1, kαkυ } min {1, kαkυ } υ∈MK υ∈MK υ∈S 4. Construcci´ on del polinomio auxiliar En esta secci´ on probaremos el an´alogo al Paso I, descripto en la demostraci´on del teorema de Liouville y el teorema de Thue. Construiremos un polinomio P (X1 , . . . , Xm ) con coeficientes enteros de un tama˜ no razonablemente chico que tendr´ a cada m-upla (αυ , . . . , αυ ) como ceros de orden grande, seg´ un nuestra noci´on de orden de anulaci´ on. Como ya ha sido mencionado, la construcci´on ser´a llevada a cabo a partir de una soluci´ on no trivial de un sistema de ecuaciones lineales con coeficientes enteros. Teorema 2.5. Sean α1 , . . . , αs enteros algebraico, cada uno de grado ds sobre Q. Sea ε > 0, y sea m un entero que cumple !2 s X (2.7) m > 16 dj ε−2 . t=1 Sean r1 , . . . , rm enteros positivos. Entonces existe un polinomio P (X1 , . . . , Xm ) no nulo con coeficientes enteros tal que (1) P tiene grado ≤ rh en la variable Xh . (2) El indice de P respecto de (r1 , . . . , rm ) en (αt , . . . , αt ) es tal que Ind(P ) ≥ m 2 (1 − ε) para todo 1 ≤ t ≤ s. r1 +...+rm (3) |P | ≤ B , con B = B(α1 , . . . , αs ) una constante que solo depende de α1 , . . . , αs . ´ n. La prueba consistir´a en considerar los coeficientes de P como Demostracio inc´ ongnitas que deber´ an cumplir un sistema de ecuaciones lineales homog´eneas provenientes de la condici´ on 2), el cual tendr´a m´as ecuaciones que inc´ongnitas, probando as´ı la existencia de dicho polinomio. Escribamos a P como r1 rm X X jm , P (X1 , . . . , Xm ) = ... Cj1 ...jm X1j1 . . . Xm j1 =0 jm =0 24 2. EL TEOREMA DE ROTH donde Cj1 ...jm son enteros a determinar para que se cumpla 2). El n´ umero total de coeficientes es N = (r1 + 1) . . . (rm + 1). Para cada m-upla (i1 , . . . , im ) se tiene que r1 rm X X j1 jm jm −im ∂i1 ...im P = ... Cj1 ...jm ... X1j1 −i1 . . . Xm . i i 1 m j =0 j =0 1 m Para que valga 2), para todo αt debe cumplirse que ∂i1 ...im P (αt , . . . , αt ) = 0 para todo (i1 , . . . , im ) con m X m ih < (1 − ε). rh 2 h=0 Para disminuir la cantidad de ´ındices en las cuentas siguientes, llamemos α, a cualquiera de estos enteros algebraicos y sea d a su grado. Evaluando en (α, . . . , α) y usando el Lema 4 para escribir las potencias de α como combinaci´on lineal de 1, α, . . . , αd−1 , obtenemos que rm r1 X X j1 jm j1 −i1 +...+jm −im = ... Cj1 ...jm ∂i1 ...im P (α, . . . , α) = ... α i im 1 j1 =0 jm =0 ! X rm r1 d−1 X X j1 jm j1 −i1 +...+jm −im k Cj1 ...jm ... ... ak α = i1 im j1 =0 k=0 jm =0 rm r1 d−1 X X X j1 jm j1 −i1 +...+jm −im k ... Cj1 ...jm ... α a i im k 1 j =0 j =0 k=0 1 m Como 1, α, . . . , αd−1 son linealmente independientes, ∂i1 ...im P (α, . . . , α) ser´a cero si y solo si rm r1 X X j1 jm j1 −i1 +...+jm −im Cj1 ...jm ... ... a =0 i1 im k j =0 j =0 1 m para 0 ≤ k ≤ d − 1. Estas son d ecuaciones lineales homog´eneas con coeficientes enteros para cada m-upla (i1 , . . . , im ) tal que m X m 1 ih < (1 − ε) = (m − εm) rh 2 2 h=0 Seg´ un Lema 3 con λ = εm, la cantidad total de ecuaciones M 0 ser´a M 0 ≤ 2dm−1/2 ε−1 (r1 + 1) . . . (rm + 1) = 2dm−1/2 ε−1 N . Dado que queremos que esto suceda para todo αt , la cantidad total de ecuaciones M ser´ a ! s X N M ≤2 dt m−1/2 ε−1 N ≤ , 2 t=1 5. EL INDICE ES GRANDE 25 donde la ultima desigualdad es v´alida por la hip´otesis hecha sobre m. Por lo tanto, tenemos M ecuaciones lineales homog´eneas con coeficientes enteros en N inc´ ongnitas. Aplicaremos ahora el Lema de Siegel para as´ı obtener una cota sobre la altura de nuestro polinomio. Para esto, necesitamos tener una (l) estimaci´ on de los coeficientes de las ecuaciones. Por Lema 4 sabemos que |ak | ≤ (1 + |Q|)l , con Q el polinomio minimal sobre Q del α considerado. Consecuentemente podemos estimar los coeficientes del sistema lineal por j1 −i1 +...+jm −im j1 m ak i1 . . . jim ≤ 2j1 +...+jm (|Q| + 1)j1 +...+jm ≤ (2|Q| + 2)r1 +...+rm . Esta cota, nos sirve para las ecuaciones que provienen de considerar un solo α. Con lo cual, la cota que se obtiene de considerar todos los αt ser´a el m´aximo de todas estas. Digamos A = max |Qt | donde Qt es el polinomio minimal de αt , entonces los coeficientes de nuestro sistema estar´an acotados por (2A+2)r1 +...+rm . Aplicando el lema de Siegel a nuestro sistema obtenemos que los coeficientes de P est´an acotados por M |P | ≤ (N (2A + 2)r1 +...+rm ) N −M ≤ N (2A + 2)r1 +...+rm ≤ 2r1 +...+rm (2A + 2)r1 +...+rm = B(α1 , . . . , αs )r1 +...+rm con B(α1 , . . . , αs ) = 4A + 4. La segunda desigualdad se debe a que M ≤ N2 . M N −M ≤ 1 pues 5. El indice es grande Una vez que tenemos el polinomio con coeficientes de tama˜ no ”chico” y orden grande en (αυ , . . . , αυ ), debemos mostrar ahora que si las aproximaciones β1 , . . . , βm son lo suficientemente cercanas a los αυ , entonces el polinomio deber´a de anularse con orden alto en (β1 , . . . , βm ). Ilustraremos este fen´ omeno con polinomios de una variable. Sea entonces β = p/q un n´ umero racional, P (X) ∈ Z[X] un polinomio con coeficientes enteros, de los cuales tenemos alguna especie de control y P se anula con orden grande en un n´ umero α. Pidamos por ejemplo grP (X) = r, Ind(P ; r; α) = multi(P,α) r ≥ 12 , |P | ≤ B(α)r , y supongamos que p/q es una buena aproximaci´on de α, es decir, |p/q−α| ≤ q −(2+ε) . La expresi´ on de Taylor de P alrededor de α ser´a P Pr P (X) = i=0 ∂i P (α)(X − α)i = i≥r/2 ∂i P (α)(X − α)i . Evaluando en p/q obtenemos que i p P P ( q ) ≤ i≥r/2 ∂i P (α) pq − α . Recordando el lema 1 y usando que |P | ≤ B(α)r podremos estimar el tama˜ no de las derivadas en α. Como ∂i P es un polinomio de grado como mucho r y coeficientes acotados por |∂i P | se tiene que r r |∂i P (α)| ≤ r|∂i P | max {1, |α|} ≤ 2r .2r .B(α)r max {1, |α|} = C(α)r Por lo tanto, tendremos que r/2 r/2 r p 1 2C ≤ (2C)r q2+ε = q1+ε/2 . P ( q ) ≤ rC r pq − α Por otro lado, si P (X) no se anula en p/q, P (p/q) es una fracci´on no nula con denominador q r y por lo tanto P (p/q) ≥ 1/q r . Entonces tendremos que 26 2. EL TEOREMA DE ROTH 1 qr r 2C , ≤ P ( pq ) ≤ q1+ε/2 lo que implica que q ≤ (2C)2/ε . Esto nos da una cota para q, si asumimos que p/q no es ra´ız de P (X). Por lo tanto, si nuestras aproximaciones son de altura suficientemente grande P (X) se anulara en ellas. Un argumento similar funcionara para las derivadas ∂j P . Por lo tanto, con las hip´otesis correctas impuestas sobres las alturas de las aproximaciones, podremos probar que P (X) se anula con orden grande en p/q. Por lo tanto, para generalizar este argumento y poder probar lo deseado necesitaremos tener cierto control sobre la altura de las derivadas del polinomio construido, evaluado en n´ umeros algebraicos. Lema 7. Sea P ∈ Z[X1 , . . . , Xm ] tal que grXh (P ) ≤ rh , y sea β = (β1 , . . . , βm ) una m-upla de n´ umeros algebraicos en un cuerpo de n´ umeros K. Entonces para toda m-upla j = (j1 , . . . , jm ) de enteros no negativos se cumple que m Y HK (∂j P (β)) ≤ 4(r1 +...+rm )[K:Q] HK (P ) HK (βh )rh . h=1 ´ n. Sea (j1 , . . . , jm ) una m-upla de enteros no negativos. Sea Demostracio T (X1 , . . . , Xm ) = ∂j1 ...jm P (X1 , . . . , Xm ). Por lema 1 sabemos que T posee coeficientes enteros acotados por |T | ≤ 2r1 +...+rm |P |. ∞ Consideremos υ ∈ MK cualquier valor absoluto arquimediano. Usando la desigualdad triangular y el hecho de que T posee como mucho (r1 + 1) . . . (rm + 1) ≤ 2r1 +...+rm coeficientes, cada uno de ellos acotados por |T | se tiene que r |T (β1 , . . . , βm )|υ ≤ (r1 + 1) . . . (rm + 1) |T |max {|β1 |υ , 1} 1 . . . max {|βm |υ , 1} r r 4r1 +...+rm |P | max {|β1 |υ , 1} 1 . . . max {|βm |υ , 1} m . rm ≤ 0 es algun valor absoluto noarquimediano, usando la deSimilarmente, si υ ∈ MK sigualdad triangular noarquimediana, el hecho de que T posee coeficientes enteros y recordando que |n|υ ≤ 1 ∀n ∈ Z se tiene que r rm |T (β1 , . . . , βm )|υ ≤ max {|β1 |υ , 1} 1 . . . max {|βm |υ , 1} . Elevando estas desigualdades a la potencia nυ -esima(nυ = [Kυ : Qυ ]), multiplicandolas sobre todos los υ ∈ MK , se obtiene que Y (r1 +...+rm )nυ 4 HK (T (β1 , . . . , βm )) ≤ r n r n |P | max {|β1 |υ , 1} 1 υ . . . max {|βm |υ , 1} m υ × nυ ∞ υ∈MK Y 0 υ∈MK (r1 +...+rm )[K:Q] 4 r 1 nυ max {|β1 |υ , 1} . . . max {|βm |υ , 1} rm nυ = HK (P ) HK (β1 )r1 . . . HK (βm )rm (Observar que como P posee coeficientes enteros, HK (P ) = |P |[K:Q] ). 5. EL INDICE ES GRANDE 27 Lema 8. Sean r1 , . . . , rm enteros positivos y P ∈ Z[X1 , . . . , Xm ] un polinomio con coeficientes enteros tal que grXh ≤ rh .Sea K un cuerpo de n´ umeros, S ⊂ MK un conjunto finito de valores absolutos sobre K y asumamos que cada valor absoluto ¯ Para cada υ ∈ S, sea αυ ∈ K ¯ y sea en S ha sido extendido de alguna forma a K. θυ = Ind(P ; r1 , . . . , rm ; αυ , . . . , αυ ). Sea θ = minυ∈S {θυ }. Sea 0 < δ < 1 una constante y elijamos 0 < θ0 < θ. Sea P ξ : S → [0, 1] una funci´ on tal que ξ∈S ξv = 1. Supongamos que β1 , . . . , βm ∈ K cumplen que kβυ − αυ kυ ≤ HK (βυ 1)(2+δ)ξυ para todo υ ∈ S y para todo 1 ≤ h ≤ m. Definamos D := min {HK (βh )rh }, y sea j = (j, . . . , jm ) una m-upla de enteros no Pm negativos tal que h=1 rjhh ≤ θ0 . Entonces Y kT (β1 , . . . , βm )kυ ≤ υ∈S !(r1 +...+rm )[K:Q] 16 Y HK (P ) D−(2+δ)(θ−θ0 ) . max {|αυ |υ , 1} υ∈S ´ n. Sea υ ∈ S y j = (j1 , . . . , jm ) como en el enunciado y T = Demostracio ∂j P . Estimaremos k∂j P (β1 , . . . , βm )kυ mediante la expresion de Taylor de T alrededor de (αυ , . . . , αυ ). Sea i = (i1 , . . . , im ) una m-upla de enteros no negativos. De la misma forma en la que se obtuvieron las cotas para |T (β1 , . . . , βm )|υ en el lema anterior, se tiene que, si υ es arquimediano entonces |∂i1 ...im T (αυ , . . . , αυ )|υ ≤ |T |(4max {|αυ |υ , 1})r1 +...+rm ≤ |P |(8max {|αυ |υ , 1})r1 +...+rm , mientras que si υ es noarquimediano se tendr´a que r1 +...+rm |∂i1 ...im T (α, . . . , α)|υ ≤ max {|α|υ , 1} . Por Lema 2, podemos acotar inferiormente el ´ındice de T respecto de (r1 , . . . , rm ) en (αυ , . . . , αυ ), se tiene entonces que Pm Ind(T ; r1 , . . . , rm ; αυ , . . . , αυ ) = Ind∂j1 ...jm P ≥ IndP − h=1 rjhh ≥ θυ − θ0 . Por lo tanto, si escribimos la expresi´on de Taylor de T alrededor de (αυ , . . . , αυ ), muchos de los t´erminos ser´ an ceros. Entonces P∗ T (X1 , . . . , Xm ) = ∂i1 ...im T (αυ , . . . , αυ )(X1 − αυ )i1 . . . (Xm − αυ )im , P∗ quiere decir que se suma sobre las m-uplas (i1 , . . . , im ) tal que ri11 + . . . + rim ≥ m θυ − θ0 . Sea (i1 , . . . , im ) una de estas m-uplas entonces |β1 − αυ |iυ1 . . . |βm − αυ |iυm ≤ 1 (HK (β1 )i1 ...HK (βm )im )(2+δ)ξυ /nυ , el denominador podr´ a ser acotado por i1 im HK (β1 )i1 . . . HK (βm )im = (HK (β1 )r1 ) r1 . . . (HK (β1 )rm ) rm ≥ Dθυ −θ0 . Por lo tanto, para toda m-uplas (i1 , . . . , im ) tal que que i1 r1 + ... + im rm ≥ θυ − θ0 vale 28 2. EL TEOREMA DE ROTH |β1 − αυ |iυ1 . . . |βm − αυ |iυm ≤ 1 D (2+δ)(θυ −θ0 )ξυ /nυ . Sea υ ∈ S, arquimediano, si evaluamos la expresi´on de Taylor en (β1 , . . . , βm ), usando que los βh son pr´ oximos a αυ y la desigualdad triangular, obtenemos que ∗ X |∂i1 ...im T (αυ , . . . , αυ )|υ |β1 − αυ |iυ1 . . . |βm − αυ |iυm ≤ (r1 + 1) . . . (rm + max |β1 − α|iυ1υ . . . |βm − αυ |iυm ≤ 1). max {|∂i1 ...im T (αυ , . . . , αυ )|υ } . i |T (β1 , . . . , βm )|υ ≤ i1 ...im 1 r1 +...+ rim ≥θυ −θ0 m 2r1 +...+rm max {|∂i1 ...im T (αυ , . . . , αυ )|υ } i1 ...im 1 D(2+δ)(θυ −θ0 )ξυ /nυ ≤ 1 ≤ D(2+δ)(θυ −θ0 )ξυ /nυ 1 |P |(16max {|αυ |υ , 1})r1 +...+rm (2+δ)(θ−θ )ξ /n . 0 υ υ D |P |(16max {|αυ |υ , 1})r1 +...+rm Mientras que si υ ∈ S, es noarquimediano, por la desigualdad triangular noarquimediana se tendr´ a 1 ≤ D(2+δ)(θυ −θ0 )ξυ /nυ 1 . (2+δ)(θ−θ )ξ /n r1 +...+rm |T (β1 , . . . , βm )|υ ≤ max {|αυ |υ , 1} max {|αυ |υ , 1} r1 +...+rm D 0 υ υ Elevando estas desigualdades a la potencia nυ -esima, multiplicando, recordando P que nυ ≤ [K : Q] y que ξυ = 1, conseguimos Y kT (β1 , . . . , βm )kυ ≤ υ∈S !(r1 +...+rm )[K:Q] 16 Y max {|αυ |υ , 1} HK (P ) D−(2+δ)(θ−θ0 ) . υ∈S Veremos ahora que con las hip´otesis adecuadas sobre las alturas de las aproximaciones consideradas, podremos concluir que el orden de anulaci´on de nuestro polinomio sobre ellas ser´ a elevado. En efecto, tenemos la siguiente proposici´on. ´ n 3. Sea 0 < δ < 1 una constante dada, y sea ε tal que Proposicio δ . (2.8) 0<ε< 22 Sea K un cuerpo de n´ umeros, S ⊂ MK un conjunto finito de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido extendido de alguna forma ¯ Para cada υ ∈ S, sea αυ ∈ K ¯ de grado dυ , sea m un entero tal que m > a K. Ps 2 −2 16 ( t=1 dj ) ε , sean r1 , . . . , rm enteros positivos dados y sea P (X1 , . . . , Xm ) ∈ Z[X1 , . . . , Xm ] el polinomio del Teorema 2.5. Sea P ξ : S → [0, 1] una funci´ on tal que ξ∈S ξv = 1. Supongamos que β1 , . . . , βm ∈ K cumplen que 1 (2.9) kαυ − βυ kυ ≤ HK (βυ )(2+δ)ξυ 5. EL INDICE ES GRANDE 29 para todo υ ∈ S y para todo 1 ≤ h ≤ m. Supongamos adem´ as que 1+ε max {HK (βh )rh } ≤ min {HK (βh )rh } (2.10) 1≤h≤m 1≤h≤m y que existe una constante C = C({αυ }υ∈S , δ, K) tal que C ≤ HK (βh ) (2.11) para todo 1 ≤ h ≤ m. Entonces el ´ındice de P respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) cumple Ind P ≥ εm. ´ n. Sea j = (j1 , . . . , jm ) una m-upla de enteros no negativos tal Demostraci o Pm que h=1 jh /rh ≤ εm, y seaQB = B {αυ }υ∈S la cota para |P | que proviene del Teorema 2.5 y notemos M = υ∈S max {|αυ |υ , 1}. Veremos que ∂j P (β1 , . . . , βm ) = 0. Aplicaremos el lema 8 sobre el polinomio P , tomando θ0 = εm. Observar que θ ≥ m 2 (1 − ε) y dado que ε < 1/22, se cumple que θ0 < θ, por lo tanto estamos bajo las hip´ otesis del Lema 8 obteniendo as´ı que Y (r1 +...+rm )[K:Q] k∂j P (β1 , . . . , βm )kυ ≤ (16M ) HK (P ) D(2+δ)(θ−θ0 ) υ∈S ≤ (r +...+r )[K:Q] m (16BM ) 1 m D(2+δ)( 2 (1−ε)−εm) . Por otro lado, por lema 7 se tiene que (r1 +...+rm )[K:Q] HK (∂j P (β1 , . . . , βm )) ≤ 4 (r1 +...+rm )[K:Q] (4B) HK (P ) m Y HK (βh )rh ≤ h=1 (r1 +...+rm )[K:Q] Dm(1+ε) ≤ (16BM ) Dm(1+ε) . Por la desigualdad de Liouville(Lema 6) se tiene que o bien ∂j P (β1 , . . . , βm ) = 0 o bien Q −1 . υ∈S k∂j P (β1 , . . . , βm )kυ ≥ HK (∂j P (β1 , . . . , βm )) Veamos que esto u ´ltimo contradice nuestras hip´otesis. Asumiendo entonces que ∂j P (β1 , . . . , βm ) 6= 0, la desigualdad de Liouville implica que Dm((1+δ/2)(1−3ε)−(1+ε)) ≤ (16BM )2(r1 +...+rm )[K:Q] . Como asumimos que δ < 1 y ε < δ/22, se tiene (1 + 2δ )(1 − 3ε) − (1 + ε) = δ 2 − 4ε − 23 εδ > δ 2 − 4 22 δ − 3 44 δ = δ 4 y entonces max1≤h≤m {HK (βh )rh } ≤ D1+ε ≤ (16BM )8(r1 +...+rm )[K:Q](1+ε)/(δm) . Sea j tal que rj = maxm h=1 rh , se deduce que HK (βh ) ≤ (16BM )8[K:Q](1+ε)/δ . Eligiendo C = C({αυ }υ∈S , δ, K) suficientemente grande,por ejemplo C = (16BM )8[K:Q]((8/δ)+4/11) , se consigue la contradicci´ on deseada. 30 2. EL TEOREMA DE ROTH 6. Lema de Roth Ya fue mencionado que ni bien consideramos m´as de una variable, probar la no anulaci´ on del polinomio P o alguna de sus derivadas en el punto de aproximaci´on (β1 , . . . , βm ) resulta ser el paso m´as dif´ıcil de todos. En esta secci´on explicaremos el argumento propuesto por Roth para solucionar las dificultades del Paso III. En la secci´ on anterior probamos que si P se anula con orden grande en (αυ , . . . , αυ ) entonces tambi´en se anulara con orden alto en (β, . . . , β). Aqu´ı mostraremos que de hecho, no es posible para P anularse con orden grande en (β, . . . , β). Consideremos el caso de polinomios en una variable para ilustrar una de las dificultades que aparecen. Sea P (X) ∈ Z[X] un polinomio de grado a lo sumo r,con coeficientes enteros acotados por |P | ≤ B r . Notemos por I = Ind(P ; r; p/q) = multi(P ; p/q)/r el ´ındice de P en algun n´ umero racional p/q. Tendremos entonces que (X − p/q)rI divide a P . Como P posee coeficientes enteros, el Lema de Gauss1 asegura que (qX − p)rI divide a P . Dado que q rI divide al coeficiente principal de P y prI divide al termino constantes de P , se tiene que max {|p|, |q|} rI ≤ |P | ≤ B r por lo tanto IndP = I ≤ logB logH(p/q) . Esto muestra que IndP ser´ a chico si H(p/q) es relativamente grande comparado con B. Cuando el polinomio considerado P posee m´as de una variable, este argumento de divisibilidad ya no funciona. Veamos a continuaci´on algunas de las ideas utilizadas por Thue, quien considero polinomios de dos variables de la forma P (X, Y ) = f (X) + g(X)Y . Notemos por I al ´ındice de P respecto de (r, 1) en (β1 , β2 ). Tenemos entonces, por definici´on de ´ındice que ∂i,0 P (β1 , β2 ) = ∂i f (β1 ) + ∂i g(β1 )β2 = 0 para todo i/r ≤ I. Como ha sido previamente comentado, el determinante Wronskiano, que es un polinomio de una variable, aparece naturalmente cuando tratamos de probar que P no puede anularse con orden grande en (β1 , β2 ). Sea entonces W (X) = f (X)∂1 g(X) − g(X)∂1 f (X). Diferenciando W k veces, se ve que vale P ∂k W = i+j=k (∂i f ∂j+1 g − ∂j+1 f ∂i g). Por lo mencionado m´ as arriba tenemos que si i ≤ rI y j + 1 ≤ rI, entonces ∂i,0 P (β1 , β2 ) = ∂i f (β1 ) + ∂i g(β1 )β2 = 0 y ∂j+1,0 P (β1 , β2 ) = ∂j+1 f (β1 ) + ∂j+1 g(β1 )β2 = 0. Si eliminamos β2 de estas ecuaciones obtenemos ∂i f (β1 )∂j+1 g(β1 ) − ∂j+1 f (β1 )∂i g(β1 ) = 0 para todo i ≤ rI y j ≤ rI − 1. Se sigue que ∂k W (β1 ) = 0 para todo k ≤ rI − 1, lo que significa que el ´ındice de W respecto de r en β1 cumple IndW ≥ IndP − 1r . 1El lema de Gauss asegura que si un polinomio con coeficientes enteros se factoriza en Q[X], entonces se factoriza en Z[X]. 6. LEMA DE ROTH 31 Si estimamos el tama˜ no de |W |, mediante el mismo razonamiento utilizado en el caso de una variable, conseguir´ıamos una cota superior para IndW y por lo tanto una cota superior para IndP . Al igual que el caso de una variable, si imponemos las hip´ otesis necesarias sobre las alturas de las aproximaciones, tendremos que IndP no podr´ a ser muy grande. Roth utiliza un argumento inductivo sobre la cantidad de variables y mediante el uso de Wronskianos generalizados2 logra factorizar uno de estos Wronskianos de m variables en un producto de la forma v(X1 , . . . , Xm−1 )u(Xm ) para poder aplicar la hip´ otesis inductiva sobre estos. ´ n 4. Sea i = (i1 , . . . , im ), definimos el orden del operador diferencial Definicio ∆i = ∂ i1 +...+im i im ∂X11 ...∂Xm como orden(∆i ) = i1 + . . . + im . ´ n 5. Sea k un cuerpo de caracter´ıstica cero y φ1 , . . . , φr ∈ k(X) funDefinicio ciones racionales. Un Wronskiano generalizado de φ1 , . . . , φr es un determinante de la forma det((∆i φj )1≤i,j≤r ), donde ∆1 , . . . , ∆r son operadores diferenciales, con orden(∆i ) ≤ i − 1 i−1 ∂ asico de las funciones Si m = 1 y ∆i = ∂X i−1 se recupera el Wronskiano cl´ racionales φ1 , . . . , φr ∈ k(X) i−1 ∂ W (φ1 , . . . , φr ) = det ∂X i−1 φj . Un Teorema cl´ asico establece que las funciones φ1 , . . . , φr son linealmente independientes sobre k si y solo si W (φ1 , . . . , φr ) 6= 0. Veremos que un resultado de esta ´ındole es v´ alido en m´ as variables. Lema 9. Sea k un cuerpo de caracteristica cero y φ1 , . . . , φr ∈ k(X) funciones racionales. Si φ1 , . . . , φr son linealmente independientes sobre k entonces existe un Wronskiano generalizado de φ1 , . . . , φr no nulo. ´ n. La prueba ser´a por inducci´on en r. Si r = 1, el u Demostracio ´nico Wronskiano generalizado es ∆1 φ1 = φ1 ya que el unico operador diferencial de orden 0 es la identidad. Por lo tanto, en el caso r = 1, el lema dice que φ1 es linealmente independiente sobre k si y solo si φ1 es no nula. Supongamos que el lema es verdadero para cualquier conjunto de r − 1 funciones racionales linealmente independiente sobre k y sean φ1 , . . . , φr k-linealmente independientes. Sea λ ∈ k(X1 , . . . , Xm ) una funci´on racional no nula, las funciones λφ1 , . . . , λφr siguen siendo linealmente independientes sobre k. Observar que cualquier Wronskiano generalizado det(∆i (λφj )) de λφ1 , . . . , λφr es una k(X1 , . . . , Xm )combinacion lineal de Wronskianos generalizados de φ1 , . . . , φr ( donde los coeficientes ser´ an funciones racionales en las derivadas parciales de λ). Para probar el lema, ser´ a suficiente probar que existe un wronskiano generalizado no nulo de λφ1 , . . . , λφr para un λ apropiado. Si tomamos λ = φ−1 1 , podremos suponer que φ1 = 1. Como r > 1, φ1 = 1 y φ2 son linealmente independiente, con lo cual φ2 no ∂φ2 es una constante. Entonces ∂X 6= 0 para algun j. Sin p´erdida de generalidad, J ∂φ2 podemos suponer que ∂X1 6= 0. 2Herramienta utilizada con anterioridad por Siegel. 32 2. EL TEOREMA DE ROTH Sea V el k-espacio vectorial generado por φ1 , . . . , φr y definamos el k-subespacio vectorial de V n o ∂φ W = φ ∈ V | ∂X = 0 , y sea t = dimW . 1 Observar que φ1 ∈ W y φ2 ∈ / W , entonces 1 ≤ t ≤ r − 1. Sean ψ1 , . . . , ψr funciones racionales tal que ψ1 , . . . , ψt es base de W y ψ1 , . . . , ψr es base de V . Por hip´otesis inductiva, existen operadores ∆∗1 , . . . , ∆∗t operadores diferenciales tal que det(∆∗i ψj ) 6= 0 con 1 ≤ i, j ≤ t y orden(∆∗i ) ≤ i − 1. Afirmo que las funciones racionales dientes, pues si ct+1 , . . . , cr ∈ k tal que ∂ψt+1 ∂ψr ∂X1 , . . . , ∂X1 ∂ψr t+1 0 = ct+1 ∂ψ ∂X1 + . . . + cr ∂X1 = son k-linealmente indepen- ∂ ∂X1 (ct+1 ψt+1 + . . . + cr ψ), entonces ct+1 = . . . = cr = 0 pues el subespacio generado por ψt+1 , . . . , ψr posee intersecci´ on nula con W . Aplicando hip´otesis inductiva nuevamente, obtenemos que existen operadores ∆∗t+1 , . . . , ∆∗r operadores diferenciales tal que ∂ψ det(∆∗i ∂Xj1 ) 6= 0 con t + 1 ≤ i, j ≤ r y orden(∆∗i ) ≤ i − r − 1. Definimos operadores ∆i para 1 ≤ i ≤ r como ∗ si 1≤i≤t ∆i ∆i = ∗ ∂ ∆i ∂X1 si t + 1 ≤ i ≤ k Notar que orden(∆i ) ≤ i − 1 y ademas ∂ψ ∆i ψj = ∆∗i ∂Xj1 = ∆∗i 0 = 0 para 1 ≤ j ≤ t y t + 1 ≤ i ≤ r. Se tiene entonces que ∗ ∆i ψ j det((∆i ψj )1≤i,j≤r ) = det 0 ∆∗i ψj ∂ψ ∆∗i ∂Xj1 = det(∆∗i ψj )det(∆∗i ∂ψj ) ∂X1 Por lo tanto, existe un Wronskiano generalizado no nulo de ψ1 , . . . , ψt .Pero como las funcionesPφ1 , . . . , φr y ψ1 , . . . , ψt son base del mismo k-espacio vectorial, se tiene que ψj = l ajl φl con (ajl ) matriz sobre k, inversible. Se tiene entonces P P 0 6= det(∆i ψj ) =det(∆i ( l ajl φl )) =det( l ajl ∆i (φl )) =det(ajl ) det(∆i φl ) 6= 0, y consecuentemente det(∆i φl ) 6= 0, lo que concluye la prueba del lema. Antes de empezar con la demostraci´on del lema de Roth, recordemos la definici´on P de altura de un polinomio que usaremos en el lema. Sea f = i∈I ai xi un polinomio en varias variables sobre un cuerpo de n´ umeros K, sea nυ = [Kυ : Qυ ] y |f |υ = maxi∈I |ai |υ , entonces X 1 h(f ) = log H(f ) = nυ log |f |υ [K : Q] υ∈MK 6. LEMA DE ROTH 33 ¯ 1 , . . . , Xm ] un polinomio con Lema 10. Sea m un entero positivo y P ∈ Q[X coeficientes algebraicos y grXh ≤ rh . Sea β = (β1 , . . . , βm ) una m-upla de n´ umeros algebraicos. Sea η > 0 un n´ umero real fijo tal que m rh+1 (2.12) ≤ η 2 −1 para todo 1 ≤ h ≤ m − 1, rh y (2.13) m η2 −1 min {rh log H(βh )} ≥ logH(P ) + 4mr1 . 1≤h≤m Entonces el ´ındice de P respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) cumple Ind P ≤ 2mη. Dado que siempre se tiene que IndP ≤ m, podremos suponer que η < 1/2, pues de otra forma el resultado se cumplir´a trivialmente. La prueba ser´ a por inducci´on en m, el n´ umero de variables. Para simplificar la notaci´ on, llamaremos K a un cuerpo de n´ umeros que contenga a todos los βh y los coeficientes de P . Y sea d = [K, Q]. Probemos el caso m = 1. Para simplificar notaci´on, escribamos β = β1 y r = r1 . Sea l el orden de anulaci´ on de P (X) en β, entonces P (X) = (X − β)l Q(X), con Q(β) 6= 0. Adem´ as Ind P respecto de r en β es igual a l/r. Usando la desigualdad de Gelfand, tenemos que H(β)rInd P = H(β)l = H(X − β)l ≤ H(X − β)l H(Q) ≤ H(P )2r , lo que implica Ind P ≤ log H(P )+rlog2 rlog H(β) ≤η usando hip´otesis (2.13). Lo que demuestra el caso m = 1. ´ n 3. La cota aqu´ı obtenida es mejor que la enunciada. ConObservacio seguimos una cota igual a η, en lugar de 2η, y solo usamos que ηrlog H(β) ≥ log H(P ) + rlog2 en lugar de ≥ log H(P ) + 4r. Esta observaci´ on ser´ a usada en el paso inductivo con m = 1. Supongamos ahora, que el lema de Roth es cierto para polinomios de grado menor a m y lo probaremos para P (X1 , . . . , Xm ) un polinomio en m variables. Sea rm r1 X r2 X X jm ... Cj1 ...jm X1j1 . . . Xm P (X1 , . . . , Xm ) = j1 =0 j2 =0 jm =0 ¯ Dado que con Cj1 ...jm ∈ Q. P (X1 , . . . , Xm ) = rm X con estilo r1 X jm =0 Cj01 ...jm−1 j1 =0 rm−1 X ... Cj01 ,...,jm−1 X1j1 ...X jm−1 jm Xm , jm−1 =0 ¯ siempre ser´a posible escribir al polinomio como una suma del ∈ Q, P (X1 , . . . , Xm ) = k X ϕj (X1 , . . . , Xm−1 )ψj (Xm ), j=1 ¯ Desde ahora, donde ϕ1 , . . . , ϕk y ψ1 , . . . , ψk son polinomios con coeficientes en Q. tomemos una descomposici´ on con k m´ınimo. En particular, k ≤ rm + 1. ¯ La minimalidad de k, implica que tanto ϕ1 , . . . , ϕk como ψ1 , . . . , ψk , son Q¯ linealmente independientes. Pues de no serlo, existir´an c1 , . . . , ck ∈ Q , no todos 34 2. EL TEOREMA DE ROTH nulos, tal que c1 ϕ1 + · · · + ck ϕk = 0. Supongamos sin p´erdida de generalidad que ck 6= 0, entonces k−1 X cj P (X1 , . . . , Xm ) = ϕj . ψj − ψk , ck j=1 lo que contradice la minimalidad de k. Similarmente, se prueba que ψ1 , . . . , ψk son ¯ linealmente independientes sobre Q. Por Lema 9, se tiene que existe un determinante Wronskiano generalizado no nulo, digamos ∂ i−1 1 6= 0 con 1 ≤ i, j ≤ k, U (Xm ) = det (i−1)! i−1 ψj (Xm ) ∂X m y tambi´en existen operadores ∆0i = 1 ∂ i1 +...+im−1 i1 !...im−1 ! ∂X i1 ...∂X im−1 1 m−1 para 1 ≤ i ≤ k, con orden(∆0i ) = i1 + . . . + im−1 ≤ i − 1 ≤ k − 1 ≤ rm . Tal que V (X1 , . . . , Xm−1 ) := det(∆0i ϕj ) 6= 0 con 1 ≤ i, j ≤ k. Definimos al polinomio W (X1 , . . . , Xm ) por 1 ∂ j−1 0 W (X1 , . . . , Xm ) := det (j−1)! ∆ P = j−1 i ∂Xm ! k X 1 ∂ j−1 det (∆0i ϕr ) ψ = V (X1 , . . . , Xm−1 )U (Xm ) 6= 0. j−1 r (j − 1)! ∂Xm r=1 Por lo tanto, el uso de los determinantes Wronskianos nos permite obtener un polinomio W fuertemente relacionado con P y factorizarlo como el producto de polinomios en menos variables. Por hip´otesis inductiva, lograremos obtener cotas superiores para los ´ındices de U y V , lo que derivara en una cota para W . Dado que W es un polinomio en P y sus derivadas, podremos conseguir una cota inferior para el ´ındice de W en funci´ on del ´ındice de P . Observar que W ∈ K[X1 , . . . , Xm ] y dado que U y V no comparten variables, a partir de la definici´ on de altura se tendr´a que h(U ) + h(V ) = h(W ). Para poder aplicar el lema de Roth, necesitaremos cotas para los grados y las alturas de U y V . ´ n 2. Las siguientes estimaciones son validas Afirmacio (1) grXm (U ) ≤ krm y grXj (V ) ≤ krj para todo 1 ≤ j ≤ m − 1. (2) h(U ) + h(V ) = h(W ) ≤ k(h(P ) + 4r1 ) ´ n. (1) En efecto, los determinantes que definen a U y V son de Demostracio tama˜ no k y cada entrada posee grado a lo sumo rj respecto de Xj . (2) Desarrollando el determinante que define a W por columnas tenemos que W = X (−1)sg(π) π k Y ∆0i ∂π(i) P . i=1 Por definici´ on de altura, X 1 h(W ) = nυ log [K : Q] υ∈MK ! k X Y sg(π) 0 ∆i ∂π(i) P . (−1) π i=1 υ 6. LEMA DE ROTH 35 Si υ es arquimediano se tiene que |f1 + . . . + fr |υ ≤ r max |fj |υ , mientras que si υ es no-arquimediano |f1 + . . . + fr |υ ≤ max |fj |υ . Aplicando estas propiedades a la suma sobre las permutaciones obtenemos que k Y X 1 0 nυ max log ∆i ∂π(i) P + log(k!). h(W ) ≤ π [K : Q] i=1 υ∈MK υ El lema de Gauss establece que si υ es no-arquimediano entonces |f.g|υ = |f |υ |g|υ , mientras que si υ es arquimediano por la desigualdad de Gelfand, |f1 . . . fr |υ ≤ 2d |f1 |υ . . . |fr |υ con d la suma de los grados parciales de f1 . . . fr . Aplic´andolos a nuestra desigualdad obtenemos que h(W ) = k X X 1 nυ max log ∆0i ∂π(i) P υ + k(r1 + . . . + rm ) log 2 + log(k!). π [K : Q] i=1 υ∈MK Si υ es no-arquimediano entonces ∆0i ∂π(i) P υ ≤ |P |υ mientras que en el caso arqi 0 umediano ∆i ∂π(i) P υ ≤ 2r1 +...+rm |P |υ . Esto implica que h(W ) ≤ k X (h(P ) + (r1 + . . . + rm ) log 2) + k(r1 + . . . + rm ) log 2 + log(k!) = i=1 kh(P ) + k(r1 + . . . + rm )2 log 2 + log(k!). Por hip´ otesis, m−1 r1 + . . . + rm ≤ r1 (1 + η 0 + . . . + η 0m−1 ) con η 0 = η 2 . Dado que η ≤ 1/2 y que m ≥ 2, se tiene que η 0 ≤ 1/4 y r1 + . . . + rm ≤ 4/3 r1 . Por otro lado, log(k!) k ≤ log(k) ≤ k − 1 ≤ rm ≤ 21 r1 , y por lo tanto, h(W ) ≤ k h(P ) + 4 3 2log2 + 1 2 r1 ≤ k(h(P ) + 4r1 ). Observar que la constante 4 puede ser reemplazada por la constante m´as chica 4 1 on ser´a utilizada m´as adelante. 3 2 log2 + 2 ≈ 2, 35. Esta observaci´ Ahora usaremos inducci´ on para acotar el ´ındice de U ,V y W . ´ n 3. Si el lema de Roth es verdadero para menos de m variables, Afirmacio entonces m−1 Ind(U ; rm ; βm ) ≤ kη 2 y Ind(V ; r1 , . . . , rm−1 ; β1 , . . . , βm−1 ) ≤ 2k(m − 1)η 2 ; y por lo tanto el ´ındice de W respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) cumple que Ind W = Ind(U ; rm ; βm ) + Ind(V ; r1 , . . . , rm−1 ; β1 , . . . , βm−1 ) ≤ m−1 kη 2 + 2k(m − 1)η 2 . 36 2. EL TEOREMA DE ROTH ´ n. Queremos aplicar el lema de Roth para V , que es un poliDemostracio nomio en m0 = m−1 variables, con rj0 = krj y η 0 = η 2 . Verifiquemos que se cumplen las hip´ otesis del lema. Se tiene que grXj (V ) ≤ rj0 por Afirmaci´on 2. Condici´on 2.12 se cumple pues 0 rj+1 rj0 = rj+1 rj m−1 ≤ η2 m0 −1 = η 02 . Veamos que vale la condici´ on (2.13), m−1 rj0 h(βj ) = krj h(βj ) ≥ kη −2 m0 −1 (h(P ) + 4mr1 ) = kη 0−2 (h(P ) + 4mr1 ). Dado que h(V ) ≤ h(W ) ≤ k(h(P ) + 4r1 ) obtenemos que k(h(P ) + 4r1 ) ≥ h(V ) + 4m0 kr1 . Por lo tanto, se verifican todas las hip´otesis del lema. Entonces la hip´otesis inductiva asegura que 0 Ind(V ; r1 , . . . , rm−1 ; β1 , . . . , βm−1 ) = kInd(V ; r10 , . . . , rm−1 ; β1 , . . . , βm−1 ) ≤ 0 0 2 k(2m η ) = 2k(m − 1)η . m−1 Para aplicar el lema de Roth al polinomio de una variable a U , con η 00 = η 2 0 , por Afirmaci´on 2. Como m = 1, la y r00 = krm . Tenemos que grXm (U ) ≤ rm primer condici´ on 2.12 es vacia, con lo cual solo hay que verificar (2.13). Para ver esto, usaremos la versi´ on mejorada del lema de Roth en una variable, Comentario 3. Entonces h(U ) + r00 log2 ≤ k(h(P ) + c1 r1 ) + krm log2 ≤ k(h(P ) + c1 r1 ) + k 21 r1 log2 ≤ m−1 k(h(P ) + 4r1 ) ≤ kη 2 rm h(βm ) = η 00 r00 h(βm ). (donde c1 = 4/3 2log2 + 1/2 ≈ 2, 35 y c1 + 1/2 log2 < 4). Como las hipotesis se cumplen, aplicamos lema de Roth para una variable y obtenemos m−1 Ind(P ; rm ; βm )(U ) = kInd(P ; r00 ; βm )(U ) ≤ kη 00 = kη 2 . El siguiente paso ser´ a relacionar el ´ındice de W con el ´ındice de P . A partir de la definici´ on de W , se sigue que si P se anula con orden alto en (β1 , . . . , βm ), lo mismo pasara con los coeficientes de la matriz que define a W y entonces W tambi´en poseer´ a orden alto. A continuaci´on, cuantificaremos esta observaci´on. ´ n 4. Se tiene que Afirmacio rm IndW ≥ k2 min IndP, (IndP )2 − k rm−1 . ´ n. Estimaremos primero el ´ındice de los coeficientes de la matriz Demostracio que define W respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ). Recordar que orden(∆0i ) = i1 + . . . + im−1 ≤ i − 1 ≤ k − 1 ≤ rm y r1 ≥ r2 ≥ . . .; aplicando Lema 2 tendremos que ∂ j−1 1 = Ind ∂i1 ,...,im−1 ,j−1 P ≥ Ind ∆0i (j−1)! j−1 P ∂X m i1 +...+im−1 j−1 rm IndP − ri11 − · · · − rim−1 − j−1 − j−1 rm ≥ IndP − rm−1 rm ≥ Ind(P ) − rm−1 − rm . m−1 Desarrollando el determinante que define a W por columnas se tiene que W = k X Y (−1)sg(π) ∆0i ∂π(i) P . π i=1 6. LEMA DE ROTH 37 Observemos que W es suma de productos de k elementos, uno de cada columna, los cuales son de la forma ∂i1 ...,im−1 ,j−1 P . Por Lema 2 se tiene que el indice de W es mayor o igual al m´ınimo de los ´ındices de cada uno de los sumandos, es decir, ( !) k Y 0 IndW ≥ min Ind ∆i ∂π(i) P . π i=1 Aplicando nuevamente Lema 2, se tiene que el ´ındice de un producto es igual a la suma de los ´ındices de cada factor, y dado que cada sumando del desarrollo del determinante tiene un representante de cada columna se obtiene as´ı que IndW ≥ k X j=1 min i1 ,...,im−1 Ind ∂i1 ,...,im−1 ,j−1 P . Sustituyendo en esta desigualdad la cota obtenida m´as arriba para Ind ∂i1 ...,im−1 ,j−1 P , en los casos en los que sea positivo, obtenemos que o n Pk rm − j−1 IndW ≥ j=1 max Ind(P ) − rm−1 rm , 0 ≥ n o Pk j−1 m max Ind(P ) − , 0 − rkr . j=1 rm m−1 Por lo tanto, para probar nuestra afirmaci´on, ser´a suficiente ver que k X j−1 k Ind(P ) − ≥ min IndP, (IndP )2 . rm 2 j=1 Separaremos en dos casos. Caso 3. IndP ≥ k−1 rm En este caso tendremos que k X j−1 (k − 1)k k Ind(P ) − = kIndP − ≥ IndP . rm 2rm 2 j=1 Caso 4. IndP ≤ k−1 rm Sea N = [rm IndP ], con lo cual nuestra suposici´on implica que N ≤ k − 1. Entonces nuestra inecuaci´ on en cuesti´on resulta N +1 X j−1 N (N + 1) Ind(P ) − = (N + 1).IndP − = r 2rm m j=1 [rm IndP ] 1 1 k (N + 1). IndP − ≥ (N + 1). IndP ≥ rm IndP. IndP ≥ (IndP )2 2rm 2 2 2 si tenemos que k ≤ rm . Si llegara a pasar que k = rm + 1, la cantidad que queremos acotar ser´a N +1 X j−1 N (N + 1) q(N ) := Ind(P ) − = (N + 1)IndP − . r 2rm m j=1 Observar que q(N ) es cuadr´ atica en N . Por definici´on de N , es este caso tendremos (k − 1)IndP − 1 ≤ N ≤ (k − 1)IndP . 38 2. EL TEOREMA DE ROTH Calculando el valor de q en los extremos de la desigualdad se puede ver a partir de un calculo directo que q((k − 1)IndP − 1) = q((k − 1)IndP ) = (k−1)(IndP )2 +IndP 2 . Por lo tanto, como q como funci´on cuadratica posee coeficiente principal negativo, q(N ) ≥ (k−1)(IndP )2 +IndP 2 ≥ k(IndP )2 , 2 donde la u ´ltima desigualdad se debe a que bajo nuestras suposiciones, IndP ≤ 1. Se completa as´ı la afirmaci´ on hecha. Estamos ahora en condiciones de terminar la prueba del lema de Roth. Dado que IndP ≤ m por definici´ on de ´ındice, Afirmaci´on 4 implica que )2 krm , IndW + rm−1 ≥ k2 min IndP, (IndP )2 ≥ k(IndP 2m mientras que por Afirmaci´ on 3 se tiene que IndW + krm rm−1 m−1 ≤ 2k(m − 1)η 2 + kη 2 + krm rm−1 ≤ k(2(m − 1)η 2 + 2η 2 2 m−1 ). 2 Por lo tanto, comparando estas desigualdades obtenemos que (IndP ) ≤ 4η m2 , lo que implica IndP ≤ 2mη. 7. Prueba del teorema de Roth Probaremos a continuaci´ on el teorema de Roth. La versi´on que demostraremos ser´ a la obtenida luego de aplicar las reducciones probadas al principio del capitulo. Observar que se ha cambiado δ en lugar de ε y que se reemplazara la condici´on de aproximaci´ on min {kαυ − βkυ , 1} por la condici´on m´as fuerte kαυ − βkυ . Teorema 2.6. Sea K un cuerpo de n´ umeros, S ⊂ MK un conjunto finito de valores absolutos sobre K y asumamos que cada valor absoluto en S ha sido ¯ Para cada υ ∈ S, sea αυ ∈ K ¯ un entero algebraico. extendido de alguna forma a K. Sea δ > 0 y sea X ξ : S → [0, 1] una funci´ on que cumple ξυ = 1. υ∈S Entonces existen finitos β ∈ K que satisfacen (2.14) kαυ − βkυ ≤ 1 HK (β)(2+δ)ξυ para todo υ ∈ S. ´ n. Para probar el teorema, supondremos que hay infinitas soluDemostracio ciones y llegaremos a una contradicci´on. Probarlo para δ m´as chico que alguna constante solo har´ a el resultado m´as fuerte, asumiremos entonces 0 < δ < 1. Dado que necesitaremos hacer referencia a las condiciones del Teorema 2.5, Proposici´on 3 y Lema 10, haremos una lista de dichas condiciones para que la lectura de la demostraci´ on sea m´ as sencilla. La constante B = B(αυ ; υ ∈ S) esta definida en Teorema 2.5 y la constante C = C({αυ }υ∈S , δ, K) es la definida en Proposici´on 3: Ps 2 Teorema 2.5 (2.7) m > 16 ( t=1 dυ ) ε−2 . r1 +...+rm Teorema 2.5-(3) |P | ≤ B . δ Proposicion 3 (2.8) 0 < ε < 22 . Proposicion 3 (2.9) kαυ − βυ kυ ≤ HK (βυ 1)(2+δ)ξυ . 7. PRUEBA DEL TEOREMA DE ROTH 39 Proposicion 3 (2.10) D := min1≤h≤m {HK (βh )rh } ≤ max1≤h≤m {HK (βh )rh } ≤ D1+ε . Proposicion 3 (2.11) C ≤ HK (βh ). Lema 10 (2.12) rh+1 ≤ ωrh . Lema 10 (2.13) logH(P ) + 4mr1 ≤ ω log D. Elegiremos los par´ ametros ε, m, ω, β1 , . . . , βm , r1 , . . . , rm , P (X1 , . . . , Xm ) en el siguiente orden (1) Tomemos ε tal que 0 < ε < δ/22. En particular ε cumple (2.8); notar ademas que ε < 1/22 < 1. Ps 2 (2) Elijamos m un entero tal que m > 16 ( t=1 dυ ) ε−2 donde dυ es el grade m−1 de αυ . Entonces (2.7) se cumple. Definimos ω = ω(m, ε) = (ε/4)2 . Lo −m+1 2 que implica que 2ω = ε/2 < ε. (3) Como estamos asumiendo que (2.14) posee infinitas soluciones en K, dado que K posee finitos elementos de altura acotada, podemos elegir β1 ∈ K cuya altura cumple H(β1 ) ≥ C y log H(β1 ) ≥ m(logB+4) . ω (4) Luego elegimos sucesivamente β2 , . . . , βm soluciones de (2.14) que satisfagan HK (βh+1 )ω ≥ HK (βh )2 para todo 1 ≤ h < m. En particular, como ω < 1, se tendr´a que HK (βh ) ≥ HK (β1 ). Es decir, la sucesi´ on HK (βh ) ser´ a creciente, y (2.11) se cumplir´a por la elecci´on hecha en (3). (5) Sea r1 un entero que cumpla HK (β1 )ωr1 ≥ HK (βm )2 . (6) Queremos elegir enteros r2 , . . . , rm de forma tal que todos los HK (βh )rh sean aproximadamente iguales. Definimos r2 , . . . , rm como los enteros m l m l r1 logH(β1 ) 1 logHK (β1 ) = . rh = rlogH (β ) logH(β ) K h h Para verificar la condici´on (2.10), calculamos r1 logH(β1 ) ≤ rh logH(βh ) por definicion de rh y dte ≥ t ≤ r1 logH(β1 ) + logH(βh ) definicion de rh y dte ≤ t + 1 ≤ r1 logH(β1 ) + logH(βm ) puse HK (βh ) es creciente a partir de (4) ≤ (1 + ε)r1 logH(β1 ) por la eleccion de r1 en (5). Exponenciando obtenemos (2.10). (2.12) Verificamos ahora la condici´on r1 logH(β1 ) r1 logH(β1 ) rh+1 = / ≤ rh logH(βh+1 ) logH(βh ) r1 logH(β1 ) r1 logH(β1 ) logH(βh ) logH(β1 ) +1 / = + ≤ logH(βh+1 ) logH(βh ) logH(βh+1 ) r1 logH(β1 ) ω ω + = ω. 2 2 40 2. EL TEOREMA DE ROTH (7) Dado que m fue elegido para cumplir (2.7), aplicamos Teorema 2.5 para producir un polinomio P (X1 , . . . , Xm ) con coeficientes enteros tal que grXh P ≤ rh y cumpla |P | ≤ B r1 +...+rm . (8) Ya hemos verificado que las condiciones (2.8),(2.9), (2.10) y (2.11) se cumplen, entonces aplicando Proposicion 3 obtenemos que el ´ındice de P respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) cumple IndP ≥ mε. (9) Para poder aplicar el lema de Roth, nos falta verificar (2.13). En efecto, como logD = min1≤h≤m {rh logH(βh )} = r1 logH(β1 ) se tiene que log|P |+4mr1 logD ≤ (r1 +...+rm )logB(α)+4mr1 logD ≤ m(logB+4) logH(β1 ) ≤ ω. Esto completa la verificaci´on de las hip´otesis del lema de Roth tomando −m+1 η = ω2 = ε/4, entonces se concluye que el ´ındice de P respecto de (r1 , . . . , rm ) en (β1 , . . . , βm ) satisface IndP ≤ 2mη = mε/2. Obtenemos as´ı una cota superior e inferior para el ´ındice de P que se contradicen. As´ı se completa la demostraci´on del teorema de Roth. CAP´ITULO 3 Aplicaciones 1. Sobre el desarrollo decimal de n´ umeros algebraicos A continuaci´ on veremos un ejemplo sencillo sobre c´omo utilizar el Teorema de Roth para estudiar el desarrollo decimal de n´ umeros algebraicos, lo que derivara en un criterio de trascendencia. El Teorema de Liouville visto en el Capitulo 1, implica que si {an } es una sucesi´on creciente de enteros positivos que cumple liminf an+1 umero an = ∞, entonces el n´ X 1 n 10an resulta trascendente. Veamos que podemos reemplazar la condici´on = ∞ por > 1. Sea S 0 un conjunto finitos de primos. Diremos que un n´ umero racional β = a/b con (a, b) = 1, es un S 0 -entero, si el denominador es divisible solamente por primos de S 0 . Recordando la f´ ormula del producto ! n o n o −1 Y Y H(β) = max 1, |β|p = min 1, |β|p , p p y usando que H(β) = H(1/β) se tiene que en particular si β es un S 0 -entero, entonces −1 n o Y H(β) = min 1, 1/ |β|p . p∈S 0 Sea α un n´ umero algebraico. Si aplicamos el teorema de Roth (segun el comentario (4) hecho en la secci´on 1 del capitulo 2) en el caso K = Q, S = S 0 ∪ ∞, α∞ = α, αp = ∞ para todo p ∈ S 0 , se obtiene que dado ε > 0, existen finitos β ∈ Q para los cuales n o Y 1 min {1, |α − β|} min 1, 1/ |β|p < . 2+ε H(β) 0 p∈S Usando el comentario anterior, se concluye que la desigualdad (3.1) |α − β| < 1 H(β)1+ε posee finitas soluciones en S 0 -enteros. Una consecuencia de este hecho es que la expresi´on decimal de un n´ umero algebraico no puede tener bloques de ceros “muy grandes”. M´as precisamente, sea 0.a1 a2 . . . la expresi´ on decimal de un n´ umero algebraico, y para cada n definamos l(n) como el m´ınimo l ≥ 0 tal que an+l 6= 0; entonces l(n) = o(n) con n → ∞. Pues consideremos β = 0, a1 . . . an con an 6= 0, entonces 41 42 3. APLICACIONES α−β = X i≥n+l(n) X 1 ai 9 1 ≤ = n+l(n) . i i n+l(n) 10 10 10 10 i≥0 Por lo tanto, para no entrar en contradicci´on con (3.1), para todo ε > 0, debe valer que l(n) < εn, para n suficientemente grande. En particular, si {an } es una sucesi´on creciente de enteros positivos que no cumpla an+1 − an = o(n), por ejemplo si liminf aan+1 > 1, el n´ umero n X 1 10an n resulta trascendente. Por ejemplo, podemos tomar an = 2n . Esto es solo un caso sencillo de un resultado obtenido por Ferenczi y Mauduit [13], que esencialmente establece que si la expresi´ on en base b ≥ 2 de un n´ umero contiene infinitas potencias (2+ε) de bloques (esto es un bloque seguido de sigo mismo y luego por su comienzo, de tama˜ no relativo al menos ε), a distancia del origen no mucho m´as grande que la longitud del bloque considerado, el n´ umero resulta trascendente. Veremos en el capitulo siguiente un resultado m´as fuerte que este que se obtiene a partir de Teorema del Subespacio, una generalizaci´on multidimensional del Teorema de Roth. 2. El problema de Waring En 1770, Lagrange prob´ o un problema de Diofanto, el cual asegura que todo entero positivo puede ser escrito como suma de 4 cuadrados. El mismo a˜ no, Waring afirmo, sin demostraci´ on, que todo entero positivo se pod´ıa escribir como suma de 9 cubos, 19 potencias cuartas y en general como s potencias k-esimas para alg´ un s. Se define el n´ umero g(k) como el menor entero tal que todo entero positivo se puede escribir como la suma de como mucho g(k) potencias k-esimas positivas. En 1909 Hilbert prob´ o que en generaljg(k) k < ∞. Como fue observado por J.A.Euler(hijo de j k k k k 2 − 1 requiere 32 − 1 potencias 2k y 2k − 1 Leonhard Euler), el n´ umero 23 j k k potencias 1k para su representacion, probando asi que g(k) ≥ 2k + 32 − 2. Luego del tabajo de Hardy, Littlewood, y Vinogradov en el problema de Waring, se prob´ o que para algun entero c(k), que pod´ıa ser calculado en funci´on de k, todo entero podr´ıa ser escrito como suma de menos de g(k) potencias k-esimas. Por lo tanto, q ´ue realizar finitos c´alculos para probar que todo entero menor a c(k) podr´ıa ser escrito con a lo sumo g(k) potencias k-esimas. Este trabajo fue llevado a cabo en una serie de papers por Dickson, Pillai, Rubugunday, y Niven, entre otros matem´ aticos. Todos estos trabajos se reducen en el siguiente teorema: Teorema 3.1. Sea k ≥ 6, si la siguiente inecuaci´ on se verifica k $ k %! $ k % 3 3 3 − + ≤ 2k , (3.2) 2k . 2 2 2 j k k entonces g(k) = 2k + 23 − 2. Mientras que si, j k j k k k k 2k . 23 − 32 + 32 > 2k , j k j k j k j k k k k k si definimos N (k) = 23 . 43 + 32 + 43 se tiene que j k j k k k g(k) = 32 + 43 + 2k − 3 si 2k < N (k), o ´ 3. ECUACIONES DIOFANTICAS g(k) = j 3 k 2 k + j 4 k 3 k 43 + 2k − 2 si 2k = N (k). Mahler prob´ oj usando la versi´on p-adica del teorema de Roth dada por Ridiout k k que g(k) = 2k + 32 − 2 para todo k suficientemente grande. Apliquemos el teorema tomando K = Q, S = {∞, 2, 3}, α∞ = 1, α2 = ∞, α3 = 0, y sea β = 3k /(n.2k ) con n = 23 . Se tiene que |α2 − β|2 = 2−k |n|2 , |α3 − β| = 3−k |n|−1 on 3 . Por lo tanto, por el teorema de Roth, la inecuaci´ −2−ε |α∞ − β|∞ |α2 − β|2 |α3 − β|3 = |1 − 3k /(n.2k )|.2−k |n|2 .3−k |n|−1 3 < H(β) posee finitas soluciones sobre k. En particular, usando que |n|2 ≤ 1 y que por definici´ on de altura, 3k |n|3 ≤ H(β). Se tendr´a que la desigualdad m´as fina k −2−ε |1 − 3k /(n.2k )|.2−k .3−k |n|−1 3 < (3 |n|3 ) tambi´en posee finitas soluciones sobre k. Despejando, multiplicando por n y usando que (2/3)k .n ≥ 1 y que 1 ≥ |n|3 , se tendr´a que la inecuaci´on l m k 3 k − 32 ≥ 3−εk 2 es v´ alida para todos salvo un n´ umeros finitos de enteros positivos k, para cualquier ε > 0 fijo. Si tomamos ε = log(4/3)/log 3, y usando que esta desigualdad j implica k k (3.2), deducimos el teorema de Mahler, que asegura que g(k) = 2k + 32 −2 para todo entero k suficientemente grande. Debido a la inefectividad del teorema de Roth, sigue siendo un problema abierto determinar efectivamente un k0 para el cual el resultado sea v´ alido para k ≥ k0 . 3. Ecuaciones Diof´ anticas Ya hemos mencionado que gran parte de esta teor´ıa se ha desarrollado con el fin de resolver ciertas ecuaciones diof´anticas o al menos poder determinar la finitud de su conjunto de soluciones. Como fue mostrado en el Cap´ıtulo 1, con su resultado sobre aproximaciones diof´anticas, Thue fue capaz de probar que que llamada Ecuaci´ on de Thue, F (X, Y ) = m, posee finitas soluciones enteras, si F es un polinomio homog´eneo irreducible sobre Q[X, Y ] con coeficientes enteros y m un entero no negativo. Probaremos ahora un resultado m´as general utilizando el teorema de Roth sobre Q y el valor absoluto usual. Recordemos que en este caso el teorema de Roth es equivalente a que si α es algebraico de grado d ≥ 3, y k > 2, entonces existe una constante c(α, k) > 0 tal que |α − ξ| ≥ c(α, k)H(ξ)k , para todo ξ ∈ Q. Para d = 1 o 2, el teorema de Liouville asegura que una desigualdad de este estilo sigue valiendo. Un polinomio homog´eneo F (X, Y ) ∈ Z[X, Y ] se dir´a libre de cuadrados si no es divisible por G(X, Y )2 para algun polinomio homog´eneo G ∈ Z[X, Y ]. Teorema 3.2. Sea F (X, Y ) ∈ Z[X, Y ] un polinomio homog´eneo libre de cuadrados de grado d ≥ 3. Entonces para todo k > 2 existe una constante c(F, k) > 0 tal que para par de enteros (x, y) con F (x, y) 6= 0 se tiene que (3.3) d−k |F (x, y)| ≥ c(F, k) max {|x|, |y|} . 44 3. APLICACIONES Si F posee grado d ≤ 2, el teorema es verdadero trivialmente ya que |F (x, y)| ∈ Z, luego ≥ 1. ´ n. Se probara la desigualdad solo para los pares de enteros (x, y) Demostracio con |y| ≥ |x|. Intercambiando los roles de x e y, con el mismo argumento se prueba la desigualdad para los pares (x, y) con |x| > |y|. Luego, nos restringiremos al caso en el que |y| ≥ |x| y F no es divisible por Y . Si F es divisible por Y , tendremos que F = Y.F1 , con F1 ∈ Z[X, Y ] un polinomio homog´eneo libre de cuadrados de grado d − 1 ≥ 2, el cual no es divisible por Y . Por lo tanto, si la desigualdad se cumple para F1 con d − 1 en lugar de d, se cumple autom´ aticamente para F . Supongamos entonces que F es un polinomio homog´eneo de grado d ≥ 2, libre de cuadrados, que no es divisible por Y . Luego F (X, Y ) = a0 X d + a1 X d−1 Y + · · · + ad Y d , a0 6= 0, y entonces, F (X, Y ) = a0 (X − α1 Y ) . . . (X − αd Y ) con α1 , . . . , αd distintos, pues F es libre de cuadrados. Sea (x, y) un par de enteros con F (x, y) 6= 0 y |y| ≥ |x|. Como y 6= 0, sea ξ := x/y. Observar que |y| = max {|x|, |y|} ≥ H(ξ)(con igualdad si mcd(x, y) = 1). Sea i el ´ındice para el cual |ξ − αi | = minj=1,...,d |ξ − αj |. Por el teorema de Roth, tendremos que existe una constante c(αi , k) tal que −k |ξ − αi | ≥ c(αi , k)H(ξ)−k ≥ c(αi , k) max {|x|, |y|} . Para j 6= i, se tiene que |αi − αj | ≤ |αi − ξ| + |ξ − αj | ≤ 2|ξ − αj | lo que implica que |ξ − αj | ≥ 21 |αi − αj |. Por lo tanto, Qd Qd d |F (x, y)| = |y|d .|a0 | j=1 |ξ − αj | = max {|x|, |y|} |a0 | j=1 |ξ − αj | ≥ Q d−k d−k = c0 (αi , k) max {|x|, |y|} . c(αi , k)|a0 | j6=i 12 |αi − αj | . max {|x|, |y|} Tomando el m´ınimo sobre las constantes c0 (αi , k) para i = 1, . . . , d, obtenemos el resultado deseado. Corolario 2. Sea F (X, Y ) un polinomio homog´eneo en Z[X, Y ] libre de cuadrados de grado d ≥ 3, y sea G(X, Y ) ∈ Z[X, Y ] un polinomio de grado total ≤ d − 3. Entonces existen finitas pares (x, y) ∈ Z2 tal que F (x, y) = G(x, y) y F (x, y) 6= 0. P ´ n. Sea G(X, Y ) = i+j≤d−3 aij X i Y j , entonces si (x, y) ∈ Z se Demostracio tendr´ a que P i+j d−3 |G(x, y)| ≤ (i+j≤d−3) |aij | max {|x|, |y|} ≤ C1 . max {|x|, |y|} . Sea (x, y) ∈ Z tal que F (x, y) 6= 0 y F (x, y) = G(x, y) entonces |F (x, y)| = |G(x, y)| ≤ C1 max {|x|, |y|} d−3 . ´ 3. ECUACIONES DIOFANTICAS 45 Sea 2 < k < 3, entonces por el teorema anterior, existe C2 > 0 tal que para todo (x, y) con F (x, y) 6= 0, |F (x, y)| ≥ C2 max {|x|, |y|} d−k . Por lo tanto, max {|x|, |y|} 3−k ≤ C3 , como 3 − k > 0, concluimos lo deseado. Si tomamos G(x, y) = m 6= 0, obtenemos nuevamente la Ecuaci´on de Thue. La condici´ on F (x, y) 6= 0 es necesaria pues si F y G posee alg´ un factores lineal en com´ un, con coeficientes racionales, habr´a infinitas soluciones tal que F (x, y) = G(x, y) = 0. Siegel fue el primero en probar un teorema de aproximaciones racionales sobre cuerpos de n´ umeros algebraicos, lo que le permit´ıo llegar a resultados m´as generales y probar la finitud de soluciones de ciertas ecuaciones sobre el anillo de enteros de un cuerpo de n´ umeros. Podemos generalizar la ecuaci´on de Thue en este contexto. De hecho, podremos considerar otro tipo de ecuaciones diof´anticas que tambi´en posee finitas soluciones. En lo que sigue K ser´a un cuerpo de n´ umeros y RK su anillo de enteros. ´ n 4. Las siguientes afirmaciones son equivalentes Proposicio • (M) Para todo cuerpo de n´ umeros K y todo elemento no nulo k ∈ K, la ecuaci´ on de Mordell Y 2 = X3 + k posee finitas soluciones (x, y) ∈ RK × RK . • (E) Para todo cuerpo de n´ umeros K y todo polinomio f ∈ K[X] de grado 3 con tres ra´ıces complejas distintas, la ecuaci´ on el´ıptica Y 2 = f (X) posee finitas soluciones (x, y) ∈ RK × RK . • (HE) Para todo cuerpo de n´ umeros K y todo polinomio f ∈ K[X] de grado al menos 3 con ra´ıces complejas simples, la ecuaci´ on hiperel´ıptica 2 Y = f (X) posee finitas soluciones (x, y) ∈ RK × RK . • (SE) Para todo cuerpo de n´ umeros K, todo entero m ≥ 3 y todo polinomio f ∈ K[X] con al menos dos ra´ıces complejas distintas cuyos ordenes de multiplicidad son coprimos con m, la ecuaci´ on superel´ıptica m Y = f (X) posee finitas soluciones (x, y) ∈ RK × RK . • (T) Para todo cuerpo de n´ umeros K, para todo elemento no nulo k ∈ K y elementos α1 , . . . , αn en K con # {α1 , . . . , αn } ≥ 3, la ecuaci´ on de Thue (X − α1 Y ) . . . (X − αn Y ) = k posee finitas soluciones (x, y) ∈ RK × RK . • (S) Para todo cuerpo de n´ umeros K y elementos a1 , a2 ∈ K no nulos, la ecuaci´ on de Siegel a1 U + a2 V = 1 46 3. APLICACIONES ∗ ∗ posee finitas soluciones (u, v) ∈ RK × RK . Cada una de estas afirmaciones es un teorema: Mordell prob´o (M) en el caso de n´ umeros enteros, y Thue lo hizo con (T), las primeras cuatro resultados son un caso particular del Teorema de Siegel sobre finitud de soluciones en el anillo de enteros de un cuerpo de n´ umeros para curvas F (X, Y ) = 0 que poseen genero al menos uno. Veremos c´ omo se utiliza el Teorema de Roth para probar la finitud de la ecuaci´ on de Siegel. De hecho probaremos un resultado m´as general debido a Mahler quien fue el primero en trabajar con aproximaciones en cuerpos p-´adicos. Luego probaremos como deducir la finitud de soluciones enteras en caso de curvas hiperel´ıpticas. Para una prueba completa de la equivalencia entre estos enunciados el lector se puede dirigir a [34]. En lo que sigue, S ⊂ MK ser´a un subconjunto finito de valores absolutos sobre K que contiene a todos los valores absolutos arquimedianos y notaremos por RS al anillo de S-enteros RS = {x ∈ K| |x|υ ≤ 1 ∀ υ ∈ / S}. El Teorema de Dirichlet sobre las unidades de RK establece que el rango del grupo de unidades del anillo de enteros de un cuerpo de n´ umeros es igual a r1 + r2 − 1, con r1 la cantidad de embedding reales de K en C y 2.r2 la cantidad de embeddings no reales. En el caso de S-enteros, este teorema sigue valiendo y el rango RS ser´a igual a r1 + r2 − 1 + |S|. Teorema 3.3 (Siegel-Mahler). Sea K/Q un cuerpo de n´ umeros, sea S ⊂ MK un subconjunto finito de valores absolutos sobre K que contiene a todos los valores absolutos arquimedianos, sea RS el anillo de S-enteros de K y sean a, b ∈ K ∗ . Entonces la ecuaci´ on (3.4) aU + bV = 1 tiene solo finitas soluciones en S-unidades U, V ∈ RS ´ n. Sea m un entero fijo, suficientemente grande(alcanzara con Demostracio tomar m = 2#S + 1). El teorema de S-unidades de Dirichlet implica que el grupo m cociente RS∗ / (RS∗ ) es finito. Sea c1 , . . . , cr un conjunto de representantes. Entonces toda soluci´ on (U, V ) de (3.4) se puede escribir de la forma U = ci X m V = cj Y m para algun X, Y ∈ RS∗ y algun ci , cj , y por lo tanto (X, Y ) es soluci´on de la ecuaci´on aci X m + bcj Y m = 1. Como hay finitas elecciones posibles para ci y cj , ser´a suficiente probar que para α, β ∈ K ∗ , la ecuaci´ on αX m + βY m = 1 tiene finitas soluciones con X, Y ∈ RS∗ . Supongamos por el contrario, que poseemos infinitas soluciones para una ecuaci´on de este estilo. Como el conjunto S es finito, por el principio del palomar podremos encontrar un valor absoluto ω ∈ S, para el cual la ecuaci´on αX m + βY m = 1 posee infinitas soluciones (X, Y ) y adem´as ´ 3. ECUACIONES DIOFANTICAS 47 kY kω = max {kY kυ |υ ∈ S}. Sea γ una ra´ız m-esima de -β/α, que luego ser´a determinada apropiadamente. Entonces Y X Xm β 1 Xm m = + − γ = = − ζγ , αY m Ym α Ym Y ζ∈µm donde el producto est´ a tomado sobre todas las ra´ıces m-esimas de la unidad. Dado que hay infinitas soluciones, Y tiene valor absoluto no acotado con lo cual alguno de los factores del producto ser´a chico. De hecho, solo uno de ellos podr´a ser chico. En efecto, si ζ, ζ 0 ∈ µm son ra´ıces m-´esimas de la unidad distintas, usando la desigualdad triangular tendremos que X − ζγ + X − ζ 0 γ ≥ |ζ 0 γ − ζγ| ≥ C1 . Y Y ω ω Donde la constante C1 = C1 (α, β, S, m) es independiente de X e Y . Por esta desigualdad, en el producto, todos salvo quiz´as uno de los factores deben ser mayores a C1 /2. Entonces m−1 Y X X C1 1 − ζγ ≥ min − ζγ . = m ζ∈µm Y |αY |ω Y 2 ω ω ζ∈µm Por lo tanto, existe una constante C2 = C2 (α, β, S, m) tal que X 1 − ζγ m ≥ C2 min . ζ∈µ Y kY kω m ω Para cada solucion (X, Y ), existir´a al menos una ra´ız m-´esima de la unidad ζ, que alcanza el m´ınimo del lado derecho de la inecuaci´on anterior. Como estamos suponiendo que tenemos infinitas soluciones y hay finitas ra´ıces m-esimas, entonces podemos suponer que hay infinitas soluciones X, Y ∈ RS∗ de la ecuaci´on αX m + βY m = 1 que cumplen X 1 . ≥ C − ζγ 2 m Y kY kω ω Esto nos dice que X/Y es una buena aproximaci´on de ζγ. Para poder aplicar el m Teorema de Roth, necesitamos relacionar kY kω con la altura de X/Y . El valor absoluto ω fue elegido para maximizar kY kυ . Como ademas kY kυ = 1 para todo υ ∈ / S, se tiene que !1/#S !1/#S Y Y kY kω = max kY kυ ≥ kY kυ = kY kυ ≥ HK (Y )1/#S . υ∈S υ∈S υ∈MK Recordando propiedades elementales de la altura, H(x+y) ≤ 2H(x)H(y), H(xy) ≤ H(x)H(y), HK (x) = H(x)[K:Q] , y usando que (X, Y ) es soluci´on de αX m + βY m = 1 m β β 1 [K:Q] HK X HK ( Y1m )HK ( α1 )HK ( α ). Y m = HK αY m − α ≤ 2 Tomando ra´ız m-esima y usando que HK (T m ) = HK (T )m , se tiene que existe una constante C3 = C3 (α, β, S, m) tal que 48 3. APLICACIONES HK (X/Y ) ≤ C3 HK (1/Y ) = C3 HK (Y ). Utilizando la cota obtenida anteriormente para HK (Y ), se tendr´a que si llamamos 1/#S C4 = C3 , entonces kY kω ≥ C4 HK (X/Y )1/#S . Se concluye que existe una constante C5 = C5 (α, β, S, m, K) = 1/C2 C4m para la cual X C5 − ζγ , ≥ m/#S Y H (X/Y ) K ω por suposici´ on, posee infinitas soluciones X, Y ∈ RS∗ . Recordando que podemos tomar m = 2#S + 1, el teorema de Roth nos dice que esto es un absurdo, llegando as´ı a la contradicci´ on deseada. Teorema 3.4. Sea K/Q un cuerpo de n´ umeros, sea S ⊂ MK un subconjunto finito de valores absolutos sobre K que contiene a todos los valores absolutos arquimedianos y sea RS el anillo de S-enteros de K. Sea f (X) ∈ K[X] un polinomio de grado al menos 3 con ra´ıces distintas(sobre K). Entonces la ecuaci´ on 2 Y = f (X) posee finitas soluciones en S-enteros X, Y ∈ RS . ´ n. Primero observemos que es posible reemplazar K por una Demostracio extensi´ on finita L, en la cual f (X) se factorice linealmente. En efecto, supongamos que el teorema es v´ alido bajo estas condiciones y sea f (X) un polinomio en K[X]. Sea L una extensi´ on finita de K en la cual f (X) se factoriza linealmente. Consideremos S 0 el conjunto de valores absolutos sobre L que consiste de todas las extensiones a L de los valores absolutos en S, es decir, todos los valores absolutos en L que estan arriba de algun valor absoluto de S. Como L/K es una extensi´on finita de cuerpos de n´ umeros, cada valor absoluto de S posee finitas extensiones. Luego S 0 resulta finito y posee todos los valores absolutos arquimedianos de L. Dado que RSK ⊂ RSL0 se concluye que la validez del teorema para L y S 0 , implica la validez para K y S. Notar que mientras m´ as grande sea S, m´as fuerte ser´a el resultado del teorema. Por lo tanto, probar el teorema para un conjunto de valores absolutos m´as grande no afectara la conclusi´ on buscada. Ya vimos que podemos suponer que f (X) se factoriza linealmente en K, entonces tenemos que f (X) = a(X − α1 ) . . . (X − αn ) con α1 , . . . , αn ∈ K. Por hip´ otesis, n ≥ 3 y los αi son todos distintos. Incrementaremos el tama˜ no de S para que se satisfagan las siguientes condiciones (1) a ∈ RS∗ . (2) αi − αj ∈ RS∗ para todo i 6= j. (3) RS es un anillo de ideales principales. Recordemos que para todo x ∈ K, |x|υ = 1 salvo finitos υ ∈ MK . Por lo tanto, agregando finitos valores absolutos a S, la condicion (1) y (2) ser´an v´alidas. Para ver (3), recordar que el grupo de clases de RS es finito, por lo tanto es suficiente agregar a S un primo de cada clase de ideales. ´ 3. ECUACIONES DIOFANTICAS 49 Sea (X, Y ) ∈ RS2 una soluci´on de la ecuaci´on Y 2 = f (X). Veamos que el ideal (X − αi )RS es el cuadrado de un ideal en RS . Sea p un ideal primo de RS , entonces p solo puede dividir como mucho a uno de los ideales (X − αi )RS pues sino divide a dos de ellos, dividir´ a a (αi − αj )RS lo cual contradice (2). A partir de (1), tenemos que p no puede dividir a aRS . Por lo tanto, se sigue de la la factorizaci´on de f (X), que si p divide a uno de los ideales (X −αi )RS , el orden de p debe ser par. Entonces existen ideales ai ⊂ RS tal que (X − αi )RS = a2i para todo 1 ≤ i ≤ n. Por propiedad (3) tenemos que RS es un anillo de ideales principales, entonces ai = (Zi )RS , para algun Zi ∈ RS . Por lo tanto existe una unidad Ui ∈ RS∗ tal que X − αi = Ui Zi2 , para todo 1 ≤ i ≤ n. Extendemos K a un cuerpo L, adjunt´andole todas las ra´ıces cuadradas de elementos de RS∗ . Por el teorema de S-unidades de Dirichlet, el grupo RS∗ es finitamente generado, por lo tanto RS∗ /(RS∗ )2 es finito, entonces L/K ser´a una extensi´on finta pues estara generado por las ra´ıces cuadradas de un conjunto de representantes de RS∗ /(RS∗ )2 . Sea T ⊂ ML el conjunto de lugares que est´an arriba de los elementos de S. Como L/K es finita, T resulta finito. En L, cada Ui resulta un cuadrado, digamos Ui = Vi2 . Entonces se tiene que X − αi = (Vi Zi )2 = Wi2 para algun Wi ∈ RT . Considerando la diferencia de dos de estas igualdades tenemos que αi − αj = Wi2 − Wj2 = (Wi − Wj )(Wi + Wj ). Por (2), el lado izquierdo de esta ecuaci´on esta en RT∗ , mientras que cada uno de los factores de la derecha est´ an en RT . Por lo tanto, cada uno de estos factores debe ser una unidad, Wi − Wj , Wi + Wj ∈ RT∗ para todo i 6= j. Como f (X) posee grado al menos 3, podemos escribir la siguiente identidad(a veces llamada identidad de Siegel) W1 −W2 W1 −W3 + W2 −W3 W1 −W2 = 1. Cada uno de los t´erminos del lado derecho posee finitas opciones por teorema*(Sunit equation). Similarmente, la identidad W1 +W2 W1 −W3 + W3 +W2 W3 −W1 =1 y el teorema* nos dice que cada uno de los t´erminos en esta ecuaci´on posee finitas opciones. Se sigue que hay solo finitos valores posibles para la cantidad W1 −W2 W1 +W2 W1 −W3 . W1 −W3 = W12 −W22 (W1 −W3 )2 = α2 −α1 (W1 −W3 )2 . Por lo tanto, tambi´en habr´ a finitos valores posibles para W1 − W3 , lo que implica finitos valores posibles para α3 −α1 1 1 2 (W1 − W3 ) + W1 −W3 = 2 ((W1 − W3 ) + (W1 + W3 )) = W1 , y entonces finitos valores posibles para α1 + W12 = X. Finalmente, para cada valor de X, hay como mucho 2 valores posibles para Y . Lo que completa la prueba de la finitud de las soluciones de Y 2 = f (X) con X, Y ∈ RS . CAP´ITULO 4 El Teorema del Subespacio 1. El Teorema del Subespacio El Teorema del Subespacio, probado por Schmidt en 1972, es una generalizaci´on multidimensional del Teorema de Roth y fue originalmente desarrollado para el estudio de las aproximaciones de n´ umeros algebraicos por medio de n´ umeros algebraicos de grado acotado y la norm form equation(una clase de ecuaciones diof´anticas que incluyen a las ecuaciones de Thue). Este teorema, involucra sistema de inecuaciones en formas lineales. Es importante mencionar que esta no es una generalizaci´ on rutinaria, sino que nuevas dificultades aparecen a lo largo de prueba, las cuales fueron resueltas por Schmidt al introducir nuevas ideas de la Geometr´ıa de N´ umeros. Puede verse una prueba del teorema en [29], [12] se basa principalmente en la referencia anterior pero posee varias simplificaciones. Una prueba del teorema en su versi´ on m´ as general puede encontrarse en [4]. Sea n un entero positivo y r ≤ n. Diremos que las formas lineales L1 = Pn Pn j=1 a1j xj , . . . , Lr = j=1 arj xj con aij ∈ C son linealmente dependientes si existen c1 , . . . , cr ∈ C, no todos nulos, tal que c1 L1 +. . .+cr Lr ≡ 0. Caso contrario, diremos que son linealmente independientes. Es facil ver que, si r = n, L1 , . . . , Ln son linealmente independientes si y solo si det(L1 , . . . , Ln ) = det(aij ) 6= 0. La norma de x = (x1 , . . . , xn ) ∈ Zn esta dada por kxk := max {|x1 |, . . . , |xn |}. Teorema 4.1 (Schmidt, 1972). Sea n ≥ 2, y sean L1 (X), . . . , Ln (X), n formas lineales en las variables X = (X1 , . . . , Xn ), linealmente independientes, con coefiumero finito de subespacios cientes en Q. Sean C > 0 y ε > 0, entonces existe un n´ lineales propios T1 , . . . , Th de Qn tal que el conjunto de soluciones de (4.1) |L1 (x) · · · Ln (x)| < C kxk −ε x ∈ Zn , est´ a contenido en T1 ∪ · · · ∪ Th . El Teorema del Subespacio puede reformularse en una forma m´as geom´etrica de la siguiente manera. La topolog´ıa del Subespacio (noci´on introducida por Schmidt) en Qn es la topolog´ıa cuyos conjuntos cerrados son uniones finitas de subespacioes lineales de Qn . Entonces, el Teorema 4.1 establece que para todo C > 0 y ε > 0, el conjunto de soluciones de (4.1) no es denso en Qn con respecto a la topolog´ıa del Subespacio. Veamos que el Teorema del Subepacio implica el Teorema de Roth. Recordemos que la altura de ξ ∈ Q es H(ξ) = max {|x|, |y|}, con ξ = x/y, x,y ∈ Z, mcd(x, y) = 1. Corolario 3 (Teorema de Roth). Sea α ∈ Q y C > 0, k > 2. Entonces la inecuaci´ on (4.2) |α − ξ| ≤ CH(ξ)−k posee finitas soluciones. 51 ξ∈Q 52 4. EL TEOREMA DEL SUBESPACIO ´ n. Sea ξ = x/y una soluci´on de (4.2), con x,y ∈ Z, mcd(x, y) = Demostracio 1. Sea ε > 0 tal que k = 2 + ε. Multiplicando (4.2) por y 2 obtenemos |y(x − αy)| ≤ Cy 2 max {|x|, |y|} −2−ε −ε ≤ C. max {|x|, |y|} Dado que las formas lineales Y y X − αY son linealmente independientes, podemos aplicar el Teorema del Subespacio. Se sigue entonces que los pares de enteros (x, y) ∈ Z2 , con mcd(x, y) = 1 tal que ξ = x/y es soluci´on de (4.2), est´an contenidos en una uni´ on finita de subespacios propios de Q2 , es decir, subespacios lineales de dimensi´ on uno. Los subespacios uno dimensionales de Q2 consisten en todos los puntos de la forma λ(x0 , y0 ) con λ ∈ Q y (x0 , y0 ) puede tomarse en Z2 con mcd(x0 , y0 ) = 1. Por lo tanto, ξ = x0 /y0 , esta un´ıvocamente determinado por el subespacio. El Teorema del Subespacio establece que el conjunto de soluciones de (4.1) esta contenido en finitos subespacios lineales propios de Qn . En este caso, logramos ver que de hecho existen finitas soluciones. Algo similar ocurrir´a siempre que consideremos n = 2. Si tenemos una soluci´on no nula x0 ∈ Zn tal que L1 (x0 ) = 0, entonces λ.x0 ser´ a soluci´ on de (4.1) para todo λ ∈ Z. Por lo tanto, tendremos as´ı infinitas soluciones de (4.1). Para evitar este tipo de construcci´on, consideremos (4.3) 0 < |L1 (x) · · · Ln (x)| < C|x|−ε x ∈ Zn , En el caso n = 2, el conjunto de soluciones de (4.3) ser´a de hecho finito. Lema 11. Sea Li = ai1 X + αi2 , para i = 1, 2, dos formas lineales linealmente on independientes con coeficientes en Q. Sea C > 0, ε > 0. Entonces la inecuaci´ (4.4) 0 < |L1 (x)L2 (x)| ≤ C kxk −ε en x ∈ Z2 posee finitas soluciones. ´ n. Por el Teorema del Subespacio, las soluciones de (4.4) pertenecen Demostracio a un n´ umero finito de subespacios lineales de dimensi´on 1 de Q2 . Cada uno de estos subespacios T se puede representar de la forma T = {λ(x0 , y0 )|λ ∈ Q} donde (x0 , y0 ) ∈ Z2 se puede elegir de forma tal que mcd(x0 , y0 ) = 1. Observar que λ(x0 , y0 ) ∈ Z2 si y solo si λ ∈ Z. Si L1 (x0 , y0 )L2 (x0 , y0 ) = 0, entonces (4.4) no posee soluciones en T . Supongamos que L1 (x0 , y0 )L2 (x0 , y0 ) 6= 0. Entonces λ(x0 , y0 )es soluci´ on de (4.4) si y solo si −ε 0 < λ2 |L1 (x0 , y0 )L2 (x0 , y0 )| ≤ C|λ|−ε k(x0 , y0 )k −ε Por lo tanto, |λ|2+ε ≤ C|L1 (x0 , y0 )L2 (x0 , y0 )|−1 k(x0 , y0 )k tado. . . Es decir, λ esta aco Si n ≥ 3, (4.3) puede tener infinitas soluciones, como muestra el siguiente ejemplo. Sea 0 < ε < 1 y consideremos la inecuaci´on √ √ √ √ √ √ −ε (4.5) 0 < |(x1 + 2x2 + 3x3 )(x1 − 2x2 + 3x3 )(x1 − 2x2 − 3x3 )| ≤ kxk en x = (x1 , x2 , x3 ) ∈ Z3 . Observar que las 3 formas lineales consideradas son linealmente independientes. Consideremos las uplas de enteros x = (x1 , x2 , x3 ) ∈ Z3 con x3 = 0, x1 .x2 6= 0. Para estos x, kxk = max {|x1 |, |x2 |}. Por el teorema de Dirichlet, existen infinitos racionales x1 /x2 tal que 2. APROXIMACIONES SIMULTANEAS Y ALGEBRAICAS DE GRADO ACOTADO √ 2− x1 x2 53 ≤ |x2 |2 . Para estas soluciones x = (x1 , x2 , 0), dado que √ √ |x1 /x2 | ≤ |x2 |2 + 2 ≤ 1 + 2, √ entonces kxk = max {|x1 |, |x2 |} ≤ (1 + 2)|x2 |. Por lo tanto, para los puntos considerados, √ √ √ √ √ √ + 3x )(x − 2x + 3x )(x − 2x − 3x3 )| = 0√ < |(x1 + 2x 2 3 1 2 3 1 2 √ √ √ 3 −1 −ε −1 2 2 |(x1 + 2x2 )(x1 − 2x2 ) | ≤ (1 + 2) kxk .(x2 ) ≤ (1 + 2) kxk ≤ kxk , si kxk es suficientemente grande. Por lo tanto, (4.5) posee infinitas soluciones en el subespacio {x3 = 0}. De la misma forma se prueba que hay infinitas soluciones en los subespacios {x1 = 0}, {x2 = 0} y con un poco m´as de trabajo ver que (4.5) posee finitas soluciones con x1 x2 x3 6= 0. Mencionaremos a continuaci´on una versi´on mejorada del Teorema del Subespacio, probada por Vojta [33] en 1989. Teorema 4.2. Sean L1 , . . . , Ln formas lineales linealmente independientes en n variables, con coeficientes en Q. Entonces existe un conjunto finito de subespacios lineales de Qn efectivamente determinables T1 , . . . , Tl . Tal que para todo ε > 0, el conjunto de soluciones de −ε |L1 (x) . . . Ln (x)| ≤ kxk en x ∈ Zn est´ a contenido en T1 , . . . , Tn , salvo por un conjunto finito de soluciones que pueden depender de ε. 2. Aproximaciones Simultaneas y Algebraicas de grado acotado El siguiente teorema de Dirichlet de 1842, generaliza al probado en el capitulo 1. Su prueba es similar y puede leerse en [29]. Teorema 4.3. Sean α1 , . . . , αn n´ umeros reales Q-linealmente independientes. Entonces para alguna constantes C > 0, la inecuaci´ on −n+1 |α1 x1 + . . . + αn xn | ≤ C kxk en x ∈ Zn posee infinitas soluciones. En 1970, Schmidt prob´ o que el exponente -n+1 no puede ser reemplazado por ning´ un n´ umero m´ as chico si α1 , . . . , αn son algebraicos. Teorema 4.4. Sean α1 , . . . , αn n´ umeros algebraicos. Para toda C > 0 y ε > 0, la inecuacion (4.6) 0 < |α1 x1 + . . . + αn xn | ≤ C kxk −n+1−ε en x = (x1 , . . . , xn ) ∈ Zn posee finitas soluciones. ´ n. Procederemos por inducci´on en n. El caso n = 1 resulta Demostracio trivial. Sea n > 1 y supongamos que el teorema es cierto para n − 1. Podemos asumir que al menos uno de los coeficientes α1 , . . . , αn es no nulo pues sino, no habr´ıa soluciones. Asumamos entonces que α1 6= 0. Para cada soluci´on x de (4.6) se tiene que (4.7) |(α1 x1 + . . . + αn xn )x2 . . . xn | ≤ C kxk −ε . Dado que el conjunto de formas lineales {α1 X1 + . . . + αn Xn , X2 , . . . , Xn } es linealmente independiente, el teorema del subespacio asegura que existen finitos subespacios lineales propios de Qn , T1 , . . . , Tt , que contienen las soluciones de (4.7). 54 4. EL TEOREMA DEL SUBESPACIO Sea T uno de estos subespacios, y consideremos a1 X1 + . . . + an Xn una forma lineal que se anula completamente en T . Sin perdida de generalidad, podemos suponer que an 6= 0. Podemos entonces expresar a Xn como combinacion lineal de X1 , . . . , Xn . Se tendr´ a que existen β1 , . . . , βn−1 n´ umeros algebraicos para los cuales α1 X1 + . . . + αn Xn = β1 X1 + . . . + βn−1 Xn−1 sobre T . Por lo tanto, toda soluci´on x de (4.6) con x ∈ T ,cumple que −n+1−ε 0 < |β1 x1 + . . . + βn−1 xn−1 | ≤ C kxk ≤ max(|x1 |, . . . , |xn−1 |)−n+2−ε = −n+1−ε kx0 k , con x0 = (x1 , . . . , xn−1 ). Por hip´otesis inductiva, esta desigualdad posee finitas soluciones en x0 ∈ Zn−1 . Por lo tanto, (4.6) tiene finitas soluciones con x en T . Como hay finitos subespacios posibles, completamos as´ı la prueba del teorema. En el trabajo sobre aproximaciones diof´anticas de Siegel [25], adem´as de considerar las aproximaciones de n´ umeros algebraicos por medio de n´ umeros algebraicos en un cuerpo de n´ umeros fijo, tambien estudio la aproximaci´on por medio de n´ umeros algebraico de grado acotado. Si bien los argumentos de Roth se generalizaron bien en el primer caso, no admitieron una extensi´on similar para el segundo problema. El siguiente corolario se debe a Schmidt [30]. En este corolario, si ξ es un n´ umero algebraico, H(ξ) denotara al m´aximo de los valores absolutos de los coeficientes del polinomio minimal de ξ en Z[X]. Corolario 4. Sea α un n´ umero algebraico. Para todo entero d ≥ 1 y ε > 0, existen finitos n´ umeros algebraicos ξ de grado d tal que (4.8) |α − ξ| < H(ξ)−d−1−ε . ´ n. Sea ξ un n´ Demostracio umero algebraico de grado d que satisface (4.8). Dado que α posee solo finitos conjugados, podemos asumir que ξ no es uno de ellos. Sea f (X) = xd+1 X d + . . . + x1 ∈ Z[X] el polinomio minimal de ξ sobre Z. Se tiene que si x = (x1 , . . . , xd+1 ) entonces H(ξ) = kxk, ademas f (α) 6= 0. A partir del desarrollo de Taylor o el teorema del valor medio, obtenemos que |f (α)| ≤ C(α, d)|α − ξ|H(ξ). Entonces 0 < |x1 + x2 α + . . . + xd+1 αd | = |f (α)| ≤ C(α, d)|α − ξ|H(ξ) < −d−ε C(α, d)H(ξ)−d−ε = C(α, d) kxk . Por el teorema anterior, existen solo finitos x ∈ Zd+1 que cumplen esta desigualdad. Esto implica que hay solo finitos ξ algebraicos de grado d que cumple (4.8). En particular, dados d ≥ 1 y ε > 0 existir´an finitos n´ umeros algebraicos ξ de grado a lo sumo d para los cuales valga (4.8). Pues hay finitos para cada d0 ≤ d ya que 0 |α − ξ| < H(ξ)−d−1−ε ≤ H(ξ)−d −1−ε . Si d = 1, este resultado se reduce al Teorema de Roth. Un resultado m´as d´ebil, con d + 1 + ε reemplazado por 2d + ε fue probado por Wirsing [35] por medio de un m´etodo distinto. Un problema abierto es encontrar el mejor exponente κd para el cual la inecuaci´ on |α − ξ| < H(ξ)−κd +ε 3. LA VERSION P-ADICA DEL TEOREMA DEL SUBESPACIO 55 posee infinitas soluciones reales algebraicas ξ de grado como mucho d, para todo ε > 0 fijo y todo α real que no es algebraico de grado como mucho d, para alguna constante c dependiente de α y ε. Si d = 1 y α es irracional, el teorema de Dirichlet prueba que κ1 = 2(incluso con ε = 0). Si d = 2 y α no es racional ni cuadr´atico irracional, Davenport y Schmidt [9] probaron que κ2 = 3(incluso con ε = 0). Para d ≥ 3 este resultado esta abierto y no se sabe cual podr´ıa ser una respuesta correcta. Respecto al problema de aproximanciones por medio de enteros algebraicos, Davenport y Schmidt [10] probaron que la inecuaci´on |α − ξ| ≤ cH(ξ)−2 posee infinitas soluciones en enteros algebraicos ξ de grado como mucho 2 para alguna constante c = c(α), si α es irracional. Adem´as, el exponente es ´optimo si α es irracional cuadratico. Para el caso d = 3, probaron que si α no es algebraico de grado como mucho 2, entonces la inecuaci´on |α − ξ| ≤ cH(ξ)−(3+ √ 5)/2 posee infinitas soluciones con ξ entero algebraico de grado como mucho 3. Pasaron m´ as de 30 a˜ nos hasta que en 2003 Roy [24] construyo un numero trascendente real α y una constantes c > 0 tal que |α − ξ| ≥ cH(xi)−(3+ √ 5)/2 para todo entero algebraico ξ de grado como mucho 3. 3. La version p-adica del Teorema del Subespacio Al igual que para el Teorema de Roth, existe una version p-´adica del Teorema del Subespacio. Esta fue probada por Schlickewei [27], [28]. Teorema 4.5 (Schlickewei). Sea n ≥ 2,X = (X1 , . . . , Xn ), p1 , . . . , ps finitos n´ umeros primos distintos y tomemos una extensi´ on de cada valor absoluto p-adico a Q. Sean L1,∞ (X), . . . , Ln,∞ (X) formas lineales linealmente independientes, con coeficientes algebraicos. Para cada primo pj sean L1,pj (X), . . . , Ln,pj (X) formas lineales linealmente independientes, con coeficientes algebraicos. Dado ε > 0, entonces existe un n´ umero finito de subespacios lineales propios T1 , . . . , Th de Qn tal que el conjunto de soluciones de (4.9) |L1,∞ (x) · · · Ln,∞ (x)| s Y −ε |L1,pj (x) · · · Ln,pj (x)|pj < kxk x ∈ Zn , j=1 esta contenido en T1 ∪ · · · ∪ Th . La siguiente generalizaci´ on del Teorema del Subespacio es debida a Vojta y ser´a u ´til en algunas aplicaciones. Sean L1 , . . . , Lr formas lineales con coeficientes en C en variables X1 , . . . , Xn , con r ≥ n. Diremos que L1 , . . . , Lr , estan en posici´on general si cada subconjunto de cardinal ≤ n de {L1 , . . . , Lr } es linealmente independiente. Teorema 4.6. Ses S un conjunto finito de primos, incluyendo p = ∞ y tomemos una extensi´ on de cada valor absoluto p-adico a Q. Para cada p ∈ S sea rp ≥ n y sean L1,p (X), . . . , Lrp ,p (X) formas lineales en las variables X = (X1 , . . . , Xn ), en posici´ on general, con coeficientes algebraicos. Sea C > 0 y ε > 0, entonces existe un n´ umero finito de subespacios lineales propios T1 , . . . , Th de Qn 56 4. EL TEOREMA DEL SUBESPACIO tal que el conjunto de soluciones de (4.10) Y r −n−ε |L1,p (x) · · · Lrp ,p (x)|p < C kxk ∞ x ∈ Zn con mcd(x1 , . . . , xn ) = 1, p∈S est´ a contenido en T1 ∪ · · · ∪ Th . Para probar esta versi´ on del teorema, usaremos el siguiente lema el cual se deduce a partir de la equivalencia de normas en Cn . Lema 12. Sean M1 , . . . , Mn formas lineales linealmente independientes en las variables X1 , . . . , Xn con coeficientes complejos. Entonces existe una constante C > 0 tal que kxk ≤ C max {|M1 (x)|, . . . , |Mn (x)|} para todo x ∈ Cn . ´ n del Teorema. Partimos al conjunto de soluciones x ∈ Zn Demostracio de (4.10) en un n´ umero finito de clases dependiendo en cuales de las n cantidades sobre |L1,p (x)|p · · · |Lrp ,p (x)|p para cada p ∈ S. Ser´a suficiente probar que las soluciones en cada una de estas clases pertenece a un n´ umero finito de subespacios lineales propios de Qn . Sin p´erdida de generalidad, consideremos las soluciones x ∈ Zn de (4.10) para las cuales |L1,p (x)|p · · · |Ln,p (x)|p son los menores entre |L1,p (x)|p · · · |Lrp ,p (x)|p para cada p ∈ S. Por el lema anterior, para i = n + 1, . . . , r∞ , dado que L1,∞ , . . . , Ln−1,∞ , Li,∞ son linealmente independientes, existe una constante Ci > 0 tal que para todas las soluciones x consideradas, (4.11) kxk ≤ Ci max {|L1,∞ (x)|∞ , . . . , |Ln−1,∞ (x)|∞ , |Li,∞ (x)|∞ } = Ci |Li,∞ (x)|∞ . Sea ahora p ∈ S, p 6= ∞. Dado que solo estamos considerando soluciones para las cuales el mcd es igual a 1, para cada soluci´on x = (x1 , . . . , xn ) en consideraci´on, existe un ´ındice k para el cual |xk |p = 1. Para cada i = n + 1, . . . , rp , como L1,p , . . . , Ln−1,p , Li,p son linealmente independientes, general al espacio de formas lineales en Q, se tiene que existen constantes α1 , . . . , αn tal que Xk = α1 L1,p + . . . + αn−1 Ln−1,p + αn Li,p . Por la desigualdad triangular fuerte, obtenemos (4.12) 1 = |xk |p ≤ max |αj |p |Lj,p (x)|p ≤ Ci,p |Li,p (x)|p j=1,...,n para alguna constante Ci,p . Juntando (4.11), (4.12) con (4.10) obtenemos Y |L1,∞ (x) · · · Ln,∞ (x)|∞ |L1,p (x) · · · Ln,p (x)|p ≤ p∈S,p6=∞ C 0 |L1,∞ (x) · · · Ln,∞ (x)|∞ . |Ln+1,∞ (x)|∞ |Lr∞ ,∞ (x)|∞ ... kxk kxk r∞ −n−ε ≤ C.C 0 kxk . kxk −(r∞ −n) Y p∈S,p6=∞ e kxk−ε . =C |L1,p (x) · · · Lrp ,p (x)|p ´ 4. SOBRE LA COMPLEJIDAD DE NUMEROS ALGEBRAICOS 57 Por lo tanto, por el Teorema del Subespacio p-´adico, los x en consideraci´on pertenecen a finitos subespacios lineales propios de Qn . Utilizaremos esta versi´ on del Teorema para probar la finitud de las soluciones de la ecuaci´ on de Thue-Mahler. Teorema 4.7 (Mahler, 1933). Sea F (X, Y ) ∈ Z[X, Y ] un polinomio homog´eneo libre de cuadrados de grado n ≥ 3 y sean p1 , . . . , ps . Entonces la ecuaci´ on (4.13) |F (x, y)| = pz11 . . . pzss en x, y, z1 , . . . , zs ∈ Z con mcd(x, y) = 1, posee finitas soluciones. En la prueba del teorema utilizaremos el siguiente lema, que es una consecuencias sencilla de la formula del producto en Q. Lema 13. Sea u ∈ Q. Entonces u = ±pz11 . . . pzss para ciertos enteros z1 , . . . , zs si y solo si |u|.|u|p1 . . . |u|ps = 1. ´ n. Si F (1, 0) 6= 0 entonces F se factoriza de la forma a0 (X − α1 Y ) . . . (X − αn Y ) Demostracio con α1 , . . . , αn distintos, mientras que si F (1, 0) = 0, F se factoriza como a0 Y (X − α1 Y ) . . . (X − αn−1 Y ) con α1 , . . . , αn−1 distintos. En ambos casos, F es el producto de n formas lineales en dos variables en posici´ on general. Sea ε tal que 0 < ε < n − 2. Entonces por el lema anterior, para cada soluci´on (x, y, z1 , . . . , zs ) de (4.13) se tendr´a que Qs n−2−ε |F (x, y)| . j=1 |F (x, y)|pj = 1 ≤ max {|x|, |y|} . Por teorema (subespa p adico), el conjunto de soluciones (x, y) ∈ Z2 de est´a desigualdad esta contenido en la uni´on de finitos subespacios uno dimensionales de Q2 . Cada uno de estos subespacios contiene solo dos soluciones con mcd(x, y) = 1. Por lo tanto, (4.13) posee finitas soluciones. 4. Sobre la complejidad de n´ umeros algebraicos Vimos en el cap´ıtulo anterior, como utilizar el teorema de Roth para obtener informaci´ on sobre el desarrollo decimal de n´ umeros algebraicos y resultados de trascendencia. En 2004, Adamczewski, Bugeaud y F.Luca [2], aplicaron la version p-adica del Teorema del Subespacio para obtener un criterio combinatorio de trascendencia. Luego Adamczewski y Bugeaud aplicaron este criterio para obtener informaci´ on sobre la complejidad de n´ umeros algebraicos. Teorema 4.8. Sea b un n´ umero entero b ≥ 2. Sea α ∈ R y sea 0, a1 a2 a3 . . . el desarrollo de α en base b. Supongamos que existe un n´ umero real positivo ε y infinitas 3-uplas de n´ umeros enteros positivos (j, k, l) tal que (4.14) aj+i = aj+k+i , i = 1, . . . , l, y (4.15) l ≥ ε (j + k) , l ≤ k entonces α es o bien racional o trascendente. Lo que nos est´ an diciendo las hip´otesis del teorema es que existen bloques de tama˜ no l arbitrariamente grande, que ocurren dos veces muy cerca del inicio del desarrollo b-ario de α. 58 4. EL TEOREMA DEL SUBESPACIO ´ n. Para hacer la notaci´on m´as sencilla, asumamos que α ∈ Demostracio (0, 1). Observemos que dentro de todas las uplas (j, k, l) que cumplen (4.14), (4.15), los k’s son no acotados. Si lo fueran, los l’s tambi´en lo serian por (4.15) y por (4.14) los j’s tambi´en, contradiciendo el hecho de que hay infinitas uplas. Sea entonces (j1 , k1 , l1 ) , (j2 , k2 , l2 ) , . . . una sucesi´on infinita de 3-uplas de enteros positivos que satisfacen (4.14), (4.15) y k1 < k2 < . . ., km → ∞. Supondremos que α es algebraico y veamos que de hecho es racional. Definamos el n´ umero racional αm = a1 a2 . . . ajm ajm+1 . . . ajm +km ajm+1 . . . ajm +km ajm+1 . . . ajm +km . . . con pre-periodo a1 a2 . . . ajm y periodo ajm+1 . . . ajm +km . A partir de un c´alculo directo con la serie que define la expresi´on b-aria de αm , obtenemos que existe un entero pm tal que αm = pm . bjm (bkm −1) Por (4.14) tenemos que α = a1 a2 . . . ajm ajm+1 . . . ajm +km ajm+1 . . . ajm +lm . . ., con lo cual α y αm tienen, al menos los primeros jm + km + lm digitos en com´ un. Luego 1 pm | < jm +km +lm . (4.16) |α − αm | = |α − jm km b (b − 1) b Multiplicando por bjm (bkm − 1) y usando (4.15), obtenemos que −lm /(jm +km ) −ε (4.17) |bjm +km α − bjm α − pm | < bjm +km ≤ bjm +km . Definamos ahora la informaci´on para aplicar el teorema del subespacio. Consideremos las formas lineales linealmente independientes con coeficientes reales algebraicos: L1,∞ (X) = X1 , L1,∞ (X) = X2 , L1,∞ (X) = αX1 − αX2 − X3 . Sea S el conjunto de primos que dividen a b. Para cada primo p ∈ S, consideremos la formas lineales, linealmente independientes con coeficientes enteros L1,p (X) = X1 , L1,p (X) = X2 , L1,p (X) = X3 A partir de la f´ ormula del producto y (4.17) obtenemos que para x = bjm +km , bjm , pm , 3 Y i=1 |Li,∞ (x)|. 3 YY |Li,p (x)|p ≤ |bjm +km α − bjm α − pm | ≤ bjm +km −ε ≤ kxk −ε p∈S i=1 Por lo tanto, por el Teorema del Subespacio, el conjunto de uplas bjm +km , bjm , pm , m ≥ 1, esta contenido en una uni´on finita de subespacios lineales propios de Q3 . Luego infinitas uplas pertenecen a alguno de estos subespacios. Llamemos a ese subespacio T . Sean z1 , z2 , z3 enteros tal que la forma lineal z1 X1 + z2 X2 + z3 X3 se anula ´ıntegramente en T , entonces z1 bjm +km + z2 bjm + z3 pm = 0, para infinitos m. Dividiendo por bjm (bkm − 1) obtenemos que ´ 4. SOBRE LA COMPLEJIDAD DE NUMEROS ALGEBRAICOS 59 km z1 (bkbm −1) + z2 bkm1−1 + z3 αm = 0. Si hacemos tender m a infinito, dado que ten´ıamos km → ∞ y αm → α por (4.16) obtenemos z1 + z3 α = 0, es decir, α ∈ Q como quer´ıamos ver. Sea b ≥ 2 un n´ umero entero, entonces la expresi´on b-adica de cualquier n´ umero racional es eventualmente peri´odica. Si α es un n´ umero algebraico de grado > 1, poco se sabe sobre la expresi´on b-adica de dicho n´ umero. Desde los trabajos de Borel [8], se cree que los n´ umeros algebraicos comparten la misma propiedad que casi todos los n´ umeros reales. Recordemos que un n´ umero real α se dice normal en base b, si para todo entero positivo n, cualquier combinaci´on de longitud n a partir de los d´ıgitos {0, 1, . . . , b − 1} ocurre en el desarrollo b-ario de α con igual frecuencia, es decir 1/bn . Muy poco se sabe sobre este tema, por ejemplo,√ni siquiera se sabe si el digito 7 aparece infinitas veces en el desarrollo decimal de 2. Una posible forma de medir la complejidad de la expresi´on de un n´ umero irracional en base b es la complejidad por bloques. Sea α un n´ umero real, b ≥ 2 un entero, y n un entero positivo. Notaremos por p(n, α, b) la cantidad de bloques distintos de longitud n que aparecen en la expresi´on b-adica de α, es decir, p(n, α, b) = | {ak ak+1 . . . ak+n−1 |k = 1, 2, . . .} |. Obviamente se tiene que 1 ≤ p(n, α, b) ≤ bn En [1] se prueba una versi´on similar al siguiente lema combinatorio Lema 14. Sea α un n´ umero real y b ≥ 2 un entero. Supongamos que la funci´ on de complejidad p(n, α, b) cumple que p(n, α, b) lim inf < ∞. n→∞ n Entonces existe ε > 0 e infinitas uplas (j, k, l) que cumplen (4.14) y (4.15). Combinando esto con el resultado anterior, se obtiene el siguiente teorema Teorema 4.9 (Adamczewski y Bugeaud, 2007). Si α es un n´ umero algebraico irracional real, entonces p(n, α, b) =∞ lim n→∞ n De hecho el resultado es m´as fuerte que el reci´en enunciado. En el mismo trabajo, tambi´en se prueban resultado similares sobre complejidad del desarrollo de Hensel de n´ umeros p-´ adicos y un criterio de trascendencia para n´ umeros p-´adicos. APPENDIX A Alturas Recordar que un valor absoluto sobre un cuerpo K es una funci´on real | | : K → [0, ∞) que cumple las siguientes 3 propiedades 1: |x| = 0 ⇔ x = 0. 2: |xy| = |x||y|. 3: |x + y| ≤ |x| + |y|. El valor absoluto se dir´ a no-arquimediano si cumple la condici´on m´as fuerte 3’: |x + y| ≤ max {|x|, |y|}. Si 30 falla para alg´ un valor de x,y ∈ K se dice que el valor absoluto es Arquimediano. El valor absoluto usual sobre Q es un valor absoluto arquimediano. Para cada n´ umero primo p hay un valor absoluto no-arquimediano asociado. Para cada x ∈ Q, sea ordp (x) el u ´nico entero tal que x se escribe de la forma x = pordp (x) . ab con a, b ∈ Z y p 6 |ab. (Si x = 0, definimos ordp (x) = ∞ por convenci´on.) Se define el valor absoluto p-adico como |x|p = p−ordp (x) . El conjunto de valores absolutos est´andar sobre Q ser´a notado por MQ , el cual consistir´ a en el valor absoluto arquimediano | |∞ y los valores absolutos p-adicos | |p para cada n´ umero primo p. El conjunto de valores absolutos est´andar sobre un cuerpo de n´ umeros K ser´a el conjunto MK que consiste de los valores absolutos sobre K cuya restricci´on a Q ∞ pertenece a MQ . Notaremos por MK al conjunto de valores absolutos arquimedi0 anos en MK y similarmente MK al conjunto de valores absolutos no-arquimedianos en K. Para simplificar la notaci´ on, notaremos al valor absoluto υ ∈ MK como | |υ . Sea K 0 /K una estensi´ on de cuerpos de n´ umeros y sean υ ∈ MK , ω ∈ MK 0 valores absolutos. Diremos que ω divide a υ(o que ω esta sobre υ) y notaremos ω|υ si la restriccion de ω a K es υ. Para cada valor absoluto υ sobre K, notaremos Kυ a la completacion de K respecto de υ. Sobre Q tenemos que Qυ = R si υ = ∞ es el valor absoluto arquimediano y Qυ = Qp si υ es el valor absoluto p-adico. ´ n 5. Sea K 0 /K una estensi´ Proposicio on de cuerpos de n´ umeros y sean υ ∈ MK . Entonces X [Kω0 : Kυ ] = [K 0 : K] ω∈MK 0 ,ω|υ ´ n 6. Sea υ ∈ MK un valor absoluto sobre un cuerpo de n´ Definicio umeros K. Se define el grado local de υ como el n´ umero 61 62 A. ALTURAS nυ = [Kυ : Qυ ]. El valor absoluto normalizado asociado a υ ser´ a kxkυ = |x|nυ υ . ´ n 6. Sea K un cuerpo de n´ Proposicio umeros y sea x ∈ K ∗ . Entonces Y kxkυ = 1. υ∈MK ´ n 7. Sea α ∈ K, definiremos la altura (multiplicativa) relativa a K Definicio como Q HK (α) = υ∈MK max {kxkυ , 1}. La altura (logaritmica) relativa a K como hK (α) = log HK (α) ´ n 8. Sea α ∈ Q, se define la altura absoluta (multiplicativa) de α Definicio como H(α) = HK (α)1/[K:Q] , donde K es un cuerpo de n´ umeros que contiene a α. La altura absoluta(logaritmica) ser´ a 1 h(α) = log H(α) = [K:Q] hK (α). P ´ n 9. Sea f = i∈I ai xi un polinomio en varias variables sobre un Definicio cuerpo de n´ umeros K. Se define la norma de Gauss de f respecto al valor absoluto υ como |f |υ = maxi∈I |ai |υ Definimos la altura (proyectiva) relativa a K y absoluta de f como Q HK (f ) = υ∈MK |f |nυ υ y hK (f ) = log HK (f ) y X Y 1 nυ log |f |υ . H(f ) = |f |nυ υ /[K:Q] y h(f ) = log H(f ) = [K : Q] υ∈MK υ∈MK Lema 15 (Lema de Gauss). Sea f1 , . . . , fr polinomios sobre K, entonces |f1 . . . fr |υ = |f1 |υ . . . |fr |υ para todo valor absoluto no-arquimediano υ ´ n 7 (Desigualdad de Gelfand). Sean f1 , . . . , fr ∈ C[X1 , . . . , Xm ]. Proposicio Entonces Qr d1 +...+dm |f1 . . . . .fr |, i=1 |fi | ≤ 2 para todo valor absoluto arquimediano, donde grXj (f1 . . . . .fr ) ≤ dj . En particular se tiene que r Y H(fi ) ≤ 2d1 +...+dm .H(f1 . . . . .fr ). i=1 Bibliograf´ıa [1] B. Adamczewski and Y. Bugeaud, On the complexity of algebraic numbers. I. Expansions in integer bases, Ann. of Math. (2) 165 (2007), no. 2, 547–565. MR2299740 (2008a:11130) [2] B. Adamczewski, Y. Bugeaud and F. Luca, Sur la complexit´ e des nombres alg´ ebriques, C. R. Math. Acad. Sci. Paris 339 (2004), no. 1, 11–14. MR2075225 (2005g:11033) [3] A. Baker, Transcendental number theory, Cambridge Univ. Press, London, 1975. MR0422171 (54 #10163) [4] E. Bombieri and W. Gubler, Heights in Diophantine geometry, New Mathematical Monographs, 4, Cambridge Univ. Press, Cambridge, 2006. MR2216774 (2007a:11092) [5] E. Bombieri and A. J. van der Poorten, Some quantitative results related to Roth’s theorem, J. Austral. Math. Soc. Ser. A 45 (1988), no. 2, 233–248. MR0951583 (89i:11075) [6] E. Bombieri, On the Thue-Siegel-Dyson theorem, Acta Math. 148 (1982), 255–296. MR0666113 (83m:10052) [7] E. Bombieri, D. C. Hunt and A. J. van der Poorten, Determinants in the study of Thue’s method and curves with prescribed singularities, Experiment. Math. 4 (1995), no. 2, 87–96. MR1377411 (97b:11092) √ ´ Borel, Sur les chiffres d´ [8] E. ecimaux de 2 et divers probl` emes de probabilit´ es en chaˆıne, C. R. Acad. Sci. Paris 230 (1950), 591–593. MR0034544 (11,605d) [9] H. Davenport and W. M. Schmidt, Approximation to real numbers by quadratic irrationals, Acta Arith. 13 (1967/1968), 169–176. MR0219476 (36 #2558) [10] H. Davenport and W. M. Schmidt, Approximation to real numbers by algebraic integers, Acta Arith. 15 (1968/1969), 393–416. MR0246822 (40 #91) [11] F. J. Dyson, The approximation to algebraic numbers by rationals, Acta Math. 79 (1947), 225–240. MR0023854 (9,412h) [12] B. Edixhoven and J.-H. Evertse (eds), Diophantine approximation and abelian varieties, Lecture Notes in Mathematics, 1566, Springer, Berlin, 1993. MR1288998 (95g:11061) [13] S. Ferenczi and C. Mauduit, Transcendence of numbers with a low complexity expansion, J. Number Theory 67 (1997), no. 2, 146–161. MR1486494 (98m:11079) [14] A. O. Gelfond, Transcendental and algebraic numbers, Translated from the first Russian edition by Leo F. Boron, Dover, New York, 1960. MR0111736 (22 #2598) [15] M. Hindry and J. H. Silverman, Diophantine geometry, Graduate Texts in Mathematics, 201, Springer, New York, 2000. MR1745599 (2001e:11058) [16] K. Mahler, Lectures on diophantine approximations. Part I, Prepared from the notes by R. P. Bambah of my lectures given at the University of Notre Dame in the Fall of 1957, Univ. Notre Dame Press, Notre Dame, Ind, 1961. MR0142509 (26 #78) [17] K. Mahler, Zur Approximation algebraischer Zahlen. I, Math. Ann. 107 (1933), no. 1, 691– 730. MR1512822 [18] S. Lang, Fundamentals of Diophantine geometry, Springer, New York, 1983. MR0715605 (85j:11005) [19] W. J. LeVeque, Topics in number theory. Vols. 1 and 2, Addison-Wesley Publishing Co., Inc., Reading, MA, 1956. MR0080682 (18,283d) [20] C. J. Parry, The p-adic generalisation of the Thue-Siegel theorem, Acta Math. 83 (1950), 1–100. MR0037875 (12,320d) [21] D. Ridout, Rational approximations to algebraic numbers, Mathematika 4 (1957), 125–131. MR0093508 (20 #32) [22] D. Ridout, The p-adic generalization of the Thue-Siegel-Roth theorem, Mathematika 5 (1958), 40–48. MR0097382 (20 #3851) 63 64 BIBLIOGRAF´IA [23] K. F. Roth, Rational approximations to algebraic numbers, Mathematika 2 (1955), 1–20; corrigendum, 168. MR0072182 (17,242d) [24] D. Roy, Approximation to real numbers by cubic algebraic integers. II, Ann. of Math. (2) 158 (2003), no. 3, 1081–1087. MR2031862 (2004k:11110) [25] C. Siegel, Approximation algebraischer Zahlen, Math. Z. 10 (1921), no. 3-4, 173–213. MR1544471 [26] J. H. Silverman, The arithmetic of elliptic curves, Graduate Texts in Mathematics, 106, Springer, New York, 1986. MR0817210 (87g:11070) [27] H. P. Schlickewei, Die p-adische Verallgemeinerung des Satzes von Thue-Siegel-Roth-Schmidt, J. Reine Angew. Math. 288 (1976), 86–105. MR0422166 (54 #10158) [28] H. P. Schlickewei, On products of special linear forms with algebraic coefficients, Acta Arith. 31 (1976), no. 4, 389–398. MR0429784 (55 #2794) [29] W. M. Schmidt, Diophantine approximation, Lecture Notes in Mathematics, 785, Springer, Berlin, 1980. MR0568710 (81j:10038) [30] W. M. Schmidt, Simultaneous approximation to algebraic numbers by rationals, Acta Math. 125 (1970), 189–201. MR0268129 (42 #3028) ¨ [31] T. Schneider, Uber die Approximation algebraischer Zahlen, Journal f¨ ur die reine und angewandte Mathematik 175 (1936): 182–192. ¨ [32] A. Thue, Uber Ann¨ aherungswerte algebraischer Zahlen, J.reine angew. Math. 135 (1909), 284–305. [33] P. Vojta, A refinement of Schmidt’s subspace theorem, Amer. J. Math. 111 (1989), no. 3, 489–518. MR1002010 (90f:11054) [34] M. Waldschmidt, Diophantine equations and transcendental methods(written by Noriko Hirata). In Transcendental numbers and related topics, RIMS Kokyuroku, Kyoto, 599 (1986), no. 8,82–94. [35] E. A. Wirsing, On approximations of algebraic numbers by algebraic numbers of bounded degree, in 1969 Number Theory Institute (Proc. Sympos. Pure Math., Vol. XX, State Univ. New York, Stony Brook, N.Y., 1969), 213–247, Amer. Math. Soc., Providence, RI. MR0319929 (47 #8470)
© Copyright 2024