Feeds:
Posts
Comentários

Normalmente eu evito discussões politicas em meus blogs porque basicamente dedico eles somente a Matematica. Entretanto, como eu ja escrevi no blog da minha esposa, resolvi abrir uma exceção pelo seguinte motivo: dois amigos e matematicos Iranianos foram impedidos de entrar na Alemanha e Franca por razoes arbitrarias (para ver minhas duas justificativas para a denominação ‘arbitraria’, veja o post em portugues ou em ingles).

Bom, todos aqueles que desejam apoiar a causa, por favor juntem-se a nos no seguinte blog (fundado pelo Ali e Hossein):

http://iranianmath.blogspot.com/

Me despeço aqui! Ate mais!

Oi! Estou passando para dizer duas coisas:

  • apesar de ja estar um bom tempo sem postar nada, eu não abandonei este blog: de fato, eu tenho 3 posts (os quais ainda estou escrevendo) que estão atrasados porque os assuntos tratados neles serão abordados em mini-cursos a serem dados em breve; como eu pretendo assistir estes cursos, acho melhor ‘atrasar’ um pouco a publicação dos posts para com isso ganhar mais clareza na hora de expor os resultados;
  • nessa semana eu postei no arXiv um paper junto com o Giovanni Forni (e fiz uma palestra na Universite Paris 13 sobre esse assunto, Villetaneuse) onde nos exibimos um novo exemplo de superficie de Riemann (de genero 4) tal que o cociclo de Kontsevich-Zorich sobre esta orbita é isométrico; quem estiver interessado em ver uma descrição geral com as motivações e um pouco mais de detalhes pode ver o meu post no meu outro blog em ingles.

Bem, sem mais para o momento, fico por aqui! Até ja!

Lembramos que o teorema de Kaloshin e Rodnianski é:

Teorema. Dois elementos genéricos (no sentido da medida de Haar) A,B\in SO(3) são fracamente Diofantinos no seguinte sentido: existe uma constante D=D(A,B)>0 tal que

\|W_n(A,B)-E\|\geq D^{-n^2}

para toda W_n(A,B) palavra de tamanho n nas letras A,B.

Conforme adiantamos no post anterior, vamos utilizar a seguinte notação: dados A,B\in SO(3), denotamos por \alpha,\beta os ângulos de rotação de A,B e \gamma o ângulo entre os eixos de rotação v_A,v_B de A,B. Sem perda de generalidade, iremos assumir que A esta normalizada de maneira que v_A é o eixo OX em \mathbb{R}^3. No mais, denotaremos as palavras W_n(A,B) por W_n(\alpha,\beta,\gamma). Para trabalhar melhor com as palavras de um dado tamanho, introduzimos multi-indices \mathcal{I}_m=(s_1,r_1,\dots,s_m,r_m) onde s_1 e r_m podem ser zero mas os outros 2m-2 inteiros são todos não-nulos. O tamanho |\mathcal{I}_m| do multi-indice \mathcal{I}_m é |\mathcal{I}_m|=\sum_p(|s_p|+r_p). A palavra W_{\mathcal{I}_m}(A,B) parametrizada por \mathcal{I}_m é

W_{\mathcal{I}_m}(A,B)=A^{s_1}B^{r_1}\dots A^{s_m}B^{s_m}.

Com esta notação e utilizando o fato da medida de Haar \mu\times\mu em SO(3)\times SO(3) ser equivalente a medida de Lebesgue Leb_3 no espaço de parâmetros (\alpha,\beta,\gamma)\in\mathbb{T}^3, vemos que o teorema de Kaloshin e Rodnianski equivale à:

Teorema. Para Leb_3 quase todo (\alpha,\beta,\gamma)\in\mathbb{T}^3, existe uma constante D=D(\alpha,\beta,\gamma)>0 tal que

\min\limits_{|\mathcal{I}_m|=n}\|W_{\mathcal{I}_m}(\alpha,\beta,\gamma)-E\|\geq D^{-n^2} para todo n\geq 1.

Dada uma constante D>0, defina

\Phi_{\mathcal{I}_m}(D)=\{(\alpha,\beta,\gamma)\in\mathbb{T}^3: \|W_{\mathcal{I}_m}(\alpha,\beta,\gamma)-E\|\geq D^{-n^2}\}

e

\Phi_n(D)=\bigcup\limits_{|\mathcal{I}_m|=n}\Phi_{\mathcal{I}_m}(D).

Como ja antecipamos na discussão anterior, um argumento simples usando o lema de Borel-Cantelli mostra que o teorema acima é uma consequência do seguinte fato:

Teorema 1. Existe uma constante D^*>0 tal que

\sum\limits_{n=1}^{\infty}Leb_3(\Phi_n(D^*))<\infty.

No que se segue, iremos nos concentrar na prova do teorema 1. Para isso, adotaremos a seguinte estratégia:

  • a idéia basica seria utilizar a representação quarteniônica de SO(3) para escrever \|W_{\mathcal{I}_m}(\alpha,\beta,\gamma)-E\|^2 como um polinômio trigonométrico (e usar os lemas classicos de Dani, Kleinbock e Margulis para estimar o tamanho da vizinhança dos zeros destes polinômios); entretanto, por motivos técnicos, procederemos como nos dois passos abaixo;
  • veremos que estimar Leb_3(\Phi_n(D^*)) corresponde moralmente a estudar o tamanho do conjunto dos parâmetros (\alpha,\beta,\gamma) onde a derivada \partial_{\alpha}W_{\mathcal{I}_m}(\alpha,\beta,\gamma) da palavra W_{\mathcal{I}_m}(\alpha,\beta,\gamma) com relação a variavel \alpha é pequena;
  • em seguida, estimamos o conjunto destes parâmetros usando a representação quarteniônica de SO(3) para estimar \partial_{\alpha}W_{\mathcal{I}_m}(\alpha,\beta,\gamma) (o que sera tecnicamente mais simples).

Redução do teorema 1 ao estudo da derivada \partial_{\alpha}W_{\mathcal{I}_m}

Defina \Phi_{\mathcal{I}_m,\alpha}(D)=\{(\alpha,\beta,\gamma)\in\mathbb{T}^3: \|\partial_{\alpha}W_{\mathcal{I}_m}(\alpha,\beta,\gamma)\|^2\leq D^{-2n^2/3}\}. Para comparar as medidas de Lebesgue de \Phi_{\mathcal{I}_m}(D) e \Phi_{\mathcal{I}_m,\alpha}(D), precisaremos do seguinte lema:

Lema 1. \|\partial_{\alpha\alpha}W_{\mathcal{I}_m}(\alpha,\beta,\gamma)\|^2\leq |\mathcal{I}_m|^4.

Prova. Os elementos de SO(3) podem ser escritos em representação quaterniônica como

q=\cos\theta + \sin\theta\cdot(iv_1+jv_2+kv_3)

onde \theta é o ângulo de rotação e (v_1,v_2,v_3)\in\mathbb{R}^3 é o eixo de rotação. Nesta representação, temos

\begin{array}{l}W_{\mathcal{I}_m}(\alpha,\beta,\gamma) = \\(\cos(s_1\alpha)+i\sin(s_1\alpha)) (\cos(r_1\beta)+\sin(s_1\beta)(i\cos\gamma+j\sin\gamma))\dots \\ (\cos(s_m\alpha)+i\sin(s_m\alpha)) (\cos(r_m\beta)+\sin(s_m\beta)(i\cos\gamma+j\sin\gamma))\end{array}.

Derivando duas vezes em \alpha, obtemos

\|\partial_{\alpha\alpha}W_{\mathcal{I}_m}(\alpha,\beta,\gamma)\|^2\leq \left(\sum\limits_{p=1}^m|s_p|\right)^4\leq |\mathcal{I}_m|^4.

Isto encerra a prova do lema 1. \square

Com este lema em mãos, podemos mostrar sem dificuldades o seguinte fato:

Lema 2. Dado \mathcal{I}_m um multi-indice de tamanho |\mathcal{I}_m|=n, temos

Leb_3(\Phi_{\mathcal{I}_m}(D))\leq Leb_3(\Phi_{\mathcal{I}_m,\alpha}(D))+ 4n^4D^{-n^2/3}.

Prova. Dado (\alpha^*,\beta,\gamma)\notin\Phi_{\mathcal{I}_m,\alpha}(D), vemos da definição de \Phi_{\mathcal{I}_m,\alpha}(D) e do lema 1

\|\partial_{\alpha}W_{\mathcal{I}_m}(\alpha^*,\beta,\gamma)\|^2\geq D^{-2n^2/3} \quad \textrm{ e } \quad \|\partial_{\alpha\alpha}W_{\mathcal{I}_m}(\alpha^*,\beta,\gamma)\|^2\leq n^4.

Em seguida, dividimos o circulo \mathbb{T}_{\alpha} em 2D^{n^2/3}/n^4 intervalos de tamanhos iguais e denotamos por I o intervalo contendo \alpha^*. As estimativas acima e o teorema de Taylor implicam que

\|W_{\mathcal{I}_m}(\alpha,\beta,\gamma)\|^2\geq \frac{D^{-n^2/3}}{2}.

Logo, obtemos que a medida de Lebesgue do conjunto dos \alpha\in I tais que (\alpha,\beta,\gamma)\notin\Phi_{\mathcal{I}_m,\alpha}(D) é 2D^{-2n^2/3}. Juntando estas estimativas sobre todos os n^4/2D^{n^2/3} intervalos I e usando o teorema de Fubini, temos a prova do lema. \square

A derivada \partial_{\alpha}W_{\mathcal{I}_m} como um polinômio trigonométrico

Lema 3. Cada palavra W_{\mathcal{I}_m} de tamanho n=|\mathcal{I}_m| esta associada a um polinômio P_{\mathcal{I}_m}(x_{\alpha},y_{\alpha},x_{\beta},y_{\beta},x_{\gamma},y_{\gamma}) de grau 2n+2m com coeficientes inteiros tal que

\|\partial_{\alpha}W_{\mathcal{I}_m}(\alpha,\beta,\gamma)\|^2 = P_{\mathcal{I}_m}(\cos\alpha,\sin\alpha,\cos\beta,\sin\beta,\cos\gamma,\sin\gamma).

Prova. Isso segue de um calculo explicito usando a representação quaterniônica para W_{\mathcal{I}_m}(\alpha,\beta,\gamma) (veja a prova do lema 1). \square

Como ja comentamos, a proxima etapa consiste em utilizar a informação do lema acima para estimar o tamanho do conjunto \Phi_{\mathcal{I}_m,\alpha}(D). Mais precisamente, temos o seguinte teorema:

Teorema 2. Existe uma constante D^* tal que

\textrm{Leb}_3(\Phi_{\mathcal{I}_m,\alpha}(D^*))\leq 5^{-n}

para todo multi-indice \mathcal{I}_m de tamanho n=|\mathcal{I}_m| suficientemente grande.

Antes de entrar nos detalhes do teorema 2, vejamos que o teorema 1 segue do teorema 2.

Prova do teorema 1 (assumindo o teorema 2). Observamos que o numero de palavras de tamanho n é 4^n. Portanto, o teorema 2 e o lema 2 dizem que

\textrm{Leb}_3(\Phi_n(D^*))\leq (4/5)^n + 4n^4(D^*)^{-n^2/3}

para todo n grande. Em particular, o resultado de somabilidade desejado segue. \square

Para encerrar o post de hoje, vamos fazer um esquema da prova do teorema 2 na proxima seção.

Estimativas para polinômios e eliminação de variaveis

Lembramos ao leitor do seguinte lema de estimativa de polinômios em uma variavel:

Lema 4 (Dani, Kleinbock e Margulis). Seja P(x) um polinômio real de grau \leq n e denote por \|P\|_{I}:=\max\limits_{x\in I} |P(x)|. Então, para todo I intervalo compacto e todo \varepsilon>0, temos

\textrm{Leb}_1(x\in I: |P(x)|\leq\varepsilon)\leq 2n(n+1)^{1/n}(\varepsilon/\|P\|_I)^{1/n} |I|.

A prova deste resultado usa interpolação de Lagrange ao longo de um conjunto de pontos bem-escolhidos. O leitor curioso por mais detalhes pode ver a (curta) demonstração do lemma 2 do meu post em ingles sobre o teorema de Fayad e Krikorian (cuja prova é, por sua vez, baseada nestes argumentos de Kaloshin e Rodnianski).

Logicamente, o lema 4 não pode ser aplicado diretamente ao nosso caso porque nossos polinômios P_{\mathcal{I}_m} possuem varias variaveis (as quais possuem relações entre elas). Entretanto, esta dificuldade técnica pode ser contornada através do método de eliminação de variaveis. Para explicar como este método funciona, consideramos F(x,y), G(x,y) dois polinômios em duas variaveis x,y. O estudo dos zeros comuns de F, G pode ser reduzido ao estudo dos zeros de um polinômio em uma variavel do seguinte modo: fixando x_0, sabemos dos cursos de Algebra que a existência de raizes comuns y de F(x_0,y), G(x_0,y) é completamente determinada pelo anulamento do polinômio resultante R[F,G](x_0)=0 (o qual depende apenas da variavel x). Ou seja, a questão de entender zeros comuns de polinômios com duas variaveis pode ser reduzida ao problema de entender os zeros de um polinômio de uma variavel (com grau ligeiramente maior). Logicamente que para a aplicação desta idéia no contexto do lema 4, precisamos de versões quantitativas do método de eliminação de variaveis. Felizmente, isso foi feito por Kaloshin e Rodnianski no lema 6 do artigo. Entretanto, para fazer o método funcionar no nosso caso é necessario acompanhar todas as constantes e graus dos polinômios envolvidos na eliminação, o que é um trabalho técnico que não pode ser descrito em detalhes em um post. Porém, podemos dar uma idéia geral de como o processo ocorre.

Pelo lema 3, a prova do teorema 2 fica reduzida a uma estimativa do tamanho de conjuntos da forma

\{(\alpha,\beta,\gamma):|P_{\mathcal{I}_m}(\cos\alpha,\sin\alpha,\cos\beta,\sin\beta,\cos\gamma, \sin\gamma)|\leq \varepsilon\}.

Com esse intuito, notamos que, fazendo x_{\theta}=\cos\theta e y_{\theta}=\sin\theta, essa tarefa essencialmente equivale a estudar o conjunto de soluções comuns para as equações polinomiais

P_{\mathcal{I}_m}(x_{\alpha},y_{\alpha},x_{\beta},y_{\beta},x_{\gamma}, y_{\gamma})-\varepsilon=0

e

x_{\alpha}^2+y_{\alpha}^2-1=0, \quad x_{\beta}^2+y_{\beta}^2-1=0, \quad x_{\gamma}^2+y_{\gamma}^2-1=0.

Em seguida, aplicamos o método de eliminação de variaveis três vezes na seguinte ordem: primeiro eliminamos a variavel y_{\alpha} através do polinômio resultando R entre P_{\mathcal{I}_m} e x_{\alpha}^2+y_{\alpha}^2-1; depois, eliminamos (de modo analogo ao anterior) y_{\beta} através da resultante R_1 entre R e x_{\beta}^2+y_{\beta}^2-1=0; finalmente, eliminamos y_{\gamma} obtendo um polinômio R_2.

Para justificar porque a eliminação fornece boas estimativas, precisamos saber
que R_2 é um polinômio não-degenerado (i.e., R_2 não é identicamente nulo). No nosso caso, o processo de eliminação nunca é degenerado porque a resultante entre P_{\mathcal{I}_m} e x^2+y^2-1 identicamente nula implicaria que a função W_{\mathcal{I}_m}(\alpha,\beta,\gamma) é degenerada (i.e., constante). Entretanto, desde os trabalhos de Hausdorff no paradoxo de Banach-Tarski, sabemos que elementos genéricos de SO(3) geram um grupo livre, de modo que a função W_{\mathcal{I}_m} não pode ser constante (isto pode ser visto diretamente da representação quarteniônica: veja o lemma 2 de Kaloshin e Rodnianski).

Com isso, o esquema da prova do teorema 2 esta terminado! Ate mais!

Ola! Hoje eu pretendo iniciar a discussão de um resultado de V. Kaloshin e I. Rodinianski sobre a genericidade de elementos Diofantinos dos grupos SO(3) e SU(2). A motivação basica consiste em estender para o contexto não-comutativo o seguinte teorema bem-conhecido sobre a ma-aproximação de numeros reais ”tipicos”:

Teorema 0. Quase todo numero real x\in\mathbb{R} (no sentido da medida de Lebesgue) é Diofantino: existem constantes C,\tau>0 tais que

|x-p/q|\geq C/q^{2+\tau}

para quaisquer p,q\in\mathbb{N} inteiros.

Observação 0. Um argumento topologico simples (baseado no teorema de Baire), mostra que o conjunto de numeros Liouville (i.e., os numeros não-Diofan- tinos) é residual. A prova deste fato é deixado como exercicio. (Sugestão: Utilize a negação da condição Diofantina para escrever os numeros Liouville como a uniao enumeravel de abertos densos).

Certamente o leitor ja deve ter encontrado varios contextos onde as propriedades Diofantinas dos numeros reais são fundamentais: por exemplo, em Sistemas Dinâmicos, sabemos que as propriedades Diofantinas dos numeros de rotação de difeomorfismos do circulo e dos autovalores da derivada em pontos periodicos de transformações holomorfas estão profundamente ligadas as questões de linearização e conjugação de tais sistemas (veja estes dois trabalhos de Yoccoz, por exemplo), enquanto que na teoria KAM é bem-co- nhecida a persistencia das dinâmicas correspondentes a toros invariantes suportando rotações de ângulos verificando condições Diofantionas (veja esta exposição de Yoccoz sobre os trabalhos de Herman, por exemplo).

Visando generalizar o teorema 0 para o contexto de grupos não-comutativos, uma formulação natural da propriedade Diofantina nos grupos SO(3) e SU(2) é a seguinte:

Definição 1. Dizemos que g_1,\dots,g_k\in SO(3) (ou SU(2)) são Diofantinos sempre que existir uma constante D(g_1,\dots,g_k)>0 tal que toda palavra W_n de tamanho n sobre as letras g_1,g_1^{-1},\dots,g_k,g_k^{-1} verifica

(1) \|W_n\pm E\|\geq D(g_1,\dots,g_k)^{-n}.

Aqui E\in SO(3) é a identidade.

Observação 1. Tendo em vista palavras como ABA^{-1}B^{-1} (e outras similares), segue que uma condição necessaria para que os elementos g_1,\dots,g_k sejam Diofantinos é que o subgrupo gerado por g_1,\dots,g_k seja livre.

Observação 2. Um argumento simples baseado no principio da casa de pombos e na compacidade de SO(3) mostra que a condição Diofantina acima é op- timal: como a quantidade de palavras de tamanho n cresce exponencial- mente com n, as versões super-exponencial ou polinomial da estimativa (1) são fraca ou forte demais para descrever o comportamento tipico dos elementos de SO(3). Com efeito, o leitor é convidado a verificar que, dados g_1,\dots,g_k gerando um subgrupo livre de SO(3) e m\geq 1 inteiro, sempre existe uma palavra W_m de tamanho m sobre as letras g_1,g_1^{-1},\dots,g_k,g_k^{-1} tal que

\|W_m-E\|\leq 10/(2k-1)^{m/6}.

Observação 3. Analogamente ao caso dos numeros reais (vide observação 0), um argumento elementar mostra que para um conjunto residual de pares A,B\in SO(3) a condição Diofantina não é satisfeita.

Observação 4. Nas nossas futuras considerações, os papéis de SO(3) e SU(2) são moralmente idênticos porque SU(2) é o recobrimento (duplo e universal) de SO(3).

Com esta noção de elementos Diofantinos de SO(3) e SU(2), o analogo do teorema 0 é:

Conjectura (Gamburd, Jakobson e Sarnak). Quase todos os elementos g_1,\dots,g_k\in SU(2) ou SO(3) (no sentido da medida de Haar) são Diofantinos.

No presente momento, esta conjectura encontra-se em aberto (até onde o autor sabe). A relevância da conjectura de Gamburd, Jakobson e Sarnak é expressada na sua aplicação na solução do problema de Ruziewicz.

O problema de Ruziewicz consiste em mostrar que toda probabilidade finitamente aditiva da esfera S^n a qual é invariante pelo grupo de rotações SO(n+1) é a medida de Lebesgue. Na linguagem da teoria ergodica, este problema corresponde a saber se a ação de SO(n+1) em S^n é unicamente ergodica (com relação ao espaço de probabilidades finitamente aditivas). Note que quando a medida é \sigma-aditiva, este resultado foi provado por Lebesgue. Entretanto, S. Banach provou que este problema tem solução negativa em dimensão n=1 (de fato, J. Rosenblatt melhorou o resultado de Banach provando que existe todo um continuo de probabilidades finitamente aditivas invariantes por rotações do circulo). Por outro lado, G. Margulis e D. Sullivan (independentemente) mostraram que a solução do problema de Ruziewicz é afirmativa quando n\geq 4 usando a chamada propriedade T de Kazhdan. Finalmente, V. Drinfeld resolveu os casos restantes (n=2,3) dando uma solução afirmativa ao problema.

Conforme os resultados de J. Rosenblatt, o problema de Ruziewicz pode ser reduzido a questão de achar subgrupos livres F de SO(n+1) com a propriedade de lacuna espectral: existe uma constante c>0 tal que para toda função f\in L^2(S^n) com média nula podemos encontrar um elemento g\in F com

\|f\circ g - f\|_{L^2}\geq c\|f\|_{L^2}.

Observação 5. A informação relevante aqui é a condição de lacuna espectral: com efeito, desde os trabalhos de Hausdorff (em 1914) sobre o paradoxo de Banach-Hausdorff-Tarski, sabemos da existência de subgrupos livres com dois geradores. De fato, trabalhando-se um pouco, podemos mostrar que o conjunto de pares de matrizes A,B\in SO(3) os quais não geram um subgrupo livre é uma união enumeravel de conjuntos analiticos de codimensão 1 (isto sera visto mais tarde). Portanto, temos uma abundância de subgrupos livres com dois geradores, de maneira que basta achar um subgrupo livre com lacuna espectral dentro deste ”mar” de subgrupos livres para resolver o problema de Ruziewicz.

Observação 6. Generalizando a observação 5, lembramos que Auerbach mostrou que grupos de Lie G compactos e simplesmente conexos possuem muitos subgrupos livres: quase todo par de elementos A,B\in G (com respeito a medida de Haar) gera um subgrupo livre cujo fecho é G.

Uma construção explicita de um subgrupo livre de SU(2) com lacuna espectral foi feita por Lubotzky, Phillips e Sarnak (via operadores de Hecke), o que fornece uma prova alternativa do problema de Ruziewicz (como comentamos pouco antes da observação 5) no delicado caso n=2 (veja também esta nota de Hee Oh). Entretanto, esta construção deixa aberta a pergunta natural de entender a frequência de ocorrência de subgrupos livres de SO(3) e/ou SU(2) com lacuna espectral.

Neste sentido, Bourgain e Gamburd recentemente ( 2008 ) mostraram que todos os subgrupos livres de SU(2) gerados por elementos Diofantinos possuem lacuna espectral! Logo, usando a observação de Rosenblatt, os elementos Diofantinos de SO(3) podem ser usados para dar uma solução alternativa (mais simples) do problema de Ruziewicz em dimensão 2 (em vista da elaborada solução dada por Drinfeld).

Dito isto, vemos uma clara relação entre a conjectura de Gamburd, Jakobson e Sarnak acima e o problema de Ruziewicz em dimensão 2.

Por outro lado, ja dissemos que esta conjectura encontra-se aberta. Entretanto, temos um (unico) resultado parcial na direção da conjectura:

Teorema 1 (Kaloshin e Rodinianski). Quase todos os elementos g_1,\dots,g_k de SO(3) (ou SU(2)) são fracamente Diofantinos: existe uma constante D(g_1,\dots,g_k)>0 tal que toda palavra W_n de tamanho n sobre as letras g_1,g_1^{-1},\dots,g_k,g_k^{-1}

(2) \|W_n\pm E\|\geq D(g_1,\dots,g_k)^{-n^2}.

Nosso objetivo sera descrever os principais passos da prova desse teorema. Para efeitos de clareza da exposição, usaremos a observação 4 para nos restringirmos ao caso do grupo SO(3). Mais ainda, sendo o tratamento do caso de k elementos g_1,\dots,g_k identico ao caso de dois elementos (exceto talvez pela necessidade de uma notação mais complicada), consideraremos apenas a demonstração do teorema de Kaloshin e Rodnianski para dois elementos A,B\in SO(3) tipicos.

Para este post, iremos somente traçar a estrategia a ser seguida, deixando os detalhes para um proximo post. Dados dois elementos distintos A,B\in SO(3), denotamos por \alpha e \beta os ângulos de rotação de A e B (resp.), e por \gamma o ângulo entre os eixos de rotação v_A e v_B de A e B (resp.). Para nossas considerações posteriores, podemos fazer (sem perda de generalidade) a seguinte normalização: o eixo de rotação v_A de A é o eixo x em \mathbb{R}^3 e o eixo de rotação v_B de B esta contido no plano (x,y) fazendo ângulo \gamma com v_A no sentido horario. Observe que com esta convenção, toda palavra W_n(A,B) de tamanho n\geq 1 é unicamente determinada pela escolha deste sistema de coordenadas e pelos parâmetros

(\alpha,\beta,\gamma)\in \mathbb{T}_{\alpha}\times \mathbb{T}_{\beta}\times \mathbb{T}_{\gamma} = \mathbb{T}^3

Isto permite escrever W_n(A,B) = W_n(\alpha,\beta,\gamma) e considerar o toro tridimensional \mathbb{T}^3 como espaço de parâmetros o qual vem equipado com a medida de Lebesgue Leb_3. Do modo como nossos parâmetros são definidos, o leitor pode verificar que conjuntos de medida total para a medida de Haar produto \mu\times\mu em SO(3)\times SO(3) correspondem a conjuntos de medida total para Leb_3 em \mathbb{T}^3.

Neste ponto, a idéia da prova é bastante similar a demonstração de Fayad e Krikorian do teorema de hiperbolicidade de palavras desbalanceadas em SL(2,\mathbb{R}) ja discutida nestes dois posts anteriores no blog em ingles (cronologicamente falando, a prova de Fayad e Krikorian ( 2008 ) é inspirada na prova de Kaloshin e Rodnianski (2001)). Grosseiramente falando, o ponto é o seguinte argumento do tipo Borel-Cantelli: fixamos uma palavra W_n(\alpha,\beta,\gamma) de tamanho n em A, B e consideramos os parâmetros (\alpha,\beta,\gamma)\in \mathbb{T}^3 tais que W_n(\alpha,\beta,\gamma) esta a uma distância \leq D^{-n^2} da identidade E. Denotando por m_n(D) a medida de Lebesgue Leb_3 destes parâmetros (variando sobre todas as palavras de tamanho n) para um certo D>1 fixo, o lema de Borel-Cantelli diz que nossa tarefa fica reduzida a mostrar a estimativa:

(3) \sum\limits_{n} m_n(D)<\infty.

Para provar a estimativa (3), o fato fundamental é que a representação quaterniônica (de Hamilton) dos elementos de SO(3) permite escrever a distância entre W_n(\alpha,\beta,\gamma) e E como um polinômio trigonométrico P_n(\alpha,\beta,\gamma) de grau n em \alpha,\beta,\gamma e todos os coeficientes inteiros. Fixamos \beta=\beta^*, \gamma=\gamma^* e olhamos para o conjunto de parâmetros \alpha tais que

|P_n(\alpha,\beta_*,\gamma_*)|\leq D^{-n^2}.

Por um lema elementar de Dani, Kleinbock e Margulis sobre a medida de Lebesgue do conjunto de pontos onde um dado polinômio assume valores pequenos, sabemos que

Leb_1(\{\alpha: |P_n(\alpha,\beta_*,\gamma_*)|\leq D^{-n^2}\})\lesssim D^{-n}.

Como temos 4^n palavras W_n(A,B) de tamanho n sobre as letras A,B,A^{-1},B^{-1} (no maximo), segue que

m_n(D)\leq (4/D)^n.

Isto mostra a estimativa (3) desejada (fazendo D>4), o que completaria a prova do teorema 1.

Com isto encerramos as considerações (introdutorias) deste post. No proximo encontro, iremos detalhar um pouco mais a estrategia delineada acima. O leitor desejoso de uma ”preparação” para os argumentos de Kaloshin e Rodnianski num contexto um pouco mais simples (do grupo SL(2,\mathbb{R})) é incentivado a consultar as duas notas do blog em ingles sobre o teorema de Fayad e Krikorian. Fico por aqui! Ate ja!

Ola! Estou passando aqui para avisar (a quem interessar possa) que acabo de postar (na versão em ingles do blog) algumas notas sobre a recente prova de Brendle e Schoen do teorema da esfere diferenciavel. O link para o artigo é o seguinte:

http://matheuscmss.wordpress.com/2008/06/10/the-differentiable-sphere-theorem-of-brendle-and-schoen/

Basicamente, o artigo conta como a utilização das tecnicas do famoso fluxo de Ricci (de R. Hamilton) permitiu que Brendle e Schoen resolvessem a questão da diferenciabilidade no teorema de esfera de Berger e Klingenberg. Este é mais um exemplo (além da famosa prova de Perelman da conjectura de Poincaré) do poder da teoria de fluxo de Ricci… Parafraseando um geometra conhecido meu: ”Ricci flow is a gold mine!”.

Por enquanto é so! Aguardem mais novidades em breve!

Hoje iremos discutir a teoria ergodica do fluxo homogêneo A_s no espaço de lattices G(\mathbb{R})/G(\mathbb{Z}) conforme prometido no fim do post anterior. Para isso, vamos começar com algumas definições. Lembramos que na ultima seção do post anterior identificamos o grupo especial afim ASL_2(\mathbb{R}) com o seguinte subgrupo de SL_3(\mathbb{R})

G(\mathbb{R}):=\left\{\left(\begin{array}{ccc}a&b&x\\c&d&y\\ 0&0&1\end{array}\right) : ad-bc=1\right\}

o qual é o produto semi-direto G(\mathbb{R}) = SL_2(\mathbb{R})\ltimes V_2(\mathbb{R}) onde

SL_2(\mathbb{R})\simeq \left\{\left(\begin{array}{ccc}a&b&0\\c&d&0 \\ 0&0&1\end{array}\right)\right\} \textrm{ e } V_2(\mathbb{R})= \left\{\left(\begin{array}{ccc}1&0&x\\ 0&1&y\\ 0&0&1\end{array}\right)\right\}\simeq \mathbb{R}^2.

Além disso, identificamos o espaço de lattices E com G(\mathbb{R})/G(\mathbb{Z}) e definimos

(1) A_s:=\left(\begin{array}{ccc}s&0&0\\ 0&1/s&0 \\ 0&0&1\end{array}\right) \textrm{ e } U(t):=\left(\begin{array}{ccc}1&-2t& -t^2\\ 0&1&t \\ 0&0&1\end{array}\right).

Finalmente, nos concluimos que todas essas identificações reduziam nossa tarefa na prova do seguinte fato (enunciado como teorema 3 no post anterior):

Teorema 0. Para toda f\in C_0(E) vale

\int_0^1 f(A_s\cdot\sigma(t))dt\to\int_E f d\mu_E.

Como ja antecipamos, este resultado sera obtido de um teorema mais geral sobre equidistribuição de horociclos não-lineares. Para enunciar adequadamente este teorema, vamos introduzir a definição:

Definição 1. Uma seção horociclica (ou horociclo) é uma aplicação \sigma:\mathbb{R}\to G(\mathbb{R}) da forma

(2) \sigma(t) = \left(\begin{array}{ccc}1&t& x(t)\\ 0&1&y(t) \\ 0&0&1\end{array}\right)

tal que

\sigma(t+p_0) = \sigma(t)\gamma_0

para algum inteiro p_0\geq 1 e algum elemento \gamma_0\in G(\mathbb{Z}).

Observação 1. Dado um horociclo \sigma existe um inteiro minimal p\geq 1 tal que \sigma(t+p)=\sigma(t)\gamma para algum \gamma\in G(\mathbb{Z}). Este inteiro p é o periodo de \sigma em E=G(\mathbb{R})/G(\mathbb{Z}).

Observação 2. O nome horociclo tem a seguinte motivação: a projeção natural do espaço de lattices E para o espaço de redes B envia uma seção horociclica de E sobre um horociclo (usual) ao redor de um “cusp” de B.

Definição 2. Um horociclo \sigma é dito linear (sobre os racionais) sempre que para todo \alpha,\beta\in\mathbb{Q} tivermos

m\left(\{t\in[0,p]: x(t)=\alpha t+\beta\}\right)>0.

Caso contrario, o horociclo \sigma é dito não-linear.

Observação 3. O comportamento de y(t) não influencia na nossa definição de linearidade.

Observação 4. Um horociclo real-analitico \sigma é linear se e so se x(t)\equiv \alpha t+\beta para algum \alpha,\beta\in\mathbb{Q} ja que toda função real-analitica não-constante possui um conjunto discreto de zeros.

Comparando as equações (1), (2) e utilizando a observação 4, vemos que

\sigma(t):=U(-t/2) := \left(\begin{array}{ccc}1&t& -t^2/4\\ 0&1&-t/2 \\ 0&0&1\end{array}\right)

forma um horociclo não-linear com periodo p=2 e x(t)=-t^2/4. Portanto, o teorema 0 acima segue imediatamente do seguinte fato mais geral:

Teorema 1 (Equidistribuição de horociclos). Seja \sigma:\mathbb{R}\to G(\mathbb{R}) um horociclo não-linear de periodo p. Então, os circulos A_s\cdot\sigma ficam equidistribuidos em E, i.e.,

\lim\limits_{s\to\infty}\frac{1}{p}\int_0^p f(A_s\cdot\sigma(t)) dt = \int_E f(x) d\mu_E(x).

Observação 5. Os ingredientes importantes neste resultado são: a “parte linear” do horociclo ser uma matriz unipotente e o horociclo é não-linear. Com efeito, na prova do teorema 1 iremos usar o fato do horociclo ter parte linear unipotente para aplicar o teorema de Ratner de modo a reduzir a lei de distribuição \mu do horociclo para uma quantidade enumeravel de candidatos (dentre eles \mu_E). Em seguida usamos a não-linearidade para excluir todas as outras possibilidades.

Observação 6. A hipotese do horociclo ser não-linear é essencial: quando o horociclo é linear, o resultado do teorema 1 é falso! Voltaremos nesse ponto apos vermos a prova do teorema.

Com isso, dedicaremos o resto deste post para a demonstração do teorema 1. Para isso, vamos utilizar o seguinte esquema:

  • na proxima seção, revisaremos alguns fatos basicos sobre medidas invariantes e veremos algumas propriedades da medida \mu associada a lei de distribuição de A_s\cdot\sigma(t);
  • em seguida, usaremos o teorema de Ratner para mostrar que temos apenas uma quantidade enumeravel de possibilidades para a lei de distribuição \mu;
  • finalmente, na ultima seção utilizaremos a não-linearidade do horociclo \sigma para provar que a unica possibilidade para a lei de distribuição \mu é \mu=\mu_E, o que terminara a prova do teorema 1.

Agora passamos para a formalização desse programa.

A lei de distribuição de um ”loop”

Dado um ”loop” \sigma:\mathbb{R}/p\mathbb{Z}\to E, denotamos por m(\sigma) a probabilidade natural suportada na imagem de \sigma:

\int_E f dm(\sigma):= \frac{1}{p}\int_0^p f(\sigma(t)) dt

para f\in C_0(E).

Além disso, dado \sigma:\mathbb{R}/p\mathbb{Z}\to E um horociclo não-linear de periodo p, denotamos por \sigma_s:=A_s\cdot\sigma, de modo que o teorema 1 é equivalente ao seguinte resultado:

Teorema 2 (Equidistribuição de horociclos versão 2). Para todo horociclo não-linear \sigma vale

m(\sigma_s) = (A_s)_*m(\sigma)\to \mu_E quando s\to\infty.

Como de costume, aqui a convergência ocorre na topologia fraca-*. Pelo teorema de Banach-Alaoglu, sabemos que m(\sigma_s) possui uma subsequência convergente para uma medida \mu. Em particular, nossa tarefa consiste em mostrar que para tais subsequências sempre temos \mu=\mu_E.

Para isso, consideramos a aplicação D do espaço de lattices E para o espaço de redes B a qual associa para cada elemento g\in E a sua parte linear D(g)\in B, i.e.,

D\left(\begin{array}{ccc}a&b&x\\c&d&y\\ 0&0&1\end{array}\right) := \left(\begin{array}{ccc}a&b&0\\c&d&0\\ 0&0&1\end{array}\right).

Observe que a projeção da medida de Haar \mu_E de E por D é a me- dida de Haar \mu_B de B. Por isso, como um trabalho preliminar na direção de provar que \mu=\mu_E, vamos verificar que a projeção de \mu por D esta correta:

Proposição 1. Temos que D_*\mu=\mu_B.

Prova. A imagem H de D\circ\sigma é um horociclo (no sentido usual) do espaço B. Por outro lado, D envia as orbitas do “fluxo de Teichmuller” A_s (as quais são geodesicas) de E em geodesicas de B e D envia a medida m(\sigma) na medida de Haar \mu_H de H. Finalmente, um argumento simples mostra que o fluxo geodesico de B puxa H para longe das cuspides de B de maneira que H fica equidistribuida (para mais detalhes veja o theorem 2.4 de Elkies e McMullen). Juntando esses fatos, segue que

D_*\mu = \lim (A_s)_*\mu_H = \mu_B.

Isto termina a prova. \square

Observação 7. Uma consequência direta da proposição 1 é que \mu é uma probabilidade em E, i.e., \mu(E)=1. Em particular, a massa das probabilidades m(\sigma_s) é conservada na passagem ao limite. Essa é uma observação não-trivial porque o espaço E é não-compacto!

Como veremos mais tarde, para entrarmos no contexto do teorema de Ratner, precisamos saber que \mu é invariante por um subgrupo unipotente de SL_2(\mathbb{R}). Com esse intuito, introduzimos o grupo

N(t) := \left(\begin{array}{ccc}1&t&0 \\ 0&1&0 \\ 0&0&1\end{array}\right).

Note que este subgrupo unipotente aparece naturalmente em vista da formula D\circ\sigma(t) = N(t) sempre que \sigma(t) é um horociclo. O resultado preparatorio para ficarmos no contexto de Ratner é o seguinte:

Proposição 2. A probabilidade \mu é N(\mathbb{R})-invariante.

Prova. Fixamos \tau\in\mathbb{R}. Consideramos \sigma_s(t)=A_s\cdot\sigma(t) e \eta_s(t) = N_\tau\cdot\sigma_s(t) onde \sigma(t) é um horociclo. Temos que

\sigma_s(t) = \left(\begin{array}{ccc}s&st&sx(t) \\ 0&\frac{1}{s}&\frac{y(t)}{s} \\ 0&0&1\end{array}\right), \eta_s(t)=\left(\begin{array}{ccc}s&st+\frac{\tau}{s}&sx(t)+\frac{\tau y(t)}{s} \\ 0&\frac{1}{s}&\frac{y(t)}{s} \\ 0&0&1\end{array}\right).

Para comparar adequadamente \sigma_s(t) e \eta_s(t), fazemos uma mudança de variaveis para fazer com que as partes lineares fiquem iguais. Mais precisamente, definimos u=\tau/s^2 e consideramos

\rho_s(t):=\eta_s(t-u):=\left(\begin{array}{ccc}s&st&sx(t-u)+s^{-1}\tau y(t-u) \\ 0&1/s&y(t-u) \\ 0&0&1\end{array}\right).

Lembrando que m(\sigma_s)\to\mu, segue que

(3) m(\rho_s) = m(\eta_s)=(N_\tau)_*m(\sigma_s)\to (N_\tau)_*\mu.

Por outro lado, temos que D\circ\rho_s = D\circ\sigma_s, de modo que a distância entre \rho_s e \sigma_s é dada pela distância entre os vetores obtidos da terceira coluna dessas matrizes:

d(\rho_s,\sigma_s)=\left|\left(\begin{array}{c}sx(t-u)+\tau y(t-u)/s \\ y(t-u)/s \\1\end{array}\right) - \left(\begin{array}{c}sx(t)+\tau y(t)/s \\ y(t)/s \\ 1\end{array}\right)\right|

Em seguida, usamos o fato de x(t) ser Lipschitz, y(t) ser limitado e u=\tau/s^2 para obter que

|sx(t) - sx(t-u)|\leq s|x(t)-x(t-u)|\leq O(su)=O(1/s)

e

|y(t)/s - y(t-u)/s|\leq  (|y(t)|+|y(t-u)|)/s=O(1/s).

Portanto, vemos que d(\rho_s,\sigma_s)\to 0 quando s\to\infty. Em particular, segue que \lim m(\rho_s)=\lim m(\sigma_s)=\mu. Juntando isso com (3), obtemos

(N_\tau)_*\mu=\mu

o que encerra a demonstração. \square

Uma vez que ja temos a invariância de \mu pelo subgrupo unipotente N(\mathbb{R}), passaremos a discutir o teorema de Ratner.

Teorema de Ratner e a classificação de \mu

O teorema de Ratner pode ser enunciado assim:

Teorema de Ratner. Sejam \Gamma um subgrupo discreto de um grupo de Lie conexo G e N um subgrupo unipotente. Seja \nu uma probabilidade ergodica N-invariante em G/\Gamma e denote por J o maior subgrupo de G deixando \nu invariante. Então, existe x\in G/\Gamma tal que \nu(J\cdot x)=1. Além disso, \nu é a medida de Haar de J\cdot x e o suporte de \nu é J\cdot x (de modo que J\cdot x é fechado em G/\Gamma).

A importância do teorema de Ratner para o contexto do teorema de Elkies e McMullen fica evidente: sendo \mu invariante pelo subgrupo unipotente N, podemos classificar \mu listando todos os subgrupos fechados de E ja que o teorema de Ratner diz que \mu deve estar suportada na orbita de um tal subgrupo.

Logicamente o teorema de Ratner tem uma bela historia incluindo varias aplicações em ramos diversos da Matematica. Por isso, ficaria impossivel fazer jus a relevância desse teorema numa discussão breve, de modo que recomendamos o leitor interessado numa exposição profunda do assunto (incluindo algumas ideias da prova em casos particulares, motivação heuristica para a validade do enunciado acima e algumas aplicações) os posts publicados no blog do prof. Terence Tao (veja aqui um link para estes posts).

Em todo caso, nos iremos utilizar o teorema de Ratner do seguinte jeito. Denotando por F uma fibra de E\to B, observamos que F é um toro complexo \mathbb{C}/\Lambda. Para cada inteiro n\geq 1 definimos F[n]=\left(\frac{1}{n}\cdot\Lambda\right)/\Lambda\subset F os pontos de ordem n com respeito a estru- tura de grupo de F e denotamos E[n] o subfibrado de E com fibras F[n].

Definição 3. \bigcup E[n] é o conjunto de pontos de torção de E.

Em seguida introduzimos H(\mathbb{R})\subset G o subgrupo de translações horizontais, i.e., translações por vetores da forma (x,0)\in\mathbb{R}^2 e H(r,\varepsilon)\subset G o conjunto de translações por vetores (x,y) da forma |x|<r e |y|<\varepsilon.

O objetivo dessa seção é aplicar o teorema de Ratner para mostrar o seguinte resultado:

Teorema 4 (Classificação de \mu). Temos que \mu=\mu_E ou \mu(H(\mathbb{R})\cdot E[n])>0 para algum n\geq 1.

Infelizmente o teorema 4 não é uma consequência imediata do teorema de Ratner porque não sabemos que \mu é ergodica. Para contornar essa situação, aplicamos o teorema de desintegração ergodica para escrever \mu como uma combinação convexa (”unica”) de medidas ergodicas N(\mathbb{R})-invariantes:

\mu=\int\nu dP(\nu).

Observação 8. Usualmente o teorema de decomposição ergodica é enunciado em espaços compactos. No caso de E (um espaço não-compacto), aplicamos esse teorema para a compactificação com um ponto e restringimos para E.

Em seguida, para cada \nu probabilidade ergodica N(\mathbb{R})-invariante em E definimos

J(\nu):=\{g\in G(\mathbb{R}): g_*\nu=\nu\},

ou seja, J(\nu) é o maior subgrupo de G(\mathbb{R}) deixando \nu invariante. Observe que J(\nu) é fechado e N(\mathbb{R})\subset J(\nu).

Proposição 3. Para quase toda \nu na decomposição ergodica de \mu, temos

D_*\nu=\mu_B \quad \textrm{ e } \quad D(J(\nu))=SL_2(\mathbb{R}).

Prova. Da proposição 1 sabemos que \mu_B = D_*\mu = \int D_*\nu dP(\nu). Como a ação de N(\mathbb{R}) em (B,\mu_B) é ergodica (porque esta ação é o fluxo horociclico em B), segue que D_*\nu=\mu_B para quase toda \nu.

Por outro lado, pelo teorema de Ratner sabemos que \nu esta suportada em uma orbita J(\nu)\cdot x\subset E. Logo,

D(J(\nu))\cdot D(x) = D(J(\nu)\cdot x) = D(\textrm{supp}(\nu)) = \textrm{supp}(D_*\nu).

Como ja vimos que D_*\nu=\mu_B, obtemos

D(J(\nu))\cdot D(x)=\textrm{supp}(\mu_B)=B=SL_2(\mathbb{R})/SL_2(\mathbb{Z}).

Portanto, D(J(\nu))=SL_2(\mathbb{R}). Isso termina a prova. \square

Agora nos relembramos a seguinte proposição sobre ações de SL_2(\mathbb{R}):

Proposição 4. Toda ação afim de SL_2(\mathbb{R}) em \mathbb{R}^k possui pontos fixos.

Prova. Pelo truque unitario de Weyl, esta ação pode ser estendida para uma ação de SL_2(\mathbb{C}) em \mathbb{C}^k. Por outro lado, um ponto fixo p\in\mathbb{C}^k para o grupo compacto SU_2(\mathbb{C}) pode ser construido facilmente (p.ex., tomando a media). Como \mathbb{C}\cdot su_2(\mathbb{C})=sl_2(\mathbb{C}), o ponto p é fixado também pela ação de SL_2(\mathbb{C}) e, a fortiori, pela ação de SL_2(\mathbb{R}). Logo, a parte real de p é o ponto fixo de SL_2(\mathbb{R}) em \mathbb{R}^k desejado. \square

Proposição 5. Se H\subset G(\mathbb{R}) é um subgrupo com D(H)=SL_2(\mathbb{R}), então H=G(\mathbb{R}) ou H é conjugado a SL_2(\mathbb{R}).

Prova. Como D(H)=SL_2(\mathbb{R}), o nucleo K da aplicação D:H\to SL_2(\mathbb{R}) é um subgrupo SL_2(\mathbb{R})-invariante de V_2(\mathbb{R})\simeq \mathbb{R}^2 de modo que temos duas possibilidades:

  • K=V_2(\mathbb{R}): nesse caso, H=G(\mathbb{R});
  • K=\{e\}: nesse caso, temos uma ação afim D^{-1}:SL_2(\mathbb{R})\to H\subset G(\mathbb{R}) = ASL_2(\mathbb{R}) de SL_2(\mathbb{R}) em \mathbb{R}^2, a qual deve possuir um ponto fixo pela proposição 4; conjugando com um elemento adequado de V_2(\mathbb{R}), podemos assumir que este ponto fixo é a origem e H=SL_2(\mathbb{R}).

Isto termina a demonstração. \square

Corolario 1. J(\nu)=G(\mathbb{R}) ou J(\nu)=g\cdot SL_2(\mathbb{R})\cdot g^{-1} para alguma translação horizontal g\in H(\mathbb{R}).

Prova. Como \nu é N(\mathbb{R})-invariante sabemos que N(\mathbb{R})\subset J(\nu). Além disso, pela proposição 3 temos que D(J(\nu))=SL_2(\mathbb{R}). Logo, usando a proposição 5, segue que J(\nu)=G(\mathbb{R}) ou J(\nu)=g\cdot SL_2(\mathbb{R})\cdot g^{-1}. Isso conclui a demonstração. \square

Proposição 6. \nu=\mu_E ou \textrm{supp}(\nu)\subset g\cdot E[n] para algum n\geq 1 inteiro e g\in H(\mathbb{R}).

Prova. Do corolario anterior temos J(\nu)=G(\mathbb{R}) \textrm{ ou } g\cdot SL_2(\mathbb{R})\cdot g^{-1}. No primeiro caso vemos que \nu=\mu_E pela J(\nu)-invariância de \nu. No segundo caso, g^{-1}\textrm{supp}(\nu) = SL_2(\mathbb{R})\cdot x é uma SL_2(\mathbb{R})-orbita fechada em E. Como tais orbitas sempre estão contidas em E[n] para algum n\geq 1, isso encerra a demonstração. \square

Neste ponto, podemos finalizar esta seção dando a demonstração do teorema 4:

Prova do teorema 4. Escremos a decomposição ergodica de \mu como \mu = \int \nu dP(\nu). Pela proposição 6, quase toda componente ergodica \nu de \mu satisfaz: \nu = \mu_E ou \textrm{supp}(\nu)\subset H(\mathbb{R})\cdot E[n] para algum n. Portanto, podemos escrever \mu da seguinte forma:

\mu=a_0\mu_E + \sum\limits_{n=1}^{\infty}a_n\mu_n,

onde \sum\limits_{n=0}^{\infty}a_n=1 e \textrm{supp}(\mu_n)\subset H(\mathbb{R})\cdot E[n]. Em particular, se \mu\neq \mu_E então a_n\neq 0 para algum n\geq 1, donde \mu(H(\mathbb{R})\cdot E[n])>0. Isso termina a prova do teorema. \square

Tendo em vista a classificação de \mu fornecida pelo teorema 4, vemos que o teorema 2 de equidistribuição de horociclos não-lineares segue ao mostrarmos que \mu não enxerga os pontos de torção de E. Esse sera o conteudo da proxima seção.

Não-linearidade e pontos de torção

O teorema principal dessa seção é

Teorema 5. Dados \sigma um horociclo não-linear e \mu um ponto de acumulação das medidas m(A_s\cdot\sigma) (quando s\to\infty) temos

\mu(H(\mathbb{R})\cdot E[n])=0

para todo n\geq 1.

Prova. Dados \varepsilon>0 e r>0, defina

U=H(r,\varepsilon)\cdot E[n]

e

T_s=\{t\in [0,p]: \sigma_s(t)\in U\}.

Afirmamos que

(4) \limsup\limits_{s\to\infty} m(T_s)=O(\varepsilon).

Para computar m(T_s) sera conveniente passar para o recobrimento universal G=G(\mathbb{R}) de E = G/G(\mathbb{Z}). Começamos por notar que E[n] é coberto pela SL_2(\mathbb{R})-orbita de G[n]=\bigcup G[n]^{i,j} onde

G[n]^{i,j}=\left\{\left(\begin{array}{ccc}a&b&\frac{i}{n}a+\frac{j}{n}b \\ c&d& \frac{i}{n}c+\frac{j}{n}d\\ 0&0&1\end{array}\right): ad-bc=1\right\}.

Em particular os pontos de G[n] na mesma fibra de \sigma_s(t) são

\rho_s^{i,j}(t) = \left(\begin{array}{ccc}s&st&\frac{i}{n}s+\frac{j}{n}st \\ 0&s^{-1}& \frac{j}{n}s^{-1}\\ 0&0&1\end{array}\right).

Tomando a métrica Euclideana na terceira coluna das matrizes acima, vemos que T_s = \bigcup T_s^{i,j} onde

T_s^{i,j} = \left\{t: \left(\begin{array}{c}sx(t)\\s^{-1}y(t)\end{array}\right)- \left(\begin{array}{c}\frac{i}{n}s+\frac{j}{n}st\\s^{-1}\frac{j}{n}\end{array}\right)\in H(r,\varepsilon)\right\}.

Em particular, T_s^{i,j}\subset X_s^{i,j}\cap Y_s^{i,j} onde

X_s^{i,j} = \{t: |x(t)-\frac{i}{n}-\frac{j}{n}t|<r/s\}

e

Y_s^{i,j} = \{t: |y(t) - \frac{j}{n}|<\varepsilon s\}.

Neste ponto vamos usar a não-linearidade de \sigma para obter que o conjunto de t com x(t) = \frac{i}{n}+\frac{j}{n}t tem medida zero, de modo que, para cada i,j fixado, temos

(5) \lim\limits_{s\to\infty} m(X_s^{i,j}) = 0.

Por outro lado, utilizamos o fato de x(t) ser Lipschitz para estimar m(X_s^{i,j}) quando j é grande: mais precisamente, sempre que |j|>M:=2n\sup\limits_{0\leq t\leq p}|x'(t)|, o conjunto X_s^{i,j} é a pré-imagem de um intervalo de tamanho 1/s por uma aplicação com derivada da ordem de j/n. Logo,

(6) m(X_s^{i,j})=O(1/s|j|) para todo |j|>M.

Além disso, notamos que

(7) Y_s^{i,j}=\emptyset quando |j|\geq J_s:= n (s\varepsilon+ \sup\limits_{0\leq t\leq p}|y(t)|)

e

( 8 ) X_s^{i,j}=\emptyset quando |i|\geq I_s(j):= n(\frac{r}{s}+ |\frac{j}{n}|+ \sup\limits_{0\leq t\leq p}|x(t)|).

Finalmente, observamos que

(9) J_s = O(s\varepsilon) e I_s(j) = O(|j|+1) para s grande.

Com estes fatos em mãos, podemos estimar m(T_s) assim: por (7) e ( 8 ) segue que

(10) m(T_s)\leq \sum\limits_{|j|<J_s}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j}).

Agora dividimos a soma do lado direito em duas partes:

\sum\limits_{|j|<J_s}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j})\leq \sum\limits_{M<|j|<J_s}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j}) + \sum\limits_{|j|\leq M}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j})

Em seguida, notamos que a primeira soma é O(|J_s|\varepsilon/s)=O(\varepsilon^2) (porque (9) diz que |I_s| = O(|j|+1) e |J_s|=O(s\varepsilon)) e a segunda soma ocorre sobre um conjunto finito de indices i,j de maneira que (5) diz que esta soma tende a zero (quando s cresce). Portanto, juntando estas duas estimativas com (10) vemos que quando s é grande vale

m(T_s)=O(\varepsilon),

o que prova a estimativa (4) desejada.

Finalmente, lembramos que m_s(U) = m(T_s)/p, de modo que a estimativa (4) implica \mu(H(r,\varepsilon)\cdot E[n])=O(\varepsilon) para todo r,\varepsilon>0. Fazendo \varepsilon\to 0 e depois r\to\infty, segue que \mu(H(\mathbb{R})\cdot E[n])=0, o que finaliza a prova do teorema. \square

Com o teorema 5 ja provado, a tarefa de concluir a demonstração do teorema 2 (ou equivalentemente do teorema 1) fica facil. Com efeito esse é o conteudo da (curta) seção final abaixo.

Fim da prova do teorema 2

Dado \sigma um horociclo não-linear, consideramos um ponto de acu- mulação qualquer \mu de m(A_s\cdot\sigma) quando s\to\infty. Pelo teorema 5, \mu da massa zero para as translações horizontais dos pontos de torção \bigcup\limits_{n\geq 1} E[n] de E. Logo, o teorema 4 (de classificação) implica que \mu=\mu_E. Em outras palavras, temos que \mu_E é o unico ponto de acumulação da sequência m(A_s\cdot\sigma). Isto mostra que

m(A_s\cdot\sigma)\to\mu_E

o que encerra a prova do teorema 2.

Com isso, nossa apresentação da prova do teorema de Elkies e McMullen chega ao fim! Para fechar este post, fazemos a seguinte observação:

Observação 9. O teorema 2 de equidistribuição é optimal, i.e., ele nunca vale quando \sigma é linear: se x(t) = \frac{i}{n}+\frac{j}{n}t para um conjunto de medida positiva de t então \mu(E[n])>0 de modo que m(A_s\cdot\sigma) não pode convergir para \mu_E.

Continuando as discussões do post anterior, pretendemos utilizar a teoria ergodica de fluxos homogeneos (em particular os teoremas de Ratner) para entender os valores da função L ao longo dos latti- ces \Lambda_{s^2}(t) (na notação do post anterior). O resultado de teoria er- godica a ser invocado diz que a familia \{\Lambda_{s^2}(t): t\in [0,1]\} de circu- los de lattices fica equidistribuida no espaço de lattices E quando s\to\infty:

Teorema 1. Para toda f\in C_0(E) temos

\int_0^1 f(\Lambda_{s^2}(t)) dt\to \int_E f d\mu_E quando s\to\infty.

Por enquanto, assumiremos este teorema e veremos como deter- minar a distribuição assintotica F de \{\sqrt{n}\}.

Calculo de F assumindo o teorema 1

Relembre que o ultimo resultado provado no post anterior foi a proposição 1 segundo a qual o tamanho do conjunto de t\in [0,1] tais que L(\Lambda_{s^2}(t))\leq x é |\widetilde{I}_{s^2}(x)|+O(1/s). Juntando este fato com o teorema 1 acima, temos a seguinte consequência:

Proposição 1. Para x\in [0,\infty) temos

|\widetilde{I}_{s^2}(x)|\to \mu_E(\{\Lambda\in E: L(\Lambda)\leq x\} quando s\to\infty.

Prova. Considere E_x:=\{\Lambda\in E: L(\Lambda)\leq x\}. Com essa notação, o fato do tamanho do conjunto dos t\in [0,1] com L(\Lambda_{s^2}(t))\leq x verificar |\widetilde{I}_{s^2}(x)|+O(1/s) pode ser reescrito como:

\int_0^1\chi_{E_x}(\Lambda_{s^2}(t)) dt = |\widetilde{I}_{s^2}(x)|+O(1/s)

Isso reduz nossa tarefa a mostrar que \int_0^1\chi_{E_x}(\Lambda_{s^2}(t)) dt converge para \mu_E(E_x). Para isso, a idéia natural seria aplicar o teorema 1. Entretanto uma utilização direta desse teorema não é possivel porque a função caracteristica \chi_{E_x} não é continua. Um remédio simples para esse contra-tempo é aproximar (em L^1) \chi_{E_x} e 1-\chi_{E_x} por funções continuas em C_0(E) e aplicar o teorema 1. Com isso, a unica coisa que nos resta fazer é ver que tais aproximações exis- tem. Conforme sabemos dos cursos de analise, as funções \chi_{E_x} e \chi_{E-E_x} podem ser aproximadas por funções em C_0(E) sempre que \mu_E(\partial E_x)=0.

Resumindo, a prova da proposição terminara quando mostrarmos que \mu_E(\partial E_x)=0. Nesse sentido, começamos por convidar o leitor a verificar que L:E\to [0,\infty] é uma submersão para quase todos os pontos de E: mais precisamente, L deixa de ser submersão apenas nos lattices \Lambda contendo a origem (0,0) ou um ponto do lado horizontal w_2=1 do seu triângulo maximal \Delta_{c_-,c_+}. Em particular, para cada x, os pontos de E_x nos quais L deixa de ser submersão formam um fechado de \mu_E-medida zero. Logo, pelo teorema (de forma local) das submersões vemos que os conjuntos de nivel de L possuem \mu_E-medida zero e, a fortiori, segue que \mu_E(\partial E_x)=0, como afirmamos. Isto termina a prova. \square

Um corolario direto dessa proposição (e dos resultados obtidos no post anterior) é:

Proposição 2. Suponha que a distribuição assintotica F(\xi) de \{\sqrt{n}\} é continua. Então,

\lim\limits_{N\to\infty}|I_N(x)| = \lim\limits_{N\to\infty}|\widetilde{I}_N(x)| = \mu_E(\{\Lambda\in E: L(\Lambda)\leq x\})

para x\in [0,\infty). Mais ainda, esta convergência é uniforme em x.

Prova. Supondo F continua, podemos combinar o lema 1, o teore- ma 3 do post anterior e a proposição 1 acima para obter o resulta- do desejado. \square

Apesar do enunciado da proposição 2 ser animador (porque escre- vemos I_N assintoticamente em termos da medida \mu_E do conjunto L^{-1}([0,x])), ainda não estamos em condições de computar a distri- buição F pela seguinte razão: do post anterior sabemos apenas I_N(x)\to\int_0^x \xi F(\xi) d\xi, de modo que para obter F em termos de \mu_E(L^{-1}([0,x])) devemos derivar em x duas vezes esta função. Entretanto, neste ponto não esta claro nem que a derivada de \mu_E(L^{-1}([0,x])) existe!

Para isso, vamos ter que trabalhar um pouco com os conjuntos L^{-1}([0,x]). Com esse intuito, introduzimos o subconjunto S_{c_-,c_+} de E formado pelos lattices \Lambda com algum ponto no triângulo \Delta_{c_-,c_+}, onde c_-<0<c_+. Observe que \mu_E(S_{c_-,c_+}) depende apenas da area c_+-c_- do triângulo \Delta_{c_-,c_+} porque todos os triângulos com area fixada são equivalentes por uma transformação em ASL_2(\mathbb{R}) e a medida \mu_E é ASL_2(\mathbb{R})-invariante. Em particular, podemos definir a função p:[0,\infty]\to [0,1] por

p(c_+-c_-):=\mu_E(S_{c_-,c_+})

com as convenções p(0)=0 e p(\infty)=\infty.

Como ja comentamos, para encontrar uma formula para F eventualmente teremos que derivar duas vezes p:

Lema 1. Suponha que p\in C^2 (i.e., p é duas vezes diferenciavel e p'' é continua). Então,

F(x) = -p''(x).

Prova. Escrevemos \mu_E(\{\Lambda\in E: L(\Lambda)<x\}) em “soma telescopica” assim:

\mu_E(S_{0,x}) - \lim\limits_{M\to\infty} \sum\limits_{j=0}^{M-1} [\mu_E(S_{\frac{(j+1)x}{M}-x, \frac{jx}{M}})-\mu_E(S_{\frac{jx}{M}-x,\frac{jx}{M}})].

Colocando isto em termos da função p, obtemos

\mu_E(\{\Lambda\in E: L(\Lambda)<x\}) = p(x) - \lim\limits_{M\to\infty} M\left(p(x)-p(x-\frac{x}{M})\right).

Sendo p diferenciavel, segue que

\mu_E(\{\Lambda\in E: L(\Lambda)<x\}) = p(x) - xp'(x).

Por outro lado, supondo p duas vezes diferenciavel, sabemos que \frac{d}{dx}(p(x)-xp'(x))=-xp''(x). Mais ainda, como p(0)=0, vemos que p(x)-xp'(x)=0 em x=0. Combinando esses dois fatos, obtemos que p(x)-xp'(x)=\int_0^x -\xi p''(\xi) d\xi.

Juntando as identidades acima, obtemos

\mu_E(\{\Lambda\in E: L(\Lambda)<x\}) = \int_0^x -\xi p''(\xi) d\xi.

Isto termina a prova do lema tendo em vista a proposição 2 e o fato (discutido no post anterior) de |I_N(x)|\to \int_0^x\xi F(\xi) d\xi. \square

Observação 1. Ainda supondo que p\in C^2, vemos que a definição de p e o lema 1 implicam

F(x)=-p''(x)=-\frac{\partial^2}{\partial c_- \partial c_+}\mu_E(S_{c_-,c_+})

para quaisquer c_-<0<c_+ com c_+-c_-=x. Isto fornece a se- guinte interpretação geométrica para F(x) em termos de \mu_E: o va- lor F(c_+-c_-) dc_- dc_+ é a medida do conjunto de lattices \Lambda\in E intersectando \Delta_{c_-,c_+} em exatamente dois pontos – um deles com coordenadas (w_1,w_2) verificando w_1/2w_2\in (c_-, c_-+dc_-) e o outro com coordenadas (w_1,w_2) verificando w_1/2w_2\in (c_+-dc_+,c_+).

Do lema 1, o calculo da distribuição F de \{\sqrt{n}\} fica reduzido a computar explicitamente a função p e verificar que p\in C^2. Para isso, vamos recapitular alguns fatos conhecidos sobre a teoria de redes unimodulares.

Denotamos por B o espaço de redes unimodulares de \mathbb{R}^2 (i.e., subgrupos discretos \Lambda^0 isomorfos a \mathbb{Z}^2 com covolume 1) e \mu_B a medida de Haar de B. Um vetor w\in \Lambda^0 de uma rede \Lambda^0\in B é dito primitivo sempre que existir w'\in\Lambda^0 tal que \{w,w'\} é uma \mathbb{Z}^2-base de \Lambda^0. Equivalentemente, w\in\Lambda^0 é primitivo quando w/k\in\Lambda^0 para todo k>1. No que se segue iremos utilizar os seguintes fatos:

  • o subconjunto Z_w\subset B de redes possuindo w como um vetor primitivo forma um circulo (na verdade um horociclo fechado);
  • dado K\subset\mathbb{R}^2 um compacto convexo, a area de K é \zeta(2)\times\int_B f_K(\Lambda^0) d\mu_B onde f_K(\Lambda^0) é a quantidade de vetores primitivos de \Lambda^0 em K;
  • em particular, tomando K suficientemente pequeno de modo que f_K(\Lambda^0)\leq 1 para todo \Lambda^0\in B, vemos que o conjunto de lattices com vetor primitivo em K tem \mu_B-medida igual a 1/\zeta(2) vezes a area de K;
  • mais ainda, podemos desintegrar a medida \mu_B de um subconjunto mensuravel \widetilde{B}\subset B assim: \mu_B(\widetilde{B}) = \frac{1}{\zeta(2)}\int_{w\in K}\mu_w(\widetilde{B}\cap Z_w), onde \mu_w é a medida (normalizada) de Lebesgue do circulo Z_w.

Neste ponto, nosso objetivo sera usar a observação 1 com a des- integração de \mu_B para expressar F como uma integral dupla. Nesse sentido, em vista da interpretação geométrica de F (na observação 1), olhamos para os lattices \Lambda\in E intersectando o triângulo \Delta_{c_-,c_+} em dois pontos com coordenadas (w_1,w_2) satisfa- zendo w_1/2w_2\in (c_-,c_-+dc_-) e w_1/2w_2\in (c_+-dc_+,c_+). Note que a diferença entre esses dois pontos de \Lambda é um vetor primitivo: caso contrario, \Lambda iria conter um terceiro ponto no segmento de reta determinado por esses dois pontos; sendo \Delta_{c_-,c_+} convexo (porque ele é um triângulo) seguiria que \Lambda intersectaria \Delta_{c_-,c_+} em três pontos, uma contradição com nossa hipotese. Usando esse vetor primitivo, aplicamos a desintegração de \mu_B para exprimir F como uma integral nas w_2 coordenadas v_-,v_+ dos vetores de \Lambda na fronteira de \Delta_{c_-,c_+}: para v_-,v_+\in (0,1), escrevemos w=(2c_+v_+,v_+)-(2c_-v_-,v_-) e lembramos que Z_w parametriza os lattices contendo w; em seguida, denotamos por q_x(v_-,v_+)\in [0,1] a (\mu_w)-medida do subconjunto de Z_w formado por lattices disjuntos do interior de \Delta_{c_-,c_+}. Observe que escrevemos q_x ao invés de q_{c_-,c_+} porque essa quantidade depende apenas de x=c_+-c_-. Com essa notação, a formula de F em integral dupla é:

Proposição 3. A função (x,v_-,v_+)\mapsto q_x(v_-,v_+) é continua exceto num subconjunto de \{v_-=v_+\}. Mais ainda, para x\in [0,\infty), temos

-p''(x)=F(x)=\frac{1}{\zeta(2)}\int_0^1\int_0^1 4v_-v_+ q_x(v_-,v_+) dv_- dv_+.

Em particular, segue que F é continua.

Prova. O fato de q_x(v_-,v_+) ser continuo é imediato exceto quando o vetor w é horizontal (em particular ele fica paralelo ao terceiro lado de \Delta_{c_-,c_+}). Isto prova a primeira afirmação da proposição porque w horizontal implica v_-=v_+. No mais, como 0\leq q_x(v_-,v_+)\leq 1, a integral dupla acima existe e varia continuamente com x. Finalmente, para ver que esta integral coincide com -p''(x) e F(x), usamos a interpretação geométrica de F (discutida no paragrafo anterior ao enunciado da proposição) combinado com o fato de 4v_-v_+ ser o produto dos comprimentos dos segmentos de reta

\{(w_1,v_-): 2c_-v_-<w_1<2(c_-+dc_-)v_-\}

e

\{(w_1,v_-): 2c_-v_-<w_1<2(c_-+dc_-)v_-\}

onde os vetores do lattice variam (além do fato de que estamos utilizando os fatores q_x(v_-,v_+)/\zeta(2) na formula de desintegração de \mu_B). \square

Para tornar a proposição 3 um pouco mais util, precisamos computar q_x(v_-,v_+). A idéia para fazer isso consiste em fazer considerações geométricas apos uma mudança afim de coordenadas de (w_1,w_2) para (z,z') levando o triângulo \Delta_{c_-,c_+} no triângulo isosceles

\Delta_0:=\{(z,z')\in\mathbb{R}^2: z,z'>0, z+z'<1\}

de area 1/2. Como o triângulo \Delta_{c_-,c_+} tem area c_+-c_-, esta transformação multiplica a area pelo fator

r:=1/2x.

Apesar do argumento não ser muito complicado, deixaremos para o leitor curioso ver a prova do lemma 3.12 para os detalhes da demonstração do seguinte fato:

Lema 2. Para quaisquer 0<v,v'\leq 1 e x>0 vale q_x(v,v')= q_x(v',v). Além disso, para v\geq v', temos

q_x(v,v'):=\max\left\{0, \min\left(1,\frac{r}{vv'}\right) - \max\left(0,\frac{v(1-v')-r}{v(v-v')}\right)\right\}

com r=1/2x. Aqui estamos interpretando

\max\left(0,\frac{v(1-v')-r}{v(v-v')}\right) = \begin{cases} \infty & \textrm{ se }  v=v' \textrm{ e } r<v(1-v') \\ 0 & \textrm{ se } v=v' \textrm{ e } r\geq v(1-v') \end{cases}

Com este fato em mãos, achar uma formula explicita para F (a distribuição assintotica das lacunas de \{\sqrt{n}\}) vira um exercicio de Calculo I. Com efeito, seguindo combinando a proposição 3 com o lema 2 e calculando algumas integrais (como na prova do teorema 3.14 de Elkies e McMullen), o leitor eventualmente acabara demonstrando o seguinte resultado:

Teorema 2. Temos

F(t):=\begin{cases}6/\pi^2, \quad t\in [0,1/2], \\ F_2(t), \quad t\in[1/2,2], \\ F_3(t), \quad t\in [2,\infty), \end{cases}

onde F_2(t) e F_3(t) são

F_2(x)=\frac{6}{\pi^2}(\frac{2}{3}(4r-1)^{\frac{3}{2}}\psi(r) + (1-6r)\log r + 2r - 1)

e

F_3(x)=\frac{6}{\pi^2} (f(\alpha)-g(\alpha)-h(\alpha) .

Aqui r:=1/2x e \psi(r) = \tan^{-1}[(2r-1)/\sqrt{4r-1}] - \tan^{-1}[1/\sqrt{4r-1}], \alpha = (1-\sqrt{1-4r})/2, f(\alpha)=4(1-4\alpha)(1-\alpha)^2\log(1-\alpha), g(\alpha)=2(1-2\alpha)^3\log(1-2\alpha) e h(\alpha)=2\alpha^2.

Dito de outro modo, acabamos de completar a prova do teorema de Elkies e McMullen (conforme enunciado no primeiro post introdu- torio) modulo o teorema 1 (o qual assumimos durante toda esta seção)!

Com isso, encerramos essa seção e passamos para a questão de relacionar o teorema 1 com a teoria ergodica de fluxos homo- gêneos.

Relação entre o teorema 1 e fluxos homogêneos

Lembramos que o teorema 1 fala sobre a equidistribuição da fa- milia de circulos de lattices \{\Lambda_{s^2}(t): t\in [0,1]\} quando s\to\infty. Para reformular o teorema 1 numa linguagem apropriada, obser- vamos que toda a ação ocorre no grupo especial afim ASL_2(\mathbb{R}) o qual iremos re-escrever como

G(\mathbb{R}):=\left\{\left(\begin{array}{ccc}a &b&x \\ c&d&y \\ 0&0&1\end{array}\right) : ad-bc=1\right\} \subset SL_3(\mathbb{R}).

Note que este grupo atua em \mathbb{R}^2 através das transformações afins conservativas

\left(\begin{array}{c}X \\ Y\end{array}\right)\mapsto \left(\begin{array}{cc}a&b \\ c&d\end{array}\right)\left(\begin{array}{c}X \\ Y\end{array}\right) + \left(\begin{array}{c}x \\ y\end{array}\right).

Denotamos por G(\mathbb{Z})\subset G(\mathbb{R}) o subgrupo formado pelas matrizes com entradas inteiras e observamos que o espaço de lattices (uni- modulares) E é naturalmente identificado com G(\mathbb{R})/G(\mathbb{Z}): tomamos o lattice inteiro \mathbb{Z}^2 como ponto base e para cada g\in G(\mathbb{R}) associamos o lattice

\Lambda(g) := \left\{ (w_1,w_2)\in\mathbb{R}^2: \left(\begin{array}{c}w_1 \\ w_2 \\ 1\end{array}\right)\in g \left(\begin{array}{c}\mathbb{Z} \\ \mathbb{Z} \\ 1\end{array}\right)\right\}.

Esta aplicação é sobrejetiva e \Lambda(g)=\Lambda(h) se e so se h\in g\cdot G(\mathbb{Z}) (como o leitor pode verificar), de maneira que isto é um isomor- fismo entre E e G(\mathbb{R})/G(\mathbb{Z}).

No caso particular dos lattices \Lambda_{s^2}(t), os elementos de G(\mathbb{R})/G(\mathbb{Z}) associados por esse isomorfismo podem ser calculados explicita- mente do seguinto jeito: relembramos do post anterior que

\Lambda_{s^2}(t):=\{(s(b-2ta-t^2),(a+t)/s)\},

donde os pontos (w_1,w_2)\in\Lambda_{s^2}(t) em notação matricial ficam:

\left(\begin{array}{c}w_1 \\ w_2 \\ 1\end{array}\right) = \left(\begin{array}{ccc}s&-2st&-st^2 \\ 0&1/s&t/s \\ 0&0&1\end{array}\right)\left(\begin{array}{c}b\\a\\1\end{array}\right) = A_sU(t) \left(\begin{array}{c}b\\a\\1\end{array}\right),

onde A_s = diag(s,1/s,1) é a matriz diagonal

A_s:=\left(\begin{array}{ccc}s&0&0 \\ 0&1/s&0 \\ 0&0&1\end{array}\right)

e

U(t):= \left(\begin{array}{ccc}1&-2t&-t^2 \\ 0&1&t \\ 0&0&1\end{array}\right).

Logo, \Lambda_{s^2}(t) é o lattice

\Lambda_{s^2}(t) = \left\{(w_1,w_2)\in\mathbb{R}^2 : \left(\begin{array}{c}w_1 \\ w_2 \\ 1\end{array}\right)\in A_sU(t) \left(\begin{array}{c}\mathbb{Z} \\ \mathbb{Z} \\ 1\end{array}\right)\right\}.

Em outras palavras, \Lambda_{s^2}(t) é identificado com A_s U(t). Resumindo, vemos que o teorema 1 é equivalente ao seguinte enunciado:

Teorema 3. Os circulos \{A_sU(t):t\in [0,1]\} ficam e- quidistribuidos em G(\mathbb{R})/G(\mathbb{Z}) quando s\to\infty, i.e., para toda f\in C_0(E) vale

\lim\limits_{s\to\infty}\int_0^1 f(A_sU(t))dt = \int_E f d\mu_E.

Uma vez que o teorema 1 foi “traduzido” para o teorema 3, nosso plano sera utilizar a teoria ergodica do fluxo homogêneo A_s no es- paço E = G(\mathbb{R})/G(\mathbb{Z}): mais precisamente, iremos explorar o fato do circulo \{U(t):t\in[0,1]\} ser um horociclo não-linear (um con- ceito a ser discutido depois) para derivar o teorema 3 de um re- sultado mais geral sobre a equidistribuição de horociclos não-li- neares pelo fluxo de A_s. Porém, como uma explicação detalhada disso leva um certo tempo, deixaremos para o proximo post esta discussão.