Feeds:
Posts
Comentários

Archive for junho \18\UTC 2008

Ola! Hoje eu pretendo iniciar a discussão de um resultado de V. Kaloshin e I. Rodinianski sobre a genericidade de elementos Diofantinos dos grupos SO(3) e SU(2). A motivação basica consiste em estender para o contexto não-comutativo o seguinte teorema bem-conhecido sobre a ma-aproximação de numeros reais ”tipicos”:

Teorema 0. Quase todo numero real x\in\mathbb{R} (no sentido da medida de Lebesgue) é Diofantino: existem constantes C,\tau>0 tais que

|x-p/q|\geq C/q^{2+\tau}

para quaisquer p,q\in\mathbb{N} inteiros.

Observação 0. Um argumento topologico simples (baseado no teorema de Baire), mostra que o conjunto de numeros Liouville (i.e., os numeros não-Diofan- tinos) é residual. A prova deste fato é deixado como exercicio. (Sugestão: Utilize a negação da condição Diofantina para escrever os numeros Liouville como a uniao enumeravel de abertos densos).

Certamente o leitor ja deve ter encontrado varios contextos onde as propriedades Diofantinas dos numeros reais são fundamentais: por exemplo, em Sistemas Dinâmicos, sabemos que as propriedades Diofantinas dos numeros de rotação de difeomorfismos do circulo e dos autovalores da derivada em pontos periodicos de transformações holomorfas estão profundamente ligadas as questões de linearização e conjugação de tais sistemas (veja estes dois trabalhos de Yoccoz, por exemplo), enquanto que na teoria KAM é bem-co- nhecida a persistencia das dinâmicas correspondentes a toros invariantes suportando rotações de ângulos verificando condições Diofantionas (veja esta exposição de Yoccoz sobre os trabalhos de Herman, por exemplo).

Visando generalizar o teorema 0 para o contexto de grupos não-comutativos, uma formulação natural da propriedade Diofantina nos grupos SO(3) e SU(2) é a seguinte:

Definição 1. Dizemos que g_1,\dots,g_k\in SO(3) (ou SU(2)) são Diofantinos sempre que existir uma constante D(g_1,\dots,g_k)>0 tal que toda palavra W_n de tamanho n sobre as letras g_1,g_1^{-1},\dots,g_k,g_k^{-1} verifica

(1) \|W_n\pm E\|\geq D(g_1,\dots,g_k)^{-n}.

Aqui E\in SO(3) é a identidade.

Observação 1. Tendo em vista palavras como ABA^{-1}B^{-1} (e outras similares), segue que uma condição necessaria para que os elementos g_1,\dots,g_k sejam Diofantinos é que o subgrupo gerado por g_1,\dots,g_k seja livre.

Observação 2. Um argumento simples baseado no principio da casa de pombos e na compacidade de SO(3) mostra que a condição Diofantina acima é op- timal: como a quantidade de palavras de tamanho n cresce exponencial- mente com n, as versões super-exponencial ou polinomial da estimativa (1) são fraca ou forte demais para descrever o comportamento tipico dos elementos de SO(3). Com efeito, o leitor é convidado a verificar que, dados g_1,\dots,g_k gerando um subgrupo livre de SO(3) e m\geq 1 inteiro, sempre existe uma palavra W_m de tamanho m sobre as letras g_1,g_1^{-1},\dots,g_k,g_k^{-1} tal que

\|W_m-E\|\leq 10/(2k-1)^{m/6}.

Observação 3. Analogamente ao caso dos numeros reais (vide observação 0), um argumento elementar mostra que para um conjunto residual de pares A,B\in SO(3) a condição Diofantina não é satisfeita.

Observação 4. Nas nossas futuras considerações, os papéis de SO(3) e SU(2) são moralmente idênticos porque SU(2) é o recobrimento (duplo e universal) de SO(3).

Com esta noção de elementos Diofantinos de SO(3) e SU(2), o analogo do teorema 0 é:

Conjectura (Gamburd, Jakobson e Sarnak). Quase todos os elementos g_1,\dots,g_k\in SU(2) ou SO(3) (no sentido da medida de Haar) são Diofantinos.

No presente momento, esta conjectura encontra-se em aberto (até onde o autor sabe). A relevância da conjectura de Gamburd, Jakobson e Sarnak é expressada na sua aplicação na solução do problema de Ruziewicz.

O problema de Ruziewicz consiste em mostrar que toda probabilidade finitamente aditiva da esfera S^n a qual é invariante pelo grupo de rotações SO(n+1) é a medida de Lebesgue. Na linguagem da teoria ergodica, este problema corresponde a saber se a ação de SO(n+1) em S^n é unicamente ergodica (com relação ao espaço de probabilidades finitamente aditivas). Note que quando a medida é \sigma-aditiva, este resultado foi provado por Lebesgue. Entretanto, S. Banach provou que este problema tem solução negativa em dimensão n=1 (de fato, J. Rosenblatt melhorou o resultado de Banach provando que existe todo um continuo de probabilidades finitamente aditivas invariantes por rotações do circulo). Por outro lado, G. Margulis e D. Sullivan (independentemente) mostraram que a solução do problema de Ruziewicz é afirmativa quando n\geq 4 usando a chamada propriedade T de Kazhdan. Finalmente, V. Drinfeld resolveu os casos restantes (n=2,3) dando uma solução afirmativa ao problema.

Conforme os resultados de J. Rosenblatt, o problema de Ruziewicz pode ser reduzido a questão de achar subgrupos livres F de SO(n+1) com a propriedade de lacuna espectral: existe uma constante c>0 tal que para toda função f\in L^2(S^n) com média nula podemos encontrar um elemento g\in F com

\|f\circ g - f\|_{L^2}\geq c\|f\|_{L^2}.

Observação 5. A informação relevante aqui é a condição de lacuna espectral: com efeito, desde os trabalhos de Hausdorff (em 1914) sobre o paradoxo de Banach-Hausdorff-Tarski, sabemos da existência de subgrupos livres com dois geradores. De fato, trabalhando-se um pouco, podemos mostrar que o conjunto de pares de matrizes A,B\in SO(3) os quais não geram um subgrupo livre é uma união enumeravel de conjuntos analiticos de codimensão 1 (isto sera visto mais tarde). Portanto, temos uma abundância de subgrupos livres com dois geradores, de maneira que basta achar um subgrupo livre com lacuna espectral dentro deste ”mar” de subgrupos livres para resolver o problema de Ruziewicz.

Observação 6. Generalizando a observação 5, lembramos que Auerbach mostrou que grupos de Lie G compactos e simplesmente conexos possuem muitos subgrupos livres: quase todo par de elementos A,B\in G (com respeito a medida de Haar) gera um subgrupo livre cujo fecho é G.

Uma construção explicita de um subgrupo livre de SU(2) com lacuna espectral foi feita por Lubotzky, Phillips e Sarnak (via operadores de Hecke), o que fornece uma prova alternativa do problema de Ruziewicz (como comentamos pouco antes da observação 5) no delicado caso n=2 (veja também esta nota de Hee Oh). Entretanto, esta construção deixa aberta a pergunta natural de entender a frequência de ocorrência de subgrupos livres de SO(3) e/ou SU(2) com lacuna espectral.

Neste sentido, Bourgain e Gamburd recentemente ( 2008 ) mostraram que todos os subgrupos livres de SU(2) gerados por elementos Diofantinos possuem lacuna espectral! Logo, usando a observação de Rosenblatt, os elementos Diofantinos de SO(3) podem ser usados para dar uma solução alternativa (mais simples) do problema de Ruziewicz em dimensão 2 (em vista da elaborada solução dada por Drinfeld).

Dito isto, vemos uma clara relação entre a conjectura de Gamburd, Jakobson e Sarnak acima e o problema de Ruziewicz em dimensão 2.

Por outro lado, ja dissemos que esta conjectura encontra-se aberta. Entretanto, temos um (unico) resultado parcial na direção da conjectura:

Teorema 1 (Kaloshin e Rodinianski). Quase todos os elementos g_1,\dots,g_k de SO(3) (ou SU(2)) são fracamente Diofantinos: existe uma constante D(g_1,\dots,g_k)>0 tal que toda palavra W_n de tamanho n sobre as letras g_1,g_1^{-1},\dots,g_k,g_k^{-1}

(2) \|W_n\pm E\|\geq D(g_1,\dots,g_k)^{-n^2}.

Nosso objetivo sera descrever os principais passos da prova desse teorema. Para efeitos de clareza da exposição, usaremos a observação 4 para nos restringirmos ao caso do grupo SO(3). Mais ainda, sendo o tratamento do caso de k elementos g_1,\dots,g_k identico ao caso de dois elementos (exceto talvez pela necessidade de uma notação mais complicada), consideraremos apenas a demonstração do teorema de Kaloshin e Rodnianski para dois elementos A,B\in SO(3) tipicos.

Para este post, iremos somente traçar a estrategia a ser seguida, deixando os detalhes para um proximo post. Dados dois elementos distintos A,B\in SO(3), denotamos por \alpha e \beta os ângulos de rotação de A e B (resp.), e por \gamma o ângulo entre os eixos de rotação v_A e v_B de A e B (resp.). Para nossas considerações posteriores, podemos fazer (sem perda de generalidade) a seguinte normalização: o eixo de rotação v_A de A é o eixo x em \mathbb{R}^3 e o eixo de rotação v_B de B esta contido no plano (x,y) fazendo ângulo \gamma com v_A no sentido horario. Observe que com esta convenção, toda palavra W_n(A,B) de tamanho n\geq 1 é unicamente determinada pela escolha deste sistema de coordenadas e pelos parâmetros

(\alpha,\beta,\gamma)\in \mathbb{T}_{\alpha}\times \mathbb{T}_{\beta}\times \mathbb{T}_{\gamma} = \mathbb{T}^3

Isto permite escrever W_n(A,B) = W_n(\alpha,\beta,\gamma) e considerar o toro tridimensional \mathbb{T}^3 como espaço de parâmetros o qual vem equipado com a medida de Lebesgue Leb_3. Do modo como nossos parâmetros são definidos, o leitor pode verificar que conjuntos de medida total para a medida de Haar produto \mu\times\mu em SO(3)\times SO(3) correspondem a conjuntos de medida total para Leb_3 em \mathbb{T}^3.

Neste ponto, a idéia da prova é bastante similar a demonstração de Fayad e Krikorian do teorema de hiperbolicidade de palavras desbalanceadas em SL(2,\mathbb{R}) ja discutida nestes dois posts anteriores no blog em ingles (cronologicamente falando, a prova de Fayad e Krikorian ( 2008 ) é inspirada na prova de Kaloshin e Rodnianski (2001)). Grosseiramente falando, o ponto é o seguinte argumento do tipo Borel-Cantelli: fixamos uma palavra W_n(\alpha,\beta,\gamma) de tamanho n em A, B e consideramos os parâmetros (\alpha,\beta,\gamma)\in \mathbb{T}^3 tais que W_n(\alpha,\beta,\gamma) esta a uma distância \leq D^{-n^2} da identidade E. Denotando por m_n(D) a medida de Lebesgue Leb_3 destes parâmetros (variando sobre todas as palavras de tamanho n) para um certo D>1 fixo, o lema de Borel-Cantelli diz que nossa tarefa fica reduzida a mostrar a estimativa:

(3) \sum\limits_{n} m_n(D)<\infty.

Para provar a estimativa (3), o fato fundamental é que a representação quaterniônica (de Hamilton) dos elementos de SO(3) permite escrever a distância entre W_n(\alpha,\beta,\gamma) e E como um polinômio trigonométrico P_n(\alpha,\beta,\gamma) de grau n em \alpha,\beta,\gamma e todos os coeficientes inteiros. Fixamos \beta=\beta^*, \gamma=\gamma^* e olhamos para o conjunto de parâmetros \alpha tais que

|P_n(\alpha,\beta_*,\gamma_*)|\leq D^{-n^2}.

Por um lema elementar de Dani, Kleinbock e Margulis sobre a medida de Lebesgue do conjunto de pontos onde um dado polinômio assume valores pequenos, sabemos que

Leb_1(\{\alpha: |P_n(\alpha,\beta_*,\gamma_*)|\leq D^{-n^2}\})\lesssim D^{-n}.

Como temos 4^n palavras W_n(A,B) de tamanho n sobre as letras A,B,A^{-1},B^{-1} (no maximo), segue que

m_n(D)\leq (4/D)^n.

Isto mostra a estimativa (3) desejada (fazendo D>4), o que completaria a prova do teorema 1.

Com isto encerramos as considerações (introdutorias) deste post. No proximo encontro, iremos detalhar um pouco mais a estrategia delineada acima. O leitor desejoso de uma ”preparação” para os argumentos de Kaloshin e Rodnianski num contexto um pouco mais simples (do grupo SL(2,\mathbb{R})) é incentivado a consultar as duas notas do blog em ingles sobre o teorema de Fayad e Krikorian. Fico por aqui! Ate ja!

Anúncios

Read Full Post »

Ola! Estou passando aqui para avisar (a quem interessar possa) que acabo de postar (na versão em ingles do blog) algumas notas sobre a recente prova de Brendle e Schoen do teorema da esfere diferenciavel. O link para o artigo é o seguinte:

http://matheuscmss.wordpress.com/2008/06/10/the-differentiable-sphere-theorem-of-brendle-and-schoen/

Basicamente, o artigo conta como a utilização das tecnicas do famoso fluxo de Ricci (de R. Hamilton) permitiu que Brendle e Schoen resolvessem a questão da diferenciabilidade no teorema de esfera de Berger e Klingenberg. Este é mais um exemplo (além da famosa prova de Perelman da conjectura de Poincaré) do poder da teoria de fluxo de Ricci… Parafraseando um geometra conhecido meu: ”Ricci flow is a gold mine!”.

Por enquanto é so! Aguardem mais novidades em breve!

Read Full Post »

Hoje iremos discutir a teoria ergodica do fluxo homogêneo A_s no espaço de lattices G(\mathbb{R})/G(\mathbb{Z}) conforme prometido no fim do post anterior. Para isso, vamos começar com algumas definições. Lembramos que na ultima seção do post anterior identificamos o grupo especial afim ASL_2(\mathbb{R}) com o seguinte subgrupo de SL_3(\mathbb{R})

G(\mathbb{R}):=\left\{\left(\begin{array}{ccc}a&b&x\\c&d&y\\ 0&0&1\end{array}\right) : ad-bc=1\right\}

o qual é o produto semi-direto G(\mathbb{R}) = SL_2(\mathbb{R})\ltimes V_2(\mathbb{R}) onde

SL_2(\mathbb{R})\simeq \left\{\left(\begin{array}{ccc}a&b&0\\c&d&0 \\ 0&0&1\end{array}\right)\right\} \textrm{ e } V_2(\mathbb{R})= \left\{\left(\begin{array}{ccc}1&0&x\\ 0&1&y\\ 0&0&1\end{array}\right)\right\}\simeq \mathbb{R}^2.

Além disso, identificamos o espaço de lattices E com G(\mathbb{R})/G(\mathbb{Z}) e definimos

(1) A_s:=\left(\begin{array}{ccc}s&0&0\\ 0&1/s&0 \\ 0&0&1\end{array}\right) \textrm{ e } U(t):=\left(\begin{array}{ccc}1&-2t& -t^2\\ 0&1&t \\ 0&0&1\end{array}\right).

Finalmente, nos concluimos que todas essas identificações reduziam nossa tarefa na prova do seguinte fato (enunciado como teorema 3 no post anterior):

Teorema 0. Para toda f\in C_0(E) vale

\int_0^1 f(A_s\cdot\sigma(t))dt\to\int_E f d\mu_E.

Como ja antecipamos, este resultado sera obtido de um teorema mais geral sobre equidistribuição de horociclos não-lineares. Para enunciar adequadamente este teorema, vamos introduzir a definição:

Definição 1. Uma seção horociclica (ou horociclo) é uma aplicação \sigma:\mathbb{R}\to G(\mathbb{R}) da forma

(2) \sigma(t) = \left(\begin{array}{ccc}1&t& x(t)\\ 0&1&y(t) \\ 0&0&1\end{array}\right)

tal que

\sigma(t+p_0) = \sigma(t)\gamma_0

para algum inteiro p_0\geq 1 e algum elemento \gamma_0\in G(\mathbb{Z}).

Observação 1. Dado um horociclo \sigma existe um inteiro minimal p\geq 1 tal que \sigma(t+p)=\sigma(t)\gamma para algum \gamma\in G(\mathbb{Z}). Este inteiro p é o periodo de \sigma em E=G(\mathbb{R})/G(\mathbb{Z}).

Observação 2. O nome horociclo tem a seguinte motivação: a projeção natural do espaço de lattices E para o espaço de redes B envia uma seção horociclica de E sobre um horociclo (usual) ao redor de um “cusp” de B.

Definição 2. Um horociclo \sigma é dito linear (sobre os racionais) sempre que para todo \alpha,\beta\in\mathbb{Q} tivermos

m\left(\{t\in[0,p]: x(t)=\alpha t+\beta\}\right)>0.

Caso contrario, o horociclo \sigma é dito não-linear.

Observação 3. O comportamento de y(t) não influencia na nossa definição de linearidade.

Observação 4. Um horociclo real-analitico \sigma é linear se e so se x(t)\equiv \alpha t+\beta para algum \alpha,\beta\in\mathbb{Q} ja que toda função real-analitica não-constante possui um conjunto discreto de zeros.

Comparando as equações (1), (2) e utilizando a observação 4, vemos que

\sigma(t):=U(-t/2) := \left(\begin{array}{ccc}1&t& -t^2/4\\ 0&1&-t/2 \\ 0&0&1\end{array}\right)

forma um horociclo não-linear com periodo p=2 e x(t)=-t^2/4. Portanto, o teorema 0 acima segue imediatamente do seguinte fato mais geral:

Teorema 1 (Equidistribuição de horociclos). Seja \sigma:\mathbb{R}\to G(\mathbb{R}) um horociclo não-linear de periodo p. Então, os circulos A_s\cdot\sigma ficam equidistribuidos em E, i.e.,

\lim\limits_{s\to\infty}\frac{1}{p}\int_0^p f(A_s\cdot\sigma(t)) dt = \int_E f(x) d\mu_E(x).

Observação 5. Os ingredientes importantes neste resultado são: a “parte linear” do horociclo ser uma matriz unipotente e o horociclo é não-linear. Com efeito, na prova do teorema 1 iremos usar o fato do horociclo ter parte linear unipotente para aplicar o teorema de Ratner de modo a reduzir a lei de distribuição \mu do horociclo para uma quantidade enumeravel de candidatos (dentre eles \mu_E). Em seguida usamos a não-linearidade para excluir todas as outras possibilidades.

Observação 6. A hipotese do horociclo ser não-linear é essencial: quando o horociclo é linear, o resultado do teorema 1 é falso! Voltaremos nesse ponto apos vermos a prova do teorema.

Com isso, dedicaremos o resto deste post para a demonstração do teorema 1. Para isso, vamos utilizar o seguinte esquema:

  • na proxima seção, revisaremos alguns fatos basicos sobre medidas invariantes e veremos algumas propriedades da medida \mu associada a lei de distribuição de A_s\cdot\sigma(t);
  • em seguida, usaremos o teorema de Ratner para mostrar que temos apenas uma quantidade enumeravel de possibilidades para a lei de distribuição \mu;
  • finalmente, na ultima seção utilizaremos a não-linearidade do horociclo \sigma para provar que a unica possibilidade para a lei de distribuição \mu é \mu=\mu_E, o que terminara a prova do teorema 1.

Agora passamos para a formalização desse programa.

A lei de distribuição de um ”loop”

Dado um ”loop” \sigma:\mathbb{R}/p\mathbb{Z}\to E, denotamos por m(\sigma) a probabilidade natural suportada na imagem de \sigma:

\int_E f dm(\sigma):= \frac{1}{p}\int_0^p f(\sigma(t)) dt

para f\in C_0(E).

Além disso, dado \sigma:\mathbb{R}/p\mathbb{Z}\to E um horociclo não-linear de periodo p, denotamos por \sigma_s:=A_s\cdot\sigma, de modo que o teorema 1 é equivalente ao seguinte resultado:

Teorema 2 (Equidistribuição de horociclos versão 2). Para todo horociclo não-linear \sigma vale

m(\sigma_s) = (A_s)_*m(\sigma)\to \mu_E quando s\to\infty.

Como de costume, aqui a convergência ocorre na topologia fraca-*. Pelo teorema de Banach-Alaoglu, sabemos que m(\sigma_s) possui uma subsequência convergente para uma medida \mu. Em particular, nossa tarefa consiste em mostrar que para tais subsequências sempre temos \mu=\mu_E.

Para isso, consideramos a aplicação D do espaço de lattices E para o espaço de redes B a qual associa para cada elemento g\in E a sua parte linear D(g)\in B, i.e.,

D\left(\begin{array}{ccc}a&b&x\\c&d&y\\ 0&0&1\end{array}\right) := \left(\begin{array}{ccc}a&b&0\\c&d&0\\ 0&0&1\end{array}\right).

Observe que a projeção da medida de Haar \mu_E de E por D é a me- dida de Haar \mu_B de B. Por isso, como um trabalho preliminar na direção de provar que \mu=\mu_E, vamos verificar que a projeção de \mu por D esta correta:

Proposição 1. Temos que D_*\mu=\mu_B.

Prova. A imagem H de D\circ\sigma é um horociclo (no sentido usual) do espaço B. Por outro lado, D envia as orbitas do “fluxo de Teichmuller” A_s (as quais são geodesicas) de E em geodesicas de B e D envia a medida m(\sigma) na medida de Haar \mu_H de H. Finalmente, um argumento simples mostra que o fluxo geodesico de B puxa H para longe das cuspides de B de maneira que H fica equidistribuida (para mais detalhes veja o theorem 2.4 de Elkies e McMullen). Juntando esses fatos, segue que

D_*\mu = \lim (A_s)_*\mu_H = \mu_B.

Isto termina a prova. \square

Observação 7. Uma consequência direta da proposição 1 é que \mu é uma probabilidade em E, i.e., \mu(E)=1. Em particular, a massa das probabilidades m(\sigma_s) é conservada na passagem ao limite. Essa é uma observação não-trivial porque o espaço E é não-compacto!

Como veremos mais tarde, para entrarmos no contexto do teorema de Ratner, precisamos saber que \mu é invariante por um subgrupo unipotente de SL_2(\mathbb{R}). Com esse intuito, introduzimos o grupo

N(t) := \left(\begin{array}{ccc}1&t&0 \\ 0&1&0 \\ 0&0&1\end{array}\right).

Note que este subgrupo unipotente aparece naturalmente em vista da formula D\circ\sigma(t) = N(t) sempre que \sigma(t) é um horociclo. O resultado preparatorio para ficarmos no contexto de Ratner é o seguinte:

Proposição 2. A probabilidade \mu é N(\mathbb{R})-invariante.

Prova. Fixamos \tau\in\mathbb{R}. Consideramos \sigma_s(t)=A_s\cdot\sigma(t) e \eta_s(t) = N_\tau\cdot\sigma_s(t) onde \sigma(t) é um horociclo. Temos que

\sigma_s(t) = \left(\begin{array}{ccc}s&st&sx(t) \\ 0&\frac{1}{s}&\frac{y(t)}{s} \\ 0&0&1\end{array}\right), \eta_s(t)=\left(\begin{array}{ccc}s&st+\frac{\tau}{s}&sx(t)+\frac{\tau y(t)}{s} \\ 0&\frac{1}{s}&\frac{y(t)}{s} \\ 0&0&1\end{array}\right).

Para comparar adequadamente \sigma_s(t) e \eta_s(t), fazemos uma mudança de variaveis para fazer com que as partes lineares fiquem iguais. Mais precisamente, definimos u=\tau/s^2 e consideramos

\rho_s(t):=\eta_s(t-u):=\left(\begin{array}{ccc}s&st&sx(t-u)+s^{-1}\tau y(t-u) \\ 0&1/s&y(t-u) \\ 0&0&1\end{array}\right).

Lembrando que m(\sigma_s)\to\mu, segue que

(3) m(\rho_s) = m(\eta_s)=(N_\tau)_*m(\sigma_s)\to (N_\tau)_*\mu.

Por outro lado, temos que D\circ\rho_s = D\circ\sigma_s, de modo que a distância entre \rho_s e \sigma_s é dada pela distância entre os vetores obtidos da terceira coluna dessas matrizes:

d(\rho_s,\sigma_s)=\left|\left(\begin{array}{c}sx(t-u)+\tau y(t-u)/s \\ y(t-u)/s \\1\end{array}\right) - \left(\begin{array}{c}sx(t)+\tau y(t)/s \\ y(t)/s \\ 1\end{array}\right)\right|

Em seguida, usamos o fato de x(t) ser Lipschitz, y(t) ser limitado e u=\tau/s^2 para obter que

|sx(t) - sx(t-u)|\leq s|x(t)-x(t-u)|\leq O(su)=O(1/s)

e

|y(t)/s - y(t-u)/s|\leq  (|y(t)|+|y(t-u)|)/s=O(1/s).

Portanto, vemos que d(\rho_s,\sigma_s)\to 0 quando s\to\infty. Em particular, segue que \lim m(\rho_s)=\lim m(\sigma_s)=\mu. Juntando isso com (3), obtemos

(N_\tau)_*\mu=\mu

o que encerra a demonstração. \square

Uma vez que ja temos a invariância de \mu pelo subgrupo unipotente N(\mathbb{R}), passaremos a discutir o teorema de Ratner.

Teorema de Ratner e a classificação de \mu

O teorema de Ratner pode ser enunciado assim:

Teorema de Ratner. Sejam \Gamma um subgrupo discreto de um grupo de Lie conexo G e N um subgrupo unipotente. Seja \nu uma probabilidade ergodica N-invariante em G/\Gamma e denote por J o maior subgrupo de G deixando \nu invariante. Então, existe x\in G/\Gamma tal que \nu(J\cdot x)=1. Além disso, \nu é a medida de Haar de J\cdot x e o suporte de \nu é J\cdot x (de modo que J\cdot x é fechado em G/\Gamma).

A importância do teorema de Ratner para o contexto do teorema de Elkies e McMullen fica evidente: sendo \mu invariante pelo subgrupo unipotente N, podemos classificar \mu listando todos os subgrupos fechados de E ja que o teorema de Ratner diz que \mu deve estar suportada na orbita de um tal subgrupo.

Logicamente o teorema de Ratner tem uma bela historia incluindo varias aplicações em ramos diversos da Matematica. Por isso, ficaria impossivel fazer jus a relevância desse teorema numa discussão breve, de modo que recomendamos o leitor interessado numa exposição profunda do assunto (incluindo algumas ideias da prova em casos particulares, motivação heuristica para a validade do enunciado acima e algumas aplicações) os posts publicados no blog do prof. Terence Tao (veja aqui um link para estes posts).

Em todo caso, nos iremos utilizar o teorema de Ratner do seguinte jeito. Denotando por F uma fibra de E\to B, observamos que F é um toro complexo \mathbb{C}/\Lambda. Para cada inteiro n\geq 1 definimos F[n]=\left(\frac{1}{n}\cdot\Lambda\right)/\Lambda\subset F os pontos de ordem n com respeito a estru- tura de grupo de F e denotamos E[n] o subfibrado de E com fibras F[n].

Definição 3. \bigcup E[n] é o conjunto de pontos de torção de E.

Em seguida introduzimos H(\mathbb{R})\subset G o subgrupo de translações horizontais, i.e., translações por vetores da forma (x,0)\in\mathbb{R}^2 e H(r,\varepsilon)\subset G o conjunto de translações por vetores (x,y) da forma |x|<r e |y|<\varepsilon.

O objetivo dessa seção é aplicar o teorema de Ratner para mostrar o seguinte resultado:

Teorema 4 (Classificação de \mu). Temos que \mu=\mu_E ou \mu(H(\mathbb{R})\cdot E[n])>0 para algum n\geq 1.

Infelizmente o teorema 4 não é uma consequência imediata do teorema de Ratner porque não sabemos que \mu é ergodica. Para contornar essa situação, aplicamos o teorema de desintegração ergodica para escrever \mu como uma combinação convexa (”unica”) de medidas ergodicas N(\mathbb{R})-invariantes:

\mu=\int\nu dP(\nu).

Observação 8. Usualmente o teorema de decomposição ergodica é enunciado em espaços compactos. No caso de E (um espaço não-compacto), aplicamos esse teorema para a compactificação com um ponto e restringimos para E.

Em seguida, para cada \nu probabilidade ergodica N(\mathbb{R})-invariante em E definimos

J(\nu):=\{g\in G(\mathbb{R}): g_*\nu=\nu\},

ou seja, J(\nu) é o maior subgrupo de G(\mathbb{R}) deixando \nu invariante. Observe que J(\nu) é fechado e N(\mathbb{R})\subset J(\nu).

Proposição 3. Para quase toda \nu na decomposição ergodica de \mu, temos

D_*\nu=\mu_B \quad \textrm{ e } \quad D(J(\nu))=SL_2(\mathbb{R}).

Prova. Da proposição 1 sabemos que \mu_B = D_*\mu = \int D_*\nu dP(\nu). Como a ação de N(\mathbb{R}) em (B,\mu_B) é ergodica (porque esta ação é o fluxo horociclico em B), segue que D_*\nu=\mu_B para quase toda \nu.

Por outro lado, pelo teorema de Ratner sabemos que \nu esta suportada em uma orbita J(\nu)\cdot x\subset E. Logo,

D(J(\nu))\cdot D(x) = D(J(\nu)\cdot x) = D(\textrm{supp}(\nu)) = \textrm{supp}(D_*\nu).

Como ja vimos que D_*\nu=\mu_B, obtemos

D(J(\nu))\cdot D(x)=\textrm{supp}(\mu_B)=B=SL_2(\mathbb{R})/SL_2(\mathbb{Z}).

Portanto, D(J(\nu))=SL_2(\mathbb{R}). Isso termina a prova. \square

Agora nos relembramos a seguinte proposição sobre ações de SL_2(\mathbb{R}):

Proposição 4. Toda ação afim de SL_2(\mathbb{R}) em \mathbb{R}^k possui pontos fixos.

Prova. Pelo truque unitario de Weyl, esta ação pode ser estendida para uma ação de SL_2(\mathbb{C}) em \mathbb{C}^k. Por outro lado, um ponto fixo p\in\mathbb{C}^k para o grupo compacto SU_2(\mathbb{C}) pode ser construido facilmente (p.ex., tomando a media). Como \mathbb{C}\cdot su_2(\mathbb{C})=sl_2(\mathbb{C}), o ponto p é fixado também pela ação de SL_2(\mathbb{C}) e, a fortiori, pela ação de SL_2(\mathbb{R}). Logo, a parte real de p é o ponto fixo de SL_2(\mathbb{R}) em \mathbb{R}^k desejado. \square

Proposição 5. Se H\subset G(\mathbb{R}) é um subgrupo com D(H)=SL_2(\mathbb{R}), então H=G(\mathbb{R}) ou H é conjugado a SL_2(\mathbb{R}).

Prova. Como D(H)=SL_2(\mathbb{R}), o nucleo K da aplicação D:H\to SL_2(\mathbb{R}) é um subgrupo SL_2(\mathbb{R})-invariante de V_2(\mathbb{R})\simeq \mathbb{R}^2 de modo que temos duas possibilidades:

  • K=V_2(\mathbb{R}): nesse caso, H=G(\mathbb{R});
  • K=\{e\}: nesse caso, temos uma ação afim D^{-1}:SL_2(\mathbb{R})\to H\subset G(\mathbb{R}) = ASL_2(\mathbb{R}) de SL_2(\mathbb{R}) em \mathbb{R}^2, a qual deve possuir um ponto fixo pela proposição 4; conjugando com um elemento adequado de V_2(\mathbb{R}), podemos assumir que este ponto fixo é a origem e H=SL_2(\mathbb{R}).

Isto termina a demonstração. \square

Corolario 1. J(\nu)=G(\mathbb{R}) ou J(\nu)=g\cdot SL_2(\mathbb{R})\cdot g^{-1} para alguma translação horizontal g\in H(\mathbb{R}).

Prova. Como \nu é N(\mathbb{R})-invariante sabemos que N(\mathbb{R})\subset J(\nu). Além disso, pela proposição 3 temos que D(J(\nu))=SL_2(\mathbb{R}). Logo, usando a proposição 5, segue que J(\nu)=G(\mathbb{R}) ou J(\nu)=g\cdot SL_2(\mathbb{R})\cdot g^{-1}. Isso conclui a demonstração. \square

Proposição 6. \nu=\mu_E ou \textrm{supp}(\nu)\subset g\cdot E[n] para algum n\geq 1 inteiro e g\in H(\mathbb{R}).

Prova. Do corolario anterior temos J(\nu)=G(\mathbb{R}) \textrm{ ou } g\cdot SL_2(\mathbb{R})\cdot g^{-1}. No primeiro caso vemos que \nu=\mu_E pela J(\nu)-invariância de \nu. No segundo caso, g^{-1}\textrm{supp}(\nu) = SL_2(\mathbb{R})\cdot x é uma SL_2(\mathbb{R})-orbita fechada em E. Como tais orbitas sempre estão contidas em E[n] para algum n\geq 1, isso encerra a demonstração. \square

Neste ponto, podemos finalizar esta seção dando a demonstração do teorema 4:

Prova do teorema 4. Escremos a decomposição ergodica de \mu como \mu = \int \nu dP(\nu). Pela proposição 6, quase toda componente ergodica \nu de \mu satisfaz: \nu = \mu_E ou \textrm{supp}(\nu)\subset H(\mathbb{R})\cdot E[n] para algum n. Portanto, podemos escrever \mu da seguinte forma:

\mu=a_0\mu_E + \sum\limits_{n=1}^{\infty}a_n\mu_n,

onde \sum\limits_{n=0}^{\infty}a_n=1 e \textrm{supp}(\mu_n)\subset H(\mathbb{R})\cdot E[n]. Em particular, se \mu\neq \mu_E então a_n\neq 0 para algum n\geq 1, donde \mu(H(\mathbb{R})\cdot E[n])>0. Isso termina a prova do teorema. \square

Tendo em vista a classificação de \mu fornecida pelo teorema 4, vemos que o teorema 2 de equidistribuição de horociclos não-lineares segue ao mostrarmos que \mu não enxerga os pontos de torção de E. Esse sera o conteudo da proxima seção.

Não-linearidade e pontos de torção

O teorema principal dessa seção é

Teorema 5. Dados \sigma um horociclo não-linear e \mu um ponto de acumulação das medidas m(A_s\cdot\sigma) (quando s\to\infty) temos

\mu(H(\mathbb{R})\cdot E[n])=0

para todo n\geq 1.

Prova. Dados \varepsilon>0 e r>0, defina

U=H(r,\varepsilon)\cdot E[n]

e

T_s=\{t\in [0,p]: \sigma_s(t)\in U\}.

Afirmamos que

(4) \limsup\limits_{s\to\infty} m(T_s)=O(\varepsilon).

Para computar m(T_s) sera conveniente passar para o recobrimento universal G=G(\mathbb{R}) de E = G/G(\mathbb{Z}). Começamos por notar que E[n] é coberto pela SL_2(\mathbb{R})-orbita de G[n]=\bigcup G[n]^{i,j} onde

G[n]^{i,j}=\left\{\left(\begin{array}{ccc}a&b&\frac{i}{n}a+\frac{j}{n}b \\ c&d& \frac{i}{n}c+\frac{j}{n}d\\ 0&0&1\end{array}\right): ad-bc=1\right\}.

Em particular os pontos de G[n] na mesma fibra de \sigma_s(t) são

\rho_s^{i,j}(t) = \left(\begin{array}{ccc}s&st&\frac{i}{n}s+\frac{j}{n}st \\ 0&s^{-1}& \frac{j}{n}s^{-1}\\ 0&0&1\end{array}\right).

Tomando a métrica Euclideana na terceira coluna das matrizes acima, vemos que T_s = \bigcup T_s^{i,j} onde

T_s^{i,j} = \left\{t: \left(\begin{array}{c}sx(t)\\s^{-1}y(t)\end{array}\right)- \left(\begin{array}{c}\frac{i}{n}s+\frac{j}{n}st\\s^{-1}\frac{j}{n}\end{array}\right)\in H(r,\varepsilon)\right\}.

Em particular, T_s^{i,j}\subset X_s^{i,j}\cap Y_s^{i,j} onde

X_s^{i,j} = \{t: |x(t)-\frac{i}{n}-\frac{j}{n}t|<r/s\}

e

Y_s^{i,j} = \{t: |y(t) - \frac{j}{n}|<\varepsilon s\}.

Neste ponto vamos usar a não-linearidade de \sigma para obter que o conjunto de t com x(t) = \frac{i}{n}+\frac{j}{n}t tem medida zero, de modo que, para cada i,j fixado, temos

(5) \lim\limits_{s\to\infty} m(X_s^{i,j}) = 0.

Por outro lado, utilizamos o fato de x(t) ser Lipschitz para estimar m(X_s^{i,j}) quando j é grande: mais precisamente, sempre que |j|>M:=2n\sup\limits_{0\leq t\leq p}|x'(t)|, o conjunto X_s^{i,j} é a pré-imagem de um intervalo de tamanho 1/s por uma aplicação com derivada da ordem de j/n. Logo,

(6) m(X_s^{i,j})=O(1/s|j|) para todo |j|>M.

Além disso, notamos que

(7) Y_s^{i,j}=\emptyset quando |j|\geq J_s:= n (s\varepsilon+ \sup\limits_{0\leq t\leq p}|y(t)|)

e

( 8 ) X_s^{i,j}=\emptyset quando |i|\geq I_s(j):= n(\frac{r}{s}+ |\frac{j}{n}|+ \sup\limits_{0\leq t\leq p}|x(t)|).

Finalmente, observamos que

(9) J_s = O(s\varepsilon) e I_s(j) = O(|j|+1) para s grande.

Com estes fatos em mãos, podemos estimar m(T_s) assim: por (7) e ( 8 ) segue que

(10) m(T_s)\leq \sum\limits_{|j|<J_s}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j}).

Agora dividimos a soma do lado direito em duas partes:

\sum\limits_{|j|<J_s}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j})\leq \sum\limits_{M<|j|<J_s}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j}) + \sum\limits_{|j|\leq M}\sum\limits_{|i|<I_s(j)} m(X_s^{i,j})

Em seguida, notamos que a primeira soma é O(|J_s|\varepsilon/s)=O(\varepsilon^2) (porque (9) diz que |I_s| = O(|j|+1) e |J_s|=O(s\varepsilon)) e a segunda soma ocorre sobre um conjunto finito de indices i,j de maneira que (5) diz que esta soma tende a zero (quando s cresce). Portanto, juntando estas duas estimativas com (10) vemos que quando s é grande vale

m(T_s)=O(\varepsilon),

o que prova a estimativa (4) desejada.

Finalmente, lembramos que m_s(U) = m(T_s)/p, de modo que a estimativa (4) implica \mu(H(r,\varepsilon)\cdot E[n])=O(\varepsilon) para todo r,\varepsilon>0. Fazendo \varepsilon\to 0 e depois r\to\infty, segue que \mu(H(\mathbb{R})\cdot E[n])=0, o que finaliza a prova do teorema. \square

Com o teorema 5 ja provado, a tarefa de concluir a demonstração do teorema 2 (ou equivalentemente do teorema 1) fica facil. Com efeito esse é o conteudo da (curta) seção final abaixo.

Fim da prova do teorema 2

Dado \sigma um horociclo não-linear, consideramos um ponto de acu- mulação qualquer \mu de m(A_s\cdot\sigma) quando s\to\infty. Pelo teorema 5, \mu da massa zero para as translações horizontais dos pontos de torção \bigcup\limits_{n\geq 1} E[n] de E. Logo, o teorema 4 (de classificação) implica que \mu=\mu_E. Em outras palavras, temos que \mu_E é o unico ponto de acumulação da sequência m(A_s\cdot\sigma). Isto mostra que

m(A_s\cdot\sigma)\to\mu_E

o que encerra a prova do teorema 2.

Com isso, nossa apresentação da prova do teorema de Elkies e McMullen chega ao fim! Para fechar este post, fazemos a seguinte observação:

Observação 9. O teorema 2 de equidistribuição é optimal, i.e., ele nunca vale quando \sigma é linear: se x(t) = \frac{i}{n}+\frac{j}{n}t para um conjunto de medida positiva de t então \mu(E[n])>0 de modo que m(A_s\cdot\sigma) não pode convergir para \mu_E.

Read Full Post »