sábado, 30 de junho de 2018

Deriva Genética - Uma breve introdução (matemática)

Nesta simulação cada ponto preto em uma bolinha  significa que ele foi escolhido (ao acaso) para ser copiado (se reproduzir) uma vez. Há fixação do "alelo" azul dentro de cinco gerações. Fonte: Wikipedia.


De uma maneira simples, podemos dizer que a Deriva Genética diz respeito a mudanças randômicas nas frequências alélicas. É justamente devido a este componente aleatório que torna muitíssimo improvável a repetição exata de uma história evolutiva. A Deriva Genética  pode afetar a evolução de duas maneiras principais:

1 - Dispersivamente, removendo a variação das populações. A taxa de remoção da variação é inversamente proporcional ao tamanho da população.
2 - Afetando a probabilidade de sobrevivência de novas mutações.

Por hora, vamos focar em (1). Para tanto, iremos estudar um pouco algo conhecido por "Decaimento da Heterozigosidade". Por motivos de clareza e para manter a simplicidade, vamos assumir algumas premissas para elaborar um modelo (simplificado); vamos estudar um locus autossômico em uma população com N indivíduos diplóides e hermafroditas que se acasalam ao acaso. Para definir o estado dessa população, faremos a introdução de uma variável g, que nos indica a probabilidade de dois alelos diferentes por origem serem idênticos por estado. g, portanto, é uma medida da variação genética encontrada na população. Assumimos que esses alelos são equivalentes em função e, assim, são invisíveis aos olhos da Seleção Natural; tais alelos são ditos neutros. 

Agora, consideremos g', que é o valor de g após uma rodada de acasalamento. Encontremos uma expressão matemática para g' em função de g. Veja bem, g' é a probabilidade de que dois alelos que diferem por origem na próxima geração serem idênticos no quesito estado (por exemplo, na sequência de "letras" em um gene). De quantas maneiras isso pode ocorrer? Duas. E quais são elas?

A. Os dois alelos possuem um ancestral comum na geração anterior, o que ocorre com probabilidade 1/2N.

B. Quando os ancestrais dos dois alelos são, eles próprios, idênticos por estado. A probabilidade disso é 1 - 1/2N. Lembre-se que a probabilidade desses dois alelos ancestrais serem idênticos por estado é, por definição, g. Assim, a probabilidade final para esta "caminho" é (1 - 1/2N)g. Levando em conta que ou acontece (A) ou acontece (B), finalmente obtemos uma expressão para g':

Agora que temos g' em função de g, o que faremos? Jogaremos fora! Não é bem isso, mas vamos introduzir uma nova variável, chamada de H, que nos indica a probabilidade de dois alelos escolhidos ao acaso serem diferentes em estado; H é uma espécie de medida de heterozigosidade da população. Note que, dois alelos diferentes por origem são idênticos em estado  ou são diferentes. Portanto, g + H = 1. E assim obtemos H = 1- g.

Se temos um H em termos de g, podemos obter um H' em termos de g'.


Agora, vejamos o que acontece com a diferença entre H' e H, ou seja H = H' - H.


O que essa variação significa? Significa que a probabilidade de dois alelos serem diferentes em estado decresce conforme uma taxa de 1/2N, isto a cada geração. Para grandes populações (N grande), esse decaimento será mais lento do que para populações pequenas. E assim a variação, lenta ou rapidamente, vai sendo varrida da população por meio da Deriva Genética.

Podemos obter uma fórmula geral para H na geração t em função do H inicial (t=0). Vejamos.


Generalizando,



Fica claro que o decaimento de H é geométrico. Isto é, conforme as gerações passam, H tende rapidamente a zero. O que isso significa? Em termos práticos, isso significa que H se torna tão pequeno que as populações tenderão a ser compostas por homozigotos. Se ainda não ficou claro, isso quer dizer que todo e qualquer alelo na população atual descende de um único alelo encontrado na população original.

Para deixar ainda mais claro onde a Deriva Genética tem mais influência (N grande x N pequeno), vamos estimar o tempo requerido para que H (t=0) seja reduzido a ½. Queremos



O que a equação 4 nos diz é que o tempo requerido para que a variação original seja reduzida pela metade é diretamente proporcional ao tamanho N da população. Para se ter uma melhor ideia do significado disto, imagine que uma população com N = 1 milhão tem um tempo de geração de 20 anos. Fazendo uso da equação 4 e do tempo médio de geração, se verifica facilmente que seriam necessários cerca de 28 milhões de anos para que a variação genética viesse a ser reduzida pela metade. Por outro lado, fazendo N pequeno, é possível que esse tempo se bastante reduzido, especialmente em populações onde o intervalo entre gerações é curto.
 
Estamos quase no fim. Nossa última tarefa será avaliar a probabilidade de fixação de um alelo particular, isto é, a probabilidade que um dado alelo presente na população inicialmente se torne o único sobrevivente.

Como acabamos de concluir, mais cedo ou mais tarde a Deriva irá varrer a variação, o que quer dizer que um único alelo será o ancestral dos alelos que interação as populações no futuro. Como nossa população é diplóide, existem 2N alelos na população e, assim, a probabilidade de que um deles venha a ser o ancestral é 1/2N. Agora consideremos a existência de i cópias do alelo A1 presentes na população. Assim, a probabilidade de que uma das i cópias seja o ancestral é i/2N. Isto equivale a dizer que, seja p a frequência de A1 na população, então a probabilidade de fixação do alelo A1 é p. De uma maneira geral, a probabilidade de fixação de um alelo neutro é ditada pela sua frequência na população de então.

Obrigado. Até a próxima.

Referência

GILLESPIE, John H. Population genetics: a concise guide. JHU Press, 2010.

 

Nenhum comentário:

Postar um comentário

DNA Lixo: a volta dos que não foram

Nos últimos tempos, quando escrevo algo, geralmente trato de paleontologia. Antes eu dedicava maior atenção ao que acontecia no mundo molecu...