sábado, 30 de junho de 2018

Deriva Genética - Uma breve introdução (matemática)

Nesta simulação cada ponto preto em uma bolinha  significa que ele foi escolhido (ao acaso) para ser copiado (se reproduzir) uma vez. Há fixação do "alelo" azul dentro de cinco gerações. Fonte: Wikipedia.


De uma maneira simples, podemos dizer que a Deriva Genética diz respeito a mudanças randômicas nas frequências alélicas. É justamente devido a este componente aleatório que torna muitíssimo improvável a repetição exata de uma história evolutiva. A Deriva Genética  pode afetar a evolução de duas maneiras principais:

1 - Dispersivamente, removendo a variação das populações. A taxa de remoção da variação é inversamente proporcional ao tamanho da população.
2 - Afetando a probabilidade de sobrevivência de novas mutações.

Por hora, vamos focar em (1). Para tanto, iremos estudar um pouco algo conhecido por "Decaimento da Heterozigosidade". Por motivos de clareza e para manter a simplicidade, vamos assumir algumas premissas para elaborar um modelo (simplificado); vamos estudar um locus autossômico em uma população com N indivíduos diplóides e hermafroditas que se acasalam ao acaso. Para definir o estado dessa população, faremos a introdução de uma variável g, que nos indica a probabilidade de dois alelos diferentes por origem serem idênticos por estado. g, portanto, é uma medida da variação genética encontrada na população. Assumimos que esses alelos são equivalentes em função e, assim, são invisíveis aos olhos da Seleção Natural; tais alelos são ditos neutros. 

Agora, consideremos g', que é o valor de g após uma rodada de acasalamento. Encontremos uma expressão matemática para g' em função de g. Veja bem, g' é a probabilidade de que dois alelos que diferem por origem na próxima geração serem idênticos no quesito estado (por exemplo, na sequência de "letras" em um gene). De quantas maneiras isso pode ocorrer? Duas. E quais são elas?

A. Os dois alelos possuem um ancestral comum na geração anterior, o que ocorre com probabilidade 1/2N.

B. Quando os ancestrais dos dois alelos são, eles próprios, idênticos por estado. A probabilidade disso é 1 - 1/2N. Lembre-se que a probabilidade desses dois alelos ancestrais serem idênticos por estado é, por definição, g. Assim, a probabilidade final para esta "caminho" é (1 - 1/2N)g. Levando em conta que ou acontece (A) ou acontece (B), finalmente obtemos uma expressão para g':

Agora que temos g' em função de g, o que faremos? Jogaremos fora! Não é bem isso, mas vamos introduzir uma nova variável, chamada de H, que nos indica a probabilidade de dois alelos escolhidos ao acaso serem diferentes em estado; H é uma espécie de medida de heterozigosidade da população. Note que, dois alelos diferentes por origem são idênticos em estado  ou são diferentes. Portanto, g + H = 1. E assim obtemos H = 1- g.

Se temos um H em termos de g, podemos obter um H' em termos de g'.


Agora, vejamos o que acontece com a diferença entre H' e H, ou seja H = H' - H.


O que essa variação significa? Significa que a probabilidade de dois alelos serem diferentes em estado decresce conforme uma taxa de 1/2N, isto a cada geração. Para grandes populações (N grande), esse decaimento será mais lento do que para populações pequenas. E assim a variação, lenta ou rapidamente, vai sendo varrida da população por meio da Deriva Genética.

Podemos obter uma fórmula geral para H na geração t em função do H inicial (t=0). Vejamos.


Generalizando,



Fica claro que o decaimento de H é geométrico. Isto é, conforme as gerações passam, H tende rapidamente a zero. O que isso significa? Em termos práticos, isso significa que H se torna tão pequeno que as populações tenderão a ser compostas por homozigotos. Se ainda não ficou claro, isso quer dizer que todo e qualquer alelo na população atual descende de um único alelo encontrado na população original.

Para deixar ainda mais claro onde a Deriva Genética tem mais influência (N grande x N pequeno), vamos estimar o tempo requerido para que H (t=0) seja reduzido a ½. Queremos



O que a equação 4 nos diz é que o tempo requerido para que a variação original seja reduzida pela metade é diretamente proporcional ao tamanho N da população. Para se ter uma melhor ideia do significado disto, imagine que uma população com N = 1 milhão tem um tempo de geração de 20 anos. Fazendo uso da equação 4 e do tempo médio de geração, se verifica facilmente que seriam necessários cerca de 28 milhões de anos para que a variação genética viesse a ser reduzida pela metade. Por outro lado, fazendo N pequeno, é possível que esse tempo se bastante reduzido, especialmente em populações onde o intervalo entre gerações é curto.
 
Estamos quase no fim. Nossa última tarefa será avaliar a probabilidade de fixação de um alelo particular, isto é, a probabilidade que um dado alelo presente na população inicialmente se torne o único sobrevivente.

Como acabamos de concluir, mais cedo ou mais tarde a Deriva irá varrer a variação, o que quer dizer que um único alelo será o ancestral dos alelos que interação as populações no futuro. Como nossa população é diplóide, existem 2N alelos na população e, assim, a probabilidade de que um deles venha a ser o ancestral é 1/2N. Agora consideremos a existência de i cópias do alelo A1 presentes na população. Assim, a probabilidade de que uma das i cópias seja o ancestral é i/2N. Isto equivale a dizer que, seja p a frequência de A1 na população, então a probabilidade de fixação do alelo A1 é p. De uma maneira geral, a probabilidade de fixação de um alelo neutro é ditada pela sua frequência na população de então.

Obrigado. Até a próxima.

Referência

GILLESPIE, John H. Population genetics: a concise guide. JHU Press, 2010.

 

sexta-feira, 15 de junho de 2018

Como organizamos os seres vivos? - Moléculas e evolução dos primatas (Parte 5)


Resultado de imagem para jane goodall chimp
Na foto, Jane Goodall, pioneira e uma das maiores especialistas do mundo no estudo de comportamento social em primatas.
Imagem disponível aqui. 

O texto anterior desta série (que pode ser lido aqui) trouxe ideias acerca de usar o DNA dos organismos para organizá-los sob uma perspectiva evolutiva, utilizando a sistemática. Aproveitando esse gancho, neste texto faremos algo análogo ao texto 3, um exercício de reconstruir a evolução de um grupo muito interessante (para nós, pelo menos). Porém, desta vez, ao invés de usarmos características físicas dos organismos, faremos uso de sequências de "letras" do DNA. 

Da mesma forma que fiz no texto 3, é bom deixar claro que, esse trabalho de dois dias é raso e tratará apenas de um fragmento do DNA dos organismos, e não deve ser visto com o rigor de uma análise real. Para termos uma ideia, o trabalho de Chiari e colaboradores sobre posicionamento das tartarugas (grupo Testudines) dentro dos répteis, que já foi citado em um texto anterior do blog (para lê-lo clique aqui), utilizou 1000 marcadores genéticos diferentes e demandou o trabalho de meses e muitos profissionais da área. [1]

GRUPO DE INTERESSE

É muito comum ouvirmos falar sobre nós humanos compartilharmos quase 100% do DNA, em termos de sequências de bases, com os Chimpanzés. O que isso quer dizer, em termos cladisticos, é que a cladogenese que separou a população ancestral que teria dado origem à nossa linhagem e à dos nossos primos do gêneros Pan é muito recente. Poucos milhões de anos atrás, essa população, ainda existia como especie única, e esse pouco tempo de separação, explica uma diferença genética muito pequena nas sequências de DNA entre nós e nossos primos mais próximos vivos. 

Hoje tentaremos reconstruir essa hipótese filogenética, em uma rápida análise de como foi a evolução dos primatas, grupo que surgiu à menos de 100 milhões de anos atrás, e confirmar se a ideia do parágrafo acima realmente se confirma na prática.

OBTENDO SEQUÊNCIAS

Há duas formas de obter sequências genéticas: a primeira seria sequenciando nós mesmos o DNA dos organismos. Isso envolveria muito dinheiro, o sequestro de vários primatas do zoológico mais próximo e técnicas laboratoriais de sequenciamento genético.

Como a primeira, além de infringir leis, está além das minhas condições financeiras, vamos recorrer a uma forma alternativa. Para praticamente todos os trabalhos publicados no qual se fazem sequenciamento genético, os dados obtidos são publicados em bancos de dados abertos, como por exemplo o Genbank [2]. Isso garante a transparência e replicabilidade das pesquisas (afinal, estamos falando de ciência). E é nesses bancos de dados que poderemos obter, de graça, as nossas sequências para o exercício.




ESCOLHA DOS GENES

Para uma análise molecular podemos usar desde uma sequência curta, de um único gene de 800 bases, até o genoma completo dos organismos, que pode ser da ordem de bilhões de nucleotídeos. É claro que, quanto maior a sequência, mais trabalho nosso computador vai ter. Como o meu já está desafiando a obsolescência programada com seus 7 anos de idade, nós usaremos os genomas mitocondriais dos organismos, um sequenciamento popular e com boa quantidade de informação filogenética.

GENOMA MICONDRIAL? 

Dentro das células da maioria dos eucariotos (aqueles que possuem células com núcleo), existem pequenas organelas responsáveis pela maquinaria bioquímica de produção de energia dos seres vivos, chamadas de mitocôndrias (há uma história fantástica acerca de como essa organela foi parar lá, mas essa história foge ao escopo do texto atual, talvez um dia ela seja contada aqui no blog).[3]
Imagem disponível aqui


Dentro das mitocôndrias existe um genoma circular, na verdade cada organela pode conter de 2 a 10 cópias dele, contendo 22 genes que codificam RNA transportador, duas regiões que codificam RNA ribossômico e 13 proteínas. Essa informação toda esta organizada em um conjunto de cerca de 16500 pares de bases nitrogenadas e é o que garante a transformação da glicose dos alimentos em energia útil para todos os processos que o organismo realiza. [3][4]


Resultado de imagem para genoma mitocondrial
Imagem disponível aqui.

É essa sequência de bases que será usada para a nossa análise. Selecionamos 63 sequências de primatas de todas as 16 famílias da ordem (cerca de 15% de todas as 429 espécies válidas, sendo a terceira maior ordem de mamíferos viventes, perdendo apenas para roedores e morcegos ), deste total, 50 gêneros estão  representados na análise, mais de 60% do total de gêneros válidos.[5]

Também faremos uma polarização, como no exercício do texto 3, mas agora ao invés dos peixes Dipnoicos, usaremos como grupo externo uma ordem de mamíferos próxima evolutivamente dos primatas: os Colugos (ordem Dermoptera). Também conhecidos como lêmures voadores, a ordem possui apenas duas espécies  viventes, habitando as árvores do sudeste asiático. Estes animais usam uma membrana que liga o corpo aos membros para planar entre árvores (daí o nome popular lêmure voador).[6]


Resultado de imagem para dermoptera
Imagem aqui.

ALINHAMENTO DE SEQUÊNCIAS

Depois de baixar as sequências, precisamos alinhá-las, isso é necessário pois cada organismo possui um genoma mitocondrial de determinado tamanho (mutações no DNA de uma linhagem podem alterar o tamanho das sequências).




O processo de alinhamento insere "gaps" (buracos) dentro das sequências para buscar um alinhamento perfeito afim de conseguir alinhar os trechos homólogos. Esse é o primeiro desafio computacional: buscar entre milhões de formas de alinhar as sequências, um alinhamento ideal. Esse processo é ainda mais custoso que a busca por árvores parcimoniosas, e também requer mecanismos heurísticos (para saber mais leia o texto 4).[7]

Usando um software de alinhamento (eu usei o Bioedit), fazemos o alinhamento das nossas sequências. Vejam na figura abaixo como os dados começaram a se arranjar melhor após esse procedimento que levou cerca de 12 horas.





ANÁLISE CLADÍSTICA

Após a limpeza do alinhamento (removendo as pontas e deixando só as regiões de interesse) montamos a matriz para buscarmos pela árvore mais parcimoniosa. 

OBS: Para dados moleculares há formas alternativas para buscar pela melhor árvore, além do critério de máxima parcimônia. Existem métodos que levam em conta modelos de substituição de bases no DNA com diferentes custos pra cada mudança nos nucleotídeos, como os algoritmos de Maximum Likelihood. Há ainda modelos Bayesianos que inserem o componente aleatório das mutações nas análises. 

Para a análise da nossa matriz, vamos usar o programa TNT. Abrimos o TNT, selecionamos a entrada de dados como DNA. Abriremos nossa matriz e, a partir dela, o programa buscará pela árvore que reconstrói a evolução das sequências, de forma a usar o menor número de mudanças possíveis. 

Após o fim da análise chegamos a uma única árvore.

A qualidade não ficou das melhores, se quiser ver os táxons em detalhe de um zoom no navegador ou abra a imagem em outra guia.


Podemos ver na nossa reconstrução diversos grupos monofiléticos. Cada cor nos ramos representa uma família de primatas. Nossa análise mostra que todas as 16 famílias tradicionais, exceto uma (a família Lorisidae) é monofilética. Obviamente, a nossa análise não nos permite afirmar que essa família não é um grupo natural; para tanto, seria necessário muito mais rigor em uma análise muito mais robusta que a nossa. As cores por fora da arvore representam as classificações mais abrangentes, também monofiléticas, dentro do grupo dos primatas.

Grupos como o dos primatas do velho mundo, chamados cientificamente de  Catharrhiny ( representado pela junção dos clados Cercophitecoidea e Homininoidea) e dos primatas do novo mundo (grupo Platyrrhini) também foram recuperados. Não está no escopo desse texto falar sobre a evolução dos primatas a fundo (isso será abordado futuramente, em outra série de textos).

Por questões didáticas e para economizar o tempo dos interessados por conhecer a carinha dos primatas de cada grupo segue umas fotos e um resumo de cada um deles:

Tarsiiformes: é o grupo dos tarsos e primatas relacionados, sua posição filogenética hoje é reconhecida e difere do resultado da nossa análise, sendo eles mais próximos dos simiiformes que dos pro-símios como lêmures.

Imagem relacionada


Lorisoidea: o grupo que compreende os loris e galagos. A posição obtida pela nossa analise é coerente com as hipóteses atuais.




Lemuroidea: grupos inclui todos os lemuriformes e sua posição tanto em nossa análise quanto nas hipóteses atuais é corroborada como grupo irmão de Lorisoidea.


Resultado de imagem para lemures

Platyrrhini: compreende todos os macacos do novo mundo, e as principais espécies brasileiras como o macaco-prego, macaco-aranha e mico leão-dourado. Sua posição filogenética é sólida como grupo irmão dos macacos do velho mundo ou Catharrhini.



Cercophitecoidea: são grupo irmão da linhagem Hominoidea, que juntos formam o grupo dos macacos do velho mundo. São todos macacos nativos do oriente na África e na Ásia. Alguns integrantes bastante conhecidos são os babuínos, macacos rhesus e o mandril.



E agora, o que mais nos interessa nesse exercício: a pequena família de apenas 7 espécies viventes, na qual estamos incluídos: a família Hominidae e seu grupo irmão Hylobatidae (os gibões). Vamos dar um zoom nestas famílias e ver o que nossa análise nos mostra.




Como podemos observar, a hipótese mais aceita atualmente foi obtida. O primeiro grupo (de hominídeos) a se diversificar foi a linhagem dos  Ponginae, depois temos os gorilas como irmãos de um grupo formado por nós e as duas espécies do gênero Pan, o Chimpanzé comum (Pan troglodytes) e os Bonobos (Pan paniscus).

Com essa breve análise fica evidente que há um ancestral comum recente entre nós e os macacos de forma geral, e mais intimamente com os Chimpanzés. Esse posicionamento é corroborado por inúmeros trabalhos tanto morfológicos quanto moleculares muito mais robustos, incluindo uma filogenia molecular com 54 genes, totalizando uma matriz de 35000 nucleotídeos.[8][9]

CONCLUSÃO

Nosso DNA, dados morfológicos e evidências fósseis deixam claro um fato incontestável, que mesmo que questionado por muitos negacionistas, continua sendo científicamente aceito e já muito bem assentado na academia científica: somos sim irmãos dos Chimpanzés e de tantos outros primatas. Nós somos, incontestavelmente, macacos.

No próximo texto desta série veremos de que forma os fósseis são tratados na sistemática, como eles são essenciais para resolver problemas sobre a evolução dos grupos e também algumas confusões que podem ocorrer ao omiti-los das filogenias, até o próximo texto!

O texto 6, sobre fósseis e sistematica já está disponível no blog, basta clicar aqui e continuar a leitura. 

REFERÊNCIAS

1 - Chiari, Ylenia, et al. "Phylogenomic analyses support the position of turtles as the sister group of birds and crocodiles (Archosauria)." Bmc Biology 10.1 (2012): 65.
2 -Benson, Dennis A., et al. "GenBank." Nucleic acids research36.Database issue (2008): D25.
3 - Siekevitz P (1957). "Powerhouse of the cell". Scientific American197 131-140
4 - Anderson, S.; Bankier, A. T.; Barrell, B. G.; de Bruijn, M. H. L.; Coulson, A. R.; Drouin, J.; Eperon, I. C.; Nierlich, D. P.; Roe, B. A.; Sanger, F.; Schreier, P. H.; Smith, A. J. H.; Staden, R.; Young, I. G. (1981). "Sequence and organization of the human mitochondrial genome". Nature290 (5806): 457–65
5 - List of primates. Encyclopædia Britannica, Abril 07, 2016. Disponível em:https://www.britannica.com/topic/list-of-primates-2060305
6 - Schmitz, Jürgen, et al. "The colugo (Cynocephalus variegatus, Dermoptera): the primates' gliding sister?." Molecular Biology and Evolution 19.12 (2002): 2308-2312.
7-DeSalle, Rob, Gonzalo Giribet, and Ward Wheeler, eds. Multiple sequence alignment, Molecular Systematics and Evolution: theory and practice
8-Perelman, Polina, et al. "A molecular phylogeny of living primates." PLoS genetics 7.3 (2011): e1001342.
9-Nengo, Isaiah, et al. "New infant cranium from the African Miocene sheds light on ape evolution." Nature 548.7666 (2017): 169.


sábado, 2 de junho de 2018

Como organizamos os seres vivos? - Sistemática nos dias atuais (Parte 4)


Imagem disponível aqui.




ANÁLISES REAIS

No terceiro texto da série (clique aqui para ler) nós fizemos um breve exercício de construção de uma árvore simples dos tetrápodes (os vertebrados terrestres). E, logo no início do texto, eu digo que o exercício seria só para ilustrar a ideia por trás das árvores evolutivas e da lógica cladística, e que as análises reais são muito mais complexas e extensas.

Como exemplo de análise real podemos citar  um trabalho de 2013 feito para a ordem Diptera (moscas e mosquitos) que levantou 400 caracteres morfológico, para 42 táxons, sendo muitos dos caracteres multi estado, ou seja, assumindo mais valores que 0 ou 1.[1]

Em um contexto tão amplo, encontrar a árvore mais parcimoniosa seria extremamente trabalhoso, se esse trabalho fosse feito manualmente. Só para termos uma ideia, em uma análise de 9 táxons terminais a quantidade de configurações diferentes de parentesco que podem ser assumidos é de 1.281.892; se acrescentarmos mais um táxon, esse número sobe para 282.137.824. Nesse ritmo rapidamente chegaremos em um número de soluções da ordem do número de átomos no universo, o que significa que é humanamente impossível analisar todas as possibilidades para chegarmos às soluções ótimas.[2]

No início do século passado, a escola fenética (leia o texto 1 aqui para conhecer essa escola), que já tratava com quantidades de dados consideráveis, lidava com seus dados manualmente. Este trabalho era muito complicado de ser realizado e demandava um tempo de trabalho bruto considerável. Em seu surgimento, as análises cladísticas também eram realizadas manualmente, pois esta era a única forma de tratar os dados até então. Porém, com a invenção dos computadores e sua difusão no meio acadêmico, começaram a surgir os primeiros algoritmos computacionais para análise filogenética e, a partir de então, a quantidade de dados possíveis de serem analisados simultaneamente e com maior precisão aumentou de forma exponencial.

MÉTODOS COMPUTACIONAIS

Mesmo computadores, por mais rápidos que sejam (e no início eles definitivamente não eram),  têm dificuldades em testar todas as possibilidades possíveis para um conjunto de dados simples, pois como já dito anteriormente, o número de árvores possíveis cresce muito rápido com o incremento de mais táxons. Procurar dentre todas as árvores aquela mais parcimoniosa seria a situação ideal, porém ela é inviável em análises grandes, fazendo com que os programas precisem usar atalhos para achar árvores muito precisas sem a necessidade de rodar por muito tempo os algoritmos. Esses atalhos são chamados de métodos heurísticos.

Não entraremos em detalhes sobre esses métodos aqui, mas o que podemos dizer é que eles basicamente partem de árvores de distância (bem parecidas com aquelas arvores fenéticas, de similaridade par a par) que são rápidas para a máquina calcular e, a partir daí, fazem ajustes e permutações entre ramos para chegar às soluções mais simples e parcimoniosas. Hoje, existem inúmeras técnicas e uma grande quantidade de algoritmos para busca de árvores; estes métodos podem ser acessados por meio de bibliotecas em linguagens de programação como R ou Python e, de forma mais bonitinha e didática, em programas como o Winclada, TNT e o PAUP.[3][4][5]

DNA E SISTEMÁTICA

Assim como a forma dos seres vivos muda com o tempo, partindo de ancestrais comuns, e se diversificando em ramos, também mudam as sequência de "letras" dos genes, por exemplo. As populações atuais partilham um conjunto genético ancestral, que se diversifica e diverge conforme o surgimento dos grupos descendentes por cladogênese. Desta forma, a mesma lógica que a sistemática usa para tratar os atributos morfológicos dos seres vivos (leia o texto 3 para detalhes), pode ser usada para tratar as sequências de DNA dos seres vivos.

Veja abaixo o cladograma.



Pela lógica cladística, A é mais próximo de B em relação a C, o que significa que o último ancestral comum entre eles é mais recente que o ancestral entre A e C (ou B e C) , assim podemos presumir que A é geneticamente mais próximo B do que C.

As diferenças genéticas entre A e C começaram antes, na cladogênese marcada em verde, quando a população x ancestral é separada em duas diferentes e os DNAs das duas populações filhas pararam de se misturar, ou seja, a reprodução entre as populações cessou. Em termos biológicos, dizemos que houve interrupção do fluxo gênico, e a partir desse momento as duas populações seguiram caminhos evolutivos distintos. Enquanto a população ancestral que daria origem a A e B, ancestral y, ainda possuía um conjunto genético único, que só viria a divergir posteriormente, na cladogênese marcada em azul.

DADOS MOLECULARES

Apesar da lógica cladística ser aplicável ao DNA, usar esses dados de fato para reconstruir as filogenias foi um processo que levou muitos anos. Para ser mais exato, passaram-se 24 anos desde a tradução do livro de Hennig em 1966 e as primeiras analises moleculares. Mas não vamos nos adiantar. Comecemos do começo.

Quando a sistemática começa a ser difundida na década de 60, o conhecimento científico das bases moleculares da hereditariedade, e portanto do DNA, ainda engatinhava. Já sabíamos onde ele estava ( dentro do núcleo das células), de que maneira ele, ao menos rudimentarmente, se organizava (em cromossomos), e mais recentemente tínhamos descoberto qual era a sua estrutura, física e quimicamente falando, através das pesquisas de Watson e Crick (devemos sempre lembrar a importância, muitas vezes negligenciada, de Rosalind Franklin para essa descoberta) com cristalografia, maquetes e muita imaginação.[6]

Imagem relacionada
Watson e Crick junto a sua maquete da estrutura do DNA. Imagem disponível aqui.


Porém, apesar de saber que havia uma sequência genética de bases nitrogenadas (ACTG), sequenciar o DNA ainda era um sonho distante naquela época. Então nos deparamos com 2 problemas para utilizar o DNA dos seres vivos para organiza-los: o primeiro é que ainda não se tinham técnicas para acessar as sequências, e segundo, mesmo que tivéssemos seria impossível, naquele momento histórico, lidar com a quantidade cavalar de dados genéticos que um único ser vivo pode conter .

Em 1972 o primeiro gene completo de um vírus bacteriófago foi sequenciado pelo laboratório de Walter Fiers. Também de um bacteriófago em 1977, foi o primeiro sequenciamento de um genoma completo. Porém, esses sequenciamentos ainda eram precários e muito caros, e naquele momento, ainda era impossível utiliza-los para aplicar aos métodos sistemáticos.[7]

Após muitos anos de pesquisa e desenvolvimento de protocolos novos, além da informatização dos processos, o número de bases sequenciadas explodiu e o custo dos sequenciamentos caiu. Assim, tornou-se possível e acessível a utilização de sequências de DNA ou RNA para reconstruir a evolução dos organismos, isto é, filogenias.


Com isso, as primeiras análises foram aparecendo no início da década de 90. As primeiras filogenias utilizavam um ou poucos genes para grandes grupos, como por exemplo o trabalho de Hedges que inferiu a filogenia dos tetrápodes com base nas sequências de RNA ribossômico 18s e 28s em 1990 usando 21 animais.[8]

Artigo disponível aqui.


CONCLUSÃO

Desde o momento em que foi descoberto uma forma de sequenciar o DNA, RNA e proteínas e lidar com os dados através de computadores, a sistemática avançou bastante. Passamos a ter acesso a mais uma fonte de evidência evolutiva e as análises ficaram mais precisas, muitas confusões foram esclarecidas e o refinamento das filogenias aumentou.

Claro que, com muitos esclarecimentos e refinamento, não quero advogar pela supremacia dos dados moleculares sobre os dados morfológicos. Haverá um texto no blog exclusivamente sobre divergências de hipóteses usando diferentes tipos de dados, bem como as vantagens e desvantagens de cada um dos deles.

Por hora, é importante termos em mente que não há dados perfeitos, e que tanto moleculares quanto morfológicos têm sua importância e nos fornecem evidências para reconstruir os grupos naturais e determinar os graus de parentesco evolutivo entre os organismos. Deixemos o confronto e as brigas polarizadas para os fanáticos por religião ou política e vamos tentar fazer com que os dados se complementem e ajudem a melhorar a nossa compreensão sobre o processo evolutivo e os grupos naturais.

Chegamos ao fim de mais um texto da série sobre organização dos seres vivos. Agora já temos uma base interessante sobre a forma como organizamos os seres vivos. Apesar de algumas questões ainda estarem em aberto, já podemos dizer que conhecemos um básico sobre cladistica, e isso nos possibilita falar sobre evolução de qualquer grupo de seres vivos, e em um futuro breve outras séries virão para nos apresentar seres bastante familiares porém sobre uma perspectiva evolutiva, que tanto falta aos nossos livros didáticos.

Essa série de textos ainda não acabou, teremos mais textos sobre sistemática, abordando vários aspectos ainda não mencionados aqui, e que serão bastante esclarecedores, incluindo aspectos polêmicos como os conflitos entre dados moleculares e morfológicos. No próximo texto da série faremos um exercício breve ilustrando como fazemos análises cladísticas com dados moleculares usando um grupo bem interessante: os Primatas.

O texto 5 já foi publicado e você pode ler aqui.

REFERÊNCIAS

1 - The phylogenetic relationships among infraorders and superfamilies of Diptera based on morphological evidence. Lambkin, C et al. ; Systematic Entomology (2013). 

2 -  Foundations of Systematics and Biogeography.  David M. Williams, Malte C. Ebach.  Springer Science & Business Media19 de nov de 2007

3 - TNT, a free program for phylogenetic analysis. Goloboff, P. ;Farris, J.; C. Nixon, K.

4 - WinClada ver. 1.00. 08. KC Nixon , Ithaca, NY, 2002.

5 - PAUP*: Phylogenetic Analysis Using Parsimony (and other methods) 4.0.b5 (2001). Swofford, D.

6 - History of Classical Genetics. Harman, O ;  Encyclopedia of Life Sciences.

7 - The sequence of sequencers: The history of sequencing DNA

8 - Tetrapod phylogeny inferred from 18S and 28S ribosomal RNA sequences and a review of the evidence for amniote relationships. Hedges SMoberg KMaxson L

DNA Lixo: a volta dos que não foram

Nos últimos tempos, quando escrevo algo, geralmente trato de paleontologia. Antes eu dedicava maior atenção ao que acontecia no mundo molecu...