quarta-feira, 10 de janeiro de 2018

Mais de 29 evidências para a Macroevolução - Introdução à Filogenética

veja o post anterior e ligado a este clicando aqui.

Introdução à Filogenética

A descendência de um ancestral comum implica um processo de ramificação e divergência, comum em qualquer processo genealógico. As genealogias podem ser ilustradas graficamente por diagramas semelhantes a árvores, e é por isso que os biólogos frequentemente se referem à genealogia das espécies como a "árvore da vida". Na teoria evolutiva, diagramas como estes são conhecidos como árvores filogenéticas ou filogenias. Uma das predições mais importantes, poderosas e básicas da hipótese de ancestralidade comum universal é a existência de uma árvore filogenética única, histórica e universal para espécies que se reproduzem principalmente através de mecanismos genéticos verticais (outro tipo de herança, transferência de genes horizontal, pode complicar as filogenias e até o conceito de uma espécie, veja as Advertências abaixo). Uma compreensão completa da filogenética é necessária para a compreensão das deduções macroevolutivas. Ao modelo de consenso que os biólogos evolutivos usam para representar os bem evidenciados ramos da árvore universal da vida, irei me referir como a "árvore filogenética padrão". A Figura 1 mostra um exemplo simplificado de alguns dos ramos mais familiares da árvore filogenética universal.

Na seção a seguir, temos uma breve visão geral das árvores filogenéticas e de como os biólogos as determinam. Esta visão geral se torna cada vez mais técnica à medida que prossegue. O material até o título máxima parcimônia é essencial para entender o restante deste FAQ. A discussão filogenética remanescente é dada por motivos de integridade e para permitir ao leitor interessado a oportunidade de aprofundar o quanto for desejado.
Figura1
Figura 1. Árvore Filogenética de Consenso para toda a vida.


Árvores filogenéticas representam relações evolutivas

Filogenética é a disciplina científica relacionada com a descrição e reconstrução dos padrões de relações genéticas entre espécies e entre táxons superiores. As árvores filogenéticas são uma maneira conveniente de representar visualmente a história evolutiva da vida. Estes diagramas ilustram as relações inferidas entre os organismos e a ordem dos eventos de especiação que levaram de antigos antepassados comuns aos seus descendentes diversificados.

Uma árvore filogenética tem várias partes, mostradas na Figura 2. Os nós representam unidades taxonômicas, como um organismo, uma espécie, uma população, um antepassado comum ou mesmo um gênero inteiro ou outro grupo taxonômico mais elevado. Os ramos conectam nós de forma exclusiva e representam relacionamentos genéticos. O padrão específico de ramificação determina a topologia da árvore. As árvores em escala têm comprimentos de ramo que são proporcionais a algumas propriedades biológicas importantes, como o número de alterações de aminoácidos entre os nós em uma filogenia proteica (ver Figura 3). As árvores também podem ser enraizadas ou não-enraizadas . As árvores enraizadas têm um nó especial, conhecido como a raiz, que representa um ancestral comum de todos os táxons mostrados na árvore. As árvores enraizadas são, portanto, direcionais, já que todos os táxons evoluíram da raiz. As árvores não-enraizadas ilustram apenas relacionamentos, sem referência a ancestrais comuns.
Figs2e3

Um equívoco comum é a ideia de que algumas espécies modernas são ancestrais de outras espécies modernas. No entanto, todas as espécies modernas são encontradas nas pontas dos ramos da árvore, e uma espécie moderna é  "evoluída" como qualquer outra. Ou seja, embora se pense que os mamíferos evoluíram de algo que se assemelhava aos répteis modernos, os répteis modernos são tão "velhos" evolutivamente quanto os mamíferos modernos (Brooks 1991, p.68; Futuyma 1998, p.113).

Métodos para a determinação de árvores filogenéticas: Cladística e filogenética numérica
11 Toda a ave limpa comereis.
12 Porém estas são as que não comereis: a águia, e o quebrantosso, e o xofrango,
13 E o abutre, e o falcão, e o milhafre, segundo a sua espécie.
14 E todo o corvo, segundo a sua espécie.
15 E o avestruz, e o mocho, e a gaivota, e o gavião, segundo a sua espécie.
16 E o bufo, e a coruja, e a gralha,
17 E o cisne, e o pelicano, e o corvo marinho,
18 E a cegonha, e a garça, segundo a sua espécie, e a poupa, e o morcego.

Deuteronômio 14:11-18
Se as espécies modernas descendem de ancestrais nesta maneira ramificada, similar a uma árvore, deve ser possível inferir a verdadeira árvore histórica que traça seus caminhos de descendência. As filogenias foram inferidas por biólogos desde que Darwin propôs pela primeira vez que a vida estava unida pela ancestralidade comum há mais de 140 anos. Metodologias algorítmicas rigorosas para inferir árvores filogenéticas estão em uso nos últimos 50 anos.

Em 1950, o taxonomista Willi Hennig propôs um método para determinar árvores filogenéticas com base na morfologia, classificando organismos de acordo com seus caracteres derivados compartilhados, que são chamados de sinapomorfias (Hennig, 1966). Este método, agora chamado de cladística, não assume parentesco genealógico a priori, pois pode ser usado para classificar qualquer coisa em princípio, mesmo coisas como livros, carros ou cadeiras que, obviamente, não estão genealogicamente relacionadas em um sentido biológico (Kitching et al. 1998, Ch. 1, p. 26;). Usando argumentos evolutivos firmes, Hennig justificou esse método como a técnica de classificação mais apropriada para estimar as relações evolutivas geradas pela descendência linear. De fato, o método cladista de Hennig não é mais do que uma formalização dos métodos que os biólogos sistemáticos estavam usando intuitivamente desde que Linnaeus escreveu Systema Naturae. Atualmente, os biólogos constroem suas árvores filogenéticas com base no método de Hennig e, por causa da cadística, essas árvores filogenéticas são reprodutíveis e independentemente testáveis (Brooks 1991, Ch. 2; Kitching et al. 1998).

Os métodos cladistas são muitas vezes contrastados com métodos "fenéticos". Os métodos fenéticos agrupam e classificam as espécies com base no número de caracteres idênticos que compartilham, ou seja, com base na similaridade geral. Tais métodos podem ter problemas com organismos como golfinhos e o atum, que têm muitas semelhanças superficiais. Estes organismos, no entanto, não estão intimamente relacionados e não devem ser classificados em conjunto se se espera que a classificação reflita a filogenia.

Em contraste, filogenias baseadas na cladística agrupam táxons em hierarquias aninhadas e são determinadas usando apenas caracteres derivados compartilhados de organismos, não caracteres primitivos compartilhados(Brooks 1991, pp. 35-36; Kitching et al. 1998, Ch. 1; Maddison and Maddison 1992, p. 49). No jargão técnico filogenético, os caracteres primitivos são chamados de "plesiomorfias", e os caracteres derivados são chamados de "apomorfias". Em cladística, as espécies relacionadas são agrupadas porque compartilham caracteres derivados (ou seja, apomorfias) que se originaram em um ancestral comum do grupo, mas não estavam presentes em outros ancestrais anteriores do grupo. Esses caracteres derivados compartilhados são chamados de sinapomorfias. Primitivo e derivado são, portanto, termos relativos, dependendo do grupo específico que está sendo considerado. Por exemplo, a coluna vertebral é um caractere primitivo dos vertebrados, enquanto o pelo é um caractere derivado particular para vertebrados mamíferos. No entanto, quando se considera apenas mamíferos, o pelo é primitivo, enquanto que um polegar oponível é derivado.

[A seguir, algumas expressões do jargão filogenético. O texto continua após este "box"]
   Jargão filogenético

apomorfia: Um caractere derivado de um grupo de organismos, não compartilhado com ancestrais de outros grupos de organismos. As apomorfias são únicas para o grupo e, portanto, são definidores do grupo.

bootstrap: Um procedimento estatístico técnico para estimar a variabilidade de uma medida. Na filogenética, o bootstrapping envolve a produção de um novo pseudo-conjunto de dados ao retirar aleatoriamente os pontos de dados do conjunto de dados original. Para cada pseudo-conjunto de dados, uma nova filogenia é inferida. Rodadas disto fornecem uma estimativa das regiões bem e mal suportadas da filogenia original.
 
caractere: Uma característica observável de um organismo útil para distingui-lo de outro. Por exemplo, um nucleotídeo em uma sequência de DNA, um aminoácido em uma sequência de proteína, ou características morfológicas como cabelo, penas ou a presença ou ausência de certos ossos.
 
caractere derivado: ver apomorfia.
caractere primitivo: veja plesiomorfia.
 
cladística: Uma classe de técnicas filogenéticas que constroem árvores (cladogramas) pelo agrupamento de táxons em hierarquias aninhadas de acordo com caracteres derivados compartilhados (sinapomorfias). Cladística está intimamente associada com o critério de parcimônia.
 
cladograma: Uma classificação hierárquica de táxons representada como uma árvore. Os cladogramas formalmente são independentes da teoria evolutiva, embora na prática eles sejam normalmente interpretados como filogenias.

fenética: Às vezes conhecida como taxonomia numérica, os métodos fenéticos classificam e agrupam organismos com base na similaridade geral, geralmente sem referência explícita às suas relações filogenéticas. 

filogenia: Um diagrama de ramificação, em forma de árvore, que representa as relações genealogicas entre os táxons. Filogenias enraizadas especificam antepassados comuns e têm um eixo temporal.
 
máxima verossimilhança: Um critério cladístico para inferir árvores com conflito de caracteres. A melhor árvore e o melhor modelo evolutivo maximizam a probabilidade dos dados observados. A máxima verossimilhança tem uma forte base estatística. Dado um modelo correto de mudança evolutiva, é garantido que seja estatisticamente consistente, ou seja, ele irá convergir para a árvore correta à medida que mais dados forem adicionados. A máxima verossimilhança geralmente executa o melhor de todos os métodos em simulações, mas é computacionalmente muito cara. Ao contrário da parcimônia, ela depende explicitamente de um modelo evolutivo específico.
mínima evolução: Um critério de matriz de distância filogenética. A melhor árvore é aquela em que a soma dos comprimentos das ramificações é a menor.
 
mínimos quadrados: Um critério de matriz de distância filogenética. A melhor árvore é aquela com a menor diferença quadrática entre as distâncias  observadas tomadas aos pares e as distâncias calculadas a partir da árvore inferida. Tem uma forte justificativa estatística, pois baseia-se na técnica estatística comum de mínimos quadrados linear. Os mínimos quadrados são garantidos pelo teorema de Gauss-Markov para convergir na resposta correta, pois mais dados são incluídos na análise se uma métrica de distância apropriada for usada, ou seja, os mínimos quadrados são estatisticamente consistentes. Versões ponderadas corretas para variabilidade aleatória e viés devido a comprimentos de derivação mais longos.

neighbor-joining (junção de vizinhança): Um algoritmo de matriz de distância para inferir árvores. É uma aproximação dos mínimos quadrados e métodos de evolução mínima.
 
: Um ponto em uma filogenia onde os ramos se encontram ou terminam. Os nós na ponta ou no final de um ramo representam táxons. Em árvores enraizadas, os nós internos representam ancestrais comuns.
 
parcimônia: Um critério filogenético para inferir árvores com conflito de caracteres. A parcimônia exige que a melhor árvore seja aquela com menos conflito de caracteres. Sabe-se que produz a filogenia incorreta em certos casos, como quando as taxas evolutivas são altas ou certos ramos são longos.
 
plesiomorfia: Um caractere primitivo, compartilhado com ancestrais antepassados de um grupo de organismos. Uma vez que é comum a mais do que apenas o grupo que está sendo considerado, uma plesiomorfia não é usada para definir um grupo.
 
raíz: Um ancestral comum de todos os táxons em uma filogenia. Cronologicamente, a raíz é o nó mais antigo.
sinapomorfia: Um caractere derivado que é compartilhado por dois grupos de organismos.
 
UPGMA: Um método de agrupamento baseado em matriz à distância para a construção de árvores. Raramente usado, é muito rápido, mas assume taxas evolutivas constantes em toda a árvore (uma propriedade chamada ultrametricidade).

Nas análises filogenéticas da vida real, os caracteres derivados compartilhados podem conflitar com outros caracteres derivados. Assim, métodos objetivos são necessários para resolver este conflito de caracteres (Kitching et al. 1998, Ch. 1; Maddison e Maddison 1992, p. 49). Por exemplo, as asas são um caráter derivado de aves e de morcegos. Com base apenas nesse caractere, o método cladístico agruparia os morcegos e os pássaros, que é como o autor do Deuteronômio os agrupava na citação bíblica acima. No entanto, outros caracteres derivados compartilhados indicam que os morcegos devem ser agrupados com mamíferos sem asas e que as aves devem ser agrupadas com dinossauros sem asas. 

Nos últimos 40 anos, vários métodos algorítmicos foram concebidos para resolver tais instâncias de conflito de caracteres e inferir árvores filogenéticas corretas (Felsenstein 2004, Ch. 10). As seções a seguir descrevem alguns dos mais bem sucedidos desses métodos. Cada método tenta inferir uma filogenia a partir de dados existentes, e cada um tem seus respectivos pontos fortes e fracos. Anos de testes empíricos e simulação mostraram que, em geral, esses diferentes algoritmos, cada um com suposições subjacentes muito diferentes, convergem em árvores que são altamente similares quando julgadas estatisticamente (Li 1997, Chs 5 e 6; Nei e Kumar 2000, Chs 6 , 7 e 8).

Máxima Parcimônia
 

Um dos métodos mais antigos, mais básicos e mais utilizados para a resolução de caracteres é o critério de Máxima Parcimônia (MP) (Edwards e Cavalli-Sforza 1963, Kitching et al., 1998). O critério de parcimônia exige que a melhor árvore que descreva os dados é a árvore que minimiza a quantidade de conflito de caracteres. Por exemplo, considere um conjunto de dados contendo 10 caracteres derivados compartilhados que agrupam morcegos com macacos (e não com pássaros), e apenas um caractere que agrupa morcegos com pássaros (e não com macacos). De acordo com o critério da parcimônia, a árvore que dá o primeiro agrupamento deve ser a preferida.
 

Atualmente, a parcimônia é o método de escolha para a reconstrução de árvores morfológicas (Kitching et al., 1998). É muito rápido computacionalmente, e pode ser robusto para diferenças na taxa evolutiva entre os caracteres. No entanto, a máxima parcimônia encontrará a filogenia correta somente quando esperamos que o conflito de caracteres seja baixo ou a evolução continue de forma parcimoniosa(Felsenstein 2004, Ch. 9; Kitching et al. 1998, p. 17). Se as taxas de evolução são lentas e os ramos são curtos, o conflito de caráter será baixo e a parcimônia funcionará bem(Felsenstein 2004, Ch. 9; Felsenstein 1981a; Li 1997, p. 128). Se o conflito de caráter for moderado ou alto na realidade, então é muito improvável que a árvore verdadeira tenha o menor conflito de caracteres. Quando as taxas de evolução são altas, ou quando alguns ramos são muito longos, ou quando o número de possíveis estados de caracteres é limitado, o conflito de caracteres pode ser comum. Isso geralmente é verdadeiro para as sequências de nucleotídeos, que possuem somente quatro estados de caracteres possíveis (A, C, T ou G). Em casos como esses, outros métodos filogenéticos podem ser mais precisos do que a parcimônia.

Máxima Verossimilhança

Outro critério filogenético de uso comum é a máxima verossimilhança (ML), uma técnica estatística eficaz e robusta agora utilizada em todos os campos científicos (Edwards e Cavalli-Sforza 1964, Felsenstein 1981b, Fisher 1912). Muitos estimadores estatísticos bem conhecidos são, na verdade, estimadores de máxima verossimilhança. Por exemplo, a média comum da amostra como uma estimativa da média de uma distribuição gaussiana e do ajuste de mínimos quadrados de uma reta para um conjunto de pontos são ambos estimadores de máxima verossimilhança. Usando ML, pode-se inferir taxas de evolução diretamente dos dados e determinar a árvore que melhor descreve esses dados, considerando as taxas inferidas. Em outras palavras, ML encontra a árvore e os parâmetros evolutivos que produzem os dados observados com a maior probabilidade. Ao contrário da parcimônia, ML encontra árvores com a quantidade esperada de conflito de caracteres, dado as taxas evolutivas inferidas dos dados, mesmo que essas taxas sejam elevadas. ML é um método computacionalmente intensivo que pode levar muito tempo.

Métodos de Distância

Devido à sua velocidade computacional, os métodos da matriz de distância são alguns dos mais populares para inferir filogenias (Nei e Kumar 2000, Ch. 6). Todos os métodos de distância transformam dados de caracteres em uma matriz de distâncias tomadas aos pares, uma distância para cada possível emparelhamento dos táxons em estudo. Os métodos de matriz de distância não são cladistas, uma vez que a informação sobre caracteres derivados e primitivos foi perdida durante esta transformação. Os métodos de distância abordam a inferência filogenética estritamente como um problema estatístico e são usados quase que exclusivamente com dados moleculares. Embora não sejam cladistas, os métodos à distância podem ser pensados como aproximações aos métodos cladísticos e vários métodos são garantidos matematicamente para convergir na árvore correta, pois são incluídos mais dados.



A métrica de distância mais simples é meramente o número de diferenças de caracteres entre dois táxons, como o número de diferenças de nucleotídeos entre duas sequências de DNA. Existem muitas outras formas de calcular distâncias de sequências moleculares, e a maioria tenta corrigir a possibilidade de múltiplas mudanças em um único site durante a evolução. Os métodos para calcular as distâncias entre as sequências geralmente são nomeados conforme seus criadores, como os dois parâmetros de Kimura (K2P), Jukes-Cantor (JC), Tamura-Nei (TN), Hasegawa, Kishino e Yano (HKY) e Felsenstein 1984 (F84). Outras métricas de distância importantes são General Time Reversible (GTR) e LogDet (Felsenstein 2004, pp. Chs 11 e 13; Nei e Kumar 2000, Chs 2 e 3; Li 1997, Chs 3 e 4). 



Uma vez que uma matriz de distância para os táxons considerados está em mãos, existem vários critérios e algoritmos baseados em distância que podem ser usados ​​para estimar a árvore filogenética a partir dos dados (Felsenstein 2004, Ch. 11; Li 1997, Ch. 5). O critério de evolução mínima (ME) encontra a árvore em que a soma de todos os comprimentos de ramificação é a menor. Os critérios de mínimos quadrados ponderados e não ponderados calculam a discrepância entre as distâncias aos pares observadas e as distâncias aos pares calculadas a partir dos comprimentos de ramificação da árvore inferida. Os mínimos quadrados encontram a árvore que minimiza o quadrado dessa discrepância. Os métodos de mínimos quadrados são alguns dos mais estatisticamente justificados e convergem na árvore correta, pois mais dados são incluídos na análise (dada uma métrica de distância matematicamente adequada). O algoritmo de junção de vizinhança (NJ) é extremamente rápido e é uma aproximação dos mínimos quadrados e métodos de evolução mínima. Se a matriz de distância for uma descrição exata da árvore verdadeira, a junção de vizinhança é ótima para reconstruir a árvore correta. O algoritmo de agrupamento UPGMA (um acrônimo confuso) também é extremamente rápido, mas é baseado na hipótese improvável de que as taxas evolutivas sejam iguais em todas as linhagens. O UPGMA raramente é usado hoje, exceto como uma ferramenta de instrução.



Suporte Estatístico para Filogenias

Uma filogenia é uma melhor aproximação da árvore histórica correta usando um determinado método filogenético. Algumas análises filogenéticas são fortemente suportadas pelos dados, algumas são fracamente suportadas e diferentes partes de uma árvore podem ter mais suporte do que outras. Ao comparar duas filogenias independentemente determinadas, deve-se ter em conta o suporte estatístico atribuído a cada ramo das filogenias. Tal como acontece com todas as análises científicas, os detalhes de uma árvore filogenética podem mudar à medida que novas informações e dados são incorporados (Maddison e Maddison 1992, pp. 112-123; Li 1997, pp. 36-146; Felsenstein 1985; Futuyma 1998, p. 99; Hillis and Bull 1993; Huelsenbeck et al., 2001, Swofford et al., 1996, pp. 504-509).



O bootstrapping é o método estatístico mais popular para avaliar a confiabilidade dos ramos em uma árvore filogenética (Felsenstein, 1985). Bootstrapping é uma técnica estatística para estimar empiricamente a variabilidade de um parâmetro (Efron 1979; Efron e Gong, 1983). Em uma análise de bootstrap, um conjunto fictício de dados é criado amostrando aleatoriamente dados do conjunto de dados real até que um novo conjunto de dados seja criado do mesmo tamanho. Este processo é feito repetidamente (centenas ou milhares de vezes), e o parâmetro de interesse é estimado a partir de cada conjunto de dados ficcional. A variabilidade dessas estimativas obtidas por bootstrapping é em si uma estimativa da variabilidade do parâmetro de interesse.
 

Na filogenética, uma nova filogenia é inferida de cada conjunto de dados que sofreu análise de bootstrap (Felsenstein, 1985). Essas filogenias com bootstrap provavelmente terão topologias diferentes. A partir dessas diferentes árvores com bootstrap, a variabilidade na árvore inferida pode ser estimada. As partes das árvores com bootstrap  em comum atribuem uma alta confiança, enquanto que as partes que variam amplamente recebem pouca confiança. As árvores construídas a partir de dados aleatórios não resultam em árvores ou ramos de alta confiança quando submetidas a bootstrapping. Assim, o bootstrapping fornece uma maneira de testar se uma árvore filogenética é genuína.


A inferência filogenética encontra árvores corretas?
 

Para estabelecer sua validade na determinação de filogenias confiáveis, os métodos filogenéticos foram testados empiricamente nos casos em que a verdadeira filogenia é conhecida com certeza, uma vez que a verdadeira filogenia foi observada diretamente.


  • O Bacteriófago T7 foi propagado e dividido sequencialmente na presença de um mutagênico, onde cada linhagem foi rastreada. Das 135135 árvores filogenéticas possíveis, a árvore verdadeira foi determinada corretamente por métodos filogenéticos em uma análise cega. Cinco métodos filogenéticos diferentes foram usados independentemente, e cada um escolheu a árvore correta (Hillis et al.1992).

  • Em outro estudo, foram utilizadas 24 cepas de camundongos nas quais as relações genealogicas eram conhecidas. A análise cladística reproduziu quase perfeitamente a filogenia conhecida das 24 cepas (Atchely e Fitch, 1991).

  • Bush et al. utilizram análise filogenética para prever retrospectivamente a árvore evolutiva correta do vírus da Influenza A humana 83% do tempo para as estações da gripe abrangendo 1983 a 1994.

  • Em 1998, pesquisadores usaram 111 sequências modernas de HIV-1 (vírus da AIDS) em uma análise filogenética para prever a sequência de nucleotídeos do ancestral viral de que eram todos descendentes. A sequência ancestral predita casou muito bem, com alta probabilidade estatística, com uma sequência de vírus ancestral real encontrada em uma amostra de plasma africana soropositiva ao HIV-1 coletada e arquivada no Congo belga em 1959 (Zhu et al.1998).

  • Na última década, as análises filogenéticas têm desempenhado um papel importante nas condenações bem-sucedidas em vários processos judiciais criminais (Albert et al. 1994; Arnold et al. 1995; Birch et al. 2000; Blanchard et al. 1998; Goujon et al. 2000; Holmes et al. 1993; Machuca et al. 2001; Ou et al. 1992; Veenstra et al. 1995; Vogel 1997; Yirrell et al. 1997) e as reconstruções filogenéticas já foram admitidas como testemunho jurídico especializado nos Estados Unidos (97-KK- 2220 State of Louisiana v. Richard J. Schmidt [PDF]). O exame legal nos EUA para a admissibilidade do testemunho de perito são as diretrizes de Daubert(U. S. Supreme Court Case Daubert v. Merrell Dow Pharmaceuticals, Inc., 509 U.S. 579, 587-89, 113 S. Ct. 2786, 2794, 125 L. Ed. 2d 469, 1993). As diretrizes de Daubert indicam que um tribunal de julgamento deve considerar cinco fatores na determinação de "se o argumento ou metodologia subjacente do testemunho é cientificamente válido": (1) se a teoria ou técnica em questão pode ser e foi testada; (2) se foi submetido a revisão por pares e publicação; (3) sua taxa de erro é conhecida ou potencialmente conhecida; (4) existência e manutenção de normas que controlam sua operação; e (5) se atraiu aceitação generalizada na comunidade científica relevante (citado quase literalmente). A análise filogenética atendeu oficialmente esses requisitos legais.
Ressalvas com relação à inferência filogenética

Tal como acontece com qualquer método científico de investigação, certas condições devem ser atendidas para que os resultados sejam confiáveis. Uma premissa comum de muitos métodos filogenéticos moleculares é que os genes são transmitidos via herança vertical, linear, isto é, dos pais para a prole. Se esta premissa for violada, as árvores geneticas não recapitularão uma filogenia de organismos ou espécies. Esta suposição é violada em instâncias de transferência horizontal, por exemplo, na transformação de uma bactéria por um plasmídeo de DNA, ou na inserção retroviral no genoma do hospedeiro. Durante os primórdios da evolução vida, antes do advento dos organismos multicelulares, a transferência horizontal era provavelmente muito frequente (como é hoje na evolução observada de bactérias e outros organismos unicelulares). Assim, é questionável se os métodos filogenéticos moleculares são aplicáveis, mesmo em princípio, à resolução dos padrões evolutivos de muitos micróbios, incluindo a evolução nas proximidades do ancestral comum mais recente de todos os organismos vivos (Doolittle 1999; Doolittle 2000; Woese, 1998).
 
A lista abaixo fornece algumas das ressalvas mais importantes que os cientistas devem ter em mente ao interpretar os resultados de uma análise filogenética (Swofford 1996, pp. 493-509). Em geral, a contribuição de cada uma dessas preocupações será "avaliada em média", incluindo caracteres mais independentes na análise filogenética, como mais genes e sequências mais longas. 
  • Caracteres correlacionados: cada caractere utilizado na análise de forma otimizada deve ser geneticamente independente. Caracteres com forte correlação funcional são melhor considerados como um único caractere. Existem testes estatísticos que podem ajudar a controlar a correlação de caracteres não reconhecida, tais quais blocos bootstrap e jackknife.
  • Verdadeira convergência estrutural: as estruturas que sofreram uma evolução convergente podem artificialmente resultar em topologias de árvore incorretas. Incluir mais caracteres na análise também ajuda a superar os efeitos convergentes.
  • Reversões de caracteres: caracteres que retornam a um estado ancestral representam um desafio semelhante à convergência. Como o DNA e o RNA têm apenas quatro estados de caracteres diferentes, eles são especialmente propensos a reversões durante a evolução.
  • Caracteres perdidos: as linhagens que perderam caracteres(como baleias e seus membros posteriores) também podem apresentar problemas cladísticos. Muitas vezes, se uma análise cladística indicar fortemente que um certo caractere se perdeu durante a evolução, é melhor omitir esse caractere em análises de resolução superior dessa linhagem.
  • Caracteres ausentes: os fósseis incompletos são problemáticos, pois podem não ter caracteres importantes. Os melhores fósseis são a resposta.
  • Número intratável de possíveis árvores filogenéticas: por razões computacionais, este é um dos maiores desafios filogenéticos a superar. O objetivo de uma reconstrução filogenética é determinar a melhor árvore que os dados suportam. Para uma análise de apenas cinco espécies, existem 15 árvores possíveis. Para uma análise de 50 espécies, existem mais de 1074 árvores possíveis que devem ser pesquisadas — o que é computacionalmente impossível. Esse problema não é tão ruim quanto parece, uma vez que reduzir o número de árvores razoáveis pode ser trivial em muitos casos (por exemplo, usando o algoritmo de ramificação e limite). Vários métodos foram desenvolvidos para resolver este problema com sucesso, e, finalmente, os computadores mais poderosos são melhores.
  • Hipóteses de máxima verossimilhança: o método de máxima verossimilhança faz suposições explícitas sobre o padrão de substituições de nucleotídeos com base em um determinado modelo de evolução de nucleotídeos. Esses pressupostos são baseados em um sólido fundamento estatístico; No entanto, a validade dos modelos deve ser considerada ao avaliar os resultados.
  • Atração do ramo longo: as linhagens que divergiram há bastante tempo tendem a se "agrupar" em uma reconstrução filogenética nas condições apropriadas. As razões matemáticas são um pouco complicadas, mas o uso de genes que evoluem mais lentamente (ou regiões de genes) ajuda a superar o problema.


  • Variação de taxa entre linhagens: as taxas de substituição de nucleotídeos podem diferir entre linhagens; Isso pode contribuir para a atração de ramos longos e resultar em topologias de árvore incorretas. No entanto, os métodos de máxima verossimilhança e mínimos quadrados são particularmente úteis aqui.
  • Variação de taxa dentro de um único gene: as taxas de substituição de nucleotídeos podem variar ao longo de um único gene — isso também exacerba a atração de ramo longo.
  • As árvores de gene não são equivalentes as árvores de espécies: a partir de genética mendeliana simples, sabemos que os genes se segregam individualmente e que, ao longo do tempo, os genes individuais não seguem necessariamente a genealogia organísmica (Avise e Wollenberg 1997; Fitch 1970; Hudson 1992; Nichols 2001; Wu, 1991) . Um exemplo óbvio é o fato de que, enquanto você pode ter olhos castanhos, seu filho pode ter os genes para olhos azuis — mas isso não significa que seu filho não é seu descendente, ou que seus filhos de olhos castanhos estão mais intimamente relacionados com você do que seus olhos azuis. Incluir múltiplos genes na análise é uma solução para este problema. Com base em cálculos genéticos simples, geralmente é necessária uma análise de mais de cinco genes para reconstruir com precisão uma filogenia de espécies (Wu, 1991).
 Para obter mais informações sobre cladística, você pode consultar um dos vários excelentes recursos on-line, como a SASB Introduction to Phylogenetics, o Laboratório de Filogenética de Biologia Integrativa da Universidade da California,Berkeley, ou nas Basics of Cladistic Analysis de Diana Lipscomb, que podem ser baixados no formato Adobe Acrobat PDF. Uma descrição boa e concisa para os leigos pode ser encontrada no Journal of Avocational Paleontology. Finalmente, você pode ler a explicação da "Árvore da Vida" de acordo com Charles Darwin em A Origem das Espécies, onde o conceito de uma árvore filogenética foi introduzido pela primeira vez.
  

Este artigo é uma tradução. Versão original referenciada abaixo.

Theobald, Douglas L. “29+ Evidences for Macroevolution: The Scientific Case for Common Descent.” The Talk.Origins Archive. Vers. 2.89. 2012. Web. 12 Mar. 2012 <http://www.talkorigins.org/faqs/comdesc/&gt;

Referências
Albert, J., Wahlberg, J., Leitner, T., Escanilla, D. and Uhlen, M. (1994) "Analysis of a rape case by direct sequencing of the human immunodeficiency virus type 1 pol and gag genes." J Virol 68: 5918-24. [PubMed]

Arnold, C., Balfe, P. and Clewley, J. P. (1995) "Sequence distances between env genes of HIV-1 from individuals infected from the same source: implications for the investigation of possible transmission events." Virology 211: 198-203. [PubMed]

Atchely, W. R., and Fitch, W. M. (1991) "Gene trees and the origins of inbred strains of mice." Science 254: 554-558. [PubMed]

Avise, J. C., and Wollenberg, K. (1997) "Phylogenetics and the origin of species." PNAS 94: 7748-7755. http://www.pnas.org/cgi/ content/full/94/15/7748

Birch, C. J., McCaw, R. F., Bulach, D. M., Revill, P. A., Carter, J. T., Tomnay, J., Hatch, B., Middleton, T. V., Chibo, D., Catton, M. G., Pankhurst, J. L., Breschkin, A. M., Locarnini, S. A. and Bowden, D. S. (2000) "Molecular analysis of human immunodeficiency virus strains associated with a case of criminal transmission of the virus." J Infect Dis 182: 941-4. http://jid.oxfordjournals.org/content/182/3/941.long

Blanchard, A., Ferris, S., Chamaret, S., Guetard, D. and Montagnier, L. (1998) "Molecular evidence for nosocomial transmission of human immunodeficiency virus from a surgeon to one of his patients." J Virol 72: 4537-40. http://jvi.asm.org/cgi/content/full/72/5/4537?view=full&pmid=9557756

Brooks, D. R., and McLennan, D. A. (1991) Phylogeny, ecology, and behavior. Chicago: University of Chicago Press.

Bush, R. M., C. A. Bender, et al. (1999) "Predicting the evolution of human influenza A." Science 286: 1921-1925. [PubMed]

Doolittle, W. F. (1999) "Phylogenetic Classification and the Universal Tree." Science 284: 2124. [PubMed]

Doolittle, W. F. (2000) "The nature of the universal ancestor and the evolution of the proteome." Current Opinion in Structural Biology 10: 355-358. [PubMed]

Edwards, A. W. F. and Cavalli-Sforza, L. L. (1963) "The reconstruction of evolution." Annals of Human Genetics 27: 105-106.

Efron, B. (1979) "Bootstrap methods: Another look at the jackknife." Annals of Statistics 7: 1-26.

Efron, B. and Gong, G. (1983) "A leisurely look at the bootstrap, the jackknife, and cross validation." American Statistician 37: 36-48.

Edwards, A. W. F. and Cavalli-Sforza, L. L. (1964) "Reconstruction of phylogenetic trees." in Phenetic and Phylogenetic Classification. ed. Heywood, V. H. and McNeill. London: Systematics Assoc. Pub No. 6.

Felsenstein, J. (1981) "A likelihood approach to character weighting and what it tells us about parsimony and compatibility." Biol J Linn Soc Lond 16: 183-196.

Felsenstein, J. (1981) "Evolutionary trees from DNA sequences: A maximum likelihood approach." J Mol Evol 17: 368-376. [PubMed]

Felsenstein, J. (1985) "Confidence limits on phylogenies: an approach using the bootstrap." Evolution 39: 783-791.

Felsenstein, J. (2004) Inferring Phylogenies. Sunderland, MA: Sinauer Associates.

Fisher, R. A. (1912) "On an absolute criterion for fitting frequency curves." Messenger of Mathematics 41: 155-160.

Fitch, W. M. (1970) "Distinguishing homologous from analogous proteins." Syst. Zool. 28: 132-163.

Futuyma, D. (1998) Evolutionary Biology. Third edition. Sunderland, MA: Sinauer Associates.

Goujon, C. P., Schneider, V. M., Grofti, J., Montigny, J., Jeantils, V., Astagneau, P., Rozenbaum, W., Lot, F., Frocrain-Herchkovitch, C., Delphin, N., Le Gal, F., Nicolas, J. C., Milinkovitch, M. C. and Deny, P. (2000) "Phylogenetic analyses indicate an atypical nurse-to-patient transmission of human immunodeficiency virus type 1." J Virol 74: 2525-32. http://jvi.asm.org/cgi/content/full/74/6/2525?view=full&pmid=10684266

Hennig, W. (1966) Phylogenetic Systematics. (English Translation). Urbana: University of Illinios Press.

Hillis, D. M., and Bull, J. J. (1993) "An empirical test of bootstrapping as a method for assessing confidence on phylogenetic analysis." Syst. Biol. 42: 182-192.

Hillis, D. M., J. J. Bull, et al. (1992) "Experimental phylogenetics: Generation of a known phylogeny." Science 255: 589-592. [PubMed]

Holmes, E. C., Zhang, L. Q., Simmonds, P., Rogers, A. S. and Brown, A. J. (1993) "Molecular investigation of human immunodeficiency virus (HIV) infection in a patient of an HIV-infected surgeon." J Infect Dis 167: 1411-4. [PubMed]

Hudson, R. R. (1992) "Gene trees, species trees and the segregation of ancestral alleles." Genetics 131: 509-513. [PubMed]

Huelsenbeck, J. P., Ronquist, F., Nielsen, R., and Bollback, J. P. (2001) "Bayesian inference of phylogeny and its impact on evolutionary biology." Science 294: 2310-2314. [PubMed]

Kitching, I. J., Forey, P. L., Humphries, C. J., and Williams, D. M. (1998) Cladistics: The Theory and Practice of Parsimony Analysis. Second Edition. The Systematics Association Publication No. 11. Oxford: Oxford University Press.

Li, W.-H. (1997) Molecular Evolution. Sunderland, MA: Sinauer Associates.

Machuca, R., Jorgensen, L. B., Theilade, P. and Nielsen, C. (2001) "Molecular investigation of transmission of human immunodeficiency virus type 1 in a criminal case." Clin Diagn Lab Immunol 8: 884-90. [PubMed]

Maddison, W. P., and Maddison, D. R. (1992) MacClade. Sunderland, MA: Sinauer Associates.
Nei, M. and Kumar, S. (2000) Molecular Evolution and Phylogenetics. New York, NY: Oxford University Press.

Nichols, R. (2001) "Gene trees and species trees are not the same." Trends Ecol Evol. 16: 358-364. [PubMed]

Ou, C. Y., Ciesielski, C. A., Myers, G., Bandea, C. I., Luo, C. C., Korber, B. T., Mullins, J. I., Schochetman, G., Berkelman, R. L., Economou, A. N. and et al. (1992) "Molecular epidemiology of HIV transmission in a dental practice." Science 256: 1165-71. [PubMed]

Swofford, D. L., Olsen, G. J., Waddell, P. J., and Hillis, D. M. (1996) "Phylogenetic inference." In Molecular Systematics, pp 407-514. Hillis, D. M., Moritiz, C. and Mable, B. K. eds., Sunderland, Massachusetts: Sinauer.

Veenstra, J., Schuurman, R., Cornelissen, M., van't Wout, A. B., Boucher, C. A., Schuitemaker, H., Goudsmit, J. and Coutinho, R. A. (1995) "Transmission of zidovudine-resistant human immunodeficiency virus type 1 variants following deliberate injection of blood from a patient with AIDS: characteristics and natural history of the virus." Clin Infect Dis 21: 556-60. [PubMed]

Vogel, G. (1997) "Phylogenetic analysis: getting its day in court." Science 275: 1559-60. [PubMed]

Woese, C. (1998) "The universal ancestor." PNAS 95: 6854-6859. http://www.pnas.org/cgi/ content/full/95/12/6854

Wu, C. I. (1991) "Inferences of species phylogeny in relation to segregation of ancient polymorphisms." Genetics 127: 429-435. [PubMed]

Yirrell, D. L., Robertson, P., Goldberg, D. J., McMenamin, J., Cameron, S. and Leigh Brown, A. J. (1997) "Molecular investigation into outbreak of HIV in a Scottish prison." Bmj 314: 1446-50. http://bmj.com/cgi/content/full/314/7092/1446?view=full&pmid=9167560

Zhu, T., B. Korber, et al. (1998) "An African HIV-1 sequence from 1959 and implications for the origin of the epidemic." Nature 391: 594-597. [PubMed]
 
 

Nenhum comentário:

Postar um comentário

DNA Lixo: a volta dos que não foram

Nos últimos tempos, quando escrevo algo, geralmente trato de paleontologia. Antes eu dedicava maior atenção ao que acontecia no mundo molecu...