sexta-feira, 19 de janeiro de 2018

Três camadas de evidência retroviral para o modelo evolutivo

Este artigo é uma tradução (e adaptação). Veja o original clicando aqui.

Conteúdo 

I. Introdução
II. Ciclo de vida e implicações ancestrais
III. Três camadas de evidência ERV para a ancestralidade comum. 
     a. A presença de ERVs em loci idênticos entre espécies de vários graus de separação taxonômica e a hierarquia aninha nas quais eles se adequam. 
     b. Os graus comparativos de descontinuação LTR-LTR entre ERVs de comprimento total em loci idênticos.
    c. Mutações compartilhadas entre ERVs em loci idênticos e as hierarquias aninhadas comprobatórias em que eles se organizam. 
IV. Resumo
V. Quantidade de ERVs compartilhada
VI. Previsões ERV no Modelo Evolutivo
VII. Respostas criacionistas frequentes
     a. Ignore a maioria das evidências
     b. Use o desvio dos padrões para evitar contabilizar os mesmos
           1. HERV-KGC1
           2. Família de CERVs 1,2 e 3
     c. Providencie red herrings
          1. Preferência de sítio alvo
          2. Funcionalidade
    d. Minimize o número de ERVs em loci idênticos
VIII. Conclusão
IX. Referências

Introdução

      Uma poderosa fonte de evidência de que espécies modernas divergiram de espécies ancestrais via descendência com modificação é a dos retrovírus endógenos (ERVs). A evidência ERV consiste em três camadas independentes que corroboram umas às outras. Como será discutido mais adiante, as três camadas de evidência ERV são: 1) a partilha de ERVs em loci idênticos entre organismos de graus variáveis de separação taxonômica e as hierarquias aninhadas nas quais esses ERV compartilhados estão dispostos; 2) o exame de discrepâncias mutagênicas compartilhadas entre ERVs compartilhados, de modo a inferir a sequência relativa de inserção; e 3) as hierarquias aninhadas de mutações compartilhadas entre ERVs dados em loci idênticos. Mas antes que essa evidência possa ser examinada, é preciso ter uma compreensão firme dos retrovírus e da forma como eles infectam as células.
Esquemas da estrutura geral de um retrovírus antes e após a integração no genoma de uma célula hospedeira.

Ciclo de vida e Implicações ancestrais

     A fim de se replicar, um retrovírus precisa usar a maquinaria molecular de um hospedeiro, e começa o processo primeiro ligando suas glicoproteínas extracelulares e transmembrana aos correceptores de uma célula. O capsídeo — contendo as enzimas retrovirais transcriptase reversa, integrase e protease, bem como duas cópias do genoma retroviral — é inserida no citoplasma da célula, onde se abre. Agora, em sua célula hospedeira, um retrovírus transcreve o seu genoma de RNA para DNA via transcriptase reversa. A protease processa então o DNA viral removendo um dinucleótideo em cada extremidade 3', e a integrase insere-o no genoma da célula hospedeira... Uma vez integrado, e na forma de DNA, seu genoma é conhecido como um protótipo de retrovírus, ou provírus. Após a integração, a célula pode dividir e, eventualmente, a presença de certas condições ambientais desencadeia a ativação proviral. Cópia após cópia do retrovírus é produzida à medida que os vírions brotam, amadurecem e continuam infectando outras células, levando à morte da célula infectada.
     O provável problema para um retrovírus é que, uma vez que a célula se replica e a ativação ocorre, o provírus depende da RNA polimerase II da célula hospedeira para transcrevê-lo em RNA viral para ser empacotado em seus vírions. Infelizmente, a RNA polimerase II é projetada para transcrever RNA mensageiro (mRNA) para tradução em polipeptídeos, portanto, embora use promotores para iniciar a transcrição, uma vez que eles [os promotores] não codificam aminoácidos, ela não os transcreve. Com apenas um conjunto de promotores nos provírus, os genomas retrovirais recentemente transcritos não teriam nenhum promotor. Quando os vírions que os continham se transcrevessem reversamente e os inserisse em novas células hospedeiras, a segunda rodada de ativação e transcrição nunca poderia ocorrer.

   Os retrovírus contornam o problema dos promotores que desaparecem simplesmente polimerizando cópias deles durante a transcrição reversa. Eles conseguem por possuírem seções idênticas de DNA, chamadas repetições [R], em cada uma das extremidades do seu genoma. No início do processo de transcrição reversa, ocorre o primeiro salto, no qual o primer de RNA de transferência (tRNA) se separa e a repetição de DNA se hibridiza com a repetição de RNA restante no terminal 3 'do genoma... Dado o tamanho relativamente pequeno das repetições, se elas não são idênticas, elas não podem se hibridizar. Quanto às seções únicas  5' (U5) e 3' (U3), uma cópia de cada uma é polimerizada no terminal oposto. Entre a necessidade de repetições idênticas e a duplicação de seções únicas, as seções U3-R-U5 resultantes, chamadas longas repetições terminais (LTRs), devem ser igualmente idênticas no momento da inserção. Isso se tornará muito importante depois na análise da segunda e terceira camadas de evidência ERV.

   Eu achei que o paragrafo acima não deixou bem claro como ocorre a transcrição reversa nos retrovírus. Espero que a imagem e a descrição do processo de transcrição representado por ela possa ajudar a esclarecer. Minha referência pode ser conferida aqui
Figura 1. Transcrição reversa. (A) Estruturas gerais do DNA e genoma de RNA retrovirais; (B) Processos necessários para completar a síntese do DNA viral a partir do genoma de RNA viral. Vermelho, DNA; azul, RNA; verde, primer de tRNA; seta, direção da síntese de DNA. Degradação de RNase H, traços azuis.

   A transcrição reversa envolve pelo menos dois eventos obrigatórios de mudança de mole, a saber, a transferência de DNA de fita-negativa e fita-positiva (Figura 1B). A transcrição reversa inicia-se perto da extremidade 5 'do RNA viral usando um primer de tRNA da célula hospedeira, que é parcialmente recozido a uma região de RNA viral com base na complementaridade, designado sítio de ligação do primer (PBS) (Passo 1). Uma vez que o RNA viral embalado no vírion é sentido positivo, a primeira fita de DNA sintetizada é referida como fita negativa. A TR (
Transcripse Reversa), que também é uma polimerase de DNA, copia um curto trecho do RNA viral incluindo a região 5 'U5 e 5' R. Além da atividade de DNA polimerase, a TR também possui atividade de RNase H, que degrada especificamente o RNA num híbrido de RNA:DNA. A degradação do RNA que foi utilizado como modelo para sintetizar o DNA da cadeia menos, expõe a região 5 'R recentemente sintetizada (Passo 2), que pode formar um emparelhamento de bases com a região R na extremidade 3' do genoma viral, completando o primeiro evento de mudança de modelo conhecido como transferência de DNA de fita negativa. Demonstrou-se que durante este passo, o DNA da fita negativa pode se transferir para a mesma molécula de RNA (transferência intramolecular) ou para o RNA co-empacotado (transferência intermolecular) [7-9]. A TR continua a copiar a região U3 localizada na extremidade 3'do RNA viral (Passo 3). Uma vez que a síntese de DNA de cadeia negativa continua após uma região chamada trato de polipurina (PPT), que é resistente à clivagem pela RNase H, a TR faz uma clivagem específica entre PPT e 3'U3. A TR usa o PPT como iniciador para iniciar a síntese de DNA de fita positiva e copia o LTR 3'(U3, R e U5) junto com uma porção do primer de tRNA (Etapa 4). A síntese de DNA de cadeia positiva em muitos retrovírus é descontínua e pode iniciar de mais de uma posição; alguns vírus, como HIV-1, contém um segundo PPT localizado no meio do genoma denominado PPT central. Utilizando a curta complementaridade entre o DNA de fita positiva positiva e a região do PBS no DNA de fita negativa, a TR faz uma segunda mudança obrigatória, denominada transferência de DNA de fita positiva (Passo 5); embora mostrado como um modelo linear, é provável que as duas extremidades do complexo de ácido nucleico estejam próximas em relação à transferência de DNA na fita positiva. Tanto a síntese de DNA de fita positiva a de fita negativa continuam a completar a transcrição reversa (Etapa 6).


     Uma vez que o provírus foi processado, a integrase inicia o processo de inserção quebrando duas das ligações fosfodiéster do genoma do hospedeiro entre um grupo 3'-hidroxila e um grupo 5'-fosfato, permitindo que o provírus se insira em uma posição altamente randomizada (Skinner et. al., 2001). Diferentes integrases retrovirais têm pequenas tendências estatísticas para a inserção dentro da área geral de "regiões cromossômicas ricas em genes expressos ... [suas entrelaçadas] Ilhas CpG ... genes ativos ... [e áreas] perto de sítios de início de transcrição (Mitchell et al., 2004)," mas esses viéses  são tão pequenos que eles exigem milhares de ensaios (3127 usados no estudo de Mitchell) apenas para detectá-los. Na maior parte, o processo de integração é observado como bastante aleatório. 

     As duas rupturas das ligações fosfodiéster pela integrase acontecem em ambas as fitas DNA hospedeiro. Em vez de quebrar as ligações entre dois pares de bases, a integrase separa as quebras por vários pares de bases, formando um corte irregular (Skinner et al., 2001). Uma vez que cada uma das duas fitas de DNA são complementares entre si, as saliências em cada extremidade do corte irregular são igualmente complementares. Quando os nucleotídeos são polimerizados para preencher as lacunas, o resultado final é dois trechos idênticos do DNA entre as duas quebras flanqueando o provírus inserido. Esse efeito é chamado de duplicação do sítio alvo. O segundo efeito da inserção é o deslocamento do DNA. Isso pode ser observado pela comparação de áreas genômicas correspondentes em espécies com e sem provírus. Os que possuem o provírus exibem uma duplicação do sítio alvo, enquanto os que não possuem o provírus, exibem o sítio de pré-integração (Polavarapu, Bowen e McDonald, 2006). A presença desses dois efeitos demonstra conclusivamente que a sequência em questão foi inserida no genoma do hospedeiro através de uma enzima transposase em algum ponto da história da linhagem do hospedeiro.

Os alvos dos retrovírus são geralmente células somáticas, mas se a célula infectada é um esperma ou óvulo, conhecidas como gametas, ou uma célula testicular ou ovariana que se divide em um gameta, esse gameta pode ser usado para produzir prole. Nesse caso, o provírus torna-se um dispositivo permanente dentro do genoma da prole. A sua permanência é devido ao fato de que "não há mecanismo para remover provírus precisamente do genoma, sem deixar para trás um LTR solo ou excluindo DNA cromossômico (Johnson e Coffin, 1999)". Embora o retrovírus fosse estranho ao organismo infectado, e, portanto, seria considerado exógeno para esse organismo, uma vez transmitido à prole dos organismos, estaria presente no estado natural e saudável da prole e, portanto, seria considerado endógeno com relação a ela.


     Agora sendo transmitidos de uma geração para a seguinte, os ERVs acumulam erros de cópia pela DNA polimerase durante a subsequente replicação das células hospedeiras. Uma vez que os ERVs geralmente não são conservados, eles acumulam mutações na mesma taxa que os íntrons. E, como nos íntrons, ao longo do tempo, as mutações podem se fixar no pool de genes da população hospedeira (Boeke e Stoye, 1997. Em Coffin, Hughes e Varmus, 1997). Com tempo suficiente, acumulam-se mutações suficientes para tornar o ERV incapaz de ativação.

     Se dois ou mais indivíduos tiverem ERVs da mesma família nos mesmos loci, pode-se pensar que existem duas explicações plausíveis: 1) que um retrovírus inseriu-se em um ancestral comum e foi transmitido aos indivíduos através da reprodução sexual; ou 2) retrovírus diferentes inseriram-se nos mesmos loci em acestrais diferentes, e foram transmitidos aos indivíduos a partir de cada ancestral comum respectivo. O que exclui a última dessas explicações para a maioria dos ERV compartilhados é a natureza altamente aleatória da integração discutida anteriormente e as mutaçãões compartilhada entre ERVs em loci idênticos, a serem discutidos em breve.

     Assim, podemos então concluir — independentemente de quantos indivíduos têm retrovírus nos mesmos loci de seus genomas — que a maioria desses retrovírus necessariamente se inseriu dentro dos genomas  de células individuais de organismos ancestrais individuais comuns a cada um deles e foram transmitidos para aqueles indivíduos através da reprodução sexual. Se os organismos são da mesma espécie, o indivíduo de onde a inserção se originou provavelmente também foi da mesma espécie. Se, no entanto, os organismos são de espécies diferentes, os ERVs compartilhados são referidos como ortólogos, e é quando as coisas se tornam interessantes.

As Três Camadas de Evidências ERV para Ancestralidade Comum

Camada 1

     Quando examinamos o genoma coletivo do Homo sapiens, descobrimos que uma parte dele é constituída por ERVs (Consortium IHGS, 2001). Também descobrimos que os seres humanos compartilham a maioria deles com chimpanzés, bem como com os outros membros de Hominidae (grandes símios), os membros de Hylobatidae (gibões) e até os membros de Cercopitheciodae (macacos do velho mundo) (Kurdyukov et al., 2001; Lebedev et al., 2000). Uma vez que os seres humanos não procriam e / ou não podem procriar regularmente e ter descendentes férteis com membros dessas espécies e, portanto, não contribuem de forma significativa para seus conjuntos de genes, e vice-versa, sua herança não pode ter resultado de uniões de espécies modernas . Como mencionado anteriormente, a integração paralela é descartada como uma explicação para os muitos ERVs compartilhados, já que a seleção do alvo da integrase é altamente aleatória. E, mesmo que fosse muito mais específico do que observado, exigiria tantas inserções simultâneas e endogenizações que o modelo evolutivo ainda seria tremendamente mais parcimonioso. Isso deixa apenas uma maneira pela qual a maioria desses ERVs poderia ter sido herdada: através da reprodução sexuada de organismos de uma espécie que posteriormente deram origem àquelas às quais os organismos que compartilham os ERVs pertencem, isto é, espécies ancestrais — falando de maneira simples, a maioria dos ERVs são ortólogos; os humanos e os outros primatas devem compartilhar ascendência comum.

     Não só há muitos ERVs compartilhados entre os primatas, mas são compartilhados em subconjuntos hierárquicos do todo. Cada conjunto cai dentro de outro conjunto, dando uma linha de herança ininterrupta para cada espécie (Kurdyukov et al., 2001; Lebedev et al., 2000). Esse padrão é chamado de hierarquia aninhada. Esses padrões corroboram ainda que as muitas espécies de primatas compartilham a ascendência comum e exigem uma sequência específica de divergência de uma espécie ancestral para a próxima. Eles são totalmente inexplicáveis pelo modelo de ascendência incomum.

Camada 2

      Como explicado anteriormente, embora as LTRs de um provírus sejam idênticas após a inserção, uma vez endogenizadas, elas começam a acumulação de mutações. Quaisquer mutações em um LTR tornam-se bastante evidentes, pois não são acompanhadas pelas mesmas mutações na outra. Assim, cada mutação faz com que a proporção de descontinuidade entre as duas LTRs de um ERV de comprimento total aumente. Uma vez que ERVs em loci idênticos entre grandes números de espécies de ampla separação taxonômica se correlacionam com inserções mais antigas, se o modelo evolutivo estiver correto, elas também devem ter maiores razões de descontinuidade entre as LTRs. E o que encontramos? Encontramos justamente isso; um padrão, onde o grau de descontinuação LTR-LTR de um ERV compartilhado é proporcional ao grau de separação taxonômica entre as espécies que o compartilham (Johnson e Coffin, 1999). Há desvio do padrão, provavelmente causado pela transferência viral e recombinação / conversão de interelementos (Hughes & Coffin, 2005) e transferência viral (Belshaw et al., 2004) — mas o padrão é válido para muitos ERV completos e é explicável apenas pela descendência com modificação de uma série específica de espécies ancestrais comuns. Mais uma vez, vemos evidências fortes para a ortologia ERV.

Camada 3 

     Quando as mutações em ERVs compartilhados são examinadas, muitos são encontrados como sendo idênticas a outras. Assim como a distribuição de ERVs, algumas mutações compartilhadas dentro de um único ERV compartilhado adequam-se em hierarquias aninhadas; algumas são compartilhados por todos, muitas por um subconjuntos do todo, e cada conjunto encaixa-se dentro de outro conjunto (Hughes & Coffin, 2005; Johnson e Coffin, 1999). Apesar do desvio causado pelos mesmos mecanismos que efetuam a taxa de descontinuidade LTR-LTR, muitas dessas hierarquias aninhadas de mutações correspondem às de distribuição. Parte do que faz essa evidência tão poderosa para o modelo evolutivo é que a distribuição e a mutação ERV dependem de mecanismos totalmente diferentes; a função da integrase e do complexo de replicação do DNA, respectivamente. Que as duas hierarquias aninhadas coincidem em tudo é apenas explicável por uma ancestralidade comum. A evidência para a ortologia ERV é clara. 

Resumo

As três camadas de evidências ERV que acabam de ser apresentadas são as seguintes:

    Camada 1: a presença de ERVs em loci idênticos entre espécies de vários graus de separação taxonômica e das hierarquias aninhadas nas quais eles se encaixam.

        Uma vez que são transmitidos através da reprodução sexual, os muitos ERVs fixados em loci idênticos em diferentes espécies exigem a presença passada de uma espécie ancestral para ambos, que desde então divergiu nas modernas. E os padrões de sua distribuição indicam uma sequência específica de divergência.

    Camada 2: os graus comparativos de descontinuação LTR-LTR entre ERV de comprimento total em loci idênticos.

        Como as LTRs são idênticas na transcrição reversa e posterior inserção, maior divergência se correlaciona com uma inserção mais antiga. Assim, os padrões de descontinuidade indicam sequências de divergências consistentes com as indicadas pela distribuição.

    Camada 3: mutações compartilhadas entre ERVs em loci idênticos e as hierarquias aninhadas correspondentes em que elas se organizam.

        Uma vez que as mutações se acumulam e se fixam em populações de organismos, a distribuição de mutações compartilhadas indica uma sequência de eventos de especiação consistentes com a induzida pela distribuição e a descontinuação LTR-LTR.

A maioria dos ERVs realmente se originou em uma espécie ancestral comum; a maioria é verdadeiramente ortóloga. 

Quantidade de ERVs compartilhados

     Com tantos alegando que é apenas cerca de 7 ou 14, uma questão importante é: Quantos ERVs os humanos compartilham com os chimpanzés? A resposta é que humanos e chimpanzés compartilham praticamente todos eles. Sabemos que este é o caso por duas razões; exame de variação de indel e análise de todo o genoma.

Variação Indel total

     Ao alinhar as sequências genômicas para comparação, existem muitas maneiras de medir a diferença. O mais comum é a medida de substituições; um par de bases que diferem de uma sequência para a próxima, como um A, em vez de um G. Mas uma medida igualmente importante é a de indels:

     Um indel é uma deleção ou inserção de uma sequência no genoma de um organismo. Quando os genomas de múltiplos organismos estão alinhados, um indel em qualquer um dos genomas resultará em uma lacuna. Isso é útil para determinar quantos ERVs, Alus ou qualquer outro tipo de transpóson são compartilhados, uma vez que as inserções em um locus específico em apenas uma linhagem ou apenas na outra resultarão em lacunas, mas as inserções em loci idênticos não deixam lacunas:


     O comprimento total de todos ~ 6,7 milhões de elementos transposíveis no genoma humano é pelo menos ~ 1,2 Gb (gigabases, bilhões de pares de bases) e o comprimento total de todos ~ 200 mil ERVs é pelo menos ~ 127 Mb (megabases, milhões de pares de bases ) (International Human Genoma Sequencing Consortium, 2001). Mas a variação indel entre o chimpanzé e os genomas humanos é de apenas ~ 3%, compreendendo um máximo de ~ 45 Mb (~ 1,5%) em cada genoma (Chimpanzee Sequencing and Analysis Consortium, 2005). Lembre-se; isso inclui deleções e duplicações, bem como a inserção de elementos transponíveis, como ERVs. Portanto, apenas uma fração de ~ 45 Mb no genoma humano poderia  mesmo que potencialmente ser ERVs em loci diferentes. Mesmo que cada indel do tamanho de um ERV no genoma humano fosse um ERV em loci diferentes para chimpanzés e humanos, isso representaria apenas uma pequena fração dos ~ 127 Mb de todos os ERVs; e uma fração mínima de ~ 1,2 Gb de todos os elementos transponíveis. Assim, desde o início, sabemos que a maioria dos ERV estão em loci idênticos.

Variação Indel Observado Envolvendo ERVs

     A variação indel total fornece um número mínimo de elementos transponíveis que podem ser compartilhados em loci idênticos entre chimpanzés e humanos; mas um exame adicional é necessário para determinar o número real. Uma maneira de fazer isso é isolando apenas os indels que são do tamanho certo para potencialmente serem ERVs em loci diferentes. Uma vez que isso é feito, as sequências correspondentes a essas lacunas podem ser examinadas individualmente.

     Os resultados dessa análise são que menos de 100 ERVs são humano-específicos (Polavarapu, Bowen e McDonald, 2006). Como afirmado anteriormente, se uma sequência não é apenas em um locus dado em uma linhagem, nem apenas em um locus dado no outro, então o único estado possível restante no qual ele pode existir está no mesmo local em ambas as linhagens. Portanto, o número de ERVs em loci idênticos é o número total menos o número que forma lacunas. Com menos de 100 dos ~ 200 mil ERVs no genoma humano sem lacunas, a porcentagem de ERVs em loci idênticos é maior que que 99,9%. 

 Análise do genoma completo     Em 2005, a sequência disponível do genoma dos chimpanzés foi alinhada com a do genoma humano e uma análise de comparação extensa foi realizada. Como parte desta análise, os pesquisadores analisaram todas as LTR individuais disponíveis e ERV de comprimento total no genoma do chimpanzé e verificaram se havia também um em cada locus correspondente. Assim como com o exame de indels, os resultados foram que menos de 100 ERVs são específicos para humanos e menos de 300 ERVs são específicos de chimpanzé (Chimpanzee Sequencing and Analysis Consortium, 2005; R. Waterston, comunicação pessoal, 22 de abril de 2010) .

      Em resumo, a variação indel mostra que a maioria dos elementos transponíveis, como ERVs, não podem ser específicos de linhagem; eles devem estar em loci idênticos. Quando os indels são examinados, isso é corroborado, e menos de 0,1% dos ERVs são específicos da linhagem. Finalmente, a confirmação definitiva é obtida pela comparação do genoma, onde praticamente todos os ERVs são diretamente observados em loci idênticos.

Previsões ERV do Modelo Evolutivo

     À medida que os genomas dos primatas continuam sendo sequenciados na íntegra e comparados ao genoma humano, se verificará que, à medida que o grau de separação taxonômica das linhagens comparadas aumenta:

     1) As proporções de ERVs, Alus e outros elementos transponíveis em loci não-idênticos para aqueles em loci idênticos irão aumentar gradualmente — dos índices humanos e chimpanzés atuais de ~ 0,1% para ERVs e ~ 0,6% para Alus (IHGS Consortium, 2001; CSA Consortium, 2005).
     
Explicação: quanto mais velha a divergência entre as linhagens comparadas, mais tempo cada uma teve como uma linhagem distinta; assim, as inserções mais independentes devem ter acumulado.

     2) A proporção LTRs-solo para elementos completos dos ERVs em loci idênticos aumentará rapidamente.

Explicação
: as inserções tendem a sofrer recombinação homóloga rapidamente, mas assim que começa a se acumular mutações, sua chance de recombinação diminui rapidamente (Belshaw et al., 2006). Assim, existem ERVs de comprimento total muito antigos, mas seus números caem rapidamente com a idade.

     3) Os elementos transponíveis em loci idênticos serão organizados em grande parte de acordo com a hierarquia aninhada atual dos elementos examinados, mas entre a simplesiomorfia de inserção causada pela classificação de linhagem incompleta (ou seja, a segregação alélica) e a homoplasia de inserção causada pela preferência de sítio alvo, a quantidade de desvio do padrão aumentará para além do caso solitário atual de HERV-K-GC1. A maioria deste aumento envolverá o desvio de uma única linhagem por ERV desviante identicamente posicionado.

Explicação: um sítio ser usado duas vezes é bastante raro, e um sítio ser usado três vezes não é observado; mesmo em uma amostra de 40.528 inserções de HIV (Wang et al., 2007). Isto — além da tendência para a fixação alélica — indica que a simplesiomorfia/ homoplasia de inserção provavelmente será limitada a apenas um ponto de desvio de cada vez; como é o caso do HERV-K-GC1 (Barbulescu et al., 2001) e Ya5AH137 (Salem et al., 2003).

Respostas Criacionistas Comuns

Existem três respostas comuns à evidência ERV pelos criacionistas:

     a) A primeira é ignorar a maior parte dela — principalmente os padrões de distribuição e mutação.

        Os criacionistas muitas vezes respondem diretamente aos ERVs em loci idênticos, argumentando que a integrase pode gerá-los ao inserir em linhagens separadas e, indiretamente, respondem ao agrupamento hierárquico de tais ERVs citando o HERV-K-GC1 e (incorretamente) citando CERVs das famílias 1, 2 e 3.

    Mas eles não parecem responder à correlação positiva entre o número de espécies que compartilham ERVs em loci idênticos e a descontinuidade entre as LTRs de 5 'e 3' desses ERVs (Johnson e Coffin, 1999); nem a partilha de mutações entre as LTRs de ERVs em loci idênticos, o agrupamento hierárquico de tais mutações, ou que as hierarquias aninhadas de distribuição correspondem às de mutação (Hughes & Coffin, 2005).

     Continua a ser verdade que a ancestralidade comum é um poderoso modelo preditivo em relação à colocação de ERVs. Ele prevê que a maioria dos ERVs deve ser compartilhada em determinados conjuntos hierárquicos e não em outros, e até agora, quase todos foram previstos.

     Um modelo criacionista abrangente que é inconsistente com a ancestralidade comum e incorpora a totalidade dos dados ERV seria um próximo passo importante, mas até agora não foi formulado.

     b) A segunda resposta comum é usar o desvio desses padrões que eles não conseguem tratar como justificativa para descartar ERVs de forma definitiva. A seguir, os dois exemplos mais comuns:

HERV-K-GC1

     Embora os padrões sejam formados e atuem como evidências poderosas de ocorrências passadas e de mecanismos que os causam, a natureza complexa do mundo físico (devido a tantas interações simultâneas em tantos níveis) geralmente causa desvio desses padrões.

     Assim, os padrões atuam como indicadores do que está acontecendo realmente, e o desvio deles é esperado e provável que não seja indicativo do que realmente está acontecendo.

   Existe apenas um desvio conhecido solitário da hierarquia aninhada distributiva; um ERV endogenizado / fixado relativamente recentemente chamado HERV-K-GC1. Uma vez que este é um desvio não representativo de um padrão, tudo o que precisa ser feito é identificar mecanismos que podem explicar esse desvio. Existem pelo menos dois mecanismos conhecidos para explicar (Barbulescu et al., 2001):

    1) A inserção foi em um alelo que permaneceu heterozigoto nas populações em duas divergências, com deriva genética e o tamanho da sub-população divergente (segregação alélica).

Explicação mais detalhada:

    Quando um provírus se insere, ele faz isso em apenas uma cópia do genoma, e quando se torna endogenizado, é heterozigoto no organismo. Tanto o alelo com a integração como o sítio de pré-integração existem na população. Uma vez que os ERVs não são conservados, eles podem persistir nas populações, mas uma vez que as subpopulações sexualmente separadas das quais uma nova espécie divergente podem ser facilmente pequenas, e como a deriva genética é bastante prevalente em pequenas populações, os alelos podem ser perdidos, fazendo o outro ser fixado na população.

    O HERV-K-GC1 teria se inserido e sido endogenizado no ancestral comum de humanos, chimpanzés e gorilas, mas teria sido representado suficientemente bem na subpopulação dividida que mais tarde divergiu para o ancestral de humanos e chimpanzés em que o alelo permaneceu. Na subpopulação de divisão que passou a divergir mais tarde para o antepassado dos humanos, o alelo teria sido fixado pela deriva genética.

(a) Um diagrama que mostra a região sequenciada em relação à posição do provírus em Gorilla e Pan. (b) As sequências correspondentes a 165 pb flanqueando ambos os lados do provírus. (c) Sequências de 40 pb imediatamente flanqueando cada lado do provírus. (d) Segregação do alelo de pré-integração vazio (E) e do alelo de provírus (V) nas linhagens Homo, Pan e Gorilla. E + V indica que ambos os alelos estavam presentes na população das espécies afins. LCA, último ancestral comum.


     2) A inserção foi em uma seção duplicada do cromossomo que sofreu recombinação homóloga em cada respectiva linhagem. 

Explicação mais detalhada:

     A outra possibilidade é que o HERV-K-GC1 foi inserido em uma seção duplicada do cromossomo no ancestral de humanos, chimpanzés e gorilas, (possivelmente logo após a divisão do ancestral dos orangotangos) e foi fixado, provavelmente logo depois disso, mas possivelmente em qualquer ordem. Esse alelo fixo então foi submetido à recombinação homóloga em cada respectiva linhagem.

     As hierarquias aninhadas distributivas são claras e combinam com as de mutações compartilhadas. Ambos os padrões também são corroborados por aquelas descontinuidades das longas repetições terminais. É esperado desvio de padrões, mas a presença desses padrões é evidência poderosa de ancestralidade comum.
 
Família de CERVs 1,2 e 3

     As inserções das famílias CERVs 1, 2 e 3 são encontradas nos genomas dos gorilas e chimpanzés, mas não nos genomas humanos. O que deve ser entendido é que apenas as hierarquias aninhadas formadas pela herança de ERVs ortólogos fornecem evidências de ancestralidade comum; não as não-ortólogas, uma vez que são necessariamente integrados em antepassados separados.

     Cada um dos PtERVs examinados reivindicados como estando a violar a hierarquia aninhada estão em loci não-ortólogos; eles simplesmente possuem taxas de descontinuidade de longas repetições terminais inusitadamente altas, provavelmente devido à recombinação/conversão de interelementos e à transferência viral (Polavarapu, Bowen e McDonald, 2006) .

    Conforme afirmado em uma publicação sobre o PtERV1, por Yohn (2005, p. 578-579) e seus colegas, "275 (95,8%) dos sítios de inserção foram mapeados inequivocamente como localizações não-ortólogas".

     As 24 (4.2%) inserções restantes "não puderam ser definitivamente resolvidas como ortólogas ou não-ortólogas" devido às limitações da "abordagem de mapeamento de sequência final baseada em BAC" usada. Parte dos resultados foi obtida comparando "três intervalos compartilhados putativamente entre macaco e chimpanzé" para "as sequências shotgun de genoma completo disponíveis para [os] dois genomas".

    Ao fazê-lo, houve duas instâncias em que eles "conseguiram refinar a localização no mapa para uma resolução de um par de bases... Embora o status dos sítios sobrepostos restantes seja desconhecido, [os dados resolveram] quatro sítios adicionais como eventos de inserção independentes e sugerem que o resto também pode ser não-ortólogo ".

    Tudo isso indica que essas inserções dessas três famílias de ERVs infectaram primatas depois que chimpanzés e humanos divergiram. Aconteceu de os humanos terem escapado da infecção escapada, seja por geografia ou imunidade, ou foram infectados, mas nenhum deles foi endogenizado e/ou fixado na população. Estes não são exemplos de desvio da hierarquia aninhada da distribuição ERV.

    c) A terceira resposta comum é usar red herrings para descartar a evidência ERV. Os dois exemplos aqui discutidos são a preferência de sítio alvo e funcionalidade:

Preferência de Sítio Alvo

     É verdade que a inserção da integrase não é inteiramente aleatória, mas não é nem de perto locus-específica. A Figura 1 na página 1129 do estudo de Mitchell (2004) mostra que os 3127 provírus analisados inseriram-se em loci diferentes. O estudo apenas demonstra a preferência de alta ordem para as áreas gerais de "regiões cromossômicas ricas em genes expressos ... Ilhas CpG ... genes ativos ... [e áreas] perto de sítios de início de transcrição".


É o mesmo com o estudo de Taruscio (1991), onde afirma claramente:

"Os retrovírus tem a capacidade de se integrar ao genoma do hospedeiro, em muitos casos, com aprente pouca especificidade desequência ou sítio. No entanto, relativamente poucos estudos abordaram características mais gerais da integração cromossômica ... Esses pesquisadores sugeriram que características estruturais de ordem superior , ou uma capacidade transcricional activa de cromatina pode ser fundamental para eventos de integração preferidos (p.141-142) ".

     É claro a partir de todos os estudos sobre a preferência de sítio alvo que, embora a inserção proviral não seja puramente aleatória, também não é locus-específica; devido à forma como ele ataca diretamente as ligações de fosfodiéster 5 'e 3', sem necessidade de ligar-se (Skinner et al., 2001). Portanto, em relação à aleatoriedade pura, a inserção não é aleatória, mas em relação à especificidade do locus, a inserção é altamente aleatória.

    Uma vez que o modelo que nega a ancestralidade requer quase uma locus-especificidade, apresentar viéses relativamente pequenos para "características estruturais de ordem superior" é um red herring.

Funcionalidade

     Não há dúvida de que alguns ERVs têm funções em organismos, mas não há ERVs totalmente funcionais — apenas componentes funcionais, com o restante excluído ou mutado, gerando não-funcionalidade.

    Por exemplo, a contribuição do enJS56A1 e do enJS5F16 (dos meros ~ 20 enJSRVs) para a regulação do crescimento/diferenciação da placenta é conseguida unicamente por seus genes env com matrizes de leitura aberta (Dunlap et al., 2006; Palmarini et al., 2000). Embora eles também tenham uma matriz de leitura aberta para o gag (causando interação gag-gag que restringe JSRVs patogênicos), eles são os únicos conhecidos por ter isso (Mura et al., 2004). E cada enJSRV estudado possui um pol com matriz de leitura fechada (Murcia, Arnaud e Palmarini, 2007).

Outro exemplo é a contribuição da transcrição de LTRs para promotores de genes:

    1) Não só a maioria dos ERVs está loci que não permite que contribuam para a atividade transcricional, mas a maioria dos ERVs se recombinaram em LTRs individuais. Uma vez que apenas as LTRs de ERVs completas ativas podem contribuir (Cohen, Lock, & Mager, 2009, p.107), mesmo a maioria dos ERVs na posição correta não tem efeito. Tal como acontece com os enJSRV, estes ERVs representam uma porcentagem muito pequena do todo.

    2) Os genes reais desses ERVs contribuem com nada — apenas o seu promotor de sequências LTRs. Mais uma vez, tal como acontece com enJSRVs, estes são exemplos de componentes ERV funcionais, em vez de ERVs funcionais.

    É o mesmo com cada caso observado; novamente, não há "ERVs funcionais"; apenas uma pequena porcentagem de ERVs com componentes funcionais.

Mas é um ponto irrelevante, porque sabemos que ERVs são inserções:

     A característica de uma inserção é um deslocamento de DNA cromossômico, e a característica de inserção pela integrase é a presença de duplicação do site alvo, devido à forma como ela ataca as ligações de fosfodiéster 5 'e 3' com um deslocamento de alguns pares de bases ( Skinner et al., 2001). Uma vez que os ERV de comprimento total são acompanhados por duplicações de sítio alvo e deslocamento de DNA, são necessariamente inserções províricas endógenas/fixadas.

     Portanto, quaisquer componentes funcionais são necessariamente exaptações pós-inserção, e o fato de que eles são necessariamente inserções significa que eles não podem fazer parte de qualquer "design original". A questão da funcionalidade é simplesmente um arenque vermelho quando se discute como os ERVs exigem uma ancestralidade comum. 


    Para uma compreensão dos "andaimes" (p.365-366) e da exaptação (p.361-363), incluindo vários "caminhos para exaptação", consulte a primeira metade (p.358-366) de "The Evotion of Complex Organs" pelo Dr. Gregory (2008).

     d) A quarta resposta comum é subestimar o número de ERVs em loci idênticos e usar esse número em conjunto com a preferência de sítio alvo. O argumento é o seguinte:

Existem apenas alguns ERV encontrados em loci idênticos em humanos e chimpanzés. Dada a preferência de sítio alvo, não é improvável que eles sejam o resultado de infecções em linhagens separadas. Assim, o compartilhamento de ERVs é consintente com a ancestralidade não-comum [isto é, um suposto problema para a ancestralidade comum] .


      Não é razoável formular a hipótese de que, entre as dezenas de milhares de ERVs, a preferência de sítio alvo semelhante pode ter resultado em uma porcentagem muito pequena de instâncias de inserção, endogeneização e fixação em loci idênticos em duas linhagens separadas. 

      Mas o primeiro problema com a ideia de que isso torna a ancestralidade não-comum plausível é que existem ERVs compartilhados por muito mais do que apenas duas linhagens. Por exemplo, existem ERVs compartilhados por chimpanzés, humanos, gorilas, orangotangos, gibões e macacos do novo mundo (Kurdyukov et al., 2001; Lebedev et al., 2000). O segundo problema — e, de longe, o mais importante — é que não compartilhamos apenas alguns ERVs em loci idênticos com chimpanzés; o exame da variação indel e a análise de todo o genoma mostram que compartilhamos praticamente todos eles com chimpanzés. Isso é discutido extensivamente na seção "Quantidade de ERVs compartilhados", acima.

Conclusão 

     Em última análise, a melhor maneira de responder a tais afirmações — depois de ter abordado seus pontos especificamente, é claro — é dirigir implacavelmente o que eles parecem menos disposto a discutir; que esse desvio de padrões é esperado e que os padrões corroboradores de distribuição, mutação e descontinuidade LTR-LTR são explicáveis pelo modelo evolutivo. 


Referências

Anderssen, S., E. Sjøttem, G. Svineng, and T. Johansen. "Comparative Analyses of LTRs of the ERV-H Family of Primate-Specific Retrovirus-like Elements Isolated from Marmoset, African Green Monkey, and Man." Virology 234.1 (1997): 14-30. <http://www.ncbi.nlm.nih.gov/pubmed/9234943>.

Barbulescu, M., G. Turner, M. Su, R. Kim, M. Jensen-Seaman, A. S. Deinard, K. K. Kidd, and J. Lenz. "A HERV-K Provirus in Chimpanzees, Bonobos and Gorillas, but Not Humans." Current Biology 11.10 (2001): 779-83. <http://www.cell.com/current-biology/fulltext/S0960-9822(01)00227-5>.

Belshaw, R., J. Watson, A. Katzourakis, A. Howe, J. Woolven-Allen, A. Burt, and M. Tristem. "Rate of Recombinational Deletion among Human Endogenous Retroviruses." J Virol 81.17 (2007 Sep): 9437-442. <http://jvi.asm.org/content/81/17/9437.full>.

Belshaw, R., V. Pereira, A. Katzourakis, G. Talbot, J. Paces, A. Burt, and M. Tristem. "Long-term reinfection of the human genome by endogenous retroviruses." Proceedings of the National Academy of Sciences USA 101.14 (2004): 4894-899. <http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=15044706>.

Boeke, J. D., and J. P. Stoye. "Retrotransposons, endogenous retroviruses and the evolution of retroelements." (1997). In. Coffin, J. M., S. H. Hughes, and H. E. Varmus. Retroviruses. New York: Cold Spring Harbor Laboratory Press, 1997. <http://www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=rv.chapter.3430>.

Cann, Alan. "Retroviruses." MicrobiologyBytes. Web. 26 Oct. 2009. <http://www.microbiologybytes.com/virology/Retroviruses.html>.

Chimpanzee Sequencing and Analysis Consortium. "Initial Sequence of the Chimpanzee Genome and Comparison with the Human Genome." Nature 437.7055 (2005 Sep 1): 69-87. <http://www.nature.com/nature/journal/v437/n7055/full/nature04072.html>.

Cohen, C. J., W. M. Lock, and D. L. Mager. "Endogenous retroviral LTRs as promoters for human genes: a critical assessment." Gene 448.2 (2009): 105-14. <http://www.ncbi.nlm.nih.gov/pubmed/19577618>.

Dangel, A. W., B. J. Baker, A. R. Mendoza, and C. Y. Yu. "Complement component C4 gene intron 9 as a phylogenetic marker for primates: long terminal repeats of the endogenous retrovirus ERV-K(C4) are a molecular clock of evolution." Immunogenetics 42.1 (1995): 41-52. <http://www.ncbi.nlm.nih.gov/pubmed/7797267>.

Dunlap, K. A., M. Palmarini, M. Varela, R. C. Burghardt, K. Hayashi, J. L. Farmer, and T. E. Spencer. "Endogenous retroviruses regulate periimplantation placental growth and differentiation." Proc Natl Acad Sci U S A. 103.39 (2006): 14390-5. <http://www.pnas.org/content/103/39/14390.full>. 

Gregory, T. R. "The Evolution of Complex Organs." Evolution: Education and Outreach 1.4 (2008): 358-89. <http://www.springerlink.com/content/t125078h5p201442/>.

Hughes, J. F., and J. M. Coffin. "Human endogenous retroviral elements as indicators of ectopic recombination events in the primate genome." Genetics 171 (2005): 1183-194. <http://www.genetics.org/cgi/content/abstract/genetics.105.043976v1>.

International Human Genome Sequencing Consortium. "Initial Sequencing and Analysis of the Human Genome." Nature 409.6822 (2001 Feb 15): 860-921. <http://www.nature.com/nature/journal/v409/n6822/full/409860a0.html>.
 
Johnson, W. E., and J. M. Coffin. "Constructing primate phylogenies from ancient retrovirus sequences USA." Proceedings of the National Academy of Sciences 96.18 (1999): 10254-0260. <http://www.pnas.org/content/96/18/10254.full>.

Kurdyukov, S. G., Y. B. Lebedev, Artamonova II, T. N. Gorodentseva, A. V. Batrak, I. Z. Mamedov, T. L. Azhikina, S. P. Legchilina, I. G. Efimenko, K. Gardiner, and E. D. Sverdlov. "Full-sized HERV-K (HML-2) Human Endogenous Retroviral LTR Sequences on Human Chromosome 21: Map Locations and Evolutionary History." Gene 273.1 (2001 Jul 25): 51-61. <http://www.ncbi.nlm.nih.gov/pubmed/11483360>.

 
Lebedev, Y. B., O. S. Belonovitch, N. V. Zybrova, P. P. Khil, S. G. Kurdyukov, T. V. Vinogradova, G. Hunsmann, and E. D. Sverdlov. "Differences in HERV-K LTR insertions in orthologous loci of humans and great apes." Gene 247.1-2 (2000): 265-77. <http://www.ncbi.nlm.nih.gov/pubmed/10773466?dopt=Abstract>.

Medstrand, P., and D. L. Mager. "Human-Specific Integrations of the HERV-K Endogenous Retrovirus Family." J Virol 72.12 (1998 Dec): 9782-787. <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC110489/>.
 
Mitchell, R. S., B. F. Beitzel, A. R. Schroder, P. Shinn, H. Chen, C. C. Berry, J. R. Ecker, and F. D. Bushman. "Retroviral DNA integration: ASLV, HIV, and MLV show distinct target site preferences." PLoS Biology 2.E234 (2004). <http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=15314653>.

Mura, M., P. Murcia, M. Caporale, T. E. Spencer, K. Nagashima, A. Rein, and M. Palmarini. "Late Viral Interference Induced by Transdominant Gag of an Endogenous Retrovirus." Proc Natl Acad Sci U S A 101.30 (2004 Jul 27): 11117-22. <http://www.pnas.org/content/101/30/11117.long>.

Murcia, P. R., F. Arnaud, and M. Palmarini. "The transdominant endogenous retrovirus enJS56A1 associates with and blocks intracellular trafficking of Jaagsiekte sheep retrovirus Gag." J Virol. 81.4 (2007): 1762-72. <http://jvi.asm.org/cgi/content/full/81/4/1762>.

Palmarini, M., C. Hallwirth, D. York, C. Murgia, T. De Oliveira, T. Spencer, and H. Fan. "Molecular Cloning and Functional Analysis of Three Type D Endogenous Retroviruses of Sheep Reveal a Different Cell Tropism from That of the Highly Related Exogenous Jaagsiekte Sheep Retrovirus." J Virol 74.17 (2000 Sep): 8065-76. <http://jvi.asm.org/cgi/content/full/74/17/8065?view=long&pmid=10933716>. 

Polavarapu, N., N. J. Bowen, and J. F. McDonald. "Identification, characterization and comparative genomics of chimpanzee endogenous retroviruses." Genome Biology 7.R51 (2006). <http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=1779541>.

Salem, A. H., D. A. Ray, J. Xing, P. A. Callinan, J. S. Myers, D. J. Hedges, R. K. Garber, D. J. Witherspoon, L. B. Jorde, and M. A. Batzer. "Alu Elements and Hominid Phylogenetics." Proc Natl Acad Sci U S A 100.22 (2003 Oct 28): 12787-2791. <http://www.pnas.org/content/100/22/12787.full>.  

Skinner, L. M., M. Sudol, A. L. Harper, and M. Katzman. "Nucleophile Selection for the Endonuclease Activities of Human, Ovine, and Avian Retroviral Integrases." Journal of Biological Chemistry 276.1 (2001): 114-24. <http://www.jbc.org/cgi/content/full/276/1/114>.

Steinhuber, S., M. Brack, G. Hunsmann, H. Schwelberger, M. P. Dierich, and W. Vogetseder. "Distribution of human endogenous retrovirus HERV-K genomes in humans and different primates." Human Genetics 96.2 (1995): 188-92. <http://www.ncbi.nlm.nih.gov/pubmed/7635468>.

Targeting HIV Replication. Boehringer Ingelheim. Boehringer Ingelheim GmbH. Web. 3 Nov. 2009. <http://hiv.boehringer-ingelheim.com/com/HIV/index.jsp>. 

Taruscio, D., and L. Manuelidis. "Integration Site Preferences of Endogenous Retroviruses." Chromosoma 101.3 (1991 Dec): 141-56. <http://www.ncbi.nlm.nih.gov/pubmed/1790730>.

Wang, G. P., A. Ciuffi, J. Leipzig, C. C. Berry, and F. D. Bushman. "HIV Integration Site Selection: Analysis by Massively Parallel Pyrosequencing Reveals Association with Epigenetic Modifications." Genome Res 17.8 (2007 Aug): 1186-194. <http://genome.cshlp.org/content/17/8/1186.long>.
 
Yohn, C. T., Z. Jiang, S. D. McGrath, K. E. Hayden, P. Khaitovich, M. E. Johnson, M. Y. Eichler, J. D. McPherson, S. Zhao, S. Pääbo, and E. E. Eichler. "Lineage-specific Expansions of Retroviral Insertions within the Genomes of African Great Apes but Not Humans and Orangutans." PLoS Biol. E110 3.4 (2005 Apr). <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1054887/>.

 






Nenhum comentário:

Postar um comentário

DNA Lixo: a volta dos que não foram

Nos últimos tempos, quando escrevo algo, geralmente trato de paleontologia. Antes eu dedicava maior atenção ao que acontecia no mundo molecu...