Original Article: Science does it again
Author: rws.xoba.com

A Ciência apronta novamente

Um novo documento na revista Ciência de Quentin Atkinson, intitulada "Diversidade fonêmica, suporta um modelo de efeito fundador em série da expansão da linguagem da África", é um longo caminho para mostrar que o que mais conta na ciência hoje em dia é um bom fio. O resumo está aqui http://www.sciencemag.org/content/332/6027/346.abstract, e o artigo do sempre entusiasmado Nicholas Wade no New York Times esta aqui: http://www.nytimes.com/2011/04/15/science/15language.html.

Eu simplesmente colocarei abaixo para consumo público minha revisão do artigo de Atkinson para Ciência. Evidentemente, meus argumentos não eram suficientemente convincentes para entrar no caminho de uma linda história.

Eu tenho que admitir que não tenho certeza por que me pediram para revisar este artigo. Não sou um especialista em lingüística histórica ou particularmente na evolução da linguagem. Eu certamente fui um crítico franco das práticas de revisão da Ciência; talvez fosse por essa razão que me pediram. Mas, se for esse o caso, não fez nada para melhorar minha percepção da revisao de práticas Ciência.

SINOPSE

Este artigo é uma revisão de um artigo anterior, que aborda as críticas dos revisores anteriores. A tese básica de Atkinson é que uma série de migrações da pátria africana original ao longo dos últimos 50-70K anos, explica uma redução observada no tamanho médio dos estoques de fonemas à medida que se afasta da África. Os inventários de fonemas menores, em média, são encontrados na América do Sul e Oceania, os últimos lugares a serem colonizados por seres humanos.

A tese depende de outro resultado, devido a Hay e Bauer, mas também replicado pela Atkinson, que existe uma correlação positiva entre o tamanho da população e a diversidade de fonemas. Na verdade, o tamanho da população e a distância da África são, conjuntamente, fortes preditores da diversidade de fonemas.

A conclusão é que esta é uma forte evidência de que a linguagem provavelmente evoluiu na África, e se mudou para fora enquanto os seres humanos migraram 50-70K anos BP.

Atkinson é cuidadoso em sua análise e cobre muitos aspectos, incluindo uma análise de 2560 possíveis pontos de origem, cujos resultados mostram que os melhores modelos são consistentes com uma origem em algum lugar da África Central e Austral. Para testar a possibilidade de poligênese, ele considera modelos com um segundo ponto de origem. Essa análise postula a América do Sul como um segundo ponto de origem, mas este resultado invensível é argumentado como um artefato. Ele também argumenta que as expansões mais recentes desde o último máximo glacial não podem explicar o cline global no tamanho do inventário de fonemas.

As afirmações de papel são impressionantes e, se corretas, são de extrema importância em nossa compreensão da evolução da linguagem humana, e mesmo da própria humanidade....

Mas tais reivindicações marcantes exigem um apoio impressionante. E, enquanto não posso oferecer uma análise alternativa dos dados presentes na Atkinson, permaneço seriamente preocupado com uma série de questões.

CRÍTICA

População versus tamanho do inventário de fonemas

A análise depende fundamentalmente da relação entre o tamanho da população e o tamanho do inventário do fonema, descoberto primeiro por Hay e Bauer e replicado neste estudo. Sem esse relacionamento, a história não funcionaria.

Nos dados de Atkinson, a correlação entre a população de troncos e sua diversidade de fonemas normalizados tem um valor de R de 0,385. Embora o valor r não seja enorme, é altamente significativo. Mas a população de línguas varia (e isso também se aplica ao estudo de Hay e Bauer) variam de algumas dezenas de alto-falantes até idiomas com falantes em centenas de milhões.

Considere esses números no contexto dos períodos de tempo Atkinson está falando, bem mais de 10 mil BP. As estimativas das populações mundiais desse período são obviamente incertas, mas uma estimativa comum para 10 mil BP tem cerca de 1 milhão de humanos em todo o planeta. 50-70K BP presumivelmente teria números ainda menores.

Quão grande poderia ser uma população de humanos que falassem o mesmo idioma antes de 10K BP? Se somos muito generosos e assumimos que a distribuição de idiomas era semelhante a hoje, onde cerca de 1/10 da população mundial fala mandarim, então talvez falantes de 100K. Isso parece terrivelmente improvável --- veja abaixo --- mas se alguém concede que existiam línguas tão grandes que há muito tempo, um intervalo mais apropriado a considerar é a linguagem que tem populações entre algumas dezenas e cerca de 100.000 falantes. Eu não executei os números, mas apenas olhando as parcelas na Figura S1, a correlação para esse intervalo parece ser muito menor do que o r = 0.385 para todo o intervalo.

Mas quem acredita seriamente que houve qualquer grupo de falantes de 100K de um único idioma em uma data tão cedo? Antes da 10K BP, os seres humanos viviam em sociedades de caçadores-coletores, e não nas comunidades maiores estabelecidas que se formaram após a agricultura, e muito menos o que se viu após a fundação das cidades. Para essas sociedades, grupos muito pequenos são a norma. Esperamos ver qualquer grupos que tinham populações de mais de algumas centenas ou alguns milhares? A Australia pré-colonial é provavelmente um modelo mais razoável para o Paleolítico, caso em que estamos falando de grupos de alguns milhares de max. Nesse caso, se a norma para a maioria das línguas fosse de fato alguns milhares de falantes no máximo, então todas as linguagens nos primeiros períodos seriam pequenas.

Demonstrar que existe uma forte correlação entre a diversidade de fonemas e o tamanho da população, calculada em relação às amplitudes populacionais plausíveis para o Paleolítico, e podemos ter alguma base para uma discussão. Uma vez que não existe uma lei natural que dite a correlação que Hay e Bauer descobriram, e a correlação está faltando em qualquer explicação atualmente compreendida, tal demonstração parece um requisito mínimo mínimo

Outra questão é que o modelo de Atkinson pressupõe que estamos falando sobre perca de inventário quando as populações ficam menores e, portanto, existe uma direcionalidade implícita para a "lei": senão, então, por que a migração resultaria em perda de inventário e por que as línguas não recuperariam a diversidade perdida quando as populações reagissem? Mas não há provas de uma direcionalidade aqui: Hay e Bauer certamente não propõem tal direcionalidade. A coisa mais próxima que estão dispostas a oferecer como uma possível linha de explicação de sua observação é o trabalho de de Boer em sistemas emergentes. Deixando de lado a questão de saber se as simulações de de Boer são realmente relevantes para a transmissão de linguagens que já funcionam para novas gerações, o modelo é neutro sobre a questão da perda em pequenas populações versus ganho em grandes: simplesmente se desvantaja de que se obtém menos fonemas (vogais no caso de Boer) em populações menores, e mais em grandes.

Na verdade, a melhor explicação para a qual posso pensar é por que tal correlação pode ser obtida é que, em grandes idiomas, encontramos variação dialectal, e a variação dialectal pode ser plausivelmente uma fonte de empréstimo de novos fonemas em outras variedades. Mas esse mecanismo significaria que as grandes línguas ganhariam a diversidade fonética não que as pequenas línguas a perdessem.

A densidade da população mundial para o período de tempo em que estamos falando também levanta outro problema: certamente haveria um amplo tempo para que os "efeitos fundadores" se manifestam dentro da África. A África é, afinal, um continente muito grande, e com grupos tão escassos da população podem ter sido expulsos, ou por outros motivos procuraram novas terras para colonizar sem sair do continente. Com essa suposição, não se poderia esperar uma grande variedade dentro da África como em todo o mundo?

Além disso, existem muitas razões para as pequenas populações além da migração: a guerra, a fome e a doença teriam afetado as populações pré-históricas e causaram condições que poderiam favorecer uma diminuição no inventário de fonemas - assumindo novamente que a correlação é robusta pequenas áreas de população para começar. Mais uma vez, isso sugeriria que se deveria encontrar uma diversidade igual em África, como em todo o resto do mundo.

O efeito fundador

Embora eu entenda a afirmação de Atkinson, devo admitir não entender completamente o mecanismo pelo qual a migração produz menor diversidade de fonemas. Isso diz respeito à direcionalidade da "lei" discutida acima. Deixando de lado as críticas na seção anterior e aceitando que a correlação de diversidade / correlação de fonemas funcione para o tamanho da população paleolítica e que existe a direcionalidade implícita, como exatamente a história deveria funcionar? Claramente, a redução da diversidade de fonemas deve levar algum tempo. A Colônia da Baía de Plymouth, de repente, não falou uma variedade de inglês com menos fonemas, simplesmente porque eles migraram para o Novo Mundo. Se eles continuassem sendo uma colônia isolada e pequena por muitas gerações, talvez eles pudessem ter acabado dessa maneira. A questão é então quanto tempo se espera que isso aconteça. A maioria das pequenas línguas hoje são faladas por grupos de pessoas que vivem muito perto de grupos que falam outras pequenas línguas: Papua Nova Guiné é um bom exemplo. Nesses casos, as populações não têm muito espaço para crescer, sem conquistar seus vizinhos. Presumivelmente, no Paleolítico, não haveria vizinhos por perto para qualquer grupo migratório, então não se pode esperar que esse grupo cresça em tamanho uma vez que se estabeleceram em uma nova área? Então, se isso acontecer, não se espera que haja menos redução no estoque de fonemas?

Eu acho que uma afirmação tão surpreendente como a de Atkinson (mesmo que esteja em consonância com a história comummente considerada fora da África envolvendo migrações começando em torno de 70-50K da BP) requer um modelo cuidadosamente articulado e não acredito que Atkinson apresenta qualquer mecanismo pelo qual essas possíveis reduções em série no tamanho do inventário foram realizadas.

O sinal

Atkinson apresenta uma série de argumentos em resposta a revisores anteriores em apoio à idéia de que se pode esperar ver um "sinal" durante um período tão imenso.

No entanto, permaneço cético. Certamente há casos de reduções razoavelmente maciças nos tamanhos de estoque de fonemas dentro de apenas alguns milhares de anos. Um exemplo claro vem do Austronesian. A reconstrução de Proto-Austronesian de Blust tem na ordem de 30 fonemas (mais se contamos diptongos). Se assumirmos algo como 5.000 anos entre a origem do Austronesian em Taiwan e as línguas modernas, verificou-se uma redução maciça no número de cerca de 30 (que também é aproximadamente correto para as línguas modernas, como o Malay) até 13 para o Hawaiian ou 11 para o noroeste de Mekeo. E isso é em 5.000 anos, o que é menos de 10% do período de tempo que Atkinson está falando.

É verdade que este exemplo particular está de acordo com a hipótese de efeitos de fundadores em série, uma vez que os tamanhos de estoque de fonemas diminuíram. Mas não está de acordo com a idéia de que existe algum tipo de estabilidade dentro das famílias de idiomas em tais períodos de tempo, e muito menos os períodos de tempo que Atkinson está falando. É provável que tal variação adicione muito ruído ao sinal.

Outros problemas

Um ponto técnico que precisa ser esclarecido é que os dados sobre os inventários de vogais, consoantes e tonos que Ian Maddieson fez para o WALS não dão contagens reais, mas variam. Por exemplo, para as consoantes, só nos damos informações sobre se o idioma possui um inventário pequeno, moderadamente pequeno, médio, moderadamente grande ou grande, interpretado assim:

Pequeno:       6-14
Moderadamente pequeno: 15-18
Médio:	19-25
Moderadamente Grande: 26-33
Grande: 34 ou mais
Uma situação semelhante é válida para vogais e tons. A Atkinson tem acesso a dados que não conheço? Se assim for, seria bom saber mais detalhes sobre esses dados. Mas se a Atkinson estiver usando os dados que qualquer pessoa pode baixar a partir do site da WALS, seria bom esclarecer que ele não possui as contagens de fonemas reais, apenas variações aproximadas. Eu de alguma forma sinto falta de tal esclarecimento?

Não tenho certeza de que isso afete os resultados, mas pode.

RESUMO

A tese de Atkinson é impressionante, mas, como eu disse acima, tais conclusões impressionantes exigem um apoio impressionante e acredito que o documento em sua forma atual não oferece suporte suficiente.