Coluna Álvaro Machado Dias na Folha de São Paulo
Competência verbal do GPT-4 é o elefante na sala da linguística
Apesar de Chomsky refutar semelhanças entre cérebro e IA, sua teoria se aplica ao processamento linguístico de máquina.
Linguagem é o que intermedeia a relação entre as ideias e os sons articulados. A ciência que a estuda é a linguística —e, quando se fala nela, Noam Chomsky é o nome mais lembrado.
Também, pudera, não apenas ele revolucionou o status quo, a partir de uma visão mentalista do assunto, em oposição ao comportamentalismo vigente nas décadas do miolo do século passado, como teve papel central na formação da ciência cognitiva, que é o campo que hoje engloba ciência da computação, psicologia, neurociências, biologia, linguística e matemática.
A área inaugurada por Chomsky se chama linguística gerativa. Ela surge com proposições formais na década de 1950 e absorve acréscimos até o começo dos anos 1990, quando o movimento se inverte e a teoria passa a rumar em direção à simplicidade.
Os gerativistas priorizam as estruturas sintáticas (forma) sobre a semântica (sentido) na determinação do funcionamento da linguagem e em sua aquisição. Segundo dizem, é inviável construir teorias linguísticas primariamente semânticas porque a classificação dos trechos do discurso em função de seus referenciais desmorona à luz de palavras de uma classe gramatical que, em termos do seu sentido, podem ser mais bem acomodadas em outra. Por exemplo, terremoto é um substantivo que se refere a “um fenômeno envolvendo vibrações físicas da Terra, as quais podem durar de segundos a minutos”, ou seja, diz respeito a uma ação.
Há teorias alternativas que questionam isso, afirmando que categorias como substantivo e verbo não são suficientemente abrangentes, mas que é possível descrever o funcionamento da linguagem primariamente pelo prisma dos sentidos, a partir de novos entendimentos desses.
Rechaçando-as, os gerativistas pressupõem que o aspecto central da linguagem é a sua estrutura formal, a qual se manifestaria em nível subconsciente por todos os falantes e determinaria limites para a variabilidade linguística, independentemente da cultura, levando ao surgimento de uma verdadeira gramática universal: um sistema de categorias, mecanismos e limitações, compartilhado por todas as línguas humanas (Chomsky, 1986, p. 3).
Entre os princípios universais está o da recursividade, que é a capacidade de produzir infinitos períodos adequadamente estruturados e o de que toda frase é organizada em torno de um elemento central, por exemplo, frases verbais, em torno de verbos; frases nominais, em torno de substantivos etc. Paralelamente, se pressupõe que cada língua apresenta seus parâmetros específicos, rapidamente assimiláveis posto que sublimitados pelos princípios universais.
Chomsky diferencia assim as línguas e os dialetos que adotamos, os quais chama de e-linguagem, da linguagem como capacidade de gerar e entender os mais variados períodos e de incorporar os parâmetros gerais que regem as diferentes línguas, o que ele chama de i-linguagem. Aqueles podem incluir regrinhas arbitrárias, determinadas de maneira contingente, que contradizem as intuições da i-linguagem e precisam ser decoradas para que possam ser adequadamente aplicadas, em franca contradição com o que se aplica à linguagem de maneira mais ampla.
“(Se um naturalista marciano nos visitasse) notaria que a faculdade que medeia a comunicação humana é diferente da de outras criaturas; ele também notaria que a linguagem humana está organizada como um código genético — hierárquica, gerativa, recursiva e virtualmente ilimitada em relação ao escopo do que pode expressar” (Hauser, Chomsky e Fitch, 2002, p. 1569).
A ideia de que esses princípios são organizados como um código genético tanto significa que eles dão origem a incontáveis fenótipos linguísticos quanto possui um aspecto mais literal: Chomsky parte da premissa de que surgiram em função de mutações genéticas de efeito saltatório, radical, em oposição à ideia de evolução gradual, a qual tende a nortear os raciocínios evolucionários atuais.
Segundo o autor, essas mutações teriam dado origem a um módulo cerebral específico —um verdadeiro órgão da linguagem— que estaria por trás da facilidade aquisitiva das crianças, mesmo em ambientes caracterizados por franca pobreza de estímulos. Essa tese leva à proposição de que o cérebro é fortemente modular, sendo o processador de linguagem um desses módulos, o qual seria independente da cognição social, da memória operacional e de outras competências.
Velocidade de aquisição da fala articulada na primeira infância, baixa eficácia dos treinamentos para acelerar esse processo e dificuldade generalizada dos falantes de diferentes idades para realizar operações verbais que transgridam os princípios da gramática universal são argumentos comuns no respaldo à tese de que a i-linguagem é inata, emergindo diretamente da ativação do módulo cerebral linguístico, que teria surgido de maneira súbita, na história recente da espécie.
EVIDÊNCIAS SOBRE O PROCESSAMENTO DE LINGUAGEM NO CÉREBRO HUMANO
Um estudo de 2003 expôs falantes do alemão a frases em italiano e japonês, bem como a variações das mesmas, forjadas para violar os princípios da gramática universal. Ou seja, em nenhuma das condições os participantes conseguiam entender o conteúdo; a única intuição possível era sobre a forma.
Com isso, foi demonstrado que a área do córtex pré-frontal conhecida como Broca (BA44), a qual é tipicamente associada ao processamento linguístico, é ativada pelas frases que obedecem aos preceitos chomskyanos, independentemente do entendimento do que está sendo dito, mas não pelas frases que contradizem esses preceitos.
“Nossos resultados indicam que o giro inferior esquerdo está centralmente envolvido na aquisição de novas competências linguísticas, mas isso apenas se dá quando a linguagem segue os preceitos da gramática universal. Os aspectos anátomo-funcionais da área de Broca nos permitem especular que a sua diferenciação possui grande significância evolucionária, diferenciando humanos de outros primatas” (Musso et al., 2003, p. 779).
No mesmo estudo, os autores destacam que um dos genes responsáveis por essa diferenciação do módulo linguístico seria o FOXP2, “alvo de seleção durante a evolução recente da espécie humana” (p. 779), o que completaria o quebra-cabeças chomskiano. Essa conclusão alinha-se a um famoso experimento de 2009 sobre a origem saltatória da linguagem humana.
Existem outras pesquisas apontando na mesma direção, mas, fato é que a tese da gramática universal no cérebro humano está longe de ser consensual. Pesam contra ela evidências de que as áreas ligadas ao processamento verbal possuem diversas outras funções e que os genes associados não se encaixam no padrão saltatório que Chomsky preconiza nem agem exclusivamente sobre a linguagem.
Por exemplo, uma das maiores meta-análises já realizadas concluiu que a área de Broca é fundamental na memória operacional, capacidade imitativa e outras, o que igualmente se aplica às demais áreas cerebrais envolvidas no processamento linguístico.
“A participação da área de Broca em uma ampla variedade de funções (de imitação à compreensão de ações, memória operacional e inibição impulsiva) é mais que coincidente ou misteriosa; ela é explanatória, respondendo por várias das funções ligadas à linguagem no cérebro infantil. Isso não significa que estejam totalmente desenvolvidas no surgimento da linguagem. Ao contrário, algumas funções no domínio específico da imitação, memória operacional e inibição precedem a aquisição da linguagem, mas seguem se desenvolvendo em paralelo, durante toda a infância” (Müller, 2009, p. 8).
Mais recentemente (2018), um estudo que agregou múltiplas meta-análises concluiu que as áreas cerebrais ativadas no processamento linguístico precedem o surgimento da espécie, tendo outras funções em roedores e outros. “Nossos achados mostram que a linguagem se utiliza de sistemas de propósito geral e o faz de formas sistemáticas, o que é consistente com princípios gerais biológicos e evolucionários (Hamrick, Lum e Ullman, 2018, p. 1490).
Conclusões semelhantes aplicam-se a genes como o FOXP2, que é expresso em múltiplas áreas do cérebro (como também fora dele), possui funções gerais no neurodesenvolvimento e é encontrado em espécies que nos precedem, não cabendo no papel de introdutor da linguagem.
Sem desmerecer a importância da sintaxe, a tese de que existe um módulo cerebral exclusivamente dedicado a ela, o qual surgiu em um salto evolucionário, é questionável.
Para ler mais, acesse o artigo aqui: https://www1.folha.uol.com.br/colunas/alvaro-machado-dias/2023/04/competencia-verbal-do-gpt-4-e-o-elefante-na-sala-da-linguistica.shtml