Como representamos os sentidos de palavras?
Experimentos e estatística ajudam o linguista a entender essa questão
Ao pensar sobre o trabalho de um linguista, você provavelmente imagina alguém que estuda um ou mais idiomas específicos, e que passa o dia numa biblioteca. No entanto, há alguns tipos específicos de linguistas que passam boa parte de seu tempo em outro ambiente: o laboratório. Muitos linguistas não estudam uma língua específica, mas tentam entender como a capacidade para linguagem que todo humano tem se estrutura e se desenvolve. Para isso, eles costumam fazer experimentos (sim, em laboratório!) para responder algumas perguntas como “de que maneira um bebê aprende a falar?”, “por que os humanos falam e outros animais não?” ou “o que acontece na nossa mente quando ouvimos uma palavra?”.
Embora existam outras perguntas na linguística que dependam de experimentos em laboratório, essas três são um pequeno exemplo dos tipos de questões que tiram o sono dos psicolinguistas, um tipo de linguista que se preocupa com as relações entre a linguagem e mente. Vamos pegar a terceira dessas perguntas: o que acontece na nossa mente quando ouvimos uma palavra?
Um experimento para testar a relação entre as palavras
Se você ouvir “café”, talvez você se lembre de leite, pão, café-da-manhã, mas dificilmente pensará em um pente ou uma piscina. Nós sabemos que isso acontece porque, se pedirmos para alguém listar as palavras associadas a “café”, geralmente percebemos essas tendências.
No entanto, o psicolinguista está interessado no que acontece na sua mente no exato momento em que você ouve uma palavra, mesmo antes de ter tempo de pensar conscientemente sobre ela. Como podemos testar isso? Uma maneira bastante simples é fazer um experimento de decisão lexical. Funciona assim: você diz a uma pessoa que ela vai ler algumas palavras no computador. Depois de ler, ela tem que responder o mais rápido possível, apertando um botão, se aquela é ou não uma palavra que existe. A pessoa vê algumas palavras que existem, como CAFÉ, e outras pseudo-palavras que o linguista inventou, como DULONTO. O truque aqui consiste no seguinte: enquanto alguns voluntários vão ler a palavra CAFÉ logo depois de ter lido a palavra “leite”, outros lerão CAFÉ logo depois da palavra “pente”. A Figura 1 mostra como isso é feito: numa primeira tela lê-se a palavra relacionada ou não (“leite” ou “pente”) e logo na sequência lê-se aquilo que o participante tem que decidir se é ou não uma palavra.
O computador registra, em milésimos de segundo (ou milissegundos), o tempo que o participante levou para apertar o botão que dizia que “café” é uma palavra, e aí podemos comparar o tempo de reconhecimento de “café” após a leitura de “leite” e de “pente”. Chamamos de “tempo de resposta” o intervalo entre o momento em que a palavra é exibida e o momento em que o participante aperta o botão. Se de fato as palavras se organizam na nossa mente como uma rede de associações, então a palavra “café” já estará um pouco mais ativada após ler “leite”, e será mais fácil e rápido reconhecê-la. Em outras palavras, o tempo de resposta será menor.
O psicolinguista está interessado no que acontece na sua mente no exato momento em que você ouve uma palavra, mesmo antes de ter tempo de pensar conscientemente sobre ela
De fato, desde a década de 70 vários estudos mostraram que é esse o caso: as pessoas reconhecem muito mais rápido uma palavra se, antes dela, é apresentada uma outra palavra relacionada. Esse fenômeno, conhecido como priming, é a base de muitos estudos em psicolinguística, e devido à sua importância precisamos ter boas maneiras de analisar os resultados dos nossos experimentos. E, acredite, muita coisa pode dar errado quando fazemos um experimento para entender como o ser humano funciona!
Problemas ao fazer experimentos sobre a linguagem
Comecemos com uma pergunta clássica quando trabalhamos com experimentos: como saber que o tempo de resposta de um grupo A (as palavras em situação de priming) é menor que o tempo de resposta de um grupo B (as palavras sem priming)? Vamos supor que no grupo com priming, o tempo médio de leitura de “café” seja 890 milissegundos, e no grupo sem priming esse valor também seja de 890. Ora, dá para cravar que não houve diferença alguma. Não temos evidência de que nosso léxico se organiza como uma rede de associações. Mas e se houver uma diferença de um milésimo de segundo, 889 x 890? Bem, é uma diferença pequena, talvez seja só coincidência… E se a diferença for de dois milésimos? De três? Quatro ou cinco? Quando, afinal, posso considerar que existe uma diferença na média dos tempos de resposta desses dois grupos?
Como outras ciências experimentais, a psicolinguística se baseia em testes estatísticos para avaliar os resultados de seus experimentos. É por isso que um psicolinguista precisa entender um pouco de estatística, ou então se aliar a um estatístico para conseguir fazer uma boa análise de seus dados (não é coincidência que os dois autores deste texto sejam uma linguista e um estatístico). Mas há ainda outros problemas que o psicolinguista enfrenta quando faz um experimento. Sigamos.
Cada ser humano é único e terá uma experiência única com a linguagem
Se você leu esse texto até aqui, pode estar se perguntando “Ok, mas e se uma pessoa tem um cachorro chamado ‘Café’? Ela pode associar café às palavras ‘animal’ ou ‘cachorro’!”. Essa de fato é uma questão importante, porque cada ser humano é único e terá uma experiência única com a linguagem. A primeira autora deste texto, por exemplo, talvez tenha uma rede associativa muito forte entre “café” e “avô”, pois seu avô plantava café no quintal. Ela também associa café a galinha, pois lembra que os pés de café de seu avô ficavam ao lado do galinheiro. No entanto, é pouco provável que a maioria das pessoas faça essa associação. Ou seja, cada pessoa construiu sua língua de maneira única, então como um experimento geral pode dar conta de tanta diferença que existe entre os falantes?
Usando estatística para resolver problemas da linguística
Em um artigo que publicamos na Revista da Associação Brasileira de Linguística, defendemos que um modelo estatístico específico – chamado de Modelo Linear de Efeitos Mistos – pode nos ajudar a resolver esse problema. Esse modelo considera em seus cálculos algumas variações que não podem ser controladas pelos pesquisadores, como características próprias dos participantes ou mesmo alguns aspectos das palavras usadas – pode ser que “café” seja reconhecido mais rapidamente que “pressa” pois designa algo que é concreto, por exemplo. As palavras escolhidas para o experimento também são uma fonte de variação e ruído que o pesquisador tem dificuldade de controlar. Como consequência, os resultados desse tipo de modelo são mais precisos em identificar quando realmente existe uma diferença entre dois grupos. Ele é capaz de “deixar de lado”, por assim dizer, toda variação que é única de cada palavra ou participante, e assim ajudar a entender como as pessoas, na média, representam mentalmente os significados linguísticos.
[O Modelo Linear Misto] considera em seus cálculos algumas variações que não podem ser controladas pelos pesquisadores, como características próprias dos participantes ou mesmo alguns aspectos das palavras usadas
Aqui já conseguimos entender de onde vem o termo “Misto” do nome desse modelo: ele é assim chamado porque controla tanto efeitos fixos – como o priming, que é controlado pelo pesquisador – quanto efeitos aleatórios, sobre os quais o pesquisador não tem muito controle (características dos participantes e das palavras escolhidas).
Embora aqui tenhamos focado em um experimento de priming, esse modelo pode ser aplicado a experimentos que investiguem muitos outros fenômenos relacionados à linguagem, como o modo pelo qual adquirimos linguagem, como construímos representações das estruturas das frases da nossa mente, como representamos mentalmente uma narrativa, o que acontece nas representações mentais linguísticas de quem fala mais de uma língua… Todas essas questões são o centro da atenção de muitos linguistas, mas é impossível estudá-las sem um bom modelo estatístico para analisar dados de experimentos.
Para saber mais
GODOY, M. C.; NUNES, M. A. Um comparação entre ANOVA e modelos lineares mistos para análise de dados de tempo de resposta. Revista da ABRALIN, v. 19, n. 1, p. 1-23, 17 jul. 2020.