Os impasses da etimologia: o caso de “fidalgo”

Um dos grandes entraves à pesquisa etimológica de cunho científico é a larga tradição que temos no exercício de uma etimologia “achista”, feita por gramáticos e dicionaristas que pouco ou nada sabem da verdadeira ciência etimológica. Esses autores costumam dar explicações simplistas, remontando todas as palavras ao latim, não importa se foram herdadas ou nos chegaram por via culta, não importa se vieram diretamente do latim ou por intermédio de outra língua. Além disso, substituem frequentemente a etimologia propriamente dita pela decomposição morfológica da palavra, como se todos os vocábulos portugueses tivessem nascido aqui mesmo, no português, por composição ou derivação de outras palavras igualmente portuguesas ou, no máximo, a partir de radicais greco-latinos.

Um exemplo desse desatino etimológico é a palavra “fidalgo”. Basta consultar qualquer dicionário de português que traga informações etimológicas e lá está: “fidalgo”, contração de “filho de algo”. Essa explicação aparece, por exemplo, em Antenor Nascentes (p. 255). Isso nos faz crer que em algum momento da história do português, a expressão “filho de algo” sofreu sucessivas síncopes, nessa sequência: filho de algo > filho d’algo > filh’ d’algo > fi’ d’algo > fidalgo. Tudo parece muito lógico à luz da própria história fonética do português, cheia de síncopes de vogais e consoantes. (Síncope é o desaparecimento de um fonema em meio de palavra.) Além disso, “algo” significava “riqueza” no português medieval, o que parece fazer de “filho d’algo” uma expressão tipicamente portuguesa.

Só que há um complicador nessa história: o espanhol registra hijo dalgo no poema épico El Cid, do século XI, anterior portanto aos primeiros registros em português. E o dicionário etimológico espanhol Corominas, um dos mais completos do mundo, registra fidalgus num documento de cerca de 1197, o Fuero de Castroverde (p. 178).

Será então que o português e o espanhol cunharam ambos a mesma expressão “filho de algo” (isto é, filho de família rica e nobre) independentemente um do outro? E, mais surpreendente ainda, ambos sincoparam e aglutinaram suas respectivas expressões, chegando aos resultados idênticos fidalgo e hidalgo? Qualquer pessoa medianamente inteligente veria que tal explicação é inverossímil demais para se sustentar.

Na verdade, fidalgo não vem de filho d’algo, mas sim do espanhol hidalgo. Ou seja, foi em espanhol que a locução hijo de algo surgiu (o próprio significado de algo como “riqueza, nobreza” nasceu no espanhol e foi importado pelo português, o que pode ser provado pela datação das ocorrências dessas acepções em cada uma das línguas).

Pois bem, algo (no sentido de “riqueza”), hijo de algo, hijo dalgo e hidalgo são todas palavras espanholas emprestadas ao português com a respectiva tradução de hijo por “filho”. O próprio Corominas, muito mais detalhado e embasado que os dicionários etimológicos do português, menciona esse fato.

Esse é apenas um exemplo de por que é tão importante e urgente elaborarmos um dicionário etimológico da língua portuguesa calcado em premissas e métodos científicos, que busque o étimo e a origem das palavras de nossa língua por meio de investigação empírica e não através da mera consulta a outras obras, igualmente equivocadas, ou do achismo de seus autores. É isso que dá a nós, pesquisadores do NEHiLP-USP – Núcleo de Apoio à Pesquisa em Etimologia e História da Língua Portuguesa da Universidade de São Paulo (https://nehilp.prp.usp.br) –, a convicção de que estávamos no caminho certo e realizando um trabalho importantíssimo, que é a elaboração do DELPo – Dicionário Etimológico da Língua Portuguesa. Infelizmente, como mencionei em meu post anterior, semana retrasada, esse projeto está parado, sem data para voltar. Pior ainda, sua página no site do NEHiLP, na qual já era possível fazer algumas consultas, está fora do ar. Assim caminha a pesquisa científica no Brasil.

Como os dicionários etimológicos falham

Dicionários etimológicos do português explicam o substantivo concreto mancebo, “rapaz, moço” e também “amásio”, como procedente do latim vulgar mancipiu (latim clássico mancipium), bem como afirmam que o verbo amancebar-se é derivado de mancebo. Mas essa explicação é pouco convincente por duas razões. Em primeiro lugar, mancipium é substantivo abstrato, derivado de manceps, mancipis, “comprador, fiador” (literalmente, aquele que toma em suas mãos: lat. manus, “mão” e capere, “tomar”). Mancipium significa, portanto, “qualidade de quem é comprador ou fiador”, isto é, “compra, arremate, fiança”. Em segundo lugar, não há nenhuma ocorrência, mesmo em latim vulgar, da palavra mancipiu como substantivo concreto, designando pessoa.

O que ocorreu de fato é que mancebo derivou de amancebar, e não o contrário. Esse verbo amancebar, que os mesmos dicionários etimológicos dão como proveniente de mancebo por formação parassintética (isto é, acréscimo do prefixo a‑ e do sufixo de infinitivo ‑ar), na verdade, provém por evolução fonética regular do latim emancipare, “emancipar, libertar, deixar de tutelar”, que significava, dentre outras coisas, “conceder a um filho poderes civis quando este completasse a maioridade”. Portanto, manceps e emancipatus queriam dizer “maior de idade”. (No direito civil brasileiro temos o mesmo termo emancipado para designar o indivíduo que atingiu a maioridade ou a quem, sendo menor, a justiça concedeu as prerrogativas de cidadão adulto.)

Em resumo, manceps deu emancipare, que passou por herança ao português amancebar (emancipar é latinismo importado bem mais tarde), o qual, por sua vez, originou mancebo por derivação regressiva. Este, sim, produziu o derivado mancebia, “estado ou condição de mancebo”, isto é, “concubinato”. Ou seja, o que mais provavelmente se deu foi o contrário do que alguns etimólogos afirmam.

Esse exemplo mostra que os (poucos) dicionários etimológicos do português nem sempre são muito confiáveis, principalmente em se tratando das datações de primeira ocorrência do vocábulo, que, em alguns casos, pecam por coisa de vários séculos. Mas também por étimos “chutados”, como o do exemplo citado aqui.

É por isso que o NEHiLP (Núcleo de Apoio à Pesquisa em Etimologia e História da Língua Portuguesa), ligado à Pró-Reitoria de Pesquisa da Universidade de São Paulo, no qual atuo como pesquisador, decidiu anos atrás criar o Projeto DELPo – Dicionário Etimológico da Língua Portuguesa. Um dicionário totalmente on line, atualizável a todo momento, elaborado com o máximo rigor científico e as ferramentas tecnológicas mais modernas, algumas das quais desenvolvidas por nós mesmos, e de acesso totalmente livre, sem custo algum. Um dicionário que pretende sanar todas as falhas dos atuais dicionários etimológicos e dar ao nosso idioma uma obra de qualidade comparável aos melhores dicionários etimológicos do mundo: os de língua inglesa, francesa, espanhola, italiana e alemã.

Infelizmente, esse projeto está há meses parado por falta de verba, situação agravada ainda pela pandemia de covid-19. E assim caminha a pesquisa científica no Brasil. Se falta dinheiro até para pesquisas sobre vacinas que podem salvar milhares de vidas, que dizer de pesquisas sobre a origem das palavras?

Pequeno Dicionário Tabi-Português Português-Tabi

Quinta-feira passada, publiquei no meu canal do YouTube uma entrevista que fiz com um jovem paquistanês, agora naturalizado brasileiro, que aqui chegou em 2015 sem saber falar uma palavra de português e que, tendo morado na minha casa de 2016 até 2019, me permitiu acompanhar o seu processo de aprendizagem do nosso idioma, ocorrido basicamente no âmbito da minha família, já que os contatos externos que ele tinha, pelo menos nos primeiros meses, eram com conterrâneos seus radicados no Brasil.

Aftab, cujo apelido é Tabi, e que hoje goza o status extraoficial de meu afilhado, veio ao Brasil a trabalho, trazido por uma indústria farmacêutica indiana exatamente no ano em que eclodiu nossa pior crise econômica de todos os tempos – a famosa crise financeira da Dilma e do Mantega. Como resultado, Tabi se viu desempregado seis meses depois, quando a farmacêutica indiana resolveu encerrar suas atividades no Brasil. Ele, que até então morava num hotel pago pela empresa, viu-se obrigado a ir viver numa república de imigrantes do Oriente Médio, onde só se falava árabe, hindi, urdu e punjabi.

Mas qual a relação desse rapaz comigo? É que ele é irmão de uma ex-colega de colégio da minha esposa, uma paquistanesa que hoje vive na Alemanha, mas cuja família inteira morava no Brasil vinte e tantos anos atrás. Aliás, o próprio Tabi é nascido em São Paulo, embora tenha sido registrado como paquistanês, de modo que sua recente naturalização não deixou de ser a correção de um equívoco do destino.

O fato é que essa ex-colega pediu à minha esposa que recebesse Tabi no Brasil, já que ele não conhecia ninguém aqui. Mais do que recepcioná-lo, ela acabou tornando-se uma assessora desse meu agora afilhado, acompanhando-o a cartórios, consulado, polícia federal e demais instâncias burocráticas que um imigrante precisa visitar.

Quando o dinheiro acabou e ele não pôde mais pagar pela república, nos vimos na obrigação moral e já também afetiva de acolhê-lo em nossa casa. E foi nessa imersão num lar onde só se fala português que ele foi pouco a pouco adquirindo a nova língua.

Não sou psicolinguista nem especialista em aquisição de segunda  língua, portanto o processo que testemunhei foi muito mais uma vivência empírica do que a testagem e confirmação de conhecimentos teóricos que não tenho.

Mas pude perceber alguns fatos interessantes. Primeiro, que ele sofria uma certa influência da língua inglesa, um dos idiomas oficiais de seu país. Por isso, às vezes algum termo inglês pipocava em meio à sua fala. Depois vim a saber que o uso de palavras inglesas é prática comum no urdu, língua pátria do Paquistão. Outro fato curioso é que ele associava palavras novas a outras já conhecidas e por vezes confundia termos parecidos, trocando um pelo outro.

Mas o aspecto mais hilário e peculiar de seu esforço para falar português era a invenção de termos, o que me fez começar a anotá-los e elaborar um pequeno dicionário Tabi-português português-Tabi. Uma breve amostra desse “dicionário” (na verdade, um glossário) é o que eu lhes dou a seguir. Divirtam-se! Ah, e não deixem de assistir ao vídeo, hein!

  • acender → acesar;
  • açúcar mascavo → açúcar mascado (que nojo!);
  • água sanitária → água cemitéria;
  • alcachofra → cachorra;
  • alface → alfaço;
  • alumínio → alimúnio;
  • antidepressivo → depreciativo;
  • anti-impacto → antipático;
  • antirraiva → antirruiva;
  • Aracaju → Acaraju;
  • Armarinhos Fernando (uma rede de lojas em São Paulo) → Armênios Fernânios;
  • arroz com passas → arroz com Páscoa;
  • arroz parboilizado → arroz parabolizado;
  • até → atita;
  • babão → babaqueiro;
  • barulho → balu, barulu;
  • batata palha → batata palhada;
  • Bauducco (marca de panetone) → bugudutucu;
  • bisteca → biscuíta;
  • bolacha → borracha;
  • brócolis → Brooklins;
  • camada → camisinha;
  • cara de pau → cara de pão;
  • carambola → caramba rola;
  • chorão → chorento;
  • churrascaria → churrasqueira;
  • cilindrada → celindário;
  • coco → cocô;
  • colorau → coral;
  • configurar → confurigar;
  • costurar → escuturar;
  • criativo → crioso;
  • dívida → dúvida;
  • dúvida → dívida;
  • engenheiro → engenérico;
  • entupir → entupidar;
  • esmola → mola;
  • esteira → estrela;
  • estuprar → estupidar;
  • esvaziar → desvazar;
  • fazendeiro → fazendador;
  • feirante → barraqueiro;
  • f*dido → fudado;
  • folheto → foelho;
  • freguesia → fressiguesa;
  • fumaça → fumasca;
  • funerária, funilaria → funelária;
  • golpista → golpeiro;
  • grana → grama;
  • inventivo → inventoso;
  • Itubaína (marca de refrigerante) → Tabuína;
  • jabuticaba → jabaticuíba;
  • Jardim Cambará (bairro de São Paulo) → Jardim Caramba;
  • Jardim João XIII (outro bairro de São Paulo) → Jardim João Xixi;
  • leilão → lilá;
  • leite fermentado → leite Fernando;
  • leite Ninho → leite Nino;
  • lixa → lixeira;
  • lua → luva;
  • madrasta → madastrada;
  • máquina → maquina (provável influência do inglês machine);
  • maracujá → macurujá;
  • margarina → margarita;
  • massa → maçã;
  • mijão → xixeiro;
  • noz sem casca → noz sem casaca;
  • oftalmo → ofotônomo;
  • Otacílio Tomanik (avenida de São Paulo) → Tomacilo;
  • pão de forma → pão de forno;
  • papel higiênico → papel ingenético;
  • paralelepípedo → parelepíparo;
  • patinador → patineiro;
  • pepino → pepinho;
  • pesquisa → pesquisita;
  • pizza margherita → pizza de margarina;
  • polipropileno → popireoplano;
  • por exemplo → for exemplo (influência do inglês);
  • preguiça → pirissiguese;
  • presunto Seara → presunto Ceará;
  • psicopata → pescopata;
  • quiabo → tiabo;
  • quilômetro → quilomitro (influência do inglês);
  • recusar → cruzar, recruzar;
  • Rivotril (calmante) → Rotivil;
  • salada de frutas → fruta de salada;
  • sambódromo → sabadôrnomo;
  • serralheiro → ferralheiro;
  • sobremesa → sobresma;
  • sortudo → sorteado;
  • Sukita (refrigerante) → sicuta;
  • tampa → tâmpada (provável influência de lâmpada);
  • tapete → capete (influência do inglês carpet);
  • taxista → taxeza;
  • temperatura → tempura;
  • terno → térmica;
  • tigela → tijolo;
  • tuberculose → tuberculatose;
  • uva passa → uva páscoa, uva pasta;
  • vácuo → vacume (influência do inglês vacuum);
  • varal → verão, varão.

Entre o Céu e o Inferno

Praticamente todas as religiões e tradições míticas consideram a existência de um plano superior à vida terrena, habitado pelos deuses e eventualmente pelas almas bondosas, e um plano inferior, dominado por divindades maléficas, para onde vão as almas dos impuros, dos iníquos e também as dos adeptos de outras religiões.

Essa visão de que há três níveis de existência, da qual os vivos ocupam o intermediário, é uma constante nas mitologias e demais narrativas fundadoras da cultura. Em termos da nossa tradição judaico-cristã, há uma Terra, um Céu e um Inferno (o Cristianismo considera uma quarta instância, o Purgatório).

A palavra “céu” proveio do latim caelum ou coelum, por sua vez descentente de um hipotético indo-europeu *kailom, gênero neutro do adjetivo *kailos, “íntegro, intacto, puro” e, por extensão, “sagrado”. Essa mesma raiz indo-europeia deu o germânico *hailaz, e daí o inglês whole (inteiro) e o alemão heil (são, sadio). Um derivado germânico *hailigaz gerou dentre outras línguas o inglês holy e o alemão heilig, ambos significando “santo, sagrado”. E o verbo germânico *hailjan, “tornar íntegro, tornar inteiro” produziu o inglês heal e o alemão heilen, ambos com o sentido de “curar”. Ou seja, curar uma pessoa é torná-la íntegra novamente (pois a doença é uma forma de desintegração do organismo). E sagrado é aquilo que está intacto, afinal muitas culturas associam o tocar ao conspurcar, à profanação. Essa é, por sinal, a raiz da metáfora em que a virgindade feminina é um estado de pureza que o contato sexual macula (e daí a visão do sexo como impureza). Aliás, as palavras latinas intactus e integer, que deram respectivamente “intacto”, “inteiro” e “íntegro” em português provêm da união do prefixo negativo in- com radicais do verbo tangere, “tocar”. Logo, intacto, íntegro ou inteiro é aquilo que não foi tocado. E, por conseguinte, “céu” é, literalmente, o lugar do sagrado, bem como o espaço intocável, o que mostra seu caráter místico já na Pré-História.

As palavras germânicas para “céu” (dentre as quais heaven em inglês e Himmel em alemão) remetem à raiz indo-europeia *kemen (abóbada), mostrando uma visão mais física e menos espiritual do firmamento.

Já “inferno”, do latim infernum, “lugar baixo”, provém de infer (de “inferior”, “ínfimo”, etc.), do indo-europeu *ndher, que também resultou no inglês under e no alemão unter (embaixo, sob). O inglês hell e o alemão Hölle remontam ao indo-europeu *k’el, “encobrir”, donde o latim celare “esconder” e seu derivado occultus, “oculto”.

Quanto a “terra”, nome do nosso planeta e da matéria de que ele é feito, a origem está na raiz indo-europeia *ters, “seco”, de que também provém o latim torrere (torrar, isto é, secar pelo fogo), torridus (tórrido) e tostus (tostado). Da mesma raiz vieram o inglês thirst e o alemão Durst, “sede, secura na boca”. Portanto, a terra era originalmente a parte seca da superfície do planeta, por oposição aos oceanos. Por uma extensão de significado, passa a designar todo o planeta e, na visão geocêntrica dos antigos, o centro do Universo, único lugar com vida e, portanto, com seres dotados de alma, a qual, sendo boa, subiria para a abóbada celeste, morada dos deuses, e, sendo má, desceria às profundezas do inferno, no interior da própria Terra – um lugar muito quente, como o provam as lavas vulcânicas que, de quando em vez, emergem à superfície.

Finalmente, o Purgatório cristão é o lugar onde se purgam as almas. E o que é purgar? É tornar puro (o latim purgare provém de *purigare, formado de purus + agere, isto é, “fazer puro, conduzir à pureza”). Não por outra razão, os laxantes também são chamados de purgantes, já que fazem o corpo expelir as impurezas que causam mal-estar.