Podia a Wikipédia ser igual em todas as línguas?

Procurar
Close this search box.
Imagem da Wikipédia
Wikipédia via Luke Chesser/Unsplash

Podia a Wikipédia ser igual em todas as línguas?

A democracia precisa de quem pare para pensar.

Num ambiente mediático demasiado rápido e confuso, onde a reação imediata marca a ordem dos dias, o Shifter é uma publicação diferente. Se gostas do que fazemos subscreve a partir de 2€ e contribui para que tanto tu como quem não pode fazê-lo tenha acesso a conteúdo de qualidade e profundidade.

O teu contributo faz toda a diferença. Sabe mais aqui.

Em que consistiria esta Wikipédia Universal, e como funcionaria? Como comunicariam estas 300 comunidades com tantas línguas diferentes e onde nem todos falam ou escrevem em mais do que a sua língua nativa?

O sonho de uma Enciclopédia Universal ganhou um novo ímpeto há 20 anos com a criação da Wikipédia. Depois de uma criação quase acidental — enquanto projecto de apoio à Nupedia, uma enciclopédia digital escrita por especialistas — a sua rápida expansão e popularidade levou a que a partir da edição inicial, em inglês, novas edições, noutros idiomas, fossem surgindo, havendo agora mais de 300 versões, incluindo a Wikipédia em Português, e a Bikipédia em Mirandês. Cada uma destas Wikipédias tem as suas próprias comunidades que definem as regras, escrevem os artigos e fazem o controlo editorial do site. Uma independência editorial que traz desafios como manter a unidade da enciclopédia, que se quer universal, e manter a identidade e diversidade das comunidades de forma a promover uma maior pluralidade. 

Em que consiste então uma Wikipédia? Quais são as características que definem a sua identidade e distinguem-na de outros sites ou enciclopédias?

Além da plataforma (um site do tipo wiki, que corre com o software MediaWiki e é hospedado pela Wikimedia Foundation), do Logo e a sua licença aberta, a principal distinção que me surge é o modelo de gestão auto-organizado, com uma hierarquia relativamente horizontal. Apesar de alguns princípios editoriais estarem definidos desde pouco depois da sua fundação, tal como o facto que a Wikipédia é uma enciclopédia (sério!) e escrita sobre um ponto de vista neutral, a maioria das suas extensas políticas editoriais e de conduta estão sujeitas a debates, por vezes intensos, pela parte das respectivas comunidades, bem como a reflexão sobre o que da construção da Wikipédia vai resultando.

Em que consistiria esta Wikipédia Universal, e como funcionaria? Como comunicariam estas 300 comunidades com tantas línguas diferentes e onde nem todos falam ou escrevem em mais do que a sua língua nativa? Seria desejável que existisse apenas uma versão da Wikipédia em que cada assunto era tratado exactamente da mesma maneira em todas as línguas? O que seria perdido ao ter uma única comunidade?

Dada a vastidão da Wikipédia (mais de 57 milhões de artigos no total) e a multiplicidade de comunidades (sendo que o número de contribuidores activos pode variar entre um e 40 mil), naturalmente, algumas versões em determinados idiomas divergem mais ou menos da norma. Foi para isso mesmo que alertou um relatório recente da Wikimedia Foundation sobre o estado da Wikipédia em croata. No que pode ser considerado como um teste aos limites do modelo Wikipédia, durante mais de 10 anos, contribuidores (muitos com permissão de https://shifter.pt/wp-content/uploads/2023/04/333930326_6734667403227056_1447582654111296349_n-1.jpgistrador, com capacidade de bloquear outros contribuidores e eliminar páginas) distorceram propositadamente o conteúdo dos artigos, dando-lhe um viés de extrema-direita, abusaram do seu poder, e bloquearam todos os processos tidos como boas práticas em outras comunidade para manter o projecto alinhado com os ideais de pluralidade e neutralidade do movimento. O mesmo relatório propõe então que a comunidade falante de croata se funda com as comunidade bósnias e sérvias que falam variantes da língua servo-croata, tal como existia em 2003 (foram divididas nessa altura), mas este caso permite-nos reflectir além do exemplo concreto.

Num artigo na UNDARK.com de 12 de Agosto deste ano, Yumiko Sato explora este caso e outros, como o da Wikipédia em japonês, para defender que a fusão deveria ser total. Para Sato todas as comunidades linguísticas deveriam fundir-se para criar o que chama de “a soma de todas as Wikipédia”, num jogo de palavras com a visão do movimento Wikimedia que é a de “recolher e partilhar a soma do conhecimento humano”Mas também esta proposta merece ser alvo de reflexão.

Em que consistiria esta Wikipédia Universal, e como funcionaria? Como comunicariam estas 300 comunidades com tantas línguas diferentes e onde nem todos falam ou escrevem em mais do que a sua língua nativa? Seria desejável que existisse apenas uma versão da Wikipédia em que cada assunto era tratado exactamente da mesma maneira em todas as línguas? O que seria perdido ao ter uma única comunidade?

A uma escala mais pequena, esta união de comunidades já existe em algumas versões da Wikipédia. A própria Wikipédia em Português aceita artigos escrito nas várias versões de Português, falado em Portugal, Brasil, PALOPs e Timor-Leste, pré- e pós-Acordo Ortográfico (com algumas restrições). Outras edições, como a inglesa, alemã, francesa, espanhola permitem também várias versões da mesma língua. Nestas comunidades houve necessidade de estabelecer regras para que as versões de cada língua fossem respeitadas, e as versões minoritárias fossem preservadas. Assim, por exemplo, não é possível mudar artigos escritos de acordo com a ortografia no Brasil, para a ortografia de Portugal, a não ser que o artigo seja sobre um assunto de Portugal (uma aldeia portuguesa, por exemplo).

Estas regras foram elaboradas ao longo do tempo, e resultaram de enormes discussões sobre os limites destas restrições, mas efectivamente preveniram a cisão da Wikipédia Lusófona em versões linguísticas como aconteceu com a Wikipédia em croata. Isto pacificou as relações entre editores dos vários países, nomeadamente em relação à ortografia. Contudo, se numa Wikipédia em que as versões linguísticas são obviamente mutuamente compreensíveis esta dinâmica será de mais fácil aplicação, caso a ideia de uma Wikipédia Universal se tornasse realidade, estas discussões seriam muito mais complicadas de realizar e implementar.  

Tecnicamente ainda parecemos estar longe de conseguir algo parecido com esta ideia. A tradução assistida por computador entre línguas melhora a cada ano que passa, mas da minha experiência ainda dá muitos erros, e está limitado a traduções entre poucas línguas, a sua maioria de origem europeia. Na verdade, o mais recente projecto da Wikimedia Foundation (que em rigor são dois) ambiciona criar precisamente uma Wikipédia livre dos constrangimentos da língua, agnóstica em relação a variantes, dialectos, idiomas. Foi proposto em 2020  por Denny Vrandečić, um programador croata, que anteriormente  trabalhava para a Google e um dos desenvolvedores do Wikidata, um outro projecto Wikimedia para dados estruturados legível por humanos e máquinas. Estes projectos, inicialmente denominados WikiLambda (agora Wikifunctions) e Wikipédia Abstracta, usariam os dados estruturados provenientes do Wikidata, incluindo as definições lexicográficas (lexemas) de palavras e expressões, para ajudar a construir artigos enciclopédicos em qualquer língua do mundo.

lexemas: Palavra ou parte de palavra que serve de base ao sentido por ela expresso.

"lexemas", in Dicionário Priberam da Língua Portuguesa [em linha], 2008-2021, https://dicionario.priberam.org/lexemas [consultado em 29-09-2021].

Teoricamente seria possível para um falante de português escrever um artigo enciclopédico na sua própria língua, colocá-lo na Wikipédia Abstracta e ver esse artigo ser “abstraído” para a linguagem com lexemas, e funções que indicam as relações entre esses lexemas. Posteriormente, o artigo já na sua forma “abstracta” poderia ser “concretizado” em qualquer língua suportada pelo sistema (eventualmente todas). Esse conteúdo pode também ser copiado e adaptado para uma das Wikipédia já existentes.

O projecto é ambicioso, mas o seu sucesso depende do sucesso de vários factores. 

As relações lexicográficas para uma determinada língua devem estar razoavelmente completas e correctas. 

Obviamente, se o sistema não souber o significado de uma palavra, não a poderá “abstrair”. Será necessário então que cada comunidade linguística adicione centenas de milhares de palavras e os seus significados no Wikidata. Neste momento, só 14 línguas têm mais do que 10 mil lexemas definidos, sendo que o maior dicionário em língua portuguesa, por exemplo, tem mais de 300 mil palavras definidas. Não será muito surpreendente perceber que a maioria das línguas com mais lexemas são também das línguas com as versões da Wikipédia com maior número de artigos. Havendo alguma correlação entre número de contribuintes, número de artigos da Wikipédia, e número de lexemas, há um grande desafio em que este sistema seja útil para as línguas menos representadas no Universo Wikimedia. Não havendo massa crítica para a criação de uma Wikipédia, será possível criar uma comunidade para acrescentar centenas de milhares de lexemas?

O conteúdo “abstraído” deve ser extenso, de leitura fluída e natural.

Outras tentativas de escrever artigos enciclopédicos através de computadores geram textos densos, pouco naturais e, por isso, pouco atrativos para os leitores. Existem já sites que geram artigos com base nos dados presentes no Wikidata. Veja-se por exemplo, um artigo sobre D. Afonso Henriques gerado automaticamente. Eu próprio já criei (semi-)automaticamente artigos na Wikipédia em Português, resultando em pequenos artigos sobre rãs que quase ninguém lê. Num caso extremo, a Wikipédia em Cebuano (uma língua falada nas Filipinas) foi quase totalmente escrita por bot, tendo mais de 5 milhões de artigos, principalmente sobre espécies biológicas e localidades. Parece, no entanto, não ser lido por quase nenhum falante nativo da língua, que preferem ler os artigos em inglês.

O grande desafio será então criar conteúdo que seja lido pelo público-alvo, os falantes nativos das línguas. 

Imagem de artigo gerado automaticamente sobre D. Afonso Henriques
Artigo sobre D. Afonso Henriques gerado automaticamente.

O sistema deve ser de uso fácil e permitir que as comunidades diferentes possam contribuir para ele.

Uma significativa porção das pessoas quando ouve falar em funções, abstrações e lexemas desliga do que se está a dizer. Por isso, um sistema que depende de pessoas comuns escrever artigos sobre uma grande variedade de assuntos tem que obrigatoriamente ser de fácil utilização. A própria Wikipédia tem uma curva de aprendizagem que nem toda a gente está disposta a escalar, daí que o novo sistema tenha obrigatoriamente de ser o mais fácil de usar possível, sem que o conteúdo gerado perca qualidade. Isso é um equilíbrio difícil de conseguir.

A ideia da Wikipédia Abstracta não é a de substituir as comunidades existentes e sim de complementá-las, fornecendo uma ferramenta de promoção do diálogo, mas não parece ter sido essa a sugestão de Sato. Neste caso, cada comunidade terá a possibilidade de adaptar o conteúdo gerado pela Wikipédia Abstracta e modificá-lo como bem entendesse. Então, o que aconteceria então se imaginássemos um sistema que usasse a mesma ideia, mas em que o conteúdo final fosse apenas o gerado pela Wikipédia Abstracta?

Teria que ser possível não apenas “concretizar” um artigo numa qualquer língua, mas também escrever um artigo ou qualquer texto na nossa língua natural que pudesse vir a ser “abstraído” para que o próximo contribuidor conseguisse lê-lo também na sua língua. As discussões poderiam ser realizadas livremente entre as comunidades linguísticas com compreensão mútua. Haveria então uma comunidade multilinguística, multicultural que poderia discutir o conteúdo dos artigos de modo a atingir consensos que gerassem conteúdos com mais imparcialidade e rigor, com a massa crítica suficiente para não ocorrerem os desvios observados na Wikipédia em croata. Mas pela experiência das próprias comunidades na Wikipédia e no mundo em geral, a convivência entre várias culturas, nacionalidades, ou filosofias, nem sempre é fácil, principalmente em situações onde algumas facções são subrepresentadas. Veja-se por exemplo o caso da Wikipédia em Português (mais uma vez, por ser a comunidade que conheço mais de perto). Da comunidade de cerca de  2500 editores activos em cada mês, só 9 % edita de Portugal (80% edita a partir do Brasil), e só 10% da comunidade se identifica como mulher. Não é por isso raro ver artigos sobre temas que em Portugal sejam sobejamente conhecidos, como o artigo sobre Tiago Bettencourt ou ModaLisboa, sejam propostos para eliminação por ser contestada a sua “notoriedade” (no jargão Wikipédico, diz-se que um assunto tem notoriedade quando recebe cobertura significativa de fontes reputadas e independentes), quando o que na verdade faltava era que as fontes facilmente encontradas numa pesquisa rápida fossem adicionadas ao artigo, para que qualquer um pudesse avaliar a notoriedade. 

Numa Wikipédia Universal, com potencialmente milhares de sub-comunidades minoritárias, este tipo de julgamento apressado seria exponenciado, com danos que poderiam ir desde a eliminação do conteúdo em causa, até à ostracização ou abandono dessa (sub-)comunidade. Algumas comunidades poderiam entretanto ganhar massa crítica que lhes permitisse contrariar esta tendência, mas no caso das nacionalidades isso não parece ser possível, a não ser que haja uma campanha específica para angariar novos contribuidores vindos destes países.

Um sistema Universal teria por isso que assegurar que temas específicos seriam tratados com justiça, talvez permitindo que certas comunidades tivessem voz determinante nas discussões sobre esses conteúdos.

Índice

  • Gonçalo Themudo

    Gonçalo Themudo é um investigador auxiliar no CIIMAR / Universidade do Porto, e Presidente da Wikimedia Portugal, uma organização sem fins lucrativos fundada em 2009 com o objectivo de contribuir para a disseminação geral do conhecimento e cultura, encorajando a recolha, criação e distribuição de conteúdo com licenças livres, particularmente em língua portuguesa. A sua paixão por biologia evolutiva e ciência aberta levou-o a começar a contribuir para a Wikipédia em 2006, onde liderou vários projectos relacianados com biologia. Os artigos para o qual ele contribuiu são lidos mais de um milhão de vezes todos os anos. Juntamente com a Wikimedia Portugal tem organizado várias competições e eventos, tais como a maior competição fotográfica do mundo, o Wiki Loves Monuments.

Subscreve a newsletter e acompanha o que publicamos.

Eu concordo com os Termos & Condições *

Apoia o jornalismo e a reflexão a partir de 2€ e ajuda-nos a manter livres de publicidade e paywall.

Bem-vind@ ao novo site do Shifter! Esta é uma versão beta em que ainda estamos a fazer alguns ajustes.Partilha a tua opinião enviando email para comunidade@shifter.pt