‘Sr. Wikipédia’ conta como funcionam os bots que publicam textos em massa

0
53

Já pensou produzir dez mil artigos por dia para o Wikipédia? O sueco Sverker Johansson topou o desafio e atualmente é o colaborador com maior número de publicações no site, e tudo isso sem ganhar um centavo. Já são mais de 2,7 milhões de artigos e a produção em larga escala é possível por causa de um bot: um programa que automatiza o serviço e gera entradas com assuntos já determinados. O colaborador conta como tudo funciona, confira.

Nascido em Lund, na Suécia, Sverker Johansson cursou engenharia, pela Lund Institute of Technology e tem 53 anos. Além disso, é formado em economia, física e linguística. Nada que indique essa “paixão” pelos artigos do Wikipédia.

A publicação de textos em massa no site teve início em 2007, quando Sverker começou a contribuir para a enciclopédia editando arquivos “na mão”. “Fui motivado pela visão de compartilhamento livre de informações, que é a essência do Wikipedia, na qual o conhecimento humano estaria disponível para todos”, explicou.

Mas, ele não parou por ai. Atualmente, Sverker é responsável pela produção de 8,5% do conteúdo disponível no Wikipédia, com maior parte sobre espécies de animais e plantas. Um volume um tanto desproporcional para uma pessoa só.

Como funciona? A “vantagem” se dá por um bot de computador, ou seja, um programa de codinome “Lsjbot” elaborado pelo próprio Sverker, que gera a publicação de milhares de artigos automaticamente.wiki

Segundo o colaborador, basta inserir códigos no bot do tipo “complete as lacunas”: X é uma espécie de animal Y, e foi descoberto por Z em 19XX, por exemplo. Quando as lacunas são substituídas com as informações corretas sobre as espécies, o texto será enviado para Wikipedia e guardado como um artigo. As fontes utilizadas, das quais as informações são extraídas, ficam indicadas na parte inferior da página.

Esse sistema gerou polêmica entre diversos internautas, que não aprovam a maneira automatizada de publicação. Entretanto, para Sverker, essa é uma das formas mais democráticas e eficazes de produzir artigos.

“Meu bots criam uma coleção equilibrada de artigos de origem animal, por exemplo, com uma boa cobertura tanto dos animais do Brasil quanto dos da Europa”, completa. Além disso, reduz os erros “humanos” dos artigos escritos à mão, como erros de ortografia ou digitação. Ele lembra que as publicações podem ser melhoradas por outros colaboradores, o que acontece com frequência.

wiki.2

Depois de plantas e animais, uma nova safra de artigos sobre todos os autores do mundo poderá entrar em produção, conforme os projetos futuros de Sverker.

Quer conhecer mais sobre o “Sr. Wikipédia” sueco? Veja a entrevista completa com Sverker Johansson:

 Por que você começou a contribuir para o Wikipedia? 

Sverker Johansson: Comecei a editar para o Wikipedia “na mão”, da mesma forma que todos os outros, por volta de 2007. Fui motivado pela visão de compartilhamento livre de informações, que é a essência do Wikipedia, na qual o conhecimento humano estaria disponível para todos.

Depois de alguns anos, percebi que as pessoas estavam usando bots para as tarefas de rotina. Fiquei curioso e descobri que era possível criar artigos dessa forma. Assim, os artigos sobre tópicos determinados poderiam ser produzidos em massa, de forma rápida.

Quando eu comecei a fazer isso estava motivado tanto pelo desafio técnico quanto pela minha esperança de que essa seria a maneira mais eficaz de contribuir com a visão do Wikipedia. Assim, minha contribuição poderia realmente fazer a diferença para o site e para as pessoas utilizam. Faço artigos em três idiomas: sueco, cebuano, waray-waray. Espero que eu possa começar a contribuir em mais idiomas em breve, e estou testando meu bot em idioma persa.

 Como você criou seu sistema de publicação? Teve a ajuda de alguém?

SJ: O software Lsjbot [bot] reúne informações como, por exemplo, uma espécie animal, que são retiradas de bancos de dados públicos sobre biologia. Os dados são inseridas em um modelo de texto para preencher lacunas: XXX é uma espécie de animal YYY, e foi descoberto por ZZZ em 19XX, por exemplo. Quando as lacunas são substituídas com as informações corretas sobre as espécies, o texto será então enviado para Wikipedia e guardado como um artigo. As fontes utilizadas, das quais as informações são extraídas, ficam indicadas na parte inferior da página. Em seguida, o procedimento é repetido para as próximas espécies.

O trabalho com “bot” é tão preciso quanto os bancos de dados de referências, que reúnem as informações. Problemas de programação podem criar erros nos artigos, mas na maioria das vezes esse tipo de erro pode ser corrigido pelo bot. No total, os artigos bot não são perfeitos, mas eu diria que eles contêm menos erros, em média, do que os artigos escritos à mão – sem erros de ortografia ou digitação. Eu escrevi o software sozinho, sem a ajuda de ninguém. Outras pessoas no Wikipédia ajudaram com o controle de qualidade dos artigos produzidos, e sugeriram melhorias.

Quais são as vantagens de usar bot? 

SJ: Usar um bot é eficaz em quantidade, mas há mais coisas. Um ponto importante no Wikipedia é que os conteúdos refletem um grupo de escritores. A maior parte deles são jovens nerds e, consequentemente, o site tem maior cobertura de temas nerds, mais masculinos do que femininos, melhor cobertura dos países do hemisfério norte do que os países do sul, etc.

O software é mais imparcial nesse sentido. Meu bots criam uma coleção equilibrada de artigos de origem animal, com uma boa cobertura tanto dos animais do Brasil quanto dos da Europa. A longo prazo, vejo bots como uma importante ferramenta para deixar o Wikipedia mais equilibrado e mais democrático.

Já escreveu um artigo sobre o Brasil? Com qual tema?

SJ: A maioria dos artigos que eu criei são sobre as espécies de animais e plantas. Isso eu faço para todo o mundo, sem foco em algum país específico. Para o Brasil, meus esforços podem tornar o Wikipedia sueco na primeira enciclopédia a ter uma cobertura mais completa da biodiversidade conhecida da floresta Amazônica, da qual o Brasil é orgulhoso.

 Você conhece outras pessoas que produzem tanto quanto você no Wikipedia?

SJ: Há uma lista completa com o “ID de usuário” de todas as pessoas que produzem artigos em massa para o Wikipédia. Eu produzi mais do que qualquer pessoa, mas existem diversos colaboradores que se dedicam em produziu milhares de artigos também.

 Como você escolhe os temas para fazer os artigos no Wikipedia?

SJ: Os temas de artigos produzidos devem ser compatíveis com a escrita do bot. Isso significa um campo em que: ‘O conteúdo é composto por muitas unidades semelhantes, de modo que o mesmo texto do molde possa ser utilizado para muitos artigos’ e ‘os bancos de dados públicos estejam disponíveis e acessíveis’. Espécies animais e plantas atendem a esse sistema perfeitamente.

Tem alguma publicação favorita? 

SJ:
Não tenho um artigo predileto. Para mim, a grande vantagem do Wikipedia é a sua ambição de cobrir todo o conhecimento, ao invés de um assunto específico.

 Quais são os seus planos para o futuro com o Wikipedia? Novos artigos em vista?

SJ: Sim, eu vou continuar produzindo os artigos e planejo também estender meu projeto de “bot” para mais idiomas. Além disso, quero começar a produzir artigos em outros assuntos: estive pensando em fazer sobre todos os autores do mundo, por meio de informações disponibilizadas nos catálogos das bibliotecas nacionais.

Por exemplo, a biblioteca nacional brasileira, presumivelmente, tem os livros de todos os autores brasileiros. Eu posso usar esse catálogo para fazer artigos no Wikipedia sobre todos os autores do Brasil.

 Você já viajou para o Brasil? O que você acha sobre a cultura brasileira?

SJ: Não, nunca. O mais perto que cheguei do Brasil foi vendo a floresta Amazônica pelo avião, ao viajar para o Peru.

O Wikipedia já deu algum prêmio por sua colaboração? Você teve algum retorno financeiro ou de status?

SJ: Retorno em dinheiro, nada. Ninguém é pago para escrever Wikipedia, e eu também não. Tudo é feito por voluntários em seu tempo livre.

Sobre o status, bem, eu estou ficando muito conhecido na comunidade Wikipédia. Mas isso não significa muito em termos práticos.

Faça um comentário