A máquina do tempo da internet em Portugal

O Arquivo.pt vai comemorar a sua primeira década num evento dia 8 de Novembro, em Lisboa. Um dos convidados é o historiador José Pacheco Pereira.

A internet está constantemente a mudar. Diariamente nascem páginas novas e há URLs que deixam de funcionar. Para preservar os conteúdos publicados online e garantir que existe um arquivo de tudo, nasceu em 1996 nos Estados Unidos o Internet Archive, um directório online, sem fins lucrativos e de acesso livre, no qual é possível encontrar cópias de alguns dos sites mais populares da web, ver como evoluíram ao longo dos anos e recuperar páginas que já não estão disponíveis. Anos depois, em 2008, surgiu em Portugal um projecto semelhante mas dirigido para a web portuguesa. Chama-se Arquivo.pt.

Se o Internet Archive procura ser a memória da web mundial, o Arquivo.pt quer preservar a web que termina no domínio .pt. Actualmente, o directório, que começa em 1996, permite aceder a mais de 4 mil milhões de páginas, agregando perto de 5 milhões de sites, segundo dados divulgados pela publicação Future Behind. Ao todo, refere a mesma fonte, esta parte do património digital português equivale a mais de 200 terabytes de dados.

Periodicamente, o Arquivo.pt recolhe e armazena informação publicada online, processando depois esses ficheiros para os tornar acessíveis e pesquisáveis. Este processo de preservação é realizado de forma automática através de um sistema informático distribuído de larga-escala. Dessa forma, através do endereço arquivo.pt, qualquer pessoa pode pesquisar o passado da web portuguesa, garantindo que o conhecimento nela contido passa às nossas gerações futuras.

O principal foco do Arquivo.pt é a preservação de toda informação publicada na Internet para fins científicos e académicos. Para tal, desenvolveu-se uma funcionalidade para identificar automaticamente os endereços relacionados com projectos de investigação, que garante que o seu conteúdo seja preservado de forma sistemática. A plataforma dispõe também de um campo para recolha de contribuições da parte dos investigadores, que podem sugerir os endereços dos seus sítios para serem preservados na plataforma.

O Arquivo.pt está a comemorar uma década de existência. O projecto arrancou oficialmente em 2008, com a primeira versão pesquisável do arquivo a ser disponibilizada dois anos depois, em 2010. Contudo, a história do Arquivo.pt pode começar a ser contada em 2000 quando, em conjunto com a Biblioteca Nacional de Portugal, começou a ser feita uma recolha selectiva das publicações online portuguesas para ser disponibilizada no TUMBA!, um acrónimo para “Temos Um Motor de Busca Alternativo!”.

Em altura de aniversário, o Arquivo.pt vai realizar o seu primeiro evento no dia 8 de Novembro no Pavilhão do Conhecimento, em Lisboa. “Porquê E Como Preservar A Web?” é o tema do encontro, que permitirá a todos os interessados explorar a trajetória do serviço e conhecer as várias experiências na área de conservação do património digital português. O evento contará com três palestras: uma com Daniel Gomes, investigador da Fundação para a Computação Científica Nacional (FCCN) e líder do Arquivo.pt; outra com o historiador José Pacheco Pereira; e uma outra com Julien Masanès, investigador francês, considerado o “pai” do arquivamento da web na Europa, e que é actualmente o director executivo do Internet Memory Research, uma empresa que desenvolve tecnologias de monitorização focadas em conservação patrimonial e plataformas de comércio eletrónico.

Terão também lugar vários workshops sobre como usar o Arquivo.pt para fazer pesquisa no passado, como publicar informação preservável para o futuro, ou como aproveitar as APIs do Arquivo.pt. Será ainda anunciado o prémio Arquivo.pt 2018, uma iniciativa pretende premiar os melhores projectos de investigação concretizados com a ajuda do Arquivo.pt.

A participação neste encontro do Arquivo.pt é gratuita, mediante inscrição prévia aqui. Podes encontrar mais informação sobre o evento, que começará às 9 horas e terminará pelas 18 do dia 8 de Novembro, nesta página.

Previous Urban Beach é pretexto para piada com a “ascêndencia indiana” de Costa
Next Os consumidores gostam tanto dos logotipos como os marketeers?