Manter arquivos é uma forma de perpetuar o conhecimento. Os principais jornais do mundo têm extensos arquivos com cópias das edições publicadas. Na era anterior ao computador, só tinha mesmo papel e os microfilmes para arquivar isso. O Google se meteu indexar todos esses milhares de microfilmes. Três anos depois, acaba de desistir da ideia.
O trabalho era árduo. Pegar cada edição de jornal, seja em microfilme ou no papel, e passar um scanner para capturar essas imagens em alta resolução. Em seguida, um aplicativo de reconhecimento ótico tenta reconhecer as letras e palavras, formando os textos (agora sim) em formato digital.
Cerca de 2 mil jornais do mundo se aliaram ao Google nesse projeto, desde os menores até os chamados jornalões. No entanto, a empresa repentinamente desistiu do projeto. Em comunicado enviado aos veículos, o Google diz que vai se empenhar em outras atividades interessantes para a Comunicação Social, como um sistema de pagamento mais fácil de assinaturas.
Ao menos um jornal brasileiro estava participando desse sistema de indexação especial. O “Jornal do Brasil”, que deixou de circular nas bancas em 2010, tem exemplares de 1910 cadastrados no Google Newspapers. No total, o Google escaneou 18 mil números do “JB”.
As más línguas dizem que o processo é muito trabalhoso, o que acabou desanimando o Google, além de atrair pouca atenção (e poucos acessos) dos internautas. É bem provável que seja isso, mas o Google não admitiria tal fracasso no seu objetivo-mor de catalogar toda a informação disponível no mundo.
0 comentários:
Postar um comentário