Folha põe na internet 90 anos de história em 1,8 milhão de páginas

Fonte: http://migre.me/3V30e

No dia em que comemora seus 90 anos, a Folha coloca na internet a versão fac-similar das suas edições desde 1921. São cerca de 1,8 milhão de páginas, incluindo as edições da “Folha da Noite”, da “Folha da Manhã” e da “Folha de S.Paulo”.

A Folha é o primeiro dos grandes jornais brasileiros a digitalizar seu acervo integral e a colocá-lo à disposição dos leitores.

O processo demorou cerca de um ano. Envolveu dezenas de pessoas do jornal e a contratação da empresa Digital Pages. O custo estimado foi da ordem de R$ 3 milhões, o que inclui a digitalização, o armazenamento e o espaço em servidores capazes de suprir a demanda que será criada na internet.

Nesta fase inicial, qualquer pessoa poderá ter acesso gratuito por meio do site http://acervo.folha.com.br.

“Após um período de degustação aberto a todos, o acesso gratuito será mantido só para assinantes do jornal. É uma ferramenta poderosa para pesquisas e uma vantagem a mais para o leitor fiel da Folha”, afirma Antonio Manuel Teixeira Mendes, superintendente do jornal.

BUSCAS

“Todas as páginas receberam OCR, a tecnologia que permite o reconhecimento de caracteres nas imagens. Com isso, será possível fazer pesquisas simples ou sofisticadas sobre os textos do acervo de forma intuitiva. E, com enorme volume de páginas, a interface foi desenhada para que a busca traga resultados contextualizados visualmente em poucos cliques”, diz Ana Busch, diretora-executiva da Folha.com.

O trabalho foi quase todo feito a partir de microfilmes do jornal. Em 1982, a Folha começou a microfilmar suas edições desde a década de 1920. “Embora existam as coleções em papel, o microfilme é importante para preservar o material. A vida estimada de um livro em papel de jornal é de cem anos. Em microfilme, dura cerca de 500 anos”, afirma Carlos Kauffmann, gerente do Banco de Dados da Folha e um dos coordenadores do projeto.

Ainda hoje a Folha continua sendo microfilmada. Para efeitos legais, só cópias a partir desse meio são aceitas em processos na Justiça.

“O fato de o jornal na década de 1980 ter decidido microfilmar seus exemplares antigos facilitou bastante o processo. No ano passado, a digitalização começou a partir dos microfilmes. Mesmo os das edições mais velhas estão em boa qualidade”, explica Kauffmann.
A partir de agosto de 2003, os arquivos em pdf (imagens digitais das páginas) do jornal foram usados para o atual projeto de colocar na internet todo o acervo.

O projeto de digitalização e apresentação das páginas na web privilegia o acesso amplo dos leitores. Ao fazer a busca de um texto, o interessado chegará à página correspondente e terá a possibilidade de folhear a edição do jornal daquele dia ou até de um período mais longo.

Nesse sistema, o trabalho de pesquisa se torna mais rico. Por exemplo, numa busca sobre a Segunda Guerra Mundial, ao chegar ao artigo específico, o interessado também poderá ler as reportagens publicadas na mesma página e em outras partes da edição naquela data.

Em breve, outros jornais do Grupo Folha também terão seus acervos digitalizados. Entre eles, o “Notícias Populares”, que circulou de 15 de outubro de 1963 a 20 de janeiro de 2001, e a “Folha da Tarde”, criada em 1949.

GRANDES REPORTAGENS

Nesta e nas próximas páginas deste caderno especial, o jornal relaciona 90 grandes reportagens –como o caso do mensalão (2005)– e fotos publicadas ao longo de todas as suas edições.

Esse índice pode servir de guia para quem deseja fazer uma viagem histórica pelas páginas do jornal nas últimas nove décadas.