Car-tech

Google: 129 milhões de livros diferentes foram publicados

Políticas públicas e epidemias em outros países

Políticas públicas e epidemias em outros países
Anonim

Para aqueles que já se perguntaram quantos livros diferentes existem no mundo, o Google tem uma resposta para você: 129.864.880, de acordo com Leonid Taycher, engenheiro de software do Google que trabalha no projeto Google Books.

Estimando o número de livros no mundo é mais do que um exercício de curiosidade para o gigante das buscas: ele também fornece um roteiro de parte do trabalho ainda a ser feito para atingir o objetivo ambicioso da empresa de organizar todas as informações do mundo.

"Quando você faz parte de uma empresa que está tentando digitalizar todos os livros do mundo, a primeira pergunta que você costuma fazer é: "Quantos livros existem?", explicou Taycher em um post no blog anunciando a estimativa. > [Outras leituras: Os melhores serviços de streaming de TV]

Para chegar a uma aproximação razoável, a empresa começou ingerindo informações de livros de vários sistemas de catalogação, como o ISBN (International Standard Book Numbers).

Esses catálogos, embora úteis, não fornecem uma contagem definitiva., Contudo. Por exemplo, os ISBNs só foram atribuídos a livros desde a década de 1960 e tendem a ser usados ​​apenas nos países ocidentais.

Também vários livros foram atribuídos a números individuais de ISBN, e o editor atribuiu ISBNs a itens que não livros, por exemplo, camisetas e DVDs.

Então, os engenheiros do Google escreveram programas para vasculhar cerca de 150 catálogos e diretórios, e eliminaram tantas entradas duplicadas quanto possível.

A empresa também teve que fazer várias decisões difíceis sobre o que é e o que não é um livro, explicou Taycher.

Por exemplo, as edições de capa dura e capa dura de um texto são contadas como dois livros, assim como as muitas versões diferentes de um texto popular, como o de Shakespeare. "Hamlet", devido aos prefácios e comentários que eles podem conter. Serials podem contar como livros individuais ou como um trabalho coletivo.

Em junho, a empresa digitalizou 12 milhões de livros, de acordo com uma apresentação feita pelo gerente de engenharia do Google Books, Jon Orwant, na Conferência Técnica Anual da USENIX em Boston. Estes livros foram escritos em cerca de 480 idiomas (incluindo 3 livros na língua Klingon originada por Jornada nas Estrelas).

A empresa planeja concluir a digitalização de livros existentes em uma década. A coleção virtual resultante consistirá de quatro bilhões de páginas e dois trilhões de palavras, disse Orwant.

Cerca de 20% dos livros do mundo são de domínio público, explicou Orwant. Cerca de 10 a 15 por cento desses livros são impressos. Os livros restantes - a grande maioria de todos os títulos - ainda estão sob direitos autorais, mas esgotados. O Google está em processo de emprestar cópias desses livros para digitalizá-los, de cerca de 40 grandes bibliotecas em todo o mundo.

É esse ato de digitalizar em livros que estão esgotados, mas ainda cobertos por direitos autorais que foram cumpridos. com alguma resistência da indústria editorial.

A empresa está agora à espera de um julgamento do Tribunal Distrital dos EUA para o Distrito Sul de Nova York, sobre se ele pode escanear esses livros.

Em 2005, o Authors Guild e A Associação de Editores Americanos apresentou separadamente ações judiciais coletivas contra o gigante das buscas, afirmando que a empresa está infringindo os direitos autorais dos autores ao digitalizar os livros. A Google alegou que quer vender cópias digitais desses documentos de outra forma fora do padrão. imprima livros e reserve royalties para os autores reivindicarem. A empresa também espera revelar trechos desses livros em buscas na Web, e alega que esse uso se enquadra na doutrina americana de Fair Use.

A digitalização em todos os livros do mundo trará outros benefícios além de melhorar as pesquisas, explicou Orwant. Depois que todos esses volumes são digitalizados, seu conteúdo pode ser submetido a análises, o que pode levar a novos insights. Os linguistas podem descobrir quando certas palavras entraram em uso generalizado, ou quem primeiro começou a usar essas palavras.

A Pesquisa de Livros do Google também poderia ajudar a responder algumas questões históricas pendentes: por exemplo, poderia informar o debate sobre se Isaac Newton e Gottfried Leibniz - ou alguém inteiramente - inventou o cálculo.

"Podemos pesquisar não apenas por um frase, mas para um conceito ", explicou Orwant. "Podemos tomar todas as diferentes maneiras [que a idéia de] infinito pode ser flexionada, traduzi-la em diferentes idiomas e fazer uma pesquisa em paralelo."

"Minha esperança é que à medida que começarmos a expor muito mais esta coleção permitirá que as pessoas façam perguntas como esta que não puderam fazer antes, "disse ele.

O editor do IDG News Service Juan Carlos Perez contribuiu para este relatório.

Joab Jackson cobre software empresarial e tecnologia geral de notícias de última hora para

O Serviço de Notícias IDG

. Siga Joab no Twitter em @Joab_Jackson. O endereço de e-mail de Joab é [email protected]