mardi 4 novembre 2008 


Accueil > Actualité des moteurs de recherche et du référencement >

Google commence à scanner des documents et à les proposer dans ses résultats

Envoyer a un ami Version imprimable    

Google a annoncé la semaine dernière qu'il commençait à utiliser de façon significative l'OCR (Optical Character Recognition pour Reconnaissance Optique de Caractères) pour scanner des documents papier afin de reconnaître les textes qui y étaient imprimés. Tout document papier ainsi reconnu devient alors un document numérique "comme un autre", susceptible d'apparaître dans les pages de résultats du moteur de recherche.

Les résultats sont alors présentés sous la forme d'un fichier PDF, la version originale étant visualisable grâce au lien "View as HTML" :

Google OCR 1
 
Google OCR 2
 
Source de l'image : Google



Plus d'infos :
http://www.google.com/

Source(s) :
A picture of a thousand words? (Google)

Articles connexes sur ce site :
- Google lorgne vers l'OCR (13 septembre 2006)
- Un brevet sur la reconnaissance de textes dans les images et les vidéos pour Google (7 janvier 2008)

Toutes les pages du réseau Abondance pour la requête ocr...
Toutes les pages du Web pour la requête ocr...

Wikio

3 Commentaires :

Rappelons ici que les liens insérés dans vos commentaires sont en 'rel=nofollow' et ne sont donc ni suivis ni interprétés par les moteurs de recherche...

Cela pose plein de questions:
* les référneceurs devront-ils donc commencer par apprendre à leurs client à utiliser word correctement: (remplir les méta-données, utiliser des structures de titres documents propres (pas de gras grossi, mais l'arborescence des menus automatqiue ?)
* comment faire retirer un document par Google ?
* les documents resteront-ils en cache ? Si oui.. hébergé par qui?
* apparition de balises nofollow et noindex dans les formats de documents bureautique ?

Qu'en pensez-vous Olivier?

Oui enfin cela était déjà effectif pour du PDF texte, parce que les images ne sont toujours pas interprétées.
Globalement, un PDF peut être accessible mais ne permettra jamais de structurer le contenu. Il ne faut pas oublier à quoi il sert : à être imprimer. Son utilisation comme format d'échange est une hérésie.

C'est une bonne îdée d'enrichir la biblio google docs, mais ma question se pose sur compatiblité de l'OCR avec les docs en langue arabe.

Poster un nouveau commentaire


<< Accueil
 


Retrouvez ici toute l'actualité des moteurs de recherche majeurs et du référencement en France et dans le Monde, jour après jour : nouveautés, rachats, nouveaux moteurs, nouvelles fonctions, nouvelles annonces, nouveaux outils, etc.
 
feed xml
 
Wikio
 
Pour tout savoir sur le livre "Réussir son référencement web, 2ème édition" (Eyrolles, novembre 2009), consultez le site Livre Référencement !

 
Lettre d'actualité
La lettre "Actu Moteurs" est hebdomadaire et gratuite. Abonnez-vous :

Rejoignez nos 70 000 abonnés (plus d'infos) depuis 1998 et recevez toute l'info sur les moteurs chaque semaine !

 
Les blogs d'Abondance
Abondance-Actu :
Toute l'actualité quotidienne des moteurs de recherche et du référencement.
Abondance-Info :
Quelques réflexions sur les moteurs de recherche et le référencement.
Abondance-Pro :
Le sommaire de la lettre professionnelle "Recherche et Référencement".
Abondance-Abonnés :
Le blog des abonnés payants.
 



 
 Recherche sur le site Abondance :

Tout Abondance
Toute l'actu depuis 1998


 

 

Messages précédents

 
Yahoo! Live fermera ses portes en décembre
Le deal entre Google et Yahoo! aurait-il du plomb ...
Yahoo! propose des expérimentations sur SearchMonk...
Les alertes Google accessibles par fil RSS
Google teste des résultats plus accessibles
Live Search propose des raccourcis de recherche da...
L'encyclopédie collaborative Knol disponible en fr...
32 millions de $ pour Like.com, moteur basé sur la...
Les Google Street Views disponibles en Espagne et ...
Le plugin Exploredge disponible en version 2.0

 

Archives

 
juillet 2007
août 2007
septembre 2007
octobre 2007
novembre 2007
décembre 2007
janvier 2008
février 2008
mars 2008
avril 2008
mai 2008
juin 2008
juillet 2008
août 2008
septembre 2008
octobre 2008
novembre 2008
décembre 2008
janvier 2009
février 2009
mars 2009
avril 2009
mai 2009
juin 2009
juillet 2009
août 2009
septembre 2009
octobre 2009
novembre 2009
décembre 2009
janvier 2010
février 2010

 

Lettres d'actualité

 
Actu Moteurs : revue de presse hebdomadaire (gratuite)
Recherche & Référencement : lettre professionnelle mensuelle (payante)

 
Chercher sur le Web avec Mozbot :

Chercher sur :
Web international
Web francophone
Un site du Réseau Abondance (english version : Search Engine Tools) :
Information : Abondance - Goossip - Forums Abondance - Boutique Abondance - Livre Référencement
Outils : Outiref - Visiref - Keyword Search Engine - Spider Simulator - Soumission-Manuelle - Flash Moteurs - Moklic
Divers / Jeux : Googlefight - Googland - Klevener
Moteurs de recherche : Mozbot.fr - Mozbot.com - Mozbot.co.uk - Motref - Grifil.net - Biomalin - Foot Engine - SearchWings
Applicatifs du site Abondance réalisés par les sociétés Brioude Internet Référencement et Iseom