Dual Blog : DeFr's Weblog

Google Desktop Search | lundi 14 mars 2005, 23h19

Mood: Goggle

Ce post peut sembler anachronique : aussi longtemps après la sortie des premières beta disponible publiquement de Google Desktop Search, qu'est-il possible d'ajouter, qui n'est pas déja été dit et redit un peu partout sur la blogosphère ? Ils existent cependant au moins deux raisons de poster sur ce sujet : la version 1.0, incorporant la recherche dans le cache de Firefox et les mails de Thunderbird, est sorti il y a relativement peu de temps... ce qui m'a incité à le tester plus en profondeur ^^; Accessoirement, il me semble de plus que si le sujet a été largement abordé dans la langue de Shakespeare, les posts en Francais sont nettement moins nombreux ; cependant, cette impression provient probablement du fait que je ne lis que peu de blog en francais à la base.

Tout d'abord, le principe : après tous, les systèmes d'exploitation n'intègre-t-il pas une fonction de recherche depuis des lustres par défaut ? Il exite plusieurs différences majeures entre les fonctions de recherche traditionnelles et les moteurs d'indexation qui fleurissent en ce moment ( Spotlight pour Mac OS 10.4, Beagle pour Linux, et Google / Copernic Desktop Search sur Windows ). Tout d'abord, alors que les anciennes recherches se concentraient presque exclusivement sur les noms des fichiers, l'idée est maintenant d'essayer de s'interesser au contenu de ses fichiers, dans le but d'offrir à l'utilisateur de rechercher des choses telles que : "la conversation par mail que j'ai eu à propos de WordPress", ou alors "le fichier Word contenant mon projet personel et professionel". D'une facon générale, cela permet donc une recherche bien plus naturelle que ce que l'on avait avant, et surtout, beaucoup plus pratique.

Il est interessant de constater que ses capacités d'indexation ne se limite pas aux fichiers textes. En effet, la plupart des formats de fichiers possèdent des méta-données, que Google Desktop Search pourra alors exploiter. Pour prendre un exemple concret, les MP3 possèdent en eux des informations sur le chanteur, le nom CD, le titre de la chanson, le numéro de la piste, autant d'informations que GDS va pouvoir exploiter, vous permettant par la suite de faire une recherche sur le titre de la chanson pour la retrouver immédiatement, sans avoir à vous demander pendant de longs moments dans quel dossier vous avez pu mettre ce fichier, et surtout ce que vous aviez bien pu choisir comme convention de nommage à cet instant. Quiconque à galerer en recherchant son fichier comprendra immédiatement l'interet pratique d'un tel dispositif.

Cependant, l'ensemble des fonctionnalités mentionnées ci-dessous sont communes à l'ensemble des programme que j'ai mentionnés en début de post, constituant les principes de bases de tous systèmes d'indexation des meta-données. Une des premières fonctionnalités qui m'a agréablement surpris à l'installation de la version 1.0, indexant le cache de Firefox, c'est la recherche dans l'historique. On pourrait croire que cette fonctionnalité présente un interet limité, puisque "tout le monde sait bien que l'historique d'un navigateur est disponible dans le navigateur lui-même". Au niveau 0, la remarque est vraie. Là ou le génie de GDS se manifeste, c'est que la recherche donne non seulement les adresses des pages visitées, mais aussi, et surtout, les heures et version des pages visitées. Exemple type, vous visitez un site un jour donné, vous y retournez le lendemain, et il a intégrallement changé, vous privant du contenu que vous souhaitiez reconsulter. GDS vient à votre secours, il suffit de lancer une recherche sur le nom ou l'adresse du site pour pouvoir acceder à une version en cache de la page, avec toutes les informations auxquels vous avez déja eu accès. Tout simplement génial.

Autre gros avantage de GDS, la possibilité de developper des plug-ins, qui permettent d'indexer des fichiers plus ou moins "exotique", c'est à dire que Google n'a pas pris le temps d'étudier en détail pour savoir comment les prendre en compte de facon optimale. Par exemple, la version telechargeable ne comprend pas par défaut de système d'indexation pour les fichiers OpenOffice. Cependant, un petit tour sur la page des plug-ins permet d'ajouter en quelques clics la capacité de les gerer. Cette architecture de plug-in est ouverte, c'est à dire que n'importe qui peu téléchargé le SDK disponible en ligne, et se lancer dans la programmation d'un système d'indexation pour le format de fichier que vous venez d'inventer, où pour vous lancez dans l'implémentation de ce qu'il faut pour le type de fichier que vous trouvez super mega utile mais que personne d'autre ne semble utiliser.

Je suppose qu'un post objectif doit cependant comporter un avertissement : le problème d'un tel système, centralisant toutes les données d'un ordinateur - ce qui inclue des fichiers que l'on pourrait juger confidentiel - présente un attrait assez important à d'éventuels attaquants exterieurs. A priori, aucune attaque couronnée de succès n'a été mené jusqu'à présent, et les préoccupations sécuritaires soulevé à la sortie semble pour le moment infondée, mais il est toujours bon de se rappeller que la possession d'un tel système signifie que l'on souhaite encore plus se prémunir des attaques extérieures : antivirus et firewall, fortement recommandé pour tout utilisateur de Windows, devient ici absolument necessaire, sous peine de conséquences potentiellement désastreuses.

Au global, je suis totalement convaincu de l'utilité et des gains de productivité apporté par un tel système, qui indexe désormais les données en tache de fond 24h/24 sur mon PC nantais. Je recommande à tout un chacun d'au moins essayé ce genre de logiciel, au moins pour se rendre compte des possibilités que cela peut apporter ^^

Revenir au blog
Vous souhaitez ajouter un nouveau commentaire ? Faites donc, il vous suffit de remplir le petit formulaire ci-dessous.
Sites visités