Comment choisir son moteur de recherche ?

Le besoin d'un moteur de recherche performant et adapté est clairement ressenti par nombre d'entreprises. L'un des enjeux clés reste de pouvoir rendre les différentes sources d'informations visibles et facilement indexables.

Une organisation dont une part de l'activité repose sur des documents, e-mails,  bases de données, sites internet, sites intranet, peut se trouver face à une difficulté de recherche parmi les fichiers accessibles, créés au jour le jour. Cette difficulté engendre :

- Une perte de temps, donc de rendement des utilisateurs, voire leur mécontentement ;
- La rédaction en double de documents ;
- Une incertitude dans la prise de décisions due à un manque d'informations ;
- Une perte de compétitivité et de performance de la structure.

Au sein de l'entreprise, les difficultés internes seront alors :

- Un défaut de partage des informations ;
- Une dégradation voir l'absence de processus de gestion documentaire et des versions de documents.

Vis-à-vis de l'extérieur, l'absence de moteur de recherche, en particulier sur un site internet diminue la capacité de l'internaute à trouver ses informations et à approfondir sa relation avec l'entreprise et favorise le détournement des internautes vers le site des concurrents.

Au-delà de la fonction de recherche proprement dite, des paramètres additionnels permettent d'apprécier la qualité d'un moteur de recherche: son ergonomie, une recherche guidée, une assistance linguistique et rédactionnelle, une conduite de recherche assistée, un mode de présentation pertinent des résultats. .

Une fois le problème posé, que le besoin d'un moteur de recherche performant et adapté est clairement ressenti, il convient d'analyser l'existant. A partir de l'existant comme point de départ, le cheminement vers le but à atteindre sera guidé par deux grandes questions: un moteur pour quoi faire? A quoi doit-on arriver par son aide?

Le recensement des sources d'information électroniques est un passage incontournable : internes (donc en principe maîtrisées complètement), externes (soumises à une autorité non contrôlée), formats de fichiers, de bases de données, d'index s'ils existent, type de données accessibles directement par une recherche ou via une méta-recherche.

Un point souvent négligé dans cette phase du travail d'implantation d'un moteur de recherche peut être la préparation des données d'origine. Comment faire en sorte qu'elles soient prêtes et le plus visibles possible par un moteur de recherche ? C'est une phase cruciale dans la réussite finale du projet et qui doit être confiée à des spécialistes de la gestion des systèmes d'information documentaire.

L'environnement de travail du moteur va également déterminer son choix.

- Les données sont-elles locales ?
- Les index seulement sont-ils locaux ?
- Tout est-il distant ?

A pertinence égale, l'évaluation de la performance en temps de réponse du moteur va dépendre sensiblement de ces questions.

Nous savons maintenant quels sont les problèmes à résoudre et vers quel but nous devons tendre. D'autre part nous avons définit le point de départ (l'inventaire de l'existant). Le chemin de l'existant vers le but à atteindre se définit par un cahier des charges, ligne de conduite du projet tenant compte des contraintes.

Premier aspect à y intégrer : l'exploitation des données.

- Quelle sera la fréquence de mise à jour des données et des index ? En temps réel ou asynchrone ?
- Comment sera conçue la base d'indexation ? Quelle sera sa structure ?
- Quelle sera la volumétrie ? Sur une architecture concentrée ou distribuée ?
- Quel équilibre entre pertinence et rapidité de réponse veut-on établir ?

La sécurité attachée aux données est aussi à prendre en compte. Comment le moteur doit-il s'en accommoder ? On pourra par exemple concevoir un moteur qui verrait toutes les bases de métadonnées, mais ne donnerait accès aux données qu'en fonction de droits. Ou bien les données hors périmètres de droits de l'utilisateur ne seront pas visibles. Dans ce cadre des droits d'accès, qu'en sera-t-il des liens, des rebonds ? Le moteur aura probablement à s'adosser à la politique de droits définie par ailleurs dans l'organisation (via un annuaire LDAP par exemple)

Toute direction des systèmes d'information imposera par ailleurs, avec plus ou moins de fermeté, des technologies de développement du moteur de recherche et de ses fonctionnalités additionnelles : Java, php, etc... Dans le même ordre d'idée le système d'exploitation de la plateforme peut orienter le choix et faire partie du cahier des charges. Quelles seront les fonctionnalités explicites à greffer au moteur ? On citera le multilinguisme, la synonymie, les thésaurus métier, la saisie en langage naturel (jusqu'à l'intégration éventuelle d'un avatar). Enfin, dernier aspect à prendre en compte dans l'établissement du cahier des charges : le budget. Il orientera en effet fortement le choix vers un système propriétaire ou de l'Open Source.

Il sera guidé par la meilleure adéquation entre le cahier des charges défini et les fonctionnalités annoncées par le concepteur du moteur de recherche. On veillera à ce que ce dernier s'engage sur chacune des fonctionnalités et des contraintes qui y sont reprises. Il faudra s'assurer auprès de spécialistes de l'intégration que le moteur s'interface bien dans son environnement de travail. Comment se positionnera-t-il dans l'architecture fonctionnelle de l'application déjà en production ? On traitera cet aspect du choix d'autant plus en détails que tout ou partie de l'environnement est en mode ASP.

Le modèle de licence est aussi un paramètre du choix par utilisateur; serveur; en fonction de volumes, etc. La capacité à proposer de l'assistance, du conseil, des évolutions, de la part de l'éditeur est un facteur de stabilité à long terme de la solution choisie. La pérennité financière supposée de l'éditeur est aussi un facteur de choix à prendre en compte.

En conclusion, la sélection, la mise en route et le paramétrage d'un moteur de recherche au sein du SI d'une entreprise ou d'une administration est un projet complet, voire complexe, et finalement stratégique dans la politique IT d'une organisation. Il est nécessaire de  préparer les flux à traiter en amont du moteur et de définir  comment devra s'apprécier la pertinence des résultats et donc le paramétrage qui permettra de l'atteindre.

Il est indispensable de proposer des solutions techniques où le moteur de recherche sera intimement lié à l'environnement cible pour y appliquer au mieux les fonctionnalités souhaitées. Il est enfin important de se poser des questions voisines en cas de mise à jour, voire de migration d'un moteur vers un autre. Il est nécessaire de s'assurer, dans ces deux situations, qu'aucune régression fonctionnelle ne sera constatée en contrepartie d'évolutions et améliorations proposées par un éditeur.