Scrutari

Scrutari est un moteur de recherche sur les métadonnées (titre, sous-titre, auteurs, mots-clés, etc.) des différents sites participant à la Coredem. C’est à la fois un outil de mutualisation (les données sont rassemblées dans un seul endroit) et de valorisation (les résultats de la recherche renvoient vers les sites participants).

La mutualisation des données fonctionne suivant un mécanisme proche de la syndication de contenu : chaque site participant fournit un fichier contentant les métadonnées de ses documents suivant un format XML appelé ScrutariData. Le serveur Scrutari collecte régulièrement ces données pour se mettre à jour comme l’indique le schéma suivant :

La valorisation des données se fait par l’intermédiaire de « clients » (comme celui disponible sur ce site via la fonction « Rercherche Scrutari ») qui soumettent les recherches des internautes au serveur Scrutari ; ce dernier renvoie alors les résultats dans un format brut (en termes techniques, via une API au format JSON) que le client se charge de mettre en forme.

La recherche peut être simple (un seul champ de texte libre) ou avancée avec des filtres et des options de recherche, comme propose le client ScutariJs.

D’autres formes de valorisation sont disponibles comme des flux de syndication pour suivre les nouveautés sur les différents sites.

Scrutari est un logiciel libre développé en Java. Sa documentation technique est disponible sur le site scrutari.net. Scrutari ne se limite pas à la Coredem. Il est utilisé pour des bases internes ou adapté à des sites ressources particuliers.

Articles publiés dans cette rubrique

  • « Scrutariser » un site

    « Scrutariser un site », c’est, dans le jargon de l’équipe de la Coredem, le fait de mettre en place le processus automatique d’extraction des métadonnées d’un site au format ScrutariData afin de permettre au serveur Scrutari d’inclure le site dans ses résultats de recherche.
    La « scrutarisation » de (...)

  • Scrutari et la syndication

    Le mécanisme de collecte des données des sites participants par le serveur s’inspire de la syndication via des flux au format RSS ou Atom, à la différence près que le format ScrutariData s’intéresse à l’intégralité des données et met un accent particulier sur l’indexation par des mots-clés.
    Le moteur de (...)

  • Petite histoire de Scrutari

    Le logiciel Scrutari est antérieur à la Coredem mais son origine est la même : la rencontre en 1986 de la fondation Charles Léopold Mayer (FPH) et du réseau Ritimo. De cette rencontre nait DPH (Dialogues Pour l’Humanité) tout à la fois réseau, méthode et base de données d’échanges d’expérience.
    Dans les (...)