Le mécanisme de collecte des données des sites participants par le serveur s’inspire de la syndication via des flux au format RSS ou Atom, à la différence près que le format ScrutariData s’intéresse à l’intégralité des données et met un accent particulier sur l’indexation par des mots-clés.
Le moteur de recherche Scrutari se met à jour sur un rythme quotidien et tient le journal de toutes les nouvelles références. Dès lors, il est possible d’utiliser Scrutari comme source d’un flux de syndication permettant de suivre sur un seul fil toutes les ressources produites par les participants de la Coredem.
Le moteur Scrutari de la Coredem propose deux fils au format Atom différents :
1) Un flux par référence : chaque nouvelle référence constitue une entrée spécifique dans le fichier de syndication ; ce flux est le plus lisible mais peut aboutir à un très grand nombre d’entrées d’un coup lorsqu’un nouveau participant arrive dans la Coredem. L’adresse de ce flux est le suivant :
http://sct1.scrutari.net/sct/coredem/feed/fiches-f_fr.atom
2) Un flux par mise à jour : une nouvelle entrée est crée par mise à jour du moteur (normalement une par jour) et cette entrée liste toutes les fiches arrivées. Ce flux est un plus austère et il existe en deux versions :
- références classées par site : http://sct1.scrutari.net/sct/coredem/feed/tree-f_fr.atom
- références classés par catégories de document : http://sct1.scrutari.net/sct/coredem/feed/categories-f_fr.atom
Par ailleurs, ScrutariJS, l’interface avancée de recherche sur Scrutari propose pour chaque recherche le lien d’un flux de syndication qui, d’une part, reprend tous les résultats de la recherche et qui, d’autre part, s’actualisera chaque jour avec les nouvelles entrées correspondant à la recherche effectuée.