DigOut4U
DigOut4U est un système automatique de recherche sémantique
d'information sur Internet conçu par la société Arisem.
Il permet de poser une requête multilangue (anglais, français)
en langage naturel sur plusieurs moteurs de recherche en même temps. Les
résultats sont analysés, téléchargés sur
votre ordinateur et classés. Les pages doublons comme celles comportant
une erreur (404 par exemple) ne sont pas prises en compte. Une requête
peut être redéfinie afin de trouver des résultats plus pertinents
(recherche en entenoire).
L'analyse sémantique doit permettre de réduire les problèmes
de bruit, ou de silence, ainsi que le volume d'information.
Vous pouvez télécharger
du site Arisem une version d'évaluation de 30 jours.
Configuration
Une fois que vous avez installer ce logiciel sur votre disque dur, avant de
lancer pour la première fois une requête, vous devez configurer
DigOut4U en allant dans :
- Fichier / Préférences (File / Preference) :
- indiquer votre navigateur par défaut; si vous désirez
qu'en double cliquant sur une adresse ce soit l'URL qui soit appelé
ou le fichier chargé sur votre ordinateur. L'URL est préférable
si vous voulez par la suite visiter plus profondément le site.
- choisir le nombre de moteurs de recherche par requête, et de bipper
pour tout résultat jugé pertinent.
- configurer le proxy si vous en avez un.
Une fois configurer, vous pouvez lancer une requête.
Lancer une recherche
- Fichier / Nouvelle recherche (File / New Search) :
- onglet Question : posez votre question, le boutons Mots clés
(keywords) vous affiche les mots clés en anglais et en français,
puis choisissez la langue des documents que vous voulez consulter, par
défaut l'anglais et le français sont prises en compte.
- onglet Sources :
- Sélection (ou Fichier / Edition des Sources (File
/ Source Edition)) : vous permet de choisir le lieu de recherche
(Web ou NewsGroup) et le type de recherche pour le Web
(Rapide (Quick) ou Recherche étendue (Large)).
Le bouton Editer (Edit) vous permet de créer des groupes
d'URLs servant aux recherches. Si vous cliquez sur Editer (Edit)
:
- dans la fénêtre de gauche (Groupe de Sources
Disponibles (Available Source Groups)), une liste de moteurs
de recherche apparaît. Pour rajouter ou un groupe de moteurs
de recherche ou un seul moteur de recherche :
- cliquez sur Créer Groupe (Add) : donnez un nom
à votre groupe ou moteur;
- cliquez de nouveau sur Créer... (Add) et choisissez
une URL (a URL) si c'est un site spécifique ou un
moteur de recherche (a search engine) (pour les moteurs ou
metamoteurs de recherche).
Une nouvelle fenêtre apparaît, suivez les étapes
numérotées de 1 à 4 :
- 1) indiquez lui l'adresse exacte du site (http://www.lesite.extension);
- 2) cliquez sur Cliquer ici pour obtenir la page (Click
here to obtain the page);
- 3) tapez "$KEYWORD$" dans le champs de
recherche et lancez la recherche (en appuyant sur le bouton
Submit, Search, ... du site);
- 4) puis enfin cliquez sur Quand la page de résultats
est arrivée, cliquez ici (... when the results
are displayed, click here).
Répétez cette manoeuvre autant de fois que vous
désirez avoir d'adresses de sites dans votre groupe.
Au sein d'un groupe déjà existant, vous pouvez
ajouter une adresse en cliquant sur Créer... (Add)
dans la partie gauche de la fenêtre.
Pour supprimer une URL ou un groupe, choisissez le groupe
/ URL à supprimer et cliquez sur Del.
- puis pour vous servir de / des adresses que vous venez d'entrer,
vous pouvez vous créer un "profile", i.e., un
groupe contenant les moteurs que vous voulez utiliser. Dans la
fenêtre de droite (Sélection de Sources (Source
Selections)), vous pouvez cliquer sur Créer (Add),
puis donner un nom à votre source et ensuite, vous avez
juste à sélectionner dans la fenêtre de gauche
les moteurs, ou les groupes, que vous désirez utiliser
et en utilisant les boutons >> ou << pour respectivement
ajouter ou enlever des moteurs ou groupes de la source.
Si vous créer une nouvelle source, une fenêtre de
dialogue apparaît vous demandant si vous voulez garder les
moteurs se trouvant déjà dans la source active.
Choisissez non seulement si vous voulez avoir une source
vierge et choisir vous-même vos moteurs ou groupes de recherche.
- Fichier HTML (HTML Files) : vous permet d'analyser un fichier
HTML particulier (pour les fichiers particulièrement long que
vous voulez analyser).
- Locale (Directory) : analyser les fichiers ayant une extension
particulière et se trouvant soit sur votre disque dur, soit
sur un réseau local.
- URL : analyser un site particulier. Vous pouvez limiter la
recherche à ce site, ainsi, tout hyperlien de ce site renvoyant
à un site extérieur ne sera pas pris en compte.
- onglet Options Avancées (Advanced Options) :
- Arrêt au bout de (Stop After) : une recherche sur le
Web peut prendre beaucoup de temps (et donc beaucoup d'espace disque),
cette option vous permet d'arrêter la recherche au bout de n
heures et / ou de n minutes.
- Vous choisissez l'emplacement où vous voulez que les pages
Web soient copiées sur votre disque dur.
Une fois une recherche effectuée, si vous allez dans ce répertoire
(avec l'explorateur Windows par exemple) , vous verrez des répertoires
numérotés de 0 à n, chaque répertoire
contenant un ou plusieurs sous-répertoires portant le nom d'un
site. Ce sous-répertoire contient lui même un ou plusieurs
fichiers. Si vous désirez lire ces fichiers, cliquez avec le
bouton droit de la souris sur le fichier, cliquez sur Ouvrir avec
et choisissez votre navigateur (iexplore, Netscape, etc.).
- La dernière option vous permet de limiter la profondeur de
la recherche - 10 est une profondeur raisonnable.
- Conseils :
- plus le temps de recherche sera long et plus il téléchargera
de fichiers, faîtes donc attention à la place que
vous avez sur votre disque dur;
- plus la profondeur est important et, selon le temps indiquer,
moins de sites seront visités.
- Fichier / Serveurs Interdits (File / Forbidden Hosts) : vous permet
d'interdire des recherches sur des sites particuliers. Pour implémenter
cette liste, vous pouvez soit taper l'adresse du site, soit, une fois qu'une
recherche a été effectuée, cliquer sur la ligne indiquant
le site puis cliquer sur le menu déroulant Résultats / Ajouter
ce serveur aux serveurs interdits (Results / Ignore this Host for futur searches).
- Fichier / Exporter (File / Export) : vous permet d'enregistrer
le résultat de votre recherche au format HTML (une liste de résultat
(a result list) et une liste de résultat avec résumé
(a result list with relevant extracts)).
Les résultats
- Une fois une requête lancée, la fenêtre de DigOut4U se
divise en 2. La partie supérieure vous indique, entre autre, le titre
de la page, son adresse, sa pertinence (grâce à la petite tête
à gauche du titre - plus elle sourit, mieux c'est - et à l'indice
Pertinence (Relevancy)). En cliquant une fois sur l'une des lignes,
la page Web (chargée sur votre disque dur) apparaît dans la partie
basse de la fenêtre. Si vous désirez consulter une page en local
sur votre navigateur, allez dans Résultats / Lance le navigateur
sur le fichier (local) (Results / Launch Browser on stored files). En
double cliquant, la page apparaît dans votre navigateur. Vous pouvez
ainsi consulter les pages en local ou en ligne pendant que la recherche se
poursuit.
- La petite étoile qui apparaît sur la tête près
du titre de la page vous indique que la page n'a pas été consultée.
L'étoile disparaît dans le cas contraire.
- Une recherche peut être arrêter en cliquant sur la croix rouge
ou en allant dans Recherche / Démarrer/Arrêter la recherche
(Search / Start/Stop Search).
- Pour supprimer une ou plusieurs lignes, mettez en subrillance la
/ les lignes à supprimer (si il y a plusieurs lignes qui se suivent,
appuyez sur la touche Shift et cliquez sur les lignes; si les lignes
ne se suivent pas, appuyez sur la touche CTRL et cliquez sur les lignes),
puis appuyez sur la touche Suppr / Del du clavier ou allez dans
Résultats / Supprimer (Results / Delete Selected Reference(s)).
- Résultats / Copier vers le presse-papier (Results / Copy URLs
to Clipboard) vous permet de copier une ou plusieurs URL(s) en mémoire
et de le / les coller, par exemple, dans le champs adresse de votre navigateur
pour une URL, dans un document Word pour une ou plusieurs URL(s), etc.
- Résultats / Extraits Pertinents (Results / Relevant extracts)
vous permet de voir les lignes où apparaîssent les termes de
votre requête au sein de la page que vous avez choisie.
- Une fois que vous avez effectué une recherche, vous pouvez l'enregistrer
en allant dans Fichier / Enregistrer (File / Save). Vous pourrez ainsi
plus tard consulter cette recherche en allant dans Fichier / Ouvrir (File
/ Open) et en choisissant la recherche sur laquelle vous désirez
travailler.