<?xml version='1.0' encoding='UTF-8'?><?xml-stylesheet href="http://www.blogger.com/styles/atom.css" type="text/css"?><feed xmlns='http://www.w3.org/2005/Atom' xmlns:openSearch='http://a9.com/-/spec/opensearchrss/1.0/' xmlns:georss='http://www.georss.org/georss' xmlns:gd='http://schemas.google.com/g/2005' xmlns:thr='http://purl.org/syndication/thread/1.0'><id>tag:blogger.com,1999:blog-291952466913714304</id><updated>2012-02-16T18:05:59.670-08:00</updated><category term='07.Chapitre3'/><category term='03.Table des matières'/><category term='02.Résumé et problématique'/><category term='05.Chapitre1'/><category term='06.Chapitre2'/><category term='00.Présentation'/><category term='08.Conclusion intermédiaire'/><category term='04.Introduction'/><category term='09.Le web sémantique'/><category term='01.Tous les articles'/><category term='11.Bibliographie thématique'/><category term='10.Conclusion générale'/><title type='text'>Marion Consalvi - Mémoire de DEA - Septembre 2004</title><subtitle type='html'>Ce site présente le mémoire de recherche : "Répondre aux besoins d’accès à l’information : le traitement du document textuel numérique. Des services d’information d’entreprises au web sémantique" soutenu le 29 septembre 2004 à l'université d'Aix-Marseille 3.</subtitle><link rel='http://schemas.google.com/g/2005#feed' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/posts/default'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default?max-results=100'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/'/><link rel='hub' href='http://pubsubhubbub.appspot.com/'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><generator version='7.00' uri='http://www.blogger.com'>Blogger</generator><openSearch:totalResults>11</openSearch:totalResults><openSearch:startIndex>1</openSearch:startIndex><openSearch:itemsPerPage>100</openSearch:itemsPerPage><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-1844528150452611578</id><published>2008-04-04T09:32:00.000-07:00</published><updated>2008-08-06T06:03:17.939-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='00.Présentation'/><title type='text'>Présentation</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;Sujet du mémoire de recherche : "&lt;strong&gt;Répondre aux besoins d’accès à l’informations : le traitement du document textuel numérique. Des services d’information d’entreprises au web sémantique&lt;/strong&gt;."&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Mémoire présenté pour l’obtention du DEA Sciences de l’Information et de la Communication et Médiation des Connaissances&lt;br /&gt;&lt;br /&gt;Le 29 septembre 2004&lt;br /&gt;&lt;br /&gt;Université Aix-Marseille 3 – Faculté de Saint-Jérôme&lt;br /&gt;&lt;br /&gt;Sous la direction de Pascal ROBERT&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;em&gt;L’obtention de ce mémoire de DEA en Sciences de l’information et de la communication a permis l’inscription en doctorat de Sciences de l’information et de la communication l’année suivante, à l’université du Sud Toulon Var – Laboratoire I3M&lt;/em&gt;.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href="mailto:marionconsalvi@yahoo.fr"&gt;me contacter&lt;/a&gt;&lt;br /&gt;&lt;a href="http://marionconsalvi.blogspot.com/"&gt;accéder à mon CV en ligne&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Ajouter la page à vos favoris : &lt;a href="http://www.addthis.com/bookmark.php" target="_blank" onclick="window.open('http://www.addthis.com/bookmark.php?wt=nw&amp;pub=marioncons&amp;url='+encodeURIComponent(location.href)+'&amp;title='+encodeURIComponent(document.title), 'addthis', 'scrollbars=yes,menubar=no,width=620,height=520,resizable=yes,toolbar=no,location=no,status=no,screenX=200,screenY=100,left=200,top=100'); return false;" title="Bookmark and Share"&gt;&lt;img alt="Bookmark and Share" src="http://s9.addthis.com/button1-bm.gif" border="0" height="16" width="125" /&gt;&lt;/a&gt;&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-1844528150452611578?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/1844528150452611578/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=1844528150452611578' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/1844528150452611578'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/1844528150452611578'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/avertissement-toute-utilisation-ou.html' title='Présentation'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-2575131952350349619</id><published>2008-04-04T09:19:00.000-07:00</published><updated>2008-08-06T06:03:34.823-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='09.Le web sémantique'/><title type='text'>Perspectives : le web sémantique</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;5 Perspectives : le Web sémantique................................................................................... 68&lt;br /&gt;5.1 Définition du Web sémantique..................................................................................... 68&lt;br /&gt;§ Le Web sémantique se construit autour d'une succession de langages intermédiaires entre la machine et l'Homme 70&lt;br /&gt;5.2 L'indexation du Web.................................................................................................... 71&lt;br /&gt;5.2.1 Le mot clé....................................................................................................................................................... 72&lt;br /&gt;§ Le « mot clé », les métadonnées et le web...................................................................................................... 72&lt;br /&gt;§ Le « mot clé » et la recherche web................................................................................................................... 73&lt;br /&gt;§ Mot clé, page web, XML et les champs interrogeables............................................................................... 73&lt;br /&gt;5.2.2 Le "Google Bombing".................................................................................................................................. 74&lt;br /&gt;5.2.3 RDF................................................................................................................................................................. 74&lt;br /&gt;5.3 Les moteurs de recherche du Web............................................................................. 75&lt;br /&gt;5.3.1 Qu'est-ce qu'un moteur de recherche ?...................................................................................................... 75&lt;br /&gt;§ Les robots............................................................................................................................................................ 75&lt;br /&gt;§ La base de données........................................................................................................................................... 76&lt;br /&gt;§ Les agents........................................................................................................................................................... 76&lt;br /&gt;5.3.2 Les différentes catégories de moteurs de recherche............................................................................... 77&lt;br /&gt;§ Les catalogues matières.................................................................................................................................... 77&lt;br /&gt;§ Les robots automatiques................................................................................................................................... 78&lt;br /&gt;5.3.3 Les stratégies de recherche......................................................................................................................... 78&lt;br /&gt;§ Les obstacles à la recherche d'information..................................................................................................... 78&lt;br /&gt;5.4 Analyses de sites Web................................................................................................. 79&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;1 Perspectives : le Web sémantique&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Pour autant, peut-on établir un corollaire entre le monde de l'entreprise et l'Internet, dans les différentes phases de traitement du document textuel numérique ?&lt;br /&gt;L'hypothèse de départ est la suivante : au contraire des pages institutionnelles, les pages personnelles sont indexées par des non professionnels du référencement (ou de l'indexation). Dès lors, ces derniers, non formés et non qualifiés, ne peuvent pas prétendre répondre aux exigences du Web sémantique. Celui-ci sera réservé aux institutions (appliquant les principes de l'indexation électronique décrits dans les parties 2 et 3), "offrant" au Web leur bases de données. Nous nous dirigeons finalement vers deux webs distincts, l'un contenant des pages institutionnelles (entreprises, gouvernement...), constituant le Web sémantique, une fois les problèmes techniques surmontés et les normes mises en place, l'autre des pages personnelles, faiblement indexées. Le corollaire peut donc s'établir si l'on ne prend en compte que les pages des entreprises.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300130"&gt;1.1 Définition du Web sémantique&lt;/a&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn1" name="_ftnref1"&gt;[1]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Tim Berners-Lee, il y a quatre ans, a mis en branle un ambitieux projet pour tenter d'insuffler un peu d'intelligence dans la Toile. Sous les auspices du World Wide Web Consortium, l'organisme à but non lucratif dont il est le directeur depuis 1994, il travaille à la réalisation d'une extension (et non d'un remplacement) du Web actuel, qu'il a baptisée le "Web sémantique" (ou Semantic Web en anglais).&lt;br /&gt;La manière dont fonctionnent aujourd'hui les moteurs de recherche est intimement liée à l'histoire d'Internet. C'est en 1989 que le Web voit officiellement le jour dans les laboratoires du Conseil européen pour la recherche nucléaire (CERN) en Suisse. Tim Berners-Lee cherche alors un système pour faciliter l'accès aux documents scientifiques stockés dans les ordinateurs des multiples universités et instituts de recherche qui collaborent avec le CERN. Avec son collègue Robert Cailliau, il développe les deux normes à la base du Web: l'Hypertext Transfer Protocol (HTTP) et l'Hypertext Markup Language (HTML). Ces outils permettent à l'utilisateur de "naviguer" grâce à un réseau de "noeuds" et de "liens" reliant les documents entre eux pour former une immense "toile" - d'où le nom de "Web". D'un clic de souris, on peut consulter aisément des documents aux quatre coins du globe - d'où le qualificatif de "World Wide".&lt;br /&gt;Pour des raisons pratiques, le langage HTML sert principalement à définir l'affichage des données: ce bout-ci de texte doit être en gras, celui-là est de couleur rouge et en italique, cette image est alignée à droite, etc. Cependant, HTML ne dit rien sur le contenu lui-même des pages. Pour user d'une métaphore, le Web, en fait, ne sait pas ce qu'il contient. C'est ce que Tim Berners-Lee veut changer. Dans le futur Web sémantique, différentes technologies doivent permettre de mieux structurer les documents et d'identifier les données qu'ils contiennent. Cela sera notamment effectué grâce au langage XML - alias eXtensible Markup Language. Émanant du W3C, cette norme permet de créer son propre jeu d'étiquettes afin d'identifier les différentes parties de ses documents (voir l'encadré). Depuis environ un an, XML a le vent en poupe comme norme de prédilection pour l'échange de données entre logiciels, sur le Net comme ailleurs. Il remplace progressivement les anciens formats de données dits "propriétaires", créés à l'origine par les éditeurs de logiciels.&lt;br /&gt;Une autre technologie, baptisée RDF, ou Resource Description Framework, servira à donner du sens à la structure XML des documents ; comme dans le langage humain où le sens n'émane pas seulement de phrases composées d'un sujet, d'un verbe et de compléments, RDF servira à décrire les relations entre les différents éléments XML.&lt;br /&gt;Cependant, différents concepteurs de sites peuvent employer différents termes ou étiquettes pour exprimer le même concept. Et c'est là qu'intervient le rouage le plus ambitieux du Web sémantique. De vastes dictionnaires appelés des "ontologies" seront chargés de répertorier les équivalences entre termes, de manière à ce que l'on sache que le terme X sur tel site exprime le même concept que le terme Y sur tel autre site. En principe, ce mécanisme devrait grandement améliorer la précision des moteurs de recherche car, grâce aux ontologies, ils pourront rechercher les pages qui correspondent à un concept donné plutôt que, comme ils le font actuellement, celles qui contiennent simplement les mots clés particuliers. Une autre norme, OWL pour Ontology Web Language, servira à codifier les futurs dictionnaires ou encyclopédies ontologiques.&lt;br /&gt;Enfin, une recherche sur le Web sémantique ne s'exécutera plus nécessairement à l'aide d'un gigantesque moteur de recherche, mais plutôt par un réseau de dizaines, voire de centaines, de petits agents intelligents spécialisés. DARPA, l'organisme états-unien à l'origine d'Internet, s'intéresse beaucoup à ces agents et finance même le développement de leur futur langage: le DAML, ou DARPA Agent Markup Language.&lt;br /&gt;&lt;br /&gt;L'élaboration d'un Web sémantique permettra de faciliter l'ensemble des opérations de traitement de l'information textuelle que ce soit la recherche, l'indexation, la condensation, la traduction, etc. Concentrant ses énergies sur le début du cycle de vie documentaire, le Web sémantique apparaît comme complémentaire aux efforts effectués pour le traitement de l'information textuelle peu ou pas structurée.&lt;br /&gt;Pour résumer :&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300131"&gt;§ Le Web sémantique se construit autour d'une succession de langages intermédiaires entre la machine et l'Homme&lt;/a&gt;&lt;br /&gt;Le terme sémantique implique que la machine ne se contentera plus de présenter visuellement les données du Web, mais, en les reliant, elle pourra conserver les significations qui leur sont attribuables. Ainsi, le dialogue avec les moteurs de recherche devient possible. Cette "compréhension" des ressources du Web par la machine exige que le document conserve toute sa valeur informationnelle explicite et implicite. Des préalables sont nécessaires :&lt;br /&gt;1. L'ordinateur ne comprenant à la base que le langage binaire, il faut d'abord représenter la plus petite unité informationnelle humaine, soit le caractère. Universels, les jeux de caractères tels l'ASCII ou l'Unicode permettent cette première représentation. L'information est lisible ou plutôt visible. C'est le Web d'aujourd'hui.&lt;br /&gt;2. L'être humain attribue à des blocs d'informations (mots ou groupe de mots) des significations particulières (titre, auteur, etc.). Or, il est nécessaire de transmettre cette information à la machine si l'on désire conserver toute l'intelligence du document. Le XML permet de répondre à ce besoin en clarifiant pour la machine la structure du document. L'information devient structurée. C'est le Web de demain.&lt;br /&gt;3. Finalement, il existe des relations entre les diverses ressources informationnelles (pages Web, répertoires, etc.). Or, ces relations contiennent des informations implicites qui méritent d'être conservées et exploitées par la machine. RDF (Ressource Description Framework) permet d'établir pour la machine des liens entre les diverses ressources. L'information est maintenant en contexte.&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn2" name="_ftnref2"&gt;[2]&lt;/a&gt;&lt;br /&gt;4. Ultime étape nécessaire à la compréhension de l'information, la confrontation de celle-ci à une base de connaissance, liée à un domaine. Elle correspond à la constitution d'ontologies, créées grâce au langage OWL, et lues par des agents intelligents, grâce au langage DAML. C'est le Web d'après-demain.&lt;br /&gt;&lt;br /&gt;Sous l'expression Web sémantique se regroupe donc "un ensemble de programmes de recherche et de travaux variés. Leur objectif commun est de permettre aux machines d'exploiter automatiquement les contenus de sources d'information accessibles par le Web pour réaliser des tâches variées. La réalisation de cet objectif repose sur l'existence de données, accessibles par le Web, structurées ou semi-structurées, représentées dans un formalisme autorisant des traitements automatisés allant au-delà des traitements liés à la présentation des données et mettant en œuvre des mécanismes d'inférence puissants."&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn3" name="_ftnref3"&gt;[3]&lt;/a&gt;&lt;br /&gt;Le Web sémantique se décline suivant trois couches : les ressources, les métadonnées et les outils de recherches de données.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;La plupart des référenceurs du Web, contrairement aux professionnels de la gestion de l'information (documentalistes et bibliothécaires), ignorent l'analyse documentaire. Contrairement aux outils de conception HTML qui sont quasiment à la portée de tous aujourd'hui, ceux qui serviront à mettre en place le Web sémantique sont surtout conçus pour des spécialistes.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300132"&gt;1.2 L'indexation du Web&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Sur le Web, nous devrons mettre au point un langage universel afin de décrire les données et les rendre inter opérables. Comme le précise avec beaucoup de justesse Karl Dubost, &lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn4" name="_ftnref4"&gt;[4]&lt;/a&gt; "l'humain sait très bien faire des relations avec les objets, nous le faisons tous inconsciemment, mais la machine elle, ne possède pas cette intelligence."&lt;br /&gt;&lt;a name="_Toc84300133"&gt;1.2.1 Le mot clé&lt;/a&gt;&lt;br /&gt;Le Grand dictionnaire terminologique de l'Office de la langue française donne cette définition : "mot ou groupe de mots, éventuellement dans une forme lexicographique normalisée, choisi dans le titre ou le texte d'un document, caractérisant le contenu et permettant la recherche de ce document."&lt;br /&gt;En bibliothéconomie, le mot clé est un terme connu provenant d'une fiche décrivant un document. Le mot clé est réparti dans des zones ou champs «titre», «auteur», «sujet» et «description» ou «note». Le mot clé qui décrit un document se nomme «descripteur» ou vedette-matière.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300134"&gt;§ Le « mot clé », les métadonnées et le web&lt;/a&gt;&lt;br /&gt;Le terme « mot clé » s'est imposé sur le web par l'intermédiaire des fureteurs comme Netscape. Il est une composante appelée «méta balise» placée dans l'en-tête invisible d'une page HTML. Il a été introduit dans les propriétés de la page comme attribut avec le champ « classification ». Ces deux attributs proviennent du vocabulaire bibliothéconomique, donnant à penser qu'ils ont été choisis pour un usage professionnel. Utilisés par des néo&lt;a name="_Hlt84247108"&gt;p&lt;/a&gt;hytes de la documentation, ces mots ont été pris dans leur sens général sans aucun repère, donc en vocabulaire libre. C'est ainsi que «mot clé» réfère à une page et n'a de référence qu'à cette page rédigée par un auteur ayant décrit le contenu en ses propres mots. Ceux-ci ne réfèrent pas à un ensemble de pages de plusieurs auteurs ayant le même mot en commun. Ce mot clé n'est pas un mot normalisé. La majorité des auteurs ne sont pas des indexeurs professionnels et n'utilisent pas de thésaurus. Lorsqu'ils en utilisent un, celui-ci est analogue mais primaire, aléatoire et en perpétuelle évolution : le web par le truchement des logiciels de recherche.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300135"&gt;§ Le « mot clé » et la recherche web&lt;/a&gt;&lt;br /&gt;Plusieurs nomment le « mot clé », le mot utilisé pour la recherche. Or ce mot fait partie du vocabulaire libre et non normalisé. Parce qu'il est libre, il y a rarement adéquation entre le « mot clé » indexé comme attribut ou méta-balise dans les propriétés de la page web et le mot de la recherche. Qui plus est, des moteurs de recherche ne tiennent pas compte de cet attribut. Ainsi, le « mot clé » ne réfère plus à l'attribut, mais aux mots du texte.&lt;br /&gt;Les « mots clés » en tant que mot générant un corpus de pages pertinentes sont donc :&lt;br /&gt;- des noms de personne,&lt;br /&gt;- des noms géographiques,&lt;br /&gt;- des noms d'entreprises,&lt;br /&gt;- des marques de commerce,&lt;br /&gt;- des mots spécialisés ou rares,&lt;br /&gt;- des mots de titre connu d'un document (livre, article, rapport, chansons.. ), d'une expression ou citation connue.&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn5" name="_ftnref5"&gt;[5]&lt;/a&gt;&lt;br /&gt;Pour qu’une recherche arrive à terme, il faut qu’il y ait un langage commun entre le chercheur et l’auteur. Ce langage peut être puisé dans des répertoires (comme Yahoo) qui ont développé une classification.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300136"&gt;§ Mot clé, page web, XML et les champs interrogeables&lt;/a&gt;&lt;br /&gt;Cela dit, une page web contient des champs de recherche comme dans une notice bibliographique. Ces champs ont deux formes : les champs fixes et les champs flottants.&lt;br /&gt;Les champs fixes sont définis comme des champs communs à toutes les pages : l'adresse URL, le nom de domaine, le titre de la page, la description, le texte, le nom du serveur.&lt;br /&gt;Les champs flottants sont définis comme des champs pouvant être ajoutés lors de la rédaction d'une page web : la date de création, l'hyperlien, le nom de l'hyperlien, l'image, le son, l'applet. &lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn6" name="_ftnref6"&gt;[6]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Les auteurs n'ont pas compris la nature du web dans laquelle chaque page est considérée par les logiciels de recherche comme un document unique. Ce sont ces pages inappropriées, entre autres, qui augmentent le nombre de réponses non pertinentes dans une requête, ce qui est appelé le «bruit». Afin de contrer ce phénomène, il est impératif qu'une page ait un sujet et au moins un qualificatif ou un déterminatif. Par exemple, donner la requête «automobile» à un index de recherche est inutile, il faut ajouter un qualificatif comme « ancienne », ou un déterminatif comme «d'occasion». Pour un commerce, le déterminatif de lieu peut être déterminant. En termes linguistiques, il faut rédiger un syntagme descriptif.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300137"&gt;1.2.2 Le "&lt;/a&gt;Google Bombing"&lt;br /&gt;Nombres d'usagers ayant connaissance des grands principes de l'algorithmie de Google (pages pivot et pages d'autorités, pertinence d'une page liée au nombre de liens pointant vers elle), se servent de cette connaissance pour fausser ces résultats. Le "Google Bombing" désigne ainsi le fait de créer une page dans laquelle on va associer le nom d'une personnalité à une expression visant à la discréditer. Il suffit alors de faire référencer cette page par des sites disposant d'un bon PageRank (indice de classement de Google) pour qu'en quelques jours l'entrée de l'expression associée à la personnalité en question soit considérée comme allant de fait par ce moteur de recherche et renvoie sur des pages officielles de la personne.&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn7" name="_ftnref7"&gt;[7]&lt;/a&gt;&lt;br /&gt;Au-delà de la logique subversive qui sous-tend ces pratiques à l'échelle individuelle, il faut s'interroger sur la position de leader de Google, le constituant de fait comme une formidable machine à façonner l'opinion internationale.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300138"&gt;1.2.3 RDF&lt;/a&gt;&lt;br /&gt;Pour le Web sémantique, RDF est primordial, puisqu'il permet de préciser à la machine la nature d'un objet et ses relations avec les autres. RDF facilite le traitement automatique des ressources Web puisqu'il "situe" l'information, la met en relation. L'utilisation à grande échelle de RDF permettra :&lt;br /&gt;- le traitement des relations entre les ressources d'un site Web,&lt;br /&gt;- l'échange de connaissances par des agents intelligents,&lt;br /&gt;- le filtrage de contenu inappropiré et la protection de la vie privée,&lt;br /&gt;- la description d'une série de pages constituant une seule ressource logique,&lt;br /&gt;- la description des droits relations à la propriété intellectuelle,&lt;br /&gt;- un Web multilingue, etc.,&lt;br /&gt;- une plus grande efficacité des moteurs de recherche.&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn8" name="_ftnref8"&gt;[8]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300139"&gt;1.3 Les moteurs de recherche du Web&lt;/a&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn9" name="_ftnref9"&gt;[9]&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300140"&gt;1.3.1 Qu'est-ce qu'un moteur de recherche ?&lt;/a&gt;&lt;br /&gt;Un moteur de recherche est composé d'un robot, d'une base de données, d'un agent. On l'utilise pour rechercher de l'information spécifique dans les pages HTML (hypertext mark up language) du Web rassemblées par un robot.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300141"&gt;§ Les robots&lt;/a&gt;&lt;br /&gt;Ils sont appelés des "wanderers" (du verbe to wander : vagabonder, errer), des "crawlers" (du verbe to crawl : ramper, se traîner) et aussi des "spiders" (de l'anglais araignées). Ce sont des programmes informatiques qui parcourent le Web pour référencer les liens qui existent dans les pages. Un robot se comporte comme un visiteur, pas comme un virus. Il démarre d'une page d'une page de liens et suivra de façon récursive tous les liens qu'il trouvera à partir de cette page initiale.&lt;br /&gt;Ces robots utilisent le protocole HTTP (hypertext transfer protocole) pour repérer les documents chez les serveurs (les nouveaux sites), indexer l'espace pour la recherche par mots - clés, rechercher les liens morts pour la maintenance des sites jour. Leur fonction est d'indexer, de valider le texte en HTML, les liens, les nouveautés, de créer des sites miroirs. Ils font une liste chronologique des URL (Uniform Ressource Locator), repèrent les documents qui ont des liens, les listes, les annuaires de nouveautés, les best of. Ils parcourent Internet constamment de façon automatique, ils suppriment les doublons.&lt;br /&gt;Chaque robot travaille à sa manière, certains travaillent sur des ressources plus nombreuses que d'autres.&lt;br /&gt;&lt;br /&gt;C'est la qualité de la démarche du robot lorsqu'il parcourt la toile qui détermine la qualité et la quantité des informations ramenées pour alimenter sa base de données.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300142"&gt;§ La base de données&lt;/a&gt;&lt;br /&gt;Les données apportées par les robots sont indexées dans des catalogues qui contiennent les listes de notion repérées : adresse, titres, sous-titres, mots des premières lignes des textes, résumés, éventuellement texte intégral. Ces données sont stockées dans la base de données du moteur avec une adresse qui localise les documents. Par des techniques heuristiques d'auto apprentissage, le robot recherche, trouve et indexe les meilleurs sites. La taille de la base de données détermine la couverture de la recherche. Lycos, par exemple, a plusieurs bases de données : plus un moteur de recherche a de liens, plus il obtient de réponses et devient populaire.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300143"&gt;§ Les agents&lt;/a&gt;&lt;br /&gt;Le véritable potentiel du Web sémantique se révèle vraiment grâce à de petits programmes connus sous le nom d'"agents intelligents". Programmés par l'utilisateur, ils effectuent la recherche et proposent une liste de réponses classées, dans un certain ordre de pertinence. Les moteurs de recherche affichent les adresses des documents qui mentionnent le plus fréquemment le mot clé recherché.&lt;br /&gt;Les agents sur le Web agissent de manière autonome dans le but de réaliser une tâche donnée pour un utilisateur. Parmi ces systèmes, on citera Telescript de General Magic ou Topic de Verity (tous deux en perte de vitesse à cause de problèmes commerciaux), mais aussi des systèmes universitaires tels Softbot, SIMS, ou KSE qui proposent un modèle agent pour la recherche d'informations. Autonomy, très inspiré de l'intelligence artificielle, développé par l'université de Cambridge) est un moteur à raisonnement dynamique, qui suggère des notions voisines afin d'être le plus précis possible.&lt;br /&gt;Ces agents ne coopèrent pas, on peut opter pour la solution "multi-agents".&lt;br /&gt;&lt;br /&gt;Les multi-agents ont une capacité à agir, à décider. Leur principe de travail : la coopération et l'interaction, la résolution de conflits. Leur capacité : les croyances et la capacité à raisonner sur autrui, la capacité à apprendre de manière dynamique. La distribution est un des aspects essentiels des systèmes multi-agents.&lt;br /&gt;Parmi les agents coopératifs, on peut citer InfoSleuth, basé sur la technologie Carnot, qui développe une modélisation sémantique permettant de décrire les ressources d'information et de promouvoir l'utilisation des agents. Avec Infosleuth, on utilise des agents sémantiques pour effectuer des recherches coordonnées; ils coopèrent pour transformer les données trouvées en données compréhensibles.&lt;br /&gt;L'utilisation des agents nécessite une base de connaissance, à laquelle sera confrontée l'information reçue, afin d'en tirer un sens. Cette base de connaissance, c'est l'ontologie (ou plutôt les ontologies, puisqu'il y aura nécessairement plusieurs domaines abordés), qui présente, par sa sémantique, une vision d'un domaine.&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn10" name="_ftnref10"&gt;[10]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300144"&gt;1.3.2 Les différentes catégories de moteurs de recherche&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300145"&gt;§ Les catalogues matières&lt;/a&gt;&lt;br /&gt;Ce sont des index hiérarchiques dans lesquels on peut faire des recherches. Ils sont faits par des individus qui les sélectionnent et les annotent. Ils sont interrogeables par sujet matière et constituent une table des matières géante, un répertoire par sujet, permettant de combiner la classification hiérarchique à des mots clés : Yahoo, Infoseek sont ainsi faits. CUI W3, répertoire sujet unique est entièrement fait à partir de listes faites à la main et réalise une banque de données à partir de neuf catalogues matières.&lt;br /&gt;On peut citer parmi les plus intéressants : World Wide Web Virtual Library Subject Headings, Clearinghouse for Subject-Oriented Internet Ressources Guides ou des listes spécialisées comme Information Ressources : the Internet and Computer-Mediated Communication : informations présélectionnées en catégories. Mieux organisés, plus faciles à interroger, ces moteurs ont malgré tout des limites telles que la fréquence des mises à jour, une couverture moins large.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300146"&gt;§ Les robots automatiques&lt;/a&gt;&lt;br /&gt;Ils parcourent le Web de façon autonome et réagissent en fonction des artefacts rencontrés. Ils examinent les URL et en extraient les éléments importants. Ils sont tous différents, c'est pourquoi on conseille toujours d'en essayer plusieurs.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300147"&gt;1.3.3 Les stratégies de recherche&lt;/a&gt;&lt;br /&gt;Les moteurs de recherche permettent différentes manières pour rechercher l'information. Nous proposons en Annexe un tableau récapitulatif des différentes stratégies de recherche d'information.&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn11" name="_ftnref11"&gt;[11]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300148"&gt;§ Les obstacles à la recherche d'information&lt;/a&gt;&lt;br /&gt;L'absence de neutralité du moteur de recherche&lt;br /&gt;Quand nous consultons une page de résultat de Google ou de tout autre moteur utilisant un algorithme semblable, nous ne disposons pas simplement du résultat d’un croisement combinatoire binaire entre des pages répondant à la requête et d’autres n’y répondant pas ou moins (matching). Nous disposons d’une vue sur le monde (watching) dont la neutralité est clairement absente. Derrière la liste de ce résultat se donnent à lire des principes de classification du savoir et d'autres encore plus implicites d'organisation des connaissance.&lt;br /&gt;La "marchandisation" du Web&lt;br /&gt;Google, introduit en bourse il y a peu, remet en cause la recherche pertinente de l'information. Ainsi, devant l'ampleur de la toile mondiale et la difficulté de recensement de l'ensemble des informations disponibles, de plus en plus d'acteurs majeurs de la recherche d'information sur le Web fusionnent et se regroupent, ce qui donne lieu à un échange ou à une vente de tout ou partie de leurs bases d'index et de leurs bases de données. Par exemple, la partie "annuaire" de Google est fournie par Open Directory. Les requêtes sur les deux moteurs donneront donc les mêmes résultats, ce qui constitue un danger pour l'usager qui n'en a pas conscience.&lt;br /&gt;&lt;br /&gt;De plus, l'arrivée de l'indexation payante s'affirme comme le seul modèle économiquement viable pour les différents outils de recherche. Cette logique et les pratiques qui lui sont associées (achat de mots clés auprès de certains moteurs, garanties de "positionnement" dans la liste des résultats, etc.) constitue un biais évident pour l'objectivation du déroulement d'une procédure de recherche d'information.&lt;br /&gt;L'évolution des langages&lt;br /&gt;Pourra-t-on encore lire les documents dans quelques années ?&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300149"&gt;1.4 Analyses de sites Web&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Le but de l'analyse est de rendre compte qu'il existe deux types de sites, que l'on pourra classer dans deux catégories de Web différents.&lt;br /&gt;Le corpus reste à définir, il s'agira cependant d'analyser deux catégories de sites Web : les pages "personnelles" et les pages "institutionnelles".&lt;br /&gt;L'analyse portera notamment sur :&lt;br /&gt;- l'indexation des sites : l'utilisation des métadonnées et leur référencement (et par voie de conséquence la recherche de ces sites),&lt;br /&gt;- la valeur et l'objectivation de l'information contenue dans ces sites.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Le Web, conçu d’abord comme un outil de communication, est aussi un outil documentaire (fonctions de publication, stockage, classement, recherche). À terme, on peut donc imaginer la généralisation de ce qui se fait en entreprise au Web.&lt;br /&gt;Il faut d'abord constituer les fameux dictionnaires ontologiques pour, idéalement, tous les domaines du savoir humain et dans toutes les langues. Ensuite, il faudra convaincre la communauté du Web de bien vouloir inoculer un peu de XML, de RDF et autres nouveaux langages dans les quelque milliards de pages du Web actuel...&lt;br /&gt;En effet, le champ sémantique du Web est actuellement trop large (alors qu’en entreprise, le champ sémantique est restreint par son activité), pour permettre une recherche fine en langage naturel. Les données sont trop volumineuses, hétérogènes et les profils des utilisateurs variés. Devant l'ampleur de ce chantier, l'une des possibilités envisagées est - logiquement - de déléguer cette corvée à des agents intelligents. Ceux-ci pourraient adapter dynamiquement les pages Web, y insérer des balises sémantiques et aussi y ajouter des liens vers d'autres pages au contenu similaire.&lt;br /&gt;Le Web sémantique s’adressera à un contenu de valeur, issu des entreprises et des grandes organisations. Ce Web, deuxième génération, prendra alors la forme de la tant attendue base de données aux allures de bibliothèque virtuelle.&lt;br /&gt;&lt;br /&gt;Pour l'heure, le Web sémantique trace son chemin dans les laboratoires de recherche et au sein de quelques entreprises. Ses applications sont pour l'instant réservées à des domaines spécialisés, bien définis, où il est plus aisé de constituer des ontologies. Chez le constructeur aéronautique Airbus, par exemple, on regarde comment améliorer l'archivage des connaissances des ingénieurs spécialisés en conception d'avions grâce aux possibilités qu'offrirait ce "super-Web". &lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn12" name="_ftnref12"&gt;[12]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref1" name="_ftn1"&gt;[1]&lt;/a&gt; Cf. l'article : CHARTIER, Philippe, Un Web plus intelligent [en ligne], Disponible sur &lt;&lt;a href="http://www.cybersciences.com/cyber/4.0/2004/09/web.asp"&gt;http://www.cybersciences.com/cyber/4.0/2004/09/web.asp&lt;/a&gt; &gt;.&lt;br /&gt;consulté le 20 septembre 2004)&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref2" name="_ftn2"&gt;[2]&lt;/a&gt; BERTRAND-GASTALDY, Suzanne, Le Web sémantique [en ligne],&lt;br /&gt;Disponible sur &lt;&lt;a href="http://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu"&gt;HTTP://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref3" name="_ftn3"&gt;[3]&lt;/a&gt; &lt;&lt;a href="http://www.lalic.paris4.sorbonne.fr/stic/presentation5.html"&gt;http://www.lalic.paris4.sorbonne.fr/stic/presentation5.html&lt;/a&gt;&gt;, cité par : Educnet, Vers le Web sémantique, In : Métadonnées, normes et standards [en ligne], Disponible sur &lt;&lt;a href="http://www.educnet.education.fr/dossier/metadata/quoi4.htm"&gt;http://www.educnet.education.fr/dossier/metadata/quoi4.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref4" name="_ftn4"&gt;[4]&lt;/a&gt; Cité par : DUVAL, Marc, Le mot clé [en ligne], Disponible sur &lt;&lt;a href="http://www.dsi-info.ca/mot-cle.html"&gt;HTTP://www.dsi-info.ca/mot-cle.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref5" name="_ftn5"&gt;[5]&lt;/a&gt; Source : DUVAL, Marc, Le mot clé [en ligne], Disponible sur : &lt;&lt;a href="http://www.dsi-info.ca/mot-cle.html"&gt;HTTP://www.dsi-info.ca/mot-cle.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref6" name="_ftn6"&gt;[6]&lt;/a&gt; Source : DUVAL, Marc, Le mot clé [en ligne], Disponible sur : &lt;&lt;a href="http://www.dsi-info.ca/mot-cle.html"&gt;HTTP://www.dsi-info.ca/mot-cle.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref7" name="_ftn7"&gt;[7]&lt;/a&gt; Ainsi, la requête "miserable failure" renvoyait sur le site officiel de Georges W. Bush. In : ERTZSCHEID, Olivier ; GALLEZOT, Gabriel, « Des machines pour chercher au hasard : moteurs de recherche et recherche d'information », In : XIVe congrès SFSIC, Béziers 2004, Questionner l'internationalisation : cultures, acteurs, organisations, machines [en ligne], Disponible sur &lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/sic_00000989.html"&gt;HTTP://archivesic.ccsd.cnrs.fr/sic_00000989.HTML&lt;/a&gt;&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref8" name="_ftn8"&gt;[8]&lt;/a&gt; BERTRAND-GASTALDY, Suzanne, Le Web sémantique [en ligne],&lt;br /&gt;Disponible sur &lt;&lt;a href="http://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu"&gt;HTTP://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref9" name="_ftn9"&gt;[9]&lt;/a&gt; Cette partie s'inspire notamment des travaux menés par : URFIST, Moteurs de recherche : un petit récapitulatif [en ligne], Disponible sur &lt;&lt;a href="http://www.urfist.cict.fr/moteurbis.html"&gt;HTTP://www.urfist.cict.fr/moteurbis.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref10" name="_ftn10"&gt;[10]&lt;/a&gt; Voir à ce sujet la partie 3.1.2., sur les langages de description du document.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref11" name="_ftn11"&gt;[11]&lt;/a&gt; Source du tableau : URFIST, Moteurs de recherche : un petit récapitulatif [en ligne], Disponible sur &lt;&lt;a href="http://www.urfist.cict.fr/moteurbis.html"&gt;HTTP://www.urfist.cict.fr/moteurbis.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref12" name="_ftn12"&gt;[12]&lt;/a&gt; CHARTIER, Philippe, Un Web plus intelligent [en ligne], Disponible sur &lt;&lt;a href="http://www.cybersciences.com/cyber/4.0/2004/09/web.asp"&gt;http://www.cybersciences.com/cyber/4.0/2004/09/web.asp&lt;/a&gt;&gt; (consulté le 20 septembre 2004).&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-2575131952350349619?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/2575131952350349619/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=2575131952350349619' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/2575131952350349619'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/2575131952350349619'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/perspectives-le-web-smantique.html' title='Perspectives : le web sémantique'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-3358168101295986139</id><published>2008-04-04T08:27:00.000-07:00</published><updated>2008-08-06T06:03:48.043-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='11.Bibliographie thématique'/><title type='text'>Bibliographie thématique</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;Généralités - Définitions&lt;br /&gt;&lt;br /&gt;AFNOR, Vocabulaire de la documentation, 1987.&lt;br /&gt;&lt;br /&gt;Encyclopédie Yahoo [en ligne], Disponible sur &lt;&lt;a href="http://rtp-doc.enssib.fr/"&gt;http://rtp-doc.enssib.fr/&lt;/a&gt;&gt; (consulté le 2 mars 2004).&lt;br /&gt;&lt;br /&gt;LAMIZET, Bernard ; SILEM, Ahmed, Dictionnaire encyclopédique des sciences de l’information et de la communication, Ellipses, 1997.&lt;br /&gt;&lt;br /&gt;MIST, Les logiciels de traitement de l’information, quelques définitions [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt; (consulté le 10 juin 2004).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Documentaliste - Documentation&lt;br /&gt;&lt;br /&gt;ACCART, Jean-Philippe et RETHY, Marie-Pierre. Le métier de documentaliste. Paris : Editions du Cercle de la Librairie, 1999.&lt;br /&gt;&lt;br /&gt;ADBS éditions, Les professionnels de l’information – documentation au service des citoyens, des organisations et des entreprises [en ligne], novembre 2003, Disponible sur &lt;&lt;a href="http://rtp-doc.enssib.fr/"&gt;http://rtp-doc.enssib.fr/&lt;/a&gt;&gt; (consulté le 8 décembre 2003).&lt;br /&gt;&lt;br /&gt;TARONDEAU, Jean-Claude, Le management des savoirs, PUF, 2003, coll. « Que sais-je ? ».&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Information numérique&lt;br /&gt;&lt;br /&gt;Université de Montréal, École de bibliothéconomie et des sciences de l'information, Guide de l'étudiant - Certificat en gestion de l'information numérique - 2004-2005 [en ligne], Disponible sur &lt;&lt;a href="http://www.ebsi.umontreal.ca/guidegin/guide-gin-0405.pdf"&gt;HTTP://www.ebsi.umontreal.ca/guidegin/guide-gin-0405.pdf&lt;/a&gt;&gt; (consulté le 22 septembre 2004).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Document&lt;br /&gt;&lt;br /&gt;DOCSI, Le document numérique : un objet fédérateur de recherche en sciences de l’information [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/04/17/sic_00000417_02/sic_00000417.html"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/04/17/sic_00000417_02/sic_00000417.HTML&lt;/a&gt;&gt; (consulté le 12 octobre 2003).&lt;br /&gt;&lt;br /&gt;SALAÜN, Jean-Michel, Chronique inachevée d’une réflexion collective sur le document [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://rtp-doc.enssib.fr/fichiers/DefinitionDocument/Bibliotheque_document/Com-et-lang-09-01-2004.doc"&gt;HTTP://rtp-doc.enssib.fr/fichiers/DefinitionDocument/Bibliotheque_document/Com-et-lang-09-01-2004.doc&lt;/a&gt;&gt; (consulté le 6 février 2004).&lt;br /&gt;&lt;br /&gt;SALAÜN, Jean-Michel, Document : forme, signe et médium, les re-formulations du numérique [en ligne], Disponible sur &lt;&lt;a href="http://rtp-doc.enssib.fr/"&gt;http://rtp-doc.enssib.fr/&lt;/a&gt;&gt; (consulté le 12 octobre 2003).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Technologie intellectuelle&lt;br /&gt;&lt;br /&gt;ROBERT, Pascal, « Les technologies intellectuelles : typologie », In : Communication et langages, 125, septembre 2000, Armand Colin éditeur.&lt;br /&gt;&lt;br /&gt;ROBERT, Pascal, « Qu’est-ce qu’une technologie intellectuelle ? », In : Communication et langages, 123, premier trimestre 2000, Armand Colin éditeur.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Besoins en informations&lt;br /&gt;&lt;br /&gt;« Évaluer la demande et les besoins en informations : pour des enquêtes croisées », In : Documentaliste - Sciences de l’information, 2001, vol. 38, n° 1, p. 14-23.&lt;br /&gt;&lt;br /&gt;LE COADIC, Yves, Le besoin d’information, formulation, négociation, diagnostic, ADBS éditions, 1998.&lt;br /&gt;&lt;br /&gt;MUET, Florence ; SALAÜN, Jean-Michel, Stratégie marketing des services d’information, Éditions du Cercle de la Librairie, 2001.&lt;br /&gt;&lt;br /&gt;SIBERTIN-BLANC, Martine, Nouvelles technologies et communication de l’information, des besoins des utilisateurs à l’ingénierie documentaire, ADBS éditions, 1994.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Analyse de l’information&lt;br /&gt;&lt;br /&gt;BERTRAND-GASTALDY, Suzanne, Comment les logiciels de bases de données bibliographiques et textuelles peuvent-ils répondre aux différents besoins de leurs utilisateurs ? [en ligne], Disponible à l’adresse :&lt;br /&gt;&lt;&lt;a href="http://www.ling.uqam.ca/sato/publications/bibliographie/Ind_lang.htm"&gt;HTTP://www.ling.uqam.ca/sato/publications/bibliographie/Ind_lang.htm&lt;/a&gt;&gt; (consulté le 8 novembre 2002).&lt;br /&gt;&lt;br /&gt;BERTRAND-GASTALDY, Suzanne, Le traitement de l'information : de la description à l'analyse automatisée, de l'analyse automatisée à... [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://www.ling.uqam.ca/sato/publications/bibliographie/Asted93.htm"&gt;HTTP://www.ling.uqam.ca/sato/publications/bibliographie/Asted93.htm&lt;/a&gt;&gt; (consulté le 22 septembre 2004).&lt;br /&gt;&lt;br /&gt;BERTRAND-GASTALDY, Suzanne, L'évolution de la gestion de l'information documentaire sous l'impulsion des nouvelles technologies [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://www.ling.uqam.ca/sato/publications/bibliographie/Termino.htm"&gt;HTTP://www.ling.uqam.ca/sato/publications/bibliographie/Termino.htm&lt;/a&gt;&gt; (consulté le 22 septembre 2004).&lt;br /&gt;&lt;br /&gt;CHAUMIER, Jacques, Les techniques documentaires, PUF, 2000, coll. « Que sais-je ? », n°1419.&lt;br /&gt;&lt;br /&gt;DUVAL, Marc, Le mot clé, [en ligne], Disponible sur : &lt;&lt;a href="http://www.dsi-info.ca/mot-cle.html"&gt;HTTP://www.dsi-info.ca/mot-cle.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;br /&gt;JOLION, Jean-Michel, Dir., « L’indexation », In : Document numérique, vol. 4, n°1-2, 2000, Hermès Science Publications, 2001.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Ontologies&lt;br /&gt;&lt;br /&gt;CORBY, Olivier, INRIA, Les ontologies, [en ligne], Disponible sur &lt;&lt;a href="http://rangiroa.essi.fr/cours/internet/02-ontologie.pdf"&gt;HTTP://rangiroa.essi.fr/cours/internet/02-ontologie.pdf&lt;/a&gt;&gt; (consulté le 21 janvier 2004).&lt;br /&gt;&lt;br /&gt;EurOnto, L’art de l’ontologie [en ligne], Disponible sur &lt;&lt;a href="http://www.euronto.com/grenonto/ontologie_nar.htm"&gt;HTTP://www.euronto.com/grenonto/ontologie_nar.htm&lt;/a&gt;&gt; (consulté le 21 janvier 2004).&lt;br /&gt;&lt;br /&gt;GANDON, Fabien, IRIT, Ontologie, l’objet et le processus [en ligne], Disponible sur &lt;&lt;a href="http://www.irit.fr/GRACQ/COURS/CoursFabienGandon.htm"&gt;HTTP://www.irit.fr/GRACQ/COURS/CoursFabienGandon.htm&lt;/a&gt;&gt; (consulté le 21 janvier 2004).&lt;br /&gt;&lt;br /&gt;OUZIRI, Mourad, Modélisation, interrogation et génération de documents sur le web [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/89/sic_00000389_02/sic_00000389.html"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/89/sic_00000389_02/sic_00000389.HTML&lt;/a&gt;&gt; (consulté le 12 octobre 2003).&lt;br /&gt;&lt;br /&gt;Université de la Sorbonne, Les ontologies, [en ligne], Disponible sur &lt;&lt;a href="http://www.lalic.paris4.sorbonne.fr/stic/data/A25W-ExpoOnto.pdf"&gt;HTTP://www.lalic.paris4.sorbonne.fr/stic/data/A25W-ExpoOnto.pdf&lt;/a&gt;&gt; (consulté le 21 janvier 2004).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Recherche d'informations - Moteurs de recherche&lt;br /&gt;&lt;br /&gt;FOUCART, Stéphane, « Des ˝métamoteurs˝ aux agents intelligents », In : Le Monde [en ligne], 6 mars 2002, Disponible sur cédérom, 2003.&lt;br /&gt;&lt;br /&gt;FOUCART, Stéphane, « Les moteurs de recherche sur la voie de l’intelligence », In : Le Monde [en ligne], 6 mars 2002, Disponible sur cédérom, 2003.&lt;br /&gt;&lt;br /&gt;FRAISSARD, Guillaume, sans titre, In : Le Monde Interactif [en ligne], 1er juin 2002, Disponible sur cédérom, 2003.&lt;br /&gt;&lt;br /&gt;ERTZSCHEID, Olivier ; GALLEZOT, Gabriel, « Des machines pour chercher au hasard : moteurs de recherche et recherche d'information », In : XIVe congrès SFSIC, Béziers 2004, Questionner l'internationalisation : cultures, acteurs, organisations, machines [en ligne], Disponible sur &lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/sic_00000989.html"&gt;HTTP://archivesic.ccsd.cnrs.fr/sic_00000989.HTML&lt;/a&gt;&gt; (consulté le 22 septembre 2004).&lt;br /&gt;&lt;br /&gt;LARDY, Jean-Pierre, Méthodes de tri des résultats des moteurs de recherche [en ligne], Disponible sur &lt;&lt;a href="http://www.adbs.fr/adbs/viepro/sinfoint/lardy/risi.htm"&gt;HTTP://www.adbs.fr/adbs/viepro/sinfoint/lardy/risi.htm&lt;/a&gt;&gt; (consulté le 6 novembre 2003).&lt;br /&gt;&lt;br /&gt;LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;br /&gt;MACKE, Gaëlle, MATHIEU, Bénédicte « Internet : le moteur de recherche Google lance une revue de presse sans journaliste », In : Le Monde [en ligne], 28 septembre 2002, Disponible sur cédérom, 2003.&lt;br /&gt;&lt;br /&gt;ROBERGET, Olivier, « Les nouveaux défis des outils de recherche », In : 01 Informatique [en ligne], janvier 2003, Disponible sur &lt;&lt;a href="http://www.01net.com/"&gt;HTTP://www.01net.com/&lt;/a&gt;&gt; (consulté le 6 novembre 2003).&lt;br /&gt;&lt;br /&gt;URFIST, Le problème de la qualité et de la pertinence de l'information [en ligne], Disponible sur &lt;&lt;a href="http://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm"&gt;HTTP://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;br /&gt;URFIST, Moteurs de recherche : un petit récapitulatif [en ligne], Disponible sur &lt;&lt;a href="http://www.urfist.cict.fr/moteurbis.html"&gt;HTTP://www.urfist.cict.fr/moteurbis.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Intranets&lt;br /&gt;&lt;br /&gt;Sans nom, « Quel intranet pour vous simplifier l'entreprise ? », In : Internet Professionnel, Novembre 1999, n° 36, p. 50-63.&lt;br /&gt;&lt;br /&gt;ALIN, Frédéric ; LAFONT, Denis ; MACARY, Jean-François, Le projet intranet : de l’analyse des besoins de l’entreprise à la mise en œuvre des solutions, Eyrolles, 1996.&lt;br /&gt;&lt;br /&gt;BIGUET, Serge, L'irruption de l'intranet dans l'entreprise et son impact sur la fonction information, Jouve, 1998.&lt;br /&gt;&lt;br /&gt;International Data Corporation, CITRIX, Les entreprises face aux nouvelles architectures. Architectures serveurs centralisés, serveurs d'application et droit léger : attitude et stratégie des entreprises françaises, IDC, 2000.&lt;br /&gt;&lt;br /&gt;LÉVY-ABÉGNOL, Thierry, Les clés du portail du système d'information, In : 01 Informatique, 19 Mai 2000, n°1589, p.18-19.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Métadonnées – Langages à balises&lt;br /&gt;&lt;br /&gt;Sans nom, Extensible Markup Language [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://www.w3c.org/XML"&gt;HTTP://www.w3c.org/XML&lt;/a&gt;&gt; (consulté le 8 juin 2003)&lt;br /&gt;&lt;br /&gt;CHANIA, Emmanuel, « XML arrive, le plein texte résiste », In : 01 Informatique [en ligne], janvier 2003, Disponible sur &lt;&lt;a href="http://www.01net.com/"&gt;HTTP://www.01net.com/&lt;/a&gt;&gt; (consulté le 6 novembre 2003).&lt;br /&gt;&lt;br /&gt;CNDP, Les métadonnées : où en est-on ? [en ligne], Disponible sur &lt;&lt;a href="http://www.cndp.fr/standards/metadonnees/"&gt;HTTP://www.cndp.fr/standards/metadonnees/&lt;/a&gt;&gt; (consulté le 6 mai 2004).&lt;br /&gt;&lt;br /&gt;CNDP, Le Web et les métadonnées [en ligne], Disponible sur &lt;&lt;a href="http://savoirscdi.cndp.fr/culturepro/actualisation/Metadonnees/accueil.htm"&gt;HTTP://savoirscdi.cndp.fr/culturepro/actualisation/Metadonnees/accueil.htm&lt;/a&gt;&gt; (consulté le 6 mai 2004).&lt;br /&gt;&lt;br /&gt;EDUCNET, « Techniques, normes et standards », In : Séminaire Lyon 2003 [en ligne], Disponible sur &lt;&lt;a href="http://www.educnet.education.fr/tech/normes/0402.htm"&gt;HTTP://www.educnet.education.fr/tech/normes/0402.htm&lt;/a&gt;&gt; (consulté le 6 mai 2004).&lt;br /&gt;&lt;br /&gt;OUERFELLI, Tarek, « La description des documents électroniques diffusés sur le Web : pour une recherche pertinente », In : CIFSIC 2003 [en ligne], Disponible sur &lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/07/73/sic_00000773_01/sic_00000773.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/07/73/sic_00000773_01/sic_00000773.pdf&lt;/a&gt;&gt; (consulté le 6 mai 2004).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Découpage de documents&lt;br /&gt;&lt;br /&gt;BEN ABDALLAH, Nabil ; LAINÉ-CRUZEL, Sylvie ; MICHEL, Christine, Caractérisation et découpage de textes scientifiques pour la construction de systèmes de requête personnalisés [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/42/sic_00000342_00/sic_00000342.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/42/sic_00000342_00/sic_00000342.pdf&lt;/a&gt; &gt; (consulté le 12 octobre 2003).&lt;br /&gt;&lt;br /&gt;MAISONNEUVE, Marc, LENEPVEU, Philippe, Du catalogue de la bibliothèque aux ressources du Web. Applications documentaires de la génération de liens contextuels, ADBS éditions, 2003 (Sciences et techniques de l’information).&lt;br /&gt;&lt;br /&gt;MICHEL, Christine ; LAFOUGE, Thierry, Profil-doc : un système personnalisé de requête à des bases de données en texte intégral [en ligne], Disponible sur &lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/41/sic_00000341_00/sic_00000341.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/41/sic_00000341_00/sic_00000341.pdf&lt;/a&gt;&gt; (consulté le 12 octobre 2003).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Filtrage de l'information&lt;br /&gt;&lt;br /&gt;FAVIER, Laurence ; IHADJADENE Madjid, « Vers des systèmes de découverte et de filtrage d’information documentaire : quelle stratégie faut-il mettre en place ? », In : 28ème congrès annuel ACSI : Les dimensions d’une science de l’information globale [en ligne], 2000, Disponible sur&lt;br /&gt;&lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/01/29/sic_00000129_01/sic_00000129.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/01/29/sic_00000129_01/sic_00000129.pdf&lt;/a&gt;&gt; (consulté le 6 novembre 2003).&lt;br /&gt;&lt;br /&gt;GRIVEL, Luc, GUILLEMIN-LANNE, Sylvie ; COUPET, Pascal ; HUOT, Charles, Analyse en ligne de l’information : une approche permettant l’extraction d’informations stratégiques basée sur la construction de composants de connaissance [en ligne], Disponible sur &lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/04/68/sic_00000468_00/sic_00000468.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/04/68/sic_00000468_00/sic_00000468.pdf&lt;/a&gt;&gt; (consulté le 23 août 2004).&lt;br /&gt;&lt;br /&gt;GRIVEL, Luc, Intégration de composants de Text Mining pour le développement d’un système de recherche et d’analyse d’information [en ligne], Disponible sur &lt;&lt;a href="http://lepont.univ-tln.fr/isdm/PDF/isdm6/isdm6a54_grivel.pdf"&gt;HTTP://lepont.univ-tln.fr/isdm/PDF/isdm6/isdm6a54_grivel.pdf&lt;/a&gt;&gt; (consulté le 23 août 2004).&lt;br /&gt;&lt;br /&gt;GRIVEL, Luc ; GUILLEMIN-LANNE, Sylvie ; LAUTIER, Christian ; MARI, Alda, La construction de composants de connaissance pour l’extraction et le filtrage de l’information sur les réseaux [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/04/66/sic_00000466_00/sic_00000466.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/04/66/sic_00000466_00/sic_00000466.pdf&lt;/a&gt;&gt; (consulté le 23 août 2004).&lt;br /&gt;&lt;br /&gt;MICHEL, Christine, Caractérisation d’usages et personnalisation d’un portail pédagogique. État de l’art et expérimentation de différentes méthodes d’analyse du Web Usage Mining [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/31/sic_00000331_00/sic_00000331.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/03/31/sic_00000331_00/sic_00000331.pdf&lt;/a&gt;&gt; (consulté le 12 octobre 2003).&lt;br /&gt;&lt;br /&gt;MINEL, Jean-Luc, Filtrage sémantique, du résumé automatique à la fouille de textes, Lavoisier éditeur, 2002 (Hermès Science Publications).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Veille&lt;br /&gt;&lt;br /&gt;ALEXANDRE, Hélène ; NAUDIN, Nathalie, Les métiers de la documentation. APEC - Éditions d’organisation, 1998.&lt;br /&gt;&lt;br /&gt;MARTRE, H., « Intelligence économique et stratégie des entreprises », La Documentation Française, 1994, p. 65, In : MIST [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Web sémantique&lt;br /&gt;&lt;br /&gt;BERTRAND-GASTALDY, Suzanne, Le Web sémantique [en ligne], Disponible sur &lt;&lt;a href="http://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu"&gt;HTTP://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu&lt;/a&gt;&gt; (consulté le 17 juin 2003).&lt;br /&gt;&lt;br /&gt;CHARTIER, Philippe, Un Web plus intelligent [en ligne], Disponible &lt;a href="http://www.cybersciences.com/cyber/4.0/2004/09/web.asp"&gt;http://www.cybersciences.com/cyber/4.0/2004/09/web.asp&lt;/a&gt;&gt; (consulté le 20 septembre 2004).&lt;br /&gt;&lt;br /&gt;DECKER, Stefan ; SINTEK, Michael, SemanticWeb.org [en ligne], Disponible sur &lt;&lt;a href="http://www.semanticweb.org/"&gt;HTTP://www.semanticweb.org/&lt;/a&gt;&gt; (consulté le 14 octobre 2003).&lt;br /&gt;&lt;br /&gt;DUMAIS, Michel, Le Web de l’avenir, être ou ne pas être sémantique [en ligne], Disponible sur &lt;&lt;a href="http://www.ledevoir.com/2004/07/26/59857.html"&gt;HTTP://www.ledevoir.com/2004/07/26/59857.HTML&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;br /&gt;Educnet, Vers le Web sémantique, In : Métadonnées, normes et standards [en ligne], Disponible sur &lt;&lt;a href="http://www.educnet.education.fr/dossier/metadata/quoi4.htm"&gt;http://www.educnet.education.fr/dossier/metadata/quoi4.htm&lt;/a&gt;&gt; (consulté le 6 novembre 2003).&lt;br /&gt;&lt;br /&gt;FING, Le Web sémantique : trop malin pour les humains ? [en ligne], Disponible sur &lt;&lt;a href="http://www.fing.org/"&gt;http://www.fing.org/&lt;/a&gt;&gt; (consulté le 17 juin 2003).&lt;br /&gt;&lt;br /&gt;ORLER, Daniel, « Web sémantique : service Web cherche bon documentaliste ! », Manifestation ADBS Midi-Pyrénées, 1er avril 2003.&lt;br /&gt;&lt;br /&gt;PAQUETTE, G., Modélisation des connaissances et des compétences, Presse Universitaire du Québec, 2002.&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-3358168101295986139?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/3358168101295986139/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=3358168101295986139' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/3358168101295986139'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/3358168101295986139'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/bibliographie-thmatique.html' title='Bibliographie thématique'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-5014042212299918379</id><published>2008-04-04T08:19:00.000-07:00</published><updated>2008-08-06T06:03:58.897-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='02.Résumé et problématique'/><title type='text'>Résumé et problématique</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;br /&gt;&lt;/em&gt;&lt;p&gt;&lt;/p&gt;&lt;p&gt; &lt;/p&gt;&lt;p&gt;Ce mémoire soulève le problème de la gestion de l’information en entreprise, à l’heure où les documents électroniques qui y circulent sont de plus en plus abondants. Il s’agit donc d’une réflexion sur les notions d’indexation de documents, de recherche pertinente d’information, de réponse aux besoins des utilisateurs. Seront également présentés les nouveaux outils d’extraction, de filtrage de l’information. Ce mémoire, axé notamment sur la notion de personnalisation de l’information, pourra dans un deuxième temps s’appliquer au Web.&lt;/p&gt;&lt;p&gt;Comment analyser, structurer, filtrer l’information pertinente parmi toutes celles que contiennent les documents stockés ? L’indexation, technique en évolution permanente, en est-elle aujourd’hui à une phase de transformation ? Le changement de support du document change-t-il la notion d’indexation ? Comment, à l’ère du document numérique, répondre aux besoins en informations dans l’entreprise ? Peut-on vraiment y répondre ?&lt;/p&gt;&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-5014042212299918379?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/5014042212299918379/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=5014042212299918379' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/5014042212299918379'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/5014042212299918379'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/rsum-et-problmatique.html' title='Résumé et problématique'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-4514412832387381150</id><published>2008-04-04T08:18:00.000-07:00</published><updated>2008-08-06T06:04:08.823-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='03.Table des matières'/><title type='text'>Table des matières</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;Introduction............................................................................................................................... 7&lt;br /&gt;1 Information, document, numérique................................................................................. 9&lt;br /&gt;1.1 Qu’entendons-nous par information ?........................................................................... 9&lt;br /&gt;1.1.1 Information, savoir, connaissance............................................................................................................... 9&lt;br /&gt;1.1.2 Système d’information, information opérationnelle et information décisionnelle............................... 10&lt;br /&gt;1.1.3 Qualité de l’information................................................................................................................................ 11&lt;br /&gt;1.1.4 Information structurée et information non structurée............................................................................. 12&lt;br /&gt;§ Information structurée....................................................................................................................................... 12&lt;br /&gt;§ Information non structurée............................................................................................................................... 12&lt;br /&gt;1.1.5 Information tacite et information explicite................................................................................................. 12&lt;br /&gt;1.1.6 Information numérique................................................................................................................................. 13&lt;br /&gt;§ Qu'est-ce que l'information numérique ?......................................................................................................... 13&lt;br /&gt;§ Qui utilise l'information numérique ?............................................................................................................... 13&lt;br /&gt;§ Pourquoi utilise-t-on l'information numérique ?............................................................................................ 14&lt;br /&gt;§ Doit-on gérer l'information numérique ?......................................................................................................... 14&lt;br /&gt;1.2 Qu'est-ce qu'un document ?........................................................................................ 15&lt;br /&gt;§ « Réinventer des documents au travers du numérique »............................................................................ 15&lt;br /&gt;1.2.1 Une première définition du document - Le document comme signe..................................................... 16&lt;br /&gt;§ Le support du document est modifié par la numérisation............................................................................ 16&lt;br /&gt;§ Les conséquences du numérique sur l’inscription du document............................................................... 16&lt;br /&gt;1.2.2 Deuxième définition du document : le document défini par son contenu............................................ 17&lt;br /&gt;1.2.3 Troisième définition du document : l’aspect communicationnel du document – Le document comme médium 18&lt;br /&gt;1.3 Document numérique et technologie intellectuelle : au pouvoir de l'entreprise....... 19&lt;br /&gt;1.3.1 Daniel Bell : « ordonner la société de masse »......................................................................................... 19&lt;br /&gt;1.3.2 Jack Goody : l’écriture et la liste................................................................................................................. 19&lt;br /&gt;1.3.3 Pierre Lévy : l’informatique.......................................................................................................................... 20&lt;br /&gt;1.3.4 Pascal Robert : de la gestion du nombre à la « ressource de pouvoir »............................................... 20&lt;br /&gt;2 Gestion automatisée de l’information en entreprise : pour des décisions stratégiques 23&lt;br /&gt;2.1 Évaluer les besoins en informations............................................................................ 23&lt;br /&gt;2.2 L’analyse de l’information : de la classification au stockage de l’information - Les évolutions de la chaîne de traitement documentaire................................................................................................. 26&lt;br /&gt;§ Information et information numérique: deux modes de gestion différents................................................ 26&lt;br /&gt;§ Comment doit-on gérer l'information numérique?......................................................................................... 27&lt;br /&gt;2.2.1 Les langages documentaires : de la représentation par des codes au langage naturel...................... 28&lt;br /&gt;§ Les langages classificatoires............................................................................................................................ 28&lt;br /&gt;§ Les langages d’indexation................................................................................................................................ 29&lt;br /&gt;§ La notice bibliographique................................................................................................................................. 31&lt;br /&gt;2.2.2 Le traitement automatique : les bases de données.................................................................................. 32&lt;br /&gt;2.2.3 L’intranet, outil de capitalisation des connaissances en entreprise..................................................... 33&lt;br /&gt;2.3 La recherche automatique d’informations : un « dialogue » homme – machine........ 35&lt;br /&gt;§ La notion d’accueil existe aussi en informatique documentaire.................................................................. 36&lt;br /&gt;§ Pertinence de l'information................................................................................................................................ 37&lt;br /&gt;2.3.1 Les difficultés de compréhension liées au contenu................................................................................. 38&lt;br /&gt;§ La reconnaissance tardive des particularités du matériau textuel............................................................... 39&lt;br /&gt;§ Quelques paramètres relatifs aux corpus........................................................................................................ 39&lt;br /&gt;2.3.2 Les solutions adoptées................................................................................................................................ 41&lt;br /&gt;§ L’aide à l’analyse des textes............................................................................................................................. 41&lt;br /&gt;§ L’aide à l’interaction avec la base de données.............................................................................................. 44&lt;br /&gt;2.3.3 Le dialogue humain existe toujours............................................................................................................ 46&lt;br /&gt;3 D’un traitement de l’information a priori à un traitement a posteriori...................... 48&lt;br /&gt;3.1 La description du document numérique : métadonnées, langages de description et ontologies 48&lt;br /&gt;3.1.1 Les métadonnées.......................................................................................................................................... 49&lt;br /&gt;§ La normalisation des ressources numériques................................................................................................ 50&lt;br /&gt;3.1.2 Les langages de description du document............................................................................................... 51&lt;br /&gt;§ Les langages à balise : XML, RDF, DAML.................................................................................................... 51&lt;br /&gt;§ Les ontologies.................................................................................................................................................... 52&lt;br /&gt;3.2 Le text-mining : une nouvelle façon de traiter le document....................................... 53&lt;br /&gt;3.2.1 Catégorisation et extraction de l’information............................................................................................ 53&lt;br /&gt;§ Le data-mining : l’exploration de données.................................................................................................... 53&lt;br /&gt;§ Le découpage de l’information......................................................................................................................... 54&lt;br /&gt;§ Les résumés dynamiques.................................................................................................................................. 54&lt;br /&gt;3.2.2 L’introduction de la sémantique : le filtrage de l’information................................................................. 56&lt;br /&gt;§ L’exploration contextuelle................................................................................................................................. 57&lt;br /&gt;§ Les liens contextuels.......................................................................................................................................... 58&lt;br /&gt;3.2.3 Les moteurs « intelligents »........................................................................................................................ 59&lt;br /&gt;§ Les agents intelligents....................................................................................................................................... 59&lt;br /&gt;3.3 Un accès à l’information personnalisé......................................................................... 60&lt;br /&gt;3.3.1 Confidentialité de l’information.................................................................................................................. 60&lt;br /&gt;3.3.2 Détermination d’un profil de l'utilisateur................................................................................................... 61&lt;br /&gt;3.3.3 L’information personnalisée........................................................................................................................ 62&lt;br /&gt;§ Les portails d’information................................................................................................................................. 62&lt;br /&gt;§ La technologie push........................................................................................................................................... 63&lt;br /&gt;§ Intelligence économique................................................................................................................................... 64&lt;br /&gt;4 Conclusion intermédiaire............................................................................................... 67&lt;br /&gt;4.1 Une mémoire de l’entreprise...................................................................................... 67&lt;br /&gt;4.2 L’apport de la numérisation......................................................................................... 67&lt;br /&gt;5 Perspectives : le Web sémantique................................................................................... 68&lt;br /&gt;5.1 Définition du Web sémantique..................................................................................... 68&lt;br /&gt;§ Le Web sémantique se construit autour d'une succession de langages intermédiaires entre la machine et l'Homme 70&lt;br /&gt;5.2 L'indexation du Web.................................................................................................... 71&lt;br /&gt;5.2.1 Le mot clé....................................................................................................................................................... 72&lt;br /&gt;§ Le « mot clé », les métadonnées et le web...................................................................................................... 72&lt;br /&gt;§ Le « mot clé » et la recherche web................................................................................................................... 73&lt;br /&gt;§ Mot clé, page web, XML et les champs interrogeables............................................................................... 73&lt;br /&gt;5.2.2 Le "Google Bombing".................................................................................................................................. 74&lt;br /&gt;5.2.3 RDF................................................................................................................................................................. 74&lt;br /&gt;5.3 Les moteurs de recherche du Web............................................................................. 75&lt;br /&gt;5.3.1 Qu'est-ce qu'un moteur de recherche ?...................................................................................................... 75&lt;br /&gt;§ Les robots............................................................................................................................................................ 75&lt;br /&gt;§ La base de données........................................................................................................................................... 76&lt;br /&gt;§ Les agents........................................................................................................................................................... 76&lt;br /&gt;5.3.2 Les différentes catégories de moteurs de recherche............................................................................... 77&lt;br /&gt;§ Les catalogues matières.................................................................................................................................... 77&lt;br /&gt;§ Les robots automatiques................................................................................................................................... 78&lt;br /&gt;5.3.3 Les stratégies de recherche......................................................................................................................... 78&lt;br /&gt;§ Les obstacles à la recherche d'information..................................................................................................... 78&lt;br /&gt;5.4 Analyses de sites Web................................................................................................. 79&lt;br /&gt;Conclusion générale............................................................................................................... 81&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-4514412832387381150?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/4514412832387381150/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=4514412832387381150' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/4514412832387381150'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/4514412832387381150'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/table-des-matires.html' title='Table des matières'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-7397327738560432421</id><published>2008-04-04T08:16:00.002-07:00</published><updated>2008-08-06T06:04:18.167-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='04.Introduction'/><title type='text'>Introduction</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;br /&gt;&lt;/em&gt;&lt;p&gt;&lt;/p&gt;&lt;p&gt; &lt;/p&gt;&lt;p&gt;La maîtrise de l’information est un enjeu majeur pour l’entreprise. Pour être efficace, celle-ci doit disposer de la bonne information au bon moment ; la réactivité de l’organisation en dépend. Avec la numérisation, et donc la dématérialisation des supports d’information, les mouvements s’intensifient. Il est d’autant plus nécessaire pour l’entreprise d’organiser une gestion du contenu afin d’agréger, dans une interface unique, toute l’information dont l’utilisateur a besoin pour prendre les bonnes décisions.&lt;br /&gt;La profession de l’information et de la documentation se définit par la mission fondamentale qu’elle remplit : rechercher, traiter, produire, diffuser de l’information en y incorporant de la valeur ajoutée, en vue de satisfaire les besoins en informations d’une population cible. Répondre aux besoins en informations des usagers, malgré l’explosion documentaire à laquelle les entreprises sont confrontées, tel est l’objet principal de notre recherche.&lt;br /&gt;&lt;br /&gt;L’utilisation des TIC (Technologies de l’Information et de la Communication) incite à repenser les procédures, la façon d’échanger l’information et de travailler. Ainsi, avec l’arrivée du numérique en entreprise, la gestion de l’information s’en trouve bouleversée. Alors que les documents textuels étaient uniquement référencés dans les bases de données, les documents textuels électroniques y sont quant à eux intégrés. La notion de document&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn1" name="_ftnref1"&gt;[1]&lt;/a&gt; est transformée, et avec elle son traitement. L’indexation est modifiée par la structure même du document. Désormais, les documents sont décrits non seulement en fonction de leur contenu, mais aussi en fonction de leur structure. La phase de recherche, quant à elle, portait sur le ou les thèmes abordés par le document (recherche par sujet). Avec la recherche en « plein texte »&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn2" name="_ftnref2"&gt;[2]&lt;/a&gt;, portant sur tous les mots contenus dans le texte, la pertinence de la réponse est mise en cause. Les documents, non retrouvés, risquent alors de sombrer dans l’oubli. L’abondance d’information, liée elle aussi à l’entrée du numérique dans les entreprises, ne permet donc pas pour autant de parler de pérennisation.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Dès lors, comment gérer et organiser la masse de documents textuels circulant en entreprise ? Comment analyser, structurer, filtrer l’information pertinente parmi toutes celles que contiennent les documents stockés ? L’indexation, technique en évolution permanente, en est-elle aujourd’hui à une phase de transformation ? Le changement de support du document change-t-il la notion d’indexation ? Comment, à l’ère du document numérique, répondre aux besoins en informations dans l’entreprise ? Peut-on vraiment y répondre ?&lt;br /&gt;&lt;br /&gt;En réaction à ces questions, stratégiques pour l’entreprise&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn3" name="_ftnref3"&gt;[3]&lt;/a&gt;, de nouvelles techniques d’analyse de texte, d’extraction et de filtrage d’informations ont été établies&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn4" name="_ftnref4"&gt;[4]&lt;/a&gt;. Ensemble, elles visent à mieux exploiter des ressources électroniques multiples et non coordonnées afin d’apporter satisfaction à un public varié.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Afin d’étudier de façon rigoureuse l’objet de notre recherche, il conviendra tout d’abord de définir les termes d’information et de document textuel. Puis nous nous pencherons sur la chaîne du traitement documentaire de l’information, des étapes de classification et d’indexation à l’étape de recherche, en mettant en avant les difficultés et les changements dus à l’introduction du document électronique en entreprise. Enfin, nous présenterons les techniques visant à améliorer l’analyse des documents numériques textuels contenus dans les bases de données documentaires. &lt;/p&gt;&lt;p&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref1" name="_ftn1"&gt;[1]&lt;/a&gt; La notion de document fait l’objet de la partie 1, nous ne la définirons donc pas dans l’introduction.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref2" name="_ftn2"&gt;[2]&lt;/a&gt; Ces notions documentaires seront décrites dans la partie 2.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref3" name="_ftn3"&gt;[3]&lt;/a&gt; En cherchant à anticiper les évolutions du marché par une mise en valeur des informations et des connaissances, l’entreprise accroît son adaptabilité au marché. C’est ce qu’on nomme la veille. Voir à ce sujet la partie 2.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref4" name="_ftn4"&gt;[4]&lt;/a&gt; Ces techniques seront décrites dans la partie 3.&lt;/p&gt;&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-7397327738560432421?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/7397327738560432421/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=7397327738560432421' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/7397327738560432421'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/7397327738560432421'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/introduction.html' title='Introduction'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-7274366301484400283</id><published>2008-04-04T08:16:00.001-07:00</published><updated>2008-08-06T06:04:29.174-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='05.Chapitre1'/><title type='text'>Chapitre 1 : Information, document, numérique</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;1.1 Qu’entendons-nous par information ?........................................................................... 9&lt;br /&gt;1.1.1 Information, savoir, connaissance............................................................................................................... 9&lt;br /&gt;1.1.2 Système d’information, information opérationnelle et information décisionnelle............................... 10&lt;br /&gt;1.1.3 Qualité de l’information................................................................................................................................ 11&lt;br /&gt;1.1.4 Information structurée et information non structurée............................................................................. 12&lt;br /&gt;§ Information structurée....................................................................................................................................... 12&lt;br /&gt;§ Information non structurée............................................................................................................................... 12&lt;br /&gt;1.1.5 Information tacite et information explicite................................................................................................. 12&lt;br /&gt;1.1.6 Information numérique................................................................................................................................. 13&lt;br /&gt;§ Qu'est-ce que l'information numérique ?......................................................................................................... 13&lt;br /&gt;§ Qui utilise l'information numérique ?............................................................................................................... 13&lt;br /&gt;§ Pourquoi utilise-t-on l'information numérique ?............................................................................................ 14&lt;br /&gt;§ Doit-on gérer l'information numérique ?......................................................................................................... 14&lt;br /&gt;1.2 Qu'est-ce qu'un document ?........................................................................................ 15&lt;br /&gt;§ « Réinventer des documents au travers du numérique »............................................................................ 15&lt;br /&gt;1.2.1 Une première définition du document - Le document comme signe..................................................... 16&lt;br /&gt;§ Le support du document est modifié par la numérisation............................................................................ 16&lt;br /&gt;§ Les conséquences du numérique sur l’inscription du document............................................................... 16&lt;br /&gt;1.2.2 Deuxième définition du document : le document défini par son contenu............................................ 17&lt;br /&gt;1.2.3 Troisième définition du document : l’aspect communicationnel du document – Le document comme médium 18&lt;br /&gt;1.3 Document numérique et technologie intellectuelle : au pouvoir de l'entreprise....... 19&lt;br /&gt;1.3.1 Daniel Bell : « ordonner la société de masse »......................................................................................... 19&lt;br /&gt;1.3.2 Jack Goody : l’écriture et la liste................................................................................................................. 19&lt;br /&gt;1.3.3 Pierre Lévy : l’informatique.......................................................................................................................... 20&lt;br /&gt;1.3.4 Pascal Robert : de la gestion du nombre à la « ressource de pouvoir »............................................... 20&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300158"&gt;&lt;/a&gt;&lt;a name="_Toc84300055"&gt;1           Information, document, numérique&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300056"&gt;1.1         Qu’entendons-nous par information ?&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300057"&gt;1.1.1        Information, savoir, connaissance&lt;/a&gt;&lt;br /&gt;Le Dictionnaire des Sciences de l’information et de la communication, de Lamizet et Silem, définit l’information comme « l’inscription d’une référence socialement déterminée dans un système formel susceptible de faire l’objet d’une diffusion et d’un échange dans la communication. » En toute rigueur, la notion d’information doit être distinguée de donnée, de savoir et de connaissance. L’information est « une donnée pourvue d’un sens qui est reçue dans le processus de communication », le savoir est vu comme une « information plus hautement élaborée » et la connaissance est définie comme une information de portée plus générale encore que le savoir.&lt;br /&gt;Savoir et connaissance sont donc spécifiés comme différentes valeurs de l’information.&lt;br /&gt;&lt;br /&gt;En entreprise, l’information peut être vue comme un flux, ou processus, alors que la connaissance et le savoir sont assimilés à un stock, capital résultant de ce flux d’information. L’information est une « ressource que toute structure se doit de maîtriser pour acquérir, améliorer ou conserver une position favorable sur un marché donné. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn1" name="_ftnref1"&gt;[1]&lt;/a&gt; Une fois l’information maîtrisée, elle acquiert l’état de savoir. Derrière l’idée de savoir réside l’idée d’apprentissage. Reconnue ensuite par un domaine, cette « information de valeur » prend le statut de connaissance.&lt;br /&gt;L’information est donc un savoir, voire une connaissance, en devenir, qui change de statut par la voie de l’apprentissage ou après acceptation commune de son contenu.&lt;br /&gt;&lt;br /&gt;Dans notre mémoire, nous parlons de « gestion de l’information » en entreprise. Dans ce cas, qu’entendons-nous par information ? Dans les centres de documentation, l’information suit toujours les mêmes étapes de traitement (indexation, classement, recherche, diffusion), quelle que soit sa valeur, quel que soit également son degré de finitude. Qu’il s’agisse d’une information brute, non transformée (un article de presse, par exemple), d’une information en devenir, stockée mais pouvant encore être modifiée (une procédure), ou d’une information élaborée, à vocation pérenne, stockée, élargissant le capital de connaissances de l’entreprise (un rapport sur un sujet, endogène ou exogène à l’entreprise), quel que soit leur usage, toutes emprunteront la même chaîne de traitement documentaire.&lt;br /&gt;Le terme d’ « information » englobera donc dans cette recherche les trois notions : information, savoir et connaissance, vus comme processus ou stock, à valeur plus ou moins élevée.&lt;br /&gt;&lt;br /&gt;La maîtrise de l’information est un enjeu majeur pour l’entreprise. Nécessairement, des moyens assurant sa gestion doivent être mis en œuvre : ils sont regroupés dans le système d’information.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300058"&gt;1.1.2        Système d’information, information opérationnelle et information décisionnelle&lt;/a&gt;&lt;br /&gt;On entend par système d’information «  l’ensemble des moyens matériels et humains nécessaires à la définition, au traitement, au stockage et au transfert de l’ensemble des informations caractérisant une activité, un flux financier, ou un flux matériel : (…) c’est un système imagé de l’activité, des moyens mis en œuvre, des méthodes de travail et des règles de fonctionnement d’une organisation donnée. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn2" name="_ftnref2"&gt;[2]&lt;/a&gt; Une entreprise peut être définie comme un système global composé par trois niveaux :&lt;br /&gt;-         le niveau direction : le système de pilotage,&lt;br /&gt;-         le niveau production de biens et de services : le système opérant,&lt;br /&gt;-         le niveau informationnel : il assure le lien et la représentation de toute l’activité des deux niveaux précédents.&lt;br /&gt;Les informations gérées sont donc de natures différentes : de nature décisionnelle (niveau pilotage) ou de nature opérationnelle (niveau opérant). De par leur nature, les informations opérationnelles interviennent dans des procédures formalisées et structurées, tandis que les informations décisionnelles sont peu ou pas du tout formalisées et les procédures où elles interviennent sont très peu structurées. Pour cette raison, l’introduction de l’informatique comme moyen de traitement des systèmes d’information est devenue une nécessité : l’amélioration des moyens de stockage, d’exploitation et de communication des informations conditionnent l’efficacité des systèmes d’information. Un tel système d’information est appelé système d’information automatisé.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300059"&gt;1.1.3        Qualité de l’information&lt;/a&gt;&lt;br /&gt;Une information pertinente répond à un besoin précis d’information, formulé par un acteur donné, à un moment donné et sur un sujet donné.&lt;br /&gt;Au plan terminologique, il est important de distinguer ces deux notions : information de qualité et information pertinente. Quelles sont les caractéristiques d’une "information de qualité", notamment de l’information documentaire, ou spécialisée ? Il est intéressant de repartir de la définition traditionnelle des caractéristiques de la qualité de l’information, notamment professionnelle ; elles définissent en creux tous les objectifs et les critères d’évaluation :&lt;br /&gt;-         une information identifiée, "sourcée" : il s'agit d'une information dont on peut identifier facilement l’auteur. L'identification est le premier objectif de l’évaluation,&lt;br /&gt;-         une information fiable : le contenu, les données apportées doivent avoir été vérifiées, recoupées. L’information professionnelle doit reposer sur un contrat de confiance, une légitimité admise, évitant au lecteur d’avoir à vérifier lui-même la véracité des informations, c'est l'objectif le plus difficile et le plus important de l’évaluation de l’information sur Internet, puisqu’il n’y a pas forcément le contrat de confiance existant dans l’information professionnelle,&lt;br /&gt;-         une information apportant de la nouveauté : cela renvoie à la définition même, au plan théorique, de l’information (quelque chose qui apporte du nouveau, enrichit les connaissances). Sur Internet, l’évaluation de l’information doit viser à apprécier le degré de nouveauté, d’originalité d’une information. Il s'agit là d'un des fléaux d’Internet : la redondance toucherait environ un tiers des documents…&lt;br /&gt;-         une information précise, exacte, complète ou exhaustive : critère de la densité, de l’exactitude, de la complétude de l’information apportée,&lt;br /&gt;-         une information accessible : l’information documentaire, spécialisée, doit être facilement retrouvée, identifiée, localisée, et accessible. Le problème sur Internet est l’accès parfois incertain aux documents, ou l’accès gratuit ou payant, ou encore la localisation,&lt;br /&gt;-         une information fraîche, actualisée : la mise à jour et le renouvellement de l’information sont des données essentielles,&lt;br /&gt;-         une information ayant un impact, un effet : cela regroupe les caractéristiques de l’information "utile", recherchée en vue d’un objectif d’action ou de décision. C'est un critère difficile à apprécier, lié à la pertinence et à l’adaptation de l’information à l’objectif de recherche,&lt;br /&gt;-         une information bien structurée, bien présentée, bien rédigée.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn3" name="_ftnref3"&gt;[3]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300060"&gt;1.1.4        Information structurée et information non structurée&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300061"&gt;§         Information structurée&lt;/a&gt;&lt;br /&gt;L’information structurée est principalement celle contenue dans les bases de données relationnelles. De type numérique ou alphanumérique, elle est retrouvée par des chemins d’accès, des codes précis. L’information est dite « structurée » lorsqu’on lui a attribué un nombre de champs prédéfinis, et lorsque les concepteurs de la base ont prévu tous les modes et chemins d’accès utiles.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn4" name="_ftnref4"&gt;[4]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300062"&gt;§         Information non structurée&lt;/a&gt;&lt;br /&gt;Au contraire de l’information structurée, l’information non structurée est celle contenue dans les bases de données documentaires, sous forme de textes enregistrés séquentiellement. Il n’y a pas de chemin d’accès prédéfinis pour retrouver les informations. Il faut faire une recherche directement sur le contenu, ceci est beaucoup plus complexe que l’accès par champs.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300063"&gt;1.1.5        Information tacite et information explicite&lt;/a&gt;&lt;br /&gt;Certains savoirs sont tacites car ils ne peuvent pas être codifiés dans un langage permettant leur transmission à autrui. Ils se transmettent par imitation et expérience. D’autres savoirs sont explicites, car ils peuvent être codifiés de telle sorte qu’ils puissent faire l’objet de transmission sans contact direct entre l’émetteur et le récepteur. Ils peuvent être mis en œuvre sans expérimentation préalable. Ils sont formalisables et par conséquent se prêtent à une large diffusion par des moyens tels que la transmission électronique. Ils offrent le moyen de contrôler l’action par standardisation.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn5" name="_ftnref5"&gt;[5]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;L’information tacite ne fera pas l’objet d’un traitement documentaire, puisqu’elle ne se transmet pas par l’écrit ; elle n’en perd néanmoins pas sa valeur, bien au contraire, en étant confidentielle, elle permet à l’entreprise d’accroître son potentiel concurrentiel.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300064"&gt;1.1.6        Information numérique&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300065"&gt;§         Qu'est-ce que l'information numérique ?&lt;/a&gt;&lt;br /&gt;L'information numérique correspond à ce qu'on appelle en anglais "digital information". Très concrètement, il s'agit de toute information se présentant sous forme de fichiers informatiques traitables par ordinateur. L'information numérique est ainsi appelée parce qu'elle est représentée -ou codée- en nombres binaires, de façon à pouvoir être traitée par ordinateur. L'information numérique peut être : du texte (exemple : documents Word ou "PDF"), du son (exemple : fichiers "MP3" ou "WAV"),  des images (exemple : formats " JPEG " et " GIF "), du multimédia (exemple : présentations PowerPoint, "Flash").&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300066"&gt;§         Qui utilise l'information numérique ?&lt;/a&gt;&lt;br /&gt;Toutes les organisations (entreprises, organismes gouvernementaux, etc.) sont aujourd'hui utilisatrices, et même productrices, d'information numérique. Pensons simplement aux masses de documents de traitement de texte (Word, etc.) qui se créent dans les secrétariats d'écoles, de magasins, d'hôpitaux, dans les bureaux d'avocats, de dentistes, de médecins, dans les gouvernements, les banques, etc.&lt;br /&gt;Les individus utilisent et créent aussi de l'information numérique. De plus en plus de gens possèdent leur propre ordinateur. Le courrier électronique (courriel) est maintenant omniprésent. La navigation ("surfing") et la recherche d'information sur Internet est de plus en plus populaire.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300067"&gt;§         Pourquoi utilise-t-on l'information numérique ?&lt;/a&gt;&lt;br /&gt;Si l'information numérique est si populaire et se retrouve partout aujourd'hui, c'est parce qu'elle comporte beaucoup d'avantages par rapport à l'information qui existe exclusivement sur papier. Par exemple :&lt;br /&gt;-         il est plus facile d'apporter des corrections au moment où on crée les documents,&lt;br /&gt;-         une fois qu'ils sont créés, les documents ne prennent pratiquement aucun espace physique,&lt;br /&gt;-         on peut envoyer les documents par courrier électronique ou en stocker des milliers sur un seul cédérom,&lt;br /&gt;-         toutes les formes d'information (images, sons, texte, etc.) peuvent être stockées sur les mêmes types de supports (disquettes, CD-ROM, etc.) et transmises via les mêmes réseaux informatiques (réseaux locaux, intranet, extranet, Internet.),&lt;br /&gt;-         l'information numérique est plus facile à rechercher : par exemple, on peut facilement retrouver parmi des milliers de documents numériques tous ceux qui contiennent un mot précis, ce qui est quasi-impensable avec des documents papier.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn6" name="_ftnref6"&gt;[6]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300068"&gt;§         Doit-on gérer l'information numérique ?&lt;/a&gt;&lt;br /&gt;Considérons la question de façon plus générale : doit-on gérer l'information tout court? La réponse à cette question dépend du contexte. Un individu peut très bien accumuler son information personnelle, sans méthode particulière, et il arrivera probablement malgré tout à retrouver sans trop de problème ce dont il a besoin, par exemple, pour faire sa déclaration d'impôt. Une organisation, cependant, ne peut pas fonctionner de cette façon. En effet, une organisation a une existence légale, à laquelle se rattachent des obligations. Elle doit par exemple pouvoir montrer des livres comptables bien tenus, produire des rapports annuels, etc. Une bonne gestion de l'information peut également procurer des avantages compétitifs. Par exemple, si une entreprise peut retrouver facilement l'information sur ses clients potentiels et sur ses compétiteurs, elle réalisera probablement plus de ventes.&lt;br /&gt;&lt;br /&gt;La gestion systématique de l'information, numérique ou pas, est une obligation pour toute organisation.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300069"&gt;1.2         Qu'est-ce qu'un document ?&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Dans ce mémoire, nous nous intéressons au document textuel.&lt;br /&gt;Selon le Dictionnaire des Sciences de l’information et de la communication, le document est le « support d’informations enregistrées à titre permanent et susceptible d’être classé et consulté, et éventuellement reproduit. »&lt;br /&gt;On distingue diverses typologies du document, cependant dans le cadre de la documentation, l’une des plus efficaces a pour fondement « la distinction des documents selon leur nature et leur fonction. » Il résulte alors les catégories de document primaire (ou original) et de document secondaire (ou notice bibliographique du document primaire). La bibliographie, l’index sont des exemples de documents secondaires.&lt;br /&gt;&lt;br /&gt;Pour Jean-Michel Salaün&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn7" name="_ftnref7"&gt;[7]&lt;/a&gt;, l’idée serait qu’un document ne serait qu’« un contrat ou une convention entre des hommes qui fonderait une part de leur humanité, de leur capacité à vivre ensemble, et dont les modalités anthropologiques (lisibilité - perception, signe), intellectuelles (intelligibilité - assimilation, texte) et sociales (sociabilité - intégration, médium) devraient non seulement être efficientes prises chacune séparément, mais encore être cohérentes entre elles. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn8" name="_ftnref8"&gt;[8]&lt;/a&gt;&lt;br /&gt;Pour l’auteur, le document est donc successivement perçu comme signe, texte ou médium.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300070"&gt;§         « Réinventer des documents au travers du numérique »&lt;/a&gt;&lt;br /&gt;Le numérique bouscule à l’évidence profondément le document, devenu électronique. Selon Jean-Michel Salaün, il s’agit de mesurer comment le numérique, à la fois « révélateur » et « facteur d’évolution »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn9" name="_ftnref9"&gt;[9]&lt;/a&gt;, transforme le contrat qui fonde la notion de document. Le numérique ne serait qu’un « vecteur de multiplication, de renouvellement et un des ferments de la transformation des conventions établies entre les hommes. »&lt;br /&gt;Les transformations qui s’opèrent avec l’introduction du numérique portent par exemple sur la matérialité, le traitement cognitif, la perception ou encore l’usage du document.&lt;br /&gt;&lt;br /&gt;1.2.1         &lt;a name="_Toc84300071"&gt;Une première définition du document - Le document comme signe&lt;/a&gt;&lt;br /&gt;L’article « Document : forme, signe et médium, les re-formulations du numérique »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn10" name="_ftnref10"&gt;[10]&lt;/a&gt; définit le document par l’équation suivante :&lt;br /&gt;&lt;br /&gt;Document traditionnel = support + inscription&lt;br /&gt;&lt;br /&gt;Le document est un support sur lequel est fixée une inscription. Le support du document textuel traditionnel est le papier. L’inscription est une trace manuscrite ou imprimée sur le papier.&lt;br /&gt;Avec la numérisation, l’attachement permanent du document traditionnel à son support a été rompu.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300072"&gt;§         Le support du document est modifié par la numérisation&lt;/a&gt;&lt;br /&gt;La numérisation engendre la dématérialisation du support.&lt;br /&gt;Si l’objectif du numérique est de reproduire une « perception similaire ou homologue »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn11" name="_ftnref11"&gt;[11]&lt;/a&gt; à celle de l’objet d’origine, il s’agit néanmoins d’une traduction nouvelle qui pourra « occulter des éléments signifiants ou au contraire en faire découvrir ou redécouvrir de nouveaux. » Le lecteur, quant à lui, doit utiliser un appareillage sophistiqué pour accéder à la lecture du document numérique.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300073"&gt;§         Les conséquences du numérique sur l’inscription du document&lt;/a&gt;&lt;br /&gt;L’inscription relève du codage, une opération familière des informaticiens qui, avec la numérisation, cherchent à isoler les éléments du document pour les modéliser, automatiser les opérations et réagencer les différents éléments. Ceux-ci ont fait ressortir deux niveaux fondamentaux de structuration des documents : leur structure logique (l’articulation du documents en parties et sous-parties) et la représentation formelle de la présentation (par exemple le choix typographique d’un texte).&lt;br /&gt;&lt;br /&gt;On passe alors de l’équation :&lt;br /&gt;&lt;br /&gt;Document traditionnel = support + inscription&lt;br /&gt;à l’équation :&lt;br /&gt;&lt;br /&gt;Document numérique = structure + données&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300074"&gt;1.2.2        Deuxième définition du document : le document défini par son contenu&lt;/a&gt;&lt;br /&gt;Le document est cette fois-ci exprimé selon l’équation :&lt;br /&gt;&lt;br /&gt;Document = inscription + sens&lt;br /&gt;&lt;br /&gt;Le support est cette fois accessoire, seule l’inscription compte. Le contenu est porteur de sens, à deux moments différents de la vie du document : le sens se construit d’abord par rapport au contexte de production, puis par rapport au contexte de diffusion du document.&lt;br /&gt;&lt;br /&gt;Avant d’aller plus loin dans le raisonnement, il est nécessaire de donner une définition du terme « contenu ». Le Dictionnaire des Sciences de l’information et de la communication nous apprend qu’il s’agit du « message [ou de l’] objet de la communication » ou  encore de « ce qui est conservé et transmis par le contenant (document ou support) ». Le contenu peut être « sujet d’une analyse documentaire » ; celle-ci repose sur « [l’extraction des] informations d’un document en les réduisant à l’essentiel par une reformulation dans les termes d’un langage approprié, qui permet de retrouver le document avec son information primaire aussi rapidement et aussi sûrement que possible. »&lt;br /&gt;&lt;br /&gt;La finalité du document est sa diffusion, immédiate ou non. Le document passe nécessairement par une phase d’indexation (le document est défini par son contenu) puis de classement qui permettra la recherche ultérieure (production). Le sens du document se fait ensuite lorsqu’il est lu et interprété par un lecteur à une époque donnée (diffusion) ; le contexte de diffusion (individu, époque) « conditionne l’interprétation du contenu. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn12" name="_ftnref12"&gt;[12]&lt;/a&gt;&lt;br /&gt;Le document est donc pris dans une « double relation » : la relation au monde documentaire (indexation, classement) d’une part, et la relation au monde naturel (interprétation) d’autre part.&lt;br /&gt;&lt;br /&gt;Avec la numérisation, les informaticiens se sont attaqués au contenu du document, pour de l’indexation automatique par exemple. À ce titre, ils ont intégré aux documents les métadonnées, informant de la structure du document, et ont créé les ontologies, langages documentaires héritiers des thésaurus.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn13" name="_ftnref13"&gt;[13]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Le document se définit alors par l’équation :&lt;br /&gt;&lt;br /&gt;Document = texte informé + ontologies&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300075"&gt;1.2.3        Troisième définition du document : l’aspect communicationnel du document – Le document comme médium&lt;/a&gt;&lt;br /&gt;« L’utilisation de plus en plus poussée de la langue naturelle comme d’un outil a tendance à souligner l’aspect communicationnel des textes en estompant la cohérence globale des documents. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn14" name="_ftnref14"&gt;[14]&lt;/a&gt; Ainsi, les liens hypertextes joueraient un rôle plus important que le texte tel qu’il était construit par l'auteur. Pourtant, le contenu n’a de valeur que par rapport à un contexte.&lt;br /&gt;Un document donne un statut à une information, à un signe matérialisé, il est porté par un groupe social qui le suscite, le diffuse, le sauvegarde et l’utilise. La publication constitue souvent un moyen simple de légitimation. Entré dans une « mémoire » partagée, sa valeur est appréciée collectivement. « Le contrat de lecture trouve sa troisième dimension dans la sociabilité. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn15" name="_ftnref15"&gt;[15]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Le numérique a transformé le document, et avec lui son traitement. Il nous a semblé nécessaire, avant de parler de gestion de l’information en entreprise (partie 2), et particulièrement de gestion automatisée, de définir la notion de « technologie intellectuelle ». Celle-ci regroupe tous les outils qui, depuis l’écriture, sont venus modifier la relation au savoir, la façon dont les gens échangent entre eux.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300076"&gt;1.3         Document numérique et technologie intellectuelle : au pouvoir de l'entreprise&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;« L’intelligence ne s’est jamais construite sans support technique, il n’existe pas d’intelligence "naturelle", non équipée et fruit du seul individu. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn16" name="_ftnref16"&gt;[16]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300077"&gt;1.3.1        Daniel Bell : « &lt;/a&gt;ordonner la société de masse »&lt;br /&gt;Pascal Robert nous apprend&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn17" name="_ftnref17"&gt;[17]&lt;/a&gt; que l’expression  « technologie intellectuelle » est employée la première fois par Daniel Bell, dans son livre La Société post-industrielle (Robert Laffont, 1976). Pour l’auteur, elle désigne un outil susceptible d’« ordonner la société de masse », de gérer la complexité de notre société. Elle est un outil de résolution formelle de problème, mise en œuvre par un ordinateur.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300078"&gt;1.3.2        Jack Goody : l’écriture et la liste&lt;/a&gt;&lt;br /&gt;Jack Goody élargit cette première définition à l’écriture. Cité par Pascal Robert&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn18" name="_ftnref18"&gt;[18]&lt;/a&gt;, il avance dans La Raison graphique (Éditions de Minuit, 1979), que « même si l’on ne peut raisonnablement pas réduire un message au moyen matériel de sa transmission, tout changement dans le système des communications a nécessairement d’importants effets sur les contenus transmis. (…) C’est pourquoi un examen des moyens de communication peut contribuer à nous éclairer davantage sur la nature des développements dans le domaine de la pensée. » Écrire, faire des listes, ne participe pas simplement à l’émergence d’une nouvelle habileté technique, mais « au fondement d’une nouvelle aptitude intellectuelle. » Ainsi, « l’écriture et la liste offrent une intelligence gestionnaire qui repose sur la possibilité de travailler avec et sur les opérations de stockage, de regroupement, de tri (…), grâce à la maîtrise d’une technique de distribution spatiale de l’information. »&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300079"&gt;1.3.3        Pierre Lévy : l’informatique&lt;/a&gt;&lt;br /&gt;Pierre Lévy, dans Les Technologies de l'intelligence (La Découverte, 1990), reprend le travail de Jack Goody, en se concentrant davantage sur l’informatique. Pascal Robert résume ainsi son propos : « l’écriture et l’imprimerie ont exploré des voies certes essentielles, mais dont la véritable richesse ne peut être véritablement révélée que par l’informatique. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn19" name="_ftnref19"&gt;[19]&lt;/a&gt; La technologie intellectuelle est un « réseau hétérogène d’interfaces, liées par une dynamique hypertextuelle, en évolution constante. » L’auteur étend ensuite sa définition à tous les outils, machines et procédés de production, « même quand ils n’ont pas pour objet direct le traitement de l’information, l’enregistrement ou la transmission des représentations. »&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300080"&gt;1.3.4        Pascal Robert : de la gestion du nombre à la « &lt;/a&gt;ressource de pouvoir »&lt;br /&gt;Pascal Robert nous délivre une théorie à la fois plus générale et plus stricte des technologies intellectuelles.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn20" name="_ftnref20"&gt;[20]&lt;/a&gt; Il admet, après un travail de définition sur les propriétés de la notion, que, outre l’écriture, l’imprimerie et l’informatique, d’autres dispositifs techniques peuvent également être considérés comme des technologies intellectuelles. Il objecte cependant à Pierre Lévy d’assimiler la notion à tout processus, dès lors qu’il relève du penser / classer.&lt;br /&gt;Pascal Robert propose donc la définition suivante : la technologie intellectuelle est « un outil régulé de gestion du nombre (de la complexité) opérant une traduction de l’événement en document par la conversion des dimensions. »&lt;br /&gt;&lt;br /&gt;Une technologie intellectuelle est un outil, c’est-à-dire une réalité technique matérielle (par exemple le livre), support d’une représentation (le texte), dont la relation est entendue comme condition réciproque d’existence. « Cet outil possède un dispositif de régulation qui permet de déterminer un effet d’ordre et d’organisation. » Ce dispositif institue une règle de structuration propre à chacune des technologies intellectuelles (par exemple l’index, la bibliographie sont des régulateurs assurant une manipulation plus simple et plus productive du livre).&lt;br /&gt;Les technologies intellectuelles sont d’excellents outils de gestion du nombre : elles le comptent, le classent, le hiérarchisent, etc. Voilà ce à quoi, pour l’auteur, l’on emploie et l’on reconnaît une technologie intellectuelle. « Cette gestion s’exerce par le travail d’une opération de traduction de l’événement, manifesté par la production d’informations pour un observateur, en document ». La technologie intellectuelle recueille, fixe et enregistre cette information, pérennisant l’événement. Les opérations ultérieures d’accumulation et de traitement se développeront sur cette base. Il n’y a donc pas de traitement possible sans le passage au document, stabilisant l’information.&lt;br /&gt;« Le document constitue l’espace d’expression du dispositif de régulation de la technologie intellectuelle : il participe à définir le mode de traitement de l’information qu’il autorise. (…) Mais s’il permet de définir un ordre, il ne joue que peu sur les variables de l’espace et du temps. La maîtrise de l’événement (…) passe par une maîtrise de ces deux paramètres. Les technologies intellectuelles y parviennent en jouant (…) sur les dimensions&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn21" name="_ftnref21"&gt;[21]&lt;/a&gt;. » Ces opérations sont à l’œuvre dans le travail de traduction de l’événement en document :&lt;br /&gt;-         le passage d’une dimension inférieure à une dimension supérieure correspond au traitement de l’information,&lt;br /&gt;-         le travail sur l’échelle avec conservation de la dimension correspond à la navigation,&lt;br /&gt;-         le passage d’une dimension supérieure à une dimension inférieure correspond à la modélisation.&lt;br /&gt;Ce travail de conversion des dimensions permet à l’auteur, dans un second article,&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn22" name="_ftnref22"&gt;[22]&lt;/a&gt; de définir trois grandes « raisons », regroupées autour de ces trois principes : la raison graphique (la liste, les graphiques), la raison classificatrice (le livre, l’encyclopédie) et la raison simulatrice (l’informatique).&lt;br /&gt;&lt;br /&gt;« Dire de quelque chose qu’il est stable, cela revient à dire qu’il ne se modifie / dégrade pas ou peu, (…) ou qu’il parvient à maintenir constant son état interne par lui-même, que sa structure, sa morphologie et sa fonction ne se déforment pas aléatoirement. (…) La stabilité du document est à la fois matérielle et informationnelle : l’intégrité de l’information qu’il porte dépend de celle de son support. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn23" name="_ftnref23"&gt;[23]&lt;/a&gt; Bien évidemment, le document pourra être détruit, reproduit, se déplacer, sans que cela remette forcément en cause sa stabilité. « Grâce à cette double stabilité / mobilité », le document peut être transmis dans le temps et déplacé dans l’espace. Il entre dans un processus de décontextualisation.&lt;br /&gt;Les banques de données jouent habilement du balancement entre l’indispensable concentration, la masse, et sa variation, son actualisation ; entre l’irréversibilité (sans quoi il n’y a pas d’effet de masse) et la réversibilité (sans quoi la masse demeure inerte). Ces deux couples, stabilité / mobilité et réversibilité / irréversibilité, permettent à ceux qui les maîtrisent d’entrer en concurrence (diffuser le document ou au contraire le rendre immobile, unique) et leur offrent donc beaucoup de pouvoir.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Dès lors qu’un document n’est plus figé par un support, il faut gérer les temporalités diverses d’un et de plusieurs documents et de son écriture, de son enrichissement ou de sa réécriture par des intervenants variés.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftn24" name="_ftnref24"&gt;[24]&lt;/a&gt; La dématérialisation de son support entraîne une facilité dans sa modification.&lt;br /&gt;Pour les auteurs du Dictionnaire des Sciences de l’information et de la communication, les fonctions du document sont « la conservation de l’information (constitution d’une mémoire) et la diffusion du savoir. » Comment parler de conservation dans les organisations, quand les versions intermédiaires d’un document sont effacées ? Seule la dernière version du document est désormais conservée. À l’heure du travail collaboratif en entreprise, qui nécessite la mise en commun de documents, l’affichage des informations ne constitue pas à lui seul le document, il doit être validé par des procédures certifiées.&lt;br /&gt;&lt;br /&gt;Avec le développement des Technologies de l’information et de la communication, techniques d’une sophistication extrême, les technologies intellectuelles revêtent une importance particulière dans la gestion de l’information. Bien maîtrisées, elles permettent à une entreprise de prendre les décisions stratégiques, indispensables à sa survie.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref1" name="_ftn1"&gt;[1]&lt;/a&gt; Source : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref2" name="_ftn2"&gt;[2]&lt;/a&gt; Source : LAMIZET, Bernard ; SILEM, Ahmed, Dictionnaire encyclopédique des sciences de l’information et de la communication, Ellipses, 1997.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref3" name="_ftn3"&gt;[3]&lt;/a&gt; Source : URFIST, Le problème de la qualité et de la pertinence de l'information [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm"&gt;HTTP://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref4" name="_ftn4"&gt;[4]&lt;/a&gt; Source : LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref5" name="_ftn5"&gt;[5]&lt;/a&gt; TARONDEAU, Jean-Claude, Le management des savoirs, Que sais-je ? ; PUF éditions, 2003.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref6" name="_ftn6"&gt;[6]&lt;/a&gt; Université de Montréal, École de bibliothéconomie et des sciences de l'information, Guide de l'étudiant - Certificat en gestion de l'information numérique - 2004-2005 [en ligne], Disponible sur  &lt;&lt;a href="http://www.ebsi.umontreal.ca/guidegin/guide-gin-0405.pdf"&gt;HTTP://www.ebsi.umontreal.ca/guidegin/guide-gin-0405.pdf&lt;/a&gt;&gt; (consulté le 22 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref7" name="_ftn7"&gt;[7]&lt;/a&gt; Jean-Michel Salaün, Professeur à l’ENSSIB et animateur du domaine « Documents et contenu : création, indexation, navigation », du département Sciences et technologies de l’information et de la communication du CNRS, est l’initiateur de l’article intitulé « Document : forme, signe et médium, les re-formulations du numérique », projet collectif qui se propose de spécifier la notion de document.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref8" name="_ftn8"&gt;[8]&lt;/a&gt; SALAÜN, Jean-Michel, Chronique inachevée d’une réflexion collective sur le document [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://rtp-doc.enssib.fr/fichiers/DefinitionDocument/Bibliotheque_document/Com-et-lang-09-01-2004.doc"&gt;HTTP://rtp-doc.enssib.fr/fichiers/DefinitionDocument/Bibliotheque_document/Com-et-lang-09-01-2004.doc&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref9" name="_ftn9"&gt;[9]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref10" name="_ftn10"&gt;[10]&lt;/a&gt; SALAÜN, Jean-Michel, Document : forme, signe et médium, les re-formulations du numérique [en ligne], Disponible sur &lt;&lt;a href="http://rtp-doc.enssib.fr/"&gt;HTTP://archivesic.ccsd.cnrs.fr/sic_00000511.HTML&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref11" name="_ftn11"&gt;[11]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref12" name="_ftn12"&gt;[12]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref13" name="_ftn13"&gt;[13]&lt;/a&gt; La notion d’ontologie sera définie dans la partie 3.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref14" name="_ftn14"&gt;[14]&lt;/a&gt; SALAÜN, Jean-Michel, Document : forme, signe et médium, les re-formulations du numérique [en ligne], Disponible sur &lt;&lt;a href="http://rtp-doc.enssib.fr/"&gt;HTTP://archivesic.ccsd.cnrs.fr/sic_00000511.HTML&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref15" name="_ftn15"&gt;[15]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref16" name="_ftn16"&gt;[16]&lt;/a&gt; ROBERT, Pascal, « Qu’est-ce qu’une technologie intellectuelle ? », In : Communication et langages, 123, premier trimestre 2000, Armand Colin éditeur.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref17" name="_ftn17"&gt;[17]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref18" name="_ftn18"&gt;[18]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref19" name="_ftn19"&gt;[19]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref20" name="_ftn20"&gt;[20]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref21" name="_ftn21"&gt;[21]&lt;/a&gt; La dimension de premier niveau correspond à la page, la deuxième dimension correspond au livre, la troisième à la bibliothèque, et la quatrième au film (ajout du mouvement).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref22" name="_ftn22"&gt;[22]&lt;/a&gt; ROBERT, Pascal, « Les technologies intellectuelles : typologie », In : Communication et langages, 125, septembre 2000, Armand Colin éditeur.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref23" name="_ftn23"&gt;[23]&lt;/a&gt; ROBERT, Pascal, « Qu’est-ce qu’une technologie intellectuelle ? », In : Communication et langages, 123, premier trimestre 2000, Armand Colin éditeur.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=7274366301484400283#_ftnref24" name="_ftn24"&gt;[24]&lt;/a&gt; SALAÜN, Jean-Michel, Document : forme, signe et médium, les re-formulations du numérique [en ligne], Disponible sur &lt;&lt;a href="http://rtp-doc.enssib.fr/"&gt;HTTP://archivesic.ccsd.cnrs.fr/sic_00000511.HTML&lt;/a&gt;&gt;.&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-7274366301484400283?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/7274366301484400283/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=7274366301484400283' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/7274366301484400283'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/7274366301484400283'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/information-document-numrique.html' title='Chapitre 1 : Information, document, numérique'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-4231717004015567960</id><published>2008-04-04T08:15:00.000-07:00</published><updated>2008-08-06T06:04:42.006-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='06.Chapitre2'/><title type='text'>Chapitre 2 : Gestion automatisée de l’information en entreprise : pour des décisions stratégiques</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;2.1 Évaluer les besoins en informations............................................................................ 23&lt;br /&gt;2.2 L’analyse de l’information : de la classification au stockage de l’information - Les évolutions de la chaîne de traitement documentaire................................................................................................. 26&lt;br /&gt;§ Information et information numérique: deux modes de gestion différents................................................ 26&lt;br /&gt;§ Comment doit-on gérer l'information numérique?......................................................................................... 27&lt;br /&gt;2.2.1 Les langages documentaires : de la représentation par des codes au langage naturel...................... 28&lt;br /&gt;§ Les langages classificatoires............................................................................................................................ 28&lt;br /&gt;§ Les langages d’indexation................................................................................................................................ 29&lt;br /&gt;§ La notice bibliographique................................................................................................................................. 31&lt;br /&gt;2.2.2 Le traitement automatique : les bases de données.................................................................................. 32&lt;br /&gt;2.2.3 L’intranet, outil de capitalisation des connaissances en entreprise..................................................... 33&lt;br /&gt;2.3 La recherche automatique d’informations : un « dialogue » homme – machine........ 35&lt;br /&gt;§ La notion d’accueil existe aussi en informatique documentaire.................................................................. 36&lt;br /&gt;§ Pertinence de l'information................................................................................................................................ 37&lt;br /&gt;2.3.1 Les difficultés de compréhension liées au contenu................................................................................. 38&lt;br /&gt;§ La reconnaissance tardive des particularités du matériau textuel............................................................... 39&lt;br /&gt;§ Quelques paramètres relatifs aux corpus........................................................................................................ 39&lt;br /&gt;2.3.2 Les solutions adoptées................................................................................................................................ 41&lt;br /&gt;§ L’aide à l’analyse des textes............................................................................................................................. 41&lt;br /&gt;§ L’aide à l’interaction avec la base de données.............................................................................................. 44&lt;br /&gt;2.3.3 Le dialogue humain existe toujours&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300159"&gt;&lt;/a&gt;&lt;a name="_Toc84300081"&gt;1           Gestion automatisée de l’information en entreprise : pour des décisions stratégiques&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;La gestion électronique de documents (GED) comporte quatre dimensions essentielles :&lt;br /&gt;-         la recherche : capacité à retrouver les documents recherchés,&lt;br /&gt;-         la sécurité : contrôle des accès aux documents en lecture / écriture,&lt;br /&gt;-         le contrôle des versions : conservation de la trace des originaux et des corrections,&lt;br /&gt;-         l’archivage : accessibilité des données archivées.&lt;br /&gt;Si les quatre fonctionnalités sont stratégiques pour l’entreprise, il faudra investir dans un système de gestion documentaire.&lt;br /&gt;La GED regroupe un ensemble de fonctions qui gèrent par ordinateur les sept étapes de la vie d’un document : les étapes d’archivage (l’acquisition, le traitement, le stockage, la recherche) et les étapes d’exploitation (l’organisation, la consultation, la transmission). La justification d’un système de GED doit être par conséquent liée à une volonté de mise à disposition des données et des informations qu’elles contiennent.&lt;br /&gt;L’objectif du système de GED peut être :&lt;br /&gt;-         d’acquérir de nouvelles connaissances depuis des sources extérieures,&lt;br /&gt;-         d’organiser l’information interne à l’entreprise et d’en faciliter la consultation,&lt;br /&gt;-         de mettre en place une base documentaire destinée à assister les utilisateurs.&lt;br /&gt;&lt;br /&gt;L’utilisateur est au centre de la réussite du projet de GED, c’est pourquoi il est important de se placer de son côté pour en comprendre ses besoins et adapter l’outil à son environnement de travail. Il faut aussi comprendre comment il peut intégrer l’outil dans le cadre de ses activités professionnelles.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300082"&gt;1.1         Évaluer les besoins en informations&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;L’analyse (interpréter les pratiques, les demandes, les besoins et les attentes des usagers, développer leur culture de l’information en les aidant à faire le meilleur usage des ressources disponibles) et la satisfaction des besoins des usagers sont au cœur de la démarche des professionnels de l’information et de la documentation.&lt;br /&gt;Leur travail consistera tout d’abord à définir leur cible prioritaire : s’ils travaillent pour leur directeur, ils privilégieront l’information immédiate, factuelle (dossier papier, contact par messagerie…) ; s’ils travaillent pour des chargés d’études, ils privilégieront les sources d’information, les actes de colloques, les études (banques de données en ligne, forums électroniques…). Effectivement, chaque individu appréhende les textes avec ses propres connaissances et intérêts. Pour augmenter la rentabilité de ces bases de données, il faudrait à la fois satisfaire une collectivité et permettre des traitements ad hoc pour répondre à des objectifs particuliers.&lt;br /&gt;Les besoins réels des utilisateurs sont parfois difficiles à cerner : d’une part, les utilisateurs manifestent une sorte d’autocensure (ils modulent leurs attentes en fonction de ce qu’ils croient pouvoir demander à un système automatisé) ; d’autre part, ils font preuve d’un manque d’imagination (car ils n’ont pas l’habitude de l’interaction en ligne avec un texte, par exemple).&lt;br /&gt;&lt;br /&gt;Cependant, afin d’évaluer les besoins en informations d’utilisateurs divers et dont les besoins sont variés, quelques paramètres entrent en ligne de compte :&lt;br /&gt;-         leur connaissance des systèmes automatisés en général, des systèmes de gestion textuelle en particulier : veulent-ils utiliser à leur guise toutes les commandes disponibles ou bien préfèrent-ils s’en remettre à quelques automatismes de repérage, quitte à se priver de certains traitements évolués, mais compliqués ?&lt;br /&gt;-         leur connaissance du domaine représenté par la base de données : il faudrait fournir aux non-spécialistes une carte conceptuelle du domaine afin de faciliter leur orientation et la mise au point de leurs stratégies de recherche, alors que les experts n’en auront cure,&lt;br /&gt;-         leur connaissance de la base de données elle-même, de son contenu, de sa structuration, des politiques ou algorithmes d’analyse et de classification, etc.,&lt;br /&gt;-         leur connaissance du type de textes gérés par le système : peuvent-ils localiser d’emblée les différents éléments de la macrostructure de ces textes, même si elle n’est pas explicitement marquée par la typographie ou la mise en page, ou bien faut-il la reconstituer pour eux, sous forme de table des matières ou de résumé indicatif ?&lt;br /&gt;-         les objectifs d’utilisation : les représentations les plus utiles varient en fonction de ce que l’on veut faire : on peut accéder à un corpus pour trouver ce qui est dit d’un thème donné, corriger des textes, en rédiger d’autres du même type, effectuer une analyse stylistique, étudier des tendances, préparer une synthèse, faire des recherches longitudinales, établir des corrélations, naviguer parmi les thèmes, les passages ou les textes qui s’appellent les uns les autres, etc. En principe, les utilisateurs ne devraient plus être limités par la recherche « sujet » qu’imposait l’indexation par mots-clés.&lt;br /&gt;-         les exigences du contexte de travail : si la rapidité d’accès aux données prime, une analyse sémantique approfondie est irréaliste, car elle nécessite une intervention humaine. Mais, en l’absence d’un contrôle des expressions synonymiques et d’une structuration hiérarchique des concepts, le taux de rappel risque, dans certains corpus, d’être faible, à moins que les utilisateurs ne soient très familiers avec le vocabulaire,&lt;br /&gt;-         le nombre des utilisateurs : plus la clientèle est importante et plus les interactions avec la base de données sont nombreuses, plus il vaut la peine d’investir dans un traitement préalable des textes, afin de minimiser le temps perdu par chacun pour élaborer des stratégies de recherche complexes et pour trier les résultats « bruyants » du repérage.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn1" name="_ftnref1"&gt;[1]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Tous les paramètres énumérés peuvent se combiner pour donner une palette impressionnante de besoins si la clientèle est hétérogène. À cela, il faudrait encore ajouter d’autres problèmes comme :&lt;br /&gt;-         le caractère évolutif des besoins : même si les utilisateurs sont relativement homogènes, au fur et à mesure que se développe une certaine familiarisation avec le domaine, les documents, les outils, etc., leur besoin d'assistance diminue et ils risquent de se sentir limités par les possibilités offertes,&lt;br /&gt;-         le caractère individuel et collectif des besoins : il est dangereux de concevoir un système d’analyse et de repérage des données textuelles uniquement à partir d’un portrait-type des utilisateurs, car chaque individu appréhende les textes avec ses propres connaissances et intérêts.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn2" name="_ftnref2"&gt;[2]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Les attentes des personnels d’une entreprise s’expriment finalement en six points : l’information doit être disponible, l’information doit être fiable, l’information doit être ouverte vers le monde externe, la présentation de l’information doit être unifiée, la performance technique doit être à la hauteur d’un usage professionnel et la sécurité de l’information doit être garantie.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn3" name="_ftnref3"&gt;[3]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;L’omniprésence du numérique dans le documentaire, sa performance et la rapidité de sa diffusion rendent d’autant plus nécessaire une fine et juste analyse de chaque entrée et de leur croisement.&lt;br /&gt;Après une présentation des méthodes d’indexation et de classification usitées dans les centres de documentation, nous exposerons les outils et les moyens nouveaux palliant aux bouleversements intervenus dans la chaîne du traitement documentaire, liés à l’arrivée du document numérique dans l’entreprise.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300083"&gt;1.2         L’analyse de l’information : de la classification au stockage de l’information - Les évolutions de la chaîne de traitement documentaire&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;L’analyse documentaire  repose sur « [l’extraction des] informations d’un document en les réduisant à l’essentiel par une reformulation dans les termes d’un langage approprié, qui permet de retrouver le document avec son information primaire aussi rapidement et aussi sûrement que possible. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn4" name="_ftnref4"&gt;[4]&lt;/a&gt; L’analyse documentaire n’est pas un but en soi : ce n’est qu’une technique préalable à la recherche d’informations, il est donc important de relier les différentes méthodes d’indexation aux modes de recherche visés.&lt;br /&gt;L’analyse documentaire doit faire appel à des langages documentaires, afin de normaliser l’expression des contenus. En effet, l’indexeur et l’usager ne parlent pas le même langage, et le langage documentaire fournit le lien entre leurs vocabulaires, notamment par l’importance des relations hiérarchiques dans le cas d’un thésaurus.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300084"&gt;§         Information et information numérique: deux modes de gestion différents&lt;/a&gt;&lt;br /&gt;L'information numérique comporte beaucoup d'avantages par rapport à l'information exclusivement sur papier, mais elle amène aussi son lot de problèmes particuliers.&lt;br /&gt;D'abord, elle est "dématérialisée", en ce sens qu'un fichier informatique ne se voit pas directement comme une feuille de papier; il faut nécessairement un ordinateur et un logiciel approprié pour voir (ou entendre) l'information numérique. Ensuite, elle est facile à copier : c'est le problème des droits d'auteurs, qui culmine actuellement dans des querelles du genre de celle que se sont livrées Napster et les géants de la musique enregistrée. Elle est difficile à "signer" : comment, par exemple, être sûr que l'auteur d'une offre d'achat reçue électroniquement sur une disquette est bien la personne mentionnée comme acheteur éventuel dans le document ? Finalement, elle est plus difficile à conserver à long terme que l'information traditionnelle, car la durée de vie des supports de stockage, et même des logiciels pour y accéder, est beaucoup plus limitée que celle du papier.&lt;br /&gt;Étant donné ces problèmes potentiels, toutes les méthodes que l'on a développées jusqu'à maintenant pour gérer systématiquement l'information sur papier doivent être revues et adaptées pour être applicables à l'information numérique.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300085"&gt;§         Comment doit-on gérer l'information numérique?&lt;/a&gt;&lt;br /&gt;L'information numérique est née de la technologie, et il est donc tout à fait naturel que les outils pour la gérer viennent aussi de la technologie. Ces outils sont habituellement des logiciels, mais parfois aussi des pièces d'équipement matériel, par exemple un scanner. Des outils existent pour :&lt;br /&gt;-         créer l'information numérique,&lt;br /&gt;-         convertir l'information numérique d'un format à un autre,&lt;br /&gt;-         entreposer l'information numérique,&lt;br /&gt;-         organiser l'information numérique,&lt;br /&gt;-         sécuriser l'information numérique,&lt;br /&gt;-         retrouver l'information numérique,&lt;br /&gt;-         publier l'information numérique tant sur papier que sur réseaux informatiques : réseaux locaux, intranets, extranets et Internet,&lt;br /&gt;-         diffuser l'information numérique par des moyens traditionnels ainsi que par courrier électronique, forums de discussion, moteurs de recherche, etc.,&lt;br /&gt;-         conserver à long terme l'information numérique.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn5" name="_ftnref5"&gt;[5]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;C'est en orchestrant judicieusement l'utilisation de ces différents types d'outils que l'on arrive à bien gérer l'information numérique dans une organisation.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300086"&gt;1.2.1        Les langages documentaires : de la représentation par des codes au langage naturel&lt;/a&gt;&lt;br /&gt;« Un langage documentaire est un système de signes destiné à la classification ou à l’indexation du contenu des documents et des questions des utilisateurs d’un fonds documentaire. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn6" name="_ftnref6"&gt;[6]&lt;/a&gt; Outils de recherche d’information, les langages documentaires permettent de recenser les documents par la constitution de fichiers, index, catalogues…&lt;br /&gt;Avec le document numérique, ces techniques, en évolution permanente, en sont-elles à une phase de transformation ?&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300087"&gt;§         Les langages classificatoires&lt;/a&gt;&lt;br /&gt;« Opérer une classification dans une collection d’objets, c’est reconnaître des apparentements, mettre en évidence des différences, c’est aussi effectuer une mise en ordre, une structuration des objets donnés. »&lt;br /&gt;&lt;br /&gt;La classification, réalisée à partir d’une analyse globale du contenu du document, est utilisée pour ranger un document dans un nombre limité de rubriques. Elle peut également servir à le localiser dans un espace (rayonnage de bibliothèques par exemple). Ces rubriques, exprimées par des codes, donnent lieu à des catalogues, bulletins et index.&lt;br /&gt;Les langages classificatoires sont plutôt utilisés pour les fonds documentaires encyclopédiques, bien que certaines rubriques aient fait l’objet de développements importants pour s’adapter à des fonds documentaires spécialisés.&lt;br /&gt;Les évolutions&lt;br /&gt;Le développement de systèmes d’organisation du savoir est relativement récent. La Classification décimale de Dewey (C.D.D.), publiée en 1876 par Melvil Dewey, établie sur une division hiérarchique de tous les domaines du savoir, représentée par des indices numériques, connaît encore de nos jours un vif succès. Le développement de certaines rubriques permet notamment le classement de fonds de livres spécialisés.&lt;br /&gt;La Classification décimale universelle (C.D.U.), dérivée de la C.D.D., est publiée pour la première fois en 1910. Elle propose une description plus fine des informations et un enrichissement de la syntaxe par l’introduction de signes de mise en relation des indices. Elle est utilisée par les bibliothèques universitaires.&lt;br /&gt;&lt;br /&gt;Les nombreuses traductions auxquelles ces deux langages ont donné lieu contribuent à leur usage dans le monde entier. Toutefois, un certain nombre de reproches d’ordre technique (lenteur des mises à jour, complexité d’utilisation, voire manque de logique), leur sont faits.&lt;br /&gt;&lt;br /&gt;Parallèlement à ces langages classificatoires, dont la représentation par des codes et l’insuffisance des index ajoutent à la complexité d’appréhension, des travaux ont été menés pour développer des langages créés à partir du vocabulaire du langage naturel. « L’extension de l’information et la variété des supports désormais disponibles réclament une analyse plus fine en même temps qu’une recherche plus facile. Les langages d’indexation sont nés de ces exigences. »&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300088"&gt;§         Les langages d’indexation&lt;/a&gt;&lt;br /&gt;L’indexation, obtenue après une analyse approfondie du contenu d’un document, a pour fonction de répertorier l’ensemble de ses concepts et d’aider à les retrouver quelle qu’en soit leur combinaison. Les concepts sont utilisés pour organiser alphabétiquement des fichiers, bulletins et index matières. Un index est une « liste ordonnée alphabétiquement des éléments ou données contenus dans un document ou un fichier, qui permet de les localiser. »&lt;br /&gt;À l’inverse des langages classificatoires, les langages d’indexation sont destinés à la description du contenu de documents très spécialisés. Parmi les diverses approches qui se sont succédé dans le temps, il est courant de mettre en évidence plusieurs types d’oppositions : indexation humaine / automatique, indexation sur le texte intégral / indexation plein texte, indexation libre / indexation contrôlée (liste des termes fermée), indexation à plat (liste non organisée de descripteurs non pondérés) / indexation différenciée.&lt;br /&gt;Les évolutions&lt;br /&gt;En 1953, Mortimer Taube a mis au point un système de représentation du contenu des documents fondé sur le mot comme plus petite unité d’information. Il s’appelle uniterm. L’usage de ce système est très limité par le risque de fausses combinaisons qu’il engendre à l’interrogation.&lt;br /&gt;Calvin Moers, à la fin des années cinquante, conçoit un lexique dans lequel l’unité d’information n’est plus le mot mais le descripteur, « concept d’un ou plusieurs termes représentant le contenu d’un document. » Les réponses apportées sont plus pertinentes.&lt;br /&gt;Des normes françaises de constitution de vedettes matières publiées par l’AFNOR en 1957 (NF Z 44-070) permettent d’harmoniser les pratiques de constitution de catalogues alphabétiques matières. Utilisées conjointement avec les classifications C.D.D. ou C.D.U., elles en reprennent le modèle mais ont l’avantage d’exprimer les contenus en termes clairs.&lt;br /&gt;Toujours en 1957, la dénomination de thésaurus est utilisée pour la première fois. « Instrument de contrôle de la terminologie utilisé dans un système d’information, dans les centres de documentation, il joue un rôle important dans l’exploitation d’un système de stockage et de recherche d’information, surtout dans un système informatisé où il peut servir de fichier de référence. C’est un répertoire de mots dont l’environnement sémantique est précisé par des relations hiérarchiques, associatives ou d’équivalence. C’est un langage contrôlé. » Jacques Chaumier&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn7" name="_ftnref7"&gt;[7]&lt;/a&gt; définit le thésaurus comme un « dictionnaire de mots ou expressions du langage naturel, normalisés et préférentiels, organisés d’une manière conceptuelle présentant les termes groupés par affinité sémantique et complété d’indications de relations. » Les unités lexicales sont reliées les unes aux autres par des relations sémantiques qui font l’objet de diverses représentations graphiques, facilitant la perception de l’environnement des termes tout en leur donnant du sens et en enrichissant les possibilités d’interrogation à divers degrés de hiérarchie. Les relations sémantiques (relations associative et synonymique) et les relations hiérarchiques (termes générique et spécifique) contribuent à lever la polysémie, permettent d’élargir une question trop précise ou encore définissent des profils documentaires d’une grande portée.&lt;br /&gt;&lt;br /&gt;Bénéficiaire des expériences qui l’ont précédé, le thésaurus peut être organisé en domaines du savoir, disposer de lexique permuté, être complété par des codes pour faciliter l’utilisation simultanément en plusieurs langues. L’indexation manuelle par thésaurus représente l’aboutissement des techniques documentaires traditionnelles.&lt;br /&gt;Les possibilités de gestion informatisée, d’usage pour l’indexation automatique, l’adaptation aux besoins particuliers des groupes d’usagers, ont contribué à la multiplication des thésaurus alors même que l’indexation libre en langage naturel gagne du terrain.&lt;br /&gt;&lt;br /&gt;À travers toutes ces approches de l’indexation se dégagent des constantes. Philippe Lefèvre&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn8" name="_ftnref8"&gt;[8]&lt;/a&gt; nous donne la définition suivante : « l’indexation est la représentation formalisée et condensée du contenu thématique ou sémantique d’un document, à l’aide d’indicateurs sémantiques qui peuvent être des indices de classification ou des descripteurs, contrôlés ou non. Ces indicateurs appartiennent au langage naturel et / ou à un langage documentaire. »&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300089"&gt;§         La notice bibliographique&lt;/a&gt;&lt;br /&gt;Dans tous les cas, les documents doivent être identifiés, classés et référencés. Les références de chaque document sont saisies dans une notice documentaire (le catalogage). Celle-ci contient donc des informations structurées dans des champs prédéfinis, leur existence permet de retrouver les documents par une recherche factuelle plus simple que la recherche sur le contenu. Pour un livre, on parle de notice bibliographique : « ensemble de données organisées sous forme de champs et qui décrivent un document (champ auteur / champ titre / champ année et lieu de publication / champ mot-clé ...). »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn9" name="_ftnref9"&gt;[9]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Après la phase d’indexation / classification du document, le chemin de la gestion de l’information nous emmène logiquement vers son traitement, et plus particulièrement son traitement automatique.&lt;br /&gt;Trois générations de systèmes et logiciels documentaires se sont succédé. La première génération correspond à des corpus de document papier, dont seules les références sont gérées par le logiciel documentaire. La deuxième génération est constituée de bases de documents stockés sous forme de fichier images sur des disques optiques numériques : le système gère à la fois les références et l’accès aux fichiers ; c’est la GED classique. La troisième génération correspond à des bases de documents en texte intégral, accessibles localement ou à distance à travers un réseau, dont les références et le contenu sont totalement gérés par le système : ce sont les logiciels de gestion des connaissances.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn10" name="_ftnref10"&gt;[10]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Nous sommes aujourd’hui loin du plan de classement qui existait il y a une quinzaine d’années dans les entreprises. Les outils de traitement de l’information ont des qualités supérieures, ce qui rend possible une meilleure indexation et une meilleure signalisation du document. Intéressons-nous à l’un d’entre eux : la base de données.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300090"&gt;1.2.2        Le traitement automatique : les bases de données&lt;/a&gt;&lt;br /&gt;Dans cette partie nous montrons en quoi une base de données est une technologie intellectuelle.&lt;br /&gt;&lt;br /&gt;Rappelons tout d’abord qu’une « technologie intellectuelle » est un « outil qui possède un dispositif de régulation qui permet de déterminer un effet d’ordre et d’organisation. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn11" name="_ftnref11"&gt;[11]&lt;/a&gt;&lt;br /&gt;En outre, une base de données est un « ensemble de données évolutives, organisé ou structuré pour en faciliter l’utilisation via un programme spécialisé d’accès aux données de la base. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn12" name="_ftnref12"&gt;[12]&lt;/a&gt; La notion de programme d’exploitation ne préjuge pas de la technologie employée : la base de données peut tout aussi bien être exploitée manuellement (un fichier sur carton par exemple) qu’automatiquement (logiciel de documentation). Cependant, l’intérêt d’un logiciel informatique est de faciliter l’accès à l’information recherchée, de réaliser des tris selon différents critères, de combiner les mos clés pour éviter les silences (des documents pertinents ne sont pas retenus) et les bruits (des documents non pertinents sont retenus). Les informations peuvent être organisées de différentes manières, mais le modèle d’organisation hiérarchique (en arborescence) ou relationnel (tableau de lignes et de colonnes) sont les formes les plus courantes.&lt;br /&gt;Nous en déduisons que les bases de données possèdent un dispositif de régulation (les modèles hiérarchique ou relationnel), qui permet de déterminer un effet d’ordre et d’organisation (les données sont organisées et structurées en arborescence ou en tableau).&lt;br /&gt;&lt;br /&gt;La définition même de la technologie intellectuelle renseigne de sa fonction. Si nous reprenons la définition établie par Pierre Lévy, dans Les Technologies de l'intelligence (La Découverte, 1990), nous voyons qu’elle a  pour objet direct « le traitement de l’information, l’enregistrement ou la transmission des représentations. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn13" name="_ftnref13"&gt;[13]&lt;/a&gt; La base de données, quant à elle, organise et structure les données (traitement), stockées dans la base (enregistrement), et facilite l’accès à l’information (transmission).&lt;br /&gt;&lt;br /&gt;Une même définition, une même fonction : la base de données est bien une technologie intellectuelle, mettant à disposition de l’entreprise l’information stratégique recherchée.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Les bases de données exécutent le traitement automatique des données, soit l’« ensemble des opérations réalisées par des moyens automatiques, relatif à la collecte, l’enregistrement, l’élaboration, la modification, la conservation, la destruction, l’édition de données et, d’une façon générale, leur exploitation. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn14" name="_ftnref14"&gt;[14]&lt;/a&gt; En entreprise, leur travail est relayé par un outil de capitalisation et de communication de l’information : l’intranet.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300091"&gt;1.2.3        L’intranet, outil de capitalisation des connaissances en entreprise&lt;/a&gt;&lt;br /&gt;L’intranet est le vecteur privilégié pour toutes les informations internes de l’entreprise. Il est également un outil de capitalisation des connaissances (endogènes ou exogènes à l’entreprise), de la circulation de l'information, mais aussi un outil de communication.&lt;br /&gt;&lt;br /&gt;Le concept d’intranet est apparu en 1996 dans un rapport de Forrester Research sous le nom de « Full service Intranet », en référence à l’utilisation, à l’intérieur d’entreprises privées, de technologies conçues pour la communication informatique entre entités. En d’autres termes, un intranet est un réseau informatique privé basé sur les standards de communication de données de l’Internet public.&lt;br /&gt;Autant dire que c’est un tout nouvel outil dont les entreprises ne maîtrisent pas encore tous les paramètres. L’offre développée sur un intranet varie d'une entreprise à l'autre en nombre de sujets traités ou de services proposés. Si certaines tendances générales se dessinent, l’intranet est d’abord utilisé par les entreprises pour publier des informations à destination de leurs employés. Des services de messagerie, d’agenda, des forums de discussion, des news, des formulaires de commerce électronique et des abonnements personnalisés à des sources d’information ont ainsi été mis en place, favorisant le développement du travail de collaboration au sein de l’entreprise.&lt;br /&gt;Un intranet est strictement limité dans ses possibilités. Il peut connecter un groupe de travail, un service ou une entreprise entière, mais il dessert une communauté d’utilisateurs aux liens bien définis. Le contenu du trafic d’un intranet est limité aux besoins d’information de sa communauté d’utilisateurs.&lt;br /&gt;&lt;br /&gt;Favorisant le stockage des données, l’intranet gère des informations à valeur patrimoniale et opérationnelle. L’information patrimoniale permet à l’entreprise de s’inscrire dans la durée, en se constituant ainsi des mémoires (mémoire de son histoire, séries chronologiques retraçant l’évolution des ventes ou du chiffre d’affaires sur une période donnée, par exemple, mémoire liée au savoir-faire, mémoire procédurière). L’information opérationnelle, quant à elle, est liée à l’activité ponctuelle de l’entreprise, en fonction des contrats et des missions qu’elle effectue à un moment donné.&lt;br /&gt;L’intranet délivre des informations relevant de la communication interne. Il peut être étendu avec un logiciel de gestion électronique de documents, visant à gérer (échanger, diffuser, archiver : constitution d’une mémoire) l’ensemble des documents produits par l’entreprise. Il prend alors la fonction d’intranet documentaire.&lt;br /&gt;L’intranet documentaire permet de rassembler sous un accès unique les sources d’information de l’entreprise, afin de garantir l’unicité des documents et leur intégrité. Sa qualité réside dans un référencement efficace des documents et dans l’offre de modes de recherche multiples (recherche guidée, en texte intégral ou multicritères). Il a pour objectif essentiel de répondre aux besoins des utilisateurs, en terme d’information pertinente. L’utilisateur doit appréhender l’outil mis à sa disposition comme une aide dans sa recherche d’information, qu’elle soit formulée ou non. Ainsi, toute la problématique d’un intranet documentaire est de savoir quelle information, ou type d’information, doit figurer et sous quelle forme.&lt;br /&gt;&lt;br /&gt;À terme, l’enjeu de l’intranet est d’être au centre de tout système d’information en entreprise. Il ne s’agit plus seulement de diffuser de l’information vers le bas, par le biais de ce réseau, mais de repenser entièrement l’organisation du travail autour de l’activité d’information.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn15" name="_ftnref15"&gt;[15]&lt;/a&gt;&lt;br /&gt;Les intranets, utilisés hier comme moyen de communication interne à l’entreprise (agenda, revue de presse), sont aujourd’hui agrémentés de moteurs de recherche, de bases de données documentaires.&lt;br /&gt;&lt;br /&gt;Les rapports entre le service documentaire et ses usagers évoluent constamment. Les recherches demandées doivent s’effectuer plus rapidement. Support d’information, l’intranet documentaire facilite pour ses usagers l’accès en ligne aux services du centre de documentation.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300092"&gt;1.3         La recherche automatique d’informations : un « dialogue » homme – machine&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Un document n’existe pas si on ne peut pas le retrouver.&lt;br /&gt;&lt;br /&gt;Dernier volet de notre chapitre consacré à la gestion documentaire : la recherche d’informations. Nous nous intéressons particulièrement au « dialogue » homme – machine qui existe avec la recherche automatique d’informations.&lt;br /&gt;&lt;br /&gt;Du fait de l’ambiguïté et de la redondance du langage, une recherche d’informations donne rarement des résultats corrects et complets en une seule fois. En effet, une recherche complète se présente comme un véritable processus incrémental, mettant en œuvre plusieurs requêtes successives, qui affinent progressivement les réponses données par le système.&lt;br /&gt;Les documents sont présentés à l’utilisateur après un classement par pertinence, établi par le système. L’utilisateur, après une analyse des documents jugés les meilleurs, peut utiliser ces informations pour générer une nouvelle requête mieux adaptée. C’est l’action de relevance feedback, ou rétroaction (dans un système documentaire traditionnel, la rétroaction est réalisable en listant les descripteurs associés aux documents trouvés suite à la première requête), désignant « l’ensemble des procédés qui permettent de prendre en compte l’évaluation des résultats par l’utilisateur, en vue d’émettre une requête mieux adaptée à son besoin. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn16" name="_ftnref16"&gt;[16]&lt;/a&gt;&lt;br /&gt;Le « dialogue » entre l’utilisateur et la machine est entamé.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300093"&gt;§         La notion d’accueil existe aussi en informatique documentaire&lt;/a&gt;&lt;br /&gt;L’expansion des bases de données en ligne a modifié l’objectif fondamental de l’interrogation : le repérage de l’information pertinente avec le maximum d’exhaustivité et de précision et le minimum d’effort, ainsi qu’une communication plus naturelle entre les utilisateurs et l’ordinateur est plus que jamais nécessaire.&lt;br /&gt;&lt;br /&gt;La communication entre les auteurs des documents et les interrogateurs s’effectue grâce à une série d’intermédiaires, êtres humains ou machines. Les énoncés des auteurs et les questions des utilisateurs sont donc modifiés à plusieurs reprises avant d’être mis en relation, en recourant à plusieurs langages (langage naturel et langages artificiels). La communication est différée : les auteurs des énoncés primaires et secondaires ne sont pas présents lorsque l’utilisateur final en prend connaissance.&lt;br /&gt;Pour que l’interaction soit réussie, il faut la rendre la plus « naturelle » possible ; cela supposerait que la machine soit dotée des mêmes connaissances que celles que possèdent les humains pour comprendre les textes et les questions en langage naturel, pour adapter les analyses et les réponses aux différents utilisateurs.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn17" name="_ftnref17"&gt;[17]&lt;/a&gt;&lt;br /&gt;Les professionnels de la documentation (indexeurs, bibliothécaires de référence, gestionnaires de documents, archivistes, etc.) jouent le rôle d’intermédiaires entre les systèmes et toute sorte d’utilisateurs finals, pouvant être à la fois producteurs et consommateurs de textes. Quel genre d’assistance assurent-ils désormais dans l’interaction avec les bases de données ?&lt;br /&gt;&lt;br /&gt;La qualité de l’interaction entre les bases de données et leurs utilisateurs dépend, d’une part, de la nature des deux éléments en présence, d’autre part, du contenu de la base de données. Nous avons spécifié au début de cette partie comment évaluer les besoins particuliers des utilisateurs. Nous listons maintenant les difficultés de compréhension liées au contenu même de la base.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300094"&gt;§         Pertinence de l'information&lt;/a&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn18" name="_ftnref18"&gt;[18]&lt;/a&gt;&lt;br /&gt;La nécessité d’identifier, d’évaluer la qualité et la pertinence de l’information n'est pas nouvelle, elle est au fondement de la recherche documentaire. Nous rappelons la définition de la recherche documentaire : "action, méthodes et procédures ayant pour objet de retrouver dans des fonds documentaires les références des documents pertinents."&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn19" name="_ftnref19"&gt;[19]&lt;/a&gt;&lt;br /&gt;La pertinence est le "degré de corrélation entre une question et la réponse apportée."&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn20" name="_ftnref20"&gt;[20]&lt;/a&gt;&lt;br /&gt;En général, la notion de pertinence vise le document et son adéquation à une requête : - généralement définie par le croisement de deux notions transversales de la recherche d'information et de la RDI : le bruit et le silence documentaires (bruit : documents retrouvés non pertinents ; silence : documents pertinents non retrouvés),&lt;br /&gt;- l’élimination ou la réduction de ces deux indices définit la pertinence (relevance) d'un système documentaire.&lt;br /&gt;Mais il s'agit là d'une vision restrictive de la pertinence, centrée uniquement sur les systèmes documentaires classiques (de type bases de données).&lt;br /&gt;Selon Sylvie Dalbin, la pertinence concerne plusieurs aspects de la recherche d'information :&lt;br /&gt;-         la pertinence de la représentation du document par rapport à la requête,&lt;br /&gt;-         la pertinence de la représentation du document par rapport au thème,&lt;br /&gt;-         la pertinence du document lui-même par rapport à la requête,&lt;br /&gt;-         la pertinence du document par rapport au thème,&lt;br /&gt;-         la pertinence de la requête par rapport au système documentaire,&lt;br /&gt;-         la pertinence de l'information trouvée par rapport au besoin initial.&lt;br /&gt; Toutes ces catégories de la pertinence ne sont pas concernées par l'évaluation de l'information et il importe de bien caractériser la pertinence que l'on veut mesurer, évaluer. Schématiquement, trois grandes catégories de pertinences relevées par plusieurs chercheurs :&lt;br /&gt;La pertinence du système&lt;br /&gt;Elle concerne la capacité du système documentaire (logiciel, base de données...) à indexer le document et surtout à le retrouver, en réponse à une requête. Elle vise surtout la pertinence de la représentation du document (son indexation...) et, en conséquence, la pertinence de la recherche d'information elle-même. La pertinence-système ne concerne pas l'évaluation de l'information mais plutôt les outils de recherche.&lt;br /&gt;La pertinence vue sous l'angle de l'utilisateur&lt;br /&gt;Elle concerne la tâche elle-même de recherche, le besoin d'information, la formulation de la requête, etc. On en dénombre plusieurs types :&lt;br /&gt;-         la pertinence de la formulation de la requête : comment l'utilisateur traduit sa question en une requête d'interrogation, comment le système facilite ou non la formulation des requêtes, etc. Cela renvoie encore à l'évaluation des outils (des interfaces de recherche...),&lt;br /&gt;-         la pertinence de la présentation des résultats : concerne encore exclusivement les outils de recherche. Par exemple, quelle pertinence des représentations cartographiques dans certains outils (Kartoo...). Ce type de pertinence est encore mal mesuré,&lt;br /&gt;-         la pertinence du document par rapport au besoin : c'est la plus importante du point de vue de l'utilisateur. Un document pertinent par rapport à sa représentation dans le système (bien indexé), pertinent par rapport à la requête, ou au thème, n'est pas forcément pertinent par rapport au besoin d'information de l'utilisateur. Ce type de pertinence est la plus difficile à mesurer : elle est à apprécier par l'utilisateur lui-même et ne peut faire l'objet d'une évaluation "objective" et critériée.&lt;br /&gt;La pertinence lié au thème&lt;br /&gt;Elle concerne la pertinence de la valeur d'un document ou d’une information, par rapport au thème traité. Il s'agit du type principal de pertinence visé dans les problématiques d'évaluation de l'information sur Internet.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300095"&gt;1.3.1        Les difficultés de compréhension liées au contenu&lt;/a&gt;&lt;br /&gt;Cette partie s’inspire notamment des travaux menés par Suzanne Bertrand-Gastaldy, dont elle expose une synthèse dans les articles suivants : « Comment les logiciels de bases de données bibliographiques et textuelles peuvent-ils répondre aux différents besoins de leurs utilisateurs ? », « Le traitement de l'information : de la description à l'analyse automatisée, de l'analyse automatisée à... » et « L'évolution de la gestion de l'information documentaire sous l'impulsion des nouvelles technologies ».&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn21" name="_ftnref21"&gt;[21]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300096"&gt;§         La reconnaissance tardive des particularités du matériau textuel&lt;/a&gt;&lt;br /&gt;Pendant longtemps l’indexation et le repérage par mots clés ou par chaînes de caractères extraites des titres et des résumés ont été privilégiés. Les mêmes méthodes appliquées au texte intégral ont engendré des résultats catastrophiques et l’on a reconnu un peu tardivement les diverses connaissances à mettre en œuvre pour la compréhension et la production d’un texte. Il a fallu admettre l’incapacité des descripteurs isolés à rendre compte du sens des textes, bien qu’ils demeurent utiles pour les classifier rapidement et grossièrement.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300097"&gt;§         Quelques paramètres relatifs aux corpus&lt;/a&gt;&lt;br /&gt;La quantité de textes à traiter&lt;br /&gt;Plus la quantité de textes à traiter est importante, plus la représentation devrait permettre la discrimination au repérage, mais plus il est difficile de mettre en œuvre des traitements automatiques affinés. On doit bien souvent se contenter de méthodes statistiques, beaucoup plus grossières.&lt;br /&gt;L’étendue des domaines couverts par ces documents&lt;br /&gt;Une représentation des connaissances du domaine nécessaires pour une interprétation automatique des textes n’est possible que pour des univers restreints. On peut considérer qu’en entreprise, l’univers est restreint et la question de l’étendue des domaines ne se pose pas, cependant elle mérite que l’on y prête attention (en cas de l’évolution de l’univers de l’entreprise).&lt;br /&gt;Le taux d’accroissement de la base de données&lt;br /&gt;Un apport fréquent de documents limite le travail à des traitements rapides, et, par conséquent, assez rudimentaires. Le fait que le corpus soit ouvert peut entraîner des changements de thématiques, un apport de connaissances nouvelles et nécessiter des mises à jour du vocabulaire contrôlé ou de la base des connaissances. C’est un problème qui ne se pose pas lorsqu’on veut représenter des corpus fermés, comme les monographies ou certains fonds d'archives.&lt;br /&gt;La stabilité des documents&lt;br /&gt;Alors que dans les bases de données bibliographiques, on est habitué à traiter des documents qui sont écrits une fois pour toutes, dans les organisations, il faut composer avec des textes qui sont modifiés constamment. Il ne sera sans doute pas rentable d’investir dans des traitements très fins, s’il faut les recommencer périodiquement.&lt;br /&gt;L’hétérogénéité des textes&lt;br /&gt;Depuis que la saisie des textes s’est généralisée, le contenu des bases de données s’est diversifié. On ne recense plus seulement les articles scientifiques ou les rapports de recherche, mais à l’intérieur d’une organisation, par exemple, on peut retrouver de la correspondance, des mémos, des contrats, des décisions administratives, des textes réglementaires, des directives, des conventions collectives, des lois, des griefs, des règlements de griefs, etc.&lt;br /&gt;La normalisation du contenu&lt;br /&gt;Si chacun de ces types de textes répond à des normes explicites ou implicites de rédaction, celles-ci sont extrêmement différentes les unes des autres et les stratégies à mettre en œuvre pour les analyser sont multiples. Il reste encore beaucoup de recherches à faire d’abord pour découvrir la « grammaire » des différents types de textes, ensuite pour l’appliquer à l’analyse et au repérage. Bien d’autres éléments que la structure textuelle entrent en ligne de compte. Selon que le vocabulaire est répétitif ou varié, spontanément contrôlé ou au contraire mal fixé, les besoins de contrôle et de structuration a posteriori seront différents. Des énoncés fortement nominalisés seront traités beaucoup plus facilement que des textes où les propositions subordonnées et incidentes sont courantes. &lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn22" name="_ftnref22"&gt;[22]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Un langage de spécialité, parce qu’il représente un sous-ensemble de la syntaxe et du vocabulaire de la langue naturelle, se prêtera plus facilement à un traitement automatique. En général il est destiné à un groupe d’usagers qui partagent une même approche du réel et les mêmes habitudes de communication écrite (politiques de gestion, manuels d’entretien, rapports boursiers).&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Face à toute cette complexité, il n’est pas étonnant que les logiciels n’offrent pas tous les mêmes solutions pour la représentation du contenu de chaque texte pris individuellement ou de l’ensemble de la base de données. Un compromis doit être trouvé entre qualité des représentations et quantité / hétérogénéité des informations à traiter.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300098"&gt;1.3.2        Les solutions adoptées&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300099"&gt;§         L’aide à l’analyse des textes&lt;/a&gt;&lt;br /&gt;L’inadéquation des chaînes de caractères&lt;br /&gt;Les chaînes de caractères sont tout à fait inadaptées pour la représentation du sens, puisqu’elles constituent soit des termes simples, soit des éléments de termes composés et sont ambiguës hors contexte. Les logiciels occultent donc la plupart des phénomènes morphologiques, lexicaux, syntaxiques et sémantiques à l’œuvre dans un texte. Si les chaînes de caractère ont pu constituer un pis-aller pour la recherche dans les textes réduits, comme les titres et les résumés, elles génèrent dans les textes pleins beaucoup de bruit à cause de la polysémie et de l’homographie et beaucoup de silence à cause de la synonymie lexicale et syntaxique. Alors que la plupart des systèmes de repérage fonctionnent encore ainsi, il est à prévoir qu’ils seront de plus en plus réservés aux systèmes d’information situés aux deux extrémités de l’éventail : ou bien les systèmes d’information personnels, avec peu de fichiers (dans ce cas, l’utilisateur connaît bien les textes qu’il a lui-même produits, et il utilise l’ordinateur essentiellement pour repérer rapidement un mot ou un passage à corriger), ou bien les serveurs de grandes bases de données multidisciplinaires contenant des millions de références dans lesquelles on veut sélectionner celles qui risquent de correspondre le mieux à une thématique donnée. Mais le fardeau de l’analyse repose entièrement sur l’utilisateur final.&lt;br /&gt;&lt;br /&gt;La représentation des concepts par des termes simples ou composés&lt;br /&gt;Une des nécessités premières de l’analyse consiste à extraire non pas les chaînes de caractères, mais les termes, simples ou composés, susceptibles de représenter les concepts du domaine, dont on peut vouloir expliciter l’organisation dans un thésaurus ou que l’on doit lier en énoncés complexes pour former des propositions. Les méthodes de reconnaissance des termes composés offertes dans les différents logiciels sont multiples. Elles peuvent tenir plus ou moins compte de la nature linguistique du texte et faire intervenir à des degrés divers les traitements automatiques ou humains.&lt;br /&gt;Alors que les logiciels d’interrogation sur les chaînes de caractères laissent à l’interrogateur le soin de reconstituer tant bien que mal des unités complexes à l’aide des opérateurs d’adjacence et de distance, les traitements situés en amont incluent, selon les cas :&lt;br /&gt;-         la reconnaissance des segments répétés par des méthodes purement statistiques de cooccurrences,&lt;br /&gt;-         le marquage en contexte avec ajout de caractérisations aux chaînes de caractères,&lt;br /&gt;-         la catégorisation lexicale des entrées du lexique et recherche de séquences dans le texte,&lt;br /&gt;-         une analyse syntaxique partielle,&lt;br /&gt;-         une analyse morphosyntaxique complète des phrases.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn23" name="_ftnref23"&gt;[23]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Certains corpus, parce qu’ils sont fortement stéréotypés, ne requièrent pas la mise en œuvre d’analyseurs susceptibles de traiter toutes les particularités de la langue. Inversement, même un excellent analyseur syntaxique du français serait impuissant à traiter la plupart des tournures de certains langages de spécialité, comme celui des rapports médicaux.&lt;br /&gt;Les évaluations de l’efficacité des différentes méthodes&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn24" name="_ftnref24"&gt;[24]&lt;/a&gt; concluent, comme il fallait s’y attendre, à l’insuffisance des analyses syntaxiques, à la nécessité de traitements lexico-sémantiques portant sur le contexte d’énonciation et d’utilisation des textes.&lt;br /&gt;La représentation des relations lexico-sémantiques&lt;br /&gt;Si les logiciels de repérage traditionnels permettent, grâce à la troncature et au masque, de pallier les silences importants dus aux variantes orthographiques, ils exigent de la part des interrogateurs une certaine dextérité et compliquent les stratégies de recherche. Ils sont impuissants à régler les problèmes de synonymie ; en outre, l’absence d’indications sur les relations hiérarchiques peut empêcher un utilisateur peu familier avec le domaine de modifier les taux de rappel et de précision. Les homographes et polysèmes peuvent être détectés facilement par l'affichage du contexte, mais la manipulation d’opérateurs comme le SAUF n’est pas évidente pour tous. Les textes intégraux, parce qu’ils peuvent contenir des tournures beaucoup plus variées que les résumés qui passent par le filtre préalable d’un analyste, rendent plus nécessaires que jamais le contrôle et la structuration a posteriori du vocabulaire, du moins pour certains types d’utilisateurs et de corpus.&lt;br /&gt;&lt;br /&gt;Il existe une panoplie de solutions qui nécessitent plus ou moins d’intervention humaine :&lt;br /&gt;-         classification automatique des termes (sans indication de la nature des liens),&lt;br /&gt;-         construction d’une « pseudo classification » à partir des stratégies de recherche des utilisateurs,&lt;br /&gt;-         construction a posteriori d’un thésaurus (à l’aide de l’ordinateur) à partir du dépistage de certains marqueurs de relations dans les corpus. Ainsi, les définitions contenues dans les lois ou les recueils de politiques administratives permettent de représenter fidèlement, sans distorsion, l’acception de termes pour le micro-monde des auteurs et des utilisateurs. Il faut prendre garde cependant au grand nombre de connaissances non explicitées dans les textes, parce que supposées connues des lecteurs. Donc, on ne peut espérer extraire automatiquement d’un corpus tout ce qui serait nécessaire à un novice.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn25" name="_ftnref25"&gt;[25]&lt;/a&gt;&lt;br /&gt;La représentation des relations syntaxico-sémantiques et la prise en compte de la sémantique phrastique&lt;br /&gt;Pour représenter le sens des propositions, l’ordre d’énumération des termes n’est efficace que dans de rares domaines où il n’y a aucune ambiguïté possible, pour un expert, sur le sens de la relation implicite qui les unit. Dans ce cas, les opérateurs de proximité peuvent, lors de l’interrogation, être suffisants, surtout si on recourt en même temps à la troncature pour récupérer à la fois les expressions nominales et verbales. La plupart du temps, cependant, il faut représenter la nature des liens pour éviter le bruit. Des systèmes d’indexation humaine ou assistée par ordinateur introduisent autour de la représentation de l’action des relations syntaxico-sémantiques entre les termes. Le problème est d’arriver à les déduire automatiquement des différentes structures de surface des discours en langue naturelle, et ce malgré les nombreux cas d'ambiguïtés. Comme certaines ambiguïtés ne peuvent être levées qu’au prix d’une connaissance d’un contexte pouvant s’étendre jusqu’au texte tout entier, il est irréaliste d’éliminer toute intervention humaine, que ce soit à l’étape de l'analyse ou à celle du repérage.&lt;br /&gt;La prise en compte de la sémantique textuelle&lt;br /&gt;Les représentations du contenu textuel devraient permettre de discriminer entre le thème central et les thèmes accessoires. Aussi les recherches sur le thème principal et les thèmes secondaires qui ont été entreprises timidement dans la décennie 1970, se poursuivent-elles actuellement. Plusieurs travaux ont été effectués sur les phénomènes de cohésion, notamment les phénomènes de cohérence, comme dans TOPIC (Hahn, 1990)&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn26" name="_ftnref26"&gt;[26]&lt;/a&gt; qui permet d’envisager, outre le repérage de passages pertinents basés sur la cohérence interne plutôt que sur l’occurrence de tel ou tel mot, la condensation des textes à des niveaux variés de généralité, selon les besoins.&lt;br /&gt;Les évaluations sur l’efficacité de tels traitements sont rares, car ils sont récents. Comme la plupart des recherches se concentrent sur la résolution d’un problème à la fois, il est difficile d’obtenir une amélioration sensible. Tout dépend aussi de la structure d’information des corpus choisis. Certains textes administratifs, par exemple, sont pauvres en anaphores et un système de résolution n’est pas nécessaire.&lt;br /&gt;L’expertise des indexeurs&lt;br /&gt;De nombreuses connaissances doivent être prises en compte, en dehors des connaissances linguistiques. Très peu de recherches ont été effectuées sur les processus cognitifs de l’analyse par un intermédiaire, si bien que les systèmes experts d’aide à l’indexation sont encore rares. Il faut, entre autres, modéliser les stratégies de résolution de problèmes mises en œuvre par les indexeurs ainsi que les connaissances extra-linguistiques qu’ils utilisent, comme celles du domaine, des contextes de production des textes, des besoins des utilisateurs, etc.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300100"&gt;§         L’aide à l’interaction avec la base de données&lt;/a&gt;&lt;br /&gt;L’interrogation n’est pas immanente au système ; elle dépend des connaissances et des préférences des utilisateurs. L’interaction peut consister en l’exécution d’une séquence d’opérations mécaniques comme le branchement à un serveur, mais aussi en des tâches plus complexes de consultation du thésaurus, d’ajustement de la question en fonction des jugements de pertinence posés sur les documents repérés, ou encore d’interprétation du problème de l’utilisateur. Elle nécessite un « dialogue » de clarification avec ce dernier pour aboutir au choix de la meilleure base de données ou pour établir la stratégie de recherche la plus appropriée.&lt;br /&gt;Les utilisateurs ont de la difficulté à formuler leurs stratégies de recherche, à sélectionner les termes acceptés par le système, à élargir ou à rétrécir leurs stratégies.&lt;br /&gt;&lt;br /&gt;Dans le cas de l’interrogation en langue naturelle, les problèmes d’analyse des questions sont à peu près du même ordre que ceux que l’on rencontre pour les textes, avec des nuances importantes toutefois : l’étendue du vocabulaire risque d’être moindre, de même que la variété des constructions syntaxiques. Les énoncés sont plus courts, moins structurés aussi, puisque, contrairement à ceux des auteurs de documents, ils expriment un manque dans la structure cognitive des interrogateurs. Par contre, l’interface devra être plus tolérante pour les fautes d’orthographe, les erreurs grammaticales et les phrases incomplètes ; idéalement, l’interface devrait être dotée de mécanismes d’inférences et se construire un modèle de l’interlocuteur.&lt;br /&gt;Les documents pertinents repérés peuvent constituer à leur tour une question et servir à trouver d’autres documents par un calcul de similarité. L’intérêt de l’interface consiste dans la prise en compte de la nature linguistique des éléments manipulés et de la quantité des données à traiter. Cela contraste avec les logiciels documentaires les plus répandus.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Dans les systèmes les plus élaborés de recherche d’information, la réponse ne consiste pas en un affichage de passages pertinents, mais en la génération d’un énoncé synthétique adapté au niveau de connaissances et aux motivations de l’utilisateur, respectant les principes des actes de langage. On voit bien qu’alors les bases de données textuelles deviennent de véritables bases de connaissances mais cela ne peut être envisagé que dans des domaines et des corpus très restreints.&lt;br /&gt;Certains systèmes modélisent les connaissances des intermédiaires, spécialistes de l’interrogation. Une tâche relativement complexe, au premier abord, comme l’appariement de la structure cognitive de l’usager et de la structure de la base de données ne recourt pas obligatoirement à des analyses linguistiques et des connaissances poussées pour venir en aide à l’utilisateur. Joanna Pomian (1990)&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn27" name="_ftnref27"&gt;[27]&lt;/a&gt; a montré, avec LEXIQUEST, la faisabilité d’un système expert qui modélise les utilisateurs et leur fournit une aide adaptée en exploitant les correspondances de structures d’association du vocabulaire contenu dans les questions des utilisateurs et la base de données, sans ajout de connaissances relatives au domaine, ce qui assure la transportabilité du système.&lt;br /&gt;&lt;br /&gt;La nature des solutions offertes est très diversifiée : elle dépend beaucoup du contexte, de la quantité, de la couverture du domaine, de la nature plus ou moins stéréotypée des textes à représenter, de la nature des questions auxquelles il faut répondre, de l’habileté des interrogateurs, etc. Avec ces solutions, il s’agit d’aider les utilisateurs à interagir avec les textes, non de supprimer ces interactions. La richesse des textes étant inépuisable, il serait dommage de créer des systèmes qui en limitent l’exploration.&lt;br /&gt;L’idéal serait de mettre au point de nouveaux modes d’indexation qui utilisent les mots, et atteignent en même temps une dimension sémantique, mais non figée à l’avance : une sorte d’ « indexation sémantique libre » &lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn28" name="_ftnref28"&gt;[28]&lt;/a&gt;. Comme le dit si bien Philippe Lefèvre, « le problème est ardu, mais certainement pas insoluble ». Cette avancée serait capitale, car l’indexation conditionne la plupart des autres traitements : elle sert de base à la mise en correspondance des textes, à la recherche, au classement, au filtrage.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300101"&gt;1.3.3        Le dialogue humain existe toujours&lt;/a&gt;&lt;br /&gt;Les commentaires des professionnels vont tous dans le même sens : dans un contexte de surabondance de l’information, le gestionnaire de l’information devra faire un tri afin que les utilisateurs ne soient pas noyés sous le flot. L’évaluation de la pertinence de l’information, la capacité à retenir la bonne information (au meilleur coût), à indiquer des sources fiables, porteuses de valeur ajoutée, deviennent prépondérantes.&lt;br /&gt;D’où l’optimisme de la plupart des intéressés : on aura de plus en plus besoin des documentalistes, qui assurent aussi le rôle de conseil auprès des utilisateurs.&lt;br /&gt;L’information est aujourd’hui au centre de l’économie et toutes les activités qui s’y rapportent sont prises dans un mouvement qui déstabilise leurs responsables en déplaçant les repères.&lt;br /&gt;&lt;br /&gt;Les services d’information sont aussi pris dans un second mouvement : le recentrage sur l’usager. La numérisation renvoie les documentalistes aux origines de leur métier, à savoir l’importance de la recherche et de la fourniture d’informations pertinentes pour aider à résoudre des problèmes. En effet, les sources d’information sont inépuisables, il faut savoir les observer en permanence (intelligence économique&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftn29" name="_ftnref29"&gt;[29]&lt;/a&gt;) et les solliciter de façon simple.&lt;br /&gt;Les documentalistes doivent donc redéfinir leur rôle de médiateur dans l’accès à l’information, redevenir des spécialistes de l’orientation.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Avec la recherche en « plein texte », liée à l’introduction des documents numériques et à l’automatisation des tâches documentaires, les besoins en informations, individuels ou collectif, ne sont pas pleinement satisfaits, aux yeux des professionnels de l’information en tout cas. En effet, quelle que soit leur requête, les utilisateurs obtiennent des réponses intéressantes qu’ils n’auraient pas pu trouver en consultant manuellement les documents. Bien entendu, ils ne se rendent pas compte que la réalité qui leur est présentée est très partielle. Cela pourrait avoir des conséquences graves s’ils s’appuyaient sur ces seuls résultats pour prendre une décision stratégique.&lt;br /&gt;Pour tenter de remédier à cette faiblesse dans la recherche documentaire, les professionnels de l’information et les informaticiens ont mis au point des outils et langages d’analyse et de structuration des documents électroniques. Nous les exposons à présent.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref1" name="_ftn1"&gt;[1]&lt;/a&gt; Cf. BERTRAND-GASTALDY, Suzanne, Comment les logiciels de bases de données bibliographiques et textuelles peuvent-ils répondre aux différents besoins de leurs utilisateurs ? [en ligne], Disponible à l’adresse :&lt;br /&gt;&lt;&lt;a href="http://www.ling.uqam.ca/sato/publications/bibliographie/Ind_lang.htm"&gt;HTTP://www.ling.uqam.ca/sato/publications/bibliographie/Ind_lang.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref2" name="_ftn2"&gt;[2]&lt;/a&gt; Ibid. faisant référence à : BERTRAND-GASTALDY, Suzanne, « L'indexation assistée par ordinateur : un moyen de satisfaire les besoins collectifs et individuels des utilisateurs de bases de données textuelles dans les organisations », In : ICO, intelligence artificielle et sciences cognitives au Québec ; 2(3); septembre 1990: 71-91.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref3" name="_ftn3"&gt;[3]&lt;/a&gt; BIGUET, Serge, L'irruption de l'intranet dans l'entreprise et son impact sur la fonction information, 1998.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref4" name="_ftn4"&gt;[4]&lt;/a&gt; Source : LAMIZET, Bernard ; SILEM, Ahmed, Dictionnaire encyclopédique des sciences de l’information et de la communication, Ellipses, 1997.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref5" name="_ftn5"&gt;[5]&lt;/a&gt; Université de Montréal, École de bibliothéconomie et des sciences de l'information, Guide de l'étudiant - Certificat en gestion de l'information numérique - 2004-2005 [en ligne], Disponible sur  &lt;&lt;a href="http://www.ebsi.umontreal.ca/guidegin/guide-gin-0405.pdf"&gt;HTTP://www.ebsi.umontreal.ca/guidegin/guide-gin-0405.pdf&lt;/a&gt;&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref6" name="_ftn6"&gt;[6]&lt;/a&gt; Sauf indication contraire, les citations de cette partie sont issues du Dictionnaire des Sciences de l’information et de la communication, de LAMIZET et SILEM.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref7" name="_ftn7"&gt;[7]&lt;/a&gt; CHAUMIER, Jacques, Les techniques documentaires, Paris, PUF, 2000, coll. "Que sais-je ?", n°1419.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref8" name="_ftn8"&gt;[8]&lt;/a&gt; In : LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref9" name="_ftn9"&gt;[9]&lt;/a&gt; Source : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref10" name="_ftn10"&gt;[10]&lt;/a&gt; LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref11" name="_ftn11"&gt;[11]&lt;/a&gt; ROBERT, Pascal, « Qu’est-ce qu’une technologie intellectuelle ? », In : Communication et langages, 123, premier trimestre 2000, Armand Colin éditeur. Nous rappelons que l’auteur définit la technologie intellectuelle comme « un outil régulé de gestion du nombre (de la complexité) opérant une traduction de l’événement en document par la conversion des dimensions. » La notion a été plus amplement décrite dans la partie précédente.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref12" name="_ftn12"&gt;[12]&lt;/a&gt; Source : LAMIZET, Bernard ; SILEM, Ahmed, Dictionnaire encyclopédique des sciences de l’information et de la communication, Ellipses, 1997.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref13" name="_ftn13"&gt;[13]&lt;/a&gt; Cité dans le même article de Pascal Robert.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref14" name="_ftn14"&gt;[14]&lt;/a&gt; Source : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref15" name="_ftn15"&gt;[15]&lt;/a&gt; « Quel intranet pour vous simplifier l'entreprise ? », In : Internet Professionnel, Novembre 1999, n° 36, p. 50-63.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref16" name="_ftn16"&gt;[16]&lt;/a&gt; LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref17" name="_ftn17"&gt;[17]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref18" name="_ftn18"&gt;[18]&lt;/a&gt; Cette partie s'inspire notamment des travaux menés par : URFIST, Le problème de la qualité et de la pertinence de l'information [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm"&gt;HTTP://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm&lt;/a&gt;&lt;a name="_Hlt84258330"&gt;&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref19" name="_ftn19"&gt;[19]&lt;/a&gt; AFNOR,Vocabulaire de la documentation, 1987.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref20" name="_ftn20"&gt;[20]&lt;/a&gt; URFIST, Le problème de la qualité et de la pertinence de l'information [en ligne], Disponible sur &lt;&lt;a href="http://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm"&gt;HTTP://www.uhb.fr/urfist/Supports/StageEvalInfo/EvalInfo_cadre.htm&lt;/a&gt;&gt; (consulté le 25 septembre 2004).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref21" name="_ftn21"&gt;[21]&lt;/a&gt; BERTRAND-GASTALDY, Suzanne, Comment les logiciels de bases de données bibliographiques et textuelles peuvent-ils répondre aux différents besoins de leurs utilisateurs ? [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://www.ling.uqam.ca/sato/publications/bibliographie/Ind_lang.htm"&gt;HTTP://www.ling.uqam.ca/sato/publications/bibliographie/Ind_lang.htm&lt;/a&gt;&gt;.&lt;br /&gt;BERTRAND-GASTALDY, Suzanne, Le traitement de l'information : de la description à l'analyse automatisée, de l'analyse automatisée à... [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://www.ling.uqam.ca/sato/publications/bibliographie/Asted93.htm"&gt;HTTP://www.ling.uqam.ca/sato/publications/bibliographie/Asted93.htm&lt;/a&gt;&gt;.&lt;br /&gt;BERTRAND-GASTALDY, Suzanne, L'évolution de la gestion de l'information documentaire sous l'impulsion des nouvelles technologies [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://www.ling.uqam.ca/sato/publications/bibliographie/Termino.htm"&gt;HTTP://www.ling.uqam.ca/sato/publications/bibliographie/Termino.htm&lt;/a&gt;&gt;.&lt;br /&gt;Suzanne Bertrand-Gastaldy est Professeur agrégée de l'École de bibliothéconomie et des sciences de l'information de l'Université de Montréal. Son enseignement, ses travaux de recherche et ses publications portent sur l'analyse de l'information, l'indexation et les langages documentaires.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref22" name="_ftn22"&gt;[22]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref23" name="_ftn23"&gt;[23]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref24" name="_ftn24"&gt;[24]&lt;/a&gt; Ibid. faisant référence à : SALTON, G.; BUCKLEY, C ; SMITH, M., « On the application of syntactic methodologies in automatic text analysis », In : Information Processing &amp;amp; Management, 26(1), 1990, p.73-92.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref25" name="_ftn25"&gt;[25]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref26" name="_ftn26"&gt;[26]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref27" name="_ftn27"&gt;[27]&lt;/a&gt; Ibid. se référant à : POMIAN, Joanna, Statistiques et connaissances de structure; application à la reformulation des requêtes documentaires, Thèse de doctorat nouveau régime, Paris : Université Pierre et Marie Curie-Paris VI: 1990. 281 p.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref28" name="_ftn28"&gt;[28]&lt;/a&gt; Source de cette citation et la suivante : LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=4231717004015567960#_ftnref29" name="_ftn29"&gt;[29]&lt;/a&gt; Nous développons ce point dans la partie 3.&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-4231717004015567960?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/4231717004015567960/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=4231717004015567960' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/4231717004015567960'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/4231717004015567960'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/chapitre-2-gestion-automatise-de.html' title='Chapitre 2 : Gestion automatisée de l’information en entreprise : pour des décisions stratégiques'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-3830105318098127421</id><published>2008-04-04T08:10:00.000-07:00</published><updated>2008-08-06T06:04:58.884-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='07.Chapitre3'/><title type='text'>Chapitre 3 : D’un traitement de l’information a priori à un traitement a posteriori</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;3.1 La description du document numérique : métadonnées, langages de description et ontologies 48&lt;br /&gt;3.1.1 Les métadonnées.......................................................................................................................................... 49&lt;br /&gt;§ La normalisation des ressources numériques................................................................................................ 50&lt;br /&gt;3.1.2 Les langages de description du document............................................................................................... 51&lt;br /&gt;§ Les langages à balise : XML, RDF, DAML.................................................................................................... 51&lt;br /&gt;§ Les ontologies.................................................................................................................................................... 52&lt;br /&gt;3.2 Le text-mining : une nouvelle façon de traiter le document....................................... 53&lt;br /&gt;3.2.1 Catégorisation et extraction de l’information............................................................................................ 53&lt;br /&gt;§ Le data-mining : l’exploration de données.................................................................................................... 53&lt;br /&gt;§ Le découpage de l’information......................................................................................................................... 54&lt;br /&gt;§ Les résumés dynamiques.................................................................................................................................. 54&lt;br /&gt;3.2.2 L’introduction de la sémantique : le filtrage de l’information................................................................. 56&lt;br /&gt;§ L’exploration contextuelle................................................................................................................................. 57&lt;br /&gt;§ Les liens contextuels.......................................................................................................................................... 58&lt;br /&gt;3.2.3 Les moteurs « intelligents »........................................................................................................................ 59&lt;br /&gt;§ Les agents intelligents....................................................................................................................................... 59&lt;br /&gt;3.3 Un accès à l’information personnalisé......................................................................... 60&lt;br /&gt;3.3.1 Confidentialité de l’information.................................................................................................................. 60&lt;br /&gt;3.3.2 Détermination d’un profil de l'utilisateur................................................................................................... 61&lt;br /&gt;3.3.3 L’information personnalisée........................................................................................................................ 62&lt;br /&gt;§ Les portails d’information................................................................................................................................. 62&lt;br /&gt;§ La technologie push........................................................................................................................................... 63&lt;br /&gt;§ Intelligence économique................................................................................................................................... 64&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300160"&gt;&lt;/a&gt;&lt;a name="_Toc84300102"&gt;1           D’un traitement de l’information a priori à un traitement a posteriori&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;À la différence des documents textuels au format papier, qui sont seulement référencés dans les bases de données, les documents textuels électroniques y sont intégrés. Le traitement en est modifié : il ne porte plus sur les « mots clés », mais sur le « plein texte ».&lt;br /&gt;Dans un premier temps, l’informatique n’était utilisée par les documentalistes que comme un outil performant de classement des items des langages documentaires sous forme de bases de données bibliographiques. Le traitement de la langue naturelle puis la production et la gestion directe de documents électroniques, enfin la modélisation du raisonnement ont changé la donne.&lt;br /&gt;L’inscription sur un support est remplacée par l’attachement à une structure.&lt;br /&gt;&lt;br /&gt;« Le document traditionnel repose sur un support, un texte et une légitimité. Une première phase de numérisation a fait ressortir ses structures internes, l’importance des métadonnées pour son traitement. (…) [Une deuxième phase] insiste sur le format XML, qui intègre la structure mais la détache de la mise en forme par les feuilles de style, voudrait s’appuyer sur des ˝ontologies˝ pour retrouver et reconstruire les textes, et met en avant l’accès personnalisé. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn1" name="_ftnref1"&gt;[1]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300103"&gt;1.1         La description du document numérique : métadonnées, langages de description et ontologies&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;« Plus un document numérique est riche, plus il a besoin de structuration pour faciliter le repérage de l’information. Or, contrairement à l’écrit traditionnel ou aux enregistrements analogiques dont l’articulation est visible et peut être relevée et détaillée après coup, posément, lors d’une lecture ou  d’un visionnage du document, le document numérique, lui, exige d’être structuré dès sa création, faute de quoi l’information ne peut même pas être enregistrée. C’est pourquoi les logiciels associent de plus en plus l’auteur du document à la formulation de ces éléments de structuration qui constituent dès lors également des éléments de description. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn2" name="_ftnref2"&gt;[2]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300104"&gt;1.1.1        Les métadonnées&lt;/a&gt;&lt;br /&gt;Le terme de métadonnées (des données sur des données) est utilisé pour définir « l’ensemble des informations techniques et descriptives ajoutées aux documents pour mieux les qualifier. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn3" name="_ftnref3"&gt;[3]&lt;/a&gt; Ce terme est surtout utilisé pour désigner l’information lisible par la machine concernant des fichiers de données.&lt;br /&gt;Les métadonnées sont des outils importants pour le développement de la description de documents électroniques. Leurs usages portent sur la description du document lui-même (usage spécifique) ou sur l’affichage et l’indexation des documents par les moteurs de recherche (usage générique), tout en permettant une normalisation de la description des ressources électroniques dans un contexte « réseaux ».&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn4" name="_ftnref4"&gt;[4]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Les métadonnées, par leur définition même, apportent des informations de nature sémantique sur les documents qu’elles décrivent. En les prenant en compte, les moteurs peuvent améliorer leurs méthodes de recherche et donner des réponses plus pertinentes. Ils peuvent juger qu’un document répond particulièrement bien à une requête si le mot recherché se trouve dans le résumé ou dans la liste des mots-clés figurant dans les métadonnées.&lt;br /&gt;En ce sens, la description des documents numériques par ces éléments n’est pas un objectif final, mais un moyen de faciliter l’usage de ces documents dans une perspective de recherche d’informations.&lt;br /&gt;&lt;br /&gt;L'intérêt des métadonnées :&lt;br /&gt;-         faciliter la recherche d'information : décrire et classer le contenu et les relations entre les fichiers d'un site, référencer un site,&lt;br /&gt;-         faciliter l'interopérabilité : partager et échanger des informations,&lt;br /&gt;-         faciliter la gestion et l'archivage : informer sur le cycle de vie des documents, gérer des collections et des archives électroniques,&lt;br /&gt;-         gérer et protéger les droits : de propriété intellectuelle, d'accès à des pages Web (restriction de consultation),&lt;br /&gt;-         authentifier un texte : encoder une signature électronique pour valider un texte sur Internet.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300105"&gt;§         La normalisation des ressources numériques&lt;/a&gt;&lt;br /&gt;En outre, les informaticiens ont insisté sur le caractère essentiel de la normalisation afin qu’un document soit lisible sur tout type d’ordinateur et déchiffrable par des applications variées. Les métadonnées s’appuient donc sur les normes du Dublin Core. La norme&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn5" name="_ftnref5"&gt;[5]&lt;/a&gt; est un ensemble d’éléments simples mais efficaces pour décrire une grande variété de ressources en réseau. Elle comprend quinze éléments dont la sémantique a été établie par un consensus international de professionnels provenant de diverses disciplines telles que la bibliothéconomie, l’informatique, le balisage de textes, la communauté muséologique et d’autres domaines connexes.&lt;br /&gt;&lt;br /&gt;L'enjeu central se résume à cinq défis de base :&lt;br /&gt;-         l'accessibilité : permettre la recherche, l'identification, l'accès et la livraison de contenus et composantes de formation en ligne de façon distribuée,&lt;br /&gt;-         l'interopérabilité : permettre l'utilisation de contenus et composantes développés par une organisation sur une plate-forme donnée par d'autres organisations sur d'autres plate-formes,&lt;br /&gt;-         réutilisabilité : permettre aux contenus et composantes à différentes fins, dans différents produits, dans différents contextes et par différents modes d'accès,&lt;br /&gt;-         durabilité : permettre aux contenus et composantes d'affronter les changements technologiques sans la nécessité d'une réingénierie ou d'un développement,&lt;br /&gt;-         adaptabilité : permettre la modulation sur mesure des contenus et des composantes.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn6" name="_ftnref6"&gt;[6]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300106"&gt;1.1.2        Les langages de description du document&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300107"&gt;§         Les langages à balise : XML, RDF, DAML&lt;/a&gt;&lt;br /&gt;Les langages à balises renseignent les métadonnées. Avec eux, on retrouve nécessairement le principe des notices bibliographiques (informations sur l’auteur, le titre, la date de publication, etc.) : le document est étendu, on insiste sur sa structure.&lt;br /&gt;XML : la structure formalisée des documents&lt;br /&gt;Le langage XML fournit le vocabulaire et les principes pour la description et l’échange de tout type d’informations numériques. En tant que métalangage, XML permet de définir un modèle de codage propre à chaque application. Mais le risque de voir se multiplier des descriptions hétérogènes est limité par les principes mêmes de XML qui distingue les documents « bien formés » des documents « valides ». La définition d’une DTD (définition de type de document) offre ainsi à l’utilisateur rigoureux la possibilité d’éditer un document « valide » qui respecte le modèle de la DTD et ensuite de diffuser un document « bien formé » dans la communauté.&lt;br /&gt;La norme XML et ses nombreux dérivés intègrent dans un même fichier structure et contenu par un balisage normalisé du texte, permettant de « retrouver et de dépasser très largement la plasticité et la complexité des feuilles reliées dont on avait perdu quelques fonctionnalités en route. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn7" name="_ftnref7"&gt;[7]&lt;/a&gt;&lt;br /&gt;RDF : insiste sur l’indexation du document&lt;br /&gt;Le langage XML permet de créer une description structurée d’un document. La signification de ce contenu peut être spécifiée par un protocole de description de ressources appelé RDF (Ressource Description Framework). Celui-ci représente les connaissances sous la forme de triplets, lesquels peuvent être rédigés en langage XML.&lt;br /&gt;RDF est un métalangage développé par le W3C (World Wide Web Consortium), servant à encadrer la description de ressources. Il s’agit d’un mécanisme de description à facettes qui se veut neutre et extensible. Ces qualités sont ce qui le distingue par exemple des métadonnées HTML ou Dublin Core. Avec RDF, il est possible de décrire pratiquement tout, peu importe le domaine, la langue ou la culture rattachés à la ou les ressources décrites.&lt;br /&gt;RDF permet de préciser à la machine la nature d’un objet et ses relations avec les autres. En somme, RDF facilite le traitement automatique des documents puisqu’il situe l’information, la met en relation.&lt;br /&gt;L’utilisation à grande échelle de RDF permettra une plus grande efficacité des moteurs de recherche, le traitement des relations entre les ressources de plusieurs sites, l’échange de connaissances par des « agents intelligents », le filtrage de contenu, etc.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn8" name="_ftnref8"&gt;[8]&lt;/a&gt;&lt;br /&gt;DAML : une extension de XML et de RDF&lt;br /&gt;Même si les ressources informationnelles sont « compréhensibles », elles sont difficilement traitables puisque la machine a besoin de « confronter » l’information reçue avec ses bases de « connaissances » afin d’en tirer un sens. Le langage DAML (DARPA Agent Markup Language), qui est une extension du XML et du RDF, semble être la solution. Il permettra de créer des ontologies (en Intelligence Artificielle, « document définissant de façon formelle des termes et des relations entre eux »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn9" name="_ftnref9"&gt;[9]&lt;/a&gt;) et de les rendre « compréhensibles » par la machine.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300108"&gt;§         Les ontologies&lt;/a&gt;&lt;br /&gt;Les ontologies, sortes de langages documentaires construits pour le Web sémantique, sont les héritières des thésaurus, elles se focalisent sur l’essence d’un domaine, sur son vocabulaire et sur le sens dont il est porteur. Ce sens a deux facettes, celui compris par l’être humain et celui « compris » par la machine. Une des principales richesses des ontologies est donc leur formalisation qui permet leur usage par un programme informatique là où un thésaurus est en échec. Les ontologies améliorent la précision de la recherche d’informations.&lt;br /&gt;&lt;br /&gt;L’ontologie est une forme particulière de « modèle des connaissances »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn10" name="_ftnref10"&gt;[10]&lt;/a&gt;, elle suit les cinq processus de base de la modélisation comme suit :&lt;br /&gt;identifier les composantes de l’ontologie (les concepts, les relations, les axiomes qui doivent figurer dans le modèle) et construire une ontologie initiale,&lt;br /&gt;prioriser les connaissances de l’ontologie initiale pour lesquelles on construit l’ontologie,&lt;br /&gt;décomposer l’ontologie en niveaux par des sous-modèles, notamment la taxonomie de base, les principaux concepts, les relations et les axiomes,&lt;br /&gt;coréférencer les connaissances s’il y a plusieurs domaines ou types de concepts qui doivent être associés,&lt;br /&gt;valider et documenter l’ontologie.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Les techniques automatiques de recherche d’informations ne sont pas toujours très satisfaisantes et ne répondent qu’imparfaitement aux besoins des utilisateurs dans la mesure où elles sont souvent bruitées. Dans ce contexte, il est intéressant d’offrir des outils de visualisation rapide des textes sélectionnés afin que l’utilisateur puisse évaluer leur pertinence par rapport à sa requête : produire un résumé du texte statique ou dynamique (visualisation des points intéressants par navigation interactive dans le résumé). Ce dernier est construit en interaction avec l’utilisateur.&lt;br /&gt;Le filtrage et la sélection de l’information ne se font plus a priori comme dans les médias traditionnels, mais a posteriori. Les documents les plus pertinents sont progressivement repérés et mis en valeur.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300109"&gt;1.2         Le &lt;/a&gt;text-mining : une nouvelle façon de traiter le document&lt;br /&gt;&lt;br /&gt;Le data-mining&lt;a name="datmin1"&gt;&lt;/a&gt; (littéralement fouille de données) est « la découverte et l’extraction, à partir de bases de données, de l’information implicite, non triviale, préalablement non connue et potentiellement utile pour l’utilisateur. » Le text-mining (fouille de texte) est un « prolongement du data-mining ; il analyse de grands volumes de données textuelles. » &lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn11" name="_ftnref11"&gt;[11]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300110"&gt;1.2.1        Catégorisation et extraction de l’information&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300111"&gt;§         Le data-mining : l’exploration de données&lt;/a&gt;&lt;br /&gt;L’exploration de données ou data-mining est l’extraction d’informations à partir de gros corpus de données accumulés pour des buts différents. Il met en évidence des informations statistiques, non accessibles sans un examen global des données. Enfin, il est à la recherche de relations et de modèles génériques qui existent dans des grosses bases de données mais qui sont cachés dans la masse d’information.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300112"&gt;§         Le découpage de l’information&lt;/a&gt;&lt;br /&gt;La première opération à réaliser pour analyser un texte consiste à le segmenter en ses unités élémentaires : les mots ou les phrases.&lt;br /&gt;Les séparateurs sont en principe les espaces et les signes de ponctuation, mais l’existence de mots composés indissociables (aujourd’hui, après-demain) ne facilite pas la tâche. Pour une opération si simple, les logiciels se trouvent déjà confrontés à des ambiguïtés.&lt;br /&gt;&lt;br /&gt;Nous pouvons voir dans les résumés une application de ces techniques de découpage du texte en unité textuelle.&lt;br /&gt;Les résumés statique ou dynamique reposent sur une analyse du contenu des documents afin d’en extraire les thèmes abordés (structuration), dans le but de fournir des résumés structurés en fonction des besoins et objectifs d’un utilisateur et de ses préférences.&lt;br /&gt;L’élaboration de résumés dynamiques repose sur une meilleure prise en compte de l’utilisateur, en se focalisant sur les thèmes ou segments textuels qui contiendront les informations recherchées, et sur le lien qui unit le résumé au texte original.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn12" name="_ftnref12"&gt;[12]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300113"&gt;§         Les résumés dynamiques&lt;/a&gt;&lt;br /&gt;Les méthodes de résumé automatique sont classées en deux groupes : les approches par extraction et les approches par compréhension.&lt;br /&gt;Les approches par extraction&lt;br /&gt;Les méthodes par extraction mobilisent des ressources linguistiques légères, ce qui leur permet de traiter, avec une certaine efficacité opérationnelle, des textes longs, de différents domaines et avec des temps de traitement acceptables.&lt;br /&gt;Elles sont fondées sur l’hypothèse qu’il existe, dans tout texte, des unités textuelles saillantes, comme la phrase ou le paragraphe. Elles utilisent un algorithme de sélection fondé sur des connaissances statistiques, linguistiques, ou sur des heuristiques combinant différents types de connaissances, qui consiste à extraire du texte source une liste ordonnée d’unités textuelles.&lt;br /&gt;Elles construisent un résumé à partir de cette liste, en respectant l’ordre dans lequel les unités apparaissent dans le texte source tout en veillant à ne pas dépasser un nombre total d’unités textuelles, appelé « seuil de réduction » (de l’ordre de 20%).&lt;br /&gt;&lt;br /&gt;Les méthodes par apprentissage, elles aussi basées sur l’extraction d’unités textuelles, comportent deux phases.&lt;br /&gt;La première phase est la phase d’apprentissage dans laquelle un corpus étiqueté, c’est-à-dire composé de textes et de leur résumé respectif, est utilisé pour entraîner un classifieur, ce qui permet de construire un modèle d’apprentissage.&lt;br /&gt;Ce modèle est ensuite utilisé pour construire les résumés. On peut lui reprocher de ne pas tenir compte de l’apparition de nouveaux termes, rendant aléatoire toute tentative de figer la pondération entre les critères d’apprentissage, ou de l’évolution des normes de production des textes, ce qui entraîne une modification de l’importance de certains critères structurels appris par un système supervisé.&lt;br /&gt;&lt;br /&gt;Ces approches, s’appuyant sur l’hypothèse que les phrases qui contiennent les mots les plus fréquents sont représentatives de la thématique du texte, posent le problème de la cohérence et de la cohésion du résumé. Il n’y a pas d’analyse syntaxique du texte. Les approches par compréhension tentent d’y remédier.&lt;br /&gt;Les approches par compréhension : un repérage d’informations factuelles&lt;br /&gt;L’étude de la compréhension automatique s’inspire des méthodes de l’intelligence artificielle, définie par le Dictionnaire des Sciences de l’information et de la communication comme une « discipline de l’informatique dont le but est l’étude et la conception de systèmes dont le comportement se rapproche de ce que nous qualifions d’intelligence chez l’homme. »&lt;br /&gt;&lt;br /&gt;La première étape vise à construire une représentation du texte à traiter. Cette représentation est le résultat d’une analyse syntaxique. Le résultat obtenu est une représentation réduite aux parties les plus importantes de la représentation du texte initial.&lt;br /&gt;L’étape suivante consiste à engendrer un texte à partir de la représentation résultante. Ce texte est considéré comme le résumé du texte initial.&lt;br /&gt;&lt;br /&gt;Ce type d’approche est très lié à un domaine particulier, ce qui nécessite la construction de représentations, devant refléter les relations importantes et celles qui le sont moins, et une possibilité effective de faire appel à des connaissances relatives aux domaines traités. Construire une représentation sémantique d’un texte est un travail qui exige un développement de modèles conceptuels, de faire appel à des ressources linguistiques et à des outils informatiques qui, même si certains d’entre eux sont disponibles dans les laboratoires de recherche, n’ont pas encore atteint le stade d’une industrialisation.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn13" name="_ftnref13"&gt;[13]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Le résumé recherche finalement une adéquation entre l’expression d’une requête d’un lecteur et l’identification d’informations dans un texte. L’information doit correspondre aux besoins d’un utilisateur. Cette recherche d’adéquation entre les besoins d’un utilisateur et l’extraction d’informations pertinentes correspond au filtrage sémantique.&lt;br /&gt;La prise en compte, dès la modélisation, des utilisateurs, a conduit progressivement à une conception élargie du résumé synthétique. Il s’agit maintenant de proposer des systèmes informatiques capables de fouiller, avec des points de vue différents, le contenu de textes.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300114"&gt;1.2.2        L’introduction de la sémantique : le filtrage de l’information&lt;/a&gt;&lt;br /&gt;« La sémantique s’intéresse aux sens des mots, à leur variation, et plus généralement à l’analyse et à la construction de sens à partir du langage. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn14" name="_ftnref14"&gt;[14]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Le filtrage sémantique d’informations est une des réponses qui est proposée face aux limites constatées des systèmes de résumé automatique. Les systèmes automatiques de filtrage sémantique visent à répondre aux besoins spécifiques d’un utilisateur pour une tâche d’identification ou de recherche d’informations. Ces systèmes s’appuient sur une modélisation des connaissances linguistiques propres à la tâche d’identification et exigent le développement d’interfaces adaptées à la fouille de textes. Afin d’éviter le développement de systèmes spécifiques à une tâche, il est nécessaire de développer des plates-formes d’ingénierie linguistique suffisamment ouvertes pour accueillir des nouvelles tâches d’identification. Mais il est tout aussi nécessaire que le langage de description des connaissances linguistiques qu’elles proposent soit suffisamment formalisé pour qu’il soit possible de capitaliser ces connaissances pour construire de véritables ressources linguistiques réutilisables.&lt;br /&gt;En d’autres termes, il s’agit de repérer dans les textes des unités textuelles, en général des phrases. Ce repérage nécessite l’acquisition et l’organisation en classes, sur des critères sémantiques, de formes lexicales qui vont constituer des ressources linguistiques. C’est là toute la différence avec le résumé dynamique, qui ne s’appuyait en aucune façon sur le sens du texte.&lt;br /&gt;&lt;br /&gt;La première étape de l’analyse du sens d’un texte consiste à trouver le sens de chaque phrase, isolée de son contexte. On parle de sémantique lexicale (le sens des mots séparés, avec les problèmes de polysémie, de sens propre ou figuré… que cela comporte) et de sémantique grammaticale (la compréhension des relations entre les mots est aussi nécessaire que l’identification du sens des mots isolés).&lt;br /&gt;La deuxième étape donne la possibilité de relier les phrases successives les unes aux autres, de façon à construire un sens global, cohérent en soi et par rapport à la situation d’ensemble et aux conditions d’énonciation du discours. On fait référence dans ce cas à la sémantique contextuelle (la phrase particulière analysée s’insère dans un contexte préalable qui évolue ensuite et se construit au fur et à mesure du texte, du fait des phrases précédentes) et à l’implicite (les lecteurs possèdent un nombre de connaissances générales sur l’univers, indispensable pour construire le sens complet des textes à partir des informations que ceux-ci contiennent).&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300115"&gt;§         L’exploration contextuelle&lt;/a&gt;&lt;br /&gt;Le contexte représente l’« environnement global, les conditions générales d’expression d’un discours qui donne un sens aux éléments linguistiques isolés »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn15" name="_ftnref15"&gt;[15]&lt;/a&gt; ; il joue un rôle essentiel pour la connotation du document.&lt;br /&gt;&lt;br /&gt;Une technique particulière du filtrage sémantique, la méthode d’exploration contextuelle, vise à se donner les moyens d’accéder au contenu sémantique des textes pour mieux les cibler et en extraire des séquences particulièrement pertinentes. Elle tient compte des informations présentes dans le contexte textuel pour un calcul des valeurs sémantiques relevant de différentes tâches.&lt;br /&gt;Elle propose de déterminer d’abord la carte sémantique correspondant à la tâche de traitement que l’on désire automatiser. Le travail linguistique de construction de cette carte sémantique consiste à identifier l’ensemble des valeurs sémantiques et à organiser ces valeurs sémantiques dans un réseau organisé.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn16" name="_ftnref16"&gt;[16]&lt;/a&gt;&lt;br /&gt;Un important travail théorique est donc à réaliser en amont de tout projet d’automatisation de la tâche. Une voie intermédiaire consiste alors à se limiter à identifier des valeurs sémantiques, sans prétendre que ces valeurs couvrent exhaustivement le domaine et sans chercher à construire un réseau entre les concepts identifiés.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300116"&gt;§         Les liens contextuels&lt;/a&gt;&lt;br /&gt;Une nouvelle génération de logiciels apparaît aujourd’hui sur le marché, qui vise à mieux exploiter des ressources électroniques multiples et non coordonnées en générant des liens contextuels entre elles. Ces outils permettent de prolonger la consultation d’une banque de données documentaires par l’affichage de documents associés (résumé, analyse critique, sommaire…).&lt;br /&gt;La technique de la génération de liens contextuels autorise trois types principaux d’application : la construction d’un portail documentaire, la collecte systématique sur le Web d’informations apparentées à une référence, le rebond automatisé avec collecte du type de document demandé par l’usager. Intégrés au module de recherche documentaire ou au catalogue en ligne d’un centre de documentation, ces nouveaux logiciels améliorent sensiblement la lisibilité de leur offre de services en ligne.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn17" name="_ftnref17"&gt;[17]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Le filtrage aboutit donc à la création d’un réseau sémantique : « formalisme de représentation des connaissances tenant compte de leur sens, sous forme de graphes. Les nœuds du graphe représentent des concepts (objets ou événements) et les arcs, des relations entre ces concepts. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn18" name="_ftnref18"&gt;[18]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Afin d’améliorer la performance des outils de résumé automatique ou de filtrage sémantique, on peut imaginer un système reposant sur des indicateurs linguistiques indépendants des sujets abordés dans les textes traités, l’intégration de connaissances du domaine demeurant cependant possible. D’autre part, le système de fouille et de filtrage doit pouvoir fournir des extraits de texte en rapport avec la thématique intéressant l’utilisateur et donc tenir compte de la structure thématique du texte original.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300117"&gt;1.2.3        Les moteurs « intelligents »&lt;/a&gt;&lt;br /&gt;Le fait de rechercher des informations dans les textes amène implicitement à envisager la possibilité de compréhension de leur contenu. Déjà, les traitements dits sémantiques ont l’ambition de prendre en compte leur sens, c’est-à-dire de les comprendre.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn19" name="_ftnref19"&gt;[19]&lt;/a&gt; Il est donc licite de se demander si les ordinateurs pourront un jour « comprendre » le langage des hommes.&lt;br /&gt;La difficulté de la compréhension automatique des textes provient en premier lieu de la pauvreté de la représentation interne d’un ordinateur et des informations disponibles, par rapport à la richesse de l’être humain. Il est par exemple inconcevable qu’une machine puisse elle-même repérer ou abstraire un concept nouveau, encore moins élaborer un nouveau modèle et être capable de l’ « expliquer » clairement à un interlocuteur.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn20" name="_ftnref20"&gt;[20]&lt;/a&gt;&lt;br /&gt;Tout ce qu’il est possible d’obtenir pour l’instant, c’est la mise en évidence d’associations nouvelles de concepts déjà introduits dans le système.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300118"&gt;§         Les agents intelligents&lt;/a&gt;&lt;br /&gt;Avec les agents de recherche, nous entrons dans une catégorie de logiciels qui vont au-delà de la simple fonction de recherche, et que l’on désigne parfois sous le terme d’ »agents intelligents ». « On parle d’agents intelligents lorsqu’on désigne des systèmes qui opèrent dans un environnement qui évolue de manière constante et à propos duquel ces systèmes possèdent une information partielle ou incorrecte ».&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn21" name="_ftnref21"&gt;[21]&lt;/a&gt;&lt;br /&gt;Les agents intelligents sont à la fois capables d’interroger plusieurs moteurs de recherche en parallèle, de réindexer les résultats obtenus en utilisant parfois des traitements sémantiques, dans un but de filtrage, et de charger de nouvelles pages en suivant les liens de pages  résultats jugées intéressantes.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn22" name="_ftnref22"&gt;[22]&lt;/a&gt;&lt;br /&gt;Ces logiciels, aux fonctions multiples, sont d’une utilisation assez complexe. Ils ne règlent pas encore tous les problèmes liés à la recherche d’informations.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Le recours à la sémantique semble encore rebuter la plupart des informaticiens. Toutes les promesses de l’intelligence artificielle qui recouraient à des représentations universelles des connaissances n’ont pas été tenues.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn23" name="_ftnref23"&gt;[23]&lt;/a&gt; Bien des questions sur la performance des outils restent encore non résolues, les meilleurs outils ont dû intégrer une part de travail humain, se présentant plus comme des outils d’aide que comme des outils automatiques.&lt;br /&gt;Le problème principal est de construire des modèles permettant de traiter le contenu des documents, afin de les retrouver, et éventuellement les réagencer pour en produire de nouveaux, adaptés à la demande du lecteur.&lt;br /&gt;C’est dans la personnalisation de la recherche d’informations que les besoins de toute une collectivité seront satisfaits.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300119"&gt;1.3         Un accès à l’information personnalisé&lt;/a&gt;&lt;br /&gt;&lt;a name="_Toc84300120"&gt;1.3.1        Confidentialité de l’information&lt;/a&gt;&lt;br /&gt;Les choix stratégiques de l’entreprise consistent à créer, exploiter et maintenir un « portefeuille de savoirs »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn24" name="_ftnref24"&gt;[24]&lt;/a&gt; qui assurent à celle-ci certains avantages sur les entreprises concurrentes. Pour que les savoirs fournissent des avantages durables, il faut qu’ils ne se diffusent pas, ou de façon très lente, qu’ils ne soient pas imitables ou accessibles sur le marché. Ainsi, certaines informations ne seront pas divulguées, même en interne.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300121"&gt;1.3.2        Détermination d’un profil de l'utilisateur&lt;/a&gt;&lt;br /&gt;Prenons pour exemple le service de criticité SEC (unité fonctionnant au sein du CEA), de l’Institut de protection et de sûreté nucléaire (IPSN). Les caractéristiques à prendre en compte pour chaque utilisateur sont résumées dans le tableau suivant :&lt;br /&gt;&lt;br /&gt;Utilisateur&lt;br /&gt;Caractéristiques&lt;br /&gt;Expert ingénieur&lt;br /&gt;Bonne connaissance des paramètres et des mécanismes utilisés dans les calculs de criticité&lt;br /&gt;Bonne connaissance des outils mis à sa disposition&lt;br /&gt;Connaissance moyenne des phénomènes physiques liés à la criticité&lt;br /&gt;Connaissance de la terminologie technique et des références les plus utilisées&lt;br /&gt;Expert chercheur&lt;br /&gt;Bonne connaissance des paramètres et des mécanismes utilisés dans les calculs de criticité&lt;br /&gt;Bonne connaissance des phénomènes physiques liés à la criticité&lt;br /&gt;Utilisation détournée des outils&lt;br /&gt;Connaissance des domaines connexes&lt;br /&gt;Apprenant&lt;br /&gt;Connaissance des phénomènes physiques de base liés à la criticité&lt;br /&gt;Faible connaissance des méthodes de neutronique utilisées par les criticiens&lt;br /&gt;Peu ou pas de connaissance sur les outils de calcul de criticité&lt;br /&gt;Peu ou pas de connaissance des activités du SEC&lt;br /&gt;Novice&lt;br /&gt;Aucune connaissance des phénomènes physiques liés à la criticité&lt;br /&gt;Aucune connaissance des méthodes de neutronique utilisées par les criticiens&lt;br /&gt;Aucune connaissance des activités du SEC&lt;br /&gt;Tableau 1 : Caractéristiques des différents types d’utilisateurs en sûreté – criticité &lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn25" name="_ftnref25"&gt;[25]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Alors que l’expert connaît la totalité des outils et mécanismes couverts par l’entreprise, le novice n’en a aucune connaissance. Dès lors, voyons quelles informations, en fonction de leurs besoins, leur sont diffusées :&lt;br /&gt;&lt;br /&gt;Domaines&lt;br /&gt;Novice&lt;br /&gt;Apprenant&lt;br /&gt;Expert&lt;br /&gt;Études de criticité (Ingénierie)&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Navigation dans les diagrammes et les documents du système d’information les plus proches par des liens statiques&lt;br /&gt;&lt;br /&gt;Accès limité aux informations de type ingénierie&lt;br /&gt;&lt;br /&gt;Accès aux options standard des codes&lt;br /&gt;Accès orienté études à l’ensemble du système d’information&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Accès à toutes les applications&lt;br /&gt;&lt;br /&gt;Expertises pour les transports (ingénierie)&lt;br /&gt;Accès orienté expertises à l’ensemble du système d’information&lt;br /&gt;Codes de calcul (recherche)&lt;br /&gt;Accès limité aux informations de type recherche&lt;br /&gt;&lt;br /&gt;Accès aux options standard des codes&lt;br /&gt;Accès orienté codes à l’ensemble du système d’information&lt;br /&gt;Expériences critiques (recherche)&lt;br /&gt;Accès orienté expériences à l’ensemble du système d’information&lt;br /&gt;Tableau 2 : Fonctionnalités offertes aux différents types d’utilisateurs &lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn26" name="_ftnref26"&gt;[26]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;En fonction des différents profils d’utilisation, le système d’expression du besoin d’information doit se comporter différemment. Ainsi, l’expert aura accès à toutes les applications, alors que le novice ne bénéficiera que d’un accès limité aux documents.&lt;br /&gt;&lt;br /&gt;Avec l’évolution probable des niveaux de confidentialité de l’information, ainsi que du profil des utilisateurs, les critères d’accès aux documents changeront. La numérisation rendra cette tâche particulièrement réalisable.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300122"&gt;1.3.3        L’information personnalisée&lt;/a&gt;&lt;br /&gt;Développer autant d’applications que l’on compte de profils de clients, d’employés ou de partenaires relève de l’impossible. C’est précisément là qu’interviennent les portails, chargés d’agréger l’information à la volée en fonction du profil de la personne qui l’utilise. Les utilisateurs, dépassés par le nombre d’outils en tout genre qui foisonnent actuellement, n’ont plus le temps d’apprendre à les manipuler, et souhaitent une approche plus simple et unifiée.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300123"&gt;§         Les portails d’information&lt;/a&gt;&lt;br /&gt;Les portails constituent de nouveaux espaces de travail et d’accès à l’information. Le concept de portail répond à des principes simples : une interface unique, le navigateur, dans lequel on agrège à la volée différentes sources d’information selon des règles préétablies par l’administrateur du système et / ou les utilisateurs eux-mêmes. Tirant parti des organisations en réseau des entreprises, le portail ne crée pas l’information ; il la récupère dans les applications internes de la société, sur Internet ou dans les systèmes d’information des partenaires.&lt;br /&gt;Le portail simplifie considérablement la publication du contenu. Point d’entrée unique, il s’appuie sur un moteur de règles ou sur des agents pour personnaliser l’information et simplifier les procédures d’authentification des utilisateurs. Il suffit en effet de saisir son login (nom d'utilisateur) et son mot de passe une seule fois pour accéder à l’ensemble des données et des applications. Le portail est une véritable passerelle entre l’utilisateur et le système d’information. Initialement dédiés à la diffusion de contenu, les portails sont destinés à fédérer l’ensemble des composantes des systèmes d’information et à proposer un point d’entrée unique, personnalisé et sécurisé, vers de multiples ressources.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn27" name="_ftnref27"&gt;[27]&lt;/a&gt;&lt;br /&gt;Les portails d’information semblent la forme la plus aboutie de l’intranet.&lt;br /&gt;&lt;br /&gt;Un aspect négatif des portails réside néanmoins dans la concentration : seuls les logiciels capables d’apporter des solutions dans une majorité de registres survivront. La qualité en pâtira, car aucun produit ne peut être le meilleur en tout. La largeur de leur couverture fonctionnelle risque donc de se faire au détriment de la qualité de certaines de leurs fonctions, en particulier celles d’indexation et de recherche, qui sont parfois considérées comme secondaires dans ce genre de produits.&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn28" name="_ftnref28"&gt;[28]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Autre solution apportée à la personnalisation de l’information : la technologie push.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300124"&gt;§         La technologie push&lt;/a&gt;&lt;br /&gt;Le push, c’est la diffusion sélective de l’information. Elle s’oppose à la technologie pull, consistant pour sa part à aspirer l’information à partir du poste client.&lt;br /&gt;&lt;br /&gt;Ces technologies de diffusion à la demande poussent l’information vers le demandeur et offrent un service de distribution d’informations qui se fonde sur les notions de chaînes d’informations thématiques.&lt;br /&gt;Les exigences des entreprises à l’égard des solutions de push sont les suivantes :&lt;br /&gt;-         l’information saisie, filtrée et disséminée doit être gérée,&lt;br /&gt;-         le contenu doit être compréhensible et approprié au travail,&lt;br /&gt;-         la performance humaine doit être renforcée par la livraison automatique et en temps réel de l’information.&lt;br /&gt;&lt;br /&gt;Un danger est de recevoir périodiquement plus de mails que l’internaute ne peut en lire. L’utilisateur doit sélectionner les abonnements de push correspondant à son besoin réel.&lt;br /&gt;&lt;br /&gt;&lt;a name="_Toc84300125"&gt;§         Intelligence économique&lt;/a&gt;&lt;br /&gt;Dans l’entreprise, la qualité des décisions entraîne directement le succès ou l’échec. Même dans une entreprise à but non lucratif, la qualité des décisions influe sur l’efficacité de l’organisation. Mais les gens ne peuvent prendre des décisions qu’à hauteur de l’information dont ils disposent. Les centres de documentation ont donc créé des services de « veille », s’intégrant dans une logique d’intelligence économique.&lt;br /&gt;&lt;br /&gt;L’intelligence économique est « l’ensemble des actions coordonnées de recherche, de traitement et de distribution de l’information utile, en vue de son exploitation, aux acteurs économiques. Elle s'intéresse à tous types de signaux, et notamment à ceux touchant aux coopérations, aux alliances, aux contextes culturels et sociaux. » &lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn29" name="_ftnref29"&gt;[29]&lt;/a&gt; La finalité de l’activité d’intelligence économique est d’informer utilement, c’est-à-dire « contribuer à l’amélioration des prises de décisions et à l’élaboration des stratégies des acteurs économiques, quelque soit leur position », nous dit le Dictionnaire encyclopédique des sciences de l’information et de la communication. Les professionnels se préoccupent de plus en plus de la pertinence de l’information, la valeur de l’information, l’attente en matière d’information et, au-delà, ils s’intéressent aux processus d’interprétation, de conception et de décision des acteurs. Il faut veiller à une utilisation la plus poussée possible de l’information, donc à une forte individualisation du service rendu à l’usager.&lt;br /&gt;&lt;br /&gt;La veille désigne la « pratique qui englobe les actions de collecte, d’analyse et de diffusion des informations en vue de rendre plus intelligible l’environnement de l’entreprise. En cherchant à anticiper les évolutions du marché par une mise en valeur des informations et des connaissances, la veille a pour objectif d’accroître l’adaptabilité de l’entreprise à son marché. Selon les entreprises et leur(s) secteur(s) d'activité, les domaines à surveiller varient. »&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn30" name="_ftnref30"&gt;[30]&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;Faire de la veille, c’est aussi savoir ce qui se passe partout dans l’entreprise. Les informations pertinentes ne sont pas toujours à l’extérieur mais au sein même de l’entreprise. Avec l’arrivée de l’information électronique, les gros systèmes de GED, les entreprises se sont mises à leurs archives. Elles s’aperçoivent alors qu’il y a une accumulation des connaissances.&lt;br /&gt;Citons J.-F. THONIN, chargé de la veille concurrentielle à Chronopost. Il définit la documentation interne et ses origines : « par interne, on fait référence à toutes les personnes qui sont en contact avec le terrain, les clients en particulier. De ces personnes provient une remontée d’informations, notamment concurrentielles. Dans certaines entreprises, on essaie même de placer auprès d’elles un correspondant qui est payé pour avoir un réflexe « remontée d'informations ». Autrement, on mise sur le volontariat et le bénévolat, dans une sorte de marché tacite. Chacun est conscient que l’information sur la concurrence lui est utile dans son travail, surtout les commerciaux…»&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftn31" name="_ftnref31"&gt;[31]&lt;/a&gt;&lt;br /&gt;Pour Roger MOIROUD, président de SCIP France, « il ne suffit pas d’attendre que l'information se présente, mais il faut aller la chercher. Le rôle de l’intelligence économique est de reconnecter les décideurs et les cueilleurs d’informations. »&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;Pour assurer leur compétitivité, les entreprises sont obligées d’évaluer leur environnement mondial, ainsi que l’évolution des marchés et des nouvelles technologies. D’où l’importance de la veille, qui les conduit à prendre le plus tôt possible les bonnes décisions d’orientation de leur activité, à s’adapter aux changements et à tenir compte des politiques de leurs concurrents.&lt;br /&gt;&lt;br /&gt;Créer une structure permanente de sensibilisation aux attentes des utilisateurs en matière de mise à disposition d’informations est une priorité dans l’entreprise. Il va sans dire que la place des outils informatiques, et leur performance en terme de recherche documentaire, est prépondérante. On peut regretter que la performance des outils de recherche, d’un point de vue documentaire, soit bien inférieure à leur puissance informatique. Lorsque les nouvelles générations de ces outils exploiteront pleinement les formats XML, RDF ou DAML, il sera possible d’exprimer le besoin en informations à partir des structures des documents. Dès lors, les producteurs d’information auront à concevoir des DTD qui faciliteront cette expression du besoin.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref1" name="_ftn1"&gt;[1]&lt;/a&gt; SALAÜN, Jean-Michel, Chronique inachevée d’une réflexion collective sur le document [en ligne], Disponible sur&lt;br /&gt;&lt;&lt;a href="http://rtp-doc.enssib.fr/fichiers/DefinitionDocument/Bibliotheque_documnt/Com-et-lang-09-01-2004.doc"&gt;HTTP://rtp-doc.enssib.fr/fichiers/DefinitionDocument/Bibliotheque_documnt/Com-et-lang-09-01-2004.doc&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref2" name="_ftn2"&gt;[2]&lt;/a&gt; JOLION, Jean-Michel, Dir., « L’indexation », In : Document numérique, vol. 4, n°1-2, 2000, Hermès Science Publications, 2001, COTTE, Dominique, Représentation des connaissances et convergence numérique, p. 167-182, citant CHABIN, M.-A., « Exigences numériques et besoins documentaires », In : Solaris, déc. 1999 - janv. 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref3" name="_ftn3"&gt;[3]&lt;/a&gt; Source : CNDP, Les métadonnées : où en est-on ? [en ligne], Disponible sur &lt;&lt;a href="http://www.cndp.fr/standards/metadonnees/"&gt;HTTP://www.cndp.fr/standards/metadonnees/&lt;/a&gt;&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref4" name="_ftn4"&gt;[4]&lt;/a&gt; OUERFELLI, Tarek, « La description des documents électroniques diffusés sur le Web : pour une recherche pertinente », In : CIFSIC 2003 [en ligne], Disponible sur &lt;&lt;a href="http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/07/73/sic_00000773_01/sic_00000773.pdf"&gt;HTTP://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/07/73/sic_00000773_01/sic_00000773.pdf&lt;/a&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref5" name="_ftn5"&gt;[5]&lt;/a&gt; Nous présentons en annexe un document intitulé « Les 15 éléments du Dublin Core ».&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref6" name="_ftn6"&gt;[6]&lt;/a&gt; &lt;&lt;a href="http://amerique-nord.auf.org/"&gt;http://amerique-nord.auf.org/&lt;/a&gt;&gt;, cité par : Educnet, Vers le Web sémantique, In : Métadonnées, normes et standards [en ligne], Disponible sur &lt;&lt;a href="http://www.educnet.education.fr/dossier/metadata/edu1.htm"&gt;http://www.educnet.education.fr/dossier/metadata/edu1.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref7" name="_ftn7"&gt;[7]&lt;/a&gt; SALAÜN, Jean-Michel, Document : forme, signe et médium, les re-formulations du numérique [en ligne], Disponible sur &lt;&lt;a href="http://rtp-doc.enssib.fr/"&gt;HTTP://archivesic.ccsd.cnrs.fr/sic_00000511.HTML&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref8" name="_ftn8"&gt;[8]&lt;/a&gt; BERTRAND-GASTALDY, Suzanne, Le Web sémantique [en ligne],&lt;br /&gt;Disponible sur &lt;&lt;a href="http://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu"&gt;HTTP://mapageweb.umontreal.ca/gastaldy/BLT-6134/Travaux/Travail_final/Beaulieu&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref9" name="_ftn9"&gt;[9]&lt;/a&gt; PAQUETTE, G., Modélisation des connaissances et des compétences, Presse Universitaire du Québec, 2002.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref10" name="_ftn10"&gt;[10]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref11" name="_ftn11"&gt;[11]&lt;/a&gt; Source : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref12" name="_ftn12"&gt;[12]&lt;/a&gt; Cette partie se réfère notamment aux travaux de : MINEL, Jean-Luc, Filtrage sémantique, du résumé automatique à la fouille de textes, Lavoisier éditeur, 2002 (Hermès Science Publications).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref13" name="_ftn13"&gt;[13]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref14" name="_ftn14"&gt;[14]&lt;/a&gt; LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref15" name="_ftn15"&gt;[15]&lt;/a&gt; Source : LAMIZET, Bernard ; SILEM, Ahmed, Dictionnaire encyclopédique des sciences de l’information et de la communication, Ellipses, 1997.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref16" name="_ftn16"&gt;[16]&lt;/a&gt; MINEL, Jean-Luc, Filtrage sémantique, du résumé automatique à la fouille de textes, Lavoisier éditeur, 2002 (Hermès Science Publications).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref17" name="_ftn17"&gt;[17]&lt;/a&gt; MAISONNEUVE, Marc, LENEPVEU, Philippe, Du catalogue de la bibliothèque aux ressources du Web. Applications documentaires de la génération de liens contextuels, ADBS éditions, 2003 (Sciences et techniques de l’information).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref18" name="_ftn18"&gt;[18]&lt;/a&gt; Source : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref19" name="_ftn19"&gt;[19]&lt;/a&gt; LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref20" name="_ftn20"&gt;[20]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref21" name="_ftn21"&gt;[21]&lt;/a&gt; Source : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref22" name="_ftn22"&gt;[22]&lt;/a&gt; LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref23" name="_ftn23"&gt;[23]&lt;/a&gt; Jean-Pierre Desclés, Professeur à l’université de Paris-Sorbonne, dans la préface de : MINEL, Jean-Luc, Filtrage sémantique, du résumé automatique à la fouille de textes, Lavoisier éditeur, 2002 (Hermès Science Publications).&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref24" name="_ftn24"&gt;[24]&lt;/a&gt; Cf. TARONDEAU, Jean-Claude, Le management des savoirs, Que sais-je ? ; PUF éditions, 2003. Pour l’auteur, les savoirs définissent la « frontière entre ce qu’une entreprise peut produire et ce qu’elle ne peut pas produire. » Les savoirs constituent donc des « actifs stratégiques » pour l’entreprise.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref25" name="_ftn25"&gt;[25]&lt;/a&gt; JOLION, Jean-Michel, Dir. ; MÉDINI, Lionel et al. « Intégration de l’indexation conceptuelle dans l’expression du besoin d’information », In : Document numérique – L’indexation, vol. 4, n°1-2, 2000, Hermès Science Publications, 2001, p.85-108.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref26" name="_ftn26"&gt;[26]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref27" name="_ftn27"&gt;[27]&lt;/a&gt; Les clés du portail du système d'information. LÉVY-ABÉGNOL, Thierry. 01 Informatique, 19 Mai 2000, n°1589, p.18-19.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref28" name="_ftn28"&gt;[28]&lt;/a&gt; LEFÈVRE, Philippe, La recherche d’informations, du texte intégral au thésaurus, Hermès Science Europe, 2000.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref29" name="_ftn29"&gt;[29]&lt;/a&gt; Source : MARTRE, H., « Intelligence économique et stratégie des entreprises », La Documentation Française, 1994, p. 65, In : MIST [en ligne], Disponible à l’adresse : &lt;&lt;a href="http://mist.univ-paris1.fr/logiciel/def.htm"&gt;HTTP://mist.univ-paris1.fr/logiciel/def.htm&lt;/a&gt;&gt;.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref30" name="_ftn30"&gt;[30]&lt;/a&gt; Ibid.&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-edit.g?blogID=291952466913714304&amp;amp;postID=3830105318098127421#_ftnref31" name="_ftn31"&gt;[31]&lt;/a&gt; Source de cette citation et suivante : ALEXANDRE, Hélène ; NAUDIN, Nathalie, Les métiers de la documentation. APEC - Editions d'organisation, 1998.&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-3830105318098127421?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/3830105318098127421/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=3830105318098127421' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/3830105318098127421'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/3830105318098127421'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/chapitre-3-dun-traitement-de.html' title='Chapitre 3 : D’un traitement de l’information a priori à un traitement a posteriori'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-6238070736148587162</id><published>2008-04-04T08:08:00.000-07:00</published><updated>2008-08-06T06:05:10.091-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='08.Conclusion intermédiaire'/><title type='text'>Conclusion intermédiaire</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;br /&gt;&lt;/em&gt;&lt;p&gt;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;&lt;/strong&gt; &lt;/p&gt;&lt;p&gt;&lt;strong&gt;Une mémoire de l’entreprise&lt;/strong&gt;&lt;/p&gt;&lt;p&gt;Le rôle de la gestion de l’information est, entre autres choses, de garder la mémoire d’une activité humaine. Les fichiers XML sont en théorie inaltérables puisqu’ils contiennent la totalité de leurs informations sous forme numérique. Mais ces fichiers ne représentent pas les formes sous lesquelles sont lus les documents. Au-delà de la mémoire de l’entreprise, une mémoire complète de chaque document supposerait de conserver la totalité des matériels et systèmes de lecture successifs qui permettent d’y accéder.&lt;br /&gt;&lt;br /&gt;Un rôle nouveau, plus actif, émerge pour les centres de documentation, avec le numérique : archives ouvertes, récupération de documents sur le Web, etc. On sent des questions émerger sur un rôle différent à assumer : hésitation entre le témoignage d’une action passée et l’enregistrement d’une action en cours, confusion entre l’archivage et la publication. Dès lors, comment garder la mémoire d’un mouvement continu et renouvelé sans cesse ?&lt;br /&gt;&lt;strong&gt;&lt;br /&gt;&lt;/strong&gt;&lt;a name="_Toc84300128"&gt;&lt;strong&gt;L’apport de la numérisation&lt;/strong&gt;&lt;/a&gt;&lt;/p&gt;&lt;p&gt;La numérisation des documents offre la possibilité de faire évoluer le document a posteriori, en y ajoutant de nouveaux outils, de nouvelles formes d’indexation, tout en conservant les possibilités anciennes. Elle permet par exemple d’éviter une duplication abusive des documents, de classer les documents selon plusieurs critères, de contenir des données non « véhiculables » sur papier, de supprimer les contraintes de temps et de lieu, d’implémenter de nouveaux modes de navigation dans l’information. On peut également imaginer de limiter l’accès aux documents contenus dans les bases de données, selon des critères de plus en plus fins et de plus en plus complexes, et modifier ainsi à volonté la stratégie de communication de l’information en entreprise.&lt;br /&gt;&lt;br /&gt;L’entreprise s’ouvre désormais aux ressources contenues dans les banques de données du Web. Les portails autorisent par exemple chaque salarié de l’entreprise à personnaliser son interface en fonction de son métier ou créer un lien vers un site sur Internet pour suivre le marché.&lt;/p&gt;&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-6238070736148587162?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/6238070736148587162/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=6238070736148587162' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/6238070736148587162'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/6238070736148587162'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/conclusion-intermdiaire.html' title='Conclusion intermédiaire'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry><entry><id>tag:blogger.com,1999:blog-291952466913714304.post-8665324800490304788</id><published>2008-04-04T08:05:00.000-07:00</published><updated>2008-08-06T06:05:22.873-07:00</updated><category scheme='http://www.blogger.com/atom/ns#' term='01.Tous les articles'/><category scheme='http://www.blogger.com/atom/ns#' term='10.Conclusion générale'/><title type='text'>Conclusion générale : Répondre aux besoins en informations ?</title><content type='html'>&lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;&lt;img alt="Creative Commons License" style="border-width: 0pt;" src="http://i.creativecommons.org/l/by-nc-nd/2.0/fr/88x31.png" /&gt;&lt;/a&gt;&lt;br /&gt;&lt;em&gt;Cette création est mise à disposition sous un &lt;a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/2.0/fr/"&gt;contrat Creative Commons&lt;/a&gt;.&lt;br /&gt;&lt;/em&gt;&lt;br /&gt;&lt;br /&gt;Répondre aux besoins en informations ?&lt;br /&gt;&lt;br /&gt;Avec l’automatisation du traitement de l’information, on est passé d’un procédé d’analyse de l’information par un documentaliste, en réponse aux besoins du demandeur, à un procédé d’analyse effectuée par un logiciel. Le problème qui se pose est alors la compréhension par la machine de la demande humaine. Le moteur de recherche doit « s’adapter » au demandeur, et non l’inverse (le demandeur affine sa recherche en fonction des réponses qui lui sont proposées).&lt;br /&gt;&lt;br /&gt;Dans ce mémoire, la notion d’intelligence de la machine, ou du moins l’appropriation de caractères humains par la machine, est transversale. Ainsi sont évoqués successivement les « technologies intellectuelles », les « bases de connaissances », le « dialogue » homme – machine, la « compréhension automatique » et les « agents intelligents ». Ces différentes notions s’inspirent des méthodes de l’ « intelligence artificielle » (« discipline dont le but est l’étude et la conception de systèmes dont le comportement se rapproche de l’intelligence humaine » ; elle donnera naissance aux systèmes experts).&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftn1" name="_ftnref1"&gt;[1]&lt;/a&gt;&lt;br /&gt;La réponse à notre problématique se situe sans doute dans la recherche d’un système expert (en tant que « système de production capable d’atteindre les performances d’un expert humain pour une tâche donnée ») approprié, répondant à la fois aux exigences collectives d’une organisation et sachant s’adapter à la demande personnalisée. On peut croire qu’aux « bases de données » (« ensemble de données évolutives, organisé ou structuré pour en faciliter l’utilisation via un programme spécialisé d’accès aux données de la base »), viendront se succéder des « bases de connaissances » (« partie d’un système expert contenant l’ensemble des règles qui constituent le domaine de compétence du système »).&lt;br /&gt;&lt;br /&gt;Si les outils ne permettent pas encore de satisfaire pleinement les usagers, ils sont cependant promis à un bel avenir.&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a title="" style="" href="http://www.blogger.com/post-create.g?blogID=291952466913714304#_ftnref1" name="_ftn1"&gt;[1]&lt;/a&gt; Source de cette définition et suivantes : LAMIZET, Bernard ; SILEM, Ahmed, Dictionnaire encyclopédique des sciences de l’information et de la communication, Ellipses, 1997.&lt;div class="blogger-post-footer"&gt;&lt;img width='1' height='1' src='https://blogger.googleusercontent.com/tracker/291952466913714304-8665324800490304788?l=memoire2004-marionconsalvi.blogspot.com' alt='' /&gt;&lt;/div&gt;</content><link rel='replies' type='application/atom+xml' href='http://memoire2004-marionconsalvi.blogspot.com/feeds/8665324800490304788/comments/default' title='Publier les commentaires'/><link rel='replies' type='text/html' href='http://www.blogger.com/comment.g?blogID=291952466913714304&amp;postID=8665324800490304788' title='0 commentaires'/><link rel='edit' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/8665324800490304788'/><link rel='self' type='application/atom+xml' href='http://www.blogger.com/feeds/291952466913714304/posts/default/8665324800490304788'/><link rel='alternate' type='text/html' href='http://memoire2004-marionconsalvi.blogspot.com/2008/04/conclusion-gnrale-rpondre-aux-besoins.html' title='Conclusion générale : Répondre aux besoins en informations ?'/><author><name>Marion Consalvi</name><uri>http://www.blogger.com/profile/12984654461190510332</uri><email>noreply@blogger.com</email><gd:image rel='http://schemas.google.com/g/2005#thumbnail' width='16' height='16' src='http://img2.blogblog.com/img/b16-rounded.gif'/></author><thr:total>0</thr:total></entry></feed>
