12.07.2015 Views

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

Le resume linguistique de donnees structurees comme ... - APMD

SHOW MORE
SHOW LESS
  • No tags were found...

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

8 CHAPITRE 1 — <strong>Le</strong>s résumés du modèle SAINTETIQdonnées sont présentées en section 1.1 afin d’exposer la problématique générale <strong>de</strong>s résumés<strong>linguistique</strong>s SAINTETIQ.1.1 Techniques <strong>de</strong> réduction <strong>de</strong> donnéesCette section est consacrée à une brève présentation générale <strong>de</strong>s techniques <strong>de</strong> réduction<strong>de</strong> données, dont l’objectif est <strong>de</strong> réduire le volume <strong>de</strong> données en entrée d’un traitement. Malgréune apparente similarité, il est nécessaire <strong>de</strong> distinguer ces techniques (<strong>de</strong> réduction <strong>de</strong>sdonnées) <strong>de</strong>s techniques <strong>de</strong> compression même si ces <strong>de</strong>rnières sont parfois utilisées par laréduction <strong>de</strong> données.La compression semble ne viser qu’une réduction du volume <strong>de</strong>s données, traditionnellementliée à <strong>de</strong>s limites matérielles en capacité <strong>de</strong> stockage ou en débit <strong>de</strong> transmission. L’applicationla plus représentative <strong>de</strong> la compression <strong>de</strong> données est la compression <strong>de</strong> fichiers,utilisant <strong>de</strong>s algorithmes (RLE, LZW, codage <strong>de</strong> Huffman, etc.) ou utilitaires (PkZip, 7-zip, <strong>de</strong>flate,compress, etc.) relativement connus. <strong>Le</strong> résultat <strong>de</strong> ces algorithmes est dit « sans perte »en ce sens qu’un algorithme inverse peut être appliqué au résultat pour retrouver exactement lesdonnées initiales. On parle parfois <strong>de</strong> compactage pour désigner cette compression sans perte.La compression peut être également « avec perte » pour certains types <strong>de</strong> données (audio, vidéoet photo). Dans ce <strong>de</strong>rnier cas, la décompression <strong>de</strong> données compressées ne garantit pas<strong>de</strong> reconstituer à l’i<strong>de</strong>ntique les données initiales, mais le résultat est quasiment i<strong>de</strong>ntique pourl’oreille ou l’œil humain.La motivation <strong>de</strong>s techniques <strong>de</strong> réduction <strong>de</strong> données est autre. Ces techniques répon<strong>de</strong>ntau besoin d’obtenir rapi<strong>de</strong>ment <strong>de</strong>s réponses approximatives dans <strong>de</strong>s contextes où « l’obtentiond’une réponse exacte est un processus habituellement long » [3] et où une réponse approximativeapporte suffisamment d’informations pour être acceptable.1.1.1 Quelles métho<strong>de</strong>s ?Intuitivement, les techniques <strong>de</strong> réduction <strong>de</strong> données se ramènent à un traitement effectuésur <strong>de</strong>s données représentatives <strong>de</strong> l’ensemble <strong>de</strong>s données : le résultat d’une réduction <strong>de</strong> donnéesest un résumé (<strong>de</strong>s données initiales), qui adopte parfois une forme différente <strong>de</strong> celle <strong>de</strong>sdonnées initiales.<strong>Le</strong> contexte d’une application peut également faire intervenir <strong>de</strong>s techniques <strong>de</strong> réduction<strong>de</strong> données. Par exemple, dans les systèmes distribués en mo<strong>de</strong> pair à pair, la volatilité <strong>de</strong>s

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!