36 CHAPITRE 2 — Algorithme d’interrogation <strong>de</strong>s résumésDans la suite <strong>de</strong> cette section, la formulation ensembliste <strong>de</strong>s requêtes fournie par la caractérisationinitiale (voir la section 2.1.1 pour une définition) est utilisée afin <strong>de</strong> réaliser <strong>de</strong>stests <strong>de</strong> correspondance où le problème évoqué dans la section 2.2.1 précé<strong>de</strong>nte ne se pose pas.Il ne s’agit plus d’évaluer une proposition logique dans le cadre d’un résumé, mais <strong>de</strong> déterminerla situation <strong>de</strong>s <strong>de</strong>ux ensembles <strong>de</strong> <strong>de</strong>scripteurs mis en jeu, l’un par rapport à l’autre.Ces ensembles sont d’une part, les caractères requis fournis par une requête et, d’autre part,les <strong>de</strong>scripteurs extraits d’intensions <strong>de</strong> résumés. L’équivalence qui existe entre interprétationlogique et opérations ensemblistes permet <strong>de</strong> traduire la conjonction logique par l’intersectionet la disjonction par l’union.Évaluer les conditions <strong>de</strong> sélection sur un résumé z revient donc à mettre en rapport l’ensembleL Ai (z) <strong>de</strong> ses <strong>de</strong>scripteurs sur l’attribut A i et la caractérisation-attribut C i sur le mêmeattribut A i . Bien sûr, tous les attributs présents dans la requête font l’objet <strong>de</strong> ce test <strong>de</strong> correspondance.La figure 2.1 illustre les cinq différentes situations découlant <strong>de</strong> la comparaison <strong>de</strong> <strong>de</strong>uxensembles, en l’occurrence L Ai (z) et C i :1. la disjonction <strong>de</strong>s <strong>de</strong>ux ensembles (fig. 2.1-a) ;2. l’égalité <strong>de</strong>s <strong>de</strong>ux ensembles (fig. 2.1-b) ;3. l’inclusion <strong>de</strong> L Ai (z) dans C i (fig. 2.1-c) ;4. l’inclusion <strong>de</strong> C i dans L Ai (z) (fig. 2.1-d) ;5. l’intersection partielle, indiquant une intersection non vi<strong>de</strong> distincte <strong>de</strong> l’inclusion et <strong>de</strong>l’égalité (fig. 2.1-e).CiL Ai (z)a b c d eFigure 2.1 – Comparaison <strong>de</strong>s ensembles <strong>de</strong> <strong>de</strong>scripteurs L Ai (z) et C iLa situation relative <strong>de</strong>s ensembles L Ai (z) et C i , rapportée à l’ensemble <strong>de</strong>s attributs <strong>de</strong> larequête en cours d’évaluation, permet <strong>de</strong> prendre une décision quant au statut <strong>de</strong> z en tant querésultat <strong>de</strong> la requête. On distingue trois cas, détaillés ci-<strong>de</strong>ssous.
CHAPITRE 2 — Algorithme d’interrogation <strong>de</strong>s résumés 37Cas 1 (correspondance nulle). Il existe au moins un attribut pour lequel la clause <strong>de</strong> sélection<strong>de</strong> la requête n’est pas satisfaite : P(z) = FAUX. <strong>Le</strong> résumé n’est pas un résultat et lesous-arbre <strong>de</strong> racine z ne sera pas exploré.Exemple 9 :Soit une requête Q 1 = DESCRIBE ON température, dureté WHERE épaisseur IN (fin,mince). La caractérisation sur l’épaisseur (C ep = {fin, mince}) n’est pas satisfaite par z 1 tel quez 1 .ep = {1.0/moyen + 1.0/épais}.De même, pour une requête Q 2 = DESCRIBE ON température WHERE dureté IN (doux, mou)AND épaisseur IN (moyen), z 2 = 〈1.0/moyen, 0.7/dur, 1.0/modéré〉 n’est pas un résultat carz 2 .dureté = {0.7/dur} ne présente aucune <strong>de</strong>s caractéristiques recherchées.La section 2.2.1 montre que la sélection <strong>de</strong>s résumés doit se faire sur un autre critère lorsqueP(z) = VRAI. En effet, la satisfaction <strong>de</strong> la proposition par un résumé donné ne suffit pas àdéterminer que ce <strong>de</strong>rnier est un résultat vali<strong>de</strong> <strong>de</strong> la requête. Pour lever l’ambigüité, on utiliserala relation ensembliste liant C i et L Ai (z) car le problème d’ambigüité décrit par l’expression(2.11) nécessite que l’on ait, sur au moins un attribut, un <strong>de</strong>scripteur <strong>de</strong> z.A i qui n’appartiennepas à C i (voir le cas 3 plus loin).Cas 2 (correspondance exacte). Pour tous les attributs <strong>de</strong> la requête, le résumé présenteuniquement <strong>de</strong>s caractéristiques recherchées. Ce cas <strong>de</strong> figure ne fait intervenir que <strong>de</strong>s situationsrelatives d’égalité ou d’inclusion (fig. 2.1-b et 2.1-c)) : ∀ i ∈ {1, . . . , k}, L Ai (z) ⊆ C i . Ici,toutes les combinaisons <strong>de</strong> <strong>de</strong>scripteurs du résumé sont <strong>de</strong>s résultats vali<strong>de</strong>s <strong>de</strong> la requête. On adonc Ch(z) ⊆ ∏ ki=1 C i. <strong>Le</strong> résumé z est un résultat ainsi que tous les éventuels nœuds du sousarbre<strong>de</strong> racine z. L’exploration <strong>de</strong> ce sous-arbre n’est donc pas nécessaire. Un exemple pour cecas est celui <strong>de</strong> la requête Q 3 = DESCRIBE ON température, dureté WHERE épaisseur IN(fin, mince, moyen). La caractérisation initiale est constitué <strong>de</strong> C ep = {fin, mince, moyen} et lerésumé z 3 tel que z 3 .ep = {0.6/fin + 0.8/mince} en est un résultat.Cas 3 (correspondance par excès). Ce cas correspond à l’expression (2.11) : la propositionlogique associée à la requête est satisfaite par un résumé z, mais il reste possible qu’aucunrésultat ne soit trouvé dans le sous-arbre <strong>de</strong> racine z. Cette situation se présente typiquementlorsque le résumé dispose, sur un ou plusieurs attributs, <strong>de</strong> plus <strong>de</strong> <strong>de</strong>scripteurs que ceux <strong>de</strong> larequête : ∃ i, ∃ d ∈ L Ai (z) / d /∈ C i . Par exemple, pour Q 1 = DESCRIBE ON température,dureté WHERE épaisseur IN (fin, mince), la caractérisation C ep = {fin, mince} est satisfaitepar z 4 .ep = {1.0/fin + 0.8/mince + 0.4/moyen}.Dans une correspondance <strong>de</strong> ce type, il existe dans z au moins un <strong>de</strong>scripteur (moyen dansl’exemple) en plus <strong>de</strong>s caractères requis. L Ai (z) est un sur-ensemble <strong>de</strong> C i (fig. 2.1-d) ou tient