Mesures de similarité sémantique

return to the website
by Marie-Aude Aufaure, Omar Boussaïd, Pascale Kuntz
Abstract:
De nombreuses applications ont besoin de mesurer le degré de similarité entre termes ou concepts. Parmi ces applications, nous pouvons citer la recherche d’information, l’indexation de documents, le résumé automatique de textes ou encore l’alignement ou l’extraction d’ontologies. Le choix d’une bonne mesure est important puisqu’il aura une grande influence sur la pertinence des résultats obtenus. Les mesures de similarité dédiées aux textes peuvent être basées sur la notion de co-occurrence ainsi que sur celle de contexte. Celles dédiées aux ontologies sont divisées en deux grandes familles : les mesures basées sur les arcs, donc sur la notion de profondeur, et celles basées sur les nøe uds, donc sur le contenu informationnel des concepts, et peuvent ou non prendre en considération un corpus textuel associé. Une question qui se pose est d’étendre ces mesures à d’autres structures comme par exemple les treillis de Galois pour faciliter la navigation dans de grands treillis en déterminant le plus proche voisinage d’un concept. L’introduction de la notion de contexte est fondamentale pour améliorer la qualité des résultats obtenus. Par exemple, dans le cas de l’extraction d’ontologies à partir de pages web, le contexte pourra être représenté par la structure des pages, et ainsi permettre d’accorder un poids aux mots en fonction de leur position dans le texte. Un deuxième exemple est celui des applications où l’on recherche une proximité spatiale et où la sémantique peut jouer un rôle prépondérant. L’objectif de cet atelier est donc de faire le point sur les recherches en cours dans ce domaine. Il se veut un lieu de rencontre et d’échange et restera ouvert, permettant de présenter un travail abouti comme des réflexions sur le domaine ou des travaux préliminaires. L’atelier sera constitué d’une série de présentations orales, de posters et de démonstration de logiciels. La durée prévue est d’une journée. Les articles seront soumis au comité de lecture pour en améliorer la qualité et donner des conseils aux auteurs. La présentation de travaux de doctorants sera privilégiée. Une place sera également réservée à la présentation des équipes et de travaux de synthèse dans le domaine. L’objectif est de mettre en place un groupe de travail couvrant cette thématique de recherche.
Reference:
Mesures de similarité sémantique (Marie-Aude Aufaure, Omar Boussaïd, Pascale Kuntz), 2008.
Bibtex Entry:
@book{Extraction2008,
abstract = {De nombreuses applications ont besoin de mesurer le degr\'{e} de similarit\'{e} entre termes ou concepts. Parmi ces applications, nous pouvons citer la recherche d’information, l’indexation de documents, le r\'{e}sum\'{e} automatique de textes ou encore l’alignement ou l’extraction d’ontologies. Le choix d’une bonne mesure est important puisqu’il aura une grande influence sur la pertinence des r\'{e}sultats obtenus. Les mesures de similarit\'{e} d\'{e}di\'{e}es aux textes peuvent \^{e}tre bas\'{e}es sur la notion de co-occurrence ainsi que sur celle de contexte. Celles d\'{e}di\'{e}es aux ontologies sont divis\'{e}es en deux grandes familles : les mesures bas\'{e}es sur les arcs, donc sur la notion de profondeur, et celles bas\'{e}es sur les n\oe uds, donc sur le contenu informationnel des concepts, et peuvent ou non prendre en consid\'{e}ration un corpus textuel associ\'{e}. Une question qui se pose est d’\'{e}tendre ces mesures \`{a} d’autres structures comme par exemple les treillis de Galois pour faciliter la navigation dans de grands treillis en d\'{e}terminant le plus proche voisinage d’un concept. L’introduction de la notion de contexte est fondamentale pour am\'{e}liorer la qualit\'{e} des r\'{e}sultats obtenus. Par exemple, dans le cas de l’extraction d’ontologies \`{a} partir de pages web, le contexte pourra \^{e}tre repr\'{e}sent\'{e} par la structure des pages, et ainsi permettre d’accorder un poids aux mots en fonction de leur position dans le texte. Un deuxi\`{e}me exemple est celui des applications o\`{u} l’on recherche une proximit\'{e} spatiale et o\`{u} la s\'{e}mantique peut jouer un r\^{o}le pr\'{e}pond\'{e}rant. L’objectif de cet atelier est donc de faire le point sur les recherches en cours dans ce domaine. Il se veut un lieu de rencontre et d’\'{e}change et restera ouvert, permettant de pr\'{e}senter un travail abouti comme des r\'{e}flexions sur le domaine ou des travaux pr\'{e}liminaires. L’atelier sera constitu\'{e} d’une s\'{e}rie de pr\'{e}sentations orales, de posters et de d\'{e}monstration de logiciels. La dur\'{e}e pr\'{e}vue est d’une journ\'{e}e. Les articles seront soumis au comit\'{e} de lecture pour en am\'{e}liorer la qualit\'{e} et donner des conseils aux auteurs. La pr\'{e}sentation de travaux de doctorants sera privil\'{e}gi\'{e}e. Une place sera \'{e}galement r\'{e}serv\'{e}e \`{a} la pr\'{e}sentation des \'{e}quipes et de travaux de synth\`{e}se dans le domaine. L’objectif est de mettre en place un groupe de travail couvrant cette th\'{e}matique de recherche.},
author = {Aufaure, Marie-Aude and Boussa\"{\i}d, Omar and Kuntz, Pascale},
booktitle = {8\`{e}mes Journ\'{e}es Francophones Extraction et Gestion des Connaissances},
keywords = {SML-LIB-BIBLIO,lang:FR},
mendeley-tags = {SML-LIB-BIBLIO,lang:FR},
title = {{Mesures de similarit\'{e} s\'{e}mantique}},
year = {2008}
}
Powered by bibtexbrowser