Folksonomy et web sémantique : convergence ?
La table-ronde “Tags and Search” de Web Science’09 a tenu toutes ses promesses. En réunissant des papiers portant sur le tagging et d’autres proposant des modèles de recherche d’information dans les réseaux sociaux à partir d’outils du web sémantique, les organisateurs ont choisit de ne pas ignorer les oppositions de stratégies de recherche qui fondent l’intérêt de l’espace interdisciplinaire des web science. Ces deux démarches sont-elles conciliables ? Parlent-elles de la même chose ? Comment articuler le désordre assumé de la folksonomy et le souci d’amélioration (et de rationalisation) des recherches du web sémantique ? De fait, les papiers proposés cherchent tous à porter des améliorations aux formes simples, efficaces, mais aussi désordonnées, redondantes et parfois très insatisfaisantes de la folksonomy. Mais, à l’évidence, les chemins pris pour faciliter cette convergence sont très différents.
Le papier proposé par les universités de Southampton et de Postdam propose une première piste d’articulation très respectueuse du fonctionnement de la folksonomy. Il s’agit simplement d’améliorer les techniques d’identification des meilleurs taggeurs. Ching-man Au Yeung, Michael Noll, Nicholas Gibbins, Christoph Meinel et Nigel Shadbolt (“On Measuring Expertise in Collaborative Tagging Systems”) proposent un algorithme dont l’ambition est limitée, mais qui paraît très performant. Ils suggèrent une solution assez élégante pour distinguer les experts dans une population de taggueurs. Ces derniers, soulignent-ils, ne se définissent pas seulement par le nombre de tags attribués à des articles de bonne qualité, mais par la capacité de l’expert à être un des premiers à découvrir et à valoriser les documents de qualité. Ils proposent un algorithme permettant d’identifier différents types d’experts et de spammeurs (SPEAR : SPamming-resistant Expertise Analysis and Ranking). A partir d’une évaluation expérimentale d’un échantillon de tags de del.icous, les auteurs montrent que leur algorithme permet de distinguer les experts (et surtout différentes formes d’expertise) mais aussi d’isoler les spammers. Leurs outils permet donc de produire un tri et un ordonnancement entre les taggeurs d’un document et de rendre beaucoup plus pertinente et riche la recherche des meilleurs annotateurs de bons documents.
C’est en revanche une toute autre stratégie que déploient Alexandre Passant, Matthias Samwald, John G. Breslin et Stefan Decker de l’université de Galway, ce haut lieu de la recherche européenne en web sémantique, et l’Institute for Evolution and Cognition Research autrichien. Il s’agit cette fois de poser sur les réseaux sociaux une architecture intégrant un ensemble d’outils “légers” du web sémantique construit autour de l’architecture RDF/OWL. A travers la construction de Social Semantic Information Spaces (SSIS), l’ambition des auteurs est rien moins que de créer un “Interlinked Online Information Society” en fédérant les informations extraites des réseaux sociaux.
Le système proposé fait converger les différents langages du web sémantique en y intégrant des modèles adaptés à la capture des réseaux sociaux sur le web comme FOAF ou SIOC (Semantically-Interlinked On-line Communities ontology développé à Gallway). Le développement rapide de l’initiative du “Web of Data” visant à connecter entre elles de grandes bases de connaissance publiques pour les mettre au format RDF rend ainsi envisageable un déploiement enfin consistant des outils du web sémantique. C’est en tout cas ce que les auteurs espèrent…
Reste beaucoup de questions en suspend. Les tenants de ce projet de généralisation des machines du web sémantique vers les plateformes du web 2.0 font comme si les réseaux sociaux étaient un système d’information à rechercher (ce qui se conçoit bien, notamment pour les réseaux sociaux d’entreprise). Mais, à bien y regarder, il est probable que l’on trouve plus de conversations que d’informations dans les réseaux sociaux et il n’est pas du tout sûr que la demande des utilisateurs soient d’augmenter la capacité de moteur de recherche plus “intelligent” à les retrouver, eux et leurs productions.

Dans le genre j’aime bien ce site, son schéma de positionnement et sa proposition :
http://triplify.org/Overview
daneelariantho
20 mars 2009 à 11:13
Chouettes commentaires ! Ça serait bien qu’il y ait plus de posts qui commentent des articles ou des présentations ; ça serait génial qu’il y ait des vidéos de la présentation.
Je pensais faire une présentation plus graphique du papier de Yeung & al.: ça vous intéresse ?
Bertil
31 mars 2009 à 4:33
@bertil
> nous avons quelques images de la présentation de Noshir Contractor, il y a vraiment du travail au montage, on verra
> oui tes présentations sont les bienvenues. Au delà de la conférence, nous allons probablement continuer à alimenter le blog sur la science du web.
ps: tu peux utiliser slideshare pour tes présentations, accompagné de tes notes ? enfin c’est juste une idée. A terme nous aimerions faire de ce blog un espace de publication collaboratif…
Mathieu
31 mars 2009 à 5:05
moi je pense faire quelques commentaires sur d’autres papiers, dès que j’ai le temps :)
François
31 mars 2009 à 5:07
[...] sémantique . MasterWebScience : Folksonomy et web sémantique : convergence ? Le sociologue Dominique Cardon, depuis la conférence WebScience09 qui se tenait à Athènes, [...]
A lire ailleurs du 27 mars au 3 avril 2009 | traffic-internet.net
3 avril 2009 à 1:52
[...] Le Rôle de l’Intégration de Données en Open Source. Une étude réalisée par Mark Madsen.MasterWebScience : Folksonomy et web sémantique : convergence ?Outil: TreeCloud : présentation en [...]
(pluri)TAL / ILPGA [U. Paris 3]
6 avril 2009 à 5:02