Approches Interdisciplinaires du Web

Suivez les évenements liés au projet de master AIW

Modélisation des réseaux sociaux de l’Internet

with one comment

Parmi les multiples papiers d’analyse des réseaux sociaux, on peut commencer par retenir quatre travaux exemplaires de ce qui se fait en la matière dans ICWSM.

L’argument développé par Indala Kahanda et Jennifer Neville de Purdue University est important. Leur idée est d’identifier les liens forts au sein du paquet indifférencié de ceux que nous appelons « amis » sur les plateformes relationnelles (« Using Transactional Information to Predict. Link Strength in Online Social Networks »). Ils montrent qu’il est possible de prédire les liens forts (mesurés dans leur analyse par le classement des « top friends » par l’utilisateur) à partir des événements transactionnels entre les utilisateurs (commenter une photo, être dans un groupe commun, écrire sur le wall). Pour démontrer la validité de cette méthode d’identification des liens forts, Indala Kahanda et Jennifer Neville testent quatre types de modélisation différents : la similarité des attributs (comparer des éléments communs du profil des utilisateurs), la connectivité topologique (le nombre d’amis en commun entre deux membres), la connectivité transactionnelle (le nombre de transactions (écrire sur le wall, être dans le même groupe, photos taggués) entre deux membres, et la dynamique de connectivité transactionnelle (le nombre de transactions entre deux membres relativement à l’ensemble des transactions avec le réseau de la personne). Les auteurs montrent que la dernière méthode donne les meilleurs résultats et offre une prédiction très pertinente de la force du lien entre deux utilisateurs. Ils appliquent leur modèle sur le réseau Facebook de l’université de Purdue composé de 56 061 utilisateurs ayant chacun en moyenne 46 amis et 81 en médiane. Parmi les meilleurs prédicteurs de la force du lien, c’est le fait d’écrire sur le wall d’un autre qui constitue le meilleur indicateur.

Une équipe de chercheurs de l’Université de l’Arizona (« A Social Identity Approach to Identify Familiar Strangers in a Social Network », Nitin Agarwal, Huan Liu, Sudheendra Murthy, Arunabha Sen, and Xufei Wang) propose un travail très algorithmique pour identifier les « familiar stranger » dans un grand réseau. Le « familiar stranger » est cet inconnu que vous croisez tous les jours dans le train sans lui adresser la parole mais qui est toujours en train de lire un livre que vous avez lu ou que vous aimeriez lire. Vous faites quotidiennement le même parcours, vous avez probablement les mêmes habitudes de lecture, il est probable que vous pourriez facilement sympathiser ou au moins tenir une conversation avec lui. Nitin Agarwal et al. proposent un algorithme qui, en dotant chaque nœuds d’un ensemble de propriétés dont on peut mesurer la similarité, permet d’identifier ces « familiar strangers » que l’on ne peut pas voir dans un réseau, parce qu’ils ne sont pas nos voisins.

Comment décider qu’un blog est « influential » ? Comment à l’intérieur d’une communauté de blogs thématiques, décider des blogs qu’il faut lire ? C’est à cette question que propose de répondre l’algorithme BlogRank développé à l’Université du Michigan par Ahmed Hassan et Dragomir Radev (« Content Based Recommendation and Summarization in the Blogosphere »). Leur idée est que l’on peut identifier et classer les meilleurs blogs sur un thème donné à partir de la similarité de contenu entre les posts de différents blogs. Cette sélection par le contenu est complétée par des informations permettant de mesurer le rythme et la fréquence des posts sur les blogs identifiés. Cette solution est plus efficace qu’un classement à partir d’algorithmes basés sur les liens (du type PageRank ou HITS) car les blogs ont un tissu de lien plus faible que les sites. Les auteurs ont expérimenté leurs outils sur un set de données du TREC Blog Track. Ce test montre que leur technique de ranking des blogs à partir de la similarité de contenu est performante.

Le papier certainement le plus novateur en matière de théorie des graphes est celui de Michaela Götz, Jure Leskovec, tout deux de l’université de Cornell, et de Mary McGlohon et Chsristos Faloutsos, de Carnegie Mellon. Il montre la très grande créativité de Jure Leskovec qui depuis quelques temps a publié un ensemble de travaux essentiels dans l’analyse de la dynamique des graphes. La présentation d’ICWSM propose la première modélisation de la dynamique des blogs qui parviennent à tenir ensemble propriétés topographiques et dynamiques. (« Modeling Blogs Dynamics »).  Cette modélisation (nommé ZC pour « Zero Crossing ») permet de créer automatiquement des réseaux dynamiques de blogs de grande échelle reproduisant quelques unes des propriétés principales de la blogosphère réelle : la distribution en loi de puissance des liens entrants, le principe d’attachement préférentiel (« richer get richer ») et la « burstiness » (explosivité) de la création des liens autour de certain nouveaux posts. Impossible de résumer ici l’algorithme des auteurs qui se lit très facilement (élégance et simplicité sont les principes revendiqués par les auteurs). Il suffit de dire que les auteurs distinguent deux types de réseaux, celui des blogs et celui des posts, et qu’ils proposent un arbre de parcours allant de la création d’un post vers sa citation par un autre selon des principes de choix.

à suivre…

Written by docardon

7 juin 2009 à 1:52

Publié dans Uncategorized

Tagged with

Une Réponse

Subscribe to comments with RSS.

  1. […] Modélisation des réseaux sociaux de l’Internet 7 Juin 2009 […]


Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :