Archives de mars 2009
3 questions aux fondateurs du WSRI, avec Sir Tim Berners-Lee, Dame Wendy Hall, Nigel Shadbolt et Leslie Carr.
Le Web et le futur de l’éducation

Le centre Hellenic Cosmos le soir
La relation entre le web et l’éducation peut et doit être une association à bénéfice réciproque. Julia Minguillon, du département informatique et médias de l’Université Libre de Catalogne, nous le démontre à travers l’histoire et le futur de la rencontre entre web et éducation.
L’UOC, université qui propose uniquement de l’enseignement à distance, compte en 2009 34 000 étudiants, et propose des enseignements en catalan, espagnol et anglais débouchant sur 20 diplômes différents. En 1994, elle ne comptait que 200 étudiants pour 2 diplômes. Ces chiffres reflètent les changements énormes qui ont eu lieu durant ces 15 dernières années.
Pendant longtemps, le e-learning a été vu comme un parent pauvre des systèmes d’éducation classiques. De moindre qualité, l’enseignement à distance permet ce “apprendre quand je veux, où je veux” ; l’étudiant classique a une quarantaine d’année, a un emploi. Il reçoit des contenus, mais il est isolé, et n’a pas d’interactions avec des professeurs ou d’autres étudiants.
Désormais, grâce à l’apparition du web 2.0, le statut du e-learning a changé. Il s’appelle désormais web-based learning. Les mots d’ordre en sont : personnalisation, abondance de contenu, liberté. L’interaction est placée au coeur de l’apprentissage. Cette direction est promue par le processus de Bologne (qui vise à créer une European Higher Education Area).
Dans le futur, les ressources pour l’éducation seront disponibles pour tous. L’apprentissage sera centré sur la capacité à créer des liens entre les objets (c’est le connectivisme). Le méta-apprentissage, c’est à dire l’ “apprendre à apprendre” deviendra essentiel. Et l’apprentissage devra se faire tout au long de la vie.
Minguillon mentionne (trop) rapidement le fait que c’est la technologie qui permet l’apparition de ces nouvelles formes d’apprentissage. Au delà de ce rôle passif de permission, je crois que la technologie est surtout une formidable force d’entraînement. C’est peut être l’observation de nouveaux usages sur internet (construction collaborative de savoirs et d’outils, vagabondage et sérendipité, évaluation collective des contenus) qui permet aujourd’hui la réactivation des théories sur l’”apprentissage actif” ou “métaapprentissage” (voir par exemple le knowledge building). Si l’on considère également les capacités d’accueil limitées des universités classiques, et l’afflux massif de nouveaux étudiants* dans les prochaines années dans les pays en développement, il devient évident que nous devons dès maintenant prendre un tournant radical et imaginer de nouvelles formes d’éducation utilisant à plein les possibilités du web.
* Un petit chiffre calculé à la louche : en France, d’après le ministère, environ 1.78 millions de personnes sont engagées dans des études supérieures (environ 1 habitant sur 40). En Inde, c’est le cas de seulement une personne sur 100 (il y a 10 millions d’étudiants Indiens répartis dans plus de 300 universités). Dans une vingtaine d’année, si l’Inde a atteint un niveau de développement comparable au nôtre, elle comptera 40 millions d’étudiants (1 sur 40 de ses 1.5 milliards d’habitants). Ce seront donc 30 millions de nouveaux étudiants auxquels l’Inde devra faire face. Si les systèmes d’éducation ne changent pas, alors l’Inde devra construire une université à la capacité d’accueil de 30000 étudiants toutes les semaines pendant les 20 prochaines années.
“Athens, what a place to start a discipline”
C’est par cette citation que Nigel Shadbolt, founding director de la Web Science Research Initiative, a lancé la journée de jeudi.
A la fin de la journée, lors de la présentation de posters, nous avons eu la chance d’interviewer Nigel Shadbolt :
Folksonomy et web sémantique : convergence ?
La table-ronde “Tags and Search” de Web Science’09 a tenu toutes ses promesses. En réunissant des papiers portant sur le tagging et d’autres proposant des modèles de recherche d’information dans les réseaux sociaux à partir d’outils du web sémantique, les organisateurs ont choisit de ne pas ignorer les oppositions de stratégies de recherche qui fondent l’intérêt de l’espace interdisciplinaire des web science. Ces deux démarches sont-elles conciliables ? Parlent-elles de la même chose ? Comment articuler le désordre assumé de la folksonomy et le souci d’amélioration (et de rationalisation) des recherches du web sémantique ? De fait, les papiers proposés cherchent tous à porter des améliorations aux formes simples, efficaces, mais aussi désordonnées, redondantes et parfois très insatisfaisantes de la folksonomy. Mais, à l’évidence, les chemins pris pour faciliter cette convergence sont très différents.
Le papier proposé par les universités de Southampton et de Postdam propose une première piste d’articulation très respectueuse du fonctionnement de la folksonomy. Il s’agit simplement d’améliorer les techniques d’identification des meilleurs taggeurs. Ching-man Au Yeung, Michael Noll, Nicholas Gibbins, Christoph Meinel et Nigel Shadbolt (“On Measuring Expertise in Collaborative Tagging Systems”) proposent un algorithme dont l’ambition est limitée, mais qui paraît très performant. Ils suggèrent une solution assez élégante pour distinguer les experts dans une population de taggueurs. Ces derniers, soulignent-ils, ne se définissent pas seulement par le nombre de tags attribués à des articles de bonne qualité, mais par la capacité de l’expert à être un des premiers à découvrir et à valoriser les documents de qualité. Ils proposent un algorithme permettant d’identifier différents types d’experts et de spammeurs (SPEAR : SPamming-resistant Expertise Analysis and Ranking). A partir d’une évaluation expérimentale d’un échantillon de tags de del.icous, les auteurs montrent que leur algorithme permet de distinguer les experts (et surtout différentes formes d’expertise) mais aussi d’isoler les spammers. Leurs outils permet donc de produire un tri et un ordonnancement entre les taggeurs d’un document et de rendre beaucoup plus pertinente et riche la recherche des meilleurs annotateurs de bons documents.
C’est en revanche une toute autre stratégie que déploient Alexandre Passant, Matthias Samwald, John G. Breslin et Stefan Decker de l’université de Galway, ce haut lieu de la recherche européenne en web sémantique, et l’Institute for Evolution and Cognition Research autrichien. Il s’agit cette fois de poser sur les réseaux sociaux une architecture intégrant un ensemble d’outils “légers” du web sémantique construit autour de l’architecture RDF/OWL. A travers la construction de Social Semantic Information Spaces (SSIS), l’ambition des auteurs est rien moins que de créer un “Interlinked Online Information Society” en fédérant les informations extraites des réseaux sociaux.
Le système proposé fait converger les différents langages du web sémantique en y intégrant des modèles adaptés à la capture des réseaux sociaux sur le web comme FOAF ou SIOC (Semantically-Interlinked On-line Communities ontology développé à Gallway). Le développement rapide de l’initiative du “Web of Data” visant à connecter entre elles de grandes bases de connaissance publiques pour les mettre au format RDF rend ainsi envisageable un déploiement enfin consistant des outils du web sémantique. C’est en tout cas ce que les auteurs espèrent…
Reste beaucoup de questions en suspend. Les tenants de ce projet de généralisation des machines du web sémantique vers les plateformes du web 2.0 font comme si les réseaux sociaux étaient un système d’information à rechercher (ce qui se conçoit bien, notamment pour les réseaux sociaux d’entreprise). Mais, à bien y regarder, il est probable que l’on trouve plus de conversations que d’informations dans les réseaux sociaux et il n’est pas du tout sûr que la demande des utilisateurs soient d’augmenter la capacité de moteur de recherche plus “intelligent” à les retrouver, eux et leurs productions.
Suivre Websci09 sur Internet
Quand on assiste avec assiduité aux keynotes, posters / papers sessions et autre panels qui se tiennent en ce moment même à la conférence Websci09, on se retrouve vite dans un flux d’informations qui se croisent, s’entremêlent, se répondent et parfois se répètent. En ce qui me concerne, et si je pouvais utiliser un tag pour linker/lier la plupart des présentations abordées depuis le début de la matinée, ça serait privacy.
En effet, à l’issue des présentations auxquelles j’ai assisté aujourd’hui, persiste le sentiment que c’est un, sinon l’objet (frontière) central dans ce que l’on nomme communément Webscience. Pourquoi ? Je ne saurais le dire avec précision ici, il faudrait pouvoir bénéficier de plus de temps pour reprendre les différents key points relevés par les spécialistes du sujet et autres éminences du web thinking. Je constate simplement que le concept de privacy fait inéluctablement référence au mix “web, pouvoir”. En témoigne l’intitulé du legal panel “What can web science do for the privacy of data subjects ? Law, privacy and data retention in a post 9/11 world ?”. Dans lequel, sans vouloir réduire les propos des intervenants, nous reviendrons sur chaque présentations ultérieurement, le concept de privacy suggère une question simple relevée par plusieurs intervenants : de quelle société voulons nous ? Et plus précisément dans le cadre de la conférence actuelle, en quoi la science du web va-t-elle contribuer à construire la société dans laquelle nous voulons vivre ?
Voilà, je vous ai fait pzrt de quelques unes de mes impressions sur la matinée, au départ je tenais simplement à vous informer que l’on pouvait suivre des éléments de la conférence sur twitter à partir du hashtag #websci09 (cf.illustration ci-dessous et cliquer sur l’image pour voir le live)
Grâce au hashtag j’ai découvert des videos qui font écho de ce qu’il se passe ici ainsi qu’un site qui diffuse la conférence en streaming (pas encore eu le temps de tester).
Le marché de la religion et l’effet “longue traîne”
Le web modère-t-il ou favorise-t-il les opinions extrémistes ? Depuis le livre de Cas Sunstein, Republic.com, ce débat sous-tend de nombreuses recherches des chercheurs en sciences politiques qui se préoccupent du web. Kieron O’Hara de l’université de Southampton et David Stevens de l’université de Nottingham reviennent sur cette question dans un papier présenté à Web Science’09 en prenant l’extrémisme religieux comme fil rouge. Cette question, expliquent les auteurs, peut être reformulé dans les termes d’un débat entre Hume et Smith. Le premier soutenait qu’un marché libre des croyances favoriserait les opinions extrêmes, puisque les nouveaux entrants pour se faire remarquer et attirer des pratiquants doivent développer des formules extrêmes et différenciantes. A l’inverse, Adam Smith dans La richesse des nations soutenait qu’une libéralisation du marché religieux favoriserait la modération et la domination des religions centrales et modérées. Les religions non-établies dans un marché ouvert doivent se policer pour entrer en relations compétitives avec leurs rivales.
O’Hara et Stevens plongent ce vieux débat dans le modèle de la “longue traîne” développée par Chris Anderson. En abaissant fortement les coûts de l’engagement extrémiste, le web favoriserait (c’était la thèse de Cas Sunstein) les opinions extrêmes et les petites communautés sectaires. Le web offrirait ainsi plus de visibilité aux niches religieuses sectaires, tout en maintenant une centralité forte aux marques religieuses à forte notoriété. L’exercice proposé par les auteurs est habile et séduisant, même s’ils n’apportent aucune vérification empirique.
Ils proposent cependant une hypothèse originale. En s’appuyant sur l’idée (avancée dans les débats sur la longue traîne par Salganik et al) que les systèmes de recommandation “centralisent” le marché alors que l’absence de recommandation entre usagers allonge la traîne, les auteurs soutiennent que toute mise en discussion des idées des groupes religieux sectaires (incluant des liens vers leur site) contribuent à les réduire. C’est souvent parce qu’ils parviennent à s’isoler dans une “niche” fermée sans contact et point de comparaison avec les autres marques religieuses présentes sur le marché que les sectes parviennent à prospérer… Conclusion, il suffirait d’installer un système de recommandation de croyances basés sur du filtrage collaboratif pour réduire à peu de chagrin les sectes les plus illuminées !
Tim Berners Lee a la pêche

On l’a vu en vrai, Tim Berners-Lee, inventeur du web. Dans la grande salle de conférence du Hellenic Cosmos, devant le président grec, le ministre de la culture, le gratin athénien et les participants de websci09, il a parlé pendant une heure du Web, depuis son invention jusqu’à la création de la “World Wide Web Foundation” en 2008.
Son discours était bien rodé, il parlait vite, parfois il bafouillait un peu, en tout cas il avait l’air très excité par son sujet. “10 puissance 11 pages web, imaginez, autant que de neurones dans un cerveau humain. Maintenant, on boit un verre de vin, le nombre de neurones diminue. Le web, lui, grandit, et grandit de plus en plus vite”.
Il a conclu son discours en parlant de la webfoundation, qui a pour but de promouvoir un web “libre et ouvert”.
Enfin, il a grimpé les escaliers de l’auditorium quatre à quatre pour tendre son micro à l’auditeur qui a posé la première question (“est-ce que l’on crée un Big Brother ?”).
Après les questions, le président de la république héllénique s’en va, suivi par une bonne partie de l’auditoire. Il nous reste une présentation de Josep Sifakis, puis le cocktail de bienvenue … brochettes, boulettes de viande, vin blanc grec et discussions…

Comprendre l’impact du web sur la littérature scientifique (une synthèse de l’après-midi)
Ce qu’il faut souligner, c’est la très grande variété des préoccupations des uns et des autres: de la dimension cognitive de l’outil, aux inquiétudes d’une doctorante quant à la diffusion de ses idées, une tentative de synthétiser toutes ces idées…
Idéalement, cet outil devrait rendre disponibles toutes les productions scientifiques, directement, sans délai, sans distinction de lieu, et gratuitement, cela change le rapport du scientifique à sa production. Une visée de court terme (on écrit un papier, puis un autre, et on s’empresse d’oublier les premiers),une pensée autour de questions simplifiées, conçues pour être traitées en un papier, etc.
Autre point crucial: le web rend lisible le réseau des publications scientifiques, les liens entre elles, définis à partir de données fondées sur le sens, le contenu des papiers, la connaissance produite elle-même. les relations qu’entretiennent les publications entre elles, un genre de réflexivité liée à la nature de l’outil de diffusion, n’est pas dénué de toute signification; elles peuvent avoir leur importance dans l’émergence de nouvelles idées, cet retracer les réseaux des publications peut aider…
D’un autre côté, les relations entre les publications scientifiques sont aussi (d’abord?) des relations entre humains, guidées par des liens affinitaires, des projets en cours: c’est un contexte particulier, très “réel”, non lisible directement dans le contenu des papiers et que pourtant il faut connaître dès que l’on prétend faire de la recherche: On peut donc dire que le web contribue à décontextualiser la production scientifique.
Le constat, aujourd’hui, c’est que l’on ne tire pas suffisamment profit des opportunités offertes par cet outil.
Il ne s’agit pas de privilégier un contexte sur l’autre, mais de devenir capable d’articuler ces deux choses. Concrètement, Leslie Carr ( de l’université de Southampton) propose une synthèse provocante et stimulante ( Why the web never took off in scholarly communication?) en s’interrogeant sur le cas des pages personnelles des chercheurs.
D’abord, il souligne que le Web change le rapport du scientifique à sa discipline, à la science. En rendant virtuellement toute la “littérature” scientifique d’un domaine accessible, on donne du crédit à l’idée qu’il existe quelque chose comme une littérature d’un domaine. En fait, cette chose ne va pas de soit; les productions scientifiques sont situées, dans le temps et dans l’espace, dans un contexte social. On produit du savoir en un temps en un lieu donné, avec des personnes données. Qu’il soit parfois utile de pouvoir dépasser ce contexte ne signifie pas qu’il faille à tout prix chercher à l’oublier.
Dans le cas des pages personnelles des chercheurs, il invite à la responsabilité. Sur le web, il ne s’agit pas seulement d’une logique de consommation (je souhaite atteindre facilement toutes les publications d’une personne) ou de promotion (il ne s’agit plus seulement de communiquer sur les contenus produits, mais de rendre accessibles ces mêmes contenus) ; c’est est un outil-projet participatif, c’est à chacun de veiller à l’accessibilité du contenu qu’il produit.
Précisément, les pages personnelles des chercheurs constituent le lieu privilégié où pourraient s’articuler ces deux contextes, réel et sémantique : il est très dommage qu’elles soient souvent délaissées…
Un entretien réconfortant avec Daniel Riera i Terren
Daniel Riera i Terren est professeur d’informatique à l’université ouverte de Catalogne. Il a créé il y a un an environ un cursus en “sciences du web”. Je trouve que son cursus est le programme le plus sincèrement interdisciplinaire qui ait été proposé jusqu’alors. “The technology behind the web”, “web analysis”, “web and social issues”, “e-learning”, “web, droit et gouvernance”. Tout semble y être. Daniel s’est directement inspiré de l’article “a framework for web science” pour son cursus de master.
En fait, c’est bien là que réside le problème : son cursus n’est pas encore habilité, et lui-même reconnait qu’il n’y a pas beaucoup de débouchés. Il veut créer un master pro : mais qui dit pro, dit spécialisation, or la web science est pour le moment un champ ouvert et divergent. Pour remédier à cela, trois spécialisations sont proposées en M2 : science et technologie, e-learning, et droit et gouvernance. Mais pourquoi quelqu’un qui veut faire, par exemple, du droit du numérique, perdrait-il son temps en M1 à s’intéresser à l’e-learning ou à l’”analyse du web” ?
Daniel espère lancer son master dans deux ans. Pour le moment, il propose un cours “web science” au sein d’un master en ingénierie et informatique.
François Blanquart
L’atelier “curriculum en sciences du web” : rien de très neuf

Rien de neuf, mais il faut dire que 16 participants seulement étaient prévus ; au lieu de ça, une soixantaine de personnes se sont retrouvées dans la salle de conférence du “Hellenic Cosmos” (centre culturel de la fondation du monde héllénique). La discussion est donc restée un peu superficielle, même si le moment où chacun des 10 projets de curriculum suggérés ont été présentés a été intéressant.
Le débat commence de façon très classique, par une opposition entre humanités et informatique. D’un côté, les informaticiens, attachés aux aspects techniques du web. Selon eux, on ne peut étudier le web sans comprendre la technique qui le sous-tend. Il faut comprendre le médium pour être capable de le concevoir. De l’autre côté, les sociologues, regroupés derrière le mot d’ordre « get rid of the geeky tech ! » lancé par Catherine Pope (organisatrice du débat).
Ce « either…or » est ensuite remplacé par un « either… and ». Selon une philosophe, les deux aspects doivent être articulés et un travail conceptuel est nécessaire pour associer les aspects techniques et les aspects sociaux du web.
Un autre courant se dessine, formé par les personnes venant du web sémantique et de l’intelligence artificielle. Deux aspects les motivent : il faut des outils pour comprendre, tirer du sens, rendre utilisable les vastes quantités de données présentes sur le web ; et il faut concevoir le web de demain (sous entendu le web sémantique).
A noter, une intervention amusante sur le thème « on n’a pas besoin de web science ». Le même débat pourrait avoir eu lieu il y a 3000 ans, en Mésopotamie. A cette époque, des discussions ont sans doute eu lieu pour créer une « writing science » ; selon l’intervenant, cette « writing science » n’a toujours pas été créée.
Enfin, le débat s’est fini sur une intervention de James Hendler visant à recentrer le débat sur la question des curriculums en Science du Web ; il ne faut pas oublier que nous avons besoin de former des gens qui comprennent le web et prédisent son futur ; des personnes par exemple capables de concevoir le facebook de demain (i.e., un meilleur facebook). En bref, des personnes capables de produire un web meilleur.
La suite du débat tourne autour de la question suivante : de quelle discipline voulons-nous nous débarrasser ?
Voici quelques interventions intéressantes suite à cette question, lancée par Cathy Pope :
- on n’a pas besoin de se débarrasser de quiconque, on doit réaliser une « fusion » entre les disciplines
- il faut se débarrasser de l’informatique : car les informaticiens sont dangereux, ils aiment les choses exactes, ils pensent qu’on peut modéliser tout et n’importe quoi. Alors que le web est une entité complexe, qui doit être comprise à travers le prisme des humanités.
- il faut trouver des emplois pour ces étudiants (remarque : une seule personne ici travaille dans une entreprise, les autres sont des universitaires)
- le web est un miroir du monde ; tout ce que nous faisons dans le monde, nous le faisons sur le web ; or il n’y a pas de curriculum sur « ce que nous faisons dans le monde » ; il faut emprunter une approche « constructiviste », écrire un agenda de recherche et se focaliser sur quelques questions.

