samedi, novembre 08, 2008

Dix Idées sur la structure des réseaux sociaux

Je suis en train de préparer un exposé sur les réseaux sociaux. Non pas dans le sens Facebook ou LinkedIn, mais au sens de la structure sous-jacente, que l'on l'étudie en tant que graphe ou du point de vue d'un sociologue.

Je m'intéresse aux réseaux sociaux depuis quelques années, ce qui est visible à travers les différents posts de ce blog. En revanche, il n'est pas toujours facile d'expliquer pourquoi je trouve cette nouvelle discipline scientifique, à la croisée de la théorie des graphes, de la sociologie expérimentale, de la physique théorique et de la psychologie de la communication, passionnante. Cette science a son journal « Social Networks », auquel je me suis récemment abonné, et son association INSNA.

Je me suis donc livré à l'exercice suivant : quelles sont les 10 choses les plus remarquables que j'ai lues, retenues et que j'utilise dans ma propre réflexion. C'est un exercice subjectif (à comparer avec Wikipédia) et doublement difficile : d'une part il est difficile de résumer un concept en quelques lignes, et d'autre part ces idées ne sont intéressantes que par ce que l'on peut en tirer, ce que je n'ai pas le temps de développer. Voici néanmoins ma liste :

  • Le concept le plus visible est la « structure des petits mondes » et sa mesure associée, celle de diamètre. Les réseaux sociaux ont des petits diamètres, par rapport à leur taille, ce qui se traduit souvent par le terme « degré de séparation ». Compte-tenu du fort degré de « clusterisation » (qui mesure la transitivité – du type « les amis de mes amis sont les amis »), c'est inattendu (alors que ce serait normal pour un graphe aléatoire).
  • Ce taux de « clusterisation » (la plupart des réseaux sociaux sont composés de petits groupes fortement connectés – « tout le monde connaît tout le monde ») est largement étudié et documenté. Ce taux de cluster s'explique par l'adage « qui se ressemble s'assemble » et justifie l'utilisation des réseaux sociaux pour calculer des prédictions d'appétence. Les quelques liens en dehors des clusters (les « liens faibles ») jouent donc un rôle essentiels (ce sont eux qui explique le faible diamètre) ce qui est avéré par des études de sociologie, comme celle de Granovetter.
  • Une autre surprise concerne la distribution des degrés dans les réseaux sociaux : cette distribution est presque toujours une distribution polynomiale (« power law ») alors qu'on pourrait attendre une gaussienne (obtenue pour des graphes aléatoires) ou une exponentielle (que l'on retrouve dans des structures physique obtenues par dégénérescence). On la retrouve d'ailleurs dans les graphes de préférence, c'est ce qui justifie l'équilibre économique de la « long tail ».
  • Les réseaux qui ont ce type de distribution des degrés sont appelés « scale-free » et ont des propriétés remarquables (par exemple, de robustesse). Ils sont caractéristiques d'un processus émergent et intelligent de sélection (cf. Buchanan). On les retrouve un peu partout : cooccurrence des mots dans le langage naturel, biologie moléculaire, etc.
  • Cette distribution engendre la présence de « nœuds connecteurs ». Les connecteurs jouent un rôle clé dans la transmission des informations, ce qui a été avéré par différents exemples en sociologie et popularisé par Malcom Gladwell dans « The Tipping Point ». Ce rôle de connecteur se caractérise avec la notion de centralité due à Linton Freeman. Les HP Labs ont fait des études passionnantes sur les logs des emails pour reconstruire les « communautés de pratiques » à partir de cette notion de centralité (un nœud central est un point focal des trajets de transfert d'information).
  • La recherche dans un réseau social est souvent complexe. La condition de Kleinberg permet de comprendre l'équilibre entre deux forces : si il n'y a pas assez de liens, les chemins sont difficiles à trouver, si il y en a trop, il y a tellement de chemins qu'il est très difficile de trouver le plus efficace. Un des points les plus intéressants est la réalisation que la « proximité n'est pas une distance » (essentiellement parce que la proximité dépend de critères multiples), ce qui rend la recherche d'un chemin « de proche en proche » difficile.
  • Les réseaux d'affiliation sont une forme de réseaux sociaux qui m'intéresse particulièrement puisqu'elle décrit la structure du « système réunion » d'une entreprise. Il se trouve qu'il existe également de nombreuses études sur ces réseaux (taux de clusterisation, degrés, etc.), dont celles, célèbres, sur les films et sur les conseils d'administration. Le point le plus important est qu'on retrouve les deux caractéristiques fondamentales : power law et fort taux de cluster (le terme français est « clique », qui désigne un sous-groupe fortement connecté).
  • Les réseaux sociaux se transforment en réseaux d'interaction si on ajoute la fréquence d'interaction comme valuation du graphe d'origine (ce qui est également valable pour les réseaux d'affiliation). Je ne m'étends pas puisque c'est un des sujets clés de ce blog.
  • Il existe des dimensions caractéristiques dans les processus d'interactions entre humains qui déterminent le comportement de certains réseaux sociaux. Un exemple est la célèbre limite de 150 personnes avec lesquelles nous pourrions entretenir des relations « signifiante », due à Robin Dunbar. Cette limite a des applications directes en termes d'organisation d'entreprise. On peut aussi citer les limites que l'on observe dans des situations de responsabilisation collectives (cf. the « Diner Dilemma » ou le syndrome du spectateur rapporté par Christian Morel). Dans le cas du diner dilemma (où les convives doivent choisir entre un plat raisonnable et un plat hors de prix), il y a une « transition de phase » entre un comportement responsable (choix raisonnable, puisque le total est partagé à la fin de façon identique) et un comportement irresponsable (dans l'espoir que ce choix est noyé dans l'anonymat), qui dépend du nombre de convive.
  • Pour terminer, un point clé tiré de CMC (Computer Mediated Communication) qui est un rappel de posts précédents : la communication n'est pas un simple transfert d'information, c'est un processus, un échange dans lequel trois dimensions sont fondamentales : l'affinité (entre les deux nœuds du social net J), l'engagement (« commitment ») et l'attention. Ce dernier point est un contre-point à tous les autres : il ne suffit pas de s'intéresser à la structure ! Une des limites des supports électroniques et un des intérêts du « contact réel » est cette capacité à transmettre et à s'ajuster à des signaux faibles (posture, expressions faciales, intonations, etc.)

Sans rentrer dans le détail, voici les sources principales pour ces 10 réflexions :

  • « Linked » de Albert-Laszlo Barabasi. Un must-read ! en particulier pour comprendre l'importance du concept de « scale-free », les liens avec l'émergence et la robustesse.
  • "Six Degrees" de Duncan Watts. Déjà mentionné moultes fois dans ce blog.
  • « Beyond Bandwidth: Dimensions of Connection in Interpersonal Communication » de B. Nardi (Journal of Computational Supported Cooperative Work (2005, 14 :91-130).
  • "Email as Spectroscopy: Automated Discovery of Community Structure within Organizations" de J. Tyler, D. Wikinson, B. Huberman. Du premier auteur, voir également "When can I expect an email response?"

1 commentaire:

  1. Hey thank you giving us brief ideas on social network sites and sociology....we are only limited to facebook and all so luking forward to see new blogs..........

    RépondreSupprimer