top of page

La question Lumper/Splitter
Partie 2/3

Dans l’article précédent, nous nous penchions sur la question Lumper/Splitter appliquée à un paquet de 52 cartes, sans vraiment y apporter de réponse.

 

Une piste possible pour répondre à ce problème pourrait consister à délimiter des groupes de manière à ce que la variance intra-groupe soit significativement inférieure à la variance intergroupe. Ou pour le dire plus simplement, il s’agira de découper nos groupes de manière à ce que les membres de chaque groupe soient beaucoup plus proches les uns des autres que les différents groupes ne sont proches les uns des autres.

 

Cette approche semble toutefois plus indiquée pour des modes de classification reposant sur des éléments facilement quantifiables, comme le génome. Dans le cas de notre jeu de cartes, on se heurte rapidement à des difficultés : les cartes [cœur] sont-elles plus proches des cartes [carreau] que des cartes [pique] ? La dame de cœur est-elle plus proche de la dame de trèfle ou du roi de cœur ? Les [as] sont-ils plus proches des cartes [roi] que des [deux] ?

​

A elle toute seule, cette méthode n’apporte donc pas de réponse immédiatement claire à la question Lumper/Splitter. Mais il se pourrait bien qu’elle en soit une des pièces du puzzle.

​

Dans son ouvrage Les structures du hasard, Jean Louis Boursin, alors maître de conférences à la faculté des sciences d’Orléans, propose une résolution intéressante au « paradoxe du tas ». Ce paradoxe, qui repose sur une sémantique floue, peut s’énoncer ainsi :

​

Un tas de grains reste un tas si on lui enlève un grain. Donc, par récurrence, un grain unique est un tas de grains.

​

L’absurdité de cette conclusion illustre les problèmes qui peuvent émerger quand on tente d’employer un raisonnement formel inscrit dans une sémantique informelle. Selon Jean-Louis Boursin, « la seule réponse correcte au sophisme est statistique ». Il propose donc de faire un sondage en présentant des ensembles de grains aux participants, tout en leur demandant s’il s’agit, selon eux, d’un tas. Il serait alors possible d’en dégager la probabilité qu’un ensemble de grains soit perçu comme un tas par un individu tiré au hasard dans cette population en fonction du nombre de grains de l’ensemble.

​

La solution de Boursin est donc descriptive plutôt que normative, et en s’inspirant de cela il devient envisageable de définir nos catégories de cartes via une sorte de referendum : on s’adresse à un groupe et on demande à chaque membre sa distribution. Suite à quoi, on pourrait définir une sorte de « distance » entre deux cartes données : plus des cartes auront été mises fréquemment dans un même tas, plus on les considérera comme « proches ». La méthode de la variance redevient ainsi applicable.

​

On pourrait objecter que nous ne sommes plus ici en train d’apprendre quelque chose sur les cartes elles-mêmes, mais plutôt sur la perception et les catégories de pensée de tel ou tel groupe humain à propos de ces cartes. Mais qu’est-ce qui sépare ces cartes des autres morceaux de carton, sinon la perception que nous en avons ?

 

(à suivre…)

Posté le 31/10/2021

Tu veux t'abonner ?

Merci !

Les trucs de Boomy : des sciences humaines, d'autres trucs, et des mashups drôlement baths.

bottom of page