Photo by Alexandre Perotto on Unsplash
Publié à l’origine en espagnol: «De los apellidos de los catalanes». Maia Güell et Sevi Rodríguez-Mora. Nada es gratis.
22.09.2015
On entend couramment parler d’un aspect ethnique du conflit politique catalan, qui aurait à voir avec la phonétique des noms de famille. Etant donné la situation politique difficile que nous vivons à l’heure actuelle, il nous semble utile de faire attention aux données et de vérifier ce qu’il y a de vrai dans cette affaire. A cette fin nous trouvons utile de faire référence à une publication scientifique [1] récente dans laquelle nous développons une méthodologie de l’usage des noms de famille permettant de mesurer la mobilité sociale inter générationnelle (à savoir, la probabilité qu’un pauvre devienne riche et vice versa), compte tenu des aspects ethniques et socio-économiques. Et tout cela avec des données catalanes.
Mobilité sociale
Mesurer l’évolution de la mobilité intergénérationnelle est une tâche difficile car les données qui mettent en relation les membres de plusieurs générations pour un ensemble statistiquement représentatif des familles sont rares. Notre travail surmonte ce problème en utilisant les noms de famille comme marqueur de l’historique de chaque famille.
Notre méthode mesure la mobilité sociale, qui est un phénomène intrinsèquement dynamique, en observant uniquement une photo statique de la société. Nous pouvons le faire dans la mesure où les effets dynamiques impriment des traces reconnaissables sur la photo, de la même manière que la vitesse d’une voiture rend son image plus ou moins claire.
Le plus il y a une incidence de ce qui est hérité sur le bien-être des individus (c’est-à-dire, le moins il y a de mobilité sociale), le plus ce que les membres d’une famille partagent (leur héritage commun) est important face aux vicissitudes de la vie. En conséquence, le moins il y a de mobilité, le plus il y aura des similitudes entre les revenus et le niveau éducatif des membres d’une même famille par rapport à un ensemble d’individus choisi de manière aléatoire. Connaissant les degrés de parenté entre les membres d’une population, il serait donc aisé de déterminer le niveau de mobilité. Nous ne connaissons pas ces degrés de parenté, mais nous avons accès aux noms de famille.
Ce n’est pas qu’un nom de famille particulier nous rend plus ou moins riche, mais le nom de famille fait partie de notre héritage, de la même manière que d’autres caractéristiques déterminantes pour le bien-être futur des enfants, comme les gènes, la richesse, le niveau d’éducation, l’ethnicité ou le patrimoine culturel des parents. Dans cet article nous montrons que la distribution des noms de famille d’une population établit une partition de la société qui est informative du degré de parenté, dans la mesure où elle établit une relation directe entre le contenu informatif des noms de famille et le niveau intergénérationnel : le moins de mobilité, le plus un nom de famille nous en dit sur les caractéristiques de celui qui le porte.
Certains noms de famille sont très fréquents, et donc les personnes qui le partagent ne sont que rarement des membres de la même famille. Dans ces cas, on ne peut pas en obtenir d’informations utiles. Cependant, beaucoup de noms de famille sont très rares : dans ces cas, deux personnes qui le portent ont des fortes chances d’appartenir à la même famille. Le plus la mobilité sociale est réduite, le plus le niveau d’éducation de ceux qui partagent un nom de famille peu fréquent sera semblable. En d’autres mots, la quantité d’information contenue dans le nom de famille sera relativement plus élevée.
On définit le contenu informatif des noms de famille (Informational content of surnames: ICS) comme [2] le “R carré” d’une régression du niveau d’éducation de chaque individu sur une variable « dummy » pour chaque nom de famille. Il s’agit d’une mesure de «combien de plus » nous savons sur une personne du fait de connaître son nom de famille. On développe ensuite un modèle dont la variable endogène est la distribution jointe de revenu et les noms de famille, avec deux variables exogènes (1) un processus de génération d’outcomes (revenu, éducation, n’importe), qui est en grande mesure déterminé par l’importance de l’héritage ; et (2) un processus [3] de génération et destruction de noms de famille (qui a lieu généralement suite à la mort du dernier mâle sans descendance masculine, et la création par des mutations aléatoires). Le résultat méthodologique principal de cet article est de démontrer que le plus l’importance de l’héritage sur le processus de génération de revenus est élevé, le plus on observera un ICS élevé. Ainsi, l’évolution temporelle de l’ICS pourra nous dire si l’importance de ce qui est hérité a augmenté ou diminué dans le temps.
Ethnicité
Un nom de famille contient non seulement de l’information concernant le niveau d’éducation d’une famille, mais aussi sur son ethnicité. Si, pour une raison ou une autre, l’ethnicité venait à avoir un impact direct sur le niveau d’éducation des personnes (de manière indépendante à l’éducation des parents), nous aimerions distinguer entre ces deux effets. Heureusement, cela est possible grâce justement aux noms de famille, même si nous n’avions pas d’information directe sur l’ethnicité des personnes.
On définit la “catalanité” d’un nom de famille comme le pourcentage d’espagnols avec ce même nom de famille qui habitent en Catalogne.
Un nom de famille qui est tout aussi commun en Catalogne que dans le reste du pays aura une valeur de 0,16 (le pourcentage de la population catalane en Espagne). Un autre, relativement peu commun en Catalogne, aurait une valeur inférieure, tandis qu’un nom de famille relativement plus commun en Catalogne aura une valeur supérieure. Si tous les espagnols avec un nom de famille donné habitent en Catalogne, la valeur de l’indice sera de 1.
Le recensement officiel nous montre la province de naissance et le niveau de connaissance de la langue catalane. Dans cet article nous démontrerons que la « catalanité » du nom de famille est un excellent prédicteur de ces deux variables, ce qui suggère qu’il s’agit d’un bon proxy de l’ethnicité.
Par exemple, dans le graphique suivant, le panel (a) montre comment la “catalanité” du nom de famille est corrélée avec la probabilité de répondre que l’on connaît bien la langue catalane pour la cohorte d’individus nés dans la région de Barcelone entre 1945 et 1950 et (b) à la probabilité d’être né en Catalogne pour la cohorte née entre 1935 et 1940.
L’ethnicité, tout comme le revenu, est en partie héritée (en fait, combien on en hérite dépend du niveau d’appariement sélectif, mais on parlera de cela dans la suite de cet article), et donc cela a un impact sur l’héritage et la mobilité sociale.
Notre objectif est tout d’abord de mesurer l’évolution de la mobilité sociale en Catalogne (sans distinguer en quelle proportion cela est dû à l’éducation des parents ou à leur ethnicité), et ensuite mesurer séparément l’évolution des effets de l’éducation paternelle et de l’ethnie.
L’évolution de la mobilité sociale et ses composantes en Catalogne
Tout d’abord nous mesurons l’évolution de l’ICS total sans conditionner entre les effets familiers et les effets ethniques. De fait, ceci est en réalité ce qu’on appelle mobilité sociale, puisque tant l’ethnicité comme les conditions familiales sont héritables. Nous trouvons qu’en Catalogne les noms de famille contiennent aujourd’hui plus d’information que dans le passé, ce qui suggère une forte chute séculaire de la mobilité intergénérationnelle.
Le graphique suivant nous montre la quantité d’information sur l’éducation d’une personne qui est contenue dans son premier nom de famille (ICS), pour une moyenne mobile de toutes les cohortes de population de l’année 2000. Le point le plus à gauche nous montre l’ICS de ceux qui avaient alors entre 75 et 100 ans, celui immédiatement à droite celui des qui avaient entre 70 et 95, et ainsi de suite.[4]
Connaître le nom de famille d’une personne est beaucoup plus informatif sur le niveau d’éducation d’un jeune que sur celui d’un vieux (en relation à ses cohortes respectives). Ceci est le cas car ce qui est héritable est plus important pour la détermination du revenu des jeunes que des vieux. La mobilité sociale a chuté de manière séculaire en Catalogne. Cela dit, nous ne pouvons à ce stade pas dire si cela est dû à l’éducation des parents ou à la langue parlée à la maison, mais ce qui est claire est que l’appartenance à l’un ou l’autre des groupes ethnolinguistiques est important. Les familles catalanophones sont en termes moyens mieux éduquées. Une augmentation de l’écart-type du degré de catalanité implique en moyenne 6 mois d’éducation en plus sans prendre en compte l’effet du revenu familial, et 4 quand on contrôle pour cette variable.
Nous pouvons ensuite mesurer séparément l’évolution de la composante ethnique (origine familial catalan mesuré à travers la catalanité du nom de famille) de la composante familiale (deux familles avec le même niveau d’ethnicité mais différents niveaux de revenu ou d’éducation).[5]
Nous trouvons que l’incidence de ces deux effets a augmenté dans le temps. En d’autres mots, non seulement la famille d’origine est plus importante, mais la valeur d’avoir une ethnicité « plus catalane » est à ce jour plus grande qu’il y a une ou deux générations.
La Figure (a) ci-dessous montre la valeur de l’ICS du premier nom de famille, conditionné par l’indice de catalanité du second pour toutes les cohortes. Cela nous montre que le niveau d’éducation de la famille est de plus en plus important pour la détermination de celui d’un individu, et ce indépendamment de la langue parlée à la maison.
Par exemple, comparons d’un côté deux jeunes, avec le même degré de catalanité, et de l’autre deux vieux (de nouveau avec le même degré de catalanité). La position relative des deux jeunes sera beaucoup plus affectée par l’éducation de ses parents que celle des vieux.
La Figure (b), quant à elle, montre la valeur du paramètre qui détermine l’incidence du degré de “catalanité” conditionné par l’éducation de la famille. Avoir un nom de famille plus catalan « offre » plus d’années d’éducation à un jeune aujourd’hui comparé à l’avantage perçu auparavant par un vieux. Si l’on considéré deux familles avec le même niveau d’éducation, mais l’une plus catalane que l’autre, la différence espérée sur le niveau d’éducation des enfants est plus grande si les familles sont jeune que si elles sont vieilles.
L’appariement sélectif
Jusqu’ici nous n’avons pas dit pourquoi la mobilité intergénérationnelle a baissé. Au contraire, nous n’avons que constaté cette chute. En général, trouver des causes est compliqué. Cependant, la convention espagnole pour les noms de famille (cette merveilleuse idée qui consiste à maintenir celui du père et de la mère pour toute la vie) nous permet d’observer un évènement capable de trouver une explication à cette diminution de la mobilité.
Tout d’abord, nous devons prendre en compte qu’une des causes potentielles de cette baisse de la mobilité est une augmentation de l’appariement sélectif. Pour cela il suffirait que les deux parents aient une influence sur l’enfant. Si appariement très sélectif il y a, nous aurions les «bonnes » familles exerçant une forte influence positive sur l’enfant, et le contraire pour les « mauvaises » familles. Mais si au contraire il y a peu d’appariement, l’ethnicité elle-même se dilue rapidement. Seulement à travers un appariement sélectif est-il possible de maintenir une variable ethnique identifiable au sens statistique, et par conséquent aussi les effets sur le revenu et l’éducation.
Ce que nous pouvons faire est d’analyser à quel point se rassemblent le premier et second nom de famille de chaque personne tant en termes tant d’éducation comme de son ethnicité. Nous trouvons que tout au long du XXème siècle, en Catalogne, les individus se marient de plus en plus sélectivement tant en termes éducatifs (par exemple, les universitaires se marient de plus en plus avec d’autres universitaires), comme en termes de région d’origine. En conséquence, la diminution de la mobilité intergénérationnelle que nous trouvons se doit très probablement à l’augmentation de l’appariement sélectif : il y a ainsi plus à hériter. Dans la figure ci-dessous la ligne rouge dessine la corrélation entre le degré de catalanité du premier et du second nom de famille de ceux qui sont nés dans chacune des cohortes, alors que la ligne bleue nous montre la corrélation de l’éducation moyenne de chaque nom de famille. Ceci nous apporte de l’information concernant le degré d’appariement sélectif des parents de ces personnes. En d’autres mots, l’augmentation de l’appariement sélectif eut lieu une génération avant la chute de la mobilité dont nous avons parlé, et en est la cause.
Manifestation politiques des asymétries socio-culturelles
Cela étant clarifié, nous adressons maintenant l’aspect ethnique, celui dont beaucoup en parlent, souvent en chuchotant. Il nous semble, à la lumière des données, qu’il existe en Catalogne une hétérogénéité ethnolinguistique substantielle qui se traduit dans des différences statistiques en éducation (et probablement revenu) qui ont augmenté dans le temps. Fort probablement, ceci est au moins en partie dû à l’augmentation séculaire de l’appariement sélectif tant dans sa dimension socioéconomique (les riches avec les riches), comme dans sa dimension ethnique (les plus catalans avec les plus catalans). Ces conclusions sont bien entendu limitées aux données dont nous disposons.
De fait, s’il y a bien quelque chose de caractéristique dans la morphologie sociale catalane est justement cette hétérogénéité.
Etant donné le contexte, et malgré que notre recherche publiée ne l’étudie pas directement, il semble intéressant de se demander si cette asymétrie culturelle et économique a une manifestation politique en Catalogne.
Il s’agit bien évidement d’un sujet désagréable dont personne ne veut en parler…et pourtant une révision superficielle tant de la distribution des noms de familles des dirigeants des différents courants politiques, comme de la géographie de la distribution des voix, suggère fortement que cela pourrait très bien être le cas. Nous ne pouvons pas rentrer dans le détail du sujet (pour cela nous devrions voir comment la composante ethnique a un effet différent de celui de l’éducation sur le comportement électoral), mais il est possible de regarder un aspect surprenant de la structure politique catalane qui n’est probablement pas Independent de la réalité politique.
Dans un livre extraordinaire,[6] indispensable pour comprendre ne fut-ce qu’un peu le côté apparemment surréaliste de la politique catalane actuelle, le politologue de Cambridge Thomas Jeffrey Miley comparait il y a environ 10 ans les paramètres socio-économiques et culturels des élites catalanes avec ceux de la population en général, trouvant un abîme terrifiant. Les élites sont fort semblables à ce qu’il appelle la « communauté ethnolinguistique » catalanophone et ne rassemblent en rien à la communauté hispanophone, pourtant majoritaire dans la société.
Nous utilisons notre méthodologie pour montrer que cela n’a pas changé depuis. L’indice de catalanité moyen des noms de famille de tous les catalans est de 0,37. Si nous le comparons à celui des membres du Gouvernement (0,59), à celui des hauts-fonctionnaires (0,59), à celui des membres du CATN [7], ou à celui de l’ensemble des membres du Parlement (0,55), il est évident que dans un sens statistique les élites sont beaucoup plus « catalanes » que la population catalane elle-même. Les élites ne sont donc pas représentatives. C’est le même résultat qu’avait obtenu Miley : en termes politiques il y a un seul groupe culturel en Catalogne.
Ainsi, l’évidence nous montre qu’en Catalogne coexistent (i) des profondes et croissantes divisions socio-économiques associées à la diversité ethnolinguistique et (ii) des structures politiques qui, pour une raison ou pour une autre, résultent en une surreprésentation massive du groupe social dominant.
Matière à réflexion.
[1] Maia Güell, José V. Rodríguez Mora y Christopher I. Telmer “The Informational Content of Surnames, the Evolution of Intergenerational Mobility, and Assortative Mating” Review of Economic Studies (2015) 82 (2): 693-735, 2014 doi:10.1093/restud/rdu041
[2] En fait, la réalité es un peu plus compliquée mais ceci permet de comprendre l’essentielle. Vous pouvez lire les articles pour comprendre les détails.
[3] Le modèle est équivalent à un modèle d’héritage génétique sans selection naturelle (de l’ADN qui ne codifie pas les protéines).
[4] Notre univers est composé de tous les mâles agés de 25 ans ou plus, nés en Espagne et résidents en Catalogne en 2001.
[5] Nous utilisons le premier nom de famille comme proxy de l’éducation familiale, et le second comme proxy de catalanité, mais les résultats sont les mêmes si nous le faisons à l’invers ou avec d’autres combinaisons.
[6] “Nacionalismo y política lingüística: El caso de Cataluña”. Madrid, Centre d’Etudes Politiques et Constitutionnels , 2006
[7] Consell Assessor per a la “Transició” Nacional.