Accès aux données

Actuellement, les données SHARE des Vagues 1 à 7 sont disponibles (2004-2017). Pour le Luxembourg, seules les données des Vagues 5, 6 et 7 sont actuellement disponibles.

Les données pour l'ensemble des pays sont destinées à la recherche scientifique. Les personnes désirant utiliser ces données doivent être affiliés à un institut de recherche.

Le CentERdata, hébergé par l'Université de Tilburg aux Pays-Bas, a la responsabilité du stockage des données. Il suit les critères du German Council for Social and Economic Data concernant l’accès aux données.

Aussi, pour en disposer, la procédure prévoit que :

  1. Le demandeur renseigne une déclaration préalable qu’il adresse par télécopie ou par courrier au :
    CentERdata
    P.O. Box 90153
    5000 LE Tilburg
    The Netherlands
    Fax + 31 13 466 2764.
  2. Le CentERdata retourne un "username" et un "password" permettant de télécharger les données.

En signant la déclaration préalable, l’utilisateur s’engage sur les points suivants :

  1. Seul l’utilisateur est autorisé à exploiter les données. Ce dernier n’a pas le droit de copier les données. De même, il n’est pas autorisé à les transmettre à une autre personne. Toute autre personne désirant utiliser les données doit contacter le CentERdata pour obtenir un accès personnel.
  2. Pour chaque usage des données SHARE, la mention de la source doit être précisée sur le travail. Pour cela, il convient de mentionner : « This paper uses data from SHARE Waves 1, 2, 3, 4, 5, 6, 7 and 8 (DOIs: 10.6103/SHARE.w1.710, 10.6103/SHARE.w2.710, 10.6103/SHARE.w3.710, 10.6103/SHARE.w4.710, 10.6103/SHARE.w5.710, 10.6103/SHARE.w6.710, 10.6103/SHARE.w7.711, 10.6103/SHARE.w8cabeta.00), see Börsch-Supan et al. (2013) for methodological details.

    La collecte des données SHARE est financée par la Commission européenne à travers les programmes FP5 (QLK6-CT-2001-00360), FP6 (SHARE-I3 : RII-CT-2006-062193, COMPARE : CIT5-CT-2005-028857, SHARELIFE : CIT4-CT-2006-028812), FP7 (SHARE-PREP : GA N°211909, SHARE-LEAP : GA N°227822, SHARE M4 : GA N°261982, DASISH : GA N°283646) et Horizon 2020 (SHARE-DEV3 : GA N°676536, SHARE-COHESION : GA N°870628, SERISS : GA N°654221, SSHOC : GA N°823782), ainsi que par la DG Emploi, Affaires sociales et Inclusion. Un financement supplémentaire provient de l’Institut National Américain sur le Vieillissement (U01 AG09740-13S2, P01 AG005842, P01 AG08291, P30 AG12815, R21 AG025169, Y1-AG-4553-01, IAG BSR06-11 et AHOG 04-064), du Ministère Allemand de l’Education et de la Recherche, ainsi que du Ministère Luxembourgeois de la Recherche et de l’Enseignement Supérieur (voir www.share-project.org). »
  3. Par ailleurs, il est demandé aux auteurs d'envoyer par mail (info@share-project.org), à l'équipe de coordination SHARE, les références de tous les documents de travail (working papers), de tous les articles et de tous les livres lorsque ceux-ci utilisent les données SHARE.

En signant la déclaration, le demandeur sera systématiquement ajouté aux utilisateurs de SHARE et il accepte de recevoir des informations sur les mises à jour des données via e-mail.

En cas de doute sur l’utilisation purement scientifique des données par l’utilisateur, le coordinateur décidera de la révocation du mot de passe et si des actions judiciaires doivent être entreprises à l’encontre de cet utilisateur.

haut de page

Utilisation des données

Les fichiers

Les données collectées au cours des enquêtes sont fournies aux formats STATA et SPSS.

Elles sont restituées dans différents fichiers correspondant aux modules de l’enquête, soit pour la Vague 5 par exemple : 26 fichiers pour 26 modules. Chaque fichier comprend systématiquement les données individuelles détaillées pour l’ensemble des individus ayant participé à l’enquête dans les différents pays européens de SHARE.

A ces fichiers s’ajoute la partie intitulée Coverscreen (composition du ménage). Celle-ci donne lieu à la création de deux fichiers : CV-H au niveau ménage et CV-R au niveau individuel contenant l’ensemble des individus éligibles. Toutes ces données sont fournies de manière anonyme, chaque individu possédant un identifiant ménage (hhid) et individuel (mergeid).

Les répondants

Au cours de l’enquête, un « Proxy », c’est-à-dire une personne proche de la personne enquêtée (famille, ami, etc.), peut répondre à la place du répondant principal. Le proxy est autorisé pour l’ensemble des modules exception faite des modules CF (fonction cognitives), MH (santé mentale), GS (test de force), WS (marche), AC (activités), EX (attentes), CS (test de levé), PF (test de souffle) et BS (test sanguin).

Un proxy est également requis pour la réalisation des interviews de « fin de vie ».

En sus du proxy, plusieurs membres de la famille peuvent également répondre à l’enquête. La détermination du nombre de répondants dépend de la composition familiale des ménages. Au total, trois types de répondants sont identifiés :

  • Le répondant ménage : celui-ci est défini au début du premier entretien individuel. Ce répondant renseigne les questions concernant le ménage dans son ensemble, soit HH (Revenu du ménage), HO (Logement) et CO (consommation). Il est identifié par la variable « dumhhr ».
  • Le répondant famille : il s’agit de la personne qui a répondu en premier dans un couple. Il répond au module CH (enfants) et au début du module SP (SP001 à SP017 – aide sociale). Il est identifié par la variable « dumfamr » qui est une variable fictive.
  • Le répondant financier : ce dernier répondant est défini avant le début du module DN du premier entretien individuel. Il répond aux modules FT (transferts financiers) et AS (actifs financiers). Il est identifié par la variable « dumfinr ».

Les variables

A la clôture de chaque vague d’enquête, plus de 700 variables sont restituées dans les différents fichiers. L’ensemble de ces variables est harmonisé de manière ex-ante et ex-post. Au résultat, chaque fichier contient :

  • Des variables communes : chaque module dispose d’identifiants et de variables communes : mergeid, hhid, hhid1, hhid2, country, waveid, split, language, cvid ;
  • Des variables spécifiques : chaque question posée conduit à la création d’une variable. Toutes les variables sont identifiées par un code constitué d’une abréviation à deux caractères (précisant le nom du module en anglais) et d’un nombre à 3 chiffres (identifiant la question). Par exemple, la variable « FT002 » correspond à la question « 002 » du module « FT – Transferts financiers ».

En sus de ces variables, un codage spécifique est créé pour :

  • Les questions en boucle : certaines questions sont posées plusieurs fois, notamment lorsque le répondant a plusieurs enfants. Dans ce cas, le code de la variable reprend l’identification habituelle (Section + Numéro de question) à laquelle est ajoutée une valeur incrémentée. Par exemple, la variable CH510_2 correspond au niveau de formation du deuxième enfant du répondant.
  • Les questions à choix multiples : chaque variable correspond à une modalité de réponse à la question. Par exemple, la variable « PH010d3 » correspond à la troisième modalité de réponse de la question PH010. Ces variables sont des variables binaires indiquant si oui (1) ou non (0) le répondant a sélectionné cette réponse.

Par ailleurs, le caractère longitudinal de l’enquête induit de nombreux filtres dans le but d’alléger l’enquête. Ainsi, les questions relatives aux caractéristiques démographiques, aux conditions de logements, à la situation professionnelle ne sont pas posées aux personnes ayant déjà été interrogées lors d’une Vague précédente. De plus, certaines questions du questionnaire SHARE sont filtrées suivant les réponses fournies aux questions précédentes (âge du répondant, résidence ou non en maison de retraite, etc.). Ces filtres peuvent générer un nombre important de valeurs non-renseignées dans les fichiers. Aussi, il est nécessaire de fusionner les différentes vagues d’enquête pour rapporter les informations collectées précédemment.

Enfin, la diversité des systèmes nationaux, notamment sur les prestations ou aides perçues, les types de contrat de travail ou encore sur les études suivies fournissent des résultats non comparables sans traitement supplémentaire.

Pour une information détaillée sur chaque variable, vous pouvez consultez le dictionnaire des codes.

Conseils pour l’utilisation des données

Les données téléchargées sont livrées brutes. Aussi, SHARE conseille d’utiliser la procédure SHARETOM (programme STATA) développée par l’équipe du MEA. Ce programme permet de transformer certaines valeurs associées aux valeurs manquantes (-1 pour « Ne sait pas » par exemple) en codes qui ne rentrent pas dans le calcul des statistiques (.a pour « Ne sait pas »).

D’autre part, plusieurs jeux de pondérations sont téléchargeables avec les données de chaque vague. Ils garantissent la représentativité des données dans la population et permettent d’effectuer des analyses transversales ou longitudinales des données au niveau ménage ou individuel. Ces pondérations sont nécessaires pour s’assurer que les informations sont représentatives des différentes populations concernées et elles permettent d’effectuer des interprétations sur ces populations. Pour le Luxembourg, par exemple, les données finales sont représentatives par genre et par âge.

Pour obtenir des informations détaillées sur la méthodologie et l’utilisation des fichiers de données, vous pouvez consulter les guides intitulés « Release Guide » disponibles pour chacune des vagues de l’enquête. Ces guides sont accessibles à l’adresse suivante : www.share-project.org (Data Access & Documentation > Documentation).

Un dictionnaire des codes décrivant les questions, filtres et données de la vague 5 est également disponible.

EasyShare

EasyShare offre une base de données simplifiée pour la formation des étudiants et l’usage des chercheurs qui ont peu d'expérience dans les analyses quantitatives de données d'enquêtes complexes. Alors que la sortie principale de SHARE est stockée dans plus de 100 fichiers de données simples, EasyShare stocke les informations pour l'ensemble des répondants et pour toutes les vagues de collecte dans un seul ensemble de données. Ainsi, la complexité des bases a été considérablement réduite. Par exemple :

  • L'information recueillie seulement pour une personne d'un couple ou d’une famille a été transférée à tous les répondants respectifs.
  • Les informations recueillies lors du premier entretien ont été transférées sur toutes les entrevues ultérieures.
  • Le codage des valeurs manquantes a été enrichi afin d’offrir une compréhension plus facile du routage et du filtrage des interviews.

En outre, plusieurs analyses de variables ont été ajoutées, tels que les indices de santé, les données démographiques ou les mesures économiques. Enfin, les mesures comparables ont été sélectionnées ou recodées pour faciliter les analyses comparatives avec l'étude sur la santé et la retraite des États-Unis (HRS).

Un guide EasyShare documente les bases données et toutes les variables. Il fournit des instructions de base sur la façon de travailler avec les données en utilisant à partir des logiciels (SPSS et Stata).

Toutes les personnes enregistrées comme utilisateur SHARE peuvent accéder à EasyShare. Ceux qui souhaitent utiliser EasyShare à des fins d'enseignement peuvent faire une demande. Cette procédure est incluse dans le téléchargement des données et peut être téléchargée ici.

haut de page

Documentation sur les données

Documentation des vagues 1 et 2

Documentation de la vague 3 (SHARELIFE)

Documentation de la vague 4

Documentation de la vague 5

Documentation de la vague 6

Documentation de la vague 7

Documentation de la vague 8

Documentation de l’enquête SHARE-COVID-19

Documentation EasySHare

Documents généraux

haut de page