Share Luxembourg

Accès aux données

Procédure

Les données collectées sont disponibles pour l’ensemble de la communauté scientifique mondiale après enregistrement individuel.

Plus précisément, l'accès aux données SHARE est gratuit et celles-ci peuvent être utilisées à des fins de recherche scientifique, sous réserve d’être en conformité avec les lois et réglementations nationales et de l'Union européenne sur la protection des données et les conditions d'utilisation de SHARE, considérant que ces données ne sont pas utilisées à d'autres fins que celles de la recherche. Toute autre utilisation, telle qu'une utilisation commerciale des données, est exclue par principe.

Pour accéder aux données SHARE, trois étapes simples sont nécessaires :

Étape 1 : Lisez attentivement les conditions d'utilisation des données SHARE.

Étape 2 : Téléchargez, remplissez et signez la déclaration d'utilisation de SHARE.

Tous les candidats doivent remplir et signer la PAGE 1 de la déclaration d'utilisation de SHARE.

Le cas échéant, à la PAGE 1, il faut également fournir des preuves que le candidat est affilié à une institution scientifique, telle qu'une université ou un(e) institution/centre de recherche scientifique (pour plus de détails, voir les conditions d'utilisation). Si l'affiliation scientifique est démontrée (plus facilement par une adresse email valide de l'institution affiliée), l'accès sera accordé pour la durée de validité de l'affiliation.

La PAGE 2 de la déclaration d'utilisation de SHARE ne doit être remplie que si le demandeur n'a pas d'affiliation scientifique. Dans ce cas, l'accès ne peut être accordé que dans des cas justifiés pour un projet scientifique spécifique, à condition que le projet ait été décrit et que son caractère scientifique ait été démontré de manière suffisante conformément à cette page de la déclaration d'utilisation.

Si vous envisagez d'utiliser l'ensemble de données easySHARE à des fins d'enseignement, veuillez prendre note de la procédure de demande simplifiée. Elle offre aux "enseignants" un moyen pratique d'enregistrer tous les participants au cours en tant qu'utilisateurs réguliers de SHARE en même temps et leur permet de distribuer les données easySHARE à leurs "étudiants". Pour utiliser les données easySHARE à des fins d'enseignement, il suffit de remplir et de signer la déclaration de l'enseignant easySHARE.

Étape 3 : Soumettre la ou les déclaration(s) complétée(s) et signée(s) par courrier électronique ou postal au Centre de données de recherche SHARE :

SHARE Research Data Center
c/o Centerdata Université de Tilburg
Boîte postale 90153 5000
LE Tilburg
Pays-Bas
Courriel : share-rdc@centerdata.nl

L'accès aux données ne sera accordé qu'après réception des documents requis. Veillez à ne fournir que des informations véridiques et à jour.

Une fois les informations d'identification acceptées (normalement dans un délai de quelques jours ouvrables), l'accès aux données SHARE se fera très facilement via le site web du Centre de données de recherche SHARE en entrant un identifiant personnel et un mot de passe.

Condition d'usage

En signant la déclaration préalable, l’utilisateur s’engage sur les points suivants :

Seul l’utilisateur est autorisé à exploiter les données. Ce dernier n’a pas le droit de copier les données. De même, il n’est pas autorisé à les transmettre à une autre personne. Toute autre personne désirant utiliser les données doit contacter le CentERdata pour obtenir un accès personnel.
Conformément aux conditions d'utilisation de SHARE régissant l'utilisation des données SHARE, une mention contenant les informations suivantes doit être incluse dans toutes les publications utilisant lesdites données : « This paper uses data from SHARE Waves 1, 2, 3, 4, 5, 6, 7, 8 and 9 (DOIs: 10.6103/SHARE.w1.800, 10.6103/SHARE.w2.800, 10.6103/SHARE.w3.800, 10.6103/SHARE.w4.800, 10.6103/SHARE.w5.800, 10.6103/SHARE.w6.800, 10.6103/SHARE.w7.800, 10.6103/SHARE.w8.800, 10.6103/SHARE.w8ca.800, 10.6103/SHARE.w9ca800) see Börsch-Supan et al. (2013) for methodological details.(1) The SHARE data collection has been funded by the European Commission, DG RTD through FP5 (QLK6-CT-2001-00360), FP6 (SHARE-I3: RII-CT-2006-062193, COMPARE: CIT5-CT-2005-028857, SHARELIFE: CIT4-CT-2006-028812), FP7 (SHARE-PREP: GA N°211909, SHARE-LEAP: GA N°227822, SHARE M4: GA N°261982, DASISH: GA N°283646) and Horizon 2020 (SHARE-DEV3: GA N°676536, SHARE-COHESION: GA N°870628, SERISS: GA N°654221, SSHOC: GA N°823782, SHARE-COVID19: GA N°101015924) and by DG Employment, Social Affairs & Inclusion through VS 2015/0195, VS 2016/0135, VS 2018/0285, VS 2019/0332, and VS 2020/0313. Additional funding from the German Ministry of Education and Research, the Max Planck Society for the Advancement of Science, the U.S. National Institute on Aging (U01_AG09740-13S2, P01_AG005842, P01_AG08291, P30_AG12815, R21_AG025169, Y1-AG-4553-01, IAG_BSR06-11, OGHA_04-064, HHSN271201300071C, RAG052527A) and from various national funding sources is gratefully acknowledged (see www.share-project.org).”.

EasySHARE est destiné à la formation des étudiants et à l'enseignement. Pour les publications scientifiques, il est recommandé d'utiliser le jeu de données principal de SHARE, ou d'étudier attentivement la documentation easySHARE (PDF) et le programme Stata qui extrait et génère easySHARE à partir de la version principale de SHARE. Si les données easySHARE sont utilisées pour des thèses ou d'autres publications scientifiques, la mention supplémentaire suivante doit être incluse : « This paper uses data from the generated easySHARE data set (DOI: 10.6103/SHARE.easy.800), see Gruber et al. (2014) for methodological details. The easySHARE release 8.0.0 is based on SHARE Waves 1, 2, 3, 4, 5, 6, 7 and 8 (DOIs: 10.6103/SHARE.w1.800, 10.6103/SHARE.w2.800, 10.6103/SHARE.w3.800, 10.6103/SHARE.w4.800, 10.6103/SHARE.w5.800, 10.6103/SHARE.w6.800, 10.6103/SHARE.w7.800, 10.6103/SHARE.w8.800).”

Enfin, la mention supplémentaire suivante doit être incluse lors de la publication avec les données du panel d'épisodes d'emploi SHARE : « This paper uses data from the generated Job Episodes Panel (DOI: 10.6103/SHARE.jep.800), see Brugiavini et al. (2019) for methodological details. The Job Episodes Panel release 8.0.0 is based on SHARE Waves 3 and 7 (DOIs: 10.6103/SHARE.w3.800, 10.6103/SHARE.w7.800)”.

Si les informations fournies dans ces paragraphes font déjà partie du texte d'une publication scientifique, il n'est pas nécessaire de les inclure à nouveau dans les remerciements. En revanche, l'information sur le financement de la collecte de données SHARE est obligatoire dans tous les cas.
Conformément aux conditions d'utilisation de SHARE, outre la reconnaissance de la collecte de données et des principales sources de financement de la collecte de données SHARE, les utilisateurs sont également tenus de citer les ensembles de données utilisés et d'inclure la littérature de base sur la recherche et la méthodologie SHARE dans la bibliographie correspondant à l'ensemble de données qu'ils ont utilisé dans la publication.

Tout d'abord, il est obligatoire de citer les données utilisées pour la publication. Comme il n'existe pas encore de normes générales de citation pour les ensembles de données, une citation basée sur le schéma de métadonnées da|ra(2) est recommandée, ce qui est également conforme à la norme recommandée par DataCite(3) : « Börsch-Supan, A. (2022). Survey of Health, Ageing and Retirement in Europe (SHARE) Wave 1. Release version: 8.0.0. SHARE-ERIC. Data set. DOI: 10.6103/SHARE.w1.800 »
Par ailleurs, il est demandé aux auteurs d'envoyer par e-mail (info@share-project.org) à l'équipe de coordination SHARE, les références de tous les rapports, les documents de travail (working papers), les articles et les livres, lorsque ceux-ci utilisent les données SHARE.

En signant la déclaration, le demandeur sera systématiquement ajouté aux utilisateurs de SHARE et accepte de recevoir des informations sur les mises à jour des données via e-mail.

En cas de doute sur l’utilisation purement scientifique des données par l’utilisateur, le coordinateur décidera de la révocation du mot de passe et si des actions judiciaires doivent être entreprises à l’encontre de cet utilisateur.

haut de page

Utilisation des données

Les fichiers

Les données collectées au cours des enquêtes sont fournies aux formats STATA et SPSS.

Elles sont restituées dans différents fichiers correspondant aux modules de l’enquête, soit pour la Vague 5 par exemple : 26 fichiers pour 26 modules. Chaque fichier comprend systématiquement les données individuelles détaillées pour l’ensemble des individus ayant participé à l’enquête dans les différents pays européens participants et en Israël.

A ces fichiers s’ajoute la partie intitulée Coverscreen (composition du ménage). Celle-ci donne lieu à la création de deux fichiers : CV-H au niveau ménage et CV-R au niveau individuel contenant l’ensemble des individus éligibles. Toutes ces données sont fournies de manière anonyme, chaque individu possédant un identifiant ménage (hhid) et individuel (mergeid).

Les répondants

Au cours de l’enquête, un « proxy », c’est-à-dire une personne proche de la personne enquêtée (famille, ami ou autre), peut répondre à la place du répondant principal. Le proxy est autorisé pour l’ensemble des modules exception faite des modules CF (fonction cognitives), MH (santé mentale), GS (test de force), WS (marche), AC (activités), EX (attentes), CS (test de levé), PF (test de souffle) et BS (test sanguin).

Un proxy est également requis pour la réalisation des interviews de « fin de vie ».

En sus du proxy, plusieurs membres de la famille peuvent également répondre à l’enquête. La détermination du nombre de répondants dépend de la composition familiale des ménages. Au total, trois types de répondants sont identifiés :

Le répondant ménage : celui-ci est défini au début du premier entretien individuel. Ce répondant renseigne les questions concernant le ménage dans son ensemble, soit HH (revenu du ménage), HO (logement) et CO (consommation). Il est identifié par la variable « dumhhr ».
Le répondant famille : il s’agit de la personne qui a répondu en premier dans un couple. Il répond au module CH (enfants) et au début du module SP (SP001 à SP017 – aide sociale). Il est identifié par la variable « dumfamr » qui est une variable fictive.
Le répondant financier : ce dernier répondant est défini avant le début du module DN du premier entretien individuel. Il répond aux modules FT (transferts financiers) et AS (actifs financiers). Il est identifié par la variable « dumfinr ».

Les variables

A la clôture de chaque vague d’enquêtes, plus de 700 variables sont restituées dans les différents fichiers. L’ensemble de ces variables est harmonisé de manière ex-ante et ex-post. Au final, chaque fichier contient :

Des variables communes : chaque module dispose d’identifiants et de variables communes : mergeid, hhid, hhid1, hhid2, country, waveid, split, language, cvid ;
Des variables spécifiques : chaque question posée conduit à la création d’une variable. Toutes les variables sont identifiées par un code constitué d’une abréviation à deux caractères (précisant le nom du module en anglais) et d’un nombre à 3 chiffres (identifiant la question). Par exemple, la variable « FT002 » correspond à la question « 002 » du module « FT – Transferts financiers ».

En sus de ces variables, un codage spécifique est créé pour :

Les questions en boucle : certaines questions sont posées plusieurs fois, notamment lorsque le répondant a plusieurs enfants. Dans ce cas, le code de la variable reprend l’identification habituelle (Section + Numéro de question) à laquelle est ajoutée une valeur incrémentée. Par exemple, la variable CH510_2 correspond au niveau de formation du deuxième enfant du répondant.
Les questions à choix multiples : chaque variable correspond à une modalité de réponse à la question. Par exemple, la variable « PH010d3 » correspond à la troisième modalité de réponse de la question PH010. Ces variables sont des variables binaires indiquant si oui (1) ou non (0) le répondant a sélectionné cette réponse.

Par ailleurs, le caractère longitudinal de l’enquête induit de nombreux filtres dans le but d’alléger l’enquête. Ainsi, les questions relatives aux caractéristiques démographiques, aux conditions de logements, à la situation professionnelle ne sont pas posées aux personnes ayant déjà été interrogées lors d’une vague précédente. De plus, certaines questions du questionnaire SHARE sont filtrées suivant les réponses fournies aux questions précédentes (âge du répondant, résidence ou non en maison de retraite, etc.). Ces filtres peuvent générer un nombre important de valeurs non-renseignées dans les fichiers. Aussi, il est nécessaire de fusionner les différentes vagues d’enquêtes pour rapporter les informations collectées précédemment.

Enfin, la diversité des systèmes nationaux, notamment sur les prestations ou aides perçues, les types de contrat de travail ou encore sur les études suivies fournissent des résultats non comparables sans traitement supplémentaire.

Conseils pour l’utilisation des données

Les données téléchargées sont livrées brutes. Aussi, SHARE conseille d’utiliser la procédure SHARETOM (programme STATA) développée par l’équipe du MEA. Ce programme permet de transformer certaines valeurs associées aux valeurs manquantes (-1 pour « Ne sait pas » par exemple) en codes qui ne rentrent pas dans le calcul des statistiques (.a pour « Ne sait pas »).

D’autre part, plusieurs jeux de pondérations sont téléchargeables avec les données de chaque vague. Ils garantissent la représentativité des données dans la population et permettent d’effectuer des analyses transversales ou longitudinales des données au niveau ménage ou individuel. Ces pondérations sont nécessaires pour s’assurer que les informations sont représentatives des différentes populations concernées et elles permettent d’effectuer des interprétations sur ces populations. Pour le Luxembourg, par exemple, les données finales sont représentatives par genre et par âge.

Pour obtenir des informations détaillées sur la méthodologie et l’utilisation des fichiers de données, vous pouvez consulter les guides intitulés « Release Guide » disponibles pour chacune des vagues de l’enquête. Ces guides sont accessibles à l’adresse suivante : www.share-project.org (Data Access & Documentation > Documentation).

EasyShare

EasyShare offre une base de données simplifiée pour la formation des étudiants et l’usage des chercheurs qui ont peu d'expérience dans les analyses quantitatives de données d'enquêtes complexes. Alors que la sortie principale de SHARE est stockée dans plus de 100 fichiers de données simples, EasyShare stocke les informations pour l'ensemble des répondants et pour toutes les vagues de collecte dans un seul ensemble de données. Ainsi, la complexité des bases a été considérablement réduite. Par exemple :

L'information recueillie seulement pour une personne d'un couple ou d’une famille a été transférée à tous les répondants respectifs.
Les informations recueillies lors du premier entretien ont été transférées sur toutes les entrevues ultérieures.
Le codage des valeurs manquantes a été enrichi afin d’offrir une compréhension plus facile du routage et du filtrage des interviews.

En outre, plusieurs analyses de variables ont été ajoutées, tels que les indices de santé, les données démographiques ou les mesures économiques. Enfin, les mesures comparables ont été sélectionnées ou recodées pour faciliter les analyses comparatives avec l'étude sur la santé et la retraite des États-Unis (HRS).

Un guide EasyShare documente les bases de données et toutes les variables. Il fournit des instructions de base sur la façon de travailler avec les données. Ces dernières sont fournies sous deux formats : SPSS et Stata.

Toutes les personnes enregistrées comme utilisateur SHARE peuvent accéder à EasyShare. Ceux qui souhaitent utiliser EasyShare à des fins d'enseignement peuvent faire une demande (cf Accès aux données).

haut de page

Documentation sur les données

Release guides

Questionnaires

SHARE Corona-2

Documents méthodologiques

Données et informations complémentaires

Données complémentaires

haut de page

Accès rapide

Accès aux données
Utilisation des données
Documentation sur les données