• Không có kết quả nào được tìm thấy

Analyse des données

Trong tài liệu Université d’été en Sciences Sociales 2008 (Trang 178-182)

[Jean-Pierre Cling]

Avez-vous des questions suite à la journée d’hier et en particulier la dernière présentation d’introduction aux données de Mireille ? Il semble que vous vous soyez d’ores et déjà bien familiarisés avec l’ensemble des variables proposées.

Le programme de la journée s’articulera comme suit : - une première partie de matinée sera consacrée

à une réflexion sur « comment analyser les données ? » ;

- puis en seconde partie, nous vous livrerons les données afin que vous puissiez travailler par vous-même sur vos ordinateurs.

Hier, vous avez eu une présentation des techniques d’analyse de données – analyse en composante principale, technique de classification, etc –, et de certains résultats des données de l’enquête VHLSS sur le Việt Nam. Il est important à présent de s’intéresser aux questions que l’on va se poser pour analyser les trois fichiers de données : ménages, actifs occupés et unités de production.

On vous propose de vous partager en groupe de deux ou trois personnes et de réfléchir sur ce que l’on voudrait analyser : quelles questions se poser ? quelles sont les hypothèses ? quels sont les regroupements existants ou qui sont à faire entre les catégories de ménage ? quelles variables actives et complémentaires considérer ?

Exemple. On a abordé dans la journée de lundi le secteur informel. Comment analyser les caracté-ristiques de ce secteur à partir des trois fichiers et des techniques présentées ?

Thèmes d’analyse et approches proposées par les différents groupes

Les stagiaires travaillent en groupe durant une demi-heure avec l’appui des formateurs selon une trame commune de questions :

1- Quelles hypothèses ?

2- Quelle population de référence ? 3- Quelle méthode (ACP, ACM, etc) ?

4- Quelles variables (actives, supplémentaires) ? 5- Quels sont les résultats attendus ?

Les groupes proposent selon le cadre proposé des exemples d’analyse.

Objet Hypothèses/résultats 

attendus Population Méthode Variables

Groupe 1 Revenus du

travail Revenus urbains plus élevés ; les salariés du secteur public sont mieux payés

Individus / Population active occupée

ACM Actives : revenu du travail, régions, urbain rural

Supplémentaires : sexe, âge, secteur institutionnel

Groupe 2 Économie familiale et urbanisation

Caractéristiques de l’exportation de la main d’œuvre à l’étranger

8 régions économiques du Việt Nam

ACP Actives : revenu du travail, revenu des unités de production formel, revenu des dividendes, revenu des transferts, revenu foncier

Supplémentaires : sexe du chef de ménage, taille du ménage, région Groupe 3 Revenus des

ménages Les travailleurs du secteur formel sont mieux rémunérés ; le niveau d’éducation du chef de ménage influe sur le revenu

Ménages ACP Actives : secteur institutionnel, revenu total des ménages, type de travail, type de revenu

Supplémentaires : rural, urbain, taille des ménages

Groupe 4 Marché du travail et secteur informel

La population active dans le secteur informel est elle plutôt féminine ? Le niveau d’éducation et le revenu sont-ils faibles ?

Actifs

occupés ACM Actives : variables recodées de 64 à 92 (éducation, âge, secteur institutionnel, durée de travail), caractéristiques des individus et des ménages

Supplémentaires :

[François Roubaud]

Nous avons entendu toutes les propositions des équipes ; nous allons à présent discuter des questions et problèmes que cela pose.

[Marie Piron]

J’aimerais apporter deux précisions. Tout d’abord, lorsque l’on aborde l’analyse des revenus (ACM) il est important de garder en mémoire que l’on travaillera sur des revenus décomposés en classe. Ensuite, il faut raisonner en variables thématiques c’est-à-dire des variables regroupées dans certains thèmes.

Les variables actives proposées ici me semblent un peu trop disparates, hétérogènes.

[François Roubaud]

Quelques commentaires généraux dans le prolongement de ce que vient de dire Marie.

Globalement, vous avez compris le sens de la méthode.

Il y a une bonne intersection entre les thèmes que vous avez retenus et ceux que l’on aurait choisis.

Évidemment, vos choix ne sont pas tout à fait libres puisque nous vous avons fourni une sélection des variables et par type de population.

Une des étapes préalables à ce travail est de définir des espaces thématiques qui ont une cohérence interne.

- Prenons l’exemple du groupe 1 qui propose une analyse sur les revenus. Les variables actives se composent des revenus mais aussi les régions et la partition urbain/rural ; les variables complémentaires sont les caractéristiques des individus et des ménages. Pourquoi ne pas prendre l’espace circonscrit aux revenus et projeter en variables supplémentaires les autres caractéristiques (localisation géographique des individus, genre, éducation etc) ?

Quel est l’intérêt de l’analyse factorielle ? L’intérêt est de tenir compte de la multidimensionnalité des variables dont on dispose. Or dans certains cas, les hypothèses posées sont unidimensionnelles.

- Le groupe 3 veut tester l’hypothèse simple : est-ce que les revenus dans les entreprises formelles sont supérieurs à ceux des entreprises informelles ? Il s’agit d’une hypothèse sur une variable ó l’on compare deux sous-populations ; nous ne sommes plus dans un espace multidimensionnel.

Assurez-vous de l’adéquation entre les questions, les méthodes, les variables que vous utilisez et les données disponibles.

- Le groupe 7 s’intéresse au processus de transformation, d’urbanisation de l’économie vietnamienne. Ce genre de question se pose dans le temps. Si nous avions plusieurs enquêtes, Objet Hypothèses/résultats 

attendus Population Méthode Variables

Groupe 5 Emploi non

agricole L’emploi non agricole formel est mieux rémunéré que l’emploi non agricole informel, les ménages sont plutơt urbains, féminins, avec faible niveau d’éducation

Ménages ACM et

ACP Actives : sexe, age, ménages ruraux, urbains, montant des revenus, type de travail, secteur institutionnel

Supplémentaires : Groupe 6 Revenus des

unités de production (« Household Business »)

Le revenu des unités de production informelle varie en fonction du secteur et des zones rurales ou urbaines

Ménages non

agricoles ACM Actives : chiffre d’affaire, bénéfice, branche ou secteur d’activités, lieux d’activités

Supplémentaires : impơts, difficultés rencontrées, niveau d’éducation, politique

Groupe 7 Revenus des ménages sur l’ensemble du Việt Nam

L’urbanisation dans les grandes villes du pays permet un accroissement des revenus

Ménages ACP Actives : type de revenus (salarial, location foncière)

Supplémentaires : sexe, métier Groupe 8 Difficultés de

développement des unités de production

Les difficultés rencontrées par les unités de production (corruption, enregistrement) ont un impact plus important dans le secteur informel que formel

Unités de

production ACM Actives : corruption, enregistrement, choix sectoriel : unités de production formelle ou informelle

Supplémentaires : secteur d’activités, localité, qualification et niveau d’éducation

l’hypothèse posée serait légitime. Ce qui n’est pas le cas.

Inadéquation entre hypothèses et population de référence

- Le groupe 2 propose une analyse ó la population étudiée est l’ensemble des huit régions. Pourquoi ne pas utiliser les données individuelles et de ménage ó le potentiel d’analyse des données est bien plus riche (plutơt que de se limiter uniquement à une analyse sur les régions)?

- Le groupe 5 s’intéresse aux différences entre l’emploi formel non agricole et l’emploi informel alors que la population choisie est le ménage. Si l’on pense

« emploi », il s’agit d’une population d’actifs occupés (ou unités de production). Le lien avec le ménage est plus distant, l’hypothèse sera difficile à tester.

D’un point de vue des méthodes, aucun groupe n’a mentionné les classifications.

Deux remarques pour conclure : 1/ beaucoup d’entre vous posent des questions de relation de cause à effet or l’analyse des données ne permettra jamais de dire

« le fait A implique le fait B ». Il n’y a pas d’hypothèse de cause à effet ; 2/ souvent les quantitativistes, et les économistes en particulier, ont tendance à considérer que la base – les variables actives – doit être constituée

de variables dures, objectives (revenus, emplois). Mais on peut également projeter les variables dures comme variables supplémentaires.

[Marie Piron]

Les méthodes d’analyse factorielle et de classification sont tout à fait complémentaires, le logiciel DTM favorise l’enchaỵnement des deux méthodes.

L’analyse factorielle aide à structurer l’information, la classification facilite quand à elle la lecture des résultats en synthétisant l’ensemble des facteurs.

[Mireille Razafindrakoto]

L’étape suivante est d’examiner tous ensemble chaque projet proposé. L’intérêt est de regarder si la méthode choisie correspond bien aux résultats escomptés, la pertinence des variables sélectionnées. Nous allons tenter de réfléchir ensemble afin d’améliorer les propositions des différents groupes.

Le reste de la séance est consacrée à une discussion entre les groupes sur la pertinence des choix proposés.

Les stagiaires accompagnés par les formateurs apportent les corrections appropriées dans le cadre de l’exercice.

Thèmes d’analyses possibles et approches (après correction) Objet Hypothèses/résultats 

attendus Population Méthode Variables

Groupe 1 Revenus du

travail Revenus urbains plus élevés ; les salariés du secteur public sont mieux payés

Individus / Population active occupée (salariés ?)

ACM Actives : revenu du travail, autres caractéristiques de l’emploi Supplémentaires : sexe, âge, secteur institutionnel, régions, urbain rural Groupe 2 Économie

familiale et urbanisation

Caractéristiques de l’exportation de la main d’œuvre à l’étranger

8 régions économiques du Việt Nam Les ménages

ACP Actives : revenu du travail, revenu des unités de production formel, revenu des dividendes, revenu des transferts, revenu foncier

Supplémentaires : sexe du chef de ménage, taille du ménage, région Groupe 3 Revenus des

ménages Les ménages ont des revenus plus élevés quand les chefs de ménage travaillent dans le secteur formel; le niveau d’éducation du chef de ménage influe sur le revenu

Ménages ACP Actives : revenu total des ménages, type de travail, type de revenu

Supplémentaires : rural, urbain, taille des ménages, secteur institutionnel

[François Roubaud]

Vous avez à présent pris en main le logiciel, les données et vous avez commencé à explorer la statistique descriptive des données des trois fichiers.

Nous passerons demain à l’analyse factorielle proprement dite, nous analyserons en premier lieu l’ACP sur les revenus et sur les ménages.

Objet Hypothèses/résultats 

attendus Population Méthode Variables

Groupe 4 Marché du travail et secteur informel

La population active dans le secteur informel est elle plutôt féminine ? Le niveau d’éducation et le revenu sont ils faibles ?

Actifs

occupés ACM Actives : variables caractérisant l’emploi (revenu, durée de travail), secteur institutionnel

Supplémentaires : caractéristiques des individus et des ménages

Groupe 5 Emploi non

agricole L’emploi non agricole formel est mieux rémunéré que l’emploi non agricole informel. Les chefs de ménages dans l’informel sont plutôt urbains, féminins, avec faible niveau d’éducation

Ménages ACM et

ACP Actives : montant des revenus, Supplémentaires : sexe, âge, secteur institutionnel du chef de ménage, ménages ruraux, urbains

Groupe 6 Revenus des unités de production (« Household Business »)

Le revenu des unités de production informelle varie en fonction du secteur et des zones rurales ou urbaines

ménages non agricoles Les unités de production ou

« Household Business »

ACM Ou ACP

(avec variables

numé­

riques)

Actives : chiffre d’affaire, bénéfices, branche ou secteur d’activités, lieux d’activités

Supplémentaires : impôts, difficultés rencontrées, niveau d’éducation, politique

Groupe 7 Revenus des ménages sur l’ensemble du Việt Nam

L’urbanisation dans les grandes villes du pays permet un accroissement des revenus

Ménages ACP Actives : type de revenus (salariale, location foncière)

Supplémentaires : sexe, région, urbain/

rural Groupe 8 Difficultés de

développement des unités de production

Les difficultés rencontrées par les unités de production (corruption, enregistrement) ont un impact plus important dans le secteur informel que formel

Unités de

production ACM Actives : corruption, enregistrement, autres difficultés, choix sectoriel : unités de production formelle ou informelle Supplémentaires : secteur d’activités, informel/formel, VA, EBE, taille, localité, qualification et niveau d’éducation

L’après-midi est consacrée à l’installation de DTM et aux différents transferts et importations de fichiers Excel pour chaque station de travail.

Journée 3, mercredi matin

Trong tài liệu Université d’été en Sciences Sociales 2008 (Trang 178-182)