La fin d’une aventure

Voilà, c’est fait. Mon article est terminé, posté sur le blog commun. Il ne nous reste qu’à attendre le dernier article et à confirmer tous que nous sommes d’accord sur son apparence finale.
Une aventure en effet ! Que de recherches, de moments de confiance, de déception, d’obstacle,…
J’ai déjà expliqué globalement ce que j’aurai pu et voulu faire de plus dans mon article final mais je tenais également à écrire un article un peu plus complet sur mon blog personnel pour donner un peu mes impressions par rapport à mon travail.

Je vais commencer par les points « négatifs ».
Je regrette d’avoir autant chipoté avant d’avoir trouvé ma dernière question. C’est dommage car par conséquent, je n’ai pas pu creuser le sujet alors que j’aurais pu et que finalement, il était intéressant quand même. Une fois que j’ai réussi à mettre l’idée au clair dans ma tête, que j’ai vu que j’avais normalement les données qu’il me fallait, et que j’ai dû me mettre à faire mes graphiques et ensuite à rédiger mon article, je n’ai plus fait que ça car le temps commençait à manquer, et j’ai donc enchainé tout le travail d’un coup, sans avoir eu le temps de prendre du recul. En bref, je suis un peu déçue de mon travail final, il n’a pas été assez peaufiné.

Mais je ne retire pas de ce cours que des points négatifs, bien sûr! C’est surtout par rapport à mon travail que je retire des points négatifs à vrai dire.
Le cours était vraiment intéressant, on a appris à maîtriser ou à aborder de nouveaux outils, et ça, c’est très intéressant. Même si on ne sait pas tous bien les manier, on sait au moins ce qui est possible et on a appris qu’il était possible d’apprendre pas mal de choses par nous même, si on s’en donne les moyens.
De plus, l’air de rien, même si j’ai un peu l’air de « râler » sur le fait que j’ai perdu du temps… j’aime bien chipoter en fait ^^ Le seul soucis, c’est qu’on a eu une période de cours trop courte pour être aussi « peu » encadré, comme on en a parlé au dernier cours, car on s’est pour certains retrouvé coincés à la fin, mais sinon, la méthode est intéressante et me plaît beaucoup.
Et puis, prendre confiance, échouer, se relever,… n’est-ce pas la VIE finalement ?

Hum… Je m’égare un peu, mais pour résumer : un travail final un peu décevant (en ce qui me concerne), mais un quadrimestre enrichissant, plein de découvertes et de sensations!

Ebauche de structure

Bon. Normalement, toutes les idées sont là, les graphiques aussi (à retravailler pour la présentation, mais ils sont là). La structure et les idées que j’ai en tête seront peut-être un peu changées durant la rédaction de l’article, mais en gros, ce dernier devrait se présenter en trois parties.

L’idée de base est d’analyser la façon dont les français, selon l’enquête sur les pratiques culturelles des français de 2008, se procurent leurs produits culturels de type films, musique, jeux vidéos, livres,… en fonction de l’âge.

La première partie sera l’analyse d’un graphique dans lequel j’ai rassemblé les données que j’ai sur l’achat de livres/cds/dvd, emprunt en médiatèque, téléchargement,…

Dans la deuxième partie, je comparerai le téléchargement par rapport l’achat en ligne. Il pourra paraître étonnant que je n’aies pas intégré certaines de ces données au premier graphique mais la raison est la suivante : pour la première partie, j’ai pris des données « sur les 12 derniers mois » et pour la deuxième partie, j’ai utilisé des données parfois plus complètes concernant le téléchargement et l’achat en ligne mais pour lesquelles la question était : « Avez-vous déjà téléchargé/acheté en ligne… ». Les données ne sont pas comparables. Par exemple, je n’ai pas du tout les mêmes chiffres pour l’achat de livre en ligne au cours des 12 derniers mois et pour l’achat de livre en ligne en général. Cette analyse se fera toujours en fonction de l’âge.

Enfin, dans la troisième partie, j’essayerai comparer certains résultats avec le matériel audiovisuel que possèdent ces tranches d’âges.

Les petits soucis que j’ai eu pour cette questions-ci ont été le fait que tout n’est pas comparables. Par exemple, pour la première partie, bien sûr, on ne va pas parler de graver un livre, ou d’enregistrer une musique sur son lecteur DVD, mais pourquoi a-t-on les données d’emprunt de CDs, de DVDs, mais pas de livres ? j’aurais bien entendu voulu comparer ça avec les livres étant donné que j’avais l’impression que justement, les livres étaient le type de produit qu’on empruntait plus facilement qu’un cd par exemple. Mais je n’ai pas les données pour. J’ai donc parfois l’impression que c’est un peu incomplet, mais on fait avec ce qu’on a.

A ce stade, j’hésite aussi à supprimer ma dernière partie ou pas. En effet, pour cette étude, je n’ai que des pourcentage, alors est-ce vraiment pertinent de faire ce genre d’étude dessus ? Je vais déjà m’atteler à l’écriture des premières parties et nous verrons ensuite.

Nouvelle et (à priori) dernière idée


N’étant pas sûre de pourvoir mettre au point ma dernière idée à temps (celle concernant la fréquentation des concerts), j’ai du chercher une autre idée de question à poser à mes données. Comme le temps commence vraiment à manquer, il faut que cette dernière idée ne soit pas trop floue et que je sache déjà comment je pourrai la travailler.

Je pense avoir trouvé. Sur base de l’enquête 2008 sur les pratiques culturelles des français, j’aimerais comparer la façon dont les gens accèdent aux musiques, aux films et aux livres. Achètent-t-ils les cds, dvd ? est-ce qu’ils les louent ? est-ce qu’ils achètent leur musique en ligne ? est-ce qu’ils achètent leurs livres sur internet, ou les empruntent-ils en bibliothèque ?
Le but serait de comparer, en fonction des tranches d’âge et en fonction des dvds, cds ou livre, quelle méthode d’accès est la plus utilisée.

Je viens de rassembler les tableaux qui pourraient contenir des informations intéressantes et je réfléchis maintenant aux données que je peux mettre ensemble pour que ce soit cohérent.
Je pense que de simples graphiques excel suffiront à répondre à ces questions, et il y en aura plusieurs.

Avancement du projet


L’idée que je voudrais, si c’est possible, exploiter dans mon article final est la suivante : essayer d’évaluer si les gens ont tendance à se rendre aux concerts du type de musique qui correspond au type de musique qu’ils écoutent le plus ou pas. J’ai trouvé cette idée en me rendant compte que je possède les données du type de musique que les gens écoutent le plus, et le type de concerts qu’ils sont allé écouter sur l’année. Les types de musique se correspondant bien dans les deux cas, je pourrais donc les exploiter.

En effet, le principal problème auquel j’ai été confrontée en cherchant une question à poser à des données l’enquête EPCV Participation culturelle et sportive – mai 2003, c’est que les données n’étaient pas nécessairement compatibles.
Par exemple, je disposais des données concernant l’obligation de pratiques culturelles et l’obligation de pratiques sportives dans le cadre professionnel. J’ai donc voulu évaluer si le fait d’être obligé de pratiquer des activités sportives ou culturelles dans le cadre professionnel incitait les gens à pratiquer ce type d’activités en tant que loisir, et si c’était plus important pour les pratique culturelle ou pour les pratiques sportives. Seulement, les données ne se correspondaient pas : je n’avais pas de données générales sur les pratiques culturelles, j’avais plutôt « sortie dans les musées », « concert »,… mais par contre, j’en avais pour le sport. Mais pour le sport, que choisir pour que ce soit équivalent ? L’inscription dans un club ? Le temps de pratique par semaine ? Le nombre de fois par semaine ?

Avec la dernière idée que j’ai eu, je ne suis pas confrontée à ce type de problème qui risquerait de fausser les résultats. Et je suis vraiment curieuse, si j’arrive à l’appliquer, de voir le résultat… J’avais tendance à me dire « logiquement, ça devrait correspondre », mais en me posant la question à moi-même, je me suis rendue compte que ça ne correspondait pas du tout chez moi : je me rends quasiment exclusivement à des concerts de musique classiques, mais ce n’est pas du tout le type de musique que j’écoute le plus chez moi. Et pour les habitués des festivals ? Peut-être y vont-ils pour l’ambiance mais n’écoute pas beaucoup ce type de musique chez eux ?

Le problème, c’est que je n’ai pas vraiment idée de la façon dont je pourrait traiter ces données pour en faire une visualisation. Je ne pense pas que ce soit avec un graphique que j’y arriverai… Mon professeur m’a parlé d’une analyse factorielle. Je suis donc allée me renseigner un tout petit peu et vu ce que ça pouvait donner comme type de représentation, et en effet, ça pourrait peut-être fonctionner, mais je ne m’y connais quand même pas fort bien et surtout, je ne sais absolument pas comment faire… J’attends donc de voir s’il saurait m’expliquer.

Sinon, une deuxième idée serait d’essayer de travailler sur les gens qui vont voir plusieurs concert? La question est d’essayer de voir si ce sont souvent les même types de concerts qui sont vu « ensemble », s’il y a des associations. Exemple : est-ce qu’une personne qui va voir su jazz a aussi tendance à aller voir un concert de rock ?

Voilà ou j’en suis jusqu’à maintenant. Sinon, depuis, j’ai appris à faire un tableau croisé dynamique. Je trouvais que ça sonnait bien. Ça a l’air pratique mais je ne sais pas si ça va m’aider dans le cadre de ce travail…

Et ce serait quand même cool que je réfléchisse (à nouveau) à une nouvelle idée au cas-où celle-ci ne fonctionnerait pas car le temps commence à manquer…

 

Avancement du projet

Au cours précédent, je me suis rendue compte que travailler uniquement sur les données que fournissent l’enquête sur les pratiques culturelle des français n’allait me permettre que de faire des analyses et des graphiques extrêmement simples car toutes les données sont déjà rassemblées en pourcentages. Je ne dispose en fait pas des données brutes. J’avais en effet l’idée de comparer le matériel audio-visuel (home cinéma, bouquet tv,…) des gens avec leur fréquence/quantité d’écoute de radio ou de télévision, ce genre de chose. Mais le soucis était que, si j’avais beaucoup d’information, je n’avais pas les données brutes.

Pour pouvoir faire ce genre d’analyse, je me suis donc dirigée vers l’étude de l’insee « EPCV Participation culturelle et sportive ». Je pensais pouvoir répondre à ce type de questions grâce à cette étude car elle me fournissait une fiche contenant les informations sur les bien des ménages (allant jusqu’au dernier achat d’un lave-linge), une fiche sur des informations liées à l’individu, et enfin, 2 fiches sur les pratiques culturelles et sportives. Malheureusement, cette étude date de 2003, et le matériel audio-visuel a bien évolué depuis -> Aucune info ni sur les home-cinéma, ni sur les bouquets tv. Il n’y est même pas question d’ordinateur mais de « micro-ordinateur » portable ou non, équipé ou non en multimédia. Je me suis donc rendue compte qu’avec cette enquête, je devais quitter le domaine du multimédia.
J’ai alors décidé de me concentrer plutôt sur les pratiques culturelles en temps que telles. En fonction des données que j’ai à disposition, j’ai voulu me poser quelques questions :
– Est-ce que la fréquence d’écoute de musique (hors-radio) est proportionnelle au nombre de disques qu’on a chez soi ?
– Est-ce que le type de musique qu’on écoute le plus correspond au type de musique qu’on va écouter en concert.
– Est-ce que, lorsqu’on va par obligation (pour le travail ou pour les études) à des activités sportives, artistiques ou culturelles, on a tendance à aller de nous-même respectivement à des activités sportives, artistiques ou culturelles.

La difficulté que j’ai rencontrée était de trouvé les bonnes données, celles qui m’intéressent. Pour prendre un exemple simple : pour le type de musique écouté, j’avais le choix entre « Premier genre de musique cité » et Genre de musique que la personne écoute le plus parmi ces 2 (ou 3) genres ». Dans ce cas-ci, le choix a été assez rapide.
Mais je suis actuellement bloquée avec le troisième point que j’ai cité. Pour la pratique obligatoire d’un sport, j’ai le choix entre « Pratique obligatoire d’activités sportives pendant le travail ou les études » -> oui/non, « : Pratique obligatoire d’activités sportives pendant le travail ou les études au cours des 12 derniers mois – unité de temps »,  » Nombre total de fois où la personne pratique obligatoirement une activité sportive pendant le travail ou les études au cours des 12 derniers mois « . Je voulais l’opposer ensuite l’opposer à « pratique obligatoire d’activité culturelles et artistiques ». Ensuite, l’idée était de voir si je pouvais observer une corrélation entre la pratique obligatoire d’un sport ou d’une activité culturelle ou artistique. Le soucis, c’est que j’avais pour le sport la possibilité de regarder les « Pratique d’une activité sportive » avec leur fréquence, mais je n’avais pas d’équivalent pour les pratiques artistiques. Par contre, j’avais les données de participation à des cours/stages,… de sport, et de pratiques artistiques. J’ai donc voulu opposer « pratique obligatoire d’activité artistiques » avec « pratique obligatoire d’activité sportive » avec la participation personnelle à ce type d’activité. Maintenant, il y a deux soucis. Le premier, c’est que je ne suis pas sûr que la notion ces données sur la les cours/stages etc. soient uniquement du domaine privé, ou font partie des obligations (cours dans le cadre des études etc). Dans ce cas, mon résultat pourrait être biaisé. Le deuxième problème, c’est que je n’ai pas trouvé les colonnes correspondant aux cours dans mon fichier de données (alors que je procédait exactement de la même façon que pour les autres, en faisant un copier/collé de ce qui est sensé être la tête de colonne à partir du fichier pdf concernant les données. Mais je ne trouve rien du tout sur les cours.
Bref, j’ai donc décidé d’arrêter pour aujourd’hui car ça n’a l’air de rien, mais rien que ça m’a pris pas mal de temps, d’autant plus que j’y ai déjà travaillé le w-e. J’y reviendrai à tête reposée.
Et j’imaginais déjà essayer de faire d’autres graphiques avec ces tableaux, ne fusse qu’essayer, mais finalement, je n’aurai fait que des tableaux…

Ceci-veut aussi dire que je reprendrai mon ancien petit graphique pour écrire mon premier petit article.

Graphiques !

Ce soir, je m’apprêtais à réaliser mes premiers vrais tableaux, et à chercher quelles données je pourrais croiser. Pour finir, je ne me suis occupée que des données concernant l’évolution des pratiques (et non des données à croiser). Pourquoi ce changement de programme ? Parce que je n’ai pas pu résister à l’envie de faire mes premiers graphiques !
J’ai donc organisé un premier tableau avec les données qui m’intéressaient pour faire un graphique qui montrerait l’évolution des pratiques culturelles les unes par rapport aux autres :
null

Le problème, c’est qu’en sélectionnant ce tableau et en insérant un graphique, je me retrouvais avec un graphique de ce type :
null
Or, j’avais besoin que les lignes ne correspondent pas aux dates mais aux différentes pratiques, et que les dates soient en abscisse pour avoir un aperçu de l’évolution. Je pensais qu’en inversant mon tableau (en faisant un collage spécial), le problème serait résolu :
null
Mais non, toujours le même graphique. C’est là que j’ai un peu stagné. J’ai finalement résolu le problème grâce à un forum en sélectionnant le graphique et en cliquant sur le bouton « inversion lignes/colonnes ». A partir de ce moment-là, dans la fenêtre « modifier le type de graphique », en plus de choisir le type de graphique (courbe, etc.) je pouvais aussi choisir si je voulais l’ancien graphique ou celui qui me convenait, c’est à dire celui-ci :
null
Ce graphique permet d’observer facilement quelle pratique prévaut par rapport à une autre. Par contre, l’évolution des pratique est un peu difficile à distinguer car il y a beaucoup de ligne, il y a a parfois de grands écarts entre-elles et finalement, l’évolution du graphique est assez faible par rapport à la taille du graphique.
J’ai donc également créé le graphique suivant, qui permet d’observer l’évolution année par année pour chacune des pratiques. J’ai tout simplement changé de type de graphique :
null

Je ne sais pas encore si c’est optimal et ni si c’est vraiment ce que j’utiliserai en définitive, mais en tout cas, je me suis un peu familiarisée avec l’outil graphique d’Excel, même si je n’ai encore fait que des choses assez simples.

Illusion-désillusion

Quand je travaille pour ce cours, il se passe assez souvent un phénomène de ce que j’appellerai « illusion-désillusion ». Je vais prendre pour exemple mon travail de cet après-midi.

Cet après-midi, j’ai voulu essentiellement rassembler les fichiers de données qui m’intéressaient sur l’enquête des pratiques culturelles des français et sur ce que je retrouvais sur l’Insee. J’ai ensuite voulu aller rechercher des données sur les pratiques culturelles d’autres pays car je me disais que ce serait particulièrement intéressant de faire des comparaisons et je suis donc allée sur les liens que proposait le blog Comment récupérer des données d’enquêtes sur les pratiques culturelles ?.

Je suis d’abord allée voir des enquêtes faite au niveau européen, sur ces deux adresses de gesis.org : ici et ici. J’ai pu télécharger les données . Mais elles étaient en .dta. . Je vais chercher sur google comment lire des .dta. Sur un forum, des personnes disent que ça peut s’ouvrir avec excel . Mais chez moi, ça ne fonctionne absolument pas. Ensuite, on conseille d’utiliser notepad++ pour les ouvrir. Je télécharge notepad : toujours pas moyen.
Tant pis, je n’aurai pas de comparaison à faire au niveau européen.

J’ai ensuite voulu aller voir comment ça se passe en Amérique. Comme je l’avais écrit dans mon précédent billet, je n’ai pas pu accéder directement aux enquêtes que proposaient l’article de blog. Je suis donc allée voir directement sur le site CPANDA d’où provenaient ces enquêtes et j’ai cherché à partir de là. Je suis tombée sur 2 enquêtes, donc celles proposée sur cette page : http://www.cpanda.org/cpanda/studies/c00018?view=summary. Je ne sais pas si j’ai mal suivi la procédure ou si je ne sais tout simplement pas analyser les résultats, mais je tombe sur un « tableau? » comme celui-ci : http://www.cpanda.org/sdaweb/tmpdir/AAAHfEJN.txt
Je ne sais absolument pas quoi en faire…

Je crois donc que, le temps commençant à manquer, je vais essentiellement utiliser les données proposée par les enquêtes de l’Insee, l’enquête sur les pratiques culturelles du ministère de la culture en m’aidant du livre d’Olivier Donnat ainsi que les données sur les pratiques culturelles des enfants fournie par l’enquête « L’enfance des loisirs », et donc rester en France.

Je suis assez déçue de ne pas avoir trouvé de données sur les pratiques américaines car j’aurais trouvé très intéressant de comparer cela. Mais tant pis, je trouverai bien d’autres questions à poser, comme l’évolution des pratiques liée à l’arrivée du numérique dans nos vies par exemple. J’espère juste que j’arriverai à me libérer de tout ce qui aura déjà été fait sur le sujet car ces données ont déjà été exploitées de bien des façons.

Sinon, en dehors du travail à proprement parler, j’ai résolu le problème que j’avais avec Zotero. C’était un problème de version du module firefox de zotero. La version de mon zotero standalone était bien la plus récente, mais mon module firefox était obsolète.