Graphiques !

Ce soir, je m’apprêtais à réaliser mes premiers vrais tableaux, et à chercher quelles données je pourrais croiser. Pour finir, je ne me suis occupée que des données concernant l’évolution des pratiques (et non des données à croiser). Pourquoi ce changement de programme ? Parce que je n’ai pas pu résister à l’envie de faire mes premiers graphiques !
J’ai donc organisé un premier tableau avec les données qui m’intéressaient pour faire un graphique qui montrerait l’évolution des pratiques culturelles les unes par rapport aux autres :
null

Le problème, c’est qu’en sélectionnant ce tableau et en insérant un graphique, je me retrouvais avec un graphique de ce type :
null
Or, j’avais besoin que les lignes ne correspondent pas aux dates mais aux différentes pratiques, et que les dates soient en abscisse pour avoir un aperçu de l’évolution. Je pensais qu’en inversant mon tableau (en faisant un collage spécial), le problème serait résolu :
null
Mais non, toujours le même graphique. C’est là que j’ai un peu stagné. J’ai finalement résolu le problème grâce à un forum en sélectionnant le graphique et en cliquant sur le bouton « inversion lignes/colonnes ». A partir de ce moment-là, dans la fenêtre « modifier le type de graphique », en plus de choisir le type de graphique (courbe, etc.) je pouvais aussi choisir si je voulais l’ancien graphique ou celui qui me convenait, c’est à dire celui-ci :
null
Ce graphique permet d’observer facilement quelle pratique prévaut par rapport à une autre. Par contre, l’évolution des pratique est un peu difficile à distinguer car il y a beaucoup de ligne, il y a a parfois de grands écarts entre-elles et finalement, l’évolution du graphique est assez faible par rapport à la taille du graphique.
J’ai donc également créé le graphique suivant, qui permet d’observer l’évolution année par année pour chacune des pratiques. J’ai tout simplement changé de type de graphique :
null

Je ne sais pas encore si c’est optimal et ni si c’est vraiment ce que j’utiliserai en définitive, mais en tout cas, je me suis un peu familiarisée avec l’outil graphique d’Excel, même si je n’ai encore fait que des choses assez simples.

Publicités

Illusion-désillusion

Quand je travaille pour ce cours, il se passe assez souvent un phénomène de ce que j’appellerai « illusion-désillusion ». Je vais prendre pour exemple mon travail de cet après-midi.

Cet après-midi, j’ai voulu essentiellement rassembler les fichiers de données qui m’intéressaient sur l’enquête des pratiques culturelles des français et sur ce que je retrouvais sur l’Insee. J’ai ensuite voulu aller rechercher des données sur les pratiques culturelles d’autres pays car je me disais que ce serait particulièrement intéressant de faire des comparaisons et je suis donc allée sur les liens que proposait le blog Comment récupérer des données d’enquêtes sur les pratiques culturelles ?.

Je suis d’abord allée voir des enquêtes faite au niveau européen, sur ces deux adresses de gesis.org : ici et ici. J’ai pu télécharger les données . Mais elles étaient en .dta. . Je vais chercher sur google comment lire des .dta. Sur un forum, des personnes disent que ça peut s’ouvrir avec excel . Mais chez moi, ça ne fonctionne absolument pas. Ensuite, on conseille d’utiliser notepad++ pour les ouvrir. Je télécharge notepad : toujours pas moyen.
Tant pis, je n’aurai pas de comparaison à faire au niveau européen.

J’ai ensuite voulu aller voir comment ça se passe en Amérique. Comme je l’avais écrit dans mon précédent billet, je n’ai pas pu accéder directement aux enquêtes que proposaient l’article de blog. Je suis donc allée voir directement sur le site CPANDA d’où provenaient ces enquêtes et j’ai cherché à partir de là. Je suis tombée sur 2 enquêtes, donc celles proposée sur cette page : http://www.cpanda.org/cpanda/studies/c00018?view=summary. Je ne sais pas si j’ai mal suivi la procédure ou si je ne sais tout simplement pas analyser les résultats, mais je tombe sur un « tableau? » comme celui-ci : http://www.cpanda.org/sdaweb/tmpdir/AAAHfEJN.txt
Je ne sais absolument pas quoi en faire…

Je crois donc que, le temps commençant à manquer, je vais essentiellement utiliser les données proposée par les enquêtes de l’Insee, l’enquête sur les pratiques culturelles du ministère de la culture en m’aidant du livre d’Olivier Donnat ainsi que les données sur les pratiques culturelles des enfants fournie par l’enquête « L’enfance des loisirs », et donc rester en France.

Je suis assez déçue de ne pas avoir trouvé de données sur les pratiques américaines car j’aurais trouvé très intéressant de comparer cela. Mais tant pis, je trouverai bien d’autres questions à poser, comme l’évolution des pratiques liée à l’arrivée du numérique dans nos vies par exemple. J’espère juste que j’arriverai à me libérer de tout ce qui aura déjà été fait sur le sujet car ces données ont déjà été exploitées de bien des façons.

Sinon, en dehors du travail à proprement parler, j’ai résolu le problème que j’avais avec Zotero. C’était un problème de version du module firefox de zotero. La version de mon zotero standalone était bien la plus récente, mais mon module firefox était obsolète.

Les pratiques culturelles

N’ayant pas trouvé de données satisfaisante à propos de Youtube (pas de vraies données du tout en fait), j’ai changé de sujet et j’ai donc décidé de travailler sur les pratiques culturelles comme je l’ai dit au prochain cours.

Sources
J’utiliserai les données d’enquêtes proposées par dans le blog dont j’ai parlé dans mon article précédent : Comment récupérer des données d’enquêtes sur les pratiques culturelles ?

Les plus facilement exploitables sont celles de la série d’Enquêtes sur les pratiques culturelles des Français, dont les données sont accessibles en fichiers xls. De plus, je pourrai m’aider du livre Les pratiques culturelles des français à l’ère numérique d’Olivier Donnat qui porte sur les résultats de cette étude.

J’en ai aussi pointé quelques une de l’Insee : une Enquête sur les loisirs (assez ancienne : 1987-1988) ainsi qu’une Enquête EPCV « Participation culturelle et sportive ». Pour ces enquêtes, les données sont particulièrement abondantes. Elle sont fournies en .dbf, mais sont ouvrables avec excel et également avec le logiciel gratuit dbfviewer.

Si j’ai besoin d’information sur les loisirs des plus jeunes en particuliers, je pourrai m’aider des enquêtes suivantes : Enquête sur les loisirs des 6-14 ans et Enquête Univers culturels des enfants et des adolescents. Je pourrai dans ce cas également m’aider du livre L’enfance des loisirs de Sylvie Octobre, Christine Détrez, Pierre Mercklé et Nathalie Berthomier.

L’article du blog propose également des liens vers des enquêtes américaine, mais malheureusement, elles ne sont plus accessible. Par contre, le site d’où elles proviennent est accessible. Il s’agit de CPANDA (Cultural Policy and teh Art National Data Archive). Je vais donc essayer de fouiller ce site pour trouver des données que je pourrais croiser avec les données françaises.
Des sites enquêtes sont également proposées pour d’autres pays et pour l’Europe, mais je ne suis pas encore allée voir.

Travail
Mon travail est donc maintenant d’aller voir dans ces données lesquelles sont intéressantes, exploitables, pourraient soulever des questions intéressantes, pourraient être croisées entre elles,… et que je range tout ça dans un tableau.

Gephi
J’ai installé Gephi. Malheureusement… le programme ne s’ouvre pas. Quand je le lance, la « fenêtre » d’attente apparait, il charge, je vois le processus dans le gestionnaire des tâches et puis plus rien. Je vais essayer de le désinstaller et le réinstaller, sinon, je chercherai une autre solution.

Zotero
Je suis plutôt déçue également par Zotero car je n’arrive pas à l’utiliser correctement. J’ai voulu enregistrer dans la bibliothèque de Zotero le livre Les pratiques culturelles des français à l’ère numérique d’Olivier Donnat via Amazon . J’ai donc fait un clic droit sur le petit livre dans la barre d’adresse et cliqué sur « enregistrer dans Zotero avec Amazon », mais j’ai à chaque fois un message d’erreur. J’ai essayé plusieurs solutions proposées pour régler le problème, mais je n’ai encore rien essayé qui fonctionne…

Recherche d’un sujet de secours

Dernier cours
Lors du dernier cours, l’idée que j’avais soulevée au sujet des buzz musicaux ne semblait pas mauvaise. Seulement, je n’avais pas accès directement aux données via SocialBlade, seulement à de graphiques. Comme je n’étais pas capable d’aller chercher moi-même si le fichiers des données sous-jacentes était accessible, Mr. Dozo m’a généreusement proposé d’aller voir lui-même s’il était possible d’extraire les données à partir du code source de la page SocialBlade.

Zotero
Cela signifie que d’ici jeudi, en attendant de savoir si ces données sont accessibles ou pas, je ne savait pas avancer dans ce projet. J’en ai profité pour prendre le temps de me familiariser un peu avec Zotero, de voir comment on pouvait s’en servir et de me rendre compte de quel résultats on pouvait concrètement obtenir avec ce logiciel.

Recherche d’une roue de secours
J’ai également cherché quelques pistes de secours au cas où les données de SocialBlade ne seraient pas accessibles. J’ai jeté un coup d’oeuil aux données que proposaient la BNF. J’ai trouvé le site assez difficilement abordable, et je me suis complètement perdue dans la partie « Téléchargez les données de la BNF« . Entre les fichiez RDF, XML, les lignes de codes, j’étais complètement perdue.
Je suis alors allée voir du coté de l’Insee. Beaucoup de données étaient accessibles, mais je n’y trouvais pas de sujet qui me parlait, et dans les rares cas où j’étais intéressée, les données ne s’étalaient que sur quelques années et restaient très constantes. Je n’y ai rien relevé de particulièrement intéressant.
J’ai également jeté un coup d’oeuil sur CultureComunication.gouv.fr qui fournissait une liste d’enquêtes, mais dans les quelques enquêtes que j’ai lues ne fournissaient pas les données en tant que telles, ou étaient payantes, ou partaient dans tous les sens.
En cherchant des données sur les pratiques culturelles, je suis tombée sur un article s’intitulant : « Comment récupérer des données d’enquêtes sur les pratiques culturelles« . Cet article m’a fourni quelques pistes, et de plus, il fournit en fin d’article une liste des données d’enquêtes disponibles. Notamment une page du site qui s’intitulepratiquesculturelles.culture.gouv.fr/ (il suffisait de demander finalement…) qui fournit directement des tableaux de donnée sur les pratiques et les équipements culturels des français, en format .pdf et .xls (donc facilement exploitables).

Voilà, ce petit article pour remettre mes idées au clair après ces recherches. Je vais maintenant voir ce que je peux ressortir de ces nouvelles données afin d’avoir une roue de secours.

PS: J’ai également ajouté un petit avant-propos, court et simple, mais plus explicite que les « … » qui lui ont précédé.
PS2 : Je suis heureuse d’apprendre que d’après WordPress, j’étais suisse le 25 février, je suis ensuite devenue belge, et qu’aujourd’hui, je suis française :
(Ca m’a aussi permis de tester l’insersion d’image dans un article. Plutôt aisé.)

Une idée à l’horizon

/!\ Alerte /!\ Cet article contient plusieurs fois le mot « buzz ». C’est article est long car j’ai beaucoup de choses à dire et j’ai du mal à synthétiser, donc j’ai essayé d’aller vite et je n’ai pas trouvé d’autre expression, et « buzz » est simple et rapide et je pense que tout le monde comprend même si c’est un peu moche. Voilà. En vous souhaitant une bonne lecture.

Avant d’en venir à l’idée que j’ai actuellement, je vais rapidement faire le point sur mes recherches du w-e. Ce w-e, j’ai en réalité passé pas mal de temps à explorer SocialBlade et à chercher ce que je pouvais faire avec. J’ai constaté qu’en plus de donner des données pour des chaînes spécifiques, ils offraient la possibilité de voir des top classements de chaines, comme par exemple, un classement de chaînes par catégorie (musique, humour,…), par pays (le plus regardé en Belgique etc.). Mais par contre, pas moyen de superposer les filtres (c’est soit tout par pays, soit tout par musique, mais pas moyen de regarder quelles sont les vidéos de musique les plus regardées en Belgique par exemple). Ils permettent aussi de voir un classement pas Youtube Network, et un classement chaines dans ces Network. Je me suis dite que c’était assez intéressant et que je pouvais peut-être chercher de ce côté là et éventuellement faire des liens avec les données de ComScore pour trouver une question derrière tout ça mais je ne trouvais pas. Seulement c’était trop flou, je ne trouvais pas de question à faire émerger de ces données, et à vrai dire, je ne comprenais pas bien le sujet malgré quelques recherches annexes.

Bref; ça ne m’a pas menée très loin. Ceci-dit, j’ai maintenant une nouvelle idée ! Qui demande encore à être plus précise mais là, je crois que je devrais me débrouiller pour avoir les données qu’il faut, quelle que soit la question précise final que je poserai :

L’idée à la base, c’est de sélectionner des chansons qui ont « fait le buzz » comme on dit (par exemple : Gagnam Style de Psy, Happy de Pharrel Williams, Hey I just met you ou on truc du genre de jenesaisplusqui, Skyfall d’Adèle…), et de constater la notoriété que l’artiste avait avant la sortie du titre, et l’évolution d’audience qu’il aura à la suite de ce fameux titre. Bref, son évolution autour du titre en question -> est-ce que les gens continuent d’écouter ces artistes après le « buzz », est-ce que l’audience retombe en flèche ? Est-ce que les vues de la chaine de l’artiste est continue ou est-ce que le graphique des vues a tendance à faire des pics par sortie de chanson ? Ce genre de chose.

En réalité j’avais eu une autre idée ce w-e mais que je n’ai pas réussi à mettre en place dans ma tête, c’était de faire ce genre de chose pour des « youtubers » connus, ceux qui se sont fait connaitre via youtube (Lindsey Stirling, ThePianoGuys, Malukah, Peter Hollens,…) et d’essayer de voir quelle(s) vidéo(s) les avait fait connaître car pour la plupart d’entre eux, c’est une ou plusieurs vidéos de musique de jeu vidéo ou de film connu (Skyrim, Assasin’s Creed et Zelda pour Lindsey Stirling, Starwars pour ThePianoGuys par exemple) et de constater grâce aux graphiques de SocialBlade s’il y avait bien un pic à la sortie de cette vidéo et donc de établir un lien entre la notoriété de ces chaines et la vidéo de musique de JV ou de film qu’ils ont sortie, et si les vues diminuent pour leur vidéos plus personnelles par rapport aux cover de JV ou de films. Mais pareil, je pataugeais un peu. Ce paragraphe semble sortir de nulle part mais en fait pas tout à fait. La question que je cherchais à préciser sur ces chaines peut peut-être être tournée autrement et, vu qu’il y a aussi une histoire de « buzz » dans cette affaire, pourquoi ne pas se poser la même question que ce que j’ai proposé plus haut, c’est à dire suivre l’évolution des vues sur les chaines de ces artistes par rapport à la vidéo qui les a fait connaître, et comparer l’évolution globale de ces « youtubers » avec celle des chanteurs/groupes populaires ? et même, qui sait pourquoi pas, aux podcasteurs « d’humour », un autre phénomène à « buzz » de youtube. Mais je m’égare peut-être un peu.

Sinon une autre idée serait de comparer les « buzz » avec leur diffusion sur les réseaux sociaux, mais ça me semble un peu simple et la réponse me semble évidente…

Je vais encore essayer de fouiller un peu ça cette après-midi si j’ai un peu de temps. Donc pour l’instant, l’idée est de :

– Chercher ces titres les plus écoutés sur des « Top 10/50 » « chansons qui ont le plus marqué telle année » et de sélectionner ceux qui apparaissent le plus souvent dans ces listes.

– Aller chercher les données des chaines officiels de ces artistes sur SocialBlade et d’analyser le graphique du nombre de vues, voir quand la vidéo du titre connu a été postée, le pic que ça représente sur le graphique et d’en suivre l’évolution.

– De faire ça donc pour quelques titres et de voir si on a tendance à assister au même phénomène ou pas -> réponse à la question : tendance à avoir un pic sur le fameux titre puis plus rien ou l’artiste est toujours suivi par après ?

– après ça, et surtout si la tendance est en général la même pour la plupart des artistes (sinon je pense que ça ne sert à rien), éventuellement faire la même chose avec les « youtuber » et comparer et/ou comparer avec les partages sur les réseaux sociaux.

Je pense que l’avantage de ce genre de sujet, c’est que ce genre de vidéo n’est en général pas trop dispersé sur youtube, bien que j’aie fait l’essai pour Pharrel Williams et j’ai trouvé pas mal de chaines différentes, dont 2 VEVO différentes et une autre sur laquelle se trouve justement le clip officiel du fameux Happy. C’était beaucoup plus clair pour Gagnam Style par exemple, j’espère que Happy est une exception (que je n’utiliserai de toute façon pas car la chanson trop récente).

Je vais essayer de chercher encore un peu cette après-midi afin de préciser un peu plus ce que je veux exactement, comment y arriver et de m’assurer que l’idée se tient (et que je ne viens pas de pense et d’écrire n’importe quoi) pour arriver au cours demain avec les idées claires.

Petit post avant de partir au kot

Les recherches que j’ai effectuées ce week-end mon fait découvrir trois site sur lesquels j’ai accès à des données sur youtube.

Le site Youtuberlink.com donne régulièrement des classements des chaines françaises les plus vues/connues et donne donc quelques statistiques en terme de nombres d’abonnés, de nombres de vues etc. Et permet de voir l’évolution que connaissent ces chaines. Seulement, ce n’est que pour la France, et surtout, les données sont très récentes, on ne sait pas remonter très loin.

Ce site donne une liste de « site », « logiciels » qui permettent d’obtenir des statistiques sur les vidéos de youtube mais j’avais l’impression que pour la plupart, ça servait surtout à évaluer sa propre chaine. J’ai tout de même jeté un coup d’oeuil à YoutubeTrends mais je n’ai pas réussi à l’utiliser. J’ai ensuite un peu parcouru leur blogs dans lesquels ils font quelques analyses intéressantes.

Ma dernière découverte me semble assez intéressante pour peu d’avoir un sujet assez ciblé. Il s’agit de Social Blade. Sur ce site, on peut entrer un nom d’utilisateur Youtube et accéder alors à toutes sortes de caractéristiques et de graphiques concernant la chaîne (évolution du nombre de vues, nombre de vue par jour, évolution du nombre d’abonné, argent gagné…). Il est également possible de comparer des chaines entre-elles et d’en faire ressortir un graphique, mais ces graphiques ne remontent qu’à quelques mois. Pour remonter plus loin, il faut se rendre sur la page « Social Blade » des chaînes prises séparément.

Cours du 26/11

Lors du précédent cours, mon idée concernant les plateformes de téléchargements et/ou les services de streaming était délicate car les véritables données étaient difficilement accessibles. De plus, mon idée n’était pas claire du tout. Je vais donc changer d’idée et me tourner à nouveau vers Youtube. On m’a conseiller pour ce sujet de commencer par chercher des données sur youtube, et dans un deuxième temps, d’en faire émerger une question.

Je ne suis pas encore allée très loin dans mes recherches, j’ai juste un petit peu chercher pendant la fin du cours. La première difficulté en cherchant des informations sur youtube, c’est que quand la recherche google contient le mot « youtube »… on tombe le plus souvent sur des vidéos youtube portant sur le reste des mots de la recherche….

Pour essayer d’avoir des informations statistiques, j’ai lancé la recherche « youtube vs dailymotion » en me disant que je tomberai bien quelque part sur une comparaison de données et sur la façon d’obtenir ces données. Bingo, j’ai trouvé une première piste : comScore . L’article parlait d’une certaine recherche concernant youtube et daylimotion, et disaient que dailymotion trouvait que les informations de comScore étaient plus correctes que celles utilisés dans cette recherche. Je suis donc allée voir sur ce site et j’ai un peu chipoté dans les articles sur youtube (recherche) et qu’il y avait moyen de filtrer pour avoir uniquement les articles qui donnent des données. Si j’ai bien compris, ce site fourni des statistique sur le comportement des internautes pour les fournir des statistiques à des « client » (entreprise ou autre j’imagine) pour qu’ils puissent gérer leurs affaires en fonction. J’ai remarqué que la plupart des statistiques sur youtube qu’ils proposent concernaient les « Youtube Partner Channel » (Vevo, Warner Music,..).

Voilà où j’en suis après ce cours. Je continue de chercher.