Recherche d’un sujet de secours

Dernier cours
Lors du dernier cours, l’idée que j’avais soulevée au sujet des buzz musicaux ne semblait pas mauvaise. Seulement, je n’avais pas accès directement aux données via SocialBlade, seulement à de graphiques. Comme je n’étais pas capable d’aller chercher moi-même si le fichiers des données sous-jacentes était accessible, Mr. Dozo m’a généreusement proposé d’aller voir lui-même s’il était possible d’extraire les données à partir du code source de la page SocialBlade.

Zotero
Cela signifie que d’ici jeudi, en attendant de savoir si ces données sont accessibles ou pas, je ne savait pas avancer dans ce projet. J’en ai profité pour prendre le temps de me familiariser un peu avec Zotero, de voir comment on pouvait s’en servir et de me rendre compte de quel résultats on pouvait concrètement obtenir avec ce logiciel.

Recherche d’une roue de secours
J’ai également cherché quelques pistes de secours au cas où les données de SocialBlade ne seraient pas accessibles. J’ai jeté un coup d’oeuil aux données que proposaient la BNF. J’ai trouvé le site assez difficilement abordable, et je me suis complètement perdue dans la partie « Téléchargez les données de la BNF« . Entre les fichiez RDF, XML, les lignes de codes, j’étais complètement perdue.
Je suis alors allée voir du coté de l’Insee. Beaucoup de données étaient accessibles, mais je n’y trouvais pas de sujet qui me parlait, et dans les rares cas où j’étais intéressée, les données ne s’étalaient que sur quelques années et restaient très constantes. Je n’y ai rien relevé de particulièrement intéressant.
J’ai également jeté un coup d’oeuil sur CultureComunication.gouv.fr qui fournissait une liste d’enquêtes, mais dans les quelques enquêtes que j’ai lues ne fournissaient pas les données en tant que telles, ou étaient payantes, ou partaient dans tous les sens.
En cherchant des données sur les pratiques culturelles, je suis tombée sur un article s’intitulant : « Comment récupérer des données d’enquêtes sur les pratiques culturelles« . Cet article m’a fourni quelques pistes, et de plus, il fournit en fin d’article une liste des données d’enquêtes disponibles. Notamment une page du site qui s’intitulepratiquesculturelles.culture.gouv.fr/ (il suffisait de demander finalement…) qui fournit directement des tableaux de donnée sur les pratiques et les équipements culturels des français, en format .pdf et .xls (donc facilement exploitables).

Voilà, ce petit article pour remettre mes idées au clair après ces recherches. Je vais maintenant voir ce que je peux ressortir de ces nouvelles données afin d’avoir une roue de secours.

PS: J’ai également ajouté un petit avant-propos, court et simple, mais plus explicite que les « … » qui lui ont précédé.
PS2 : Je suis heureuse d’apprendre que d’après WordPress, j’étais suisse le 25 février, je suis ensuite devenue belge, et qu’aujourd’hui, je suis française :
(Ca m’a aussi permis de tester l’insersion d’image dans un article. Plutôt aisé.)

Une idée à l’horizon

/!\ Alerte /!\ Cet article contient plusieurs fois le mot « buzz ». C’est article est long car j’ai beaucoup de choses à dire et j’ai du mal à synthétiser, donc j’ai essayé d’aller vite et je n’ai pas trouvé d’autre expression, et « buzz » est simple et rapide et je pense que tout le monde comprend même si c’est un peu moche. Voilà. En vous souhaitant une bonne lecture.

Avant d’en venir à l’idée que j’ai actuellement, je vais rapidement faire le point sur mes recherches du w-e. Ce w-e, j’ai en réalité passé pas mal de temps à explorer SocialBlade et à chercher ce que je pouvais faire avec. J’ai constaté qu’en plus de donner des données pour des chaînes spécifiques, ils offraient la possibilité de voir des top classements de chaines, comme par exemple, un classement de chaînes par catégorie (musique, humour,…), par pays (le plus regardé en Belgique etc.). Mais par contre, pas moyen de superposer les filtres (c’est soit tout par pays, soit tout par musique, mais pas moyen de regarder quelles sont les vidéos de musique les plus regardées en Belgique par exemple). Ils permettent aussi de voir un classement pas Youtube Network, et un classement chaines dans ces Network. Je me suis dite que c’était assez intéressant et que je pouvais peut-être chercher de ce côté là et éventuellement faire des liens avec les données de ComScore pour trouver une question derrière tout ça mais je ne trouvais pas. Seulement c’était trop flou, je ne trouvais pas de question à faire émerger de ces données, et à vrai dire, je ne comprenais pas bien le sujet malgré quelques recherches annexes.

Bref; ça ne m’a pas menée très loin. Ceci-dit, j’ai maintenant une nouvelle idée ! Qui demande encore à être plus précise mais là, je crois que je devrais me débrouiller pour avoir les données qu’il faut, quelle que soit la question précise final que je poserai :

L’idée à la base, c’est de sélectionner des chansons qui ont « fait le buzz » comme on dit (par exemple : Gagnam Style de Psy, Happy de Pharrel Williams, Hey I just met you ou on truc du genre de jenesaisplusqui, Skyfall d’Adèle…), et de constater la notoriété que l’artiste avait avant la sortie du titre, et l’évolution d’audience qu’il aura à la suite de ce fameux titre. Bref, son évolution autour du titre en question -> est-ce que les gens continuent d’écouter ces artistes après le « buzz », est-ce que l’audience retombe en flèche ? Est-ce que les vues de la chaine de l’artiste est continue ou est-ce que le graphique des vues a tendance à faire des pics par sortie de chanson ? Ce genre de chose.

En réalité j’avais eu une autre idée ce w-e mais que je n’ai pas réussi à mettre en place dans ma tête, c’était de faire ce genre de chose pour des « youtubers » connus, ceux qui se sont fait connaitre via youtube (Lindsey Stirling, ThePianoGuys, Malukah, Peter Hollens,…) et d’essayer de voir quelle(s) vidéo(s) les avait fait connaître car pour la plupart d’entre eux, c’est une ou plusieurs vidéos de musique de jeu vidéo ou de film connu (Skyrim, Assasin’s Creed et Zelda pour Lindsey Stirling, Starwars pour ThePianoGuys par exemple) et de constater grâce aux graphiques de SocialBlade s’il y avait bien un pic à la sortie de cette vidéo et donc de établir un lien entre la notoriété de ces chaines et la vidéo de musique de JV ou de film qu’ils ont sortie, et si les vues diminuent pour leur vidéos plus personnelles par rapport aux cover de JV ou de films. Mais pareil, je pataugeais un peu. Ce paragraphe semble sortir de nulle part mais en fait pas tout à fait. La question que je cherchais à préciser sur ces chaines peut peut-être être tournée autrement et, vu qu’il y a aussi une histoire de « buzz » dans cette affaire, pourquoi ne pas se poser la même question que ce que j’ai proposé plus haut, c’est à dire suivre l’évolution des vues sur les chaines de ces artistes par rapport à la vidéo qui les a fait connaître, et comparer l’évolution globale de ces « youtubers » avec celle des chanteurs/groupes populaires ? et même, qui sait pourquoi pas, aux podcasteurs « d’humour », un autre phénomène à « buzz » de youtube. Mais je m’égare peut-être un peu.

Sinon une autre idée serait de comparer les « buzz » avec leur diffusion sur les réseaux sociaux, mais ça me semble un peu simple et la réponse me semble évidente…

Je vais encore essayer de fouiller un peu ça cette après-midi si j’ai un peu de temps. Donc pour l’instant, l’idée est de :

– Chercher ces titres les plus écoutés sur des « Top 10/50 » « chansons qui ont le plus marqué telle année » et de sélectionner ceux qui apparaissent le plus souvent dans ces listes.

– Aller chercher les données des chaines officiels de ces artistes sur SocialBlade et d’analyser le graphique du nombre de vues, voir quand la vidéo du titre connu a été postée, le pic que ça représente sur le graphique et d’en suivre l’évolution.

– De faire ça donc pour quelques titres et de voir si on a tendance à assister au même phénomène ou pas -> réponse à la question : tendance à avoir un pic sur le fameux titre puis plus rien ou l’artiste est toujours suivi par après ?

– après ça, et surtout si la tendance est en général la même pour la plupart des artistes (sinon je pense que ça ne sert à rien), éventuellement faire la même chose avec les « youtuber » et comparer et/ou comparer avec les partages sur les réseaux sociaux.

Je pense que l’avantage de ce genre de sujet, c’est que ce genre de vidéo n’est en général pas trop dispersé sur youtube, bien que j’aie fait l’essai pour Pharrel Williams et j’ai trouvé pas mal de chaines différentes, dont 2 VEVO différentes et une autre sur laquelle se trouve justement le clip officiel du fameux Happy. C’était beaucoup plus clair pour Gagnam Style par exemple, j’espère que Happy est une exception (que je n’utiliserai de toute façon pas car la chanson trop récente).

Je vais essayer de chercher encore un peu cette après-midi afin de préciser un peu plus ce que je veux exactement, comment y arriver et de m’assurer que l’idée se tient (et que je ne viens pas de pense et d’écrire n’importe quoi) pour arriver au cours demain avec les idées claires.

Petit post avant de partir au kot

Les recherches que j’ai effectuées ce week-end mon fait découvrir trois site sur lesquels j’ai accès à des données sur youtube.

Le site Youtuberlink.com donne régulièrement des classements des chaines françaises les plus vues/connues et donne donc quelques statistiques en terme de nombres d’abonnés, de nombres de vues etc. Et permet de voir l’évolution que connaissent ces chaines. Seulement, ce n’est que pour la France, et surtout, les données sont très récentes, on ne sait pas remonter très loin.

Ce site donne une liste de « site », « logiciels » qui permettent d’obtenir des statistiques sur les vidéos de youtube mais j’avais l’impression que pour la plupart, ça servait surtout à évaluer sa propre chaine. J’ai tout de même jeté un coup d’oeuil à YoutubeTrends mais je n’ai pas réussi à l’utiliser. J’ai ensuite un peu parcouru leur blogs dans lesquels ils font quelques analyses intéressantes.

Ma dernière découverte me semble assez intéressante pour peu d’avoir un sujet assez ciblé. Il s’agit de Social Blade. Sur ce site, on peut entrer un nom d’utilisateur Youtube et accéder alors à toutes sortes de caractéristiques et de graphiques concernant la chaîne (évolution du nombre de vues, nombre de vue par jour, évolution du nombre d’abonné, argent gagné…). Il est également possible de comparer des chaines entre-elles et d’en faire ressortir un graphique, mais ces graphiques ne remontent qu’à quelques mois. Pour remonter plus loin, il faut se rendre sur la page « Social Blade » des chaînes prises séparément.

Cours du 26/11

Lors du précédent cours, mon idée concernant les plateformes de téléchargements et/ou les services de streaming était délicate car les véritables données étaient difficilement accessibles. De plus, mon idée n’était pas claire du tout. Je vais donc changer d’idée et me tourner à nouveau vers Youtube. On m’a conseiller pour ce sujet de commencer par chercher des données sur youtube, et dans un deuxième temps, d’en faire émerger une question.

Je ne suis pas encore allée très loin dans mes recherches, j’ai juste un petit peu chercher pendant la fin du cours. La première difficulté en cherchant des informations sur youtube, c’est que quand la recherche google contient le mot « youtube »… on tombe le plus souvent sur des vidéos youtube portant sur le reste des mots de la recherche….

Pour essayer d’avoir des informations statistiques, j’ai lancé la recherche « youtube vs dailymotion » en me disant que je tomberai bien quelque part sur une comparaison de données et sur la façon d’obtenir ces données. Bingo, j’ai trouvé une première piste : comScore . L’article parlait d’une certaine recherche concernant youtube et daylimotion, et disaient que dailymotion trouvait que les informations de comScore étaient plus correctes que celles utilisés dans cette recherche. Je suis donc allée voir sur ce site et j’ai un peu chipoté dans les articles sur youtube (recherche) et qu’il y avait moyen de filtrer pour avoir uniquement les articles qui donnent des données. Si j’ai bien compris, ce site fourni des statistique sur le comportement des internautes pour les fournir des statistiques à des « client » (entreprise ou autre j’imagine) pour qu’ils puissent gérer leurs affaires en fonction. J’ai remarqué que la plupart des statistiques sur youtube qu’ils proposent concernaient les « Youtube Partner Channel » (Vevo, Warner Music,..).

Voilà où j’en suis après ce cours. Je continue de chercher.

Premiers tâtonnements

Dans ce premier article, je vais faire part des premières questions que je me suis posées concernant le travail, mon sujet, et la visualisation de données en général.

Tout d’abord, quand il nous a été demandé de trouver une question, ou au moins une piste, j’ai pensé à plusieurs choses : le téléchargement de partitions et les différentes plateformes, quelque chose en lien avec l’écoute de musique sur Youtube, et éventuellement l’utilisation de plus en plus courante de l’anglais à la place de la langue maternelle du chanteur ou du groupe dans les chansons populaires actuelles.

J’ai donc noté ces idées dans un document sans savoir ce que je pouvais en faire, sans trouver aucune question. Je me suis donc dirigée vers le blog de Martin Grandjean pour aller chercher quelques idées du type de question qu’on pouvait poser. J’y ai lu deux-trois articles dont celui sur le marché de la bière. Le titre exact de cet article était : Visualiser des données : l’exemple du marché de la bière. Je m’étais dit qu’il détaillerait sans doute plus en détails la façon de visualiser des données, ce que je devrai finalement faire dans le cadre de mon travail. Le graphique que Martin Granjean propose à la place de celui proposé par le journal Le Monde permet en effet d’avoir une meilleure vue d’ensemble, mais je me suis quand même réellement posée la question : « Mais… A quoi sert ce nouveau graphique ? On avait déjà compris avec le précédent et on avait plus d’informations ». Cependant, tout est justifié par la suite, et surtout, il est bien précisé à la fin qu’il ne faut pas prendre ce graphique comme produit finit.

Bon. D’accord, mais ça m’a laissée perplexe, et presque encore plus embrouillée. Je suis justement tombée juste après sur un article du même blog s’intitulant Actualités de la visualisation de données : 3 regards critiques. Je me me suis dit que ça m’aiderait à mieux comprendre comment aborder la visualisation de données. Je n’ai lu que les deux premières critiques, la troisième me semblant superflue pour l’instant. C’est là que j’ai réalisé quelque chose : la plupart des graphiques, lorsqu’ils posent une bonne question et qu’ils sont bien construit demande du temps pour être lus. Ou peut-être est-ce parce que je n’ai pas l’habitude d’en lire ? C’est tout à fait possible aussi. En tout cas, il me fallait souvent du temps pour comprendre ce que le graphique voulait dire, pour le lire correctement. D’ailleurs, quand je lis des articles de journaux, je saute très souvent les graphiques, cartes, ou autres car j’essaye de me tenir régulièrement informée de l’actualité, mais je m’accorde assez peu de temps pour le faire, donc je ne « perds pas mon temps » à essayer de comprendre l’éventuel graphique associé à l’article. C’est probablement une habitude qui va bientôt changer.

J’ai laissé ça quelques jours de côté et maintenant, me revoilà à chercher un sujet. Pour finir, j’ai trouvé une nouvelle piste qui me semble prometteuse, mais la façon dont je compte l’aborder est encore assez floue dans mon esprit. J’envisage de travailler du côté des plateformes de téléchargement légales de type Itunes Music Store, FnacMusic, Starzik,… et/ou des services de streaming musical de type Spotify, Deezer, Myspace, Soundcloud… Le fait est que j’ai eu cette idée aujourd’hui, et je ne sais pas encore quel type de question je compte poser exactement… Une comparaison entre les différentes plateformes au niveau des services proposés et de leur popularité ? Une comparaison entre les services de streaming et les plateformes de téléchargement ? Quelque chose de plus précis que ces deux propositions ?

C’est donc à un stade assez flou que je me trouve actuellement, comme en témoigne le caractère sans doute un peu brouillon de cet article. Je pense que j’ai besoin me renseigner un peu plus sur le sujet avant de pouvoir aller plus loin car à vrai dire, je ne le connais pas si bien que ça. Des idées plus précises me viendront alors certainement en tête.