Analyse des cooccurrences des termes employés dans les réponses aux formulaires du Grand Débat

La Transition écologique


Introduction

Dans le cadre de l'analyse des données produites au cours du Grand Débat, nous proposons de nous focaliser sur une thématique particulière et centrale de la transition écologique : le transport. Si les données collectées sur la plateforme sont foisonnantes, il existe peu d'annotation permettant d'identifier quelles sont les réponses associées aux transports.

A la fin de la consultation, une initiative d'annotation des réponses est proposée par le collectif la Grande Annotation (site). Une belle initiative qui a permis l'annotation de plus de 300000 réponses ! Cependant, ce n'est qu'un faible pourcentage de l'ensemble des réponses... Pas de panique ! Si le nombre d'annotation ne couvre pas l'ensemble des réponses, celles-ci peuvent être utilisées pour entrainer un (ou plusieurs ?) modèle d'apprentissage automatique (machine learning).

A l'aide des annotations, nous avons entrainé un modèle (SVM + Bag of Words) de classification binaire, c-a-d qui va indiquer si une réponse parle de transport ou non. Après différents tests de paramétrage de l'algorithme d'apprentissage, nous arrivons à une classification avec 86% de précision ce qui permet d'avoir une bonne base !

La figure ci-dessous présente le pourcentage de réponses lié à la thématique du transport pour chaque question.

Suite à ces résultats, nous proposons d'analyser les réponses associé aux transports (grâce au modèle). Une première étape consiste à analyser les mots utilisés. Pour cela, nous avons construit plusieurs lexiques:

  • Lexique du Transport : contient des mots liés aux infrastuctures, moyen de locomotion, etc.
  • Lexique du changement : contient les verbes usuels du changement (augmenter, limiter, adapter, etc.).

Dans ce document, nous vous proposons de visualiser les cooccurrences entretenues par les termes de différents lexiques. Plus particulièrement, quel sont les verbes de changement associées le plus à un terme. Pour identifier les cooccurrences, nous utilisons les termes présents dans nos deux lexiques. Une fois identifié, nous vérifions si deux termes appartenant à une même fenêtre et un lexique différent apparaissent dans une même fenêtre (voir Figure ci-dessous). Dans les résultats présentées dans ce document, la fenêtre est uni-directionnelle et de taille 5.

Exemple: Cooccurrence identifiée dans une fenêtre de taille 5.


Les résultats présentées dans ce document concernent les questions suivantes :

  • Que faudrait-il faire selon vous pour apporter des réponses à ce problème ?
  • Si oui, de quelle manière votre vie quotidienne est-elle touchée par le changement climatique ?
  • Qu'est-ce qui pourrait vous inciter à changer vos comportements comme par exemple mieux entretenir et régler votre chauffage, modifier votre manière de conduire ou renoncer à prendre votre véhicule pour de très petites distances ?
  • Quelles seraient pour vous les solutions les plus simples et les plus supportables sur un plan financier pour vous inciter à changer vos comportements ?
  • Si oui, que faudrait-il faire pour vous convaincre ou vous aider à utiliser ces solutions alternatives ?
  • Si non, quelles sont les solutions de mobilité alternatives que vous souhaiteriez pouvoir utiliser ?



Pour chacune des questions, nous affichons le nombre de cooccurrences entretenues entre les termes de lexiques différents dans une heatmap. Chaque case de la figure indique la valeur obtenue (nombre de cooccurrence) entre deux termes.


QUXVlc3Rpb246MTYx - Que faudrait-il faire selon vous pour apporter des réponses à ce problème ?

QUXVlc3Rpb246MTQ3 - Si oui, de quelle manière votre vie quotidienne est-elle touchée par le changement climatique ?

QUXVlc3Rpb246MTUw - Qu'est-ce qui pourrait vous inciter à changer vos comportements comme par exemple mieux entretenir et régler votre chauffage, modifier votre manière de conduire ou renoncer à prendre votre véhicule pour de très petites distances ?

QUXVlc3Rpb246MTUx - Quelles seraient pour vous les solutions les plus simples et les plus supportables sur un plan financier pour vous inciter à changer vos comportements ?

QUXVlc3Rpb246MTU1 - Si oui, que faudrait-il faire pour vous convaincre ou vous aider à utiliser ces solutions alternatives ?

QUXVlc3Rpb246MjA3 - Si non, quelles sont les solutions de mobilité alternatives que vous souhaiteriez pouvoir utiliser ?