Les chercheurs du CRI Marc Santolini et Bastian Greshake Tzovaras explorent comment les tweets sur les symptômes COVID19 autodéclarés peuvent aider à prédire les prochaines vagues de pandémie, et plus généralement la montée et la chute de la maladie. Avec l’aide de Naila El Haouari (stagiaire au CRI) et Samuel Fraiberger (NYU & MIT MediaLab) ils ont parcouru les tweets publics de la région parisienne et les ont filtrés par des mots-clés sur les symptômes. Bien que cela semble déjà donner une bonne corrélation entre le nombre de tweets et l’évolution de la maladie, le filtrage automatique est très sommaire. En général, les gens ne twittent pas seulement sur les symptômes lorsqu’ils sont en train de tomber malade, mais aussi sur les moments passés où ils sont tombés malades, ou lorsqu’ils parlent des nouvelles générales.
Pour filtrer ces faux positifs, Marc & Bastian ont besoin de votre aide pour voir quels sont les tweets qui décrivent un symptôme aigu et ceux qui ne le décrivent pas ? Votre contribution aura un impact direct ! Grâce à ce filtrage supplémentaire, ils pourront non seulement affiner leurs analyses actuelles, mais aussi d’entraîner l’intelligence artificielle à créer de meilleures stratégies de filtrage automatisé.
Votre aide n’a pas besoin de se limiter à annoter des tweets. Comme le CRI se consacre à la science ouverte, toutes les données et les méthodes d’analyse sont partagées publiquement. Vous pouvez donc télécharger vous-même les tweets et les annotations pour reproduire les résultats et améliorer les analyses.
Consultez le site du projet pour en savoir plus et commencer à contribuer: http://covid-twitter.thecommons.science/.