Comment l'analyse de recherche Google peut détecter les poches de COVID-19 plus tôt que les autorités ne le peuvent

L'anosmie - manque d'odeur - est un symptôme du COVID-19.



Selon les données de 2,5 millions d'utilisateurs de l'application de symptômes COVID-19 de King's College London, les deux tiers des utilisateurs diagnostiqués avec la maladie ont signalé une anosmie. Dans le même temps, seulement un cinquième des personnes chez lesquelles la maladie n'a pas été détectée ont signalé le même symptôme. Pendant ce temps, des dizaines de milliers de personnes se tournent chaque jour vers Google pour une réponse à la question de savoir pourquoi elles ont soudainement cessé de sentir. Y a-t-il une corrélation entre le terme de recherche «Je ne peux pas sentir» et le nombre d'infections au COVID-19? Oui, il existe une telle corrélation.















Cette étude montre que les recherches liées à l'anosmie correspondent à des épidémies presque parfaites à New York, au New Jersey, en Louisiane et au Michigan.



Un modèle construit par Bill Lampos et une équipe de scientifiques de l'UCL montre que l'analyse de recherche Google prédit une augmentation des cas de COVID-19 détectés pendant jusqu'à deux semaines. Parmi les requêtes les plus révélatrices figurent les requêtes sur l'anosmie.



Ainsi, les recherches liées à l'anosmie peuvent aider à prédire les épidémies de COVID-19. Mais les données issues de l'analyse de ces requêtes peuvent-elles empêcher de telles épidémies?



Cela dépend de la rapidité avec laquelle vous pouvez obtenir les données souhaitées. Si vous prévoyez d'utiliser ces informations pour répondre de manière proactive aux futures épidémies, vous avez besoin de données en temps réel.



Le 5 juin, Houston, pour la première fois, devançait New York dans les requêtes de recherche liées à l'anosmie.



Les symptômes du COVID-19 apparaissent entre deux jours et deux semaines après l'infection, selon le CDC . Cela signifie que vous n'avez que 14 jours pour faire quelque chose en fonction des données de la requête de recherche. Dans le même temps, vous devez savoir où vivent exactement les personnes qui ont tapé "Je ne peux pas sentir" dans Google. Et vous devez vous renseigner à ce sujet au moment où de telles demandes tombent dans le moteur de recherche.



De plus, vous devez savoir combien de personnes se tournent vers Google avec une demande similaire. Et il ne doit pas s'agir de données approximatives et non agrégées (comme celles trouvées dans Google Trends ).



Une façon d'obtenir ce type de données en temps réel et des données précises consiste à acheter les mots clés "Je ne peux pas sentir" dans Google Ads , la plateforme de publicité en ligne Google.



Ensuite, vous devez créer une simple annonce pour l'anosmie (ou, mieux encore, utiliser une source d'information fiable sur l'anosmie). Enfin, il ne reste plus qu'à choisir un endroit sur la carte à partir duquel vous souhaitez recevoir des données sur la demande "Je ne sens pas".



L'annonce apparaîtra ensuite sur la page de résultats de recherche pour toute personne qui recherche "Je ne peux pas sentir". Cela sera fait pour les requêtes saisies à la place du monde visé par l'annonce.



Que les utilisateurs de Google cliquent ou non sur une telle annonce, Google Ads recevra des informations sur le nombre d'impressions d'annonces. Ces données seront disponibles une heure après la session de recherche.



Voici un graphique montrant les recherches de "Je ne peux pas sentir" dans les 250 villes les plus peuplées des États-Unis, à partir du 23 avril. L'axe des y indique le nombre de sessions de recherche.





Nombre de recherches pour les mots "Je ne peux pas sentir"



Je dispose de ces données car, à partir du 23 avril, j'ai acheté les mots clés "Je ne peux pas sentir" dans Google Ads et j'ai ciblé des annonces dans 250 villes américaines avec le plus grand nombre d'habitants.



Peut-être que ce calendrier est assez difficile à percevoir. Affichons les mêmes données sur une carte américaine.





Nombre de recherches pour "Je ne peux pas sentir" visualisées à l'aide d'une carte des États-Unis.



Ici, vous pouvez voir que les recherches pour "Je ne peux pas sentir" à la fin avril et au début mai provenaient principalement de New York et Chicago. Ce sont les deux villes les plus durement touchées par le COVID-19 au cours de cette période.



De plus, vous pouvez voir qu'en juin, les indicateurs augmentent à Houston et à Dallas, au Texas. Le 5 juin, pour la première fois, Houston devançait New York dans les recherches liées à l'anosmie. Et depuis le 13 juin, Houston occupe la première place pour de telles demandes parmi les 250 villes américaines les plus peuplées.



Voici les graphiques, à partir desquels vous pouvez comparer le nombre de recherches d'anosmie à Houston et le nombre de tests positifs pour COVID-19 au cours des trois premières semaines de juin.





Tests COVID-19 positifs et recherches d'anosmie



Je tiens à souligner que quiconque prend quelques heures pour trier Google Ads peut reproduire ces expériences.



J'ai commencé à acheter des mots-clés liés à l'anosmie parce que je voulais en savoir plus sur les personnes qui se trouvaient dans les endroits en quarantaine.



Mais après quelques semaines de cette expérience, j'ai réalisé que cette méthode d'exploration de données peut être utilisée pour collecter des informations sur les régions dans lesquelles les données étaient "en quarantaine".



Par conséquent, l'achat de mots-clés et le ciblage d'annonces auprès des citoyens de certains pays peuvent vous aider à savoir quelles autorités de quels pays mentent à leurs citoyens (ou au monde entier). Et cela, en passant, s'applique non seulement au COVID-19, mais à tout autre sujet. Jetez un œil à cette étude , par exemple.



Le gouvernement cache le nombre de décès, c'est vrai à 100%. Combien ils cachent est plus difficile à dire. Ils ont, pendant longtemps, complètement contrôlé les données, par conséquent, nous n'avons pas eu la possibilité d'accéder à des informations indépendantes sur ce qui se passait.



Zitto Kabwe, chef du parti d'opposition ACT-Wazalendo, Tanzanie





Cas de COVID-19 en Tanzanie La



Tanzanie, un pays d'Afrique de l'Est, a signalé 509 cas d'infection au COVID-19 depuis le 8 mai. Depuis lors, aucun nouveau cas n'a été signalé.



L'analyse des requêtes de recherche sur l'anosmie est en corrélation avec le nombre de cas détectés d'infection au COVID-19 et permet même de prédire cet indicateur. L'anosmie est le symptôme le plus courant du COVID-19. Tout cela signifie qu'il faut s'attendre à ce qu'en Tanzanie, s'il n'y a vraiment pas de nouveaux cas depuis le 8 mai, nous chercherons rarement des informations sur l'anosmie.



Cependant, la même semaine que le gouvernement tanzanien a cessé de signaler de nouveaux cas d'infection au COVID-19, le pays s'est classé deuxième au monde pour les recherches liées à l'anosmie.



Apparu très bientôtMessages du terrain, qui indiquaient les hôpitaux bondés et les enterrements nocturnes.



Les critiques ont accusé le gouvernement tanzanien de ne pas avoir informé le public de l'ampleur réelle de la propagation de la maladie et du nombre de vies qu'elle a coûtées.



Afin de voir la vraie image, basée sur les données des Tanzaniens, depuis l'époque où le gouvernement tanzanien se taisait, j'ai acheté les mots-clés "je ne peux pas sentir" et j'ai dirigé la recherche dans toute la Tanzanie.



Voici une carte thermique de toutes les régions de la Tanzanie.





Analyse des requêtes pour les mots «Je ne peux pas sentir» en Tanzanie



Il s'est avéré que du 8 au 31 mai 2020, les résidents anglophones de la Tanzanie ont effectué en moyenne 93 requêtes par jour.



L'une des fonctionnalités de Google Ads est que vous ne pouvez pas diffuser d'annonces ici aux utilisateurs dont la langue du navigateur est définie sur le swahili. Cette langue est parlée par environ 12,15 Tanzaniens pour 1 anglophone. Il convient de garder à l'esprit que Google dispose de données provenant d'environ 5,1% des appareils du pays.



En conséquence, il s'avère que le nombre réel de recherches pour l'anosmie en Tanzanie est, en fait, proche d'environ 1824 par jour. Google n'autorise pas la divulgation d'au moins 94,9% des données des campagnes publicitaires, j'ai donc multiplié le nombre de sessions de recherche trouvées par 19,61 afin d'estimer grossièrement ce qui se passe réellement dans le pays.



A titre de comparaison, entre le 8 et le 31 mai, 3251 séances de recherche d'anosmie ont été enregistrées à New York. Dans le même temps, 18 143 cas d'infection ont été signalés. Le rapport entre les sessions de recherche et les infections est de 1: 5,5.



À Chicago, le même ratio était de 1: 4 sur la même période.



Dans le district de Columbia, il est de 1: 1,96.



Dans la plupart des villes américaines que j'ai ciblées, le nombre de cas confirmés de COVID-19 a dépassé le nombre de recherches de 1,75 à 6 fois.



Et en Tanzanie, environ 1824 recherches d'anosmie ont été effectuées chaque jour depuis le 8 mai.



Les résultats exacts sont hors de question, cependant, je ne prends pas en compte aux États-Unis des demandes plus vagues liées à l'anosmie, telles que la "perte d'odeur" ("perte d'odeur"). De plus, je ne suis pas en mesure de savoir exactement quelles données sur les utilisateurs, par rapport aux données sur les appareils, Google possède pour une région particulière.



Mais dans tous les cas, j'estime qu'en mai, le nombre réel de cas quotidiens de COVID-19 en Tanzanie pourrait être exprimé en un petit nombre à quatre chiffres.



Peut-être que ce nombre est inférieur. Mais ce n'est certainement pas égal à zéro.



Voici comment les données de Google peuvent aider à lutter contre le COVID-19.



Ce qui, appliqué à notre projection à court terme du nombre de personnes atteintes de COVID-19, peut être appelé «naucasting», c'est l'observation de la propagation de la maladie à l'aide des moteurs de recherche Google. C'est une technique de travail comme le prouve le modèle de Bill Lampos.



Mais cette technique peut échouer. Google Flu Trends, le premier et le plus connu des outils de naukastage, a cessé de fonctionner trois ans après son lancement. Il n'a pas été en mesure de prédire le pic de l'épidémie de grippe de 2013.



«Mais la conclusion la plus utile qui puisse être tirée n'est pas que l'analyse des données de recherche n'est pas fiable», écrit Sam Gilbert. «C'est un ajout à d'autres méthodes, mais pas un remplacement», ajoute-t-il.



Un autre modèle que je suis est soutenu par l' Imperial College de Londres . Ce modèle estime le nombre réel d'infections en Tanzanie au cours des quatre semaines entre le 29 avril et le 26 mai 2020 à 24689. L'



analyse des données de recherche Google peut être un indice précieux pour ceux qui observent une situation et ne se limite pas aux données officielles.



Même s'il s'avère que l'analyse des requêtes de recherche liées à l'anosmie ne permet pas de prédire la propagation du COVID-19, je ne pense pas que nous devions succomber au sentiment qui a émergé après l'échec de la plateforme Google Flu Trends.



Ce n’est pas le moment d’être pessimiste à propos du naucasting. Le fait est que les gens de nos jours se tournent plus que jamais vers Google pour informer le moteur de recherche de choses qu'ils ne disent à personne d'autre. Et maintenant, plus que jamais, nous avons besoin des meilleurs outils disponibles pour percer les informations cachées et, en capturant des informations sur les pensées, les peurs, les espoirs (ou les symptômes) des gens, pour comprendre ce dont on ne parle pas.



Si les autorités cherchent à cacher des données, tentent de cacher la vérité aux citoyens de leur pays ou du monde entier, alors pour empêcher ce dont nous avons parlé ici, elles devront bloquer complètement Google. Et pas parce que les gens peuvent utiliser Google pour trouver des informations objectives, mais parce que l'analyse des requêtes de recherche Google peut indiquer la direction de la recherche pour ceux qui ne se contentent pas des données officielles.



"La publicité cesse d'être une publicité si elle aide à trouver des réponses à certaines questions." C'est un slogan qui aiderait mes collègues à mieux percevoir ce qu'ils font. Bien qu'ils n'appréciaient pas le fait qu'ils étaient essentiellement des marchands, ils utilisaient Google Ads à des fins commerciales (afin de vendre aux gens des biens et des services dont ils n'avaient pas besoin).



Lorsque vous interrogez Google sur les critiques de nouvelles baskets, ou interrogez un moteur de recherche sur la situation de quarantaine actuelle, ou sur des symptômes étranges que vous avez soudainement, la première chose qui apparaîtra sur les SERPs sera, d'un point de vue technique , La publicité.



C'est d'ailleurs la réponse à une question. Et, en fait, beaucoup plus.



Envisagez-vous d'apprendre quelque chose en utilisant la technique d'analyse des requêtes de recherche présentée dans cet article?






All Articles