OneSoil développe des applications fermières gratuites qui sont utilisées dans plus de 180 pays à travers le monde. Dans notre travail, nous utilisons le big data et l'apprentissage automatique, et une autre quête pour nous consiste à trouver des données de vérité terrain. Voici comment nous résolvons cette tâche non triviale.
Pourquoi OneSoil Machine Learning? Afin de déterminer les limites des champs, des cultures, des stades phénologiques, des rendements, des dates de semis et des dates de récolte à l'aide d'images satellites. Tout cela est soit déjà dans les applications OneSoil, soit y apparaîtra dans un proche avenir.
Regardons l'exemple de la détermination des limites des champs à l'aide d'images satellites. Pour un agriculteur, délimiter les limites de son champ est la toute première étape du processus de digitalisation de sa ferme. C'est la pierre angulaire sans laquelle aucun autre travail d'application n'est possible. Et la tâche n'est pas si simple: avant, les agriculteurs la résolvaient car ils parcouraient leurs champs avec des traceurs GPS sur des VTT, se débattaient avec des orthophotomaps, bref, c'était cher et long. OneSoil, de son côté, a appris à reconnaître les limites de champ à l'aide d'images satellites: vous ouvrez l'application, appuyez sur le bouton «ajouter des champs», sélectionnez le vôtre sur la carte avec des champs reconnus - et c'est tout.
Comment avons-nous fait ça? Au début, nous ne disposions de données que de quelques fermes en Biélorussie et dans les pays baltes, à l'aide desquels les algorithmes d'apprentissage automatique ont appris à prédire les limites des champs. Cela a fonctionné comme ceci: pour chaque champ réel (dont nous connaissions les limites grâce aux fermes), nous avons calculé la zone de coïncidence avec les limites prédites par les algorithmes. Si l'algorithme a encerclé les sections supplémentaires, il a reçu une amende pour cela. Alors il a étudié. Cet indicateur est appelé intersection sur union, il peut prendre des valeurs de 0 à 1, où 1 est une correspondance parfaite. Dans notre pays, cet indicateur varie d'une région à l'autre, mais se situe en moyenne entre 0,85 et 0,88.
Ensuite, nous avons commencé à montrer au réseau de neurones des millions d'images de champs agricoles afin qu'il apprenne à déterminer où se trouve le champ et où il ne se trouve pas. L'algorithme prend beaucoup de temps à apprendre, nous regardons les résultats et nous l'améliorons plusieurs fois jusqu'à ce que la précision de la détermination des limites des champs pour une région particulière devienne bonne. Comment comprenons-nous que la précision s'est améliorée? Encore une fois, nous comparons nos calculs avec des données réelles sur les champs. Maintenant, il y a 57 pays dans lesquels nous sommes bons pour définir les limites des champs.
Lorsque nous définissons avec confiance les champs, disons en Ukraine, cela ne signifie pas que tout fonctionnera de la même manière quelque part au Brésil - après tout, il y a leurs propres champs et leurs propres caractéristiques agricoles. Par conséquent, nous avons à nouveau besoin de données réelles pour affiner et améliorer notre algorithme.
. , . ? .
OneSoil , , , . — R&D .
, . . (, ), , . , . , , . , . , . OneSoil , .
133 | 2,8 — , OneSoil. 2020 .
R&D , , . .
OneSoil Map 2018 (Guido Lemoine), Joint Research Center (JRC). (ESA) Data Science . « , - , — . — , ». R&D , JRC .
OneSoil — . , , . , , .
4 7 . , , — R&D. 2–3 . — . « 2020 100 » — .
2018 CEO . , . , : « ». .
, . . 50 , OneSoil .
392 | 126 — ground truth . 2020 .
Lorsque nous avons beaucoup de données provenant de sources ouvertes et de différents partenaires, nous améliorons nos algorithmes que nous utilisons déjà dans les applications OneSoil (ou le seront dans un proche avenir). Lorsque nous avons beaucoup de données d'utilisateurs, nous améliorons à nouveau la précision de nos calculs. C'est ainsi que les données et la technologie fonctionnent l'une pour l'autre.