Intelligence artificielle et apprentissage automatique dans la diffusion Web: tendances récentes





Bonjour, Habr. Je m'appelle Alexander Alpern, je suis PDG et fondateur du Webinar Group. Aujourd'hui, je voudrais discuter de questions telles que l'utilisation des technologies d'apprentissage automatique et d'intelligence artificielle dans la diffusion sur Internet, le traitement du contenu multimédia et sa livraison à l'utilisateur.



Pourquoi est-ce? L'augmentation des vues, la fidélité des téléspectateurs, le contenu informatif des programmes, ainsi que la réduction de la charge sur le réseau ne sont qu'une partie des avantages offerts par les technologies modernes.



Pandémie + trafic = problèmes



Selon TeleGeography, qui a analysé les taux de change du trafic Internet mondial, la consommation de trafic a explosé en 2020. Ainsi, la moyenne mondiale est passée d'environ 120 à 170 Tbps, à son apogée - 300 Tbps.



image



En principe, la croissance était déjà assez importante, mais l'année dernière, tous les records ont été battus - la croissance était de 47%. Le cercueil s'ouvre simplement - des centaines de millions de personnes ont été enfermées chez elles, de sorte que l'utilisation de messageries Internet, de plates-formes d'apprentissage en ligne, de services de jeux en nuage et, bien sûr, de plates-formes vidéo comme YouTube a considérablement augmenté.



Les points d'échange de trafic les plus chargés se trouvaient en Allemagne, à Francfort (DE-CIX FRA) et aux Pays-Bas, à Amsterdam (AMS-IX). En mars, le centre pair à pair DE-CIX a atteint un pic de trafic historique de 9,1 Tbps .



En Russie, une situation similaire a été observée: en mars-avril 2020, les cinémas en ligne ont enregistré une augmentation du trafic de 2 à 4 fois. La raison est toujours la même - à cause de la pandémie et de l'auto-isolement, les gens ont été isolés dans leurs propres appartements et maisons, Internet est donc devenu l'un des moyens de se divertir. Le trafic mobile au cours de la même période a augmenté de 10 à 30%, principalement en raison des chats vidéo et des messageries instantanées.



Il est arrivé au point que Netflix et YouTube ont baisséqualité vidéo pour les utilisateurs européens. YouTube a commencé à afficher des vidéos en définition standard au lieu de HD, et Netflix a baissé la résolution de 25%.



Que faire?



Idéalement, augmentez la capacité et le débit de l'infrastructure réseau, à la fois localement et globalement. Tout est compliqué ici, car les fournisseurs d'Internet, de communications cellulaires et d'autres services de télécommunication ne peuvent pas toujours investir des ressources importantes.



La deuxième option consiste à optimiser votre contenu. Cela ne se réfère pas tant à la réduction de la qualité de la vidéo ou de l'audio que d'autres méthodes. Nous les examinerons ci-dessous.



Optimiser la compression de différentes vidéos



Netflix est le plus grand fournisseur de contenu multimédia. Il y a plusieurs années, elle a introduit la pratique de sélectionner différents profils de compression pour différentes vidéos, en tenant compte de leurs caractéristiques.



Netflix possède une riche expérience vidéo, y compris la compression de contenu. En utilisant ses propres développements, l'entreprise a formé un système de type neuronal qui évalue les attributs vidéo de bas niveau, détermine sa classe, puis trouve les paramètres optimaux pour chaque classe.



Des paramètres tels que la dynamique de l'image, le degré de clarté et la complexité globale du tracé sont évalués. En quelques minutes, le système évalue la dynamique de l'intrigue, le degré de clarté et la saturation globale de «l'image». Sur la base des données d'analyse, le système prend une décision sur l'optimisation vidéo. Ainsi, si l'émission ou la diffusion n'est pas très dynamique, la qualité vidéo peut être réduite. Si l'image change rapidement, que les couleurs sont saturées et que le tracé est complexe, la qualité diminue légèrement ou reste au même niveau.



image



Ainsi, l'optimisation de la transmission vidéo est obtenue, la charge sur l'infrastructure du réseau est réduite. Le travail avec la vidéo est effectué de manière à ce que le résultat final soit invisible pour les consommateurs de contenu. En d'autres termes, le public ne remarque rien. Pour la compression, l'entreprise utiliseDifférents codecs et modèles de compression, y compris 4K VMAF , afin que le réseau ne soit pas encombré même lors de la diffusion de vidéo 4K.



Sélection de la source vidéo avec une qualité optimale



Une résolution élevée, et donc une grande quantité de données transmises, ne signifie pas une vidéo de bonne qualité livrée au destinataire. Un exemple de ceci est le gif publié ci-dessus.



Le choix d'une source de vidéo de bonne qualité est un problème urgent pour les distributeurs de bouquets de chaînes de télévision. Ssimwave a mis au point une solution d'apprentissage automatique qui sélectionne automatiquement la source de contenu de la plus haute qualité.



image



Un exemple est la diffusion de la chaîne CNN. Dans une source, les paramètres vidéo sont 1080 @ 29.97i, MPEG-2, 40 Mbps, et dans l'autre - avec 720p60, H264, 22 Mbps. Comme mentionné ci-dessus, une haute résolution ne signifie pas du tout une bonne qualité vidéo pour le destinataire. La qualité est influencée par un grand nombre de facteurs, notamment les formats de compression et de couleur, la plage dynamique, les procédures de transcodage, les technologies de livraison et les versions des lecteurs abonnés.



Il est tout simplement impossible d'évaluer tout cela manuellement. Mais le réseau neuronal est capable de faire face à la tâche sans aucun problème. Ssimwave a pu développer une solution qui vous permet de sélectionner la source de transmission avec la plus haute qualité et un volume de données minimum en quelques secondes.



Pas uniquement par le trafic



L'apprentissage automatique, l'intelligence artificielle et les réseaux de neurones aident non seulement à optimiser le volume de contenu transmis. Il existe de nombreux autres domaines où la technologie est tout simplement indispensable maintenant.



Navigation dans le catalogue vidéo



De nombreuses sociétés de contenu multimédia ont des catalogues - avec des jeux, des vidéos, des films et des émissions. Selon Netflix, lors du choix d'un film à regarder, les abonnés sont plus susceptibles de prêter attention aux icônes d'affiche de film. Selon le directeur créatif de l' entreprise Nick Nelson, dans 82% des cas, le choix d'un film est déterminé par l'icône / l'affiche présentée.



En conséquence, plus l'image est réussie, plus la probabilité que le spectateur choisisse ce contenu particulier est élevée. Tout cela est pertinent non seulement pour la vidéo, mais également pour d'autres biens numériques.



image



Pour confirmer ou réfuter l'opinion de Nelson, Accedo s'est associé à AWS et à British Television Corporation ITV pour exécuter un test A / B afin d'identifier les facteurs qui influencent les choix des utilisateurs. La conclusion n'est pas trop surprenante: les utilisateurs choisissent un film, guidés par leurs émotions lors de la visualisation des captures d'écran. L'évaluation de la capture d'écran prend moins de 2 secondes.



En conséquence, les technologies d'apprentissage automatique et d'IA peuvent être utilisées pour sélectionner des captures d'écran avec des conversions optimales. Pour les films, ces captures d'écran incluent généralement l'image d'un héros dont le visage exprime des émotions, et le plus souvent, des images avec des antagonistes sont choisies. Les captures d'écran avec des groupes de héros sont moins intéressantes.



En outre, l'intelligence artificielle a aidé à former différentes collections pour différentes catégories / segments de téléspectateurs - à la fois socialement et géographiquement. Maintenant, il n'est pas surprenant que les catalogues soient différents dans différents pays ou régions d'un même pays. Mais il y a à peine 10 à 20 ans, la situation était différente.



Augmenter le contenu informatif de la vidéo



image



Il s'agit de créer et de structurer des métadonnées multimédias pour différentes vidéos - par exemple, des vidéos de sport. IBM Watson, un supercalculateur IBM doté d'une intelligence artificielle intégrée, s'est particulièrement distingué ici. Il peut créer des descriptions visuelles en temps réel, transcrire l'audio, ajouter des notes éditoriales.



Ces compétences sont utilisées tout en travaillant avec des événements sportifs populaires - par exemple, la Coupe du monde, l'US Open, le Super Bowl et d'autres.



L'IA traite le flux de diffusion, en marquant les points clés, en ajoutant des notes et des commentaires. En outre, le flux déjà traité est soit envoyé aux éditeurs du programme de diffusion, soit diffusé directement aux téléspectateurs.



Réduction du taux de désabonnement des clients



L'apprentissage automatique et l'intelligence artificielle sont excellents pour éviter le churn des clients. Cela se produit si l'intérêt des utilisateurs pour le contenu diminue. Selon nos données, un contenu inintéressant ou trop complexe peut entraîner un taux de désabonnement pour un quart des utilisateurs. C'est beaucoup et cela ne devrait pas être autorisé.



Afin de réduire le taux de désabonnement, il est important de:



  • comprendre ce qui peut provoquer une désabonnement
  • automatiser les analyses
  • utiliser des outils de prévision


Analytics utilise des données telles que les informations utilisateur, la visibilité du contenu, les évaluations des utilisateurs, l'activité d'interaction des utilisateurs avec assistance (ici, nous pouvons parler non seulement de vidéos, mais également de cours en ligne, comme dans notre cas) et d'autres données. Par exemple, sur la plate- forme We.Study, le système lui-même «surveille» régulièrement le cours, fournissant des recommandations spécifiques pour l'améliorer, vous permettant de suivre le comportement des participants et de prévoir le taux de désabonnement.



Sur la base des résultats de l'analyse, certaines actions peuvent être entreprises - pour changer le contenu, le programme de formation, s'il s'agit de cours - pour améliorer l'interaction avec les utilisateurs.



Personnaliser le contenu présenté



image



Tous les utilisateurs de YouTube savent quel est le contenu recommandé. Plus la recommandation est réussie, plus il y a de chances que l'utilisateur regarde la vidéo ou regarde un autre type de contenu.



Cas illustratif - le projet IBM Watson et la plate-forme Iris.tv. Les partenaires ont réussi à réaliser une personnalisation optimale du contenu. Pour ce faire, les vidéos sont d'abord transmises à un supercalculateur qui collecte les métadonnées. Ensuite, la plateforme analyse ces données pour créer de nouvelles catégories et titres de la cinémathèque.



De plus, avec l'aide de l'apprentissage automatique, la plateforme a pu s'entraîner à analyser les intérêts d'utilisateurs spécifiques afin de garantir d'offrir une vidéo intéressante à une personne après avoir regardé le programme suivant.



Et après?



Il existe de nombreux cas d'utilisation de l'IA et de l'apprentissage automatique, seuls les points les plus révélateurs sont donc indiqués dans l'article. La conclusion générale est que ces technologies commencent à être utilisées systématiquement. Auparavant, ils n'étaient utilisés que comme test. Désormais, des centaines et des milliers d'entreprises de contenu utilisent l'apprentissage automatique pour optimiser le contenu, déboguer les processus métier, attirer de nouveaux utilisateurs et conserver les anciens.



Au cours des 3 à 5 prochaines années, la très grande majorité des fournisseurs de contenu multimédia adopteront des technologies modernes, car elles permettent de résoudre les problèmes des clients individuels et de l'entreprise dans son ensemble.



All Articles