Les algorithmes obtiennent la quantité maximale de connaissances à partir d'images

Anonim

Les images numériques et les vidéos contiennent beaucoup plus d'informations que les ordinateurs n'en extraient actuellement. À l'aide d'algorithmes intelligents, une équipe de recherche dirigée par le professeur Stefan Roth vise à obtenir le maximum de connaissances à partir d'images.

Une scène de rue typique peut être vue sur l'écran dans le bureau de Stefan Roth - mais du point de vue d'un ordinateur. Des voitures teintées de rouge arrivent et sortent des espaces de stationnement, des piétons violets s'affairent, des plantes marquées en vert indiquent la limite. "Pour l'ordinateur, une vidéo ne comprend d'abord que des pixels", explique le professeur d'informatique Stefan Roth. "Nous lui apprenons à interpréter les pixels", ajoute le responsable du Visual Inference Lab de la Technische Universität Darmstadt.

L'équipe de Roth enseigne des algorithmes intelligents pour détecter les voitures, les piétons ou même les objets potentiellement dangereux dans les images radiographiques de la sécurité des transports. Le logiciel mis au point par les scientifiques de TU Darmstadt reconstruit également les informations sur l’image qui peuvent être cachées derrière des images floues ou floues. La question de recherche qui les guide:

Quelle quantité d'informations peut être extraite d'une image numérique? La nécessité d'une analyse d'image automatique est énorme. Des millions d'appareils photo numériques créent un flot d'images sans précédent. Si les ordinateurs pouvaient interpréter de manière fiable non seulement des scènes routières ordonnées comme sur une autoroute, mais aussi une circulation qui peut sembler plutôt chaotique, par exemple à un carrefour, «une conduite entièrement autonome serait également possible dans des centres urbains très fréquentés», explique Roth. "Il existe de nombreux autres domaines d'application potentiels", ajoute l'informaticien. Des systèmes d'analyse d'image intelligents pourraient aider les utilisateurs dans des tâches fastidieuses, telles que le contrôle des bagages dans les aéroports. L'utilisation des terres peut être automatiquement classée dans les images satellitaires, par exemple pour déterminer sur quels champs le blé pousse.

Mais enseigner les ordinateurs à voir est difficile. Il y a des décennies, les chercheurs ont tenté de créer directement des programmes imitant la perception humaine. Mais cela a été en grande partie infructueux, du moins jusqu'à présent. "Les approches actuelles sont très axées sur les données", déclare Roth. Les ordinateurs apprennent au moyen d'une grande quantité d'exemples. La base est souvent ce qu'on appelle les réseaux neuronaux artificiels. Ceux-ci sont inspirés par la structure du cerveau: les cellules nerveuses, appelées en langage technique neurones, sont interconnectées par des voies neuronales. Lorsque des photos de voitures sont présentées à un tel réseau, des motifs récurrents tels que le châssis, les roues et les phares renforcent certaines voies neurales. Si des motifs similaires apparaissent sur des photos inconnues, les mêmes neurones deviennent actifs via les voies neuronales intensifiées que pendant l'entraînement: le réseau neuronal a appris à reconnaître les voitures dans les images. Ou des piétons et des pots de plantes.

Le piège: Pendant l'entraînement, il faut littéralement montrer l'ordinateur sur chaque image d'échantillon où se trouve la voiture, où se trouve le piéton et où se trouve la marmite. "Au début, cela nous prenait une heure et demie par image", dit Roth. Parce que les ordinateurs ne reconnaissent les objets de manière fiable qu'après des dizaines de milliers d'exemples, ce n'est pas toujours pratique. "Pour cette raison, nous essayons tout d'abord de nous en sortir avec moins de données et, deuxièmement, nous visons à accéder à des sources de données qui contiennent déjà certaines informations", explique Roth. Les jeux informatiques, par exemple, montrent des scènes de rue réalistes. Sur une photo d'une scène réelle, les chercheurs doivent d'abord séparer minutieusement les objets les uns des autres en traçant leurs contours. "Dans un jeu sur ordinateur, cependant, les objets individuels sont déjà séparés", explique Roth. Il suffit alors de dire au réseau neuronal où se trouvent les voitures et la surface de la route.

Pour se débrouiller avec moins de données, les chercheurs proposent plus de trucs. "Sur la base des informations contenues dans le jeu, nous pouvons détecter quel objet déjà connu réapparaît plus tard", explique Roth. Cela signifie que l'objet, par exemple une voiture particulière, n'a plus besoin d'être annoté à chaque image d'une séquence vidéo.

Le succès de l'approche développée par les scientifiques de TU Darmstadt est mis en évidence par la vidéo interprétée par ordinateur d'une rue commerçante très fréquentée. Plus loin dans la rue, des piétons et des véhicules éloignés sont détectés.

menu
menu