Robust and efficient models for action recognition and localization

Dan Oneata

Thèse Année : 2015

Robust and efficient models for action recognition and localization

Modèles robustes et efficaces pour la reconnaissance d'action et leur localisation

(1)

Dan Oneata

Fonction : Auteur

Learning and recognition in vision

Résumé

Video interpretation and understanding is one of the long-term research goals in computer vision. Realistic videos such as movies present a variety of challenging machine learning problems, such as action classification/action retrieval, human tracking, human/object interaction classification, etc. Recently robust visual descriptors for video classification have been developed, and have shown that it is possible to learn visual classifiers in realistic difficult settings. However, in order to deploy visual recognition systems on large-scale in practice it becomes important to address the scalability of the techniques. The main goal is this thesis is to develop scalable methods for video content analysis (eg for ranking, or classification).

Vidéo d'interprétation et de compréhension est l'un des objectifs de recherche à long terme dans la vision par ordinateur. Vidéos réalistes tels que les films présentent une variété de problèmes difficiles d'apprentissage machine, telles que la classification d'action / récupération d'action, de suivi humaines, la classification interaction homme / objet, etc Récemment robustes descripteurs visuels pour la classification vidéo ont été développés, et ont montré qu'il est possible d'apprendre classificateurs visuels réalistes des paramètres difficile. Toutefois, afin de déployer des systèmes de reconnaissance visuelle à grande échelle dans la pratique, il devient important d'aborder l'évolutivité des techniques. L'objectif principal est cette thèse est de développer des méthodes évolutives pour l'analyse de contenu vidéo (par exemple pour le classement ou la classification).

Mots clés

Action recognition Action localization Event recognition Video representation Efficiency Classification

Reconnaissance des actions Localisation des actions Reconnaissance des événements Représentation vidéo Efficacité Classification

Domaines

Vision par ordinateur et reconnaissance de formes [cs.CV]

Fichier principal

ONEATA_2015_archivage.pdf (12.53 Mo)

Origine	Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-01217362

Soumis le : lundi 19 octobre 2015-14:52:16

Dernière modification le : mercredi 15 mai 2024-04:41:43

Archivage à long terme le : mercredi 20 janvier 2016-13:00:49

Dates et versions

tel-01217362 , version 1 (19-10-2015)

Identifiants

HAL Id : tel-01217362 , version 1

Citer

Dan Oneata. Robust and efficient models for action recognition and localization. Computer Vision and Pattern Recognition [cs.CV]. Université Grenoble Alpes, 2015. English. ⟨NNT : 2015GREAM019⟩. ⟨tel-01217362⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS INRIA INSMI STAR LJK LJK_GI LJK_GI_LEAR INRIA2

821 Consultations

1113 Téléchargements

Robust and efficient models for action recognition and localization

Modèles robustes et efficaces pour la reconnaissance d'action et leur localisation

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager