Γρήγορος εντοπισμός αντικειμένων, υπολογισμός του πραγματικού τους μεγέθους και αναγνώριση με τη χρήση του αισθητήρα Microsoft Kinect.

Dimitriou, Michail; Δημητρίου, Μιχαήλ

Fast 3d scene object detection and real size estimation using microsoft kinect sensor

Στοιχεία Dublin Core

dc.creator	Δημητρίου, Μιχαήλ	el
dc.creator	Dimitriou, Michail	en
dc.date.accessioned	2016-03-15T15:38:11Z
dc.date.available	2016-03-15T15:38:11Z
dc.date.issued	2013-07-10T10:20:13Z
dc.identifier.uri	http://hdl.handle.net/20.500.12688/3680
dc.description.abstract	Αυτή η εργασία παρουσιάζει ένα αποδοτικό και ολοκληρωμένο σύστημα για τον εντοπισμό πολλαπλών αντικειμένων από μια τρισδιάστατη σκηνή και την κατηγοριοποίηση τους κάνοντας χρήση του αισθητήρα Microsoft Kinect. Χρησιμοποιεί μια νέα και γρήγορη μέθοδο για τον εντοπισμό των αντικειμένων που βασίζεται στους χάρτες βάθους που παράγει το ο αισθητήρας Kinect και στη συνέχεια εφαρμόζει τον αλγόριθμο ταξινόμησης Γραμμικής Χωρικής Ταύτισης Πυραμίδας (Linear Spatial Pyramid Matching[1]) που προτάθηκε από τον Jianchao Yang και τους συνεργάτες του (CVPR09)για να κάνει κατηγοριοποίηση των αντικειμένων. Η επιτυχής ανίχνευση και κατηγοριοποίηση των αντικειμένων μιας τρισδιάστατης σκηνής είναι κρίσιμος παράγοντας της Υπολογιστικής Όρασης. Ο κύριος στόχος της Υπολογιστικής Όρασης είναι να κατασκευαστούν μηχανές οι οποίες θα βλέπουν αλλά και θα κατανοούν τα αντικείμενα όπως και ο άνθρωπος. Προς αυτή την κατεύθυνση, το Kinect μπορεί να χρησιμοποιηθεί αφού έχει την δυνατότητα να παράγει σε πραγματικό χρόνο χάρτες βάθους που περιέχουν τη τρισδιάστατη πληροφορία και μαζί με τις αντίστοιχες RGBεικόνες που επιστρέφει μπορούν να χρησιμοποιηθούν για τον στόχο μας. Στο σύστημα μας χρησιμοποιούμε αποτελεσματικές μεθόδους για την επεξεργασία του χάρτη βάθους σε συνδυασμό με ανίχνευση ακμών, εντοπισμό συνδεδεμένων στοιχείων και τεχνικές φιλτραρίσματος με σκοπό την υλοποίηση ενός αλγορίθμου που μπορεί να ανιχνεύει πολλαπλά αντικείμενα από μία μόνο σκηνή, ακόμα και σε πολύπλοκες σκηνές με πολλά και αλληλεπικαλυπτόμενα αντικείμενα. Επιπλέον χρησιμοποιούμε τον αλγόριθμο LSPM για την αποδοτική κατηγοριοποίηση των αντικειμένων που εντοπίζονται. Η ανίχνευση αντικειμένων με την προτεινόμενη μέθοδο παρουσιάζει πολλά πλεονεκτήματα σε σχέση με τις παραδοσιακές μεθόδους ανάμεσα στα οποία είναι η αποτελεσματικότητα, η ακρίβεια στον εντοπισμό των ορίων, η εκτίμηση του πραγματικού μεγέθους των αντικειμένων και η μεγάλη ταχύτητα ανίχνευσης. Η κατηγοριοποίηση αντικειμένων όταν έχει προηγηθεί ανίχνευση βοηθάει στην καλύτερη αναγνώριση των αντικειμένων, καλύτερη αξιοποίηση της επεξεργαστικής ισχύος του συστήματος και κάνει δυνατή την αναγνώριση πολλαπλών αντικειμένων που προέρχονται από την ίδια εικόνα.	el
dc.description.abstract	This work presents an efficient and complete system for multiple object detection and classification in a 3D scene using the Microsoft Kinect sensor. It employs a new and fast detection method based on the depth map generated by the Kinect sensor and then applies the Linear Spatial Pyramid Matching [1] classification algorithm proposed by Jianchao Yang et al for the classification task. Successful 3D scene’s object detection and classification are crucial features in computer vision. The main goal is making machines that see and understand objects like humans do. To this goal, the Kinect sensor can be utilized since it provides real-time depth map generation which can be used along with the RGB images for our tasks. In our system we employ effective depth map processing techniques, along with edge detection, connected components detection and filtering approaches, in order to design a complete algorithm for efficient object detection of multiple individual objects in a single scene, even in complex scenes with many objects. Besides, we use the LSPM algorithm for the efficient classification of the detected objects. This method provides many benefits over traditional object detection and classification methods; among others is the high detection rate, the accurate detection of boundaries, the real size estimation of objects and fast detection speed. Object classification when preceded by detection can provide better recognition rates, computational efficiency and multiple object classification from a single scene image.	en
dc.language	el
dc.publisher	Τ.Ε.Ι. Κρήτης, Τεχνολογικών Εφαρμογών (Σ.Τ.Εφ), Τμήμα Μηχανικών Πληροφορικής Τ.Ε.	el
dc.publisher	T.E.I. of Crete, School of Engineering (STEF), Department of Informatics Engineering	en
dc.rights	Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
dc.rights.uri	https://creativecommons.org/licenses/by-sa/4.0/
dc.title	Γρήγορος εντοπισμός αντικειμένων, υπολογισμός του πραγματικού τους μεγέθους και αναγνώριση με τη χρήση του αισθητήρα Microsoft Kinect.	el
dc.title	Fast 3d scene object detection and real size estimation using microsoft kinect sensor	en

Στοιχεία healMeta

heal.creatorName	Δημητρίου, Μιχαήλ	el
heal.creatorName	Dimitriou, Michail	en
heal.publicationDate	2013-07-10T10:20:13Z
heal.identifier.primary	http://hdl.handle.net/20.500.12688/3680
heal.abstract	Αυτή η εργασία παρουσιάζει ένα αποδοτικό και ολοκληρωμένο σύστημα για τον εντοπισμό πολλαπλών αντικειμένων από μια τρισδιάστατη σκηνή και την κατηγοριοποίηση τους κάνοντας χρήση του αισθητήρα Microsoft Kinect. Χρησιμοποιεί μια νέα και γρήγορη μέθοδο για τον εντοπισμό των αντικειμένων που βασίζεται στους χάρτες βάθους που παράγει το ο αισθητήρας Kinect και στη συνέχεια εφαρμόζει τον αλγόριθμο ταξινόμησης Γραμμικής Χωρικής Ταύτισης Πυραμίδας (Linear Spatial Pyramid Matching[1]) που προτάθηκε από τον Jianchao Yang και τους συνεργάτες του (CVPR09)για να κάνει κατηγοριοποίηση των αντικειμένων. Η επιτυχής ανίχνευση και κατηγοριοποίηση των αντικειμένων μιας τρισδιάστατης σκηνής είναι κρίσιμος παράγοντας της Υπολογιστικής Όρασης. Ο κύριος στόχος της Υπολογιστικής Όρασης είναι να κατασκευαστούν μηχανές οι οποίες θα βλέπουν αλλά και θα κατανοούν τα αντικείμενα όπως και ο άνθρωπος. Προς αυτή την κατεύθυνση, το Kinect μπορεί να χρησιμοποιηθεί αφού έχει την δυνατότητα να παράγει σε πραγματικό χρόνο χάρτες βάθους που περιέχουν τη τρισδιάστατη πληροφορία και μαζί με τις αντίστοιχες RGBεικόνες που επιστρέφει μπορούν να χρησιμοποιηθούν για τον στόχο μας. Στο σύστημα μας χρησιμοποιούμε αποτελεσματικές μεθόδους για την επεξεργασία του χάρτη βάθους σε συνδυασμό με ανίχνευση ακμών, εντοπισμό συνδεδεμένων στοιχείων και τεχνικές φιλτραρίσματος με σκοπό την υλοποίηση ενός αλγορίθμου που μπορεί να ανιχνεύει πολλαπλά αντικείμενα από μία μόνο σκηνή, ακόμα και σε πολύπλοκες σκηνές με πολλά και αλληλεπικαλυπτόμενα αντικείμενα. Επιπλέον χρησιμοποιούμε τον αλγόριθμο LSPM για την αποδοτική κατηγοριοποίηση των αντικειμένων που εντοπίζονται. Η ανίχνευση αντικειμένων με την προτεινόμενη μέθοδο παρουσιάζει πολλά πλεονεκτήματα σε σχέση με τις παραδοσιακές μεθόδους ανάμεσα στα οποία είναι η αποτελεσματικότητα, η ακρίβεια στον εντοπισμό των ορίων, η εκτίμηση του πραγματικού μεγέθους των αντικειμένων και η μεγάλη ταχύτητα ανίχνευσης. Η κατηγοριοποίηση αντικειμένων όταν έχει προηγηθεί ανίχνευση βοηθάει στην καλύτερη αναγνώριση των αντικειμένων, καλύτερη αξιοποίηση της επεξεργαστικής ισχύος του συστήματος και κάνει δυνατή την αναγνώριση πολλαπλών αντικειμένων που προέρχονται από την ίδια εικόνα.	el
heal.abstract	This work presents an efficient and complete system for multiple object detection and classification in a 3D scene using the Microsoft Kinect sensor. It employs a new and fast detection method based on the depth map generated by the Kinect sensor and then applies the Linear Spatial Pyramid Matching [1] classification algorithm proposed by Jianchao Yang et al for the classification task. Successful 3D scene’s object detection and classification are crucial features in computer vision. The main goal is making machines that see and understand objects like humans do. To this goal, the Kinect sensor can be utilized since it provides real-time depth map generation which can be used along with the RGB images for our tasks. In our system we employ effective depth map processing techniques, along with edge detection, connected components detection and filtering approaches, in order to design a complete algorithm for efficient object detection of multiple individual objects in a single scene, even in complex scenes with many objects. Besides, we use the LSPM algorithm for the efficient classification of the detected objects. This method provides many benefits over traditional object detection and classification methods; among others is the high detection rate, the accurate detection of boundaries, the real size estimation of objects and fast detection speed. Object classification when preceded by detection can provide better recognition rates, computational efficiency and multiple object classification from a single scene image.	en
heal.language	el
heal.academicPublisher	Τ.Ε.Ι. Κρήτης, Τεχνολογικών Εφαρμογών (Σ.Τ.Εφ), Τμήμα Μηχανικών Πληροφορικής Τ.Ε.	el
heal.academicPublisher	T.E.I. of Crete, School of Engineering (STEF), Department of Informatics Engineering	en
heal.title	Γρήγορος εντοπισμός αντικειμένων, υπολογισμός του πραγματικού τους μεγέθους και αναγνώριση με τη χρήση του αισθητήρα Microsoft Kinect.	el
heal.title	Fast 3d scene object detection and real size estimation using microsoft kinect sensor	en
heal.type	bachelorThesis
heal.keyword	ψηφιακή εικόνα, ψηφιακή επεξεργασία εικόνας, Microsoft Kinect, ανίχνευση αντικειμένων	el
heal.keyword	digital image, digital image processing, Microsoft Kinect, object detection	en
heal.advisorName	Τριανταφυλλίδης, Γεώργιος	el
heal.advisorName	Triantafyllidis, Georgios	en
heal.academicPublisherID	teicrete
heal.fullTextAvailability	true
tcd.distinguished	false
tcd.survey	false

Αρχεία σε αυτό το τεκμήριο

Name:: DimitriouMichalis2013.pdf
Μέγεθος:: 2.773Mb
Τύπος:: PDF

Προβολή/Άνοιγμα

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Πτυχιακές εργασίες / Bachelor Theses [9026]

Εμφάνιση απλής εγγραφής

Except where otherwise noted, this item's license is described as Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)