Εμφάνιση απλής εγγραφής

Research and statistical analystis of emotional speech database of greek language.

Στοιχεία Dublin Core

dc.creatorΦλεντζουρής, Παναγιώτηςel
dc.creatorFlentzouris, Panagiotisen
dc.date.accessioned2016-03-15T13:28:46Z
dc.date.available2016-03-15T13:28:46Z
dc.date.issued2015-04-22T10:23:09Z
dc.identifier.urihttp://hdl.handle.net/20.500.12688/2281
dc.description.abstractΣτην ανθρώπινη επικοινωνία, η έκφραση της συναισθηματικής κατάστασης εκτελείται αρχικά με τη διαμόρφωση των εκφράσεων του προσώπου και αφετέρου με την προσωδία της ομιλίας. Κατά συνέπεια για την εύρωστη αναγνώριση της συναισθηματικής κατάστασης, οι ερευνητές εκτελούν πέραν της ανάλυση της έκφρασης του προσώπου και την ανάλυση ακουστικών χαρακτηριστικών του προφορικού λόγου. Ένας εκτενής αριθμός πειραμάτων έχει πραγματοποιηθεί χρησιμοποιώντας τεχνικές επεξεργασίας σήματος με σκοπό την αξιολόγηση ακουστικών χαρακτηριστικών του σήματος ομιλίας τα οποία συνεισφέρουν στην αναγνώριση της συναισθηματικής κατάστασης του ομιλητή. Τα αποτελέσματα αυτής της έρευνας έδειξαν ότι τα σημαντικότερα χαρακτηριστικά ήταν εκείνα τα οποία περιείχαν προσωδιακή πληροφορία του προφορικού λόγου (καμπύλη τονικότητας, ένταση, ενέργεια και διάρκεια τμημάτων ομιλίας). Στόχος της παρούσης πτυχιακής εργασίας είναι η μελέτη και η στατιστική ανάλυση των χαρακτηριστικών αυτών σε μια προσωδιακή βάση συναισθηματικής ομιλίας της Ελληνικής. Στα πλαίσια της εργασίας χρησιμοποιήθηκε βάση δεδομένων συναισθηματικής ομιλίας η οποία περιείχε τα συναισθήματα θυμού, χαράς, λύπης, φόβου καθώς και της ουδέτερης συγκινησιακής κατάστασης. Συγκεκριμένα το σώμα ομιλίας που χρησιμοποιήθηκε αποτελείται από 40 φράσεις, 5 αποτελούμενες από μια ή δύο λέξεις και 35 προτάσεις, με το ίδιο κείμενο για κάθε συναισθηματική κατάσταση. Σε πρώτη φάση, το σήμα ομιλίας τεμαχιοποιήθηκε σε επίπεδο πρότασης, λέξης και φωνήματος. Στη συνέχεια εξάχθηκαν ακουστικά χαρακτηριστικά τα οποία ευθυγραμμίσθηκαν με το κείμενο. Για το σκοπό αυτό χρησιμοποιήθηκε η γλώσσα δέσμης ενεργειών "scripting language" του περιβάλλοντος PRAAT. Μετά την δημιουργία των παραπάνω μελετήθηκαν οι διαφοροποιήσεις των διαρκειών, της ενέργειας και του τονικού ύψους σε διάφορα επίπεδα κατάτμησης της εκφερόμενης φράσης για κάθε συναισθηματική κατάσταση. Για την διεκπεραίωση της πτυχιακής χρησιμοποιήθηκαν τά προγράμματα PRAAT και Matlab.el
dc.description.abstractIn human communication, the expression of emotional state is conducted firstly with the formation of facial expressions and secondly with the prosody of speech. Consequently, for the robust recognition of emotional state, researchers conduct apart from the analysis of facial expression also the analysis of acoustic characteristics of speech. An extensive number of experiments has been conducted using signal processing techniques in order to evaluate the acoustic characteristics of the speech signal that contribute to the recognition of the emotional state of the speaker. The results of these researches showed that the most important features were those containing prosodic information of speech (tone curve, intensity, energy and duration of parts of the speech). The aim of this thesis is the study and statistical analysis of these characteristics in a prosodic database of emotional speech of Greek language. For the purpose of this thesis was used an emotional speech database that contained the emotions of anger, joy, sadness, fear and neutral emotional state. Specifically the speech body was composed of 40 phrases, 5 composed of one or two words and 35 sentences, with the same text for each emotional state. Initially, the speech signal was cut at sentence level, word and phoneme. Then acoustic characteristics were exported which were aligned with the text.For this purpose scripting language of the .PRAAT program was used. After the creation of the above mentioned parts, the variations of durations, energy and pitch at different segmentation levels of the speaking phrase for each emotional state were considered. For the completion of this thesis two programs were used, PRAAT and Matlab.en
dc.languageel
dc.publisherΤ.Ε.Ι. Κρήτης, Σχολή Εφαρμοσμένων Επιστημών (Σ.Εφ.Ε), Τμήμα Μηχανικών Μουσικής Τεχνολογίας και Ακουστικής Τ.Ε. (Ρέθυμνο)el
dc.publisherT.E.I. of Crete, School of Applied Sciences, Department of Music Technology and Acoustics Engineering (in Rethymno)en
dc.rightsAttribution-ShareAlike 4.0 International (CC BY-SA 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-sa/4.0/
dc.titleΜελέτη και στατιστική ανάλυση συναισθηματικής βάσης ομιλίας της ελληνικής.el
dc.titleResearch and statistical analystis of emotional speech database of greek language.en

Στοιχεία healMeta

heal.creatorNameΦλεντζουρής, Παναγιώτηςel
heal.creatorNameFlentzouris, Panagiotisen
heal.publicationDate2015-04-22T10:23:09Z
heal.identifier.primaryhttp://hdl.handle.net/20.500.12688/2281
heal.abstractΣτην ανθρώπινη επικοινωνία, η έκφραση της συναισθηματικής κατάστασης εκτελείται αρχικά με τη διαμόρφωση των εκφράσεων του προσώπου και αφετέρου με την προσωδία της ομιλίας. Κατά συνέπεια για την εύρωστη αναγνώριση της συναισθηματικής κατάστασης, οι ερευνητές εκτελούν πέραν της ανάλυση της έκφρασης του προσώπου και την ανάλυση ακουστικών χαρακτηριστικών του προφορικού λόγου. Ένας εκτενής αριθμός πειραμάτων έχει πραγματοποιηθεί χρησιμοποιώντας τεχνικές επεξεργασίας σήματος με σκοπό την αξιολόγηση ακουστικών χαρακτηριστικών του σήματος ομιλίας τα οποία συνεισφέρουν στην αναγνώριση της συναισθηματικής κατάστασης του ομιλητή. Τα αποτελέσματα αυτής της έρευνας έδειξαν ότι τα σημαντικότερα χαρακτηριστικά ήταν εκείνα τα οποία περιείχαν προσωδιακή πληροφορία του προφορικού λόγου (καμπύλη τονικότητας, ένταση, ενέργεια και διάρκεια τμημάτων ομιλίας). Στόχος της παρούσης πτυχιακής εργασίας είναι η μελέτη και η στατιστική ανάλυση των χαρακτηριστικών αυτών σε μια προσωδιακή βάση συναισθηματικής ομιλίας της Ελληνικής. Στα πλαίσια της εργασίας χρησιμοποιήθηκε βάση δεδομένων συναισθηματικής ομιλίας η οποία περιείχε τα συναισθήματα θυμού, χαράς, λύπης, φόβου καθώς και της ουδέτερης συγκινησιακής κατάστασης. Συγκεκριμένα το σώμα ομιλίας που χρησιμοποιήθηκε αποτελείται από 40 φράσεις, 5 αποτελούμενες από μια ή δύο λέξεις και 35 προτάσεις, με το ίδιο κείμενο για κάθε συναισθηματική κατάσταση. Σε πρώτη φάση, το σήμα ομιλίας τεμαχιοποιήθηκε σε επίπεδο πρότασης, λέξης και φωνήματος. Στη συνέχεια εξάχθηκαν ακουστικά χαρακτηριστικά τα οποία ευθυγραμμίσθηκαν με το κείμενο. Για το σκοπό αυτό χρησιμοποιήθηκε η γλώσσα δέσμης ενεργειών "scripting language" του περιβάλλοντος PRAAT. Μετά την δημιουργία των παραπάνω μελετήθηκαν οι διαφοροποιήσεις των διαρκειών, της ενέργειας και του τονικού ύψους σε διάφορα επίπεδα κατάτμησης της εκφερόμενης φράσης για κάθε συναισθηματική κατάσταση. Για την διεκπεραίωση της πτυχιακής χρησιμοποιήθηκαν τά προγράμματα PRAAT και Matlab.el
heal.abstractIn human communication, the expression of emotional state is conducted firstly with the formation of facial expressions and secondly with the prosody of speech. Consequently, for the robust recognition of emotional state, researchers conduct apart from the analysis of facial expression also the analysis of acoustic characteristics of speech. An extensive number of experiments has been conducted using signal processing techniques in order to evaluate the acoustic characteristics of the speech signal that contribute to the recognition of the emotional state of the speaker. The results of these researches showed that the most important features were those containing prosodic information of speech (tone curve, intensity, energy and duration of parts of the speech). The aim of this thesis is the study and statistical analysis of these characteristics in a prosodic database of emotional speech of Greek language. For the purpose of this thesis was used an emotional speech database that contained the emotions of anger, joy, sadness, fear and neutral emotional state. Specifically the speech body was composed of 40 phrases, 5 composed of one or two words and 35 sentences, with the same text for each emotional state. Initially, the speech signal was cut at sentence level, word and phoneme. Then acoustic characteristics were exported which were aligned with the text.For this purpose scripting language of the .PRAAT program was used. After the creation of the above mentioned parts, the variations of durations, energy and pitch at different segmentation levels of the speaking phrase for each emotional state were considered. For the completion of this thesis two programs were used, PRAAT and Matlab.en
heal.languageel
heal.academicPublisherΤ.Ε.Ι. Κρήτης, Σχολή Εφαρμοσμένων Επιστημών (Σ.Εφ.Ε), Τμήμα Μηχανικών Μουσικής Τεχνολογίας και Ακουστικής Τ.Ε. (Ρέθυμνο)el
heal.academicPublisherT.E.I. of Crete, School of Applied Sciences, Department of Music Technology and Acoustics Engineering (in Rethymno)en
heal.titleΜελέτη και στατιστική ανάλυση συναισθηματικής βάσης ομιλίας της ελληνικής.el
heal.titleResearch and statistical analystis of emotional speech database of greek language.en
heal.typebachelorThesis
heal.keywordσυναίσθημα, στατιστική ανάλυση, τονικό ύψος, αναγνώριση ομιλίαςel
heal.keywordemotion, statistical analysis, pitch, speech recognitionen
heal.advisorNameΖέρβας, Παναγιώτηςel
heal.advisorNameZervas, Panagiotisen
heal.academicPublisherIDteicrete
heal.fullTextAvailabilitytrue
tcd.distinguishedfalse
tcd.surveyfalse


Αρχεία σε αυτό το τεκμήριο

Thumbnail

Αυτό το τεκμήριο εμφανίζεται στις ακόλουθες συλλογές

Εμφάνιση απλής εγγραφής

Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
Except where otherwise noted, this item's license is described as Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)