Φ. ΠΑΝΤΑΖΟΓΛΟΥ: Ο ερευνητής που θα μάθει τα ρομπότ... Ελληνικά

Ρομποτικά συστήματα μπορούν να κατανοούν την ελληνική γλώσσα χάρη στην έρευνα του μέλους της ομάδας υποβρυχίων ρομποτικών συστημάτων του ΕΛ.ΚΕ.Θ.Ε., κ. Φώτη Πανταζόγλου. «Προσωπικά για μένα η επιστήμη δεν έχει όρια. Αν δούμε λίγα χρόνια πίσω, θα διαπιστώσουμε το πόσο ραγδαία έχει αλλάξει η ζωή μας λόγω της εξέλιξης της επιστήμης» αναφέρει ο ίδιος σε συνέντευξή του στην «Π».

Η έρευνά του, που έγινε σε συνεργασία με τους καθηγητές της Στρατιωτικής Σχολής Ευελπίδων, δρ. Γιώργο Κλάδη και δρ. Νικόλαο Παπαδάκη, δημοσιεύτηκε στο περιοδικό WSEAS.

Τα μέρη του ελληνικού μοντέλου για το CMU Sphinx
Τα μέρη του ελληνικού μοντέλου για το CMU Sphinx

Η συνέντευξη

Το κείμενο της συνέντευξης έχει ως εξής:

Ποια είναι τα μέχρι σήμερα δεδομένα στα συστήματα αυτόματης φωνητικής αναγνώρισης;

«Με τον όρο αυτόματη φωνητική αναγνώριση –Automatic Speech Recognition (ASR) εννοούμε τη διαδικασία μετατροπής ενός ηχητικού σήματος φωνής σε μια διαδοχική σειρά λέξεων με τη χρήση κάποιου υπολογιστικού αλγόριθμου.

Τα τελευταία χρόνια έχουμε μια σειρά εφαρμογών στις οποίες οι τεχνολογίες ASR παίζουν σημαντικό λόγο. Εφαρμογές όπως οι speech2speech, για παράδειγμα, μας επιτρέπουν την αυτόματη μετάφραση των λεγομένων μας σε μια νέα γλώσσα.

Ταυτόχρονα  εφαρμογές που προέρχονται από τις τεχνολογίες φωνής έχουν σημαντικά βελτιώσει τη  διάδρασή μας με διάφορες μηχανικές κατασκευές και συστήματα. Οι πιο δημοφιλείς εφαρμογές αυτής της κατηγορίας συμπεριλαμβάνουν τη φωνητική αναζήτηση, τον προσωπικό ψηφιακό βοηθό, τα συστήματα διαδράσης για το σπίτι, τα συστήματα πληροφορίας και διασκέδασης για τα αυτοκίνητα».

Ποια είναι η καινοτομία που φέρνει η δική σας έρευνα;

«Στην αυτόματη φωνητική αναγνώριση χρησιμοποιούνται μια σειρά εργαλείων και πλατφορμών εφαρμογής. Μια  τέτοια πλατφόρμα, ανοικτού κώδικα, είναι και το CMU Sphinx. Έχει αναπτυχθεί από κοινού από το Πανεπιστήμιο Carnegie Mellon, τα εργαστήρια της Sun Microsystems και τα ερευνητικά εργαστήρια της Mitsubishi. Η πλατφόρμα εργαλείων CMU Sphinx μας παρέχει μια σειρά από γλωσσικά μοντέλα διαφόρων γλωσσών, που αποτελούν και τη βάση όλων των εργασιών που θέλουμε να κάνουμε κατά τη διαδικασία της αυτόματης φωνητικής αναγνώρισης (ASR). Για δημοφιλείς γλώσσες όπως τα Αγγλικά, Γαλλικά, Ρωσικά κτλ. τα μοντέλα αυτά είναι πολύ ακριβή και εξελιγμένα.

Πλην όμως για την ελληνική γλώσσα δεν υπήρχε μέχρι πρότινος το ολοκληρωμένο ελληνικό μοντέλο που θα μας επέτρεπε να χρησιμοποιήσουμε το CMU Sphinx σε εφαρμογές που θα θέλαμε να αναπτύξουμε.

Η εκ του μηδενός δημιουργία του ελληνικού μοντέλου για το CMU Sphinx εκτιμώ ότι συνέβαλε στη συνολική προσπάθεια περαιτέρω ανάπτυξης του CMU Sphinx. Η διαδικασία προβλέπει συγκεκριμένα στάδια, τα οποία λόγω της φύσης της γλώσσας μας ήταν ομολογουμένως πολύ ενδιαφέροντα αλλά και πρωτοποριακά, καθώς δεν υπήρχε κάποια άλλη γλώσσα που να προσομοιάζει της δικής μας. Ιδιαίτερη αναφορά θα πρέπει να δοθεί ίσως στη διαδικασία «εκπαίδευσης»  του συστήματος, καθώς μέσα από μια σειρά υπολογιστικών διαδικασιών ουσιαστικά εκπαιδεύουμε το σύστημα μας να κατανοεί και να αποδίδει σε γραπτή μορφή, λόγο που εκφέρεται στην ελληνική γλώσσα».

Εργασίες με τον ρομποτικό βραχίονα του MaxRover ROV
Εργασίες με τον ρομποτικό βραχίονα του MaxRover ROV

Οι εφαρμογές

Πού μπορεί να έχει εφαρμογές;

«Ένα από τα πολύ χρήσιμα χαρακτηριστικά του CMU Sphinx είναι το γεγονός ότι σου επιτρέπει να προσαρμόσεις την πλατφόρμα σύμφωνα με τις δικές σου ανάγκες. Θα προσπαθήσω να το κάνω πιο κατανοητό με ένα απλό παράδειγμα εφαρμογής που προκύπτει από τον εργασιακό μου χώρο.

Σαν μέλος της ομάδας υποβρυχίων ρομποτικών οχημάτων (ROV) του Ελληνικού Κέντρου Θαλάσσιων Ερευνών με ενδιέφερε να προσαρμόσω το ελληνικό μοντέλο του CMU Sphinx, έτσι ώστε να μπορώ να το χρησιμοποιήσω στον φωνητικό έλεγχο συστημάτων υποβρυχίων οχημάτων.

Στο MaxRover ROV του ΕΛΚΕΘΕ διαθέτουμε ένα σύστημα με  δύο ρομποτικούς βραχίονες ικανούς να πραγματοποιήσουν εργασίες και δειγματοληψίες στο θαλάσσιο περιβάλλον. Τα συστήματα βραχιόνων είναι τηλεχειριζόμενα από τους χειριστές που βρίσκονται στο σκάφος ελέγχου. Αποτελούν ουσιαστικά την «προέκταση» των χεριών του χειριστή και είναι σε θέση σε πραγματικό χρόνο να εκτελέσουν εργασίες με διαφορετικούς βαθμούς δυσκολίας και πολυπλοκότητας.

Ένα από τα πιο σημαντικά μέρη του συστήματος βραχιόνων είναι το σύστημα χειρισμού που ο χειριστής χρησιμοποιεί ώστε να πραγματοποιήσει τις εργασίες που επιθυμεί.

Ένα σύστημα το οποίο θα συνδυάζει την απλότητα στον έλεγχο, την ευκολία χρήσης, την επανάληψη θα μπορούσε να συνδράμει αποφασιστικά στην περαιτέρω αύξηση της παραγωγικότητας των εργαλείων που χρησιμοποιούνται από τους βραχίονες των ROV.

Από αυτή την επιχειρησιακή ανάγκη ορμώμενος αποφάσισα να αναπτύξω ένα μοντέλο του CMU Sphinx που να μπορεί να χρησιμοποιηθεί σε εργασίες ROV. Βασιζόμενος πάνω στο γενικό ελληνικό, μετά από περαιτέρω παραμετροποίηση, εκπαίδευση και ανάπτυξη, προέκυψε ένα νέο «υπο-μοντέλο»  που εξυπηρετούσε τις συγκεκριμένες ανάγκες μας. Αυτό είναι άλλωστε για μένα και το μεγάλο πλεονέκτημα που σου δίνει η πλατφόρμα αυτή, η  ευελιξία σχεδιασμού, προσαρμογής και περαιτέρω ανάπτυξης».

Κονσόλες χειρισμού MaxRover ROV
Κονσόλες χειρισμού MaxRover ROV

Τα επόμενα χρόνια τι θα είναι δυνατό και θα πάψει να αποτελεί επιστημονική φαντασία;

«Προσωπικά για μένα η επιστήμη δεν έχει όρια. Αν δούμε λίγα χρόνια πίσω, θα διαπιστώσουμε το πόσο ραγδαία έχει αλλάξει η ζωή μας λόγω της εξέλιξης της επιστήμης. Σαν το πιο απλό παράδειγμα μπορώ να αναφέρω τα smartphones και το πώς αυτά έχουν αλλάξει τη ζωή όλων μας.

Όσο η τεχνολογία των μικροεπεξεργαστών εξελίσσεται καθημερινά τόσο θα μπορούμε πιο εύκολα να πραγματοποιήσουμε συνθέτες και χρονοβόρες υπολογιστικές διαδικασίες σε μικρότερο χρόνο. Αυτό θα μας επιτρέψει να σχεδιάσουμε ακόμα πιο πολύπλοκα και μικρά σε μέγεθος συστήματα τα οποία να εξυπηρετούν τις ανάγκες μας.

Αυτό το δεδομένο, σε συνδυασμό με την εξέλιξη στην έρευνα για τις μορφές ενέργειας πιστεύω ότι θα μας επιτρέψει να δούμε αρκετά από αυτά που θεωρούσαμε πριν λίγα χρόνια επιστημονική φαντασία να γίνονται πραγματικότητα.

Μπορεί τώρα να χρειαζόμαστε έναν απλό υπολογιστή ώστε να «τρέξουμε» μια εφαρμογή που να βασίζεται στο CMU Sphinx, αλλά να είστε σίγουροι ότι σε λίγο χρονικό διάστημα αυτό θα γίνεται εφικτό από κάποιο σύστημα πολλαπλής δύναμης και μικρότερου μεγέθους».

 

Ο ερευνητής μέλος της ομάδας υποβρυχίων ρομποτικών συστημάτων του ΕΛ.ΚΕ.Θ.Ε., κ. Φώτης Πανταζόγλου

Ποιος είναι

Ο κ. Φώτης Πανταζόγλου είναι ειδικός τεχνικός επιστήμονας, κάτοχος Masters of Science από το Πολυτεχνείο Χανίων και την Στρατιωτική Σχολή Ευελπίδων στην Μηχανική Συστημάτων.

Εργάζεται στο Ινστιτούτο Ωκεανογραφίας του Ελληνικού Κέντρου Θαλασσίων Ερευνών. Είναι μέλος της ομάδας υποβρυχίων ρομποτικών συστημάτων του ΕΛ.ΚΕ.Θ.Ε. με  25ητη εμπειρία σε θέματα θαλάσσιας τεχνολογίας και νεών τεχνολογιών.

Έχει συμμετάσχει σε σειρά  διεθνών ερευνητικών αποστολών σε διάφορες θαλάσσιες περιοχές όπως ο Ατλαντικός ωκεανός, Μεσόγειος θάλασσα και η Ερυθρά θάλασσα. Κύρια ερευνητικά του ενδιαφέροντα είναι η αυτόματη φωνητική αναγνώριση, η συνεργασία ανθρώπου-μηχανής, η αναγνώριση προτύπων, ο έλεγχος αυτόνομων συστημάτων, τα αυτόνομα υποβρύχια οχήματα, η ρομποτική και ο προγραμματισμός.

Περισσότερες πληροφορίες και υλικό εργασίας στου παρακάτω συνδέσμους

https://gitlab.sse.gr/fpantazoglou/omilia

https://goo.gl/9v3QqG