Archiv

Archive for the ‘Elektrotechnik’ Category

Spracherkennung für einen Roboter

Mai 11, 2011 1 Kommentar

Wie bereits angekündigt möchte ich in diesem Blog neben meinen Erfahrungen rund um Linux & Ubuntu auch Projekte aus der Elektronik und der Elektrotechnik vorstellen.

Thema hier ist eigentlich das Thema meiner Studienarbeit: Aufbau und Test einer Sprachsteuerung für einen Roboter.
Vorlage für dieses Projekt ist ein Spielzeugroboter (R2D2) von Hasbro, der leider in Deutschland nicht auf den Markt gekommen ist. Dieser kann mittels einer einfachen Kommandostruktur mit ein paar Verzweigungen gesteuert werden. Nachteile dabei sind allerdings die beschränkte Kommandostruktur (ca. 50 Begriffe) und die Tatsache, dass der Roboter nur auf englisch gesteuert werden.
Ziel meiner Arbeit soll es sein, eine Sprachsteuerung aufzubauen, mit der es möglich ist, den Robbi mit einer etwas intelligenteren Kommandostruktur und vor allem mit mehr (deutschen) Kommandos zu steuern.

Schritt 1 meiner Arbeit hat sich erstmal mit der sprecherunabhängigen Spracherkennung (engl. speaker-independent voice recognition, kurz SI-VR) beschäftigt, also dem Einlesen in die Thematik. Da dieses Thema sehr theorethisch ist, möchte ich hier erstmal nicht weiter darauf eingehen (ist etwas trocken).

Im weiteren Verlauf habe ich dann mit meinem Projektpartner ein geeignetes Sprachmodul ausgesucht, welches auf einfache Weise mit Sprachbefehlen gefüttert werden kann. Problem ist nämlich bei der SI-VR, dass man Akustikmodelle von mehreren tausend Sprechern benötigt, um damit überhaupt ein Wort zu verstehen.
Lange Rede, kurzer Sinn: Wir sind letztendlich beim VoiceGP DKT2SI von VeeaR gelandet. Bei diesem Entwicklungsboard ist bereits alles dabei:

  • Platine, mit Prozessor RSC4128, welches 56 Pins mit diversen Schnittstellen liefert (z.B. SPI)
  • Entwicklungsboard, mit diversen Einstellungsmöglichkeiten
  • Mikro bereits auf Entwicklungsboard integriert –> Sofort startklar
  • Slot für SD-Karte, falls interner Speicher nicht ausreichend ist
  • Diverse Software (Entwicklungsumgebung, Spracherkennungs- und Sprachsynthesesoftware etc.)

Besonders hilfreich ist die Software T2SI (Lite), die eine einfache und schnelle Erstellung von Akustikmodellen und Vokabularen ermöglicht. Der Benutzer kann dabei zwischen verschiedenen Sprachen (englisch, deutsch, franz., ital. etc.) wählen. Allerdings ist diese Software kostenpflichtig (Einzelpreis ca. 200 €), sie ist allerdings bei dem von uns ausgesuchten Paket dabei.

Nach einigem Herumspielen mit dem Board, ist es schließlich möglich, dass das Board unsere Kommandos versteht und auch eine von uns gewählte Melodie abzuspielen. Damit können wir also nun eine sinnvolle Kommunikation mit dem Board implementieren.

Unsere Aufgaben sind also:

  • Erstellen des Programmcodes im Top-Down-Ansatz
  • Erstellen von Vokabularen und Akustikmodellen
  • Einspielen von Ausgabesätzen und Melodien
  • Test der Software

Mit diesen Vorgaben mach ich mich mal an die Arbeit und melde mich in Kürze wieder.

Wolowitz

Kategorien:Elektrotechnik