Den Raspberry Pi mittels Sprache steuern Teil 1

Was bringt einem ein Raspberry, wenn dieser immer an einem Bildschirm angeschlossen sein, oder man sich übers Netzwerk verbinden mus, um mit diesem interagieren zu können. Deshalb fand ich die Idee der Sprachsteuerng des Raspberrys, z.B. wie bei einer XBOX One (dies soll keine Werbung sein), sehr cool.
Um das ganze zu verwirklichen gibt es natürlich wieder mehrere Möglichkeiten. Das einfachste wäre wohl die GoogleVoice API zu verwenden. Allerdings will ich nicht, dass das Internet die ganze Zeit mein Zimmer belauscht (spätestens seit dem NSA Skandal [Jaja, immer und überall in aller Munde]). Also am bleibt nur eine Lösung übrig, die alles nötige mit sich bringt, und keine Internetverbindung benötigt. Nach einer Internetrecherche bin ich auf diesen Blog gestoßen. Das Ganze höhrte sich ziemlich einfach, und doch ausreichend für meine Ansprüche an. Genauer gesagt, hat der Beitrag genau meinen Wunsch getroffen :-). Zusätzlich hat der Autor noch seinen Code veröffentlicht, so dass nachbauen möglich ist.

Für die Sprachsteuerung wird also CMU Sphinx verwendet.
Das Installieren war nicht ganz einfach, obwohl es mehrere Guides1 2 gibt, wobei diese sich auch jeweils etwas unterscheiden. Eigentlich sollte es aber schon klappen, wenn man der offizielen Seite folgt.
Zum Testen obs geklappt hat, kann man das pocketsphinx_continuous ausführen, zu finen unter /pocketsphinx-x.x/src/programs/. Am Ende sollte so etwas wie

READY...

stehen, wonach man ins Mikro sprechen kann und der Text dann anschließend angezeigt wird (oder zumindest wie er verstanden wurde).
Mein Problem lag nicht direkt bei der Installation, sondern bei der Kompilierung des „Hello World!“ Programms.
Eigentlich kann man dieses einfach mit dem Befehl

$ gcc -o hello_ps hello_ps.c `pkg-config --cflags --libs pocketsphinx sphinxbase`

kompilieren. Allerdings habe ich beim abtippen nicht verstanden, dass diese „`“ (das Zeichen zwischen ß und „Rücktaste“) nicht diese „‚“ (das auf der # Taste) sind 😛

Im nächsten Teil werde ich darauf eingehen, die Worterkennung zu verbessern und unter Umständen schon eine erste konkrete Anwendung zu schreiben. Bis dahin kann man sich ja mal di Dokumentation unter dem Punkt Learn durchlesen, insbesondere den Punkt Adapting the default acoustic model

Momentan verwende ich für das ganze ein einfaches „Guitar Hero“ Mikrofon (hatte mein Mitbewohner gerade übrig) über den USB Anschluss. Das ist sicherlich nicht perfekt, da man das Mikro immer noch recht nahe an den Mund halten muss. Die Blogger empfehlen eine PS3 Webcam mit eingebauten Mikrofon, dieses soll wohl ganz gut den ganzen raum abdecken können, ich suche aber momentan noch nach einer günstigeren Lösung ohne Kamera (muss es doch wohl irgendwo geben…).

2 Kommentare

Eingeordnet unter Sprachsteuerung

2 Antworten zu “Den Raspberry Pi mittels Sprache steuern Teil 1

  1. Michael

    Hallo, hast Du ein geeignetes Mikro für den ganzen Raum gefunden?

    • Mannsven

      Hallo Michael,

      entschuldige, dass ich dich enttäuschen muss, aber ich habe keine Mikro zu einem günstigen Preis gefunden, habe aber auch nicht gründlich gesucht 😉

Hinterlasse einen Kommentar