Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam

In seiner Funktionalität auf die Lehre in gestalterischen Studiengängen zugeschnitten... Schnittstelle für die moderne Lehre

Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam mehr erfahren

Spracherkennung in Processing

Die Speech-to-Text Library für Processing entstand als Teilprojekt im Kurs »Immersive Datenvisualisierung« im Sommersemester 2011 bei Prof. Boris Müller. Sie ermöglicht es Spracherkennung in Processing zu benutzen und ergänzt so die herkömmlichen Eingabemöglichkeiten. Ich möchte euch mit der Library ein Werkzeug an die Hand geben um die Möglichkeiten eurer Interface-Prototypen zu erweitern.

Erklärung

Zusammen mit Julian Stahnke wollten wir im Projekt »Buchstabensuppe« die deutsche Sprache in der Kuppel visualisieren. Es war schnell klar, dass es konsequent wäre, gesprochen Sprache als Eingabemedium zu benutzen.

Die Recherche zeigte allerdings, dass es keine zuverlässige Spracherkennung für Java gibt. Die vorhandenen Libraries benötigen entweder ein Training oder basieren auf vorgegebenen Befehlen (Grammatik). Am besten erschien [Voce](http://voce.sourceforge.net/ „Voce“), das allerdings nur Englisch unterstützt und bestimmte Wörter erwartet.

Daher habe ich die Spracherkennung von Google Chrome benutzt und eine Library erstellt, mit der man aus Processing heraus Sprache aufnehmen und transkribieren lassen kann. Es gibt dabei die Möglichkeit automatisch erkennen zu lassen, wenn jemand etwas sagt oder manuell die Aufnahme zu starten.

Ausführliche Informationen und Updates gibt es auf der [Webseite der Library](http://stt.getflourish.com/ „Webseite der Library“).

Download

[STT-Library für Processing](http://dl.dropbox.com/u/974773/_keepalive/stt.zip „STT-Library für Processing“)

Ein Projekt von

Fachgruppe

Interfacedesign

Entstehungszeitraum

Sommersemester 2011

Links