Alice Sprachassistent • Projekt

Projekt

Wir haben uns im Rahmen unseres Informatikprojekts speziell mit Project Alice in der Beta 4 beschäftigt um ein Proof-of-Concept für einen Open-Source Sprachassistenten zu erstellen.

In unserem Projekt haben wir uns mit der Frage beschäftigt ob mithilfe von Project Alice und der freien Software, die Alice verwendet ein zuverlässiger Sprachassistent für deutschsprachige Nutzer entstehen kann.

Auch wenn kommerzielle Sprachassistenten zuverlässig funktionieren, funktionieren sie zumeist nur online und sind nicht geeignet wenn Datenschutzkonformität gefragt ist.

Unser Projekt wird für das Forschungsprojekt INTIA durchgeführt, welches inklusive Methoden und Technologien für die Alltagsbewältigung in der Behinderten- und Erziehungshilfe entwickelt. INTIA möchte einen Sprachassistenten für ihren sogennanten Innovationskoffers erstellen und ist daran interessiert zu erfahren ob Open-Source Lösungen eine zuverlässige Alternative zu kommerziellen Sprachassistenten sein können.

Unsere Erfahrungen mit Project Alice sowie die Wissensbasis, die wir uns im Rahmen des Projekts aneignen konnten aber auch unsere Ergebnisse und unser Fazit möchten wir mithilfe dieser Dokumentation für alle Interessierte zugänglich machen.

Die von uns getestete Version

Wir haben uns mit der Beta 4 beschäftigt und bewerten nur die Beta 4. Mit der Beta 5 kam ein ganz neues Webinterface dazu, das die User Experience erheblich verbessert. Beta 5 bringt außerdem viele kleine Verbesserungen mit sich. Vor allem im Punkt Smart Home gibt es eine bessere Integration von Geräten. Außerdem treten die Bugs, die wir in Beta 4 gefunden haben, in Beta 5 wahrscheinlich nicht mehr auf, da sie behoben worden sind oder weil Teile des Codes ersetzt/erneuert worden sind.

Ziele und Kriterien

Wir möchten Alice in der Beta 4 als Technologie speziell für unseren Anwendungsfall aber auch generell bewerten. Entscheidende Kriterien sind Datenschutzkonformität, Offlinefähgikeitund Zuverlässigkeit für deutschsprachige Nutzer. Hauptkriterien für die generelle Bewertung sind Plattformunabhängigkeit und Kompatibilität, Rezeption/Markt, Reife, Nutzersicht, Entwicklersicht und Ökosystem.

Hardware

Da wir unser Projekt zu zweit durchführen haben wir auch zwei verschiedene Konfigurationen als Testumgebung:

Konfiguration 1

Raspberry Pi 4b 4GB RAM (32 GB microSD Karte)
ReSpeaker 4-Mic Array
Conbee Stick 2
Innr RS 230 C-2 Lampen
Computerboxen mit USB-Stromversorgung

Konfiguration 2

Raspberry Pi 3B
SanDisk Ultra 16GB microSD Class 10
USB EyeToy Kamera als Mic Array
ZigBee Stick (CC2531) mit Antenne
Boxen mit Klinkenstecker und externer Stromversorgung

Techstack

Für unseren Techstack haben wir folgende Auswahl getroffen:

Wakeword Engine

Snips

ASR

Deepspeech

NLU

Snips

TTS

NanoTTS

Dialog Manager

Alice-spezifischer Dialog Manager

Wakeword

Da mit Snips standardmäßig nur “Hey Snips” funktioniert, haben wir Alice mit dem Wakeword “Hey Alice” erweitert.