sprachausgabe

Anlaufschwierigkeiten? Was ist was? Worum geht's?
janti
Neugieriger
Neugieriger
Beiträge: 3
Registriert: Donnerstag 11. August 2005, 14:14

sprachausgabe

Beitrag von janti »

Erst einmal ein Hallo an alle, die hier lesen (hoffentlich sind auch ein paar Entwickler dabei).

Ich habe beruflich viel mit Blinden zu tun und möchte die D-Box gern zweckentfremden zum Vorlesen von Videotext. Da es unter Linux auch Sprachausgaben gibt, sollte das ja prinzipiell machbar sein. Im Moment besorge ich mir gerade eine (leider kommerzielle) Sprachausgabe, welche für die 8 MB Flash klein genug sein müßte. Wer könnte mir denn etwas Start-Unterstützung geben für die Umsetzung meines Vorhabens, oder vielleicht will ja jemand sich in das Projekt auch aktiv mit einbringen?

Grüße aus Großkugel
Jan
Npq
Senior Member
Beiträge: 1339
Registriert: Donnerstag 24. April 2003, 12:12

Beitrag von Npq »

Hi, ich hab über sowas auch mal nachgedacht, ganz so einfach ist das ganze nicht. Die 8 MB insgesamt sind nicht viel Platz.

Falls du die Sprachausgabe für den Nokia Communicator (TALKS) kennst, die wurde vom Programmierer wohl schon relativ stark angepaßt und reduziert. Und das war auch eine kommerzielle TTS (text-to-speech)-Lösung.

Eine freiere Lösung und soweit ich weiß auch die Grundlage der Linux-TTS-Lösungen ist http://tcts.fpms.ac.be/synthesis/mbrola.html .

Allerdings haben die nur binäre Versionen, die man nur mit Einschränkungen verwenden darf (nicht-kommerziell und nicht militärisch). Ich hatte da auch mal angefragt und man hätte mir den Sourcecode fürs Crosscompilen (die dbox2 hat einen PowerPC-Prozessor) zukommen lassen, allerdings hätte ich diesen dann sicherlich nicht einfach unter die GPL stellen können. ;)

Weiteres Problem war die fehlende FPU, laut Aussage des Entwicklers verwendet MBrola wohl relativ viel FPU-lastige Routinen.

Ich hatte das damals nicht weiter verfolgt. PC-basierte Lösungen sind da wohl einfacher und leistungsfähiger.
janti
Neugieriger
Neugieriger
Beiträge: 3
Registriert: Donnerstag 11. August 2005, 14:14

Beitrag von janti »

mbrola geht in der Tat nicht - benötigt in deutsch schon ca. 15 MB aber die kommerzielle Version soll wohl mit 3 MB auskommen - ich warte mal die Testversion ab und melde mich dann wieder - würde mich trotzdem freuen, wenn jemand mit guten d-box Kenntnissen sich für dieses Projekt interessieren würde...
Npq
Senior Member
Beiträge: 1339
Registriert: Donnerstag 24. April 2003, 12:12

Beitrag von Npq »

Interesse hatte ich ja, mir fehlte allerdings die TTS-Lösung.

Kommerzielle Lösungen setzen üblicherweise Lizenzverträge voraus, die kosten meist Geld. Wenn wie in unserem Fall auch noch Sourcecode nötig ist geht das meist in die tausende.

Allerdings, wenn ich überlege, was eine Jaws-Lizenz kostet möchte ich schon fast sagen zehntausende. :roll:

Wenn du was hörst sag mal Bescheid, ich finde das Thema schon recht interessant. 3 MB sind übrigens immer noch viel, du weißt, daß in einem üblichen Image normalerweise nur noch ein knappes MB frei ist? Wie gut sich die Sprachdatenbanken komprimieren lassen weiß ich nicht.
janti
Neugieriger
Neugieriger
Beiträge: 3
Registriert: Donnerstag 11. August 2005, 14:14

Beitrag von janti »

...o.k. ich gebe Bescheid, wenn ich mehr weiß. Die d-box müßten wir natürlich abspecken und nur das drauf lassen, was den Blinden auch wirklich interessiert (Spiele, mehrere Oberflächen usw. sind ja nicht unbedingt notwendig). Die Sourcen für die Sprachlösung benötigen wir nicht, da ja eine Programmier-Schnittstelle mitgegeben wird. Lizensen sind allerdings zu bezahlen, bewegt sich aber in vernünftigen Rahmen. Unter welcher email-Adresse kann ich Dich denn erreichen, wenn es soweit ist?

Grüße Jan