Filter fuer bessere Hoerverstaendlichkeit

16/03/2012 - 19:04 von Ralf . K u s m i e r z | Report spam
X-No-Archive: Yes

begin Thread


Moin!

Ich àrgere mich gerade mit Transkriptionen herum. Es gibt
Sprachtonaufnahmen mit nicht so guter Qualitàt (nicht so hoch
ausgesteuert, Telefonbandbreite, Störgeràusche, Genuschel), und es ist
ab und zu wirklich nicht so gut zu verstehen. Und jetzt mal die Frage
an die Experten: Gibt es irgendwas in der Gegend Audacity, VideoLAN o.
à., womit man mit irgendwelchen sinnvollen Standardeinstellungen die
Verstàndlichkeit optimieren kann (Aussteuerung vergleichmàßigen,
Knacks-, Rausch- und Störunterdrückung, Frequenzgangbeeinflussung)? Es
soll nicht "schön" klingen, sondern (zwecks Transkription) möglichst
verstàndlich.

Tontechnik ist irgendwie nicht so meines, aber ich kann die
Rohaufnahmen auch nicht einfach ungeschnitten weggeben (Opfer, die
tippen werden, habe ich schon gefunden), und gescheite Anleitungen
habe ich nicht gefunden. (Simples Beispiel: Bei "Audacity" kann man
Bereiche markieren - unglücklicherweise nur nach ganzzahligen
Sekunden, obwohl die Trennstellen manchmal schon sinnvoll auf
Sekundenbruchteile festzulegen wàren. Da gibt es dann ein Kàstchen
"Einrasten" - was zum Kuckuck ist "einrasten"? Es nervt einfach, wenn
irgendwelche fleißigen Leuten ein ganz offensichtlich ziemlich
raffiniertes Programm mit vielen ausgeklügelten Funktionen stricken,
aber dann leider zu blöd sind, dem auch ein GUI und eine Anleitung zu
verpassen, die ich auch kapiere.)

Ich hatte mal die naive Vorstellung, ich könnte das Blabla einfach auf
eine Spracherkennung geben - keine Chance.


Gruß aus Bremen
Ralf
R60: Substantive werden groß geschrieben. Grammatische Schreibweisen:
adressiert Appell asynchron Atmosphàre Autor bißchen Ellipse Emission
gesamt hàltst Immission interessiert korreliert korrigiert Laie
nàmlich offiziell parallel reell Satellit Standard Stegreif voraus
 

Lesen sie die antworten

#1 Marcel Müller
16/03/2012 - 19:33 | Warnen spam
Hallo,

On 16.03.2012 19:04, Ralf . K u s m i e r z wrote:
Ich àrgere mich gerade mit Transkriptionen herum. Es gibt
Sprachtonaufnahmen mit nicht so guter Qualitàt (nicht so hoch
ausgesteuert, Telefonbandbreite, Störgeràusche, Genuschel), und es ist
ab und zu wirklich nicht so gut zu verstehen. Und jetzt mal die Frage
an die Experten: Gibt es irgendwas in der Gegend Audacity, VideoLAN o.
à., womit man mit irgendwelchen sinnvollen Standardeinstellungen die
Verstàndlichkeit optimieren kann (Aussteuerung vergleichmàßigen,
Knacks-, Rausch- und Störunterdrückung, Frequenzgangbeeinflussung)? Es
soll nicht "schön" klingen, sondern (zwecks Transkription) möglichst
verstàndlich.



Also was weg ist, weil die Aufnahme nichts konnte oder weil der Sprecher
am Mikrofon vorbei gesprochen hat, bekommst Du nicht wieder. Was
allerdings funktioniert ist, Dinge wegzufiltern, die Du nicht brauchst
und die aber trotzdem die Verstàndlichkeit mindern. Man kann also z.B.
Rumpelgeràusche oder Brummen wegfiltern. In gewissen Grenzen auch
Rauschen. Man kann auch die Dynamik einebnen, falls die Lautstàrke stark
schwankt. Aber wenn die Höhen für die Differenzierung der Zischlaute weg
sind, kommen sie durch reindrehen auch nicht wieder.

Ich hatte mal die naive Vorstellung, ich könnte das Blabla einfach auf
eine Spracherkennung geben - keine Chance.



Alte Regel, wenn Du es schlecht verstehst, versteht es der Computer noch
schlechter. Du darfst nicht vergessen, dass unsere "Fehlerkorrektur"
auch auf der semantischen Ebene funktioniert. Also wenn ein Wort in
einem Kontext keinen Sinn ergibt, verstehen wir halt das àhnlich
klingende Wort, was passt.


Marcel

Ähnliche fragen