Was versteht man unter Analyse der auditiven Szenerie?
auditive Szenerie = Anordnung von Schallquellen in der Umwelt
Analyse der auditiven Szenerie = Prozess, in dem die von jeder einzelenen Schallquelle erzeugten Schallsignale in separate Wahrnehmungen aufgegliedert werden.
Problem: Schalle unterschiedlicher Quellen überlagern sich = Auditory Scene
Lösung: Auditory Scene Analysis
Welche sind die Prinzipien der Auditiven Gruppierung?
Herkunftsort
Schallereignisse aus derselben räumlichen Position (oder sich lanfsam verändernder Position) sind in der Regel von der gleichen Quelle
Schallquellen verschiedener Orte
Schallquelle bewegt sich langsam / kontinuierlich
Ähnlichkeit
Klangfarbe - ähnlich klingendes gruppieren wir meist zusammen
Tonhöhe - einzelens Instrument, was abwechselnd hohe und tiefe Töne spielt wird als zwei Melodien wahrgenommen
Lautheit
Was ist Auditory Stream Segregation?
2 überlagerte Reizströme lassen sich diskriminieren, wenn sie sich unterscheiden durch:
Tonlage
Frequenzgehalt (Klangfarbe)
Tempo
Was ist das Prinzip des guten Verlaufs?
= Schallsignale, die in ihrem zeitlcihen Verlauf konstant bleiben oder sich nur langsam verändern, erden oft von gleicher Schallquelle erzeugt, selbst wenn sie von anderem Stimulus unterbrochen werden.
Was ist das Gesetz der ersten Wellenfront?
= gilt in geschlossenen Räumen
Prädenzeffekt
wir nehmen Schallquelle dort wahr, von wo aus der Schall die Ohren zuerst erreicht
Verzögerung zwischen 1 und 5 ms = nur erstes Signal hörbar
ab 5 ms = Echoschwelle
Ereignisse werden separat wahrgenommen
hängt von Art des Stimulus ab (bei Sprache und Musik länger)
Beschreibungsgrößen der Raumakustik
Womit befasst sich die Raumakustik, welche Beschreibungsgrößen kennt sie?
= Frage, wie reflektierter Schall die Wahrnehmungsqualität des Schalls verändert, den wir in geschlossenen Räumen hören
Nachhallzeit
Menge und Zeitdauer des reflektierten Schalls im Raum
Zeit, die der Schallpegel braucht um auf ein Tausendstel seines ursprünglichen Wertes zu fallen
ideal ca 2s
wenn zu lange = matschiger Klang weil zwischen Primärschall und reflektiertem Schall zu große Verzögerung
Präzedenz (intimacy time)
Zeit zwischen Primärschall und erster Reflexion
Anteil der Bässe (bass ratio)
Verhältnis niedrige Frequenzen zu mittleren Frequenzen im reflektierten Schall
Räumlichkeit (spaciousness)
Anteil des reflektierten Schalls innerhalb des Gesamtschalls, der den Zuhörer erreicht
Welche sind die drei Phasen der Sprachproduktion?
Initiationsphase (Lungen, Atem)
Ausatmen = eggressive Laute (faste alle in Deutsch)
Einatmen = ingressive Laute (selten)
Phonationsphase (Stimmbänder)
Offen = stimmlose Konsonanten (t,f,k,s) sie vibrieren nicht
Geschlossen = stimmhafte konsonanten (z,v,g) und Vokale
Artikulationsphase (Vocal tract)
Veränderung des Vocal Tracts (Ansatzrohr) formen unterschiedliche Sprachlaute
Was zeichnet den Vocal Tract bei uns Menschen aus?
vielfalt der Sprachlaute durch Flexibilität des menschlichen Sprechapparates
Kehlkopf sitzt bei uns relativ tief
leichtes Verschlucken
nicht gleichzeitig Atmen und Schlucken
Was ist ein Phonem?
= kleinste bedeutungsunterschiedende lautliche Einheit
Minimalpaare wie B und P = Bein und Pein
Menschen produzierne ca 850 verschieden Sprachlaute (5000 Sprachen)
Deutsch hat 17-19 Vokale und 21 Konsonanten
Was bestimmt die Sprachproduktion des Vocal Tracts?
Form des Vocal Tract ist veränderbar
Beweglich sind:
Kiefer
Lippen
weicher Gaumen
Zunge (spitze und körper)
kann Frequenz des Sprachsignals verändern
Kehlkopfdecken (offen vs geschlossen)
Größe und Form des VT bestimmen Frequenzverteilung des resultierenden Signals
Frequenzverteilung bestimmt welchen Vokal wir hören
Was sind Formanten in der Phonetik?
= Frequenzbereiche im Klangspektrum von Sprachlauten, bei denen besonders viel Energie vorhanden ist
diese Bereiche sind also sehr hervorstechend oder verstärkt
Jeder Vokal hat charakteristisches Muster von Formanten
werden beeinflusst von Stellung der Zunge und Lippen
Muster helfen uns , unterschiedliche Vokale zu unterscheiden
SIND KEINE OBERTÖNE
werden numerisch von niedrig nach hoch geordnet (F0, F1, F2…)
F0 = Grundfrequenz/Stimmlage
bei Kindern 250-400Hz
Frauen 150-250Hz
Männer 90-200Hz
Was ist speech segmentation?
= Prozess, bei dem Gehirn erkennt, wo eine Einheit aufhört und wo eine andere beginnt
Hauptproblem des Verständnis der Sprachwahrnehmung
komplexe Beziehungzwischen akustischen Sprechsignal und des Hörerlebnisses
akustisches Sprachsignal ist nicht klar in einzelne Wörter geliedert - wie wird der kontinuierliche Lautstrom perzeptuell in einzelne Wörter gegliedert?
Wie werden Sprachlaute Klassifiziert?
Art der Luftbehinderung
zB Plosive (p,k)
Verschluß des Mundraumes mit anschließender Öffnung
Ort der Luftbehinderung
zB Bilabiale (b,p,m) mit beiden Lippen gebildet
Stimmhaftigkeit
Stimmhaft (z,d,b,w)
Stimmlos (s,t,p,f)
Nenne einige Artikulationsarten:
Plosive (p,k)
Verschluss mit anschließender Öffnung
Frikative (s,f)
Verengung des Luftstroms
Nasale (n,m)
Verlum (Gaumensiegel) wird gesenkt, sodass die Luft durch Nase entweicht
Nenne einige Artikulationsorte:
Bilabial (p,b,m)
Lautbildung zwischen Lippen
Labiodental (v,f)
Schneidezähne und Unterlippe
Alveolar (t,s,n)
Zungenspitze und Zahnrand
Palatal (ng)
Zungenrücken bewegt sich zum harten Gaumen
Was ist Koartikulation?
= aufeinanderfolgende Sprachlaute werden gemeinsam vorbereitet
Wie? Artikulatoren werden für folgende Laute in vorbereitete Position gebracht
Warum? Sprachproduktion ist schnell, Sprechorgan eher langsam
Formanten anders je nach Vokal der Silbe
Formantenübergänge bestimmen den Konsonanten, sind aber nicht eindeutig
Computer hat Problem Sprache zu verstehen wergen der vielen Möglichkeiten der Koartikulation
Was beschreibt das Phänomen der kategorialen Wahrnehmung?
breites Spektrum an akustischen Sprachsignalen führt zu Wahrnehmung einer begrenzten Anzahl von Wahrnehmungskategorien
Was beschreibt die Bezeichnung Voice-Onset-Time? VOT?
= Merkmal des akustischen Sprachsignals
bezeichnet die zeitliche Verzögerung zwischen dem Einsetzen eines Lautes und dem Beginn dre Schwingung der Stimmbänder
bzw Zeit zwischen einem KOnsonanten und einem Vokal
hilft uns zu untscheiden ob ein Konsonant stimmhaft oder stimmlos ist
VOT am Übergang von ta zu da = Phonemgrenze
Unterschiede an Kategoriengrenzen werden aufgrund der Sensibilität am genausten wahrgenommen
Was bedeutet es, dass unsere Sprachwahrnehmung multimodal ist?
= sie kann beeinflusst werden durch eine Reihe anderer Sinne
Mc Gurk Effekt
auditve Infos überwiegen bei Sprachwahrnehmung
visuelle Infos können auch starken Einfluss ausüben
Infos aus Lippenbewegungen des Sprechers werden als selbstverständlich betrachtet um in lauter Umgebung Sprache zu verstehen
Welchen kognitiven Kontext bedient unsere Sprachwahrnehmung?
im Gedächtnis gespeicherte Infos über Beschaffenheit der Sprache und stimmlicher Charakteristika
bei mehrdeutigkeit im Sprechsignal
Erwartungen helgen beim Sprachverstehen
Wann beginnt die menschliche Sprachwahrnehmung?
Babies reagiern auf Stimme der Mutter anders als auf andere Stimmen
Neugeborene reagiern auf Sprachlaute der eigenen Sprache anders als auf andere Sprachen
Kinder fangen erst mit 2 an zu sprechen, davor ist Verständnisfähigkeit sinnlos und schwer zu messen
Wie kann man die Sprachwahrnehmung von Kindern unter 2 Jahren messen?
mittels EKPs - hier MMNs (missmatch negativity)
Reaktion des Kindes auf einen abweichenden Reiz (bob) in eienr Sequenz von standarden Reizen (beeb)
bobs sind unvorhersehbar
MMN nach 120-150ms
Kinder von 6 Monaten könenn verschiedene Laute unterscheiden (auch von anderen Sprachen)
mit 9 Monaten bildet sich aber das Vokal Inventar - Laute anderer Sprachen können nicht mehr so leicht differenziert werden
Was ist das Conditioned Headturn Paradigm?
Kleinkinder werdne trainiert, ihren Kopf bei einer Abweichung in auditiven Reizen zu reagieren
Sie sollen mit dem drehen ihres Kopfes reagieren
man hat dabei rausgefunden, dass Deutsche Kinder fähig sind den unterschied zwischen Ra und La zu hören, japanische Kinder ab dem 10 Monat jedoch nicht mehr
Was ist das Headturn preference paradigm?
Kleinkinder wenden sich eher der Schallquelle zu, für dessen auditiven Reiz sie eine Vorliebe haben bzw. sie interessanter finden
Hinwendungszeit des Kindes zum Lautsprecher wird gemessen
2 Jährige haben bei fremder sprache mehr interesse gezeigt als bei Muttersprache
Wie spezialisiert sich die Sprachwahrnehmung im Babyalter, wie die Worterkennung?
Fremde Sprachlaute werden im alter von 6 Jahren noch unterschieden
ab 12 Monaten werden Sprachlaute fremder Sprachen nicht mehr unterschieden
Worterkennung - ab 8 Monaten können statistische Regelmäßigkeiten miteinbezogen werden
In welchem Bereich liegen die Noten der meisten Musikinstrumente?
unter 4200 Hz
= Bereich, den wir gut hören
ab 5000 schwierig zu hören
Was sind Oktaven?
= Töne mit doppelten Frequenzen
Intervall zwischen den zwei Frequenzen hat Verhältnis von 1:2
Tonhöhe abhängig von Frequenz
Chroma = gleiche Färbung der Noten, die sich um eine Oktave unterscheiden
Akkorde = 3 Noten oder mehr, simultan gespielt
Konsonant = einfache Frequenzverhältnisse (3:2, 4:3)
Dissonant = Weniger elegante Frequenzverhältnisse (16:15, 45:32)
Last changed10 months ago