Ljudlokalisering - Sound localization

Ljudlokalisering är en lyssnares förmåga att identifiera platsen eller ursprunget för ett detekterat ljud i riktning och avstånd.

Ljudlokaliseringsmekanismerna hos däggdjurens hörselsystem har studerats ingående. Ljudsystemet använder flera signaler för lokalisering av ljudkällor, inklusive tidsskillnad och nivåskillnad (eller intensitetsskillnad) mellan öronen och spektral information. Dessa signaler används också av andra djur, såsom fåglar och reptiler, men det kan finnas skillnader i användningen, och det finns också lokaliseringstecken som saknas i det mänskliga hörselsystemet, till exempel effekterna av öronrörelser. Djur med förmågan att lokalisera ljud har en klar evolutionär fördel.

Hur ljud når hjärnan

Ljud är det perceptuella resultatet av mekaniska vibrationer som rör sig genom ett medium som luft eller vatten. Genom mekanismerna för komprimering och sällsynthet reser ljudvågor genom luften, studsar av yttre örats pinna och concha och kommer in i hörselgången. Ljudvågorna vibrerar trumhinnan ( trumhinnan ), vilket får de tre benen i mellanörat att vibrera, som sedan skickar energin genom det ovala fönstret och in i snäckan där det omvandlas till en kemisk signal av hårceller i orgeln av Corti , som synapser till spiral ganglionfibrer som färdas genom cochleanerven in i hjärnan.

Neurala interaktioner

Hos ryggradsdjur är det känt att interaurala tidsskillnader beräknas i den överlägsna olivkärnan i hjärnstammen . Enligt Jeffress bygger denna beräkning på fördröjningslinjer : neuroner i överlägsen olivolja som accepterar innervering från varje öra med olika anslutande axonlängder . Vissa celler är mer direkt kopplade till ett öra än det andra, så de är specifika för en viss interaural tidsskillnad. Denna teori motsvarar det matematiska förfarandet för korskorrelation . Eftersom Jeffress teori inte kan redogöra för prioritetseffekten , där endast det första av flera identiska ljud används för att bestämma ljudens plats (vilket undviker förvirring orsakad av ekon), kan den inte helt användas för att förklara svaret. Dessutom har ett antal senaste fysiologiska observationer gjorda i mitthjärnan och hjärnstammen hos små däggdjur väckt betydande tvivel om giltigheten av Jeffress ursprungliga idéer.

Neuroner som är känsliga för interaurala nivåskillnader (ILD) exciteras av stimulering av ett öra och hämmas av stimulering av det andra örat, så att cellens svarsstorlek beror på de relativa styrkorna hos de två ingångarna, vilket i sin tur beror på ljudintensitet vid öronen.

I hörselkärnan, den underlägsna colliculus (IC), har många ILD -känsliga neuroner svarsfunktioner som minskar brant från maximala till noll spikar som en funktion av ILD. Men det finns också många neuroner med mycket mer grunda responsfunktioner som inte går ner till noll spikar.

Förvirringskonen

De flesta däggdjur är skickliga på att lösa platsen för en ljudkälla med hjälp av interaurala tidsskillnader och interaurala nivåskillnader. Det finns dock inga sådana tids- eller nivåskillnader för ljud som härstammar längs omkretsen av cirkulära koniska skivor, där konens axel ligger längs linjen mellan de två öronen.

Följaktligen kommer ljudvågor som kommer från någon punkt längs en given omkrets lutande höjd att ha tvetydiga perceptuella koordinater. Det vill säga, lyssnaren kommer inte att kunna avgöra om ljudet härstammar från baksidan, framsidan, toppen, botten eller någon annanstans längs omkretsen vid basen av en kon på ett givet avstånd från örat. Naturligtvis är betydelsen av dessa oklarheter försvinnande små för ljudkällor mycket nära eller väldigt långt bort från motivet, men det är dessa mellanliggande avstånd som är viktigast när det gäller kondition.

Dessa oklarheter kan avlägsnas genom att luta huvudet, vilket kan införa en förskjutning i både amplituden och fasen av ljudvågor som kommer till varje öra. Detta översätter den interaurala axelns vertikala orientering horisontellt och utnyttjar därmed lokaliseringsmekanismen på det horisontella planet. Dessutom kan hörapparaten dra nytta av interferensmönster som genereras av pinnae, bålen och till och med en tillfällig omplanering av en hand som en förlängning av pinna, även utan att växla i interauralaxelns vinkel (dvs. utan att luta huvudet) (t.ex. att kupa handen runt örat).

Som med andra sensoriska stimuli åstadkommes också perceptuell disambiguering genom integration av flera sensoriska ingångar, särskilt visuella signaler. Efter att ha lokaliserat ett ljud inom en cirkels omkrets på ett visst avstånd, hjälper visuella signaler att fixa ljudets placering. Dessutom kommer förkunskaper om placeringen av det ljudgenererande medlet att hjälpa till att lösa dess nuvarande plats.

Ljudlokalisering av det mänskliga hörselsystemet

Ljudlokalisering är processen för att bestämma platsen för en ljudkälla . Hjärnan använder subtila skillnader i intensitet, spektrala och timing -signaler för att låta oss lokalisera ljudkällor. I detta avsnitt, för att djupare förstå den mänskliga hörselmekanismen, diskuterar vi kort om teori om lokalisering av mänskliga öron.

Allmän introduktion

Lokalisering kan beskrivas i termer av tredimensionell position: azimut eller horisontell vinkel, höjd eller vertikal vinkel och avståndet (för statiska ljud) eller hastighet (för rörliga ljud).

Ljudets azimut signaleras av skillnaden i ankomsttider mellan öronen , av den relativa amplituden för högfrekventa ljud (skuggeffekten) och av de asymmetriska spektralreflektionerna från olika delar av våra kroppar, inklusive torso, axlar, och pinnae .

Avståndsmärkena är förlusten av amplitud, förlusten av höga frekvenser och förhållandet mellan den direkta signalen och den efterklangade signalen.

Beroende på var källan finns, fungerar vårt huvud som en barriär för att ändra ljudets intensitet, intensitet och spektrala egenskaper, vilket hjälper hjärnan att orientera varifrån ljudet kom. Dessa små skillnader mellan de två öronen är kända som interaurala signaler.

Lägre frekvenser, med längre våglängder, diffrakterar ljudet runt huvudet och tvingar hjärnan att bara fokusera på fasningstecken från källan.

Helmut Haas upptäckte att vi kan urskilja ljudkällan trots ytterligare reflektioner vid 10 decibel högre än den ursprungliga vågfronten, med hjälp av den tidigaste vågfronten. Denna princip är känd som Haas -effekten , en specifik version av prioritetseffekten . Haas uppmättes till och med en millisekunds skillnad i timing mellan originalljudet och reflekterade ljudet ökade rymden, så att hjärnan kunde urskilja det ursprungliga ljudets verkliga plats. Nervsystemet kombinerar alla tidiga reflektioner till en enda perceptuell helhet så att hjärnan kan bearbeta flera olika ljud samtidigt. Nervsystemet kommer att kombinera reflektioner som ligger inom cirka 35 millisekunder från varandra och som har en liknande intensitet.

Duplexteori

För att bestämma den laterala riktningen ingång (vänster, fram, höger), den hörselsystemet analyserar följande örat signalinformationen:

År 1907 använde Lord Rayleigh stämgafflar för att generera monofonisk excitation och studerade teorin om lokalisering av sidljud på en mänsklig huvudmodell utan öron. Han presenterade först den interaurala ledtrådskillnadsbaserade ljudlokaliseringsteorin, som är känd som Duplex Theory. Mänskliga öron är på olika sidor av huvudet, så de har olika koordinater i rymden. Som visas i duplexteorifiguren, eftersom avstånden mellan den akustiska källan och öronen är olika, finns det tidsskillnad och intensitetsskillnad mellan ljudsignalerna från två öron. Vi kallar den typen av skillnader som Interaural Time Difference (ITD) respektive Interaural Intensity Difference (IID).

Duplexteori

ITD och IID

Interaural tidsskillnad ( ITD ) mellan vänster öra (upptill) och höger öra (nedre).
[ ljudkälla : 100 ms vitt brus från höger]
Interaural nivåskillnad ( ILD ) mellan vänster öra (vänster) och höger öra (höger).
[ ljudkälla : ett svep från höger]

Från duplexteorifiguren kan vi se att för källa B1 eller källa B2 kommer det att finnas en förökningsfördröjning mellan två öron, vilket kommer att generera ITD. Samtidigt kan mänskligt huvud och öron ha en skuggande effekt på högfrekventa signaler, vilket kommer att generera IID.

  • Interaural tidsskillnad (ITD) - Ljud från höger sida når höger öra tidigare än vänster öra. Det auditiva systemet utvärderar interaurala tidsskillnader från: (a) Fasfördröjningar vid låga frekvenser och (b) gruppförseningar vid höga frekvenser.
  • Teori och experiment visar att ITD relaterar till signalfrekvensen f. Antag vinkelläget hos den akustiska källan är θ, är huvudet radie r och den akustiska hastigheten är c, funktionen av ITD ges av: . I ovan stängd form antog vi att 0-graden ligger till höger före huvudet och moturs är positivt.
  • Interaural intensitetsskillnad (IID) eller interaural nivåskillnad (ILD) - Ljud från höger sida har en högre nivå vid höger öra än vid vänster öra, eftersom huvudet skuggar vänster öra. Dessa nivåskillnader är mycket frekvensberoende och de ökar med ökande frekvens. Massiva teoretiska undersökningar visar att IID avser signalfrekvensen f och vinkelpositionen för den akustiska källan θ. Funktionen av IID ges av:
  • För frekvenser under 1000 Hz utvärderas huvudsakligen ITD: er ( fasfördröjningar ), för frekvenser över 1500 Hz utvärderas huvudsakligen IID: er. Mellan 1000 Hz och 1500 Hz finns en övergångszon, där båda mekanismerna spelar en roll.
  • Lokaliseringsnoggrannhet är 1 grad för källor framför lyssnaren och 15 grader för källor till sidorna. Människor kan urskilja interaurala tidsskillnader på 10 mikrosekunder eller mindre.

Utvärdering för låga frekvenser

För frekvenser under 800 Hz är huvudets dimensioner (öronavstånd 21,5 cm, motsvarande en interaural tidsfördröjning på 625 µs) mindre än ljudvågornas halva våglängd . Så hörselsystemet kan bestämma fasfördröjningar mellan båda öronen utan förvirring. Interaurala nivåskillnader är mycket låga i detta frekvensområde, särskilt under cirka 200 Hz, så en exakt utvärdering av ingångsriktningen är nästan omöjlig bara på grund av nivåskillnader. Eftersom frekvensen sjunker under 80 Hz blir det svårt eller omöjligt att använda antingen tidsskillnad eller nivåskillnad för att bestämma ljudets sidokälla, eftersom fasskillnaden mellan öronen blir för liten för en riktningsbedömning.

Utvärdering för höga frekvenser

För frekvenser över 1600 Hz är huvudets dimensioner större än ljudvågornas längd. En entydig bestämning av ingångsriktningen baserad på enbart interaural fas är inte möjlig vid dessa frekvenser. De interaurala nivåskillnaderna blir dock större, och dessa nivåskillnader utvärderas av det auditiva systemet. Fördröjningar mellan öronen kan också fortfarande detekteras via en kombination av fasskillnader och gruppfördröjningar , som är mer uttalade vid högre frekvenser; det vill säga, om det finns en ljudstart kan fördröjningen av denna debut mellan öronen användas för att bestämma ingångsriktningen för motsvarande ljudkälla. Denna mekanism blir särskilt viktig i efterklangsmiljöer. Efter en ljudstart är det en kort tidsram där det direkta ljudet når öronen, men ännu inte det reflekterade ljudet. Ljudsystemet använder denna korta tidsram för att utvärdera ljudkällans riktning och behåller denna detekterade riktning så länge som reflektioner och efterklang förhindrar en entydig riktningsuppskattning. De mekanismer som beskrivs ovan kan inte användas för att skilja mellan en ljudkälla framför lyssnaren eller bakom lyssnaren; därför måste ytterligare ledtrådar utvärderas.

Pinna filtreringseffekt

HRTF

Motiveringar

Duplexteori påpekar tydligt att ITD och IID spelar viktiga roller för ljudlokalisering, men de kan bara hantera laterala lokaliseringsproblem. Till exempel, baserat på duplexteori, om två akustiska källor är symmetriskt placerade på höger fram och höger baksida av det mänskliga huvudet, kommer de att generera lika ITD och IID, vilket kallas som konmodellseffekt. Men mänskliga öron kan faktiskt skilja denna uppsättning källor. Förutom det, i naturligt hörsel, kan bara ett öra, vilket betyder ingen ITD eller IID, skilja källorna med hög noggrannhet. På grund av nackdelarna med duplexteori föreslog forskare pinna -filtreringseffektteorin. Formen på mänsklig pinna är mycket speciell. Den är konkav med komplexa veck och asymmetrisk oavsett horisontellt eller vertikalt. De reflekterade vågorna och de direkta vågorna kommer att generera ett frekvensspektrum på trumhinnan, som är relaterat till de akustiska källorna. Sedan lokaliserar hörselnerverna källorna efter detta frekvensspektrum. Därför föreslogs en motsvarande teori och kallades som pinna -filtreringseffektteori.

Matematisk modell

Dessa spektrumspår som genereras av pinna-filtreringseffekt kan presenteras som en huvudrelaterad överföringsfunktion (HRTF). Motsvarande tidsdomänuttryck kallas för Head-Related Impulse Response (HRIR). HRTF kallas också som överföringsfunktion från det fria fältet till en specifik punkt i hörselgången. Vi brukar känna igen HRTF som LTI -system:

,

där L och R representerar vänster öra respektive höger öra. och representerar ljudtrycksamplituden vid ingångar till vänster och höger hörselgång. är amplituden för ljudtrycket i mitten av huvudkoordinaten när lyssnaren inte existerar. I allmänhet, HRTFs och är funktioner av källan vinkelläge , höjdvinkel , avstånd mellan källan och centrum av huvudet , vinkelhastigheten och den ekvivalenta dimensionen av huvudet .

HRTF -databas

För närvarande är de viktigaste instituten som arbetar med att mäta HRTF-databas CIPIC International Lab, MIT Media Lab, Graduate School in Psychoacoustics vid University of Oldenburg, Neurophysiology Lab vid University of Wisconsin-Madison och Ames Lab från NASA. Databaser över HRIR från människor med normal och nedsatt hörsel och från djur är offentligt tillgängliga.

HRIR

Andra ledtrådar för 3D -rymdlokalisering

Monaural ledtrådar

Det mänskliga yttre örat , det vill säga strukturerna i pinna och den yttre hörselgången , bildar riktningsselektiva filter. Beroende på ljudinmatningsriktningen i medianplanet blir olika filterresonanser aktiva. Dessa resonanser implanterar riktningsspecifika mönster i öronens frekvenssvar , som kan utvärderas av hörselsystemet för vertikal ljudlokalisering . Tillsammans med andra riktningsselektiva reflektioner vid huvudet, axlarna och bålen bildar de de yttre öratöverföringsfunktionerna. Dessa mönster i örats frekvenssvar är mycket individuella, beroende på yttre örats form och storlek. Om ljud presenteras via hörlurar och har spelats in via ett annat huvud med olika formade yttre öronytor, skiljer sig riktningsmönstren från lyssnarens egna, och problem kommer att uppstå när man försöker utvärdera riktningar i medianplanet med dessa främmande öron. Som en konsekvens kan permutationer fram och bak eller lokalisering i huvudet visas när du lyssnar på dummy-huvudinspelningar eller på annat sätt kallas binaurala inspelningar. Det har visats att människor kan monauralt lokalisera högfrekvent ljud men inte lågfrekvent ljud. Binaural lokalisering var dock möjlig med lägre frekvenser. Detta beror troligen på att pinna är tillräckligt liten för att bara interagera med ljudvågor med hög frekvens. Det verkar som om människor bara kan lokalisera höjden av ljud som är komplexa och inkluderar frekvenser över 7000 Hz, och en pinna måste vara närvarande.

Dynamiska binaurala signaler

När huvudet är stilla, ger de binaurala signalerna för lateral ljudlokalisering (interaural tidsskillnad och interaural nivåskillnad) ingen information om platsen för ett ljud i medianplanet. Identiska ITD och ILD kan produceras av ljud i ögonhöjd eller vid vilken höjd som helst, så länge sidoriktningen är konstant. Men om huvudet roteras förändras ITD och ILD dynamiskt, och dessa förändringar är olika för ljud i olika höjder. Till exempel, om en ljudkälla i ögonhöjd är rakt fram och huvudet vrider sig till vänster, blir ljudet högre (och kommer tidigare) till höger öra än till vänster. Men om ljudkällan ligger direkt över huvudet kommer det inte att bli någon förändring i ITD och ILD när huvudet vrider. Mellanhöjningar kommer att ge mellanliggande grader av förändring, och om presentationen av binaurala signaler för de två öronen under huvudrörelsen vänds kommer ljudet att höras bakom lyssnaren. Hans Wallach förändrade artificiellt ett ljuds binaurala signaler under huvudets rörelser. Även om ljudet objektivt placerades i ögonhöjd, var de dynamiska förändringarna av ITD och ILD när huvudet roterade de som skulle produceras om ljudkällan hade höjts. I denna situation hördes ljudet vid den syntetiserade höjden. Det faktum att ljudkällorna objektivt sett förblev i ögonhöjd hindrade monauriska signaler från att specificera höjden, vilket visar att det var den dynamiska förändringen av de binaurala signalerna under huvudrörelsen som gjorde att ljudet kunde lokaliseras korrekt i den vertikala dimensionen. Huvudrörelserna behöver inte produceras aktivt; exakt vertikal lokalisering inträffade i en liknande inställning när huvudrotationen producerades passivt genom att sitta för ögonbindeln i en roterande stol. Så länge de dynamiska förändringarna i binaurala signaler följde en uppfattad huvudrotation, uppfattades den syntetiserade höjden.

Ljudkällans avstånd

Det mänskliga hörselsystemet har endast begränsade möjligheter att bestämma avståndet till en ljudkälla. I närområdet finns vissa indikationer för avståndsbestämning, till exempel extrema nivåskillnader (t.ex. vid viskning i ett öra) eller specifika pinna (den synliga delen av örat) resonanser i närbildsområdet.

Hörsystemet använder dessa ledtrådar för att uppskatta avståndet till en ljudkälla:

  • Direkt/ reflektionsförhållande: I slutna rum anländer två typer av ljud till en lyssnare: Det direkta ljudet kommer till lyssnarens öron utan att reflekteras vid en vägg. Reflekterat ljud har reflekterats minst en gång vid en vägg innan det anländer till lyssnaren. Förhållandet mellan direkt ljud och reflekterat ljud kan ge en indikation om ljudkällans avstånd.
  • Ljudstyrka: Avlägsna ljudkällor har en lägre ljudstyrka än nära. Denna aspekt kan utvärderas särskilt för välkända ljudkällor.
  • Ljudspektrum: Höga frekvenser dämpas snabbare av luften än låga frekvenser. Därför låter en avlägsen ljudkälla mer dämpad än en nära, eftersom de höga frekvenserna dämpas. För ljud med ett känt spektrum (t.ex. tal) kan avståndet uppskattas grovt med hjälp av det upplevda ljudet.
  • ITDG: The Initial Time Delay Gap beskriver tidsskillnaden mellan ankomst av direktvåg och första starka reflektion hos lyssnaren. Närliggande källor skapar en relativt stor ITDG, där de första reflektionerna har en längre väg att ta, möjligen många gånger längre. När källan är långt borta har de direkta och de reflekterade ljudvågorna liknande banlängder.
  • Movement: I likhet med det visuella systemet finns också fenomenet rörelse parallax i akustisk perception. För en rörlig lyssnare passerar närliggande ljudkällor snabbare än avlägsna ljudkällor.
  • Nivåskillnad: Mycket nära ljudkällor orsakar en annan nivå mellan öronen.

Signalbehandling

Ljudbehandling av det mänskliga auditiva systemet utförs i så kallade kritiska band . Den hörsel intervall är uppdelad i 24 kritiska band, vardera med en bredd av 1 Bark eller 100 Mel . För en riktningsanalys analyseras signalerna inuti det kritiska bandet tillsammans.

Ljudsystemet kan extrahera ljudet från en önskad ljudkälla ur störande störningar. Detta gör att lyssnaren kan koncentrera sig på endast en högtalare om andra högtalare också pratar ( cocktailparty -effekten ). Med hjälp av cocktailparty -effekten uppfattas ljud från störande riktningar dämpat jämfört med ljudet från önskad riktning. Ljudsystemet kan öka signal-brus-förhållandet med upp till 15  dB , vilket innebär att störande ljud uppfattas som dämpat till hälften (eller mindre) av dess verkliga ljudstyrka .

Lokalisering i slutna rum

I slutna rum kommer inte bara det direkta ljudet från en ljudkälla till lyssnarens öron, utan också ljud som har reflekterats vid väggarna. Det hörande systemet analyserar endast det direkta ljudet, som kommer först, för lokalisering av ljud, men inte det reflekterade ljudet, som kommer senare ( lagen om den första vågfronten ). Så ljudlokalisering är möjlig även i en ekoisk miljö. Denna ekodämpning sker i Dorsal Nucleus of the Lateral Lemniscus (DNLL).

För att bestämma tidsperioderna, där det direkta ljudet råder och som kan användas för riktningsutvärdering, analyserar det hörande systemet ljudförändringar i olika kritiska band och även stabiliteten i den upplevda riktningen. Om det finns ett starkt angrepp av ljudstyrkan i flera kritiska band och om den upplevda riktningen är stabil, orsakas denna attack med stor sannolikhet av det direkta ljudet från en ljudkälla, som kommer in nyligen eller som ändrar dess signalkarakteristik. Denna korta tidsperiod används av det hörande systemet för riktnings- och ljudstyrningsanalys av detta ljud. När reflektioner anländer lite senare, ökar de inte ljudstyrkan inuti de kritiska banden på ett så starkt sätt, men riktningssignalerna blir instabila, eftersom det finns en blandning av ljud från flera reflektionsriktningar. Som ett resultat utlöses ingen ny riktningsanalys av det auditiva systemet.

Denna första detekterade riktning från det direkta ljudet tas som den hittade ljudkällans riktning, tills andra starka ljudstyrkaattacker, i kombination med stabil riktningsinformation, indikerar att en ny riktningsanalys är möjlig. (se Franssen -effekten )

Specifika tekniker med applikationer

Hörselöverföring stereosystem

Denna typ av ljudlokaliseringsteknik ger oss det riktiga virtuella stereosystemet . Den använder "smarta" manikiner, till exempel KEMAR, för att samla in signaler eller använda DSP -metoder för att simulera överföringsprocessen från källor till öron. Efter förstärkning, inspelning och överföring återges de två kanalerna för mottagna signaler via hörlurar eller högtalare. Denna lokaliseringsmetod använder elektroakustiska metoder för att erhålla rumslig information om det ursprungliga ljudfältet genom att överföra lyssnarens hörselapparat till det ursprungliga ljudfältet. De mest betydande fördelarna med det skulle vara att dess akustiska bilder är livliga och naturliga. Det behöver också bara två oberoende överförda signaler för att återge den akustiska bilden av ett 3D -system.

fikon. 6 Ljudlokalisering med Manikin

3D para-virtualisering stereosystem

Representanterna för denna typ av system är SRS Audio Sandbox, Spatializer Audio Lab och Qsound Qxpander. De använder HRTF för att simulera de mottagna akustiska signalerna vid öronen från olika riktningar med vanlig binärkanals stereoåtergivning. Därför kan de simulera reflekterade ljudvågor och förbättra subjektiv känsla av rymd och omslutning. Eftersom de är para-virtualiserings stereosystem är deras huvudsakliga mål att simulera stereoljudinformation. Traditionella stereosystem använder sensorer som skiljer sig ganska mycket från mänskliga öron. Även om dessa sensorer kan ta emot den akustiska informationen från olika riktningar, har de inte samma frekvensrespons från det mänskliga hörselsystemet. Därför, när binärt kanalläge tillämpas, kan mänskliga hörselsystem fortfarande inte känna 3D-ljudeffektfältet. 3D-para-virtualiserings stereosystemet övervinner dock sådana nackdelar. Den använder HRTF -principer för att ta fram akustisk information från det ursprungliga ljudfältet och sedan producera ett levande 3D -ljudfält genom vanliga hörlurar eller högtalare.

Multikanal stereo virtuell reproduktion

Eftersom multikanals stereosystem kräver många reproduktionskanaler har vissa forskare använt HRTF -simuleringstekniker för att minska antalet reproduktionskanaler. De använder bara två högtalare för att simulera flera högtalare i ett flerkanalssystem. Denna process kallas för virtuell reproduktion. I huvudsak använder ett sådant tillvägagångssätt både interaural skillnadsprincip och pinna -filtreringseffektteori. Tyvärr kan denna metod inte helt ersätta det traditionella flerkanaliga stereosystemet, till exempel 5.1 / 7.1 surroundljudsystem . Det beror på att när lyssningszonen är relativt större kan simuleringsreproduktion genom HRTF orsaka inverterade akustiska bilder vid symmetriska positioner.

Djur

Eftersom de flesta djur har två öron kan många av effekterna av det mänskliga hörselsystemet också hittas hos andra djur. Därför spelar interaurala tidsskillnader (interaurala fasskillnader) och interaurala nivåskillnader en roll för hörseln av många djur. Men påverkan på lokalisering av dessa effekter beror på huvudstorlekar, öronavstånd, öronlägen och öronens orientering.

Lateral information (vänster, framåt, höger)

Om öronen är placerade vid sidan av huvudet kan liknande laterala lokaliseringstecken som för det mänskliga hörselsystemet användas. Detta innebär: utvärdering av interaurala tidsskillnader (interaurala fasskillnader) för lägre frekvenser och utvärdering av interaurala nivåskillnader för högre frekvenser. Utvärderingen av interaurala fasskillnader är användbar, så länge det ger entydiga resultat. Detta är fallet, så länge öronavståndet är mindre än halva längden (maximal en våglängd) för ljudvågorna. För djur med ett större huvud än människor förskjuts utvärderingsområdet för interaurala fasskillnader mot lägre frekvenser, för djur med ett mindre huvud förskjuts detta intervall mot högre frekvenser.

Den lägsta frekvensen som kan lokaliseras beror på örats avstånd. Djur med större öronavstånd kan lokalisera lägre frekvenser än människor kan. För djur med ett mindre öronavstånd är den lägsta lokaliserbara frekvensen högre än för människor.

Om öronen är placerade vid sidan av huvudet visas interaurala nivåskillnader för högre frekvenser och kan utvärderas för lokaliseringsuppgifter. För djur med öron på toppen av huvudet kommer ingen skuggning av huvudet att visas och därför kommer det att bli mycket mindre interaurala nivåskillnader, som kan utvärderas. Många av dessa djur kan röra öronen, och dessa öronrörelser kan användas som en lateral lokaliseringstecken.

Odontocetes

Delfiner (och andra odontocetes) förlitar sig på ekolokalisering för att hjälpa till att upptäcka, identifiera, lokalisera och fånga byten. Delfinsonarsignaler är väl lämpade för att lokalisera flera, små mål i en tredimensionell vattenmiljö genom att använda mycket riktad (3 dB strålbredd på cirka 10 grader), bredband (3 dB bandbredd vanligtvis på cirka 40 kHz; toppfrekvenser mellan 40 kHz och 120 kHz), klick med kort varaktighet (cirka 40 μs). Delfiner kan lokalisera ljud både passivt och aktivt (ekolokalisering) med en upplösning på cirka 1 grader. Cross-modal matchning (mellan syn och ekolokalisering) föreslår att delfiner uppfattar den rumsliga strukturen hos komplexa objekt som förhörs genom ekolokalisering, en bedrift som sannolikt kräver att rumsliga lösningar av enskilda objektegenskaper och integration i en holistisk representation av objektformen uppfattas. Även om delfiner är känsliga för små, binaurala intensitet och tidsskillnader, tyder allt större bevis på att delfiner använder positionsberoende spektrala signaler som härrör från välutvecklade huvudrelaterade överföringsfunktioner för ljudlokalisering i både horisontella och vertikala plan. En mycket liten temporal integrationstid (264 μs) möjliggör lokalisering av flera mål på olika avstånd. Lokaliseringsanpassningar inkluderar uttalad asymmetri i skallen, nässäckar och specialiserade lipidstrukturer i pannan och käftarna, samt akustiskt isolerade mellan- och inneröron.

I medianplanet (fram, ovan, bak, under)

För många däggdjur finns det också uttalade strukturer i pinna nära ingången till hörselgången. Som en konsekvens kan riktningsberoende resonanser uppträda, vilka kan användas som en ytterligare lokaliseringskod, liknande lokaliseringen i medianplanet i det mänskliga hörselsystemet. Det finns ytterligare lokaliseringstecken som också används av djur.

Huvudet lutar

För ljudlokalisering i medianplanet (höjd av ljudet) kan också två detektorer användas som är placerade på olika höjder. Hos djur erhålls dock grov höjdinformation helt enkelt genom att luta huvudet, förutsatt att ljudet varar tillräckligt länge för att slutföra rörelsen. Detta förklarar det medfödda beteendet att slå huvudet åt sidan när man försöker lokalisera ett ljud exakt. För att få omedelbar lokalisering i mer än två dimensioner från tidsskillnad eller amplitud-skillnad signaler kräver mer än två detektorer.

Lokalisering med kopplade öron (flugor)

Den lilla parasitflugan Ormia ochracea har blivit en modellorganism i ljudlokaliseringsexperiment på grund av dess unika öra . Djuret är för litet för att tidsskillnaden mellan ljud som kommer till de två öronen kan beräknas på vanligt sätt, men ändå kan det bestämma riktningen för ljudkällor med utsökt precision. De trumhinnor av motsatta öron är direkt förbundna mekaniskt, vilket möjliggör upplösning av sub-mikrosekunders tidsskillnader och kräver nytt neuralt kodningsstrategi. Ho visade att det kopplade trumhinnesystemet i grodor kan ge ökade interaurala vibrationsskillnader när endast små ankomsttider och ljudnivåskillnader var tillgängliga för djurets huvud. Arbetet med att bygga riktningsmikrofoner baserat på den kopplade trumhinnans struktur pågår.

Bi-koordinat ljudlokalisering (ugglor)

De flesta ugglor är nattliga eller kreppande rovfåglar . Eftersom de jagar på natten måste de lita på icke-visuella sinnen. Experiment av Roger Payne har visat att ugglor är känsliga för ljuden från deras byte, inte värmen eller lukten. I själva verket är ljudsignalerna både nödvändiga och tillräckliga för lokalisering av möss från en avlägsen plats där de ligger uppe. För att detta ska fungera måste ugglorna kunna lokalisera både azimut och höjden av ljudkällan.

Historia

Termen "binaural" betyder bokstavligen "att höra med två öron", och introducerades 1859 för att beteckna praxis att lyssna på samma ljud genom båda öronen, eller på två diskreta ljud, ett genom varje öra. Det var inte förrän 1916 som Carl Stumpf (1848–1936), en tysk filosof och psykolog , skilde mellan dikotiskt lyssnande, som hänvisar till stimulering av varje öra med en annan stimulans , och diotiskt lyssnande, samtidig stimulering av båda öronen med samma stimulans.

Senare skulle det bli uppenbart att binaural hörsel, oavsett om det är dikotiskt eller diotiskt, är det sätt på vilket ljudlokalisering sker.

Vetenskapligt övervägande av binaural hörsel började innan fenomenet fick namnet så, med spekulationer publicerade 1792 av William Charles Wells (1757–1817) baserat på hans forskning om kikarsyn . Giovanni Battista Venturi (1746–1822) genomförde och beskrev experiment där människor försökte lokalisera ett ljud med båda öronen, eller ett öra blockerat med ett finger. Detta arbete följdes inte upp och återhämtades först efter att andra hade räknat ut hur lokalisering av mänskligt ljud fungerar. Lord Rayleigh (1842–1919) skulle göra samma experiment och komma till resultaten, utan att veta att Venturi först hade gjort dem, nästan sjuttiofem år senare.

Charles Wheatstone (1802–1875) arbetade med optik och färgblandning och utforskade också hörseln. Han uppfann en enhet som han kallade en "mikrofon" som involverade en metallplatta över varje öra, var och en ansluten till metallstavar; han använde den här enheten för att förstärka ljud. Han gjorde också experiment med att ställa in gafflar till båda öronen samtidigt eller separat, för att försöka räkna ut hur hörseln fungerar, som han publicerade 1827. Ernst Heinrich Weber (1795–1878) och August Seebeck (1805–1849) och William Charles Wells försökte också jämföra och kontrastera det som skulle bli känt som binaural hörsel med principerna för kikareintegration i allmänhet.

Att förstå hur skillnaderna i ljudsignaler mellan två öron bidrar till auditiv bearbetning på ett sådant sätt att ljudlokalisering och riktning möjliggördes avsevärt långt efter uppfinningen av stetofonen av Somerville Scott Alison 1859, som myntade termen 'binaural'. Alison baserade stetofonen på stetoskopet , som hade uppfunnits av René Théophile Hyacinthe Laennec (1781–1826); stetofonen hade två separata "mickar", så att användaren kunde höra och jämföra ljud från två diskreta platser.

Se även

Referenser

externa länkar