Localization of sound sources. Theoretical foundations and results of experimental investigations

Joanna Czajka; Marek Niewiarowicz

eISSN: 2084-9842
ISSN: 1643-9279

Postępy w chirurgii głowy i szyi/Advances in Head and Neck Surgery

Bieżący numer Archiwum O czasopiśmie Suplementy Rada naukowa Bazy indeksacyjne Prenumerata Kontakt Zasady publikacji prac

Wyszukiwanie

1/2005
vol. 4

Poleć ten artykuł:

Wyślij znajomemu

Skopiuj link:

Udostępnij:

Lokalizacja źródeł dźwięku. Podstawy teoretyczne oraz wyniki badań eksperymentalnych

Joanna Czajka

,

Marek Niewiarowicz

Post w chirurgii głowy i szyi 2005; 1: 25–42

Data publikacji online: 2005/05/20

Plik artykułu:

- Lokalizacja.pdf [0.47 MB]

Pobierz cytowanie

Dr nauk fizycznych Marek Niewiarowicz jest specjalistą w dziedzinie akustyki. Po ukończeniu studiów na Wydziale Elektrycznym Politechniki Poznańskiej rozpoczął pracę w Instytucie Akustyki Uniwersytetu im.
A. Mickiewicza w Poznaniu. Jego praca naukowa koncentrowała się głównie na problemach związanych z oceną własności transmisyjnych przetworników elektroakustycznych, jak również na badaniach korelacji ocen obiektywnych i subiektywnych głośników oraz zestawów głośnikowych. W 2002 r. rozpoczął pracę w Katedrze i Klinice Otolaryngologii Akademii Medycznej w Poznaniu. Badania, którymi zajmuje się obecnie, dotyczą zagadnień związanych z lokalizacją oraz percepcją ruchu źródeł dźwięku przez osoby normalnie słyszące oraz osoby z patologią słuchu, zarówno nieprotezowane, jak i protezowane aparatami słuchowymi bądź implantami ślimakowymi. Ponadto prowadzi prace związane z modyfikacją metod rehabilitacji szumów usznych.
Jest członkiem Polskiego Towarzystwa Akustycznego, Audio Engineerig Society oraz Stowarzyszenia Pomocy Osobom z Przewlekłymi Szumami Usznymi.

Mgr Joanna Czajka ukończyła studia licencjackie z protetyki słuchu oraz studia magisterskie w Instytucie Akustyki na Wydziale Fizyki Uniwersytetu im. A Mickiewicza w Poznaniu. Pracę w Katedrze i Klinice Otolaryngologii Akademii Medycznej w Poznaniu rozpoczęła w 2000 r. Jej zainteresowania naukowe dotyczą badań nad lokalizacją źródeł dźwięku oraz leczenia szumów usznych metodą TRT przez zastosowanie pomocy słuchowych oraz kompensacji ubytków słuchu i podniesienia komfortu słyszenia u osób z aparatami słuchowymi.

Wprowadzenie
Każdy człowiek przebywający w środowisku, w którym rozchodzą się dźwięki, stale znajduje się pod ich działaniem. Ponieważ – w odróżnieniu od oczu – uszy ma stale otwarte, można powiedzieć, że niezależnie od stanu świadomości w jakim się znajduje, nieprzerwanie słyszy odgłosy środowiska w całej jego przestrzenności. Należy podkreślić możliwość oceny położenia źródeł dźwięku w przestrzeni za pomocą słuchu w warunkach ograniczonych, np. w ciemności czy we mgle, co może być pomocne w przypadku unikanego czy poszukiwanego obiektu.
Słyszenie kierunkowe jest filogenetycznie starsze od innych czynności ucha, takich jak percepcja mowy, muzyki, tonu czystego czy dźwięków środowiskowych. Zjawisko to już od dawna budziło zainteresowania neurologów, fizjologów i ontologów. Omawiane zagadnienie, w obecnych warunkach życia, gdy człowiek jest bez przerwy poddawany rozmaitym, tak pod względem jakości, jak i natężenia, bodźcom akustycznym, nabiera coraz szerszego znaczenia. Mimo licznych i bardzo różnorodnych badań eksperymentalnych zjawisko lokalizacji nie zostało dotychczas całkowicie opracowane. Na podstawie badań Matzkera wiadomo jednak, że w lokalizacji dźwięku dużą rolę odgrywają synapsy w obrębie komórek zwojowych pnia mózgu. Przemawiają za tym zarówno założenia teoretyczne, badania elektrofizjologiczne na zwierzętach oraz doświadczalne operacyjne wyłączenia poszczególnych odcinków mózgowia, jak też badania nad lokalizacją w zależności od wieku. Na podstawie wyników powyższych badań stwierdzono możliwość działania hamującego z drogi słuchowej ucha pobudzanego wcześniej na drogę słuchową ucha pobudzanego później [1].
Jako pierwszy rozwiązaniem problemu ilościowego określenia przestrzennej rozdzielczości systemu słuchowego zajął się Mills [2]. Wyznaczył on wielkość, dzięki której mamy możliwość oceny spostrzegania przez badanych małych zmian kierunku, z którego dochodzi dźwięk. Parametrem, który dostarcza nam informacji o tej rozdzielczości, jest wielkość kątowa, określana przez słuchacza jako zaledwie spostrzegana zmiana kąta, z którego dochodzi dźwięk, względem położenia źródła dźwięku odniesienia (ang. MAA – minimum audible angle).
Mniej więcej w tym samym czasie Zakrzewski opracował metodę, która również pozwala wyznaczyć wartości kątowe położenia źródła dźwięku [3]. Słuchacz otrzymywał 2 następujące po sobie sygnały pochodzące z różnych miejsc w obrębie koła, po którym przesuwał się głośnik (słuchacz znajdował się w centrum). Najmniejszy kąt pomiędzy dwoma położeniami głośnika, kiedy słuchacz jeszcze rozpoznawał, że obydwa sygnały dochodzą z dwóch różnych miejsc przestrzeni, określono kątem ostrości słyszenia kierunkowego – KOSK.
Głównym celem pracy było wyznaczenie wartości kąta ostrości słyszenia kierunkowego KOSK dla grupy osób zdrowych, normalnie słyszących, przy różnym typie sygnałów akustycznych. Elementem nowatorskim było wykorzystanie w pomiarach sygnałów szumowych zmodulowanych amplitudowo, które dotychczas nie zostały przetestowane w badaniach KOSK. Wybór sygnałów szumowych w znacznie lepszym stopniu odzwierciedla warunki otaczającego nas środowiska w porównaniu z sygnałami sinusoidalnymi. Z kolei zastosowanie modulacji amplitudowej przybliża nas do warunków, z którymi mamy do czynienia w przypadku sygnałów mowy. Podjęto próbę zweryfikowania zdolności lokalizacyjnych w badaniach KOSK dla tego typu sygnałów.
I. Podstawy teoretyczne
1. Podstawowe definicje i pojęcia
związane ze słyszeniem kierunkowym
Lokalizowanie źródeł dźwięku w różnych eksperymentach jest bezpośrednio związane ze słuchaniem sygnałów z wykorzystaniem głośników lub słuchawek. W przypadku kiedy interesuje nas kierunek, z którego dochodzi dźwięk, oraz ocena odległości danego źródła w przestrzeni, mówimy o lokalizacji źródła dźwięku. Natomiast wrażenie, które powstaje na zewnątrz głowy badanego, nazywa się eksternalizacją (uzewnętrznieniem) obrazu dźwiękowego. W przypadku kiedy w pomiarach używamy słuchawek, obraz dźwiękowy słyszany jest wewnątrz głowy, a badany określa przemieszczanie się dźwięku pozornego w stronę prawego lub lewego ucha, czyli lateralizuje źródło dźwięku. Efekt ten nazywany jest internalizacją obrazu dźwiękowego [4].
Słyszenie binauralne (dwuuszne) wynika z faktu posiadania dwojga uszu, w przeciwieństwie do słyszenia monauralnego, czyli słyszenia jednousznego.
Określenie kierunku źródła dźwięku w przestrzeni jest wyznaczane względem głowy słuchacza poprzez zdefiniowane 3 płaszczyzny: płaszczyznę horyzontalną, środkową i przednią. Wszystkie płaszczyzny przecinają się w środku głowy, co wyznacza punkt, który jest początkiem układu współrzędnych. Punkt ten umożliwia określenie kierunku rozchodzącego się dźwięku względem głowy. Płaszczyzna horyzontalna przechodzi przez górne krawędzie otworów słuchowych zewnętrznych i dolne krawędzie oczodołów. Płaszczyzna przednia jest prostopadła do płaszczyzny horyzontalnej, natomiast płaszczyzna środkowa jest prostopadła do obydwu – horyzontalnej i środkowej. Wektor r łączący początek układu współrzędnych z określonym punktem w przestrzeni nosi nazwę promienia wodzącego. Kierunek, z którego dociera dźwięk, jest określany za pomocą 2 kątów:
- azymutalnego, czyli kąta pomiędzy kierunkiem oznaczającym przód a rzutem promienia wodzącego (kąt θ na ryc. 1.);
- biegunowego, czyli kąta pomiędzy płaszczyzną horyzontalną a promieniem wodzącym (kąt δ na ryc. 1.).
Gdy kąt biegunowy jest równy zeru, źródło dźwięku znajduje się w płaszczyźnie horyzontalnej, natomiast kąt azymutalny o wartości równej zeru oznacza, że źródło leży w płaszczyźnie środkowej.
1.1. Teorie i zjawiska związane
z lokalizacją źródeł dźwięków tonalnych
Aby omówić zdolności przestrzenne systemu słuchowego, należy zapoznać się z mechanizmami słuchowej lokalizacji źródeł dźwięku, czyli tzw. przesłankami czy inaczej teoriami lokalizacyjnymi. Wynikają one bezpośrednio z faktu posiadania dwojga uszu i różnic w docierających do nich sygnałach oraz w zmianach w zależności od ich cech fizycznych. Pierwszą grupę omawianych dźwięków stanowią sygnały tonalne (sinusoidalne), charakteryzujące się stałością swoich parametrów w czasie.
Możliwość oceny różnic w sygnałach docierających do obojga uszu, odpowiedzialnych za lokalizację źródeł dźwięku, powstaje dzięki założonemu sferycznemu modelowi głowy [6]. Zgodnie z tym założeniem rozpatrujemy głowę jako sferę z umieszczonymi na niej uszami leżącymi na prostej przechodzącej przez jej środek. Według tego modelu źródło dźwięku (S) jest punktowe i znajduje się pod kątem θ względem prostej prostopadłej do prostej łączącej uszy i przechodzącej także przez środek sfery (ryc. 2.).

1.1.1. Międzyuszna różnica czasu – ITD
Międzyuszna różnica czasu (interaural time difference – ITD) jest jedną z podstawowych przesłanek lokalizacyjnych i wynika bezpośrednio z różnicy dróg, jaką musi pokonać fala akustyczna od źródła do obojga uszu. Kiedy źródło dźwięku znajduje się naprzeciw słuchacza, międzyuszna różnica odległości jest równa zero, tzn. dla kąta Θ=0^o (ryc. 3.); międzyuszna różnica czasu wynosi wtedy 0 µs. Dla kątów Θ=90^o i 270^o, czyli gdy źródło umieszczone jest dokładnie naprzeciw lewego bądź prawego ucha, różnica odległości jest największa i międzyuszna różnica czasu wynosi nawet 690 µs (przy założeniu, że promień głowy r_g wynosi 9 cm). Na ryc. 3. pokazano, że gdy fala akustyczna dotrze do prawego ucha – P, to musi pokonać dodatkową drogę Δr, aby dotrzeć do przeciwległego ucha – L.
Równanie opisujące różnicę dróg ma postać:

Δr = AB + BL = r_g(sin θ + θ),

gdzie: θ – wyrażony w radianach kąt położenia źródła dźwięku względem słuchacza
r_g – promień głowy

Tak więc równanie opisujące różnice czasowe można przedstawić następująco:

Δt = Δr/c = r_g(sin Θ + Θ)/c,

gdzie: c – prędkość rozchodzenia się dźwięku w powietrzu (c=344 m/s)

Dla sygnałów sinusoidalnych różnica w fazach jest równa różnicy czasu fal docierających do obojga uszu. Różnica fazy ΔΦ jest powiązana z ITD następującą zależnością:
Δt = ΔΦ/2πf.

Aby uniknąć niejednoznaczności fazowych i móc efektywnie korzystać z ITD, połowa długości fali powinna być większa od odległości między uszami. Dla fal krótszych wartość przesunięcia fazowego nie jest jednoznaczna z ITD, co prowadzi do powstawania błędów lokalizacyjnych. Przesłanka lokalizacyjna oparta na ITD jest spełniona dla fal o częstotliwościach poniżej 1 500 Hz [8]. A zatem lokalizacja tonów o częstotliwościach wyższych od 1 500 Hz jest niejednoznaczna. Nie oznacza to jednak, że dla dźwięków o wyższych częstotliwościach lokalizacja jest niemożliwa, system słuchowy może bowiem efektywnie rejestrować ITD dla sygnału ok. 4 000 Hz, pod warunkiem że jest on zmodulowany amplitudowo częstotliwością poniżej 1 000 Hz [6].
Relacje zależności międzyusznej różnicy czasu od kąta padania fali akustycznej w płaszczyźnie horyzontalnej przedstawiono na ryc. 4.
Z ryc. 4. wynika, że największe wartości ITD występują dla kąta 90^o, czyli kiedy źródło umieszczone jest z boku głowy słuchacza.

1.1.2. Międzyuszna różnica natężeń – IID
Międzyuszna różnica natężeń (interaural intensity difference – IID), niekiedy nazywana też międzyuszną różnicą poziomów (interaural level difference – ILD), jest kolejną przesłanką tłumaczącą możliwości słyszenia przestrzennego. Wynika bezpośrednio z faktu, że głowa oraz małżowiny uszne stanowią swego rodzaju przeszkodę na drodze propagacji fal akustycznych, w przypadku, gdy źródło dźwięku usytuowane jest z boku głowy słuchacza, co powoduje, że poziomy dźwięku docierającego do obojga uszu mogą różnić się w istotny sposób. Przesłanka ta jest związana z dyfrakcją fali akustycznej, czyli ugięciem fali na przeszkodzie, którą w tym przypadku jest sfera (ryc. 2.). Wielkość międzyusznej różnicy natężeń zależy od długości fali akustycznej w porównaniu z wymiarami przeszkody, czyli głowy. Jeżeli długości fal są porównywalne i większe od wymiarów głowy, to fale uginają się na niej, obchodząc głowę i z łatwością docierają do przeciwnego ucha. Różnice natężeń w takim przypadku są pomijalnie małe.
Natomiast dla fal akustycznych, których długość jest mała w porównaniu z wymiarami głowy (fale o częstotliwościach większych od 1 500 Hz), powstaje tzw. cień akustyczny, całkowity lub częściowy, po stronie ucha przeciwnego. W takiej sytuacji międzyuszne różnice intensywności mogą osiągać wartości do 20 dB. IID jest funkcją zależną od częstotliwości i rośnie wraz z jej wzrostem. Poniżej przedstawiono zależność międzyusznej różnicy poziomu ciśnienia akustycznego w zależności od kąta azymutalnego źródła (ryc. 5.).
Z wykresu przedstawionego na ryc. 5. wynika, że układ słuchowy człowieka jest czuły na międzyuszną różnicę poziomów ciśnienia akustycznego dla każdej częstotliwości. Jako przesłanka lokalizacyjna międzyuszna różnica poziomów zaczyna odgrywać istotną rolę dopiero dla częstotliwości powyżej 500 Hz, stając się najbardziej efektywnym czynnikiem dla częstotliwości powyżej 3 000 Hz [9].

1.1.3. Minimalny kąt słyszenia – MAA
Minimalny kąt słyszenia (minimum audible angle – MAA) to najmniejsza spostrzegana zmiana pozycji kątowej źródła dźwięku. Wnosi ona bezpośrednio informacje o możliwościach rozdzielczych systemu słuchowego. W badaniach Millsa słuchacze otrzymywali do odsłuchu ciąg 2 następujących po sobie sygnałów sinusoidalnych prezentowanych w płaszczyźnie horyzontalnej przy zastosowaniu głośników. Pierwszy sygnał był dźwiękiem odniesienia dla źródła ustawionego w azymutach 0^o, 30^o, 45^o, 60^o i 75^o, natomiast kolejny pochodził ze źródła testowego, umiejscowionego na prawo lub lewo względem źródła odniesienia. Zadaniem słuchaczy było określenie najmniejszego przesunięcia sygnału testowego względem źródła dźwięku odniesienia [2].
Z tego i wielu innych eksperymentów psychoakustycznych wynika, że słuchacz potrafi zlokalizować źródła emitujące tony o niskich częstotliwościach z dużą dokładnością. Dla źródła dźwięku umieszczonego na wprost (dla kąta θ bliskiego zeru) słuchacze są zdolni rozróżniać zmiany kąta rzędu 1^o–2^o. Jednostopniowa różnica odpowiada wielkości ITD rzędu 13 ms. Występuje tu pozorna sprzeczność: jak system nerwowy z bezwładnością rzędu milisekund [8] jest w stanie wykrywać tak małe różnice czasowe. Rozwiązanie tego fenomenu tłumaczy się równoległą transmisją sygnałów z obu uszu równocześnie do centralnego układu nerwowego. System dwuuszny pomija ograniczenia czasowe, transmitując sygnały jednocześnie przez wiele neuronów i dzięki temu staje się możliwa detekcja tak małych kątów i odpowiednio różnic czasowych [6].
Zwiększając azymut źródła oraz częstotliwość sygnału, można zaobserwować pogorszenie się możliwości rozdzielczych.

1.2. Teorie i zjawiska związane
z lokalizacją dźwięków złożonych
1.2.1. Międzyuszna różnica w widmi
Dźwięki otaczające nas w życiu codziennym są dźwiękami złożonymi, tzn. składają się z wielu tonów o różnych częstotliwościach, które zmieniają się w czasie. W sytuacji, kiedy umieszczamy źródło dźwięku pod pewnym kątem w stosunku do osi symetrii głowy, sygnały docierające do jednego ucha będą zmienione w stosunku do sygnałów docierających do drugiego ucha. Dzieje się tak dlatego, że składowe o częstotliwościach wyższych, które dotrą do ucha dalszego od źródła dźwięku, zostaną stłumione przez efekt ekranujący głowy. Powstaje zatem następna przesłanka lokalizacyjna, która jest znacząca i pomocna w procesie lokalizacji dźwięku. Ciekawy eksperyment przeprowadził Wightman [10], dokonano w nim manipulacji przesłankami lokalizacyjnymi polegającej na tym, że przesłanka związana z ITD sugerowała wybór innego kierunku źródła dźwięku niż przesłanki związane z IID oraz wpływem małżowiny usznej. Okazało się, że dopóki szerokopasmowy sygnał zawierał składowe o niskich częstotliwościach, o wyborze kierunku decydowała przesłanka ITD. W miarę redukcji składowych niskoczęstotliwościowych dominacja ITD zanikała, a kierunek był określany głównie na podstawie pozostałych przesłanek.

1.2.2. Znaczenie przebiegów transjentowych w procesie lokalizacji źródła dźwięku
Bardzo istotny wpływ na dokładność lokalizacji źródła dźwięku ma czas trwania transjentu początkowego sygnału ze względu na fakt, że w trakcie narastania sygnału powstaje dodatkowa międzyuszna różnica natężenia. Wartość tej różnicy zależy od czasu trwania transjentu początkowego, zmienia się w czasie i występuje również, gdy stany ustalone obu sygnałów, lewo- i prawousznego, mają równe wartości natężenia. Teoretycznie przy czasach narastania większych od 100 ms czynnik ten nie odgrywa już żadnej roli, ponieważ różnica natężenia maleje wraz ze wzrostem czasu narastania i praktycznie równa jest międzyusznej różnicy natężenia dla stanu ustalonego. Z badań psychoakustycznych wynika jednak, że dla czasów narastania większych od 100 ms wpływ transjentu początkowego ma istotne znaczenie na pogorszenie zdolności lokalizacyjnych, co manifestuje się zwiększoną liczbą błędnych odpowiedzi [11].
2. Ocena odległości od źródła dźwięku
Równie ważna jak ocena lokalizacji przestrzennej źródła dźwięku jest ocena jego odległości od obserwatora. Parametry, dzięki którym możliwa jest ocena odległości źródła dźwięku od słuchacza, zostały zestawione przez Colemana [12] i Blauerta [5] w 3 punktach:
- zmniejszający się wraz ze wzrostem odległości poziom ciśnienia akustycznego; w środowisku bezpogłosowym dla źródła punktowego wartość poziomu ciśnienia akustycznego maleje o 6 dB przy podwojeniu odległości;
- w miarę zwiększania odległości źródła dźwięku od słuchacza zmianie ulega obwiednia widmowa sygnału, ponieważ udział składowych wysokoczęstotliwościowych jest mniejszy; odczuwalna jest zmiana barwy dźwięku;
- stopień rozproszenia dźwięku; termin ten określa, że im większy jest stosunek energii fali bezpośredniej do energii fali odbitej w sygnale, tym źródło znajduje się w odległości mniejszej od obserwatora.
Opisane powyżej parametry należy podzielić na te, które są absolutne bądź relatywne. Parametry absolutne pozwalają na przybliżone określenie odległości źródła dźwięku od obserwatora, natomiast parametry relatywne są informacją wynikającą z porównania, czyli odniesienia odległości jednego źródła dźwięku w stosunku do drugiego.
3. Inne czynniki mające wpływ
na zdolności lokalizacyjne
3.1. Znaczenie ruchu głową
Do czynników ułatwiających lokalizację źródła dźwięku można zaliczyć mimowolne ruchy głowy, które niezależnie od szybkości oraz stopnia wychylenia mają istotny wpływ na lokalizację źródła dźwięku w różnych płaszczyznach i tym większego znacenia nabierają w sytuacjach, gdy dwuuszne różnice natężenia lub czasu są mało wyraźne [13–15]. Dzięki wynikom badań Klenscha [14] dowiadujemy się o ogromnej roli ruchów głowy w lokalizacji źródła dźwięku. Przeprowadził on eksperyment, zakładając badanym do przewodów słuchowych gumowe rurki zakończone lejkami, w taki sposób, by ruchy głowy nie powodowały zmiany ustawienia lejków. W rezultacie występowała widocznie mniejsza zdolność lokalizacyjna. Wyniki badań zostały potwierdzone również w 1958 r. przez Jongkeesa i Veera [15]. Późniejsze badania dowiodły, że procesowi lokalizacji źródła dźwięku zawsze towarzyszy ruch głowy, który może być niezauważalny gołym okiem [16].
3.2. Znaczenie małżowin usznych
Kolejnym czynnikiem poprawiającym możliwości słyszenia przestrzennego są małżowiny uszne. Mimo nieznacznych rozmiarów małżowin ludzkich i ich nieruchomości w porównaniu z niektórymi zwierzętami, u których możliwy jest ruch małżowin, człowiek nadrabia brak takich zdolności ruchem głowy.
Autorzy niektórych eksperymentów uważają, że małżowina uszna ma szczególne znaczenie w ocenie położenia źródła dźwięku w płaszczyźnie pionowej [17] oraz z przodu i z tyłu. Inni przypisują małżowinom usznym istotną rolę w lokalizowaniu źródeł dźwięku w każdym kierunku [18, 19].
Wiener [20] w swoich pracach kładzie nacisk na szczególną rolę małżowin usznych w tłumieniu wysokich częstotliwości dochodzących z tyłu głowy (osłabienie dźwięku). Z ich założeń wynika, że głowa, włosy oraz małżowiny uszne stanowią swoisty ekran akustyczny, działający na fale dźwiękowe tym skuteczniej, im wyższa jest częstotliwość dźwięku.
Ze względu na anatomiczną budowę zewnętrznego przewodu słuchowego w sygnałach akustycznych, które rozchodzą się w tym przewodzie, następuje szereg opóźnień (dla płaszczyzny horyzontalnej 0–80 µs dla płaszczyzny pionowej 100–300 µs), przez co ulega zmianie ich struktura czasowa. Ma to bezpośredni wpływ na istniejące już międzyuszne różnice i korzystnie wpływa na dokładność lokalizacji [18].
3.3. Rola rodzaju sygnału akustycznego w procesie lokalizacji
Istotny wpływ na stopień dokładności lokalizacji źródła dźwięku ma rodzaj stosowanego sygnału akustycznego. Z badań Toninga [21] wynika, że dźwięki złożone lokalizowane są dokładniej niż sygnały tonalne. Należy również podkreślić wpływ częstotliwości tonów na stopień ich lokalizacji: tony o częstotliwościach z zakresu 2 000–8 000 Hz lokalizujemy z większą trudnością niż te o częstotliwościach 500–1 000 Hz [22, 23]. Bodziec akustyczny, wg Christiana i Rösera [24] oraz Harrisa [25], najlepiej lokalizujemy w momencie jego narastania i zaniku, a nie podczas jego trwania, stąd lepiej lokalizowane są krótkie impulsy dźwiękowe.
3.4. Znaczenie wieku
w badaniach lokalizacji
Na zdolność lokalizacji dźwięku ma również wpływ wiek słuchacza. Badania Matzkera i Springborna [26] wykazały, że zaburzenia słuchu u osób starszych są, oprócz zmian obwodowej części narządu słuchu, spowodowane również zmianami w centralnym układzie nerwowym.
W 1965 r. Łaciak podjął próbę przebadania zdolności lokalizacji słuchowej u 80 osób, w zależności od wieku i płci, stosując sygnały tonalne o różnych częstotliwościach [22]. Stwierdził pogarszanie się lokalizacji słuchowej z wiekiem, istotne dla kobiet między 30. i 40. rokiem życia oraz mężczyzn między 40. i 50. rokiem życia. Powyżej 50. roku życia zaburzenia lokalizacji narastały szybciej, ale w jednakowym stopniu u kobiet i mężczyzn. Wraz z wiekiem pogarsza się możliwość słyszenia przestrzennego we wszystkich azymutach (najmniejszemu zaburzeniu ulega lokalizacja tonów w azymutach 0^o i 180^o). Najlepiej lokalizowane były tony o częstotliwościach 1 000 Hz, gorzej 500 Hz i najgorzej 4 000 Hz.
3.5. Efekt pierwszeństwa
Rozchodzenie się dźwięku w przestrzeni zamkniętej jest zjawiskiem złożonym z uwagi na występowanie szeregu fal odbitych o różnych amplitudach i opóźnieniach czasowych, dochodzących do obserwatora z różnych kierunków. W wyniku nakładania się tych fal powstaje złożona struktura pola akustycznego w tej przestrzeni. Pomimo, że do obserwatora docierają fale akustyczne z różnych kierunków, odbiera on najczęściej pojedynczy obraz dźwiękowy o dość dobrze zlokalizowanym w przestrzeni źródle [7]. Lokalizacja ta możliwa jest dzięki tzw. efektowi pierwszeństwa lub inaczej, prawa pierwszego czoła fali [5]. Zgodnie z tym efektem, dla lokalizacji źródła dźwięku w przestrzeni zamkniętej najważniejsza jest fala, która jako pierwsza dochodzi do obserwatora. Falą tą jest zawsze dźwięk bezpośredni dochodzący z kierunku źródła, a nie odbicia, które dochodzić mogą z różnych kierunków, z różnymi opóźnieniami czasowymi. Efekt pierwszeństwa występuje dla dźwięków o charakterze impulsowym lub transjentowym. Efekt ten tłumaczy się tym, że pierwsza fala (bezpośrednia) wnosi najwięcej informacji o kierunku źródła dźwięku. W przypadku, gdy różnica czasu pomiędzy dźwiękami docierającymi do obydwu uszu jest mniejsza od ok. 1 ms, efekt pierwszeństwa na ogół nie występuje lub też jest bardzo słaby. W pewnych przypadkach może on też wystąpić również wtedy, gdy dźwięki docierające do obu uszu leżą w płaszczyźnie środkowej, czyli gdy nie występuje ITD [27]. Nie jest on jednakże wtedy tak wyraźny, jak dla źródeł leżących w płaszczyźnie horyzontalnej. Efekt pierwszeństwa nie występuje też wtedy, jeśli różnice poziomu ciśnienia akustycznego pomiędzy dźwiękiem odbitym i bezpośrednim są rzędu 10-15 dB. Efekt ten jest szczególnie wyraźny dla dźwięków o tej samej strukturze czasowej lecz w pewnych przypadkach obserwuje się go też dla dźwięków o różnych widmach. Należy zaznaczyć, że istnienie efektu pierwszeństwa nie oznacza całkowitego zamaskowania informacji niesionych przez odbicia, ponieważ w praktyce dość łatwo jest odróżnić dźwięk bez odbić od dźwięku z odbiciami. Jeśli chodzi o pomieszczenie to odbicia dźwięku nie odgrywają większej roli przy lokalizacji źródła, bowiem następuje ich percepcyjna fuzja z dźwiękiem bezpośrednim. Aby fuzja taka mogła nastąpić, maksymalne czasy opóźnienia poszczególnych odbić, liczone względem dźwięku bezpośredniego, nie mogą być większe niż około kilkadziesiąt milisekund, zaś poziom ciśnienia akustycznego dźwięku odbitego względem dźwięku bezpośredniego nie powinien przekraczać wartości 10 dB [28].
Efekt pierwszeństwa odgrywa ważną rolę w życiu codziennym, ponieważ umożliwia on lokalizację oraz identyfikację źródeł dźwięku w różnych warunkach środowiska akustycznego. Niektóre prace sugerują, że percepcja tego efektu jest procesem zachodzącym na stosunkowo niskich poziomach percepcji wrażeń słuchowych [29, 30].
3.6. Efekt coctail party
Jest to zjawisko akustyczne, które w pośredni sposób jest związane z zagadnieniami lokalizacji źródeł dźwięku. Jego istotą jest wykazanie selektywnej uwagi. Polega ono na koncentracji wokół interesującego dla słuchacza przekazu akustycznego (monologu, dialogu prowadzonego w otoczeniu dodatkowych źródeł dźwięku) i równoczesnym ignorowaniu (najczęściej nieświadomym) informacji akustycznych docierających do słuchacza z innych miejsc. Tłumaczy się to faktem, że mózg jest w stanie zdekomponować otaczającą sytuację akustyczną na poszczególne strumienie i tym samym dokonać, w pewnym sensie, selektywnego wyboru pomiędzy poszczególnymi źródłami dźwięku [31].
4. Podstawy lateralizacji dźwięku
Podczas badań, kiedy sygnał prezentowany jest słuchaczowi za pomocą słuchawek, występuje zjawisko pojawiania się obrazu dźwiękowego wewnątrz głowy.
W sytuacji kiedy międzyuszna różnica natężeń i międzyuszna różnica czasu równa się zeru, lokalizacja wrażenia słuchowego następuje w środku głowy. Gdy wartości ITD i IID są różne od zera, występuje lateralizacja, czyli przemieszczenie obrazu dźwiękowego w kierunku ucha prawego lub lewego. Kierunek przemieszczenia zależy od znaku i wartości międzyusznej różnicy czasu i natężenia.
W badaniach Yosta [32] zaobserwowano, że wraz ze wzrostem międzyusznej różnicy fazy od 0^o do 60^o dla sygnału o częstotliwości 500 Hz obraz dźwiękowy przenosi się w stronę ucha, w którym sygnał wyprzedza w fazie sygnał podawany do ucha przeciwnego. Dla wartości od 60^o do 120^o następuje dalsze, ale wolniejsze przemieszczenie obrazu dźwiękowego, natomiast dla wartości 180^o słuchacze nie potrafią jednoznacznie umiejscowić źródła dźwięku w tym uchu, a raczej sygnalizują jego przemieszczenie do ucha przeciwnego bądź słyszą sygnał równocześnie w prawym i lewym uchu.
Według Schiano i wsp. [33] oraz Yosta i Haftera [34] znaczenie międzyusznej różnicy fazy maleje ze wzrostem częstotliwości sygnału i zanika dla częstotliwości 1 500 Hz.
Umiejscowienie obrazu dźwiękowego wewnątrz głowy jest zależne od drugiego czynnika lokalizacyjnego, a mianowicie międzyusznej różnicy poziomu ciśnienia akustycznego. Według badań Yosta [32] dla sygnału o częstotliwości 200 Hz i wartości różnic od 16 do 18 dB słuchacze sygnalizują wyraźne położenie obrazu dźwiękowego w prawym bądź lewym uchu.
Dla dźwięków złożonych, o zdolnościach lokalizacyjnych decydują takie czynniki, jak struktura czasowa i widmowa tych dźwięków [35].
W 1971 r. wykonano badania z wykorzystaniem sygnałów impulsowych, w których zmianie ulegał skład widmowy. Było to możliwe dzięki filtracji górno- i dolnoprzepustowej tego sygnału [36]. Stwierdzono, że dyskryminacja pomiędzy słyszeniem obrazu dźwiękowego w środku głowy a słyszeniem bocznym zależy głównie od składowych o niskich częstotliwościach zawartych w impulsach. Pogorszenie zdolności lateralizacyjnych dla częstotliwości wysokich jest wynikiem zaniku możliwości porównywania faz sygnałów powyżej 1 500 Hz w obojgu uszach. Tak więc dla impulsów powyżej 1 500 Hz następuje rozmazanie obrazu dźwiękowego.
Dla sygnałów zmodulowanych amplitudowo lateralizacja była zależna w większym stopniu od wzajemnego opóźnienia czasowego obwiedni sygnałów zmodulowanych aniżeli od opóźnienia czasowego sygnałów nośnych [36, 37]. Sygnały można lateralizować na podstawie opóźnienia czasowego obwiedni nawet wtedy, gdy częstotliwości nośne w obu uszach są różne. Dla sygnałów złożonych, zawierających jedynie składowe o częstotliwościach wysokich, słuchacze dokonują porównania przebiegów czasowych w obojgu uszach. Zdolności lateralizacyjne są najlepsze, gdy częstotliwości nośne są identyczne.

Zdolności lokalizacyjne przez pomiary słuchawkowe dostarczają nam konkretnych wartości ITD czy ILD, można więc takie pomiary nazwać laboratoryjną wersją lokalizacji. W tego typu badaniach pomijamy znaczenie małżowin usznych, które są również, jak wspomniano wcześniej, pewnym przyczynkiem lokalizacyjnym.
5. Metody badania lokalizacji źródła dźwięku w wolnym polu dźwiękowym
Pomiary lokalizacyjne wykonywano na wolnym powietrzu lub w pomieszczeniach wyściełanych suknem już w latach 70. XIX w. Osoby badane otaczane były źródłami dźwięku, które znajdowały się w jednakowych odległościach od słuchacza. Osoba badana wskazywała źródło dźwięku ręką, co w różnych stanach chorobowych (niekonieczne słuchu) nie dawało prawidłowej odpowiedzi, ponieważ następowało zbaczanie ręki [39], bądź odpowiedź słuchacza polegała na skierowaniu strumienia światła z reflektora w kierunku źródła [40]. Przeprowadzano również pomiary takie, w których badany zwracał twarz czy całe ciało w kierunku źródła dźwięku. Wyniki pomiarów szacowano na podstawie stosunku liczby wskazań prawidłowych do błędnych.
W późniejszych pomiarach prowadzonych przez Sancheza-Longo i wsp. [41] używano perymetru okulistycznego i głośników umieszczonych w 13 stałych punktach tego perymetru. Wyniki odczytywano przez porównanie kąta zawartego między pozycją wskazywaną a pozycją rzeczywistego umiejscowienia źródła.
W 1933 i 1937 r. prace nad badaniami słyszenia przestrzennego rozpoczął Zakrzewski. Badany znajdował się w środku koła o średnicy 3,3 m, na którym zamocowanych było 13 głośników. W płaszczyźnie poziomej znajdowało się 8 głośników rozmieszczonych co 1/8 obwodu koła, natomiast reszta głośników usytuowana była w płaszczyźnie pionowej. Badany wskazywał położenie źródła dźwięku ręką, z jednoczesnym słownym określeniem jego położenia [42, 43].
Wilska wykonywał pomiary w 3 płaszczyznach przestrzeni, wykorzystując w tym celu 2 głośniki. Badany znajdował się w środku okręgu, po obwodzie którego zbliżano i oddalano od siebie głośniki. Miarą zdolności lokalizacyjnej była wielkość kąta pomiędzy promieniem wychodzącym ze środka koła do punktów, w których umiejscowione były głośniki [44].
W 1960 r. Zakrzewski w miejsce dwugłośnikowego badania zastosował pomiar jednogłośnikowy [3].
Jedna z nowszych metod badania lokalizacji została opracowana przez Kina i Teteruk w 2001 r. [45]. Celem eksperymentu było określenie znaczenia sygnału maskującego w lokalizacji źródła dźwięku. Sygnał dźwiękowy lokalizowanego źródła maskowany był w przestrzeni w różnych miejscach względem sygnału użytecznego. Pomiary przeprowadzano dla położeń źródła dźwięku pod kątami azymutalnymi 0^o, 25^o, 45^o, 60^o oraz 90^o. Tony o częstotliwości 800 Hz i poziomie 80 dB SPL podawane były przez 1 s. Sygnałem maskującym był szum biały o takim samym poziomie, emitowany przez głośnik umieszczony pod kątem azymutalnym 60^o, 120^o, 180^o, 240^o, 300^o i 360^o. Miarą określającą zdolność lokalizacyjną był błąd lokalizacji jako wielkość określająca zdolność systemu słuchowego do rozróżniania bodźców pochodzących z różnych kierunków w obecności sygnałów zakłócających. Wnioski wysnute przez autorów badań mówią o znaczącym pogorszeniu zdolności lokalizacyjnych sygnałów emitowanych centralnie w obecności sygnału maskującego przy jednoczesnym braku wpływu położenia sygnału maskującego na wartość błędu dla kątów bliskich 0^o. Dla tonów dochodzących pod kątem 80^o nie stwierdzono wpływu sygnału zagłuszającego na błąd lokalizacji. Przy kierunku pośrednim przychodzenia dźwięku, czyli 25^o 45^o, 60^o, położenie sygnału maskującego ma silny wpływ na wartość błędu lokalizacji źródła dźwięku.
6. Kliniczne wykorzystanie badania KOSK
Jak już podano, pierwsze badania KOSK zainicjował Zakrzewski [3]. W piśmiennictwie dotyczącym zdolności rozdzielczych układu słuchowego weryfikowanego metodą KOSK można znaleźć kilka interesujących tematów.
W 1962 r. Zakrzewski badał zdolności lokalizacyjne w różnych stanach narządu przedsionkowego [46]. Celem jego pracy było sprawdzenie, czy zaburzenia przedsionkowe mogą w jakimkolwiek stopniu wpływać na wielkość KOSK. Osoby badane podzielono na 2 grupy. Pierwszą stanowiło 8 osób z prawidłowym przebiegiem krzywych progu słyszenia, natomiast ze znacznym osłabieniem pobudliwości błędnikowej (osoby te leczono dużymi dawkami streptomycyny). Wszyscy badani wykazywali prawidłowe zdolności lokalizacyjne w badaniu KOSK dla tonu o częstotliwości 1 000 Hz i poziomie ciśnienia akustycznego 100 dB. Druga seria badań dotyczyła osób zdrowych o prawidłowym słuchu i niezaburzonej czynności przedsionkowej, ale poddanych próbie badania narządu przedsionkowego, czyli badaniu kalorycznemu i próbie obrotowej. Pomiaru KOSK dokonano przed powyższymi próbami i po nich. W próbie kalorycznej wartości KOSK były identyczne, podobnie jak w badaniu obrotowym przy 2–3 obrotach. Natomiast przy zastosowaniu 10 obrotów w ciągu 20 s stwierdzono zaburzenia lokalizacji, które ustępowały po paru sekundach. Uzyskane wyniki pokazują, że zdolności lokalizacji dźwiękowej są czynnością słuchową niezależną od podrażnienia narządu przedsionkowego, co podnosi wartość kliniczną tego pomiaru.
Problemem wieku w badaniach KOSK zajmowali się Szmeja i Gerwel [47]. Zbadano 30 osób w wieku 40–49 lat, 50–59 lat oraz osoby starsze. Stwierdzono pogarszanie się zdolności lokalizacji słuchowej wraz z wiekiem w znaczącym stopniu dla osób od 50. roku życia. Zmiany te autorzy tłumaczą fizjologicznym starzeniem się całego organizmu, włącznie z narządami zmysłów.
Kolejnym podejmowanym w piśmiennictwie tematem było badanie lokalizacji dźwiękowej u osób z objawem wyrównania głośności [48]. Badaniami objęto grupę 70 osób z chorobą Ménière’a, czyli niedosłuchem odbiorczym z objawem wyrównania głośności, oraz 38 osób z guzami nerwu słuchowego. Na podstawie uzyskanych wyników stwierdzono wyraźną współzależność pomiędzy objawem wyrównania głośności a lokalizacją słuchową. Przy obecności tego objawu lokalizacja jest dużo lepsza niż w przypadku osób zdrowych. Stopień niedosłuchu nie miał istotnego wpływu na przebieg lokalizacji dźwięku. Chorzy z chorobą Ménière’a lokalizowali źródło dźwięku bardzo dobrze, w przeciwieństwie do chorych z guzami nerwu słuchowego, kiedy stwierdzono wyraźne zaburzenia po stronie ucha gorzej słyszącego. W 8 przypadkach, mimo że ubytek słuchu nie był głęboki, osoby te nie potrafiły określić kierunku, z którego docierały sygnały.
W 1964 r. Pruszewicz i Gerwel prowadzili badania nad lokalizacją słuchową u osób niewidomych [49]. Autorzy przebadali KOSK u 20 niewidomych (11 osób ze ślepotą nabytą i 9 ze ślepotą wrodzoną). Stwierdzono, że wartości KOSK u niewidomych nie odbiegały od wartości średnich dla osób widzących oraz nie zauważono istotnych różnic między osobami ze ślepotą nabytą i wrodzoną.
Kolejnym podjętym tematem były zmiany adaptacji słuchowej u chorych z niedoczynnością nadnerczy [50]. Przebadano 29 osób, z czego w 14 przypadkach stwierdzono zaburzenia lokalizacji dźwięku, które po zastosowaniu leczenia hormonalnego ustąpiły. U wszystkich chorych wartości KOSK były wyjątkowo małe.
W 1977 r. w pracy na temat wartości klinicznej badania lokalizacji dźwięku podsumowano pomiary przeprowadzane od 1958 r. dla 6 grup chorych [51]. Pierwszą grupę stanowiły osoby z chorobą Ménière’a – 70 przypadków; u wszystkich stwierdzono lokalizację dźwięku w granicach normy. Druga grupa – 30 przypadków; obejmowała pourazowe uszkodzenia pnia mózgu. W badaniach tych osób stwierdzono bardzo duże zaburzenia lub całkowity brak zdolności lokalizacyjnych. Trzecią grupę stanowiło 60 osób ze stwardnieniem rozsianym. Zaburzenia lokalizacji stwierdzono u 38 osób, występowało ono nawet u osób z prawidłowym audiogramem. Kolejna grupa poddana badaniom KOSK to 70 chorych z guzami kąta mostowo-móżdżkowego. Wyniki badań wykazywały duże zaburzenia, zależne od stopnia zaawansowania choroby. Piątą grupą było 50 chorych z wyleczoną padaczką skroniową, u których wartości KOSK były podwyższone, zwłaszcza w azymutach skroniowych – 45^o i 315^o. Ostatnią grupę stanowiło 10 osób z wyleczonym ropniem płata skroniowego – wszyscy badani mieli wyraźne zaburzenia lokalizacji dźwięku.
W 1980 r. po raz kolejny poruszono kwestie wieku, azymutów i różnic wartości KOSK u kobiet i mężczyzn w badaniu 315 zdrowych osób w wieku od 15 do 80 lat. Już u młodych osób między 20. a 30. rokiem życia stwierdzono pogorszenie lokalizacji słuchowej w azymutach 90^o, 270^o, 135^o i 225^o oraz u osób między 30. a 40. rokiem życia w azymutach 0^o, 45^o i 315^o. W przypadku osób po 70. roku życia następuje wzrost wartości KOSK dla wszystkich azymutów. Różnice między kobietami i mężczyznami okazały się statystycznie mało istotne, a więc w tego typu badaniach można rozpatrywać wyniki KOSK wspólnie dla kobiet i mężczyzn [52].
7. Lokalizacja źródeł dźwięku
pacjentów z implantami ślimakowymi
Pacjenci zaimplantowani obustronnie zgodnie potwierdzają zdolność do przestrzennej lokalizacji źródeł dźwięku. Jak wykazano wcześniej, u osób normalnie słyszących zdolność do lokalizacji źródeł dźwięku opiera się na ITD, IID oraz na przesłankach widmowych. Stwierdzono, że względna istotność tych przesłanek lokalizacyjnych zależy od płaszczyzny (horyzontalna, przednia, środkowa), w jakiej usytuowane jest źródło. W płaszczyźnie horyzontalnej na zdolności lokalizacyjne wpływają bardziej różnice międzyuszne niż przesłanki widmowe. Stwierdzono, że dla pacjentów zaimplantowanych obustronnie istotniejsze znaczenie ma IID niż ITD [53]. Przytoczone wyżej fakty prowadzą do pytania, w jakim stopniu pacjenci zaimplantowani jednostronnie lub dwustronnie będą zdolni lokalizować źródło dźwięku. Przeprowadzono eksperyment, w którym udział wzięło 3 słuchaczy. W kabinie bezechowej rozmieszczono w płaszczyźnie horyzontalnej 9 głośników dla azymutów od -120^o do +120^o. Wykorzystywano impulsy szumowe o czasie trwania 1 s, przy czym poziom stosowanego sygnału był albo stały (70 dB SPL), albo przypadkowo zmienny (60, 70 lub 80 dB SPL). Sygnały były emitowane 5-krotnie z każdego głośnika, a zadaniem pacjenta było wskazanie strony i kierunku, z którego docierał sygnał. W przypadku wszystkich pacjentów testy przeprowadzono w warunkach wykorzystania obydwu implantów oraz z wykorzystaniem pojedynczego implantu. W przypadku pojedynczego implantu 2 pacjentów potrafiło określić stronę, z której dochodził dźwięk (przy stałym poziomie pobudzenia), a 1 pacjent dawał poprawne odpowiedzi przy zmiennych poziomach. W przypadku dwustronnego wykorzystania implantów wszyscy pacjenci wykazywali zdolność prawidłowego wskazywania głośnika, przy czym średnie odchylenie wynosiło ok. 15^o. To odchylenie było znacznie mniejsze w przypadku, kiedy był to głośnik usytuowany na wprost pacjenta.
Uzyskane wyniki pokazują, że dwustronne implantowanie ślimakowe może w pewnych granicach stanowić odpowiednik wrażenia słyszenia dwuusznego.
II. Badania eksperymentalne
Przedstawione poniżej wyniki własnych badań eksperymentalnych zaprezentowane zostały na XIV Sympozjum Audiologicznym [54].
1. Słuchacze
Do przeprowadzenia badań eksperymentalnych wyselekcjonowano grupę 10 osób normalnie słyszących (6 kobiet i 4 mężczyzn) w wieku 18–28 lat.
1.1. Kryteria kwalifikacyjne słuchaczy do badań KOSK
Jak wynika z piśmiennictwa nie ma jednoznacznych kryteriów kwalifikacyjnych dla słuchaczy przystępujących do tego typu badań. Natomiast pewne jest, że pomiarów KOSK można dokonywać zarówno u kobiet, jak i mężczyzn jako jednej wspólnej grupy [52]. Najczęściej kryterium wyboru badanych jest pomiar progu słyszenia ze względu na to, że sam proces słyszenia przestrzennego zdeterminowany jest zdolnością słyszenia w ogóle.
Podstawą dalszych kwalifikacji był poprawny wynik badania audiometrii tonalnej oraz badania akumetrycznego.
1.2. Badania audiometryczne
Badanie audiometrii tonalnej wykonano w kabinie audiometrycznej przy użyciu audiometru Interacustic AD 229b ze słuchawkami TDH 39 dla przewodnictwa powietrznego metodą wstępującą dla częstotliwości 250, 500, 1 000, 2 000, 4 000 i 8 000 Hz.

W oparciu o normę ISO TR 4870:1991(E) dotyczącą wyznaczania krzywej normowej przy kalibrowaniu audiometru, kiedy dobiera się osoby, których próg słyszalności nie przekracza 10 dB HL, stwierdzono prawidłowy słuch u wszystkich przebadanych słuchaczy. Wyniki tych badań przedstawiono na ryc. 7.
1.3. Badanie akumetryczne
Badania akumetryczne przeprowadzono wykorzystując test Webera przy użyciu widełek stroikowych o częstotliwości 512 Hz. Słuchacze lokalizowali wrażenie dźwiękowe w środku głowy, co potwierdzało ich zdolność do przeprowadzenia badań.
2. Warunki przeprowadzenia
eksperymentu
2.1. Pomieszczenie do badań
Badania zostały przeprowadzone w komorze bezechowej Instytutu Akustyki UAM, która spełnia wymagania normy ISO 3745-1977.
2.2. Układ pomiarowy
Zestaw pomiarowy składał się z następujących elementów:
- komputer Macintosh HD z oprogramowaniem Syntesiser 0,83,
- wzmacniacz Optonica SM-1616 firmy Sharp,
- zestaw głośnikowy Excellence EX-1S firmy Tonsil,
- urządzenie do przesuwu zestawu głośnikowego.
Komputer Macintosh HD wykorzystano jako generator sekwencji sygnałów badawczych, które po wzmocnieniu przez wzmacniacz Optonica podawano na zestaw głośnikowy. W celu określenia poziomu ciśnienia akustycznego, w miejscu gdzie w czasie pomiaru znajdowała się głowa badanego, zostały zmierzone wartości poziomu równoważnego dźwięku przy zastosowaniu miernika Svan 945 Sound Analyzer przy odpowiednich nastawach potencjometru wzmacniacza. Metoda kalibracyjna polegała na pomiarze 10-sekundowego poziomu równoważnego dźwięku, ze stałą uśredniania fast w dB SPL.
Dla wszystkich sygnałów ustalono stałą wartość poziomu ciśnienia akustycznego, wynoszącą 80 dB SPL.

Mechanizm umożliwiający przesuw głośnika składał się z ramienia obrotowego, do którego prostopadle zamocowany był głośnik (z możliwością regulacji wysokości jego usytuowania). Odległość głośnika od uszu słuchacza była stała i wynosiła 150 cm.
Podczas badania słuchacz siedział z zamkniętymi oczami na fotelu z podpórką pod głowę (w celu uniemożliwienia wykonywania nieświadomych ruchów głową).
Pomiar przeprowadzono dla ustawień słuchacza zmieniających się zgodnie z ruchem wskazówek zegara. Dla azymutów 45^o, 90^o i 135^o słuchacz był zwrócony w stronę głośnika uchem lewym, natomiast dla azymutów 225^o, 270^o i 315^o – uchem prawym. Dla azymutu 0^o głośnik znajdował się na wprost twarzy słuchacza, a dla azymutu 180^o – z tyłu głowy. Głośnik przesuwany był metodą nadążającą, a każdorazowo punktem odniesienia był azymut 0^o.
2.3. Bodźce
Bodźcami akustycznymi w badaniach KOSK były następujące sygnały:
- sygnały tonalne,
- tercjowe pasma szumu,
- tercjowe pasma szumu zmodulowane amplitudowo:
– częstotliwość modulacji 4 Hz,
– głębokość modulacji 100%.

Częstotliwości sygnałów tonalnych oraz częstotliwości środkowe pasm szumu wynosiły 500, 1 000 i 4 000 Hz. Wybór takich częstotliwości był świadomy i oparty na zdolnościach lokalizacyjnych naszego systemu słuchowego. Dla podzakresu niskich częstotliwości efektywnymi czynnikami fizycznymi umożliwiającymi precyzyjną lokalizację źródła są dla tonów międzyuszne różnice fazy, dla sygnałów impulsowych – międzyuszne różnice czasu, a dla szumów – wzajemna korelacja pomiędzy sygnałami docierającymi do prawego i lewego ucha. Dla zakresu wysokich częstotliwości, czyli w naszym przypadku dla sygnału tonalnego o częstotliwości 4 000 Hz, powstaje znacząca międzyuszna różnica natężenia, a dla dźwięków złożonych dodatkowo różnica w widmie.

Częstotliwość 1 000 Hz jest granicą tych 2 podstawowych czynników, mających wpływ na możliwości słyszenia przestrzennego, a mianowicie międzyusznej różnicy czasu, która jeszcze w jakimś stopniu pomaga w lokalizacji dźwięku, oraz międzyusznej różnicy natężenia, która nabiera znaczenia dla tej częstotliwości. Również dla częstotliwości 1 000 Hz sygnału sinusoidalnego istnieje możliwość porównania wyników innych badań, m.in. Kruk-Zagajewskiej i Gerwela [55, 56], którzy weryfikowali zdolności lokalizacyjne metodą KOSK dla tej właśnie częstotliwości.

Wybór sygnałów szumowych, czyli szumu tercjowego i szumu tercjowego zmodulowanego amplitudowo, podyktowany był faktem, że dźwięki szumowe mają naturę zbliżoną do dźwięków naturalnych, które otaczają nas w życiu codziennym.

Zastosowano modulację amplitudy, ponieważ z badań psychoakustycznych wynika, że zmiana obwiedni amplitudy dla mowy ciągłej wynosi średnio 4 Hz. Wartość ta jest znacząca w procesie rozpoznawania mowy przez różnego typu układy, np. aparaty słuchowe. Być może pozwoli to w przyszłości uzyskać dodatkowe informacje porównawcze w badaniach KOSK dla osób zdrowych oraz osób z ubytkiem słuchu, badanych w aparatach słuchowych.

W warunkach eksperymentalnych słuchaczom prezentowano jednosekundowe sygnały przy czasach narastania i zaniku wynoszących 50 ms. Wybór tych czasów ustalono w oparciu o badania przeprowadzone przez Florkowskiego [11], który badał wpływ czasu narastania dźwięku na dokładność lokalizacyjną źródeł dźwięku.

Ustalono następującą sekwencję podawanych sygnałów:
- pierwszy sygnał (czas trwania 1 s),
- przerwa (czas trwania 2,5 s),
- drugi sygnał (czas trwania 1 s),
- przerwa (czas trwania 4,5 s).

Poziom ciśnienia akustycznego sygnału ustalono na 80 dB SPL, co przyjmuje się za wartość odpowiadającą mowie głośnej. Z badań Kołdeja [57] wynika, że zwiększając poziom sygnału, można zaobserwować zmniejszenie liczby błędnych odpowiedzi (szczególnie dla sygnałów pochodzących ze źródeł umiejscowionych w przedniej części sfery). Wybór takiego poziomu podyktowany był również możliwością wykonania w przyszłości badań KOSK u osób z patologią słuchu.
2.4. Metoda pomiarowa
Pomiar przeprowadzono dla 8 azymutów w płaszczyźnie horyzontalnej na wysokości głowy słuchacza w zakresie 0^o–360^o co 45^o, mierząc w każdym z tych ustawień wartość KOSK. Słuchacza sytuowano twarzą na wprost głośnika (głośnik znajdował się w punkcie odniesienia – azymut 0^o) i podawano serię sygnałów w sposób opisany powyżej. Prowadzący eksperyment przemieszczał głośnik sekwencjami (pierwszy sygnał podawany był zawsze w punkcie 0^o, kolejny w zmniejszających się wartościach kąta). Zadaniem słuchacza było słowne określenie tak, w momencie gdy zauważał, że 2 nadawane po sobie dźwięki słyszał z 2 punktów przestrzeni, a nie, kiedy nie odczuwał różnicy lokalizacyjnej (sygnały słyszał w tym samym miejscu). Tak więc KOSK jest wartością graniczną, kiedy słuchacz jeszcze percypował sygnał z 2 różnych miejsc przestrzeni. Badanie trwało do momentu 3-krotnego potwierdzenia wartości przez niego określonych. Wynik pomiaru określano z dokładnością 1o. Następnie zmieniano usytuowanie słuchacza (głośnik zawsze znajdował się w punkcie odniesienia) i powtarzano opisaną procedurę dla kolejnych azymutów.
2.5. Wyniki pomiarów
Pierwszy etap opracowywania uzyskanych wyników polegał na przeprowadzeniu analizy częstości występowania rozkładów wartości KOSK dla wszystkich słuchaczy. Stwierdzono, że rozkład częstości występowania wartości KOSK dla różnych azymutów jest niesymetryczny. Z tego względu w analizie wartości KOSK przyjęto miarę pozycyjną w postaci mediany Θ2, a nie miarę syntetyczną, jaką jest średnia arytmetyczna. Medianę dla n-elementowej próby określa się następująco: z elementów np. xi próby tworzymy szereg niemalejący. W przypadku gdy liczba n-elementów w szeregu jest nieparzysta, jako medianę przyjmujemy element środkowy, który można obliczyć wg wzoru:

Q₂= X_n+1/2,

podczas gdy dla parzystej liczby n-elementów szeregu korzystano ze wzoru:

Q₂= 1/2 (X_n/2+ X_n/2+1)

Wprowadzono również pojęcie kwartyla dolnego Q₁ (pierwszego) i górnego Q₃ (trzeciego). Kwartyl pierwszy i trzeci wyznacza się w ten sposób, że w dwóch częściach zbiorowości, które powstały po wyznaczeniu mediany (kwartyla drugiego), ponownie wyznacza się medianę; mediana w pierwszej części odpowiada kwartylowi pierwszemu, a w drugiej kwartylowi trzeciemu.

Na ryc. 9.–11. przedstawiono wartości KOSK dla poszczególnych częstotliwości.

Już pobieżna analiza tych wykresów pokazuje, że największe wartości współczynnika KOSK (najgorsze własności lokalizacyjne) uzyskuje się dla sygnałów sinusoidalnych, co w dużym stopniu podważa ich przydatność w określonych badaniach klinicznych.
Porównując obydwa wykresy, widać wyraźną różnicę w wartościach współczynnika KOSK dla sygnałów sinusoidalnych oraz sygnałów szumowych. Przede wszystkim, co stwierdzono już poprzednio, wartości dla sygnałów sinusoidalnych znacznie przekraczają te dla sygnałów szumowych, a ponadto występuje znacznie większy rozrzut w odpowiedziach pomiędzy poszczególnymi słuchaczami.
Na zakończenie przedstawiono tab. 1. i 2. zawierające ciekawe zestawienie wyników dla przypadków, kiedy występuje symetryczne ustawienie słuchacza w stosunku do źródła dźwięku, czyli odpowiednio dla azymutu 0^o i 180^o oraz 90^o i 270^o.
Analiza wyników przedstawionych w powyższych tabelach wskazuje, że zdecydowana większość słuchaczy lepiej percypuje zmianę kierunku dźwięku dochodzącego z przodu (0^o) niż z tyłu głowy (180^o), podczas gdy w przypadku azymutów bocznych (90^o – ucho lewe, 270^o – ucho prawe) obserwuje się znaczną dominację ucha prawego nad lewym.
III. Wnioski końcowe
1. Najlepsze zdolności lokalizacyjne stwierdzano, kiedy źródło dźwięku znajdowało się na wprost głowy badanego.
2. Stwierdzono znacznie słabszą zdolność lokalizacyjną dla azymutów 90^o i 270^o dla 2 rodzajów szumów i sygnałów sinusoidalnych, z wyjątkiem 4 000 Hz, gdzie największe wartości KOSK wypadają dla położenia źródła dźwięku za głową badanego.
3. Otrzymano znacznie mniejsze wartości współczynnika KOSK (lepsza zdolność lokalizacyjna) dla sygnałów szumowych, co najprawdopodobniej związane jest z przebywaniem w otaczającym nas środowisku dźwięków, które są sygnałami złożonymi; jesteśmy w stanie z większą precyzją rozpoznawać kierunek nadchodzącego dźwięku tego typu.
4. Mniejsze rozbieżności pomiędzy odpowiedziami poszczególnych słuchaczy otrzymano dla sygnałów szumowych, co może mieć istotne znaczenie przy wyborze tego typu sygnałów w badaniach klinicznych.
5. Wykazano łatwość i pewność odpowiedzi słuchaczy przy ocenie sygnałów szumowych.
6. Potwierdzono wyniki badań literaturowych (z wyjątkiem sygnału sinusoidalnego o częstotliwości 4 000 Hz).

W podsumowaniu należy stwierdzić, że konieczne jest kontynuowanie badań dotyczących wyboru określonego typu sygnału akustycznego do badań rozdzielczości przestrzennej układu słuchowego. Należy uwzględnić inne częstotliwości modulacji amplitudowej jak również wykorzystanie sygnałów, do których zastosowano modulację częstotliwościową czy wreszcie modulację mieszaną.

Piśmiennictwo
1. Szmeja Z. Lokalizacja dźwięku. W: Zarys audiologii klinicznej. Pruszewicz A (red.). WAM, Poznań, 1994.
2. Mills AW. On the Minimum Audible Angle. J Acoust Soc Am 1958; 30: 132-134.
3. Zakrzewski A. Clinical test for the acuity of directional hearing. Bulletin de la Societé des Amis des Science et des Lettres de Poznań, Serie C – Livraison X, 1960.
4. Plenge G. On the differences between localization and lateralization.
J Acoust Soc Am 1974; 56: 944-951.
5. Blauert J. Spatial Hearing. MIT Press, Cambridge, Mass, 1983.
6. Hartmann WM. How we localize sound. Physics Today, November 1999: 24-29.
7. Ozimek E. Percepcja binauralna (dwuuszna). W: Dźwięk i jego percepcja. PWN, Warszawa – Poznań, 2002: 288-316.
8. Moore BCJ. Przestrzenna percepcja dźwięków. W: Wprowadzenie do psychologii słyszenia. PWN, Warszawa – Poznań, 1999.
9. Feddersen WE, Sandel TT, Teas DC, Jefferess LA. Localization of high-freθuency tones. J Acoust Soc Am 1957; 29: 988-991.
10. Wightman F, Kistler D. The dominant Role of Low-Freθuency Interaural Time Differences in Sound Localization. J Acoust Soc Am 1992; 91: 1648-1661.
11. Florkowski J. Znaczenie przebiegów transjentowych dla lokalizacji źródeł dźwięku (praca doktorska). UAM, Poznań, 1980.
12. Coleman PD. An analysis of cues to auditory depth perception in free space. Psychological Bulletin 1963; 60: 302-315.
13. Wallach H. The role of head movements and vestibular and visual cues in sound localization. J Exp Psychol 1940; 27: 339-368.
14. Klensach H. Beitrag zur Frage der Lokalization des Schalles im Raum. Pflügers Arch 1948; 250: 492-500.
15. Jongkees LBW, Veer RA. On directional sound localization in unilateral deafness and its explanation. Acta Otolaryngol 1958; 49: 119-131.
16. König G, Süssmann W. Zum Richtungshören in der median-sagittal-ebene. Arch Ohren Nasen Kehlkopfheilkd 1955; 167: 303-307.
17. Butler RA. Monaural and Binaural localization of noise bursts vertically in the median sagittal plane. J Aud Res 1969; 3: 230-235.
18. Batteau DW. The role of the pinna in human localization. Proc Roy Soc B 1968; 168: 158-180.
19. Freedman SJ, Fisher HG. The role of the pinna in auditory localization. In: Neuropsychology of Spatilly Oriented Behaviour. SJ Freedman (ed.). Dorsey Press, Illinois, 1968.
20. Wiener FM. On the diffraction of a Progressive Sound Wave by the Human Head. J Acoust Soc Am 1946; 19: 143-146.
21. Toning FM. Directional audiometry. Acta Otolaryngol 1970; 69: 388-394.
22. Łaciak J. Zachowanie się lokalizacji słuchowej tonów o różnej częstotliwości w zależności od wieku. Otolaryngol Pol 1965; 19: 69-76.
23. Terhune JM. Sound localization abilities of untrained human using complex and sinusoidal sounds. Skand Audio 1974; 3: 115-120.
24. Christian W, Röser D. Ein beitrag zum richtungshören. Z Lareng 1957; 36: 431-445.
25. Harris GG. Binaural interaction of impulsiven stimuli and pure tones.
J Acoust Soc Am 1960; 32: 685-692.
26. Matzker J, Springborn E. Richtungshören und Lebensalter. Z Lareng 1958; 37: 739-745.
27. Rakerdb, Hartmann W. H. Precedence effect with and without interaural differences — Sound localizationin three planes. J Acoust Soc Am 1992; 92: 2296 (A).
28. Haas H. Über den Einfluss eines Einfachechos an die Hűrstamkeiftvon Sprache. Acustica 1951; 1: 49-58.
29. FreymannR. L. The precedence effect: Beyond echo suppression. W: Binaural and Spatial Hearing. Gilkey T, Anderson T. Erlbaum, Hilldate, New Jersay 1996.
30. Hartmann W. M. Listening in a room and the precedence effect. W: Binaural and Spatial Hearing. Gilkey T, Anderson T. Eerlbaum, Hilldate, New Jersay 1996.
31. Bronhorst AW. The Cocktail Party Phenomenon: A Review of Research on Speech Intelligibility in Multiple-Talker Conditions. ACUSTICA – Acta Acoustica 2000; 86: 117-128.
32. Yost WA. Lateralization pozition of sinusoid presented with interaural intensive and temporal differences. J Acoust Soc Am 1981; 70: 397-409.
33. Schiano JL, Trahiostis C, Bernstein LR. Lateralization of low-freθuency tones and narrow bands of noise. J Acoust Soc Am 1986; 79: 1563-1570.
34. Yost WA, Hafter ER. Lateralization. In: Directional Hearing. Yost WA, Gourevitch G (eds). Springer-Verlag, New York, 1987.
35. Nuetzel JM, Hafter ER. Lateralization of complex waveforms: Spectral effects. J Acoust Soc Am 1981; 69: 1112-1118.
36. Yost WA, Wightman FL, Green DM. Lateralization of filtered clicks.
J Acoust Soc Am 1971; 50: 1526-1531.
37. Henning GB. Lateralization and the binaural masking-level difference. J Acoust Soc Am 1974; 55: 1259-1265.
38. Henning GB. Some observations on the lateralization of complex waveforms. J Acoust Soc Am 1980; 68: 446-454.
39. Norlund B. Physical factors in angular localization. Acta Otolaryngol 1962; 54: 75-93.
40. Butler RA, Naunton RF. Some effects of unilateral auditory masking upon the localization inspace. J Acust Soc Am 1962; 34: 1100-1107.
41. Sanchez-Longo LP, Forster FM, Auth TL. Clinical test for sound localization and its applications. Neurology 1957; 7: 655-663.
42. Zakrzewski A. Badania doświadczalne nad asymetrią czynnościową narządu słuchu. Pol Przegl Otolaryng 1933; 12: 211-238.
43. Zakrzewski A. Z badań nad dwuuszną lokalizacją dźwiękową. Pol Przegl Otolaryng 1937; 13: 306-320.
44. Wilska A. Untersuchungen über das rihtungshören Acta Societ Med Feunical Douodecim 1938; 21: 1-86.
45. Kin MJ, Teteruk M. Lokalizacja źródeł dźwięku w różnych warunkach maskowania. Otwarte Seminarium z Akustyki 2001: 83-86.
46. Zakrzewski A. Lokalizacja dźwiękowa w różnych stanach narządu przedsionkowego. Otolaryng Pol 1962; 16: 11-15.
47. Szmeja Z, Gerwel T. Uwagi do zagadnienia lokalizacji słuchowej w starszym wieku badanej w wolnym polu słuchowym. Otolaryng Pol 1964; 28: 223-229.
48. Szmeja Z. Wyrównanie głośności a lokalizacja dźwięku. Otolaryng Pol 1966; 20: 147-149.
49. Pruszewicz A, Gerwel T. Badania nad lokalizacją słuchową u niewidomych. Otolaryng Pol 1964; 28: 231-234.
50. Pruszewicz A, Kosowicz J. Zmiany w adaptacji słuchowej i lokalizacji dźwięku u chorych z niedoczynnością nadnerczy. Otolaryng Pol 1972; 5: 529-535.
51. Szmeja Z, Pruszewicz A. Wartość kliniczna badania lokalizacji dźwięku. Otolaryng Pol 1977; 3: 229-238.
52. Kruk-Zagajewska A. Pomiary kątów ostrości słyszenia kierunkowego u prawidłowo słyszących kobiet i mężczyzn. Otolaryng Pol 1980;
4: 401-407.
53. Van Hoesel RJM, Tong YC, Hollow RD, Clarc DM. Psychophysical and speech perception studies; a case report on a binaural cochlear implant subject. J Acoust Soc Am 1993; 94: 3178-3189.
54. Niewiarowicz M, Czajka J. Przyczynek do badań nad lokalizacją źródeł dźwięku. XIV Sympozjum Audiologiczne. Spała, 2003.
55. Kruk-Zagajewska A. Pomiar analiza ocena i normy kątów ostrości słyszenia kierunkowego (praca habilitacyjna). AM, Poznań, 1978.
56. Gerwel T. Badania nad słyszeniem kierunkowym w zaburzeniach słuchowych typu przewodnictwa i odbioru. AM, Poznań, 1964.
57. Kołdej E. Badanie w wolnym polu akustycznym zdolności słyszenia kierunkowego jako funkcji częstotliwości i natężenia sygnałów tonalnych. Otolaryng Pol 1980; 1: 43-49.
Adres do korespondencji
dr inż. Marek Niewiarowicz
Katedra i Klinika Otolaryngologii
Akademia Medyczna
ul. Przybyszewskiego 49
60-355 Poznań

This is an Open Access journal, all articles are distributed under the terms of the Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0). License (http://creativecommons.org/licenses/by-nc-sa/4.0/), allowing third parties to copy and redistribute the material in any medium or format and to remix, transform, and build upon the material, provided the original work is properly cited and states its license.

Lokalizacja źródeł dźwięku. Podstawy teoretyczne oraz wyniki badań eksperymentalnych

Joanna Czajka , Marek Niewiarowicz

Joanna Czajka

,

Marek Niewiarowicz