1 Tilsynsrapport Sprogcenter Nordsjælland 2012 Hillerød Kommune

Bachelorafhandling til civilingeniøruddannelsen Fysik & Teknologi
Akustisk beamforming med mikrofon-array
16. juni, 2014
Syddansk Universitet, Teknisk Fakultet
Mærsk Mc-Kinney Møller Instituttet (MMMI)
Lasse Christner M˚
ansson
Fysik & Teknologi
&
Simon Holst Traberg-Larsen
Fysik & Teknologi
Vejleder:
Peter Møller Juhl
M.Sc. EE, Ph.D.
Abstract
Acoustic beamforming is a principle that utilizes arrays, consisting of either microphones or loudspeakers, to achieve a desired directivity pattern. Typical applications are
sound source localization and loudspeaker racks. One particular type of beamforming is
delay-and-sum beamforming, which takes advantage of the time delays between adjacant
transducers. By properly delaying each transducer signal, in reference to one reference
transducer in the array, signals to or from a specific direction is amplified while leaving
signals to or from other directions attenuated. A system’s beamforming response is refered
to as its beampattern.
This paper deals with localization of sound sources and how to apply it in a conference
system. Studies include different array geometries, localization accuracy as a function of
various parameters, noise reduction, sensitivity, as well as robustness to correlated and
uncorrelated noise. Comparisons are made between analytically derived, simulated and
measured beampatterns. Simulations are carried out using MATLAB.
Generally, a beamformer’s localization accuracy is mostly dependent of the individual
transducer separation (and thus the total size of the array). Furthermore, when increasing
the number of microphones the amount and the level of sidelobes decrease. The intrinsic
microphone phase errors are studied, and are found to interfere mostly at high frequencies.
Correlated noise, like reflections, tend to disturb the beamformer’s AOAE (Angle Of
Arrival Estimation), while uncorrelated noise have little to no impact. Using a fixed lookout direction, it is shown how the beamformer successfully amplifies sound coming from
this direction while it attenuates sound arriving from elsewhere.
1
Indhold
Indhold
1 Forord
4
2 Indledning
5
3 Beamforming
3.1 Delay-and-sum beamforming . . . . . .
3.2 Beamforming i hhv. fjernfelt og nærfelt .
3.3 Beamforming for plane bølger . . . . . .
3.4 Beamforming for sfæriske bølger . . . .
6
6
7
7
8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Mikrofon-array
4.1 Mikrofontyper . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Fasefejl og amplitudefejl . . . . . . . . . . . . . .
4.1.2 Følsomhedskarakteristik for ideelle og ikke-ideelle
4.2 Teori vedr. mikrofon-array . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . .
. . . . . . .
mikrofoner
. . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9
. 9
. 9
. 9
. 10
5 Menneskelig tale
11
6 Analytisk beamforming med simpelt, lineært array
12
6.1 Akustisk udstr˚
aling fra monopoler og dipoler . . . . . . . . . . . . . . . . . . . 12
6.2 Retningskarakteristik for linje-array . . . . . . . . . . . . . . . . . . . . . . . . 15
7 Simulering af delay-and-sum beamforming i MATLAB
7.1 Algoritmens funktionalitet . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Konfigurering af array-geometri . . . . . . . . . . . . . . . . . . . . . . . . .
7.3 Simulering af individuelt tidsforsinkede signaler . . . . . . . . . . . . . . . .
7.4 Beregning af og multiplikation med komplekse faser . . . . . . . . . . . . . .
7.5 Simulering af hhv. beampattern og følsomhedskarakteristik . . . . . . . . .
7.6 Avanceret funktionalitet . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.6.1 Simulering af mikrofoners fase- og amplitudefejl . . . . . . . . . . . .
7.6.2 Rumakustiske fænomener, inkl. refleksioner og støj . . . . . . . . . .
7.6.3 Akustisk dæmpning i luft mellem lydkilde og array . . . . . . . . . .
7.7 Simuleringsresultater . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.7.1 Array-geometriens indflydelse p˚
a array’ets beampattern . . . . . . .
7.7.2 Lokaliseringsnøjagtighed som funktion af indbyrdes mikrofonafstand
7.7.3 Lokaliseringsnøjagtighed som funktion af antal mikrofoner . . . . . .
7.7.4 Sidelobe-niveauer som funktion af antal mikrofoner . . . . . . . . . .
7.7.5 Kildepositionens indflydelse p˚
a array’ets beampattern . . . . . . . .
7.7.6 Effekten af mikrofonernes immanente fasefejl . . . . . . . . . . . . .
7.7.7 Effekten af 1. ordens refleksioner pga. rummets beskaffenhed . . . .
7.7.8 Effekten af tilstedeværelse af ikke-korreleret støj . . . . . . . . . . .
7.7.9 Simulering af array’ets følsomhed med og uden støj . . . . . . . . . .
7.8 Delkonklusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8 Laboratoriepraksis
8.1 M˚
alekonstruktion . . . . . . . . . . . . .
8.2 Apparater og udstyr . . . . . . . . . . .
8.3 Synkronisering af afspilning og optagelse
8.4 Fremgangsm˚
ade . . . . . . . . . . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
17
21
21
24
24
24
26
27
28
29
40
42
46
47
48
49
52
53
57
.
.
.
.
60
60
61
61
61
Indhold
9 Undersøgelse af array’ets beampattern og følsomhed
9.1 Undersøgelse af rektangulære geometrier . . . . . . . . . .
9.2 Undersøgelse af cirkulære geometrier . . . . . . . . . . . .
9.2.1 Effekten af mikrofonantal og array-radius . . . . .
9.3 Effekten af kildens afstand og retning i forhold til array’et
9.4 Robusthed over for refleksioner . . . . . . . . . . . . . . .
9.5 Undersøgelse af lavfrekvent respons . . . . . . . . . . . . .
9.6 Undersøgelse af array’ets beampattern i mødelokale . . . .
9.7 Undersøgelse af array’ets følsomhed . . . . . . . . . . . . .
9.8 Delkonklusion . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
63
66
70
71
74
77
78
82
84
10 Vurdering af resultater og forslag til fremtidigt arbejde
86
11 Konklusion
87
12 Ordforklaring
88
13 Symboler
91
14 Figurer
94
15 Tabeller
99
16 Kode
100
17 Litteraturliste
101
3
Forord
1
Forord
Denne bachelorafhandling er forfattet af Lasse Christner M˚
ansson og Simon Holst TrabergLarsen, bachelorstuderende i Fysik og Teknologi p˚
a Teknisk Fakultet, Syddansk Universitet i
Odense. Afhandlingen er skrevet i perioden 16. februar 2014 - 16. juni 2014, og afsluttet ved
mundtligt forsvar d. 20 juni 2014.
Afhandlingen er opbygget p˚
a kronologisk vis“, dvs. at kapitlerne fremkommer i den ræk”
kefølge, som de i praksis er blevet afviklet i og som ifølge os giver den bedste forst˚
aelse. Der
indledes med teoretiske grundbegreber, relevant matematik og fysik og definitioner, der anlægger et fundament til forst˚
aelsen af resten af afhandlingen. Umiddelbart efter følger vores
simuleringsresultater, og efter disse følger dokumentationen fra de praktiske undersøgelser.
Afhandlingen afsluttes med en diskussion af det udførte arbejde, muligheder for fremtidigt
arbejde og en konklusion.
Kildehenvisninger vil st˚
a skrevet som et indeks i firkantparanteser, f.eks. ... ifølge kil”
de[2], er der ingen tegn p˚
a...“. Indekset korresponderer til en litteratur i litteraturlisten, som
følger formen 1) Forfatter eller udgiver 2) Titel 3) Forlag, ˚
ar for udgivelse 4) evt. ISBN. En
kildehenvisning kan ogs˚
a indeholde specifikke sidetal eller lignende, f.eks. ...kilde[8, s. 4]...“
”
betyder kilde nr. 8, side 4.
Figurer, ligninger, tabeller og kodeeksempler er nummeret efter overordnede kapitler igennem afhandlingen, f.eks. henviser Ligning 7.2“ til ligning nummer 2 i kapitel 7. Det tilsvarende
”
gør sig gældende for figurer, tabeller og kodeeksempler.
Til sidst i afhandlingen forefindes en ord- og symbolforklaring, hvor alle specielle fagtermer, forkortelser, engelske udtryk, matematiske og fysiske symboler er forklaret. Ord bliver
forklaret og evt. markeret med kursiv font den første gang de optræder, og fremadrettet vil
de st˚
a skrevet som almindelig tekst. Symboler forklares efter behov.
Alle forsøg er foretaget p˚
a Teknisk Fakultet, Syddansk Universitet i det lyddøde rum og i
tilknyttede undervisningslokaler. Vi er taknemmelige for at have haft adgang til b˚
ade laboratorier og udstyr ifm. vores praktiske undersøgelser.
En stor tak skal g˚
a til vores vejleder, M.Sc. EE og PhD Peter Møller Juhl, der med positiv
indstilling har besvaret vores faglige spørgsm˚
al og motiveret os til yderligere arbejde igennem
hele projektperioden.
Odense, Danmark, 10. juni 2014
Lasse Christner M˚
ansson
Simon Holst Traberg-Larsen
4
Indledning
2
Indledning
Array acoustics er et felt inden for akustik, der opererer med akustisk udstr˚
aling eller m˚
aling
med flere simultane transducere (højtalere eller mikrofoner). Et array skal ikke nødvendigvis
oversættes direkte til række“, men snarere forst˚
as som en konfiguration af transducere, der
”
kan arrangeres i mange forskellige geometrier - inklusiv række-arrays naturligvis.
Den store styrke i akustiske arrays ligger i deres evne til at producere en retningskarakteristik, der kan justeres til en specifik applikation. Eksempler er højtaler-racks ifm. koncerter
og sceneoptrædener og mikrofon-arrays ifm. lydlokalisering af f.eks. mekaniske vibrationer i
dieselmotorer og rumlig filtrering. Denne rapport beskæftiger sig primært med sidstnævnte
applikation, nanvlig mikrofon-arrays til lokalisering og filtrering ifm. konferencesystemer.
Et traditionelt princip inden for spatial lokalisering og filtrering er beamforming, der - som
navnet hentyder - p˚
a mange m˚
ader udfører en str˚
aledannelse af lydfeltet p˚
a samme m˚
ade som
en lommelygte beamer lys. Signalteknisk eksisterer der en række metoder til at udføre beamforming, der afviger fra hinanden i b˚
andbredde, adaptive evner, retningsbestemthed, sidelobeniveauer (fejlestimater af lydkilde) m.m. delay-and-sum er en traditionel beamforming-teknik,
der drager nytte af fysiske fasedrejninger mellem signaler fra forskellige transducere i array’et.
Delay-and-sum er det primære beskæftigelsesomr˚
ade i denne rapport.
Teknologien skal forestilles anvendt i et konferencesystem, hvor et mikrofon-array skal
være i stand til at undertrykke lyd fra alle andre retninger end ´en bestemt vha. den omtalte
beamforming. Systemet skal s˚
aledes kunne b˚
ade lokalisere den p˚
agældende lydkilde (taler)
og herefter l˚
ase fast p˚
a denne retning, s˚
aledes at lyd fra andre retninger (betragtet som
støj) filtreres. I praksis kan man nemt forestille sig, at en beamforming-algoritme arbejder tæt
sammen med anden (digital) signalbehandling, f.eks. FIR filtre, for at forbedre taleforst˚
aelsen,
leveret af systemet. Dette projekt opererer imidlertid udelukkende med resultater produceret
af beamforming-teknikker. Eventuelle signaltekniske moduler kan s˚
aledes suppleres, hvis det
findes nødvendigt.
Nærværende rapport dokumenterer den bagvedliggende teori, undersøger delay-and-sum
beamforming-teknikken vha. MATLAB-simuleringer, afprøver teknikken i praksis i b˚
ade lyddødt
og ikke-lyddødt rum og forsøger at kvantificere og forklare mange af de observerede fænomener i brugen af akustiske arrays. Der vil primært blive lagt fokus p˚
a lokalisering af lydkilder
og tilhørende beampatterns, mens følsomhedskarakteristikker blot nævnes kort.
Relevante kvalitetsbedømmelser for systemet omfatter f.eks. lokaliseringsnøjagtighed (ofte
benævnt mainlobe-bredde), sidelobe-niveau, robusthed overfor støj (korreleret s˚
avel som ikkekorreleret), støjreduktion (SNR før og efter beamforming) og effektivitet (ydeevne1 ift. antal
transducere).
Det er ogs˚
a ønskværdigt at bestemme indflydelsen af de benyttede transducers iboende
(engelsk: intrinsic) fasefejl, eftersom disse kan for˚
arsage fejllokaliseringer og store sidelobes.
Analogt med fasefejl er det ogs˚
a væsentligt at vurdere systemets robusthed overfor menneskelige eller mekaniske positioneringsfejl af array-transducerne. F.eks., hvilken fasefejl giver
en forskydning p˚
a et par centimeter anledning til?
Som kontrollant for b˚
ade simuleringer og efterfølgende m˚
alinger udføres en analytisk udledning af en beamforming-procedure for et uniformt, lineært array (ULA).
1
Ydeevne: lokaliseringnøjagtighed, sidelobe-niveau og støjreduktion
5
Beamforming
3
Beamforming
Navnet beamforming er givet til mange forskellige array-behandlingsalgoritmer (array processing algorithms), der fokuserer array’ets følsomhed og evne til at opfange eller udstr˚
ale et
signal fra eller i en bestemt retning.
Navnet er baseret p˚
a analogien fra en lommelygte, og derfor kaldes hoveddelen af array’ets
retningsmønster for en str˚
ale, der kommer af det engelske ord beam.
3.1
Delay-and-sum beamforming
En lydkilde p˚
a positionen ~r0 , der udsender et tidsvarierende signal, p(t), ønskes lokaliseret.
Dette signal m˚
ales vha. et array, der best˚
ar af M mikrofoner lokaliseret ved positionsvektorer
~rm , m = 0, 1, ..., M − 1. Mikrofonlokationerne i array’et defineres ud fra afstanden til en referencemikrofon, som kan vælges vilk˚
arligt; f.eks. i et hjørne af array’et eller i array’ets centrum.
~rm er vektorer fra de enkelte mikrofoner til referencemikrofonen, og pm (t) er lydsignalet fra
kilden m˚
alt af den m’ te mikrofon.
Delay-and-sum beamforming best˚
ar i at p˚
aføre en tidsforsinkelse (delay) ∆m og evt. en
amplitudevægtning wm til hvert mikrofonsignal, hvorefter de resulterende signaler summeres.
Amplitudevægtningen kan bruges som kompensation for store akustiske energitab, hvis transducere er separeret med store afstande. Udgangssignalet, z(t), fra delay-and-sum beamforming
defineres i tidsdomænet som[6]
z(t) =
M
−1
X
wm pm (t − ∆m ).
(3.1)
m=0
P˚
a figur 3.1 er delay-and-sum teknikken vist signalteknisk.
Figur 3.1: Signalteknisk diagram for delay-and-sum beamforming. Illustration venligst l˚
ant af Dr. Andrew
Greensted[17].
Forsinkelsen til mikrofonsignalerne kan ogs˚
a p˚
aføres i frekvensdomænet. Her p˚
aføres en
faseforskydning i stedet for en tidsforsinkelse, og det gøres ved at gange signalet med en
kompleks fase e−jω∆m [10]
z(ω) =
M
−1
X
wm pm (ω)e
−jω∆m
m=0
=
M
−1
X
~
wm pm (ω)ej k·~rm ,
(3.2)
m=0
hvor ~k = −κ~u er bølgevektoren for en plan bølge, der udbredes fra retningen ~u, κ er en
konstant, ω er vinkelfrekvens, og pm (ω) er den Fouriertransformerede af pm (t).
6
Beamforming
3.2
Beamforming i hhv. fjernfelt og nærfelt
Kilden, der ønskes lokaliseret, kan opfattes af systemet p˚
a forskellige m˚
ader alt efter, hvor
langt fra systemet den befinder sig. Hvis dens afstand til systemet er sammenlignelig med
systemets dimensioner, befinder den sig i nærfeltet, og dens signal kan betragtes som sfæriske
bølger. N˚
ar der er tale om sfæriske bølger, kan man i teorien bestemme b˚
ade retningen og
afstanden til kilden, da retningsvektorerne, der rammer de enkelte mikrofoner, oprinder fra
en fælles kilde[6].
Hvis kilden befinder sig langt fra systemet i forhold til systemets dimensioner, kan den
antages at befinde sig i fjernfeltet, og dens signal m˚
a derfor betragtes som plane bølger. I
s˚
adanne tilfælde kan det bestemmes hvilken retning kilden befinder sig i, mens afstanden til
en kilde med ukendt styrke ikke kan bestemmes. Dette skyldes, at signalet antages at være
plane bølger, som ikke har retningsvektorer fra et fælles udbredelsespunkt.
3.3
Beamforming for plane bølger
Faseforskydninger, der p˚
aføres de enkelte mikrofonsignaler i delay-and-sum beamforming, giver array’et mulighed for at søge“ efter signalet i en bestemt retning. Ved at justere fasefor”
skydningerne kan retningen, som array’et søger i, blive styret hen imod kilden. Der defineres
en formodet udbredelsesretning vha. enhedsvektoren ~u.
I ligning (3.2) bestemmes udgangssignalet fra delay-and-sum beamforming i frekvensdomænet ved at gange lydtrykket fra mikrofonsignalerne med en kompleks fase e−jω∆m . Hvis
det vælges, at
~rm · ~u
∆m =
,
(3.3)
c
hvor c er lydens hastighed, kompenserer faseforskydningen i signalbehandlingen for udbredelsesforsinkelsen, som mikrofonerne i array’et udsættes for. Det betyder, at alle signaler fra
retningen ~u er i fase, og de vil derfor forstærke hinanden, n˚
ar de summeres. Signaler fra andre
retninger vil ikke være i fase, og derfor vil de have tendens til at annullere hinanden. Dermed er array’et blevet følsomt i en bestemt retning og har f˚
aet en retningskarakteristik, der
inderholder et s˚
akaldt mainlobe. Et s˚
adant mainlobe fremg˚
ar af figur 3.2, hvor det ses, at det
p˚
agældende array er følsomt i retningen 90◦ . P˚
a figuren ses ogs˚
a et sidelobe, der er den lille
str˚
ale i retningen 270◦ , og som repræsenterer en fejlestimering af lydkilden.
Figur 3.2: Mainlobe i retningen 90◦ og sidelobe i retningen 270◦ .
De tilfælde, hvor faseforskydningerne bringer mikrofonsignalerne i fase, kaldes stacking, og
udgangssignalet, z(t), fra delay-and-sum beamforming kan skrives som
"M −1
#
X
z(t) = p(t)
wm ,
(3.4)
m=0
Udgangssignalet er alts˚
a lig med signalet, der udbredes fra kilden, ganget med en konstant i
form af amplitudevægtningen for hver mikrofon.
7
Beamforming
Hvis den formodede udbredelsesretning, ~u, er forkert og ikke er den retning, kilden befinder
sig i, bliver udgangssignalet en forringet version af signalet, og det kaldes mismatch. En
plan bølge med bølgevektoren ~k0 , som er forskellig fra den faktiske ~k = −κ~u, resulterer i
mikrofonsignalerne, pm (ω)
~
pm (ω) = ps e−j k0 ·~rm ,
(3.5)
hvor ps er amplituden af lydtrykket. Ved at sammenligne dette udtryk med ligning (3.2) ses
det, at udgangssignalet, z(ω), bliver
z(ω) = ps
M
−1
X
~ ~
wm ej(k−k0 )·~rm = ps W (~k − ~k0 ),
(3.6)
m=0
hvor funktionen W er det s˚
akaldte array-mønster[10], der beskriver array’ets følsomhed. W
er givet ved
M
−1
X
~
~ =
W (K)
wm ej K·~rm ,
(3.7)
m=0
~ = ~k − ~k0 .
hvor K
3.4
Beamforming for sfæriske bølger
Hvis array’et befinder sig i kildens nærfelt, antages det, at kilden udsender et signal, p(t), der
udbredes sfærisk. Ses der p˚
a frekvensdomænet m˚
aler den m0 te mikrofon signalet
~
pm (ω) = pss
e−j k0 ·~rm
,
Rm
(3.8)
hvor pss er amplituden af lydtrykket, ~k0 er bølgevektoren for det m˚
alte signal, og Rm er
afstanden mellem kilden og mikrofonen. Ved igen at vælge en tidsforsinkelse til
∆m =
~rm · ~u
c
(3.9)
kan alle M mikrofonsignaler, der kommer fra kildens retning, stackes og forstærke hinanden.
I dette tilfælde gælder det, at ~k0 = ~k, og udgangssignalet, z(ω), fra beamformingen for en
sfærisk udbredende bølge bliver dermed
z(ω) =
M
−1
X
wm pm (ω)e−jω∆m =
M
−1
X
~
wm pm (ω)ej k·~rm ,
(3.10)
m=0
m=0
hvor k = −κ~u. I tilfælde af mismatch, hvor ~k0 6= ~k, vil delay-and-sum beamformingens
udgangssignal blive
"M −1
#
~ ~
X
ej(k−k0 )·~rm
z(ω) = pss
wm
= pss W (~k − ~k0 ).
(3.11)
Rm
m=0
Her er funktionen W igen array-mønstret givet ved
~ =
W (K)
M
−1
X
m=0
~ = ~k − ~k0 .
hvor K
8
~
wm ej K·~rm ,
(3.12)
Mikrofon-array
4
Mikrofon-array
4.1
Mikrofontyper
Generelt findes der tre typer akustiske lydfelter, nemlig free field, pressure field og diffuse
field. Mikrofoner er designet til at have et fladt frekvensrespons i et af disse lydfelter, hvilket
kaldes det optimerede respons[2], og anvendes en mikrofon i et andet lydfelt, end d´er hvor den
er beregnet til at m˚
ale, vil dens frekvensrespons ikke være fladt.
Forskellene p˚
a de enkelte mikrofoners respons forekommer typisk ved høje frekvenser. Hvor
høje frekvenser, der er tale om, afhænger af størrelsen p˚
a mikrofonen, da lydfeltet først f˚
ar
betydning, n˚
ar lydens bølgelængde bliver sammenlignelig med mikrofonens membranstørrelse.
I dette projekt begrænses frekvensomr˚
adet til det, der er væsentligt for menneskelig tale, og
det bliver derfor ikke aktuelt at vurdere hvilket lydfelt, der er tale om. Det har dermed ingen
betydning, om der vælges free field- eller pressure field-mikrofoner.
Der findes en type af mikrofoner, der hedder array-mikrofoner. Disse array-mikrofoner er
designet, s˚
a de minder mest muligt om hinanden og er derfor er velegnede til systemer, der
kræver et større antal mikrofoner.
4.1.1
Fasefejl og amplitudefejl
Mikrofoner, der anvendes til reelle m˚
alinger, er ikke ideelle, og brug af forskellige mikrofoner kan dermed give forskellige resultater pga. de enkelte mikrofoners fase- og amplitudefejl.
Fasefejl kan vise sig at have stor betydning, n˚
ar der laves beamforming med delay-and-sum
metoden, hvor de enkelte mikrofoner i et mikrofon-array p˚
aføres en faseforskydning. Hvis mikrofonerne har forskellige indre fasefejl, kan det give anledning til lokaliseringsfejl. De p˚
aførte
faseforskydninger skal lægges sammen med mikrofonernes fasefejl, og den p˚
aførte faseforskydning bliver dermed en anden end den ønskede.
Amplitudefejl kan p˚
avirke den destruktive interferens, der er nødvendig for undertrykkelsen (filtreringen) af uønsket lyd, men er ikke af lige s˚
a stor betydning som fasefejlene, n˚
ar
der tales om delay-and-sum beamforming. Metoden har fokus p˚
a mikrofonernes faseforskelle,
og amplituderne anvendes derfor ikke til at lokalisere retningen, lydkilden kommer fra. Hvis
form˚
alet med m˚
alingerne ogs˚
a er at bestemme afstanden til lydkilden, kan amplitudefejlene
dog vise sig at f˚
a betydning.
I array-mikrofoner er den relative fase- og amplitudefejl minimeret, s˚
a mikrofonerne minder
mest muligt om hinanden. Dette er væsentligt, n˚
ar der laves beamforming, da sm˚
a faseændringer kan have stor betydning - især ved høje frekvenser.
4.1.2
Følsomhedskarakteristik for ideelle og ikke-ideelle mikrofoner
N˚
ar følsomheden af mikrofon-array’et simuleres, antages det, at mikrofonerne er lige følsomme
ved alle indfaldsvinkler og alle frekvenser. Figur 4.1 viser indfaldsvinklen p˚
a en mikrofon. Hvis
mikrofon-array’et placeres p˚
a en bordplade (f.eks. ifm. et konferencesystem), skal der kun tages
hensyn til indfaldsvinkler fra -90◦ til 90◦ .
Figur 4.1: Indfaldsvinkel p˚
a en mikrofons membran. Figur venligst l˚
ant fra [2].
9
Mikrofon-array
I praksis er mikrofonerne dog ikke lige følsomme ved alle indfaldsvinkler og frekvenser.
Ved lave frekvenser er mikrofonerne næsten omnidirektionelle, og der vil derfor næsten ikke
være nogen forskel p˚
a indfaldende lyd ved 0◦ og 90◦ . Ved høje frekvenser er mikrofonerne mest
følsomme ved en indfaldsvinkel p˚
a 0◦ , og følsomheden bliver mindre n˚
ar indfaldsvinklen øges,
da højere frekvenser er mere retningsbestemte[16]. Figur 4.2 viser følsomhedskarakteristikker
for en pressure field-mikrofon[2] ved forskellige indfaldsvinkler og frekvenser fra 5 til 25 kHz.
(a) Følsomhedskarakteristik for frekvenser
fra 5 kHz til 12,5 kHz.
(b) Følsomhedskarakteristik for frekvenser
fra 16 kHz til 25 kHz.
Figur 4.2: Følsomhedskarakteristik for en pressure field-mikrofon som funktion af indfaldsvinkel.[2]
4.2
Teori vedr. mikrofon-array
Udover den bagvedliggende signalbehandling, som er ansvarlig for styringen af mikrofonarray’ets følsomhed, har selve udformingen af array’et en betydning for array’ets b˚
andbredde2 .
De to vigtigste parametre er array’ets fysiske størrelse og de indbyrdes mikrofonafstande, begge m˚
alt i bølgelængder. Jo større array’et fysisk er, jo større tidsforskelle opst˚
ar der mellem
forskellige mikrofoner, hvilket er til fordel for det lavfrekvente beampattern. De indbyrdes
mikrofonafstande har dog betydning for de højere frekvenser og skal konfigureres til en specifik applikation. Et fejldimensioneret array kan f.eks. udvise et fænomen, man inden for
en signalteknisk begrebsverden kan kalde for rumlig aliasing (spatial aliasing), som opst˚
ar
n˚
ar mikrofonafstandene bliver mindre end en halv bølgelængde[9]. Mikrofonafstandene kan
s˚
aledes sammenlignes med en rumlig sampling, ligesom MATLAB-algoritmen sampler mikrofonsignalerne i tid. I teorien kan man opn˚
a et frekvensinvariant beampattern for et kontinuert
frekvensspektrum, hvis man anvender et array med en kontinuert fordeling af mikrofoner. I
praksis m˚
a man nøjes med et endeligt antal diskrete mikrofoner. Opgaven ligger hermed i
finjusteringen af mikrofonplaceringer, s˚
a der f˚
as et ønsket beampattern.
Beamforming ved hjælp af mikrofon-array kan i princippet forbedre et signals SNR, fordi systemet fungerer som et filter. Udgangspunktet i dette projekt er et konferencesystem.
Der findes en række elektronik- og akustikvirksomheder b˚
ade i Danmark og udenlands, der
beskæftiger sig med akustisk beamforming. Som eksempler kan nævnes:
ˆ Br¨
uel & Kjær[12]: bruger bl.a. spiralformede array’s til pass-by støjlokalisering.
ˆ ClearOne[13]: bruger et tre-rækkers lineært array til samtalebrug ved møder.
ˆ Acoustic Camera[11]: bruger forskelligartede cirkulære array’s til støjlokalisering i f.eks.
forbrændingsmotorer.
2
B˚
andbredde: angiver størrelsen af det frekvensspektrum, hvor array’et er i stand til at lokalisere lydkilden
10
Menneskelig tale
5
Menneskelig tale
Den menneskelige tale produceres af stemmeorganerne, der omfatter lungerne, luftrøret, strubehovedet (inklusiv stemmeb˚
and), halsen, svælget, nasale hulrum (næse) og munden.[15].
Stemmeb˚
andets størrelse og ˚
abning kan regulere luftstrømmen, der kommer fra lungerne. Det
er n˚
ar stemmeb˚
andet ˚
abner og lukker ved frekvenser i omr˚
adet 50 - 500 Hz, at der produceres
akustisk energi. Resten af stemmeorganerne (fra hals og op) kan beskrives med en akustisk
overføringsfunktion, der indeholder s˚
akaldte formanter“, hvis rolle er at fremhæve specifikke
”
overtoner, herunder f.eks. konsonanter. En overvejende del af den akustiske energi bruges til
lavfrekvent vokaldannelse og en lille resterende energi bruges til højfrekvent konsonantudtale;
dette p˚
a trods af, at den primære taleforst˚
aelse udgøres af konsonanterne. Det er almindelig
anerkendt, at konsonanter (taleforst˚
aelse) groft set befinder sig i frekvensomr˚
adet 1 kHz - 4
kHz, se f.eks. figur 5.1, der viser frekvensindholdet af sætningen I can see you“.
”
Analog telefoni før i tiden b˚
andpasfiltrerede mennesketale mellem 500 Hz og 3,4 kHz, og
mere nutidig internettelefoni (VoIP) opererer med et større spektrum fra 300 Hz til 8 kHz.
Den menneskelige tale kan ogs˚
a i høj grad moduleres af et rums akustiske egenskaber,
f.eks. efterklang. Der vil i de kommende simuleringer og m˚
alinger tages udgangspunkt i frekvensomr˚
adet 1 kHz - 4 kHz, som en grov repræsentation af mennesketale.
Figur 5.1: Frekvensindhold i sætningen I can see you“. Billede er venligst l˚
ant af Brian Moore - An Intro”
”
duction to the Psychology of Hearing[15]
11
Analytisk beamforming med simpelt, lineært array
6
Analytisk beamforming med simpelt, lineært array
Igennem rapporten bliver det dokumenteret, hvorledes forskellige array-geometrier (f.eks.
rektangulære og cirkulære) udfører akustisk beamforming. De fysiske m˚
alinger understøttes
af relevante MATLAB-simuleringer, og for at bekræfte validiteten af simuleringerne er det
ønskværdigt at undersøge et teoretisk tilfælde, som kan udledes analytisk.
Det nemmeste tilfælde er et uniformt, lineært array (ULA) med et lille antal mikrofoner, f.eks. 4, placeret med regelmæssig, indbyrdes afstand p˚
a en ret linje. Udledningen tager
udgangspunkt i en række principper og antagelser[5]:
ˆ Reciprocitet mellem lydgiver og lydmodtager.
ˆ Lydgiver betragtes som punktkilde (monopol) og lydmodtager som punktmodtager.
ˆ Lydmodtager opholder sig i lydgiverens fjernfelt.
Reciprocitetsprincippet er vigtigt i denne sammenhæng, fordi udledningen tager udgangspunkt i retningskarakteristikken for et ULA best˚
aende af lydgivere, og ikke lydmodtagere.
Vha. reciprociteten ses det imidlertid, at retningskarakteristikken for en lydgiver er identisk med lydmodtagerens[16]. Derfor kan resultatet fra udledningen overføres direkte til et
mikrofon-array.
Den simpleste form for lydkilde er en lille, pulserende kugle, ofte benævnt monopol, punktkilde eller 0’te-ordens kilde. Det antages i denne analyse at lydgiver opfører sig som en ideel
monopol, mens lydmodtager opfører sig som en ideel punktmodtager.
I analysen af et ULA skal der bruges mindst to monopoler. Den mindste konstruktion
er s˚
aledes en dipol, dvs. to monopoler med fastholdt indbyrdes afstand. Det kan vises matematisk, at n˚
ar man befinder sig i nærfeltet af en dipols akustiske lydfelt, opst˚
ar der særlige
nulpunkter, hvor de to monopoler i dipolen interfererer destruktivt med hinanden. Af denne
grund betragtes kun tilfældet, hvor lydmodtageren opholder sig i ULA’ets fjernfelt.
6.1
Akustisk udstr˚
aling fra monopoler og dipoler
En frit anbragt monopol, som kan matematisk indskrænkes til et punkt, vil udstr˚
ale et sfærisk
lydfelt i fjernfeltet, f.eks. et radialfelt, hvor lydtrykssvingninger er ens overalt i enhver given
afstand fra kildens centrum. Et s˚
adant felts bølgefronter er koncentriske kugleflader med
centrum i kildens centrum. I et sfærisk koordinatsystem kan bølgeligningen skrives
∇2 Φ + k 2 Φ =
1 ∂ 2 ∂Φ
(r
) + k 2 Φ = 0,
r2 ∂r
∂r
(6.1)
hvor ∇2 er Laplaceoperatoren, Φ er hastighedspotentialet3 , k er bølgetallet og r er afstand.
Denne har den fuldstændige matematiske løsning
A jk(ct−r)
B jk(ct+r)
e
+
e
,
(6.2)
4πr
4πr
hvor A og B er arbitrære konstanter, som bestemmes vha. rand- og begyndelsesbetingelser.
De to led repræsenterer hhv. udad-propagerende (divergerende) og indad-propagerende (konvergerende) bølgefronter. Konvergerende bølgefronter er refleksioner af lydgiveren i en h˚
ard,
uendelig stor væg uendeligt langt væk. I denne udledning er lydgiveren anbragt i et frit felt, og
derfor er B = 0 (ingen refleksioner). S˚
aledes f˚
as hastighedspotentialet, Φ, partikelhastigheden,
ur , og lydtrykket, p, for en monopol til
Φ=
Φ=
3
A jk(ct−r)
e
4πr
partikelhastighed = −∇Φ
12
(6.3)
Analytisk beamforming med simpelt, lineært array
∂Φ
1
A jk(ct−r)
= ( + jk)
e
(6.4)
∂r
r
4πr
A jk(ct−r)
∂Φ
= jkρc
e
(6.5)
p=ρ
∂t
4πr
Tæt p˚
a kilden, dvs. n˚
ar r → 0, er partikelhastigheden, ur , og lydtrykket, p, tilnærmelsesvist
90◦ faseforskudt, hvilket gør lydfeltet overvejende reaktivt. I fjernfeltet er feltet overvejende
aktivt.
Hvis monopolens radius er ra , og dens radielle overfladehastighed sættes til u0 ejωt , hvor
u0 er en amplitudekonstant, f˚
as fra ligning 6.4
ur = −
(ur )r=ra = u0 ejωt = (
1
A j(ωt−kra )
+ jk)
e
ra
4πra
(6.6)
S˚
aledes er kildestyrken, A, i r = ra lig med kildens volumenhastighed:
A=
u0 ejkra 4πra2
→ u0 4πra2
1 + jkra
for kra 1
(6.7)
N˚
ar en monopol anbringes foran en uendelig stor4 , plan, h˚
ard væg med en afstand, h, der
er sammenlignelig med eller større end bølgelængden, kan man i et punkt, P , vælge at opfatte
denne konfiguration som to korrelerede monopoler, hvor monopol nr. to er en imaginær kilde
for˚
arsaget af den første monopols refleksion i væggen, se figur 6.1a. Effektivt opst˚
ar der alts˚
a
en dipol, som har interessante egenskaber i b˚
ade fjern- og nærfeltet. Ved forskellige frekvenser
vil der opst˚
a omr˚
ader, der er domineret af destruktiv interferens mellem to de monopoler
En dipol skabes ogs˚
a ved simpelt at placere to monopoler ved siden af hinanden med en
fastholdt indbyrdes afstand 2h, se figur 6.1b. Det resulterende hastighedspotentiale, Φ, i et
vilk˚
arligt punkt er
A1 jk(ct−r1 )
A2 jk(ct−r2 )
Φ=
e
+
e
(6.8)
4πr1
4πr2
(a) Monopol S placeret foran uendelig stor, h˚
ard væg med afstand h,
og lydmodtager placeret i punkt P .
Refleksionen af S i væg medfører
virtuel lydgiver S 0 .
(b) To monopoler separeret med
afstand 2h skaber en dipol med
respektive afstande til lydmodtager,
P , r1 og r2 .
Figur 6.1: Konfigurationer af ´en eller to monopoler kan effektivt forst˚
as som dipoler. Illustrationer venligst
l˚
ant fra Knud Rasmussen - Lydfelter“ [5]
”
Det ses fra figuren, at r1 = r − h · cos(ϕ) og r2 = r + h · cos(ϕ). N˚
ar man opholder sig i
fjernfeltet, dvs. r 2h, og de to monopoler udstr˚
aler med samme styrke, A1 = A2 = A, og
4
Uendelig stor kan i praksis forst˚
as som meget større end bølgelængden og kildens afstand til væggen.
13
Analytisk beamforming med simpelt, lineært array
fase, kan feltet approksimeres med
A
· 2 cos (kh cos (ϕ)) · ejk(ct−r) ,
(6.9)
4πr
hvor ϕ er vinklen mellem den vektor, der forbinder centrum af dipolen med P og den vektor,
der gennemløber begge monopoler, og det antages at r = r1 = r2 i nævneren. Hvis punktet
P ligger p˚
a væggens overflade, ϕ = 90◦ , bliver lydtrykket det dobbelte overalt p˚
a en linje,
der svarer til en normal fra dipolens centrum sammenlignet med en enkelt frit anbragt monopol. N˚
ar ϕ = 0◦ opst˚
ar der konstruktiv interferens, n˚
ar monopolafstanden 2h er et helt
antal bølgelængder. Destruktiv interferens forekommer, n˚
ar afstanden er et ulige antal halve
bølgelængder.
Faktoren 2 cos(kh cos(ϕ)) angiver s˚
aledes ændringen af lydtrykskarakteristikken sammenlignet med en enkelt kilde, n˚
ar man befinder sig i fjernfeltet. Nulpunkterne, dvs. omr˚
ader med
total destruktiv interferens, findes vha.
Φ≈
kh cos(ϕ) = (2n + 1) · π/2
(6.10)
eller formuleret i forhold til frekvenser
f=
2n + 1
c
,
4 h cos(ϕ)
(6.11)
hvor n = 1, 2, 3, · · · .
Faktoren cos(kh cos(ϕ)) kan ogs˚
a forst˚
as som forholdet mellem det faktiske lydtryk i en
given retning produceret af dipolen og det lydtryk, der ville have eksisteret, hvis dipolen erstattedes med en enkelt monopol med samme styrke, 2A, som dipolen. Faktoren benævnes R(f ),
og er en definition p˚
a dipolens retningskarakteristik. Af figur 6.2 fremg˚
ar retningskarakteristikken for en dipol for forskellige monopol-monopol afstande, 2h, i forhold til bølgelængden,
λ, ved f = 1000 Hz.
(a) 2h/λ = 0, 25
(b) 2h/λ = 0, 50
(c) 2h/λ = 1, 00
(d) 2h/λ = 2, 00
Figur 6.2: Dipol-retningskarakteristik for forskellige 2h/λ-forhold ved f = 1000 Hz.
14
Analytisk beamforming med simpelt, lineært array
6.2
Retningskarakteristik for linje-array
Et ULA kan i det mest simple tilfælde modelleres som en række af N monopoler, der svinger
med samme styrke. Hvis alle N lydgivere spiller i fase er det resulterende lydfelt, Φres , i et
fjernt punkt P givet ved en superposition
Φres =
N
X
Φi ejϕi ,
(6.12)
i=1
hvor Φi er lydfeltet produceret af den i’te lydgiver, og ϕi er den faseforskel, der er mellem
den i’te kilde og kilde nummer 1. Hvis alle lydgivere pulserer med en indbyrdes faseforskel ϕ0i
bliver feltet i stedet
N
X
0
Φres =
Φi ej(ϕi +ϕi )
(6.13)
i=1
P
a et systems
Det teoretisk maksimale lydtryk f˚
as n˚
ar Φres = N
i=1 Φi . Ifølge definitionen p˚
retningskarakteristik, udviklet i forrige afsnit, f˚
as derfor den resulterende retningskarakteristik
Rres (f ),
P
N Φ ej(ϕi +ϕ0i ) i=1 i
(6.14)
Rres (f ) = PN
Φ
i
i=1
N˚
ar alle kilder svinger med samme styrke, dvs. Φi = Φ0 , f˚
as det reducerede udtryk
N
1 X j(ϕi +ϕ0 ) i ,
Rres (f ) =
e
N
(6.15)
i=1
som er rotationssymmetrisk omkring ULA’ets længdeakse. Dette skyldes array’ets symmetriske konstruktion.
Figur 6.3: N monopoler p˚
a række med styringsretning θ i forhold til normal p˚
a ULA’ets længdeakse. Illustration venligst l˚
ant fra Knud Rasmussen - Lydfelter“ [5]
”
P˚
a figur 6.3 ses et linje-array med N monopoler, alle med indbyrdes afstand a. Udstr˚
alingen
er vist fra hver monopol som rette linjer, der danner en vinkel θ med normalen til array’ets
længdeakse. Den indbyrdes faseforskydning mellem den i0 te og den første (i = 1) monopol
bestemmes geometrisk til
ϕi = 2π
ti
2πa sin(θ)(i − 1)f
= 2πti · f =
= ka sin(θ)(i − 1),
T
c
(6.16)
hvor ti er den tidsforsinkelse, der er i mellem lydudstr˚
alingen fra hhv. den i0 te og den første
0
kilde, og T er periodetiden for lydsignalet. Hvis ϕi = 0 f˚
as der fra ligning 6.15
N
1 X j(i−1)ka sin(θ) Rres (f ) =
e
(6.17)
N
i=1
15
Analytisk beamforming med simpelt, lineært array
Ved at substituere β = ka sin(θ) og bruge at
PN −1
n=0
rn =
1−rN
1−r
f˚
ar man
1 − ejN β 1 − (cos(N β) + j sin(N β)) 1
1 − ejβ = N 1 − (cos(β) + j sin(β)) 1 1 − cos(N β) 1/2
1 sin(N β/2) =
=
N 1 − cos(β)
N sin(β/2) 1
Rres (f ) =
N
N˚
ar β = ka sin(θ) erstattes bliver retningskarakteristikken derfor
sin(N π λa sin(θ)) Rres (f ) = N sin(N λa sin(θ)) (6.18)
(6.19)
N˚
ar ϕ0i 6= 0 i ligning 6.15, dvs. at der indføres en faseforskel mellem hver nabolydgiver som
supplement til vejlængdefaseforskellen, kan ligning 6.19 udvides til
sin(N π λa sin(θ) + sin(θ0 )) ,
Rres (f ) = (6.20)
N sin(N λa sin(θ) + sin(θ0 )) hvor ϕ0i = ka sin(θ0 )(i − 1), og θ0 er en fast vinkel, der medfører en ekstra fasedrejning mellem
den i’te og første monopol (styringsretning). P˚
a figur 6.4 ses det analytiske beampattern for
et ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = π/2 rad. I dette tilfælde er lydgiverne
placeret parallelt med θ = 90◦ p˚
a figur 6.3, og der er tillagt en ekstra fase mellem hver
nabolydgiver ved at sætte θ0 = −π/2, se figur 6.4.
Figur 6.4: Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = π/2.
Et lignende array kan relativt nemt b˚
ade simuleres og undersøges i praksis, læs nærmere
om dette i kapitel 7 og 9. Lydgiverne er stadig placeret langs θ = 90◦ , mens θ0 = 0. Der f˚
as
nu et anderledes beampattern, der i høj grad understreger, at ULA’ets beamforming-evne er
afhængig af den valgte retning, se figur 6.5. I denne situation f˚
as der større sidelobes, men
mainlobe-bredden er forbedret ift. forrige situation p˚
a figur 6.4.
Figur 6.5: Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = 0.
16
Simulering af delay-and-sum beamforming i MATLAB
7
Simulering af delay-and-sum beamforming i MATLAB
7.1
Algoritmens funktionalitet
Den samlede simulering af delay-and-sum beamforming er udført i de to MATLAB-scripts
ArrayConfiguration.m”samt Beamforming FFT.m“. I ArrayConfiguration.m“ foretages al
”
”
”
opsætning af mikrofon-array’et, herunder dimensioner, geometri, lydkildens position samt
valgfrie, avancerede tillægsfunktioner (f.eks. mikrofonfasefejl og refleksioner i rummet). Derudover kan det ogs˚
a angives hvilket frekvensomr˚
ade, der ønskes undersøgt. Scriptet eksporterer
automatisk den valgte konfiguration til filen MicrophoneArray.mat“. MATLAB-algoritmen
”
Beamforming FFT.m“ implementerer delay-and-sum beamforming i frekvensdomænet, som
”
omtalt i kapitel 3. Simuleringen tager udgangspunkt i den prædefinerede array-geometri og
har flere indbyggede funktioner:
1. Simulering af tidsforsinkede signaler for hver mikrofon i array’et.
2. Beregning af komplekse faser for en valgt styringsretning for alle mikrofoner.
3. Multiplikation med faser samt addering af alle mikrofonsignaler.
4. Polær afbildning af array’ets resulterende beampattern for udvalgte frekvenser.
5. 3D afbildning af array’ets beampatten som funktion af rumlig vinkel i xy-planen og
frekvens.
B˚
ade ArrayConfiguration.m“ og Beamforming FFT.m“ er vedhæftet p˚
a den medfølgende
”
”
CD. Uddrag fra algoritmen vil blive omtalt i de følgende afsnit.
7.2
Konfigurering af array-geometri
ArrayConfiguration.m“-scriptet h˚
andterer to overordnede geometrier: 2D rektangulære og
”
2D cirkulære. I tabel 7.1 fremg˚
ar de indbyggede geometrier.
17
Simulering af delay-and-sum beamforming i MATLAB
Syntaks i MATLAB
'rect'
Geometri
Rektangulær
'circ'
Cirkulær
'rand'
Tilfældig
'logc'
Logaritmisk
'equi'
Ækvidistant
Beskrivelse
Konstruerer et m × n rektangulært array med mulighed for styring af indbyrdes mikrofonafstande.
Konstruerer et cirkulært array med N mikrofoner i C
koncentriske cirkler med maks. radius rmax .
Konstruerer et pseudotilfældigt array med N mikrofoner, der alle ligger inden for en brugerdefineret radius
rmax .
Konstruerer et cirkulært array med N mikrofoner i C
koncentriske cirkler, der er separeret radialt langs en
logaritmisk akse.
Konstruerer et cirkulært array med mikrofoner, der er
ens separeret igennem hele geometrien.
Tabel 7.1: Oversigt over indbyggede geometrier i ArrayConfiguration.m“.
”
Af tabel 7.2 fremg˚
ar de indbyggede indstillingsmuligheder.
Syntaks i MATLAB
r
v
sourceFreq
freqVector
Input
Reelt tal > 0
Reelt tal
1 × l vektor, [f1 f2
... fl ]
fi : R : ff
numRows
numCols
micSpacingRow
Heltal ≥ 0
Heltal ≥ 0
Reelt tal ≥ 0
micSpacingCol
Reelt tal ≥ 0
numShells
Heltal ≥ 0
numMics
radiusCircArray
Heltal ≥ 1
Reelt tal ≥ 0
logDegree
Reelt tal ≥ 0
equiDist
Reelt tal ≥ 0
centerMic
enable
Binært, 1/0
Binært, 1/0
micPhaseError
micAmplitudeError
Binært, 1/0
Binært, 1/0
roomDimension
1 × 3 vektor, [l b h]
Beskrivelse
Lydkildens afstand fra array’ets centrum i meter.
Lydkildens retning ift. array’ets x-akse.
Rækkevektor indeholdende frekvenser til
beampatterns.
Frekvensvektor til 3D-beampattern, fi og ff angiver hhv. mindste og største frekvens, R angiver
opløsning.
Antal rækker i rektangulært array.
Antal kolonner i rektangulært array.
Indbyrdes rækkeafstand i rektangulært array i
meter.
Indbyrdes kolonneafstand i rektangulært array i
meter.
Antal koncentriske cirkler i cirkulære geometrier.
Antal mikrofoner i cirkulære geometrier.
Maksimal radius for cirkulære geometrier i meter.
Graden af logaritmisk radial akse i cirkulære
geometrier.
Afstand til brug i ækvidistant, cirkulært array i
meter.
1 = anvend centermikron, 0 = anvend ej.
1 = aktiver avancerede funktioner, 0 = aktiver
ikke.
1 = aktiver mikrofonfasefejl, 0 = aktiver ikke.
1 = aktiver mikrofonamplitudefejl, 0 = aktiver
ikke.
Rækkevektor, der angiver rummets dimensioner
(længde × bredde × højde).
18
Simulering af delay-and-sum beamforming i MATLAB
offsetX
Reelt tal
offsetY
Reelt tal
avgAbsorp
Reelt tal ≥ 0
noiseSources
reflectionSources
mode
Binært, 1/0
Binært, 1/0
Tekststreng,
simulate'
'measure'
sensitivity
w
Binært, 1/0
Reelt tal
'←-
eller
Forskydning af array’ets centrum ift. rummets
x-akse.
Forskydning af array’ets centrum ift. rummets
y-akse.
Gennemsnitlig absorptionskoefficient i efterklangsrum.
1 = aktiver støjkilder, 0 = aktiver ikke.
1 = aktiver refleksion, 0 = aktiver ikke.
Udfører beamforming p˚
a enten simulerede eller
m˚
alte mikrofonsignaler.
1
=
aktiver
simulering
følsomhedskarakteristik, 0 = aktiver ikke.
Angiver
fastholdt
styringsretning
følsomhedskarakteristik i grader.
af
i
Tabel 7.2: Oversigt over indstillingsmuligheder i ArrayConfiguration.m“ og Beamforming FFT.m“.
”
”
Den rektangulære geometri kan indstilles til forskellige antal rækker og kolonner, som
tilsammen udgør en m × n mikrofonmatrix med et antal mikrofoner, N , svarende til
N = m × n.
(7.1)
Endvidere kan afstandene mellem enkelte mikrofoner i hhv. række- og kolonneniveau indstilles.
S˚
aledes bliver det rektangulære arrays dimensioner, længde × bredde (l × b):
l = (m − 1) · sm
b = (n − 1) · sn ,
(7.2)
hvor sm og sn er mikrofonseparering i hhv. række- og kolonneplan. Bemærk, at MATLABalgoritmen genererer et array, hvor alle mikrofoner er separeret ens. Dvs. at det rektangulære
array ikke kan konfigureres med individuelle afstande. Dette er eventuelt et emne, der kan
undersøges nærmere[8, s. 12].
Den cirkulære geometri er knyttet til fire slags konfigurationer: en symmetrisk, lagdelt opsætning, hvor mikrofoner placeres regelmæssigt i veldefinerede koncentriske cirkler; en tilfældig
opsætning, hvor mikrofoner placeres pseudotilfældigt inden for en brugerdefineret cirkelradius, rmax ; en logaritmisk opsætning, hvor de koncentriske cirkler har logaritmiske radier; og
en ækvidistant opsætning, hvor alle koncentriske cirkler har samme afstand som afstanden
mellem individuelle mikrofoner. Antallet af mikrofoner, N , bestemmes manuelt efter ønske.
Endvidere kan der angives, hvor mange koncentriske cirkler de N mikrofoner skal fordeles
regelmæssigt i.5 De cirkulære arrays kan ogs˚
a konfigureres med en centerplaceret mikrofon
ved at sætte centerMic = 1. Det ækvidistante array kan styres med parameteren equiDist,
som angiver den ønskede separation mellem transducere i arrayet i meter. Se illustrationer er
de forskellige geometrier p˚
a figur 7.1.
5
OBS: Divisionen mellem antallet af mikrofoner og antal cirkler skal give et heltal.
19
Simulering af delay-and-sum beamforming i MATLAB
(a) Eksempel p˚
a 4×4
rektangulært array,
sm = sn = 5 cm
(b) Eksempel p˚
a cirkulært
array med rmax = 14, 5 cm,
N = 30, C = 3
(d) Eksempel p˚
a logaritmisk
cirkulært array med rmax = 14, 5
cm, N = 40, C = 4
(c) Eksempel p˚
a tilfældigt
array med rmax = 14, 5 cm,
N = 24
(e) Eksempel p˚
a ækvidistant
cirkulært array med r = 11, 7 cm,
N = 35
Figur 7.1: Eksempler p˚
a array-geometrier simuleret i MATLAB.
Mikrofonernes placering er angivet i

x1
~

y1
Si =
z1
en 3 × N matrix p˚
a formen

x2 ... xN −1 xN
y2 ... yN −1 yN  ,
z2 ... zN −1 zN
(7.3)
hvor hver kolonne angiver et tredimensionelt koordinat for den i’te mikrofon. I beamformingscriptet er det imidlertid nødvendigt at udtrykke alle individuelle mikrofon-vektorer som re~1 = (x1 , y1 , z1 ). S˚
lative i forhold til en reference mikrofon, f.eks. S
aledes bliver den relative
positionsmatrix ~ri :


0 (x2 − x1 ) ... (xN −1 − x1 ) (xN − x1 )
~i − S
~1 =  0 (y2 − y1 ) ... (yN −1 − y1 ) (yN − y1 )  ,
(7.4)
~ri = S
0 (z2 − z1 ) ... (zN −1 − z1 ) (zN − z1 )
P˚
a figur 7.2 fremg˚
ar ~ri for tre forskellige arrays.
(a) Eksempel p˚
a 4×4
rektangulært array
(b) Eksempel p˚
a cirkulært
array med rmax = 14, 5 cm
(c) Eksempel p˚
a tilfældigt
array med rmax = 14, 5 cm
Figur 7.2: Afbildning af relative vektorer simuleret i MATLAB.
20
Simulering af delay-and-sum beamforming i MATLAB
7.3
Simulering af individuelt tidsforsinkede signaler
Hver mikrofon i array’et modtager det akustiske signal fra lydkilden p˚
a et forskudt tidspunkt.
Tidsforsinkelsen for den i’te mikrofon udregnes vha.
q
ti = |~ri − ~rs |/c = (rix − rsx )2 + (riy − rsy )2 + (rriz − rsz )2 )/c,
(7.5)
hvor ti er tidsforsinkelsen mellem lydkilden og den i’te mikrofon, ~rs er lydkildens position
og c ≈ 340 m/s er lydens hastighed i atmosfærisk luft. N˚
ar der ikke tages hensyn til den
akustiske dæmpning i luft, kan de signaler, som mikrofonerne enkeltvist modtager, simuleres
med kopier af det oprindelige signal fra lydkilden med en respektiv tidsforsinkelse, ti , se f.eks.
figur 7.3.
Figur 7.3: Eksempel p˚
a tidsforsinkelse mellem nærmeste og fjerneste mikrofon i forhold til lydkilden. f = 4000
Hz.
I dette eksempel modtager den nærmeste mikrofon signalet ca. 5,5 ms efter lydkilden
udsendte det, mens den fjerneste mikrofon er tidsforsinket med yderligere 1 ms. Det er netop
denne fysiske egenskab ved de optagede signaler, som muliggør delay-and-sum beamforming.
Simuleringen kan ogs˚
a udvides med tilføjelsen af støjkilder, som ønskes fjernet i den rumlige
filtrering (beamforming).
Der fokuseres p˚
a frekvensomr˚
adet 1000 Hz - 4000 Hz (menneskelig taleforst˚
aelse), se afsnit 5.
Dette svarer til akustiske bølgelængder i intervallet λ ∈ [8.5 cm ; 34 cm], og det m˚
a forventes,
at array’ets ydeevne kan relateres til disse størrelser. Læs mere om disse overvejelser i afsnit
4.2.
7.4
Beregning af og multiplikation med komplekse faser
I delay-and-sum algoritmen skal alle mikrofonsignaler tildeles et unikt delay (tidsdomæne) eller
en unik fase (frekvensdomæne), der afhænger af styringsretningen og mikrofonernes relative
positioner (~ri ), og herefter lægges sammen.
po =
N
X
pi · ϕi =
i=1
N
X
i=1
21
pi · ejω∆i ,
(7.6)
Simulering af delay-and-sum beamforming i MATLAB
hvor po er beamforming-outputtet, pi er det i’te komplekse mikrofonsignal, ω er vinkelfrekvens,
ϕi er den i’te fasedrejning, og ∆i er den i’te tidsforsinkelse, der skal tillægges det i’te signal.
Tidsforsinkelsen udregnes vha.[10]
~ri · ~u
∆i =
,
(7.7)
c
hvor ~u er en retningsvektor (|~u| = 1), der angiver array’ets styringsretning.
I kode 1 fra MATLAB-scriptet Beamforming FFT.m“ beregnes de komplekse faser, og
”
i kode 2 multipliceres faserne med de Fouriertransformerede mikrofonsignaler, dataFFT. For
hver retning, der undersøges (fra 0◦ til 360◦ i valgfri opløsning, f.eks. angleStep = 1◦ ), summeres alle de kvadrerede beamforming-output.
Kode 1: Beregning af komplekse faser.
1
2
% Phase d i f f e r e n c e f o r each mic . a t d i f f e r e n t a n g l e s
phase = exp ( 1 j * beamDelay * sourceFreq ( mm ) * 2 * p i ) ;
Kode 2: Mikrofonsignalerne dataFFT multipliceres med de tilhørende, komplekse faser. Resultatet konverteres
til effekt.
1
2
3
4
f o r ii = 1 : a n g l e
output ( ii , : ) = phase ( ii , : ) * dataFFT ;
power ( ii ) = sum ( output ( ii , : ) . ˆ 2 ) ;
power
end
% o ut pu t s i g n a l c o n v e r t e d t o ←-
beamDelay er ∆i , phase er ϕi , og sourceFreq(mm) er frekvensen i Hz.
N˚
ar disse udregninger er foretaget for alle mikrofoner i array’et og alle vinkeltrin i xyplanen, kan der afbildes et polært plot, der viser array’ets beampattern som funktion af vinkel,
se f.eks. figur 7.4. Fremadrettet vil de viste beampatterns være normerede, og beamformingoutputtet er kvadreret for at undg˚
a negative værdier (modulus kan evt. ogs˚
a anvendes).
Figur 7.4: Eksempel p˚
a polær plot af beampattern for frekvenser 1000 Hz, 2500 Hz og 4000 Hz. Lydkilden
er placeret i ~rs = (x, y, z) = (−2, 2, 1) m, dvs. 135◦ . Eksemplet tager udgangspunkt i et 10 × 10 rektangulært
array, sm = sn = 5 cm.
Lydkildens position er valgt til ~rs = (−2, 2, 1) og svarer til en vinkel i xy-planen p˚
a 135◦ ,
hvilket er i overensstemmelse med en aflæsning af array’ets beampattern. Tilsvarende, n˚
ar der
genereres ovenst˚
aende karakteristikker for alle frekvenser i intervallet f ∈ [1000; 4000] Hz, f˚
as
en 3D afbildning, der har array’ets normerede beampattern i dB som funktion af xy-vinkel
samt frekvens, se figur 7.5.
22
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.5: Eksempel p˚
a 3D afbildning af beampattern som funktion af xy-vinkel og frekvens (fra 1000 Hz til
4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. Lydkilde placeret
i 135◦ .
3D-afbildningen har samme information som de enkelte polære plot, men har fordelen, at
den viser array’ets beampattern mere kontinuert i frekvens. For en mere kvalitativ udgave af
figur 7.5, kan 3D-afbildningen anskues ovenfra, som vist p˚
a figur 7.6.
Figur 7.6: Eksempel p˚
a 2D repræsentation af 3D afbildning af beampattern som funktion af xy-vinkel og
frekvens (fra 1000 Hz til 4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5
cm. Lydkilde placeret i 135◦ .
23
Simulering af delay-and-sum beamforming i MATLAB
Vha. denne repræsentation er det overskueligt at vurdere, hvorfra lyden udbredes. I dette
eksempel er det ved ca. 135◦ . S˚
akaldte sidelobes kan identificeres som de øvrige lokale maksima
i array’ets beampattern (rød = høj styrke, bl˚
a = lav styrke).
7.5
Simulering af hhv. beampattern og følsomhedskarakteristik
I forbindelse med array-teknologi skelnes der ofte mellem et systems følsomhedskarakteristik
(sensitivity) og dets beampattern.
I denne rapport henviser et systems beampattern til det akustiske respons, som f˚
as ved
at lade systemet sekventielt evaluere alle vinkler i xy-planen (array’ets egen plan) og afbilde
den resulterende polære akustiske effektfordeling. Dette betyder s˚
aledes, at hvis to lydkilder,
placeret to forskellige steder i rummet, udsender lyd med samme effekt, vil det resulterende
beampattern indikere begge lydkilder ved deres respektive placeringer.
Ved et arrays følsomhedskarakteristik (eller bare følsomhed“) forst˚
as det respons, som
”
f˚
as ved at lade systemet være følsomt i ´en valgt retning i xy-planen og optage lyd fra alle
retninger. Det resulterende polære plot vil i s˚
adanne tilfælde vise følsomheden af array’et ved
en given retningsstyring. Hvis en lydkilde udsender lyd fra den valgte retning, vil dette være
synligt i afbildningen. Hvis lydkilden derimod udsender lyd fra en anden retning end den
valgte, vil array’et undertrykke lyden, og det polære plot viser ideelt intet respons.
7.6
Avanceret funktionalitet
Simuleringsalgoritmen kan konfigureres i yderligere to henseender: med ideelle vilk˚
ar eller
med mere realistiske vilk˚
ar. Den ideelle situation er allerede gennemg˚
aet i de tidligere afsnit.
I undersøgelsen af mikrofon-array’ets beampattern kan det ligeledes være interessant at identificere indflydelsen af realistiske effekter s˚
asom mikrofonernes fasefejl, refleksioner fra gulv,
vægge og loft i anvendelsesmiljøet og akustisk dæmpning i luften. Lydkildens position i forhold til array’et kan ogs˚
a have en betydning s˚
avel som støjkilder. De avancerede parametre
aktiveres i simuleringen ved at sætte enable = 1.
7.6.1
Simulering af mikrofoners fase- og amplitudefejl
Under ideelle forhold er alle mikrofoner i array’et identiske og uden hverken fase- eller amplitudefejl. Man kan argumentere for, at amplitudefejl ikke er nogen betydelig hindring i delayand-sum beamforming. Amplitudefejl kan muligvis være en større bekymring i havakustik og
lignende, hvor den akustiske dæmpning er langt større end i atmosfærisk luft.
Mikrofonernes fasefejl er til gengæld et centralt emne hvad ang˚
ar dette projekts omfang.
Med p˚
amindelsen om, at array’et skal anvendes som konferencesystem, er der ˚
abenlyse krav til
dimensionerne af systemet. Denne pladsbegrænsning har direkte indflydelse p˚
a b˚
ade antallet
af mikrofoner, der kan placeres i array’et, samt deres indbyrdes afstand. Afstanden mellem
de p˚
agældende mikrofoner er proportional med den tid, lyden bruger p˚
a at propagere mellem
dem. Dette er simpelt udtrykt ved
ta,b = da,b /c,
(7.8)
hvor ta,b er forsinkelsen mellem mikrofon a og b og da,b er afstanden mellem mikrofon
a og b. Eksempelvis vil to mikrofoner med en indbyrdes afstand p˚
a 5 cm være tidsforskudt
med t1,2 = 0, 05 m/(340 m/s) ≈ 0, 15 ms. Hvis man antager at en mikrofon har en fasefejl p˚
a
20◦ = 0, 35 rad ved f = 4000 Hz, f˚
as en fejlforbunden tidsforsinkelse te = 0, 35 rad/(2 · π ·
4000 Hz) ≈ 0, 015 ms. Dvs.
te ≈ 1/10 · t1,2 ,
24
(7.9)
Simulering af delay-and-sum beamforming i MATLAB
Fasefejlen kan alts˚
a bidrage betydeligt til den allerede eksisterende faseforskydning, der
følger af mikrofonernes separation. Dette bidrag giver naturligvis anledning til fejl i systemets
evne til at retningsbestemme lydkilden. For at systemets respons skal p˚
avirkes negativt af
fasefejl, kræver det, at alle mikrofoner er uafhængige, hvad ang˚
ar deres individuelle fasefejl.
Hvis alle mikrofoner har samme fejl, vil beamforming-outputtet være uændret. P˚
a figur 7.7
ses den polære karakteristik for 10×10 mikrofoner, der hver har f˚
aet tildelt en tilfældig fasefejl
mellem 0 og 2π rad.
Figur 7.7: Eksempel p˚
a 100 mikrofoner hver med en fasefejl, der er uniformt fordelt med 0 og 2π rad. Lydkilden
er placeret i retning 135◦ .
I praksis er det usandsynligt, at en mikrofon kan have en fasefejl i størrelsesordenen 2π,
men ikke desto mindre understreger ovenst˚
aende eksempel alvorligheden af fasekorrektheden.
I forbindelse med laboratorieundersøgelser kan det derfor være nødvendigt at kalibrere eller, i
det mindste, størrelsesbestemme de p˚
agældende fasefejl. I praksis er det mere sandsynligt, at
de anvendte mikrofoner har fasefejl, der er normalfordelt omkring 0◦ med en standardafvigelse
p˚
a 3-5◦ .[3]
I stedet for at anse fasefejl som en iboende egenskab ved mikrofonerne, kan de ogs˚
a være
affødt af en usikkerhed vedrørende deres relative placering i array’et. I det forrige eksempel
antages det, at to mikrofoner er separeret med 5 cm. Hvis denne afstand i virkeligheden er
stokastisk omkring 5 cm med en usikkerhed p˚
a op til 10% (svarende til 0,5 cm), kan dette give
anledning til en fejlbehæftet tidsforsinkelse mellem mikrofonerne, eller dvs. en fejlbehæftet
fase. Denne udregnes vha.:
ϕe = 2 · π · dx/λ,
(7.10)
hvor ϕe er fasefejlen for˚
arsaget af positionsusikkerhed, dx er usikkerheden i separation, og λ
er bølgelængden for en given frekvens.
Af figur 7.8 fremg˚
ar den resulterende fasedrejning (fasefejl) som følge af separationsusikkerheder mellem 0,1 cm og 0,5 cm.
25
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.8: Resulterende fasefejl for forskellige positionsusikkerheder, dx.
Det ses at en positionsusikkerhed p˚
a dx = 0, 5 cm giver anledning til en fasedrejning p˚
a
lidt over 20◦ ved 4000 Hz, hvilket verificerer det tidligere eksempel (ligning 7.9). Ved 1000 Hz
er fasedrejningen i størrelsesordnen 5◦ . Disse tal har direkte anvendelighed i forbindelse med
udviklingen af et mikrofon-array. Resultatet p˚
a figur 7.8 viser, at array’et er mere følsomt
over for positionsusikkerheder ved de høje frekvenser end ved de lave, pga. den lineære sammenhæng mellem fasedrejningen og frekvens. Det betyder ogs˚
a, at det m˚
a forventes, at sm˚
a
ændringer i array’ets dimensioner kan have stor betydning for det højfrekvente beampattern,
mens det lavfrekvente er relativt urørt af sm˚
a ændringer. Simuleringer s˚
avel som den praktiske
udførelse af array’et kan drage nytte af denne konklusion.
7.6.2
Rumakustiske fænomener, inkl. refleksioner og støj
Mikrofon-array’ets ydeevne skal b˚
ade undersøges i et lyddødt rum og i virkelige omgivelser.
Sidstnævnte undersøgelse skal især hjælpe med at afklare, hvor robust systemet er overfor b˚
ade
korreleret og ikke-korreleret støj. Korreleret støj vil typisk være refleksioner af den egentlige
lydkilde pga. rummets beskaffenhed (f.eks. gulv, vægge, loft, møbler), mens ikke-korreleret
støj indebærer trakfikstøj, uønsket mennesketale, elektronikstøj (f.eks. blæsere, diskdrev) og
lignende.
I MATLAB-simuleringen er der mulighed for at definere et rektangulært rums dimensioner
i de avancerede konfigurationsparametre. Programmet vil som standard placere array’ets centrum i midten af rummet i position (0, 0, 0), men der er mulighed for at forskyde placeringen i
hhv. x- og y-retning. Udover at visualisere rummets størrelse i forhold til array’et og lydkilden,
placerer programmet ogs˚
a punkter uden for rummet, der repræsenterer de akustiske billeder,
som er en konsekvens af refleksioner i rummet. Se figur 7.9.
26
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.9: Eksempel p˚
a simulering af rektangulært rum med dimensionerne (l × b × h) = (6 × 4 × 3) m og
lydkildeposition = (−2, 0, 1) m.
Effekten af disse refleksioner simuleres ved at tidsforsinke den egentlige lydkildes signal
for hver refleksionskilde med tiden, tri :
tri = 2 · dri /c,
(7.11)
hvor dri er afstanden mellem lydkilden og den i’te refleksionskilde. Algoritmen simulerer
kun 1. ordens refleksioner, dvs. den tillader kun refleksion med en overflade ´en gang, inden
signalet dæmpes helt. Desuden skal hvert signal multipliceres med en absorptionskoefficient
pga. akustisk effekttab ved refleksionerne. Absorptionskoefficienten kan konfigureres manuelt
p˚
a baggrund af eventuelle m˚
alinger.
MATLAB-algoritmen har mulighed for at anvende støj og refleksioner enkeltvist s˚
avel som
samtidigt. Disse indstillinger styres ved at sætte hhv. noiseSources og reflectionSources til
1 eller 0.
7.6.3
Akustisk dæmpning i luft mellem lydkilde og array
Ifølge Stokes akustiske dæmpningslov vil lyd, der propagerer i en Newtonsk væske (f.eks. luft
eller vand), opleve en eksponentiel dæmpning pga. væskens viskositet.
p0 (d) = p0 (0) · e−τ ·d ,
(7.12)
hvor p0 (d) er lydfeltets amplitude efter at lyden har propageret en afstand d, p0 (0) er lydfeltets
amplitude i position d = 0, og τ er dæmpningsraten givet ved
τ=
2ηω 2
,
3ρc3
27
(7.13)
Simulering af delay-and-sum beamforming i MATLAB
hvor η er væskens dynamiske viskositet (≈ 1, 983 · 10−5 kg/m · s for luft), ω er vinkelfrekvens og
ρ er væskens densitet (≈ 1, 225 kg/m3 for luft). τ har s˚
aledes SI-enheden m−1 . Denne funktionalitet bliver automatisk aktiv, n˚
ar enable = 1 i ArrayConfiguration.m“.
”
7.7
Simuleringsresultater
I de følgende afsnit dokumenteres resultaterne for simuleringen af delay-and-sum beamforming
med forskellige konfigurationer.
Det er ønskværdigt at opn˚
a en indsigt i, hvorledes et mikrofon-arrays form og dimensioner
p˚
avirker ydeevnen af delay-and-sum beamforming-metoden. De ydre s˚
avel som indre dimen6
sioner forventes at være koblede til gengivelsen af de akustiske bølgelængder, der er relevante
for den givne applikation.
Simuleringsresultaterne kvalitetsbedømmes vha. følgende m˚
albare størrelser:
ˆ 3 dB mainlobe-bredde i grader.
ˆ Maksimal sidelobe-niveau (normeret ift. mainlobe-niveau).
Mainlobe-bredden ønskes s˚
a smal som mulig, s˚
afremt lokaliseringen er nøjagtig, hvilket hører
under begrebet lokaliseringsnøjagtighed. Bredden m˚
ales mellem de to vinkler, som oplever 3
dB dæmpning i mainlobet. Som eksempel er 3 dB mainlobe-bredden for figur 7.10 ca. 37◦ .
Figur 7.10: Eksempel p˚
a 3 dB mainlobe-bredde m˚
alt i grader samt sidelobe-niveau.
I dette tilfælde er der et 180◦ sidelobe med et niveau (dB) p˚
a ca. 10 · log10 (0.125) ≈ −9 dB
ift. mainlobe-niveau.
Hvad ang˚
ar lydfeltets indfaldsvinkel skal følgende betragtninger nævnes. Konferencesystemet kan f.eks. være placeret p˚
a midten af et mødebord i højden ≈ 1,0 - 1,2 m. Brugeren af
systemet, derimod, kan enten være siddende ved bordet eller st˚
aende nogle meter væk fra bordet (f.eks. i forbindelse med en st˚
aende præsentation). Baseret p˚
a gennemsnitlige højder for
hhv. mænd og kvinder (samt gennemsnitlig længde af overkroppen)[1], vil lydkilden (talerens
mund) være placeret ca. 50 cm over array’et i siddende tilfælde.
6
Ydre betegner array’ets overordnede længde, bredde og højde. Indre betegner interne afstande i systemet,
f.eks. afstanden mellem to mikrofoner.
28
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.11: Illustration af situation, hvor lydkilde (taler) er siddende foran mikrofonsystemet.
I installationen, afbildet p˚
a figur 7.11, antages det, at mikrofon-array’et er placeret i lydkildens akustiske nærfelt. Da de analytiske beregninger tager udgangspunkt i, at array’et
befinder sig i lydkildens fjernfelt, kan situationer som den afbildede muligvis være i uoverensstemmelse med de analytiske resultater.
Generelt vil der i de følgende afsnit være fokus p˚
a, i hvilken grad en bestemt geometri kan
optimeres mht. antallet af mikrofoner. Med et økonomisk mind-set, er det s˚
aledes af central
betydning at udvælge den mest effektive systemtype. Effektiv betyder i denne kontekst systemets evne til at udføre en tilstrækkelig nøjagtig rumlig filtrering med et minimum forbrug af
transducere.
7.7.1
Array-geometriens indflydelse p˚
a array’ets beampattern
I undersøgelsen af array-geometriens indflydelse p˚
a array’ets beampattern er der primært
opmærksomhed p˚
a de parametre, der styrer hhv. lav-, mellem- og højfrekvent beampattern. I
denne kontekst er de repræsenteret ved hhv. 1000 Hz, 2500 Hz og 4000 Hz.
Rektangulært array Lydkilden er nu placeret som illustreret p˚
a figur 7.11 eller 7.12 med
array’ets centrum placeret i O = (0; 0; 1) m og lydkilden placeret i Ss = (0; 0, 6; 1, 5) m, og
mikrofon-array’et vil antage følgende dimensioner (m × n):
ˆ 1 × 1 array.
ˆ 2 × 1 array og 2 × 2 array.
ˆ 4 × 2 array, 4 × 4 array og 4 × 6 array.
ˆ 10 × 10 array.
29
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.12: Installation set oppefra. Ss er lydkildens position mens O er array’ets midtpunkt
Der afprøves ogs˚
a forskellige mikrofon-til-mikrofonsepareringer til hver array-dimension.
Situationen med m × n = 1 × 1 = 1 mikrofon kan anses som værende et specialtilfælde
af et array, hvor antallet af rækker og kolonner er reduceret til ´en i hver retning. Dette giver
en triviel array-størrelse p˚
a 0 × 0 m. Konsekvensen af kun at anvende ´en mikrofon i delayand-sum beamforming-algoritmen er, at resultatet er identisk med responset fra en enkelt
mikrofon uden nogen form for beamforming DSP, se figur 7.13.
Figur 7.13: Beampattern for 1 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Beampattern ligger langs
med periferien af det polære plot.
Det ses her, at systemet ikke kan retningsbestemme lydkilden i frekvensomr˚
adet 1000 Hz
- 4000 Hz. Bemærk, at der i simuleringen opereres med ideelle, omnidirektionelle punktmodtagere (jf. afsnit 4.1.2).
Allerede n˚
ar antallet af mikrofoner øges fra ´en til to i f.eks. et m × n = 2 × 1 array er
array’et ikke længere omnidirektionelt i xy-planen (jf. afsnit 6.1), se figur 7.14. I dette tilfælde
er mikrofonerne separeret med 5 cm.
Figur 7.14: Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 5
cm. Lydkilden er placeret i 90◦ .
30
Simulering af delay-and-sum beamforming i MATLAB
Vær opmærksom p˚
a, at lydkilden er placeret i retningen 90◦ . For de lave frekvenser er
array’ets mainlobe-bredde stor, hvilket kan skyldes den relative lille samlede array-størrelse
p˚
a l = (m − 1) · sm = (2 − 1) · 5 cm = 5 cm, som er langt under 1000 Hz-bølgelængden p˚
a ca.
34 cm. Det midterste frekvensomr˚
ade omkring 2500 Hz har en bedre lokaliseringsnøjagtighed
med en mainlobe-bredde p˚
a ca. 140◦ , og et sidelobe forskudt nøjagtig 180◦ , der er ca. en faktor
10 lavere end mainlobe-niveauet. Bølgelængden svarende til 2500 Hz-lyd er ca. 13,6 cm. Dvs.
at λ2500 Hz /2 = 6, 8 cm, hvilket er en anelse større end mikrofonsepareringen p˚
a 5 cm. P˚
a figur
7.15 er mikrofonafstanden øget fra 5 cm til 10 cm.
Figur 7.15: Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 10
cm. Lydkilden er placeret i 90◦ .
Array’ets beampattern for 1000 Hz er tydeligt forbedret i forhold til forrige simulering.
En mikrofonseparering sm = 10 cm ligger nærmere p˚
a λ1000Hz /2 = 17 cm end tidligere,
hvilket giver anledning til en hypotese om, at lydens halve bølgelængde er koblet til array’ets
dimensioner. I dette tilfælde har beampattern for b˚
ade 2500 Hz og 4000 Hz større og flere
sidelobes ift. det forrige beampattern. I et ækvidistant mikrofon-array med kun ´en række
af mikrofoner, er det umuligt at opn˚
a god lokaliseringsnøjagtighed for alle frekvenser med
et lille antal mikrofoner7 . Ved at g˚
a fra enkeltrække-arrays til multirække-arrays, kan der
introduceres flere dimensioner i systemet. F.eks. et m × n = 2 × 2 array med rækkeseparering
sm = 10 cm og kolonneseparering sn = 5 cm. Se figur 7.16.
Figur 7.16: Beampattern for 2 × 2 array for frekvenserne 1000, 2500 og 4000 Hz, Mikrofonafstande sm = 10
cm og sn = 5 cm. Lydkilden er placeret i 90◦ .
Array’et begynder nu at opn˚
a en bedre lokaliseringsnøjagtighed i et bredere frekvensomr˚
ade, men er stadig relativt fejlbehæftet med store sidelobes ved høje frekvenser. Ved at
indføre flere rækker og kolonner opst˚
ar der generelt større indbyrdes faseforskydninger mellem
mikrofoner, hvilket gør lokaliseringen mere sikker.
P˚
a figur 7.17 fremg˚
ar beamforming-resultatet for tre forskellige rektangulære arrays med
dimensioner p˚
a hhv. 4 × 2, 4 × 4 og 4 × 6 mikrofoner. Bemærk den gradvise forbedring i
mainlobe-bredde. I alle arrays er sm = sn = 5 cm.
7
Det er muligt at opn˚
a stor lokaliseringsnøjagtighed, hvis der benyttes mange mikrofoner
31
Simulering af delay-and-sum beamforming i MATLAB
(a) 4 × 2 rektangulært array
(b) 4 × 4 rektangulært array
(c) 4 × 6 rektangulært array
Figur 7.17: Beampatterns for forskellige array-konfigurationer. Mikrofonafstande sm = sn = 5 cm.
Lydkilden er placeret i 90◦ .
Det ses ogs˚
a fra simuleringen, og generelt for alle simuleringer, at mainlobe-bredden falder, n˚
ar frekvensen stiger. Fænomenet skal forklares med en sammenligning af lydsignalets
bølgelængde og indbyrdes mikrofonafstande. Det skal nævnes, at n˚
ar antallet af mikrofoner
stiger i de rektangulære arrays, stiger den totale array-størrelse ogs˚
a. Derfor er det svært at
konkludere, hvorvidt det er antallet af mikrofoner eller array-størrelsen, der primært bidrager
til array’ets beampattern. Denne sammenhæng er undersøgt nærmere ifm. de cirkulære geometrier. Tages der udgangspunkt i det array, hvis beampattern er afbildet p˚
a figur 7.17c, kan
array-dimensionerne optimeres for at f˚
a drejet det højfrekvente mainlobe 180◦ . Vælges f.eks.
sm = 6 cm og sn = 4 cm, f˚
as resultatet p˚
a figur 7.18.
32
Simulering af delay-and-sum beamforming i MATLAB
(a) Beampattern
(b) 3D afbildning af beampattern som funktion af retning (◦ ) og
frekvens (Hz).
Figur 7.18: Optimeret 4 × 6 rektangulært array med mikrofonafstande sm = 6 cm og sn = 4 cm. Lydkilden
er placeret i 90◦ .
Resultatet er et array, der primært har sit mainlobe i 90◦ -retningen, men ved frekvenser
mellem 2,9 kHz og 3,6 kHz har frekvensresponset et stort 180◦ sidelobe.
Som et sidste eksempel kan et array med 10 × 10 mikrofoner studeres. Kolonne- og rækkesepareringerne har tidligere vist sig at levere beampatterns med gode lokaliseringsnøjagtigheder
med indbyrdes mikrofonafstande omkring 5 cm, s˚
a dette tages der udgangspunkt i igen, se figur
7.19. H´er observeres der straks, at trods et drastisk øget antal mikrofoner er det højfrekvente
beampattern af ringere kvalitet end tidligere. Dette kan have forbindelse til lydkildens position
i forhold til array’et. Læs mere om dette i afsnit 7.7.5.
33
Simulering af delay-and-sum beamforming i MATLAB
(a) Visualisering af array-geometri inkl. lydkilde
(b) Beampattern.
(c) 3D afbildning af beampattern som funktion af retning (◦ ) og
frekvens (Hz).
Figur 7.19: 10 × 10 rektangulært array med mikrofonafstande sm = 5 cm og sn = 5 cm. Lydkilden er
placeret i 90◦ .
Cirkulært array Det cirkulære array er i praksis nemmere at konstruere i laboratoriet
vha. et drejebord og relativt f˚
a mikrofoner. Denne geometri er s˚
aledes særligt interessant at
simulere pga. dens realis´erbarhed. I det følgende vil konsekvensen af at benytte forskellige
34
Simulering af delay-and-sum beamforming i MATLAB
antal mikrofoner i det samlede system, størrelsen af systemet, antal koncentriske cirkler, m.m.
blive undersøgt. P˚
a figur 7.20c ses beamforming-outputtet for et cirkulært array med fire og
otte mikrofoner fordelt p˚
a hhv. en cirkel og to cirkler med radius r = 10 cm.
(a) Visulalisering af 4 mikrofoner i 1
cirkel.
(b) Visulalisering af 8 mikrofoner i 2
cirkler.
(c) Beampattern for 4 mikrofoner i 1 cirkel. Lydkilden er placeret
i 90◦
(d) Beampattern for 8 mikrofoner i 2 cirkler. Lydkilden er
placeret i 90◦
Figur 7.20: Cirkulært array med 4 og 8 mikrofoner og radius r = 10 cm.
I det lavfrekvente omr˚
ade er array’ets lokaliseringsevne bedre end i det højfrekvente
omr˚
ade. Generelt vil det cirkulære array, ligesom det rektangulære, opn˚
a bedre lokaliseringsnøjagtighed, n˚
ar antallet af mikrofoner stiger, medmindre antallet bliver s˚
a stort i en given
array-størrelse, at visse mikrofoner bliver presset for tæt sammen. P˚
a figur 7.20d er antallet af
mikrofoner øget, men lokaliseringsnøjagtigheden er mindre. En mulig ˚
arsag er, at geometrien
best˚
ar af to koncentriske cirkler i stedet for ´en. Til gengæld er sidelobe-undertrykkelsen større
end figur 7.20c. I s˚
adanne tilfælde vil det høje frekvensomr˚
ade i de fleste tilfælde forringes.
For at sammenligne det cirkulære og rektangulære array, anvendes nu 24 mikrofoner8 fordelt
i hhv. 1, 2 og 3 koncentriske cirkler med største radius r = 12 cm9 , se figur 7.21.
8
9
Svarer til et 6 × 4-array
Svarer til mikrofonseparering 4 × 6 cm
35
Simulering af delay-and-sum beamforming i MATLAB
(a) Beampattern for 24 mikrofoner i 1 cirkel.
(b) Beampattern for 24 mikrofoner i 2 cirkler.
(c) Beampattern for 24 mikrofoner i 3 cirkler.
Figur 7.21: Beampatterns for 24 mikrofoner med forskellige antal cirkler. Array-radius er 12 cm. Lydkilden
er placeret i 90◦ .
Figur 7.21 er endnu et eksemplet p˚
a, at antallet af mikrofoner har indflydelse p˚
a to arrayparametre p˚
a samme tid. Array’ets s˚
akaldte AOAE (Angle Of Arrival Estimation) stiger med
antallet af mikrofoner, mens lokaliseringsnøjagtigheden falder. AOAE angiver array’ets evne
til korrekt at retningsbestemme lydkilden.
Et andet problem, som ikke er tydeligt p˚
a de polære afbildninger, er illustreret p˚
a figur 7.22.
36
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.22: 3D afbildning af beampattern (dB) for cirkulært array med 24 mikrofoner placeret i 3 cirkler med
størst radius r = 12 cm. Lydkilden er placeret i 90◦ .
H´er skal man være opmærksom p˚
a, at den overordnede styrke i mainlobet falder som funktion af frekvens i dette specifikke tilfælde. Dette fænomen er ikke blevet undersøgt nærmere,
men constant beamformers kan evt. afhjælpe dette problem. Helt nøjagtigt er følsomheden
reduceret med 10 dB for 4000 Hz i 90◦ -retningen i forhold til 1000 Hz i samme retning. Det
rektangulære array udviser samme adfærd, men ikke lige s˚
a udtalt.
Centerplaceret mikrofon Et interessant alternativ til geometrien best˚
aende af 24 mikrofoner i 3 cirkler er visualiseret p˚
a figur 7.23. Tilsyneladende kan næsten samme beampattern
opn˚
as med tilnærmelsesvist halvt s˚
a mange mikrofoner i det cirkulære array, hvis den inderste
ring erstattes med en enkelt mikrofon placeret i det absolutte centrum. Dette kan muligvis
forklares ved, at mikrofonerne i den inderste ring er s˚
a tæt placerede, at de effektivt udfører
samme funktion i array’et. S˚
aledes kan man spare 24 − 13 = 11 mikrofoner i dette specifikke
tilfælde, hvilket er næsten halvdelen.
37
Simulering af delay-and-sum beamforming i MATLAB
(a) Cirkulært array med 12 mikrofoner placeret i 2 cirkler samt 1 centerplaceret mikrofon. Maks.
radius rmax = 12 cm.
(b) Beampattern for 12 mikrofoner i 2 cirkler samt 1 centerplaceret mikrofon, rmax = 12 cm.
Lydkilden er placeret i 90◦ .
Figur 7.23: Effekt af at placere ´en mikrofon i midten af array’et som erstatning for den inderste ring.
Logaritmisk array Helt generelt for alle arrays omtalt i dette kapitel, er mikrofonafstande
mindre end ca. 5 cm uønskede pga. de negative effekter ved høje frekvenser. Derfor kan man
med udgangspunkt i den ordinære cirkulære geometri ekspandere“ cirklen ved at benytte en
”
logaritmisk radial afstand. S˚
aledes bliver de koncentriske cirkler ikke ligeligt fordelt mellem r =
rmax og r = 0 cm, men i stedet presset udad. I MATLAB-algoritmen kan graden af forskydning
styres med variablen logDegree i ArrayConfiguration.m“. P˚
a figur 7.24 sammenlignes den
”
ordinære cirkulære geometri (med centerplaceret mikrofon) med det logaritmiske array med
logDegree = 2 for 30 mikrofoner10 .
10
31 med den centerplacerede
38
Simulering af delay-and-sum beamforming i MATLAB
(a) Eksempel p˚
a ordinær cirkulær geometri
med 12(+1) mikrofoner.
(b) Eksempel p˚
a logaritmisk geometri med
12(+1) mikrofoner, logDegree=2.
Figur 7.24: Sammenligningen mellem ordinært og logaritmisk cirkulær geometri med rmax = 12 cm.
Jo større logDegree gøres, jo mere presses mikrofonerne ud mod rmax . Man skal naturligvis
være opmærksom p˚
a, om mikrofonerne presses for tæt sammen. Overordnet har det logaritmiske array meget lille afvigelse fra det ordinært cirkulære, især for array-dimensionerne i den
størrelsesorden, der er behandlet i dette projekt.
Tilfældigt array Det cirkulært tilfældige array medbringer mange af de samme akustiske
egenskaber som det ordinært cirkulære array. Det ordinært cirkulære array har dog den ulempe, at alle mikrofoner er regelmæssigt placeret, hvilke giver gode beampatterns ved enkelte
frekvenser, alt efter designerens ønsker. Ideelt set vil et cirkulært tilfældigt array have et større
spektrum af indbyrdes mikrofonafstande, hvilket giver systemet en større b˚
andbredde, dvs. et
større frekvensomr˚
ade, hvor systemet er i stand til at lokalisere lydkilden. Et tilfældigt array
har alts˚
a potentialet for at opn˚
a et beampattern med større b˚
andbredde end det ordinært
cirkulære array, men det er ikke uden ulemper.
For det første skal der aktivt tages hensyn til at det tilfældige array kan placere mikrofoner
meget tæt, og endda, oven i hinanden. Dette m˚
a forhindres b˚
ade af fysisk logiske grunde samt
af grunde, der relaterer til det højfrekvente beampattern.
For det andet er der ingen kontrol over udvælgelsen af mikrofonplaceringer (definitionen
p˚
a det tilfældige array), hvilket i praksis betyder, at der m˚
a afprøves og undersøges mange
forskellige arrays ´en ad gangen for at beslutte sig for et endeligt design, der opfylder de ønskede
specifikationer. I mange tilfælde vil det tilfældige array udvise ringere lokaliseringsnøjagtighed
end et tilsvarende ordinært cirkulært, pga. en uheldig placering af mikrofoner.
Systemets mainlobe-bredde er up˚
avirket af, om den valgte geometri er ordinært cirkulær
eller tilfældig, s˚
a længe antallet af mikrofoner er ens og cirklerne har samme radius rmax .
Sidelobe-niveauer afhænger til gengæld af den specifikke geometri. Sagt med andre ord har
det tilfældige array potentialet for at opn˚
a et bredspektret beampattern, men designet er
forbundet med stor usikkerhed og lang tids undersøgelse.
I forhold til dette projekts omfang er det uhensigtsmæssig at forsøge at undersøge et
randomiseret array i praksis dels pga. de allerede nævnte ulemper, dels fordi det vil kræve et
stort indgreb i m˚
alekonstruktionen (et drejebord med plads til mikrofoner, se afsnit 8.1. Som en
eventuel approksimation p˚
a et tilfældigt array kan der afslutningsvis i forsøgsrækken udføres
en m˚
aling med et mikrofon-array, der bruger et tilfældigt“ (udvalgt af forsøgsdeltagere) array
”
med de allerede eksisterende mikrofonplaceringer.
Ækvidistant, cirkulært array Det ækvidistante array giver, i modsætning til det ordinært
cirkulære, mulighed for at fastsætte en konstant afstand mellem alle mikrofoner i et cirkulært
39
Simulering af delay-and-sum beamforming i MATLAB
array. Ulempen ved automatiseringen i programmet er, at der er meget lidt kontrol over
hvor mange mikrofoner, der medtages i arrayet og hvor stor radius, array’et f˚
ar. Derfor kan
array’et ikke umiddelbart sammenlignes med tidligere cirkulære eller rektangulære arrays.
Laves simuleringen med f.eks. 35 mikrofoner i 3 cirkler med en maksimal radius p˚
a 15 cm,
f˚
as en indbyrdes, fast mikrofonafstand p˚
a 5 cm, hvilket giver et beampattern meget lig de
tidligere viste for ordinært cirkulære.
7.7.2
Lokaliseringsnøjagtighed som funktion af indbyrdes mikrofonafstand
P˚
a figur 7.25 og 7.26 ses det, hvordan et 1×4-arrays frekvensrespons (beampattern som funktion af frekvens og retning) varierer med varierende indbyrdes mikrofonafstand. Rød indikerer
høj styrke, bl˚
a indikerer lav styrke. S˚
aledes er array’et tilnærmelsesvist omnidirektionelt ved
1 kHz ved sm˚
a mikrofonsepareringer, men opn˚
ar gradvist større selektivitet, n˚
ar separationen
stiger. Tallet under hver figur angiver mikrofonsepareringen.
Figur 7.25: Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde
placeret i retning 0◦ , 2 meter væk i samme plan som array’et. Abcissen angiver frekvens i Hz, mens ordinaten
angiver retning i grader.
40
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.26: Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde
placeret i retning 0◦ , 2 meter væk i samme plan som array’et. Abcissen angiver frekvens i Hz, mens ordinaten
angiver retning i grader.
Til gengæld opst˚
ar der generelt ogs˚
a flere sidelobes, n˚
ar den indbyrdes mikrofonafstand
stiger, særligt ved høje frekvenser n˚
ar mikrofonsepareringerne overstiger 4-4,5 cm. Figur 7.27a
viser array’ets mainlobe-bredde (lokaliseringsnøjagtighed) som funktion af indbyrdes mikrofonafstand ved forskellige frekvenser og n˚
ar lydkilden er placeret i retning 0◦ , dvs. p˚
a array’ets
længdeakse. P˚
a figur 7.27b er lydkilden placeret i retning 90◦ .
41
Simulering af delay-and-sum beamforming i MATLAB
(a) Lydkilden er placeret i retning 0◦ , dvs. p˚
a
array’ets længdeakse.
(b) Lydkilden placeret i retning 90◦ , dvs. vinkelret p˚
a array’ets længdeakse.
Figur 7.27: Mainlobe-bredde som funktion af indbyrdes mikrofonafstand for 1 × 4-array.
Det skal nævnes, at selvom array’et tydeligvis har mindre mainlobe-bredde p˚
a figur 7.27b
pga. indfaldsvinklen p˚
a 90◦ , har dette array altid store 180◦ -sidelobes (spøgelseskilder) med
et niveau p˚
a 1 ift. mainlobet.
7.7.3
Lokaliseringsnøjagtighed som funktion af antal mikrofoner
I de foreg˚
aende afsnit er det blevet vist, hvordan et mikrofon-arrays specifikke beampattern
afhænger af b˚
ade antallet af mikrofoner og deres indbyrdes afstande. I dette afsnit opsummeres de konkrete forskelle mellem de forskellige undersøgte geometrier. P˚
a figur 7.28 til
7.30 sammenlignes mainlobe-bredder for hhv. rektangulære, cirkulære og tilfældige arrays for
frekvenser 1 kHz, 2,5 kHz og 4 kHz.
De rektangulære arrays er alle enkeltrække-arrays. De cirkulære og de tilfældige arrays
har radier, der svarer til r = N/100, hvor N er antallet af mikrofoner for hver p˚
agældende
simulering og tallet 100 er valgt af bekvemmelighed. Dette er nødvendigt for at sikre, at
mikrofonafstandene er identiske i hver simulering. De cirkulære arrays best˚
ar alle kun af ´en
cirkel.
42
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.28: 1000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet.
Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner,
s˚
a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ .
Figur 7.29: 2500 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet.
Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner,
s˚
a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ .
43
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.30: 4000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet.
Rektangulært array simuleret som enkeltrække, cirkulære arrays har radius N/100, hvor N er antal mikrofoner,
s˚
a de indbyrdes afstande er identiske igennem simuleringerne. Lydkilde placeret i 0◦ .
Fælles for alle geometrier er, at med et stigende antal mikrofoner falder mainlobe-bredden
(dvs. lokaliseringsnøjagtigheden stiger). N˚
ar antallet af mikrofoner øges, gøres hele array’et
tilsvarende større, hvilket ogs˚
a kan have indflydelse p˚
a mainlobe-bredden. De rektangulære
enkeltrække arrays er mindst nøjagtige i denne konkrete undersøgelse, men det kan liges˚
a vel
skyldes de valgte parametre i simuleringen, f.eks. indbyrdes mikrofonafstande.
For de cikulære arrays er det interessant at overskueliggøre effekten af forskellige antal
koncentriske cirkler, se figurer 7.31 til 7.33, der viser sammenhængen for frekvenserne 1 kHz,
2,5 kHz og 4 kHz.
Figur 7.31: 1000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De
indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ .
44
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.32: 2500 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De
indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ .
Figur 7.33: 4000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De
indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ .
Ved ekstrapolering ses det fra disse figurer, at for et lille antal mikrofoner vil lokaliseringsnøjagtigheden blive stor n˚
ar antallet af koncentriske cirkler er stor (4 i dette tilfælde).
N˚
ar antallet af mikrofoner stiger forventes det fra simuleringen, at lokaliseringsnøjagtigheden
bliver bedre for arrays med et lille antal koncentriske cirkler og bedst for ´encirkel-array’et.
Det bemærkes ogs˚
a, at sammenhængen mellem mainlobe-bredde og antal mikrofoner (eller
array-størrelse) er ulineær og udviser en eksponentiel aftagning.
45
Simulering af delay-and-sum beamforming i MATLAB
7.7.4
Sidelobe-niveauer som funktion af antal mikrofoner
Størrelsen og antallet af sidelobes i array’ets beampattern beskriver usikkerheden ifm. lokalisering af lydkilden. Store sidelobes giver anledning til stor usikkerhed. De kan for˚
arsages
af uønsket lyd, f.eks. støj eller tilstedeværelsen af andre mennesker i lokalet. I array’ets
følsomhedskarakteristik beskriver størrelsen og antallet af sidelobes array’ets evne til at undertrykke uønsket lyd (filtrering). P˚
a figur 7.34 til 7.36 sammenlignes sammenhængen mellem
sidelobe-niveauer for forskellige geometrier som funktion af antallet af mikrofoner for tre forskellige frekvenser.
Figur 7.34: 1000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De
indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ .
Figur 7.35: 2500 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De
indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ .
46
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.36: 4000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige geometrier. De
indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret i 0◦ .
Enkeltrække-array’et udmærker sig her ved at have lave meget lave sidelobe-niveauer, men
til gengæld har array’et en ringere lokaliseringsnøjagtighed, som vist tidligere. For de cirkulære
arrays lader der ikke til at være nogen ˚
abenlys sammenhæng mellem antallet af mikrofoner og
sidelobe-niveau. Det meget varierende resultat m˚
a i stedet tilskrives enkeltst˚
aende fænomener,
der træder i kraft for et givet antal mikrofoner i et givet array (med givne dimensioner).
Generelt lader det til, at sidelobe-niveauet for ordinært cirkulære arrays er højt for et lille
antal mikrofoner.
7.7.5
Kildepositionens indflydelse p˚
a array’ets beampattern
I beamforming-algoritmen antages det, at mikrofon-array’et udsættes for sfæriske bølger, der
har oprindelse i en punktkilde. N˚
ar lydkilden defineres p˚
a denne m˚
ade vil det have en vis
signifikans, hvor mikrofon-array’et placeres i forhold til kilden. Dette er i modsætning til
situationen, hvor array’et oplever plane bølger. Her er lydtrykket i fase langs en, i princippet,
uendelig bølgefront. En s˚
adan antagelse kan kun gælde, hvis mikrofon-array’et er s˚
a langt væk
fra lydkilden, at den lokale krumning af dens sfæriske bølgefront er 0.
Fra geometriske overvejelser kan effekten af at ændre lydkildens position bestemmes. N˚
ar
mikrofon-array’et er placeret i xy-planen og lydkilden liges˚
a, som vist p˚
a figur 7.37.(1), vil der
kun være bidrag til tidsforsinkelser mellem mikrofonerne fra den sfæriske bølges xy-krumning.
Hvis lydkilden derimod flyttes op til en z-koordinat større end 0, opst˚
ar der et yderligere bidrag
til tidsforsinkelserne fra bølgefrontens krumning i xz-planen. I simuleringer viser det sig, at
n˚
ar lydkilden ligger over (eller under, for den sags skyld) mikrofon-array’et i xy-planen, opst˚
ar
der fejlbehæftede, dobbelte mainlobes, med en opsplitning i den eksakte kildeposition. Dette
skyldes, at beamformeren udelukkende søger efter kilden i array’ets plan (xy-planen), hvilket
medfører, at de p˚
aførte komplekse faser er ukorrekte.
47
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.37: Punktkilder placeret i hhv. (1) z = 0 og (2) z > 0.
P˚
a figur 7.38a ses det resulterende beampattern, n˚
ar lydkilden er placeret i punkt (1) p˚
a
figur 7.37, mens 7.38b viser resultatet n˚
ar lydkilden er placeret i punkt (2).
(a) Beampattern for mikrofon-array med kilde placeret i position
(1), z = 0 m. Lydkilden er 3 m fra array’et i 90◦ -retningen.
(b) Beampattern for mikrofon-array med kilde placeret i position
(2), z = 2 m. Lydkilden er 3 m fra array’et i 90◦ -retningen.
Figur 7.38: Simulering af effekt ved at ændre lydkildens højde.
Resultatet af flytningen er meget tydelig. Udover at alle mainlobes bliver bredere (dvs.
ringere lokaliseringsnøjagtighed), n˚
ar kilden hæves fra z = 0 m til z = 2 m, sker der ogs˚
a en
opsplitning i mainlobes ved 2,5 kHz og 4 kHz. Resultatet er, at systemet estimerer lydkilden
til at være ca. 20 grader forskudt til hver side, hvilket naturligvis er uønsket.
7.7.6
Effekten af mikrofonernes immanente fasefejl
Som diskuteret tidligere, giver mikrofonernes fasefejl anledning til usikkerhed i de fysiske
m˚
alinger. P˚
a trods af at der benyttes særlige array-mikrofoner, som er konstrueret til form˚
alet,
kan det ikke udelukkes, at der er en vis spredning i deres fasefejl. Det er tidligere vist, hvilke
konsekvenser fasefejl kan have p˚
a et arrays beampattern, jf. afsnit 7.6.1.
48
Simulering af delay-and-sum beamforming i MATLAB
I simuleringen tildeles hver mikrofon en normalfordelt, randomiseret fasefejl, hvis standardafvigelse kan indstilles. N˚
ar spredningen vælges til f.eks. 5◦ sker der ingen synlig ændring
i forhold til simuleringen uden fasefejl. Dette gælder for alle tre stikprøvefrekvenser“ 1 kHz,
”
2,5 kHz og 4 kHz. Blot for at undersøge hvor stor en fasefejl der skal til, for at det resulterende
beampattern varierer synligt, prøves med b˚
ade fasefejl p˚
a 20◦ og 50◦ , se figur 7.39.
(a) Beampattern for 4×1 rektangulært array med indbyrdes
mikrofonafstand 3,9 cm og normalfordelt fasefejl med
standardafvigelse σ = 20◦ .
(b) Beampattern for 4×1 rektangulært array med indbyrdes
mikrofonafstand 3,9 cm og normalfordelt fasefejl med
standardafvigelse σ = 50◦ .
Figur 7.39: Undersøgelse af effekten af mikrofonernes fasefejl.
Vær opmærksom p˚
a, at mikrofonernes fasefejl er stokastiske, og de resulterende beampatterns kan derfor variere mellem forskellige simuleringer. De i denne rapport afbildede resultater
viser typiske konsekvenser ved mikrofonfasefejl. Jo færre mikrofoner, der benyttes i array’et,
jo større effekt kan en given fasefejl have. Hvis ovenst˚
aende simulering s˚
aledes gentages med
10 mikrofoner i stedet for 4 vil der ofte opleves en mindre effekt af fasefejlene. Dette giver
god statistisk mening, eftersom fasefejlene er centreret omkring ϕe = 0◦ . Som forventet vil
fasefejl typisk p˚
aføre øvrige sidelobes for de højfrekvente beampatterns pga. deres relative
store følsomhed overfor fasefejl, mens 1000 Hz og derunder i stedet kan opleve en forøgelse i
mainlobe-bredde. Igen skal det understreges, at specifikke egenskaber ved en simulering i høj
grad er afhængig af de tilfældigt generede fasefejl og derfor kan variere fra gang til gang. I
praksis vil array-mikrofonerne have samme fasefejl ved hver m˚
aling og kun opleve almindelig
elektrisk og termisk støj.
7.7.7
Effekten af 1. ordens refleksioner pga. rummets beskaffenhed
Simuleringsalgoritmen giver mulighed for at undersøge indflydelsen af, at mikrofon-array’et
befinder sig i et ikke-lyddødt rum. Refleksioner udgør et korreleret akustisk signal, der i teorien
kan introducere fejl i systemets beampattern, fordi de reflekterede signaler kan interferere med
det oprindelige signal. P˚
a figur 7.40 er et rektangulært 4×1 array placeret i midten af rum
med dimensionerne l × b × h = 6 m × 6 m × 2.5 m. Array’et modtager lyd fra b˚
ade en lydkilde
49
Simulering af delay-and-sum beamforming i MATLAB
samt refleksionskilder (grønne punkter). Absorptionskoefficienten α = 0.
Figur 7.40: Visualisering af 4×1 rektangulært mikrofon-array (rød), lydkilde (bl˚
a) og refleksionskilder (grøn).
Rummet har dimensionerne l × b × h = 6 m × 6 m × 2.5 m. Gennemsigtige bl˚
a overflader indikerer rummets
vægge.
Det resulterende beampattern fremg˚
ar af figur 7.41.
(a) Simulering uden refleksioner (uden rum).
(b) Simulering med refleksioner (med rum).
Figur 7.41: Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm hhv. med og
uden refleksioner, α = 0. Kilde placeret i retning 0◦ .
Tilstedeværelsen af vægge, gulv og loft i et efterklangsrum har en stor effekt p˚
a array’ets
50
Simulering af delay-and-sum beamforming i MATLAB
beampattern. Især ved 4 kHz, hvor sidelobes og mainlobes har byttet roller, og ved 2,5 kHz,
hvor der sker en opsplitning i mainlobet. Alene ved at rotere kilden omkring array’ets midte
30 grader f˚
as et helt anderledes resultat, hvilket blot indikerer, at array’ets beampattern i et
rum med lav absorption er meget følsomt overfor positionsændringer. Det skyldes f.eks. at en
flytning af lydkilden ogs˚
a genererer en flytning af refleksionskilderne, som giver anledning til
nye faseforskydninger af signalet i array’et, se figur 7.42.
(a) Simulering uden refleksioner (uden rum).
(b) Simulering med refleksioner (med rum).
Figur 7.42: Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9 cm hhv. med og
uden refleksioner, α = 0. Kilde placeret i retning 30◦ .
Lignende effekter opst˚
ar ogs˚
a n˚
ar kilden bevæges i andre dimensioner, f.eks. op/ned ad
z-aksen, eller hvis rummets dimensioner ændres.
Ved at ændre absorptionskoefficienten fra α = 0 til hhv. α = 0, 25, α = 0, 5, α = 0, 75
og α = 1, 0 f˚
as gradvist en mindre effekt af rummets tilstedeværelse, se figur 7.43. Array’ets
beampattern for 1 kHz g˚
ar fra at være ellipseformet ved lave absorptionskoefficienter til sit
oprindelige kardioidlignende beampattern. 2,5 kHz og 4 kHz oplever begge en forskydning
af deres mainlobes p˚
a op til ca. 30◦ ved lave absorptionskoefficienter, men normaliseres n˚
ar
α → 1, hvilket svarer til et ideelt lyddødt rum. P˚
a figur 7.43d er array’ets beampattern til
det, der f˚
as, n˚
ar rummet ekskluderes fra simuleringen.
51
Simulering af delay-and-sum beamforming i MATLAB
(a) α = 0, 25.
(b) α = 0, 5.
(c) α = 0, 75.
(d) α = 1, 0.
Figur 7.43: Undersøgelse af effekten af refleksioner i et rum med forskellige absorptionskoefficienter α.
Kilden er placeret i 30◦ . 4×1 rektangulært array med indbyrdes mikrofonafstande 3,9 cm.
7.7.8
Effekten af tilstedeværelse af ikke-korreleret støj
For at simulere tilstedeværelsen af støjkilder i nærheden af array’et, der udstr˚
aler lyd simultant, men ikke korreleret, med den egentlige lydkilde, vælges det at benytte samme placeringer som refleksionskilderne i forrige afsnit. Der simuleres hvid, Gaussisk støj til hver
støjkildeposition, og alle støjsignaler ankommer ikke-korrelerede til array’et.
Det viser sig ifølge simuleringen, at ikke-korreleret støj har lav eller ingen synlig effekt
p˚
a de resulterende beampatterns. Eftersom støjkilderne er placeret symmetrisk omkring array’et, kan de have tendens til at udslukke hinanden vha. destruktiv interferens. Hvis der kun
anvendes ´en støjkilde, kan den vise sig at f˚
a større, synlig indflydelse p˚
a array’ets beampattern.
S˚
alænge støjkildens styrke er sammenlignelig med den primære lydkilde er der alts˚
a lav
til ingen indflydelse. Men hvis støjkilden overdøver den primære lydkilde, vil denne blive
lokaliseret i stedet for den primære kilde.
52
Simulering af delay-and-sum beamforming i MATLAB
7.7.9
Simulering af array’ets følsomhed med og uden støj
Vha. de simulerede beampatterns, der har været fremtrædende indtil nu, kan man undersøge
et givet array’s evne til at lokalisere en lydkilde under forskellige omstændigheder. Kvalitetsbedømmelsen har best˚
aet i bl.a. de m˚
albare parametre mainlobe-bredde og sidelobe-niveau.
Udover lydlokalisering har mikrofon-array’et en anden væsentlig funktion, nemlig at undertrykke (filtrere) lyd, der kommer fra en anden retning end den valgte styringsretning. Beamformeren kan alts˚
a fungere som et rumligt (spatialt) filter. For at simulere denne funktion
sættes sensitivity = 1 i Beamforming FFT.m“. Styringsretningen reguleres ved at indta”
ste den ønskede retning til variablen w (f.eks. w = 90◦ ) og er s˚
aledes fastsat i modsætning til
tidligere, hvor den roterede en hel omgang i enhedscirklen.
Som den primære lydkilde, Sp , vælges en 1 kHz-sinustone. Lydkilden kan placeres valgfrit
ved at angive en radial afstand fra array’ets centrum og en vinkel i forhold til array’ets
længdeakse. I de følgende simuleringer er Sp placeret 4 meter fra array’ets centrum i en vinkel
p˚
a 0◦ . Array’et er et 1 × 4 linje-array med indbyrdes mikrofonafstand 3,9 cm.
Af figur 7.44 fremg˚
ar det simulerede lydkildesignal (1 kHz-sinustone) i hhv. tids- og fre11
kvensdomæne.
Figur 7.44: Visualisering af lydkildesignal (f = 1000 Hz) i hhv. tids- og frekvensdomæne.
N˚
ar styringsretningen vælges til netop den vinkel, hvori lydkilden er placeret (w= 0◦ , f˚
as
et beamforming-output, der vidner om en forstærkning p˚
a 4 i forhold til lydkildens signal
(4 svarer til antal mikrofoner), s˚
aledes er array’ets mainlobe nu centreret omkring lydkildens
retning, se figur 7.45.
11
Bemærk, at frekvensspektrummet ogs˚
a indeholder komposanter lidt over og under grundfrekvensen, hvilket
kan forklares ved at der bruges et relativt kort signal m˚
alt i bølgelængder, og at signalet stopper aperiodisk
(dvs. ikke efter et helt antal bølgelængder).
53
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.45: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde
(f = 1000 Hz) placeret i 0◦ .
I tidsdomænet er signalet naturligvis et stykke tid om at n˚
a fra lydkilden til mikrofonarray’et. Derfor er signalet tidsforsinket med ca. 0,012 sekunder. 1 kHz-signalet er fordoblet
i frekvensdomænet og firedoblet i tidsdomænet i forhold til input-signalet. Selve spektrets
features er en anelse bredere end det oprindelige p˚
a figur 7.44. Dette kan evt. undersøges i
fremtidigt arbejde. N˚
ar styringsretningen flyttes væk fra den primære lydkilde, f.eks. w= 180◦ ,
dæmpes input-signalet med en faktor ≈2,4 (fra 1 til 0,41). Den teoretisk maksimale forstærkning fra array’et er lig med antallet af mikrofoner (=4 i dette tilfælde). I retningen w= 180◦ er
amplituden 0,41, hvilket giver en forstærkning p˚
a ca. 1/10, eller kvadreret 1/100, i forhold til
◦
retningen w= 0 . Dvs., at støjreduktionen kan bestemmes til AdB = 10 · log10 (1/100) = −20
dB, se figur 7.46. Dette er i overensstemmelse med de fundne beampatterns for det nærværende mikrofon-array.
Figur 7.46: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 180◦ . Primær lydkilde
(f = 1000 Hz) placeret i 0◦ .
Udover den primære lydkilde introduceres nu en støjkilde, placeret arbitrært ligesom den
54
Simulering af delay-and-sum beamforming i MATLAB
primære lydkilde. I dette eksempel placeres støjkilden i retningen 250◦ i en afstand af 4 meter.
Støjkilden producerer en 2,5 kHz sinustone med samme amplitude som den primære lydkilde.
Det giver et input-SNR p˚
a SNRi = 0 dB. Det samlede signal, som mikrofon-array’et modtager
er vist p˚
a figur 7.47a for mikrofon #1 og #4 (hhv. mest til venstre og højre i linje-array).
(a) Mikrofonsignaler i tidsdomæne.
(b) Frekvensindhold i ubehandlede mikrofonsignaler.
Figur 7.47: Modtagede mikrofonsignaler n˚
ar b˚
ade primær lydkilde (1 kHz-sinustone) og støjkilde er til stede
for mikrofon #1 og #4. Støjkilde: 2,5 kHz-sinustone. Lydkilde placeret i 0◦ , støjkilde placeret i 250◦ .
N˚
ar styringsretningen vælges til w= 0◦ , dvs. mod den primære lydkilde, f˚
as et beamformingoutput, der er væsentligt mindre støjfyldt end indgangssignalet p˚
a figur 7.47a, se figur 7.48.
55
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.48: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (1
kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 250◦ .
Beamforming-outputtet leverer et output-SNR p˚
a SNRo = 20 · log10 (2 · 0, 2) = 20 dB. 2,5
kHz-sinustonen er næsten filtreret fra signalet, men der er stadig sm˚
a synlige effekter tilbage
fra støjforureningen. N˚
ar støjkilden antages at være placeret tættere p˚
a den primære lydkilde,
f.eks. i 20◦ , har array’et sværere ved at filtrere signalet, og resultatet bliver et mere støjfyldt
beamforming-output, se figur 7.49.
Figur 7.49: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde (1
kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ .
Output-SNR er nu væsentligt lavere, mere præcist SNRo = 20 · log10 (2 · 1, 1) ≈ 5, 2 dB.
Beamformingen er i dette tilfælde udført ved frekvensen f = 1 kHz, hvilket har betydning
for array’ets selektivitet (mainlobe-bredde). Hvis den primære lydkildes frekvens ændres til
f = 4 kHz, forventes det, at støjkilden undertrykkes i højere grad end i figur 7.49 pga. en
større selektivitet ved denne frekvens.
56
Simulering af delay-and-sum beamforming i MATLAB
Figur 7.50: Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ . Primær lydkilde
placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ . Primær lydkilde: 4 kHz-sinustone.
Resultatet p˚
a figur 7.50 bekræfter, at mainlobe-bredden er blevet mindre ved 4 kHz
sammenlignet med 1 kHz foretaget i de forrige simuleringer. Der f˚
as nu et output-SNR p˚
a
SNRo = 20 · log10 (2 · 0, 5) ≈ 12 dB. Det skal bemærkes, at følsomhedskarakteristikkerne i
dette afsnit tager udgangspunkt i et 1×4-array, hvilket har en ringere lokaliseringsnøjagtighed
end arrays med større antal mikrofoner og dimensioner.
Styringsretning
w=0◦
w=0◦
w=0◦
Kildeposition
0◦
0◦
0◦
Kildefrekvens
1000 Hz
1000 Hz
4000 Hz
Støjposition
250◦
20◦
20◦
Støjfrekvens
2500 Hz
2500 Hz
2500 Hz
SNRo
20 dB
5,2 dB
12 dB
Tabel 7.3: SNR-resultater for 1×4-array.
7.8
Delkonklusion
I de foreg˚
aende afsnit er forskellige array-typer blevet undersøgt i forbindelse med beamformingteknikken delay-and-sum. Afhængigt af mikrofon-array’ets form˚
al og applikationsomr˚
ade kan
der med fordel anvendes forskellige array-geometrier, f.eks. rektangulære og cirkulære. Denne rapport dokumenterer overvejende undersøgelser for simple, todimensionelle, rektangulære
geometrier og forskellige typer cirkulære geometrier, herunder ´encirkel, flercirkel, logaritmiske,
ækvidistante og tilfældige arrays.
Et specialtilfælde af de rektangulære arrays er et uniformt, lineært array (ULA), der
konstrueres langs ´en længdeakse. Et s˚
adant array kan ogs˚
a undersøges analytisk, men det
◦
har den væsentlige ulempe, at det producerer store 180 -sidelobes (benævnt spøgelseskilder)
ved særlige kildepositioner. Dette kan løses ved at indføre flere rækker og/eller kolonner, s˚
a
array’et kan forst˚
as som en todimensionel matrice. Hvis systemets beampattern skal opn˚
a en
stor b˚
andbredde (dvs. have god lokaliseringsnøjagtighed over et stort frekvensomr˚
ade), er det
nødvendigt at finjustere de enkelte mikrofonafstande i det rektangulære array. Et rektangulært
array, der opfylder dette krav, er eksempelvis et 4×6-array med indbyrdes mikrofonafstande
p˚
a 6 cm i rækkeplan og 4 cm i kolonneplan.
Det mest simple cirkulære array man kan forestille sig best˚
ar af et antal mikrofoner placeret p˚
a periferien af en cirkel med en given radius. I undersøgelserne af denne array-type
57
Simulering af delay-and-sum beamforming i MATLAB
ses det ligeledes, at array’ets totale fysiske størrelse har indflydelse p˚
a array’ets lavfrekvente beampattern; generelt f˚
as en bedre lokaliseringsnøjagtighed, n˚
ar array’et gøres større. De
højfrekvente egenskaber er dog stadig afhængige af de enkelte mikrofonafstande, hvilket hænger sammen med bølgelængden. For et tilsvarende antal mikrofoner som i de rektangulære,
f˚
as et meget tilsvarende beampattern. Et cirkulært array kan ogs˚
a best˚
a af flere koncentriske
cirkler enten med en mikrofonfordeling, der placerer lige mange mikrofoner i hver cirkel eller
med en fordeling, der placerer alle mikrofoner med samme indbyrdes afstand (ækvidistant).
Sidstnævnte har ikke vist sig at have en væsentlig bedre ydeevne end ordinært cirkulære, men
ved at indføre flere koncentriske cirkler, kan b˚
andbredden af systemet øges.
Det er blevet vist, at n˚
ar den indbyrdes mikrofonafstand stiger (med konstant antal mikrofoner), forbedres lokaliseringsnøjagtigheden. Sammenhængen er ikke lineær, snarere eksponentiel. Antallet af mikrofoner har ikke udvist nogen tydelig indflydelse p˚
a mainlobe-bredden, men
har sandsynligvis en effekt p˚
a størrelsen af sidelobe-niveauer. Generelt er sidelobe-mængden
og -niveauer i høj grad et produkt af en given applikation med givne parametre (kildeposition,
frekvens, mikrofonafstande etc.).
I simuleringerne reguleres array’ets styringsretning kun rundt i array’ets plan (xy-planen)
og har derfor ikke et tredimensionelt beampattern. Dette kan evt. udvikles i fremtidigt arbejde. Selvom de forskellige arrays 3D-beampattern ikke er fastlagt, er det blevet konkluderet,
at 2D-beampattern varierer med lydkildens højde.
For at modellere mere realistiske forhold, er der bl.a. blevet undersøgt effekten af mikrofonernes iboende fasefejl, refleksioner fra vægge, gulv og loft i et rum samt ikke-korreleret
støj. Mikrofonernes fasefejl viser sig at have lille betydning for det lavfrekvente (1000 Hz)
beampattern og større betydning for det højfrekvente (4000 Hz) beampattern. Dette hænger
sammen med, at en fasefejl kan sammenlignes med en lille randomiseret forskydning af mikrofonernes placeringer, hvilket har størst indvirkning for høje frekvenser (= lille bølgelængde).
Generelt kræver det store fasefejl at levere en synlig negativ effekt p˚
a array’ets beampattern.
Det er ogs˚
a vist, at en randomiseret fejlplacering af mikrofonerne kan give anledning til fasefejl. F.eks. vil en positionsusikkerhed p˚
a 0,5 cm for˚
arsage en fasedrejning p˚
a ca. 20◦ ved 4000
Hz, hvilket giver synlige effekter p˚
a det resulterende beampattern.
Der er en forventning om, at refleksioner for˚
arsaget af et rums vægge, gulv og loft kunne
give anledning til fejlbehæftede beampatterns. N˚
ar korreleret lyd ankommer p˚
a senere tidspunkter end det direkte lydfelt, kan array’et sandsynligvis styre imod refleksionen i stedet for
den sande lydkildeposition. Simuleringer viser ogs˚
a, at der opst˚
ar store sidelobes, i retninger
af refleksionskilderne. Array’ets eksakte beampattern afhænger naturligvis af b˚
ade array’ets
og lydkildens position i rummet, rummets dimensioner samt rummets efterklangsegenskaber,
f.eks. absorptionsgrad.
Ifølge simuleringer har tilstedeværelsen af hvid Gaussisk støj ingen synlig effekt p˚
a array’ets beampattern s˚
afremt støjkildens styrke ikke er meget større end lydkildens, hvilket er
i overensstemmelse med forventningerne.
Slutteligt foretages simuleringer af følsomhedskarakteristikker med konkrete signaleksempler b˚
ade med og uden støj. Signalkvaliteten kan i begge tilfælde bevares, og med støj til stede
kan der opn˚
as et output-SNR p˚
a ca. 20 dB.
Fremtidige udvidelsesmuligheder, der kan indtænkes i simuleringsalgoritmen, omfatter
f.eks. skyggeeffekter og diffraktion blandt mikrofoner, beamforming i 3D, implementering
af 3D-arrays (f.eks. sfæriske) og m˚
aling af et systems opløsning (skelnen mellem to tætplacerede lydkilder). Derudover evt. indføring af m˚
albare ydeevneparametre som alternativ til
58
Simulering af delay-and-sum beamforming i MATLAB
mainlobe-bredde og sidelobe-niveau.
I simuleringen af det akustiske array og dets beampattern, er overholdelse af samplingsætningen (fs > 2fmax ) ikke et problem, fordi alle simulerede mikrofonsignaler kan genereres
med en opløsning, der er langt større end den ofte anvendte fs = 44100 Hz inden for akustik. I
m˚
alingerne, dokumenteret i kapitel 9, giver sampling-frekvensen heller ikke anledning til problemer, fordi der maksimalt samples p˚
a fire mikrofoner ad gangen med et USB-modul, der kan
sample fire kanaler med hver 44100 Hz. Hvis der i praksis konstrueres et akustisk array med
mange mikrofoner ( 4), er det pludseligt nødvendigt at have adgang til dataopsamplingsudstyr, der kan sample et stort antal mikrofoner p˚
a samme tid. Evt. skal det overvejes, hvorvidt
sampling-frekvensen kan reduceres for at spare p˚
a processorressourcer. En s˚
adan undersøgelse
kan være fokusomr˚
adet i fremtidige studier.
59
Laboratoriepraksis
8
Laboratoriepraksis
8.1
M˚
alekonstruktion
Til m˚
aling af mikrofon-array’ets ydeevne i praksis, anvendes en træplade (MDF), hvor der er
konstrueret et drejebord i pladens centrum som vist p˚
a figur 8.1.
Figur 8.1: Træplade, der repræsenterer et mødebord, med et drejebord, hvor mikrofonerne placeres.
Pladen skal repræsenterer et mødebord, og den m˚
aler 122 cm × 147 cm. Drejebordet i
pladens centrum er en cirkel med en radius p˚
a 22 cm, og det er her mikrofonerne skal placeres.
Form˚
alet med drejebordet er at kunne simulere et array med flere mikrofoner end det antal,
der er tilgængelige, dvs. fire. Dette kan gøres ved at placere mikrofonerne p˚
a en lige linje radialt
p˚
a drejebordet og rotere cirklen et bestemt antal grader afhængigt af antallet af mikrofoner i
array’et. Figur 8.1 viser fire mikrofoner, der er placeret ækvidistant og radialt p˚
a drejebordet.
P˚
a figuren ses det, at der ogs˚
a er lavet huller til et array, der indeholder tre ækvidistant og
radialt placerede mikrofoner.
M˚
alingerne foretages alts˚
a for ´en række mikrofoner ad gangen, og mikrofonsignalerne for
hver position lagres. N˚
ar m˚
alingerne med det valgte antal mikrofoner er blevet udført, laves
der delay-and-sum beamforming p˚
a alle mikrofonsignalerne for at opn˚
a beampattern for det
valgte array.
Hvis det ønskes at have en centermikrofon i array’et, skal denne mikrofon placeres som den
eneste, mens hullerne til de andre mikrofoner i drejebordet er fyldt ud. Der laves ´en m˚
aling
med denne centermikrofon, hvorefter den fjernes, og de andre mikrofoner placeres som nævnt
ovenfor. Centermikrofonen ønskes ikke som en del af hver m˚
aling, da den teoretisk opn˚
ar
samme resultat ved hver m˚
aling. Dette er muligvis ikke tilfældet i praksis, hvis drejebordets
centrum ikke er fastholdt under rotation.
Generelt skal alle huller i drejebordet fyldes ud, hvis de ikke anvendes til de p˚
agældende
m˚
alinger. Fyldes hullerne ikke ud, er der risiko for, at de kan for˚
arsage afvigelser fra det
ønskede lydfelt. Der kan opst˚
a refleksioner eller diffraktion, som kan p˚
avirke array’ets AOAE.
Det kan ses p˚
a figur 8.1, at de ubenyttede huller i drejebordet er fyldt ud med klæbemasse.
N˚
ar drejebordet roteres er det vigtigt, at det roteres omkring dets centrum, som ikke
m˚
a flytte sig under rotationen. Centrum af drejebordet skal anvendes som reference, og denne
position m˚
a ikke ændres, da det vides fra simuleringerne (jf. afsnit 7.6.1), at positionsændringer
p˚
a f˚
a millimeter kan give array’et en helt anden følsomhed.
Figur 8.2 viser opstillingen med bordplade, drejebord, mikrofoner og lydkilde i et lyddødt
rum. Det er kun den øverste højtaler, der benyttes til m˚
alingerne. Den st˚
ar placeret oven p˚
a
en gulvhøjtaler for at f˚
a den i niveau med mikrofon-arrayet.
60
Laboratoriepraksis
Figur 8.2: Opstilling i et lyddødt rum med bordplade, drejebord, mikrofoner og lydkilde.
8.2
Apparater og udstyr
Følgende udstyr og software benyttes til laboratoriem˚
alingerne:
ˆ 4 stk. Br¨
uel & Kjær array-mikrofoner 1/4”, type 4958 [3]
ˆ Digitalt 5-kanals signalopsamlingsmodul fra National Instruments, type USB-4431 [4]
ˆ Data Acquisition Toolbox i MATLAB
ˆ Drejebord til montering af mikrofoner
ˆ Dali 2A højtaler. Impedans 8 Ω, effekt 10-60 W, følsomhed 89 dB/Wm
ˆ Br¨
uel & Kjær Power Amplifier, type 2706
Array-mikrofonernes indre relatve fasefejl (phase-matching) er i producentens datablad[3]
angivet som følgende: < ±3◦ fra 100 Hz til 3 kHz, < ±5◦ fra 50 Hz til 5 kHz og < ±10◦ fra 5
kHz til 10 kHz.
8.3
Synkronisering af afspilning og optagelse
Det er vigtigt, at afspilningen af kildesignalet og optagelserne fra mikrofonerne er synkroniserede, s˚
a de starter p˚
a samme tid ved hver m˚
aling. Dette er vigtigt, da drejebordets funktion
er at simulere et array med flere mikrofoner end det tilgængelige antal, og hver m˚
alinger skal
derfor være synkroniseret, s˚
a det svarer til, at der kun er lavet ´en m˚
aling med et fuldt array.
Er de ikke synkroniseret, kan det ikke vides, om kildesignalets fase er den samme ved hver
m˚
aling, og det kan skabe problemer, n˚
ar der laves beamforming, som helt afhænger af faseforskelle mellem mikrofonerne.
For at sikre denne synkronisering, sendes kildesignalet til højtaleren via USB-modulets udgang, da udgangen er synkroniseret med de fire indgange, som bruges til mikrofonerne.
8.4
Fremgangsm˚
ade
Det ønskede antal array-mikrofoner monteres i drejebordets huller for den ønskede arraygeometri. Mikrofonerne fastgøres med klæbemasse p˚
a undersiden af drejebordet, som det vises
p˚
a figur 8.3, hvor der ogs˚
a ses en fastmonteret aksel, der sørger for, at drejebordets centrum
61
Laboratoriepraksis
fastholdes under rotationerne. Mikrofonerne placeres i hullerne s˚
aledes, at membranen og
beskyttelsesgitteret er igennem hullerne og synlige p˚
a bordets overflade. Dette vises p˚
a figur
8.4.
Figur 8.3: Montering af mikrofoner med klæbemasse p˚
a undersiden af drejebordet. Her ses ogs˚
a en fastmonteret aksel, der fastholder drejebordets centrum
under rotation.
Figur 8.4: Mikrofoner monteret i drejebord, s˚
a deres
membraner og beskyttelsesgitre er synlige p˚
a oversiden.
Hver mikrofon forbindes til sin hver sin indgang i USB-modulet fra National Instruments
med et SMB-til-BNC-stik. Højtaleren, der anvendes som lydkilde, placeres p˚
a den ønskede
position i forhold til array’et.
I MATLAB-programmet ”ArrayConfiguration.m”opsættes den ønskede array-geometri,
inkl. antallet af mikrofoner og lydkildens position. Herefter foretages en m˚
aling, og mikrofonsignalerne samples af USB-modulet. Vha. Data Acquisition Toolbox i MATLAB og MATLABprogrammet measure.m“ kan mikrofonsignalerne opsamles, og der kan laves beamforming
”
vha. programmet Beamforming FFT.m“. Hvis array’et maksimalt indeholder fire mikrofo”
ner, er det ikke nødvendigt at rotere drejebordet, og der skal kun foretages denne ene m˚
aling.
Hvis array’et derimod indeholder mere end de fire tilgængelige mikrofoner, skal drejebordet
roteres efter m˚
alingen. Efter rotationen foretages en ny m˚
aling, og dette fortsætter, indtil det
ønskede antal mikrofoner er opn˚
aet.
62
Undersøgelse af array’ets beampattern og følsomhed
9
Undersøgelse af array’ets beampattern og følsomhed
Det vil nu blive undersøgt, om de simulerede beampatterns er mulige at opn˚
a ved praktiske
m˚
alinger, og dette undersøges ved at foretage m˚
alinger i et lyddødt rum. M˚
alinger i et lyddødt
rum foreg˚
ar stort set uden efterklang (ned til ca. 100 Hz-omr˚
adet i det lyddøde rum p˚
a det
Tekniske Fakultet, SDU).
9.1
Undersøgelse af rektangulære geometrier
Et simpelt system med fire mikrofoner testes for at se, om kilden kan lokaliseres med s˚
a f˚
a
mikrofoner og for at sammenligne med resultater fra simuleringer s˚
avel som den analytiske
udledning. Figur 9.1 viser beampatterns for et 1×4 array, hvor mikrofonernes indbyrdes afstand er 3,9 cm. Kilden er placeret i 0◦ , hvilket betyder, at den er placeret p˚
a samme akse,
som mikrofonerne ligger p˚
a, og den udsender hvid støj. Figur 9.1a viser simulerede beampatterns for det p˚
agældende array, mens figur 9.1b viser beampatterns, der er m˚
alt i praksis i et
lyddødt rum.
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.1: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 0◦ og
udsender hvid støj.
Som det kan ses p˚
a figur 9.1, ligner de simulerede og m˚
alte beampatterns til forveksling
hinanden. Den største forskel mellem simulering og praksis findes ved 4000 Hz, hvor m˚
alingen
viser et mindre sidelobe end simuleringen men et breddere mainlobe. Kildens afstand og
retning i forhold til array’et undersøges nærmere i afsnit 9.3.
1×4 array’et, som er beskrevet ovenfor, er ogs˚
a testet med tre rene toner, 1000 Hz, 2500
Hz og 4000 Hz, og figur 9.2 viser de m˚
alte beampatterns for et kildesignal p˚
a 1000 Hz. Her er
det m˚
alte beampattern for 1000 Hz helt magen til det, der ses p˚
a figur 9.1b for 1000 Hz, hvor
kilden udsender hvid støj.
63
Undersøgelse af array’ets beampattern og følsomhed
Figur 9.2: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 0◦ og
udsender en tone p˚
a 1000 Hz. M˚
alingerne er foretaget i lyddødt rum.
De m˚
alte beampatterns p˚
a figur 9.2 for 2500 Hz og 4000 Hz ligner et mere tilfældigt
respons, hvilket er som forventet, da beamformingen laves vha. FFT, hvor der udvælges ´en
frekvens. Hvis denne ene frekvens ikke er repræsenteret i kildesignalet, bør array’ets beampattern for den frekvens være nul. Det output, der alligevel opst˚
ar ved disse to frekvenser, kan
skyldes et urent signal, ekstern støj eller fejl knyttet til FFT-algoritmen. Ydermere er de polære plots normerede, s˚
a de altid har maksimumværdien 1, og dermed kan signalstyrkerne
ved de forskellige ikke sammenlignes. Signalstyrken er højst sandsynligt lavere ved 2500 Hz og
4000 Hz end ved 1000 Hz. Ved at lade lydkilden udstr˚
ale hvid støj, f˚
as et signal, der indeholder
alle frekvenser med lige stor energi, og derfor kan der laves beamforming i frekvensdomænet
for flere frekvenser p˚
a samme signal. Fremadrettet vil der blive anvendt hvid støj i m˚
alingerne.
Der ses igen p˚
a et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Nu er kilden
dog placeret i 267◦12 , som betyder, at lydens indfaldsvinkel er tilnærmelsesvist vinkelret p˚
a mikrofonernes akse. Figur 9.3a viser de simulerede beampatterns, mens 9.3b viser beampatterns
for de praktiske m˚
alinger.
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.3: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 267◦
og udsender hvid støj.
Da der kun er ´en række mikrofoner, kan beamformeren ikke bestemme, hvilken side af
rækken lydkilden befinder sig p˚
a, og der opst˚
ar spøgelseskilder. Spøgelseskilderne optræder
Højtaleren er placeret ved 270◦ ift. drejebordets centrum og array’ets længdeakse, men array’et er ikke
centreret herom. Se figur 8.1
12
64
Undersøgelse af array’ets beampattern og følsomhed
som en spejling i mikrofonrækken, og det skyldes, at der ikke er nogle bagvedliggende mikrofoner til at skabe destruktiv interferens. Mikrofonsignalerne vil have samme faseforskelle p˚
a
begge sider af mikrofonrækken, og det ser derfor ud til, at der er en kilde p˚
a begge sider af
rækken.
Ved at anvende to mikrofonrækker kan disse spøgelseskilder elimineres, da den bagvedliggende række kan bidrage til destruktiv interferens. Afstanden mellem de to rækker er 10 cm,
mens afstanden mellem kolonnerne stadig er 3,9 cm. Beampatterns for dette 2×4 array, hvor
kilden er placeret i 270◦ , vises p˚
a figur 9.4.
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.4: Beampatterns for 2×4 array med kolonneafstand p˚
a 3,9 cm og en rækkeafstand p˚
a 10 cm. Kilden
er placeret i 270◦ og udsender hvid støj.
Her ses det, at spøgelseskilderne er forsvundet, og der er dermed næsten ikke nogle sidelobes. Der er kun et lille sidelobe i 90◦ ved 4000 Hz med et niveau p˚
a 0,2.
N˚
ar kilden placeres i 0◦ , bliver de simulerede og m˚
alte beampatterns meget lig dem for 1×4
array’et, men mainlobet er blevet en del smallere, se tabel 9.1
Array
1×4
2×4
1000 Hz
131◦
62◦
2500 Hz
87◦
25◦
4000 Hz
71◦
16◦
Tabel 9.1: Mainlobe-bredder for hhv. 1 × 4- og 2 × 4-array n˚
ar lydkilde er placeret i 0◦ .
Ved 4000 Hz opst˚
ar der nogle sm˚
a sidelobes i 45◦ og 315◦ med et niveau p˚
a ca. 0,4.
◦
N˚
ar kilden placeres i 45 er der dog stadig nogle sidelobes, som minder om spøgelseskilderne
fra 1×4 array’et. Dette vises p˚
a figur 9.5. Ved 2500 Hz eksisterer der et sidelobe ved ca. 315◦
med et niveau p˚
a 1, og ved 4000 Hz eksisterer to sidelobes med niveauer p˚
a hhv. 0,6 og 0,3.
Disse sidelobes kan minimeres ved at indføre flere rækker af mikrofoner og justere p˚
a afstanden
mellem rækkerne og kolonnerne. Der er ikke foretaget m˚
alinger af større rektangulære arrays
pga. plads- og tidsbegrænsninger, men der henvises simuleringsresultaterne i afsnit 7.7.1.
65
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.5: Beampatterns for 2×4 array med indbyrdes mikrofonafstand i hver række p˚
a 3,9 cm og afstand
mellem rækkerne p˚
a 10 cm. Kilden er placeret i 45◦ og udsender hvid støj.
9.2
Undersøgelse af cirkulære geometrier
Figur 9.6 viser simulerede og m˚
alte beampatterns for et cirkulært array med 8 mikrofoner i ´en
cirkel, der har radius r = 3, 9 cm. Kilden befinder sig i 0◦ . Det ses, at de m˚
alte beampatterns
p˚
a figur 9.6b næsten er identiske med de simulerede beampatterns p˚
a figur 9.6a. Der opst˚
ar
kun sm˚
a sidelobes ved 2500 Hz og 4000 Hz. Ved 1000 Hz er mainlobet breddere og mere
omnidirektionelt, hvilket kan skyldes array’ets relativt lille radius. Det m˚
alte beampattern
har en fejlbehæftet AOAE, som kan tilskrives en menneskelig fejlplacering af lydkilden.
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.6: Beampatterns for cirkulært array med 8 mikrofoner i ´en cirkel og radius r = 3, 9 cm. Kilden er
placeret i 0◦ og udsender hvid støj.
Geometrier med radius p˚
a r = 7, 8 cm, r = 11, 7 cm og r = 15, 5 cm er ogs˚
a undersøgt,
66
Undersøgelse af array’ets beampattern og følsomhed
men disse beampatterns indeholder b˚
ade flere og større sidelobes, der i flere tilfælde er næsten
lige s˚
a store som mainlobet. Geometrierne er undersøgt med b˚
ade 4 og 8 mikrofoner, og det
viser sig, at 8 mikrofoner med radius p˚
a r = 3, 9 cm giver de bedste beampatterns med henblik
p˚
a at lokalisere kilden.
Det undersøges nu, om 16 mikrofoner i ´en cirkel egner sig bedre til at lokalisere kilden end
array’et med 8 mikrofoner. Her vurderes det, at en radius p˚
a r = 3, 9 cm er for lille, da det vil
medføre indbyrdes mikrofonafstande p˚
a ca. 1,5 cm, hvilket i praksis er svært at konstruere og
desuden kan give anledning til unøjagtige, højfrekvente beampatterns. En radius p˚
a r = 15, 5
cm vælges i stedet, da gode simuleringer er opn˚
aet med denne radius. Dette giver indbyrdes
mikrofonafstande p˚
a ca. 6 cm. Figur 9.7 viser dette array med kilden placeret i 0◦ .
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.7: Beampatterns for cirkulært array med 16 mikrofoner i ´en cirkel og radius r = 15, 5 cm. Kilden er
placeret i 0◦ og udsender hvid støj.
Sammenlignet med det forrige array med 8 mikrofoner giver dette array væsentligt smallere
mainlobes ved de forskellige frekvenser, og dette m˚
a bl.a. skyldes den forøgede array-radius,
se tabel 9.2. Bemærk den særligt høje lokaliserigsnøjagtighed ved 4000 Hz for array’et med
16 mikrofoner. Ved 4000 Hz optræder desuden et sidelobe med et niveau p˚
a ca. 0,25 i 180◦ retningen.
Cirkulært array
8 mikrofoner, r = 3, 9 cm
16 mikrofoner, r = 15, 5 cm
1000 Hz
121◦
30◦
2500 Hz
46◦
14◦
4000 Hz
29◦
9◦
Tabel 9.2: Mainlobe-bredder for cirkulære arrays med ´en cirkel og hhv. 8 mikrofoner (r = 3, 9 cm) og 16
mikrofoner (r = 15, 5 cm). Lydkilde er placeret i 0◦ .
Det undersøges, hvordan array’ets beampatterns bliver, n˚
ar der anvendes 16 mikrofoner i
to cirkler. Figur 9.8 og 9.9 viser simulerede og m˚
alte beampatterns for s˚
adanne arrays, hvor
den yderste cirkel har en radius p˚
a henholdsvis r = 15, 5 cm og r = 7, 8 cm. Kilden befinder
sig i begge tilfælde i 0◦ .
67
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.8: Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius r = 15, 5 cm. Kilden er
placeret i 0◦ og udsender hvid støj.
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.9: Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius r = 7, 8 cm. Kilden er
placeret i 0◦ og udsender hvid støj.
Ved sammenligning af figur 9.8 og 9.9 ses det, at begge arrays lokaliserer kilden med
maksimale sidelobe-niveauer p˚
a 0,25. Array’et med radius p˚
a r = 15, 5 cm har de smalleste
mainlobes, men har til gengæld flere sidelobes ved 4000 Hz end array’et med radius r = 7, 8
cm. Det ser ud til, at mainlobe-bredden er afhængig af array’ets radius, og den bliver smallere,
n˚
ar radius øges. Det m˚
a i det enkelte praktiske tilfælde være et kompromis mellem mainlobebredde og samlet array-størrelse. F.eks. har array’et en passende lille radius p˚
a r = 7, 8 cm til
◦
et konferencesystem og samtidig en mainlobe-bredde p˚
a 31 ved 2500 Hz.
De 16 mikrofoner kan ogs˚
a fordeles i fire cirkler, og beampatterns for dette er vist p˚
a figur
9.8. Her har den yderste cirkel en radius p˚
a r = 15, 5 cm, og kilden befinder sig stadig i 0◦ .
68
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.10: Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden
er placeret i 0◦ og udsender hvid støj.
Der opst˚
ar sidelobes ved 4000 Hz i 180◦ -retningen, ligesom ved ´en cirkel, med et niveau p˚
a
0,25, mens de sidelobes, der eksisterede for det cirkulære array med to cirkler, er elimineret.
Array’et giver, ligesom tidligere, smalle mainlobes (43◦ , 19◦ , 13◦ ), og sammenlignet med figur
9.8 er der ikke nævneværdige ændringer ved at benytte fire cirkler frem for to, n˚
ar radius
fastholdes. Det er ikke de samme sidelobes, der optræder for de to arrays, men størrelserne af
dem er næsten ens ligesom størrelserne af mainlobe-bredderne.
Cirkulære arrays med 24 og 32 mikrofoner i fire cirkler med radius r = 15, 5 cm er ogs˚
a
undersøgt, og det viser sig at give ens resultater. Beampatterns for array’et med 24 mikrofoner
ses p˚
a figur 9.11, og kildens position er uændret.
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.11: Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden
er placeret i 0◦ og udsender hvid støj.
69
Undersøgelse af array’ets beampattern og følsomhed
I forhold til array’et med 16 mikrofoner er der ikke nævneværdige fordele ved at bruge 24
mikrofoner. De sm˚
a sidelobes i 180◦ -retningen, der optr˚
adte for 16 mikrofoner, forsvinder her,
men lokaliseringsnøjagtighederne er ens. Det ses derfor ikke, at det er nødvendigt at tilføre de
ekstra 8 mikrofoner.
9.2.1
Effekten af mikrofonantal og array-radius
Med udgangspunkt i et array best˚
aende af ´en cirkel undersøges det, hvordan mainlobe-bredden
og størrelsen af sidelobes afhænger af antal mikrofoner samt array’ets radius. Størrelsen p˚
a et
sidelobe kaldes her for et sidelobe-niveau, og et sidelobe-niveau p˚
a 1 betyder, at det er lige s˚
a
stort som mainlobet. Figur 9.12 viser mainlobe-bredde og sidelobe-niveau for enkelte cirkler
med radius r = 3, 9 cm, r = 7, 8 cm, r = 11, 7 cm og r = 15, 5 cm. Antallet af mikrofoner i
den enkelte cirkel varieres fra 4 til 18.
(a) Mainlobe-bredde for 1000 Hz.
(b) Sidelobe-niveau for 1000 Hz.
(c) Mainlobe-bredde for 2500 Hz.
(d) Sidelobe-niveau for 2500 Hz.
(e) Mainlobe-bredde for 4000 Hz.
(f ) Sidelobe-niveau for 4000 Hz.
Figur 9.12: Mainlobe-bredde og sidelobe-niveau som funktion af antal mikrofoner. M˚
alingerne er foretaget
for fire forskellige cirkler med radius r = 3, 9 cm, r = 7, 8 cm, r = 11, 7 cm og r = 15, 5 cm.
Ud fra de ovenst˚
aende figurer ser det ud til, at mainlobe-bredden ikke afhænger af antallet
af mikrofoner, men af array’ets radius, som det er set p˚
a tidligere beampatterns. N˚
ar array’ets
radius øges, mindskes mainlobe-bredden, hvilket er forventeligt, da en større radius giver større
afstand mellem mikrofonerne og dermed ogs˚
a en større faseforskel mellem indbyrdes mikrofoner. En interessant observation er, at arrays, der har stor lokaliseringsnøjagtighed (f.eks.
r = 15, 5 cm), har store sidelobe-niveauer. Der er tegn p˚
a, at disse to parametre er afhængige.
S˚
aledes er udviklingen af et array typisk et kompromis mellem lokaliseringsnøjagtighed og
eliminering af fejlestimeringer af lydkildens retning.
Sidelobe-niveauerne mindskes, n˚
ar der anvendes flere mikrofoner. Generelt forekommer der
store sidelobes, n˚
ar færre end ti mikrofoner anvendes, og generelt er de mindst ved 1000 Hz.
Da bølgelængden ved 1000 Hz er længere end ved 2500 Hz og 4000 Hz er array’et mindre
70
Undersøgelse af array’ets beampattern og følsomhed
følsomt over for sm˚
a ændringer i mikrofonernes placering, og der opst˚
ar færre og mindre sidelobes ved 1000 Hz (jf. afsnit 7.6.1). Ved højere frekvenser er array’et derfor mere afhængigt af
nogle bestemte afstande mellem mikrofonerne for at mindske sidelobes. Ved lavere frekvenser
har den indbyrdes mikrofonafstand ikke helt s˚
a stor betydning, og her er det nærmere hele
array-størrelsen, der har betydning.
9.3
Effekten af kildens afstand og retning i forhold til array’et
Figur 9.13 viser beampatterns for et rektangulært 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Her er kilden placeret 26 cm fra drejebordets centrum (se figur 8.1) ved vinkel
0◦ . I simuleringen er kilden placeret 17 cm over array’et, da dette svarer til en gennemsnitlig
højde for de to enheder i højtaleren. Figur 9.13b viser en voldsom opsplitning af mainlobet
ved 4000 Hz, og det ses, at den er væsentligt større i praksis end i simuleringen p˚
a figur 9.13a.
Denne større opsplitning, der forekommer i praksis, kan skyldes, at kilden ikke er en punktkilde. Det er en højtaler, der har en bas/mellemtone-enhed og en diskantenhed, hvor diskanten
sidder 14 cm højere end bassen/mellemtonen. Der gøres opmærksom p˚
a, at højtalerens (Dali
2A)crossover -frekvens er 3000 Hz, hvilket betyder at 4000 Hz-signalet primært udstr˚
ales fra
˚
diskantenheden. Arsagen til opsplitningen, som ogs˚
a forekommer i simuleringen, kan være, at
der kun tages højde for retninger i array’ets plan (xy-planen), n˚
ar der laves beamforming. Der
ses ikke i retning af z-aksen, og beamformeren kan derfor ikke h˚
andtere en s˚
a stor højdeforskel,
som forekommer, n˚
ar højtaleren er 26 cm fra drejebordets centrum.
Figur 9.14 viser beampatterns for et tilsvarende 1×4 array, hvor kilden er rykket 50 cm
længere væk og nu er placeret 76 cm fra drejebordets centrum.
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.13: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret 26 cm
fra drejebordets centrum ved vinkel 0◦ og udsender hvid støj.
Figur 9.14b viser en mindre opsplitning ved den praktiske m˚
aling for 4000 Hz end ved
den forrige m˚
aling, hvor kildens afstand til drejebordets centrum var 26 cm. Den tilsvarende
simulering viser ikke nogen opsplitning, og det antages at være højdeforskellen mellem den
simulerede kildeposition og den praktiske diskantenheds position, der for˚
arsager denne forskel.
71
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.14: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret 76 cm
fra drejebordets centrum ved vinkel 0◦ og udsender hvid støj.
Hvis kilden flyttes yderligere 50 cm væk fra drejebordets centrum, s˚
a afstanden nu er 1,26
m, opst˚
ar der en meget lille opsplitning ved 4000 Hz i den praktiske m˚
aling. Fuldstændigt
samme beampattern opn˚
as ved en afstand p˚
a 1,76 m, og ved 2,26 m er opsplitningen helt
væk, og de praktiske m˚
alinger ligner næsten til forveksling de simulerede beampatterns. De
simulerede beampatterns for afstandene mellem 0,76 m og 2,26 m er helt identiske og ser ud
som p˚
a figur 9.14a.
Kilden flyttes, s˚
a den st˚
ar i 250◦ , og der foretages m˚
alinger og simuleringer for de samme
afstande mellem 0,26 m og 2,26 m som ovenfor. N˚
ar kilden st˚
ar i denne vinkel har afstanden ingen indflydelse p˚
a array’ets beampattern, og alle beampatterns er magen til hinanden
ved disse m˚
alinger. Disse beampatterns udviser alle samme mønster som p˚
a figur 9.3, hvor
der optræder spøgelseskilder, men der er ingen nævneværdig forskel p˚
a m˚
alingerne. Dette er
bemærkelsesværdigt og kan undersøges nærmere i fremtidige studier.
Det undersøges ogs˚
a, om array’ets beampattern er afhængigt af udbredelsesretningen for
kildesignalet. I undersøgelsen drejes højtaleren væk fra array’et i forskellige retninger. Disse
m˚
alinger sammenlignes med en tidligere m˚
aling, hvor højtaleren vendte mod array’et, som det
har været tilfældet ved alle andre m˚
alinger. Figur 9.15 viser beampatterns for et cirkulært
array med 12 mikrofoner i tre cirkler, hvor radius er r = 12, 4 cm, og højtaleren er placeret
i 0◦ . P˚
a figuren vises m˚
alinger, hvor kilden vender ind mod array’et, hvor den er drejet 90◦
væk fra array’et, og hvor den er drejet 180◦ væk fra array’et.
72
Undersøgelse af array’ets beampattern og følsomhed
(a) Kilden vender ind mod array’et.
(b) Kilden er drejet 90◦ væk fra array’et.
(c) Kilden er drejet 180◦ væk fra array’et og vender ind mod væggen i det lyddøde rum.
(d) Kilden er drejet 180◦ væk fra array’et og vender ind mod
væggen i det lyddøde rum.
Figur 9.15: Beampatterns for cirkulært array med 12 mikrofoner i tre cirkler og radius r = 12, 4 cm. Kilden
er placeret i 0◦ og udsender hvid støj, og m˚
alingerne er foretaget i lyddødt rum.
Ved at sammenligne figurerne 9.15b, 9.15c og 9.15d med figur 9.15a, hvor kilden er vendt
mod array’et, ses det samme overordnede mønster, og array’et er stadig i stand til at lokalisere
kilden, selvom lyden ikke udstr˚
aler direkte mod array’et13 . P˚
a figur 9.15b lokaliseres kilden til
◦
at være i 8 . Dette stemmer godt overens med den praktiske m˚
aling, da højtalerens membran
◦
ikke var ud for 0 efter højtaleren var drejet, men nærmere ved de 8◦ , se figur 9.16.
13
Der er i praksis et lille direkte lydfelt, eftersom højtalerens kabinet ikke er fuldstændigt akustisk tæt
73
Undersøgelse af array’ets beampattern og følsomhed
Figur 9.16: Illustration af forsøgsopstilling, hvor højtaleren er drejet 90◦ væk fra array’et p˚
a drejebordet.
Figurerne 9.15c og 9.15d viser to m˚
alinger, hvor højtaleren er drejet 180◦ og vender ind
mod væggen i det lyddøde rum. Her er kilden lokaliseret til at befinde sig omkring 0◦ , men
der opst˚
ar større sidelobes ved 2500 Hz og 4000 Hz i forhold til m˚
alingen p˚
a figur 9.15a. Dette
kan skyldes, at mikrofonsignalerne er væsentligt svagere end ved de tidligere m˚
alinger, hvor
mikrofonerne har modtaget de direkte signaler fra kilden, og array’et er dermed mere følsomt
over for støj og refleksioner fra omgivelserne. N˚
ar det direkte lydfelt dæmpes, som i dette
tilfælde, tydeliggør det de mindre usikkerheder, der eksisterer i og omkring systemet.
Det kan konkluderes, at udbredelsesretningen for kildesignalet ikke har en væsentlig betydning
for systemets evne til at lokalisere af kilden.
9.4
Robusthed over for refleksioner
Indtil nu har de praktiske m˚
alinger af array’ets beampatterns ikke været p˚
avirket af refleksioner, da m˚
alingerne er foreg˚
aet i et lyddødt rum. Derfor er det nu interessant at undersøge,
om systemet er i stand til at lokalisere kilden, hvis der indføres en reflekterende plade, som
kan repræsentere en væg. Til dette form˚
al anvendes en finerplade, der m˚
aler 98 cm × 122 cm,
og den har derfor samme bredde som bordpladen. Den anvendes p˚
a to forskellige positioner,
som er placeret 23,5 cm og 64,5 cm fra drejebordets centrum, se figur 9.17, hvor pladen st˚
ar
vinkelret p˚
a kildesignalets indfaldsvinkel.
Figur 9.17: Illustration af forsøgsopstilling med en reflekterende finerplade p˚
a to forskellige positioner, som
er vinkelrette p˚
a kildesignalets indfaldsvinkel.
Figur 9.18a viser beampatterns for et 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9
◦
cm, kilden er placeret i 0 , og m˚
alingen er foretaget uden finerpladen. Figur 9.18b og 9.18c
viser tilsvarende m˚
alinger, hvor finerpladen er indført hhv. 64,5 cm og 23,5 cm fra drejebordets
centrum, og pladen st˚
ar i 180◦ , som det er vist p˚
a figuren ovenfor.
74
Undersøgelse af array’ets beampattern og følsomhed
(a) M˚
alt i lyddødt rum uden reflekterende plade.
(b) M˚
alt i lyddødt rum. En reflekterende plade er placeret i retning
180◦ vinkelret p˚
a kildesignalets indfaldsvinkel med en afstand p˚
a
64,5 cm til drejebordets centrum.
(c) M˚
alt i lyddødt rum. En reflekterende plade er placeret i retning
180◦ vinkelret p˚
a kildesignalets indfaldsvinkel med en afstand p˚
a
23,5 cm til drejebordets centrum.
Figur 9.18: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 0◦
og udsender hvid støj.
P˚
a figur 9.18b ses et større sidelobe i 180◦ -retningen ved 2500 Hz (niveau p˚
a 0,25) i forhold
til figur 9.18a. Ved 4000 Hz ses en opsplitning af mainlobet, mens sidelobet i 180◦ -retningen
mindskes (fra 0,6 til 0,2), og der opst˚
ar sidelobes i andre retninger. Opsplitningen kan evt.
skyldes destruktiv interferens mellem det reflekterede signal fra finerpladen og kildesignalet.
P˚
a figur 9.18c er finerpladen rykket tættere p˚
a array’et (23,5 cm afstand fra drejebordets
centrum), og det kan ogs˚
a ses p˚
a de resulterende beampatterns. Her fejlestimerer array’et lydkildens retning ved 1000 Hz til 90◦ eller 270◦ . M˚
alingen for 2500 Hz har f˚
aet et endnu større
sidelobe i 180◦ -retningen (niveau p˚
a 0,8). Ved 4000 Hz er det, der var et 180◦ sidelobe, nu
blevet til mainlobet, og beamformeren kan ikke skelne mellem kilden selv og refleksionerne fra
finerpladen. Kort sagt har beamformeren store vanskeligheder med at lokalisere kilden fejlfrit,
n˚
ar der indføres reflekterende overflader.
I de næste m˚
alinger er kilden flyttet til 315◦ . Figur 9.19b viser beampatterns, hvor finerpladen er 64,5 cm fra drejebordets centrum i 180◦ -retningen, mens den er placeret 23,5 cm
fra drejebordets centrum i samme retning p˚
a figur 9.19c.
75
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret uden refleksioner.
(b) M˚
alt i lyddødt rum. En reflekterende plade er placeret i 180◦
med en afstand p˚
a 64,5 cm til drejebordets centrum.
(c) M˚
alt i lyddødt rum. En reflekterende plade er placeret i 180◦
med en afstand p˚
a 23,5 cm til drejebordets centrum.
Figur 9.19: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 315◦
og udsender hvid støj.
Figur 9.19a viser en simulering af det anvendte array, men uden at tage højde for refleksioner. Her ses en spøgelseskilde i 45◦ , hvilket skyldes, at array’et best˚
ar af en enkelt række
mikrofoner, som det er beskrevet i afsnit 9.1. Med finerpladen placeret 64,5 cm fra drejebordets centrum, er array’ets beampattern præget af stor usikkerhed og tilfældighed. Dette
forværres kun, n˚
ar finerpladen placeres tættere (23,5 cm) p˚
a array’et, som det forventes fra
figur 9.18. Se resultaterne p˚
a hhv. figur 9.19b og 9.19c.
Det undersøges nu, om der sker nogle betydelige refleksioner, hvis kildesignalet tilnærmelsesvis udbredes parallelt med den reflekterende plade. Af geometriske ˚
arsaer forventes det, at
refleksioner nu vil spille en mindre rolle end tidligere forsøg. Kilden er placeret i 77◦ . Figur
9.20 viser beampatterns for denne situation, og figur 9.20a viser simulerede beampatterns for
denne opstilling uden den reflekterende plade.
76
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret uden refleksioner.
(b) M˚
alt i lyddødt rum. En reflekterende plade er placeret i 180◦
med en afstand p˚
a 64,5 cm til drejebordets centrum.
(c) M˚
alt i lyddødt rum. En reflekterende plade er placeret i 180◦
med en afstand p˚
a 23,5 cm til drejebordets centrum.
Figur 9.20: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 77◦
og udsender hvid støj.
Generelt opfører array’et sig p˚
a samme m˚
ade p˚
a figur 9.20b og 9.20c set i forhold til
de simulerede beampatterns p˚
a figur 9.20a. Der optræder synlige effekter af den reflekterende
finerplade, men som forventet har den reflekterende plade den mindste indflydelse p˚
a array’ets
beampatterns, n˚
ar kildesignalet næsten spilles parallelt med pladen, og den største indflydelse
n˚
ar det spilles vinkelret ind p˚
a pladen.
9.5
Undersøgelse af lavfrekvent respons
Indtil nu har alle undersøgelser af beampatterns fokuseret p˚
a frekvensomr˚
adet 1000 Hz - 4000
Hz, da dette er et vigtigt omr˚
ade for taleforst˚
aelsen jf. kapitel 5. I afsnittet fremg˚
ar det dog,
at frekvenser ned til 300 Hz er relevante for vokaldannelsen, og et lavere frekvensomr˚
ade vil
derfor blive undersøgt. Det cirkulære array med 16 mikrofoner, fordelt i fire cirkler og radius
r = 15, 5 cm, undersøges i frekvensomr˚
adet 300 Hz - 1000 Hz. Beampatterns for dette array
vises p˚
a figur 9.21, hvor kilden er placeret i 0◦ .
77
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret.
(b) M˚
alt i lyddødt rum.
Figur 9.21: Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden
er placeret i 0◦ og udsender hvid støj.
Ogs˚
a her er de m˚
alte og simulerede beampatterns næsten identiske, og som forventet bliver
mainlobet for henholdsvis 500 Hz og 300 Hz bredere end ved 1000 Hz, se tabel 9.3.
Cirkulært array
16 mikrofoner, fire cirkler, r = 15, 5 cm
1000 Hz
2500 Hz
4000 Hz
150◦
85◦
43◦
Tabel 9.3: Mainlobe-bredde for cirkulært array med 16 mikrofoner i fire cirkler, r = 15, 5 cm.
Ved 300 Hz er array’ets beampattern dog ikke opdelt i et mainlobe og sidelobes, men
er mere omnidirektionelt. Det lokaliserer stadig kilden til at være i 0◦ , som ved de andre
frekvenser, da det største udsving findes i den retning. Hvis det er vigtigt at f˚
a lokaliseret de
lave frekvenser ved f.eks. 300 Hz mere præcist, skal et andet array benyttes - evt. et array
med større radius.
9.6
Undersøgelse af array’ets beampattern i mødelokale
Indtil nu er alle praktiske m˚
alinger og undersøgelser foreg˚
aet i et lyddødt rum, og mikrofonarray’ets beampattern vil nu blive undersøgt i et lokale, der kan repræsentere et mødelokale.
I et mødelokale kan der opst˚
a refleksioner og diffraktioner, som ikke forekommer i et lyddødt
rum, og disse fænomener kan p˚
avirke array’ets beampattern.
Lokalet, der anvendes til disse m˚
alinger, er et klasselokale med dimensionerne 11,85 m × 7,5
m × 3,43 m. Rummets efterklangstid fremg˚
ar af figur 9.22.
78
Undersøgelse af array’ets beampattern og følsomhed
Figur 9.22: M˚
alt efterklangstid for klasselokale p˚
a Teknisk Fakultet, SDU. Venligst l˚
ant af Peter Møller Juhl.
I lokalet er der inventar som træborde og -stole, og ´en væg er delvist dækket af kridttavler.
Den modsatte væg er næsten fyldt med vinduer, og de resterende to vægge best˚
ar delvist af
lydabsorberende materiale, hvis akustiske egenskaber er ukendte.
Et rektangulært og et cirkulært array er blevet testet, og der er blevet ændret p˚
a kildens
retning. Til alle m˚
alinger i klasselokalet anvendes hvid støj som kildesignal. Figur 9.23 viser
simulerede og m˚
alte beampatterns for et 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9
cm, og figur 9.24 viser beampatterns for et cirkulært array med 24 mikrofoner fordelt i fire
cirkler, hvor array’et radius er r = 15, 5 cm. I begge tilfælde er kilden placeret i 120◦ .
(a) Simuleret.
(b) M˚
alt i klasselokale.
Figur 9.23: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 120◦
og udsender hvid støj.
79
Undersøgelse af array’ets beampattern og følsomhed
(a) Simuleret.
(b) M˚
alt i klasselokale.
Figur 9.24: Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden
er placeret i 120◦ og udsender hvid støj.
For begge arrays ses det tydeligt, at det ikke har haft nogen nævneværdig negativ indflydelse at forlade det lyddøde rum. Der opst˚
ar sm˚
a sidelobes (niveau p˚
a 0,2) for det rektangulære
array ved 4000 Hz.
Ved de to forrige m˚
alinger er kilden drejet, s˚
a den udsender lyd direkte mod array’et.
I det lyddøde rum ses det, at det ikke har nogen betydning, hvis kilden vendes væk fra
array’et. Det undersøges, om dette ogs˚
a gælder i klasselokalet. Det forventes, at rummets
efterklangsegenskaber vil inducere større og flere fejlestimeringer i array’ets beampattern.
Det rektangulære 1×4 array er blevet testet under disse omstændigheder ved at kilden er
drejet, s˚
a den udsender lyden henholdsvis 90◦ og 180◦ væk fra array’et, hvilket kan ses p˚
a
◦
figur 9.25. Figur 9.25c viser beampatterns, n˚
ar kilden er drejet 90 i forhold til array’et og
peger op mod loftet.
80
Undersøgelse af array’ets beampattern og følsomhed
(a) Kilde er drejet 90◦ væk fra array’et.
(b) Kilde er drejet 180◦ væk fra array’et.
(c) Kilde er drejet 90◦ væk fra array’et og peger op mod loftet.
Figur 9.25: Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden er placeret i 120◦
og udsender hvid støj. M˚
alingerne er foretaget i et klasselokale.
N˚
ar kilden drejes væk fra array’et har det svært ved at lokalisere kilden ved alle undersøgte
frekvenser. Det kan skyldes, at array’et nu ikke modtager meget af kildens direkte lyd, men
nærmere en masse korrelerede refleksioner, der kan ankomme fra vidt forskellige retninger. I
afsnit 9.4 kunne det konkluderes, at refleksioner har stor indflydelse p˚
a array’ets evne til at
lokalisere kilden, hvilket understreges af figur 9.25a og 9.25b. N˚
ar kilden peger direkte mod
array’et vil der ogs˚
a opst˚
a refleksioner i lokalet, men styrken af disse refleksioner vil være
væsentligt mindre end lydstyrken fra kildens direkte signal.
Array’et beampattern p˚
a figur 9.25c udviser en korrekt AOAE for 2500 Hz og 4000 Hz, mens
resultatet for 1000 Hz fejlestimerer kildens retning. Det viser sig at være bedre for array’ets
lokaliseringsevne, at kilden peger op mod loftet frem for hen mod vægge eller vinduer. Forklaringen kan ligge i den akustiske dæmpning, der er højere for loftmaterialet end for de resterende
overflader i rummet. Dette er imidlertid ikke væsentligt for konferenceapplikationen.
Det undersøges ogs˚
a, om det cirkulære array generes af, at kilden drejes, og figur 9.26 viser
dets beampatterns, n˚
ar kilden peger 180◦ væk fra array’et.
81
Undersøgelse af array’ets beampattern og følsomhed
Figur 9.26: Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius r = 15, 5 cm. Kilden
er placeret i 120◦ og er drejet 180◦ væk fra array’et, og den udsender hvid støj. M˚
alingerne er foretaget i et
klasselokale.
Ved 2500 Hz lokaliseres kilden næsten korrekt, men ved 1000 Hz og 4000 Hz fejlestimerer
array’et lydkildens retning. Det cirkulære array kommer alts˚
a i lige s˚
a store problemer som
det rektangulære array, n˚
ar der opst˚
ar refleksioner med en styrke, der er sammenlignelig med
kildens direkte signal.
9.7
Undersøgelse af array’ets følsomhed
Indtil nu har m˚
alet været at lokalisere en lydkilde s˚
a nøjagtigt som muligt. N˚
ar dette er
fuldført er det relevant at undersøge, hvor følsomt array’et er i forskellige retninger, n˚
ar
´en styringsretning fastholdes. Indtil nu er der blevet styret i 360 forskellige retninger for
at lokalisere kilden. Ved at fastholde ´en retning, tilføres der kun komplekse faser for netop
den retning til hvert af mikrofonsignalerne. Det forventes derfor, at lyd, der kommer fra
styringsretningen, vil blive forstærket, mens lyd fra andre retninger vil blive undertrykt.
For at teste array’ets følsomhed foretages m˚
alinger, hvor kilden er placeret i styringsretningen, og hvor den er placeret i en retning forskellig fra styringsretningen. Amplituden af
output-signalet fra beamformeren sammenlignes med amplituden af et mikrofonsignal. For
at gøre denne sammenligning nemmere er output-signalerne normerede ift. de ubehandlede
mikrofonsignaler. Figur 9.27 viser et normeret mikrofonsignal i frekvensdomænet for ´en af
mikrofonerne i et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Kildesignalet er
en tone p˚
a 2500 Hz.
Figur 9.27: Mikrofonsignal i frekvensdomænet for ´en mikrofon i et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal, og kildesignalet er en tone med
frekvensen 2500 Hz.
Figur 9.28 viser beamformerens output-signal, og ved denne m˚
aling er kilden placeret i
styringsretningen (0◦ ), hvor det forventes, at signalet forstærkes.
82
Undersøgelse af array’ets beampattern og følsomhed
Figur 9.28: Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret i styringsretningen, som her er 0◦ , og den udsender en tone med frekvensen 2500 Hz.
Ved at sammenligne de to figurer ovenfor ses det, at signalet forstærkes ca. med en faktor
4 (fra 0,7 til 2,7).
N˚
ar kilden flyttes fra styringsretningen, forventes det, at output-signalets amplitude bliver
mindre, da de tilførte faser til hvert enkelt mikrofonsignal sandsynligvis ikke passer med det
modtagne signal fra kilden. Figur 9.29 viser output-signalet, n˚
ar kilden er placeret 90◦ forskudt
i forhold til styringsretningen.
Figur 9.29: Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret 90◦ forskudt i
forhold til styringsretningen, og den udsender en tone med frekvensen 2500 Hz.
Her ses det, at beamformerens output-signal dæmpes ca. med en faktor 4, og array’et
undertrykker dermed en væsentlig mængde af lyden fra den retning.
Kilden forskydes nu 180◦ i forhold til styringsretningen, og beamformerens output-signal
kan ses p˚
a figur 9.30.
Figur 9.30: Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt mikrofonsignal. Kilden er placeret 180◦ forskudt
i forhold til styringsretningen, og den udsender en tone med frekvensen 2500 Hz.
I denne retning er kildesignalet dæmpet fra 0,7 til 0,5, og amplituden er sammenlignelig
med de modtagne mikrofonsignaler. Amplituden for denne retning er imidlertid over 5 gange
83
Undersøgelse af array’ets beampattern og følsomhed
mindre end, n˚
ar kilden er placeret i styringsretningen, hvilket klart viser, at følsomheden er
størst i styringsretningen. Resultaterne for de relative forstærkninger er opsummeret i tabel
9.4.
Lignende fænomener ses for et cirkulært array med 16 mikrofoner fordelt i fire cirkler
og en radius p˚
a r = 15, 5 cm. Der forekommer størst forstærkning, n˚
ar kilden befinder sig i
styringsretningen, og væsentligt mindre forstærkning, n˚
ar kilden befinder sig i andre retninger.
Resultaterne for de relative forstærkninger for dette array ses ligeledes i tabel 9.4.
Array
Rektangulært 1×4 array, indbyrdes
mikrofonafstand 3,9 cm
Cirkulært array, 16 mikrofoner, fire
cirkler, r = 15, 5 cm
Kildeposition
0◦
90◦ 180◦
4
0,25
0,7
13,5
0,95
5,5
Tabel 9.4: Forstærkning af mikrofonsignaler ved forskellige kildepositioner. Styringsretningen er 0◦ . Resultater
ses for et rektangulært 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm og for et cirkulært array med 16
mikrofoner i fire cirkler og radius r = 15, 5 cm.
Forskellen p˚
a forstærkningsniveauerne for det rektangulære og det cirkulære array skyldes
antallet af mikrofoner, der anvendes. I det cirkulære array anvendes 4 gange flere mikrofoner
end i det rektangulære, og der er derfor flere mikrofonsignaler, der kan skabe konstruktiv
interferens. Dette giver i sidste ende en højere amplitude i output-signalet.
Følsomhed for flere arrays og for flere forskellige retninger kan evt. undersøges i fremtidigt
arbejde.
9.8
Delkonklusion
Rektangulære og cirkulære array-geometrier er blevet undersøgt med henblik p˚
a at vurdere
deres evne til at lokalisere en lydkilde i form af et beampattern. Der er benyttet to typer
rektangulære arrays; et 1×4 array og et 2×4 array, og forskellige cirkulære arrays er blevet
testet. Her er der b˚
ade ændret p˚
a antallet af mikrofoner, antallet af cirkler og cirklernes
radier. Generelt ligner alle m˚
alte beampatterns til forveksling de simulerede beampatterns,
s˚
a længe der ikke forekommer refleksioner eller højdeforskelle mellem kilden og array’et, som
simuleringen ikke tager højde for.
N˚
ar kildesignalet spilles vinkelret ind p˚
a mikrofonaksen af 1×4 array’et opst˚
ar der spøgelseskilder, som betyder, at array’et ikke kan skelne mellem de to sider af mikrofonrækken. Ved
at indføre en mikrofonrække mere ses det p˚
a 2×4 array’et, at nogle af spøgelseskilderne kan
elimineres.
De cirkulære arrays er blevet undersøgt med b˚
ade ´en og flere koncentriske cirkler, og der
opn˚
as smallere mainlobes, n˚
ar array’ets radius øges. Antallet af mikrofoner ikke har betydning
for mainlobet. Størrelsen p˚
a sidelobes afhænger derimod mere af antallet af mikrofoner og
deres indbyrdes placering og ikke nødvendigvis af radius. Generelt bliver sidelobes mindre,
n˚
ar der anvendes flere mikrofoner i en enkelt cirkel. Hvis der tilføjes flere cirkler sker der ikke
nogle væsentlige ændringer, s˚
a længe radius fastholdes.
Ved m˚
alinger foretaget i lyddødt rum sker der ikke nævneværdige ændringer i array’ets
beampattern, n˚
ar lydkildens udstr˚
alingsretning ændres. N˚
ar der m˚
ales i et klasselokale, mindskes array’ets lokaliseringsnøjagtighed, da der opst˚
ar refleksioner med sammenlignelige amplituder ift. det direkte signal. Generelt har array’et svært ved at lokalisere kilden, n˚
ar m˚
alingerne
foretages i omgivelser, hvor der opst˚
ar refleksioner.
Kildens afstand til array’et har betydning for 1×4 array’ets beampattern, n˚
ar kilden er
placeret p˚
a samme akse som mikrofonerne. Her sker en opsplitning af mainlobet ved 4000 Hz,
84
Undersøgelse af array’ets beampattern og følsomhed
og dette kan skyldes, at kildens diskantenhed er placeret højere end bas-/mellemtone-enheden
og højere end kildepositionen, der er angivet i simuleringen. Det giver generelt anledning til fejl
(opsplitning af mainlobe), n˚
ar kilden flyttes væk fra array’ets plan, eftersom beamformerens
styringsretning er begrænset til denne plan.
Array’ets følsomhed over for indfaldende lyd fra forskellige retninger er blevet undersøgt.
Dette er gjort ved at fastholde ´en styringsretning, og n˚
ar en lydkilde placeres i styringsretningen, forstærkes beamformerens output-signal pga. konstruktiv interferens mellem de enkelte
mikrofonsignaler. N˚
ar lydkilden placeres 90◦ og 180◦ forskudt i forhold til styringsretningen,
undertrykker array’et signalet fra kilden. Afhængigt af array’ets geometri bliver beamformerens output-signal enten dæmpet eller forstærket væsentligt mindre end tilfældet med kilden
i styringsretningen.
85
Vurdering af resultater og forslag til fremtidigt arbejde
10
Vurdering af resultater og forslag til fremtidigt arbejde
Generelt er der meget stor lighed mellem b˚
ade det analytisk udledte, det simulerede og
det m˚
alte beampattern for et 1×4 array. Kvantitativt har det analytiske og det simulerede beampattern identiske mainlobe-bredder, sidelobe-niveauer og AOAE, mens det m˚
alte
har mindre afvigelser ved høje frekvenser (4 kHz), navnlig en sidelobe-ændring p˚
a ca. 0,1
ift. mainlobe-niveau. I analysen er der kun undersøgt ULAs (linje-arrays), hvorfor cirkulære
geometrier ifm. simulering og m˚
aling ikke kan sammenlignes med denne. Cirkulære og øvrige rektangulære (mere end ´en række) geometrier er simuleret og m˚
alt i praksis, og her ses
ligeledes meget stor overensstemmelse mellem deres beampatterns. Der opst˚
ar forventelige
afvigelser fra simuleringen, n˚
ar beamformingen udføres under ikke-ideelle omstændigheder,
dvs. ikke i et lyddødt rum.
Det analytiske beampattern er udledt p˚
a baggrund af en række antagelser, heriblandt
at mikrofon-array’et befinder sig i lydgiverens fjernfelt, selvom dette ikke altid er tilfældet i
hverken simuleringer eller m˚
alinger, hvilket er medvirkende til afvigelser. Dette skyldes ikke
nødvendigvis lydkildens bølgeform, som vil være sfærisk i nærfeltet, men snarere de akustiske
interferensfænomener, der opst˚
ar tæt p˚
a en dipol eller et array af lydgivere. B˚
ade i simuleringer
og m˚
alinger antages lydgiveren at være en monopol, hvilket i praksis er ukorrekt og derfor
kan give anledning til omtalte effekter.
Beamformeren udregner kun komplekse faser svarende til retninger i array’ets plan. Dvs.,
n˚
ar der eksisterer en højdeforskel mellem array’et og lydgiveren, tillægges opsamlede mikrofonsignaler en fejlbehæftet fase, og s˚
aledes f˚
as et fejlbehæftet beampattern. For at tage hensyn
til en s˚
adan højdeforskel kan beamformeren optimeres, s˚
a den kan styres i samtlige polære
koordinater (3D). I tilknytning hertil kan det ogs˚
a være af interesse at undersøge tredimensionelle arrays, f.eks. sfæriske eller kubiske.
Ifm. med praktiske m˚
alinger, hvor der er menneskelig indblanding, er der hæftet en række
usikkerheder, herunder f.eks. placering af mikrofoner, konstruktion af drejebordet, rotation
af drejebordet under m˚
alinger og tilstedeværelsen af forsøgsdeltagere under m˚
alinger. Udover
disse skal ogs˚
a indtænkes eventuelle fejl i de anvendte komponenter, f.eks. mikrofoner og
USB-modulet.
Hvad ang˚
ar selve repræsentationen af arrays med et stort antal mikrofoner, anvendes de
samme fire mikrofoner flere gange i løbet af ´en m˚
aling. Dette indfører kun fire forskellige
fasefejl i beamformeren, mens et virkeligt array vil have lige s˚
a mange fasefejl, som der er
mikrofoner. At der kun eksisterer op til fire forskellige fasefejl i det m˚
alte beampattern, svarer
ikke nødvendigvis til at have det faktiske antal selvstændige mikrofoner, og den skadelige effekt
af fasefejl kan s˚
aledes være anderledes. I praksis vil der f.eks. med 32 mikrofoner være op til
32 forskellige fasefejl, men til gengæld er alle mikrofoner placeret med minimal usikkerhed. I
m˚
alingerne foretaget med drejebord eksisterer der kun op til fire fasefejl, men til gengæld er der
usikkerhed forbundet med hver eneste rotation og dermed med hver eneste mikrofons position.
Hvis teknologien skal implementeres i et konferencesystem, skal beamformingen først og
fremmest kunne afvikles i realtid. Denne funktionalitet er ikke undersøgt i dette projekt, og anbefales til fremtidige studier. Konferencesystemet vil ogs˚
a typisk blive placeret i et mødelokale
med akustiske egenskaber, der giver anledning til efterklang (refleksioner). Dette betyder, at
der skal foreg˚
a signalbehandling inden beamformingen, der kompenserer for disse fænomener,
f.eks. ekkoeliminering.
Som kvalitetsbedømmelse p˚
a de resulterende beampatterns, er der igennem afhandlingen
benyttet størrelser som mainlobe-bredde, sidelobe-niveau, AOAE, SNR, lokaliseringsnøjagtighed
og støjreduktion. Der kan evt. i fremtidige studier undersøges alternative kvalitetsparametre
s˚
asom speech distortion index, directivity, white noise gain og gratinglobe-niveauer[7].
86
Konklusion
11
Konklusion
I løbet af afhandlingen er det vist, hvorledes akustisk delay-and-sum beamforming kan implementeres i MATLAB til lokalisering af en lydkilde ved brug af forskellige mikrofon-arrays.
Beamformerens robusthed overfor støj og refleksioner er undersøgt i b˚
ade lyddødt og ikkelyddødt rum, s˚
avel som ved simulering og i praksis. Det viser sig, at beamformeren har ringere
lokaliseringsnøjagtighed n˚
ar den befinder sig i omgivelser med korreleret støj, f.eks. refleksioner, mens ikke-korreleret støj har lav til ingen indflydelse. Mikrofonernes iboende fasefejl er
undersøgt i simuleringer, og - som forventet - er indflydelsen størst ved høje frekvenser. Fasefejl kan ogs˚
a introduceres via fejlplaceringer af mikrofonerne i array’et.
Sammenhængen mellem et givet arrays lokaliseringsnøjagtighed - ofte omtalt som den
m˚
albare parameter mainlobe-bredde - og dets antal af mikrofoner, mikrofonernes indbyrdes
afstand, osv. er undersøgt. Simuleringer viser, at lokaliseringsnøjagtigheden i høj grad er afhængig af mikrofonernes indbyrdes position, efter en nærmest eksponentiel sammenhæng,
hvor lokaliseringsnøjagtigheden er lav for en lille indbyrdes afstand og stor for en stor indbyrdes afstand - dog med forbehold; ved særligt store afstande optræder ogs˚
a relativt store sidelobes. Overordnet m˚
a det konkluderes, at der er en sammenhæng mellem signalets
bølgelængde og den indbyrdes mikrofonafstand mht. mainlobe-bredden. Som forventet er lokaliseringsnøjagtigheden ogs˚
a lavere ved lave frekvenser og højere ved høje frekvenser. I øvrigt
er beamformerens tolerance overfor fasefejl og mikrofonplaceringsusikkerheder afhængig af
frekvens: med stigende frekvens stiger følsomheden overfor disse.
Antallet af mikrofoner har ikke nævneværdig indflydelse p˚
a beamformerens beampattern,
bortset fra hvad ang˚
ar sidelobe-niveauer. Med et stigende antal mikrofoner er der generelt
tendens til, at det maksimale sidelobe-niveau falder, men ved enkelte mikrofonsepareringer,
array-geometrier og frekvenser opst˚
ar der undtagelsesvist store sidelobes. Mainlobe-bredden
er dog ofte up˚
avirket, n˚
ar array-størrelsen fastholdes.
Blandt de forskellige cirkulære geometrier, der er behandlet i dette projekt, herunder
´encirkel-arrays, flercirkel-arrays, logaritmisk cirkulære arrays, tilfældige arrays og ækvidistant
cirkulære arrays, er der ikke fundet tegn p˚
a nævneværdige afvigelser. Ved et konstant antal mikrofoner udviser alle typer cirkulære geometrier tilnærmelsesvist samme beampattern.
Tilfældige arrays kan imidlertid have fordelene af en stor b˚
andbredde, men dog med stor
usikkerhed fra simulering til simulering pga. genereringen af tilfældige tal.
Et linje-array (ULA) er efterstræbelsesværdigt ifm. den analytiske udledning af beampatterns og i visse praktiske m˚
alinger pga. dets simple konstruktion. Dette er dog p˚
a bekostning af
et beampattern, der genererer store 180◦ -sidelobes (spøgelseskilder) ved bestemte kildepositioner. Alene ved at indføre flere rækker eller kolonner i array’et, kan spøgelseskilder elimineres.
Det mindste realiserbare array af denne type er et 2×2 array.
I praksis er betydningen af lydkildens afstand til array’et undersøgt, og den eneste synlige
effekt er en opsplitning af mainlobet efterh˚
anden som lydkilden nærmer sig array’et. Dette
er højst sandsynligt pga. en højdeforskel mellem array’ets plan og lydgiveren. Dette tages der
ikke hensyn til af beamformeren, fordi dens styringsretning udelukkende opererer i array’ets
plan.
Undersøgelse af følsomhedskarakteristikker for simple arrays p˚
aviser beamformerens evne
til at foretage rumlig filtrering. Det er endvidere vist i praksis, at input-signalet forstærkes,
n˚
ar lydkilden er placeret i styringsretningen, mens det undertrykkes i andre retninger i større
eller mindre grad.
87
Ordforklaring
12
Ordforklaring
•
Ord
Abcisse
•
•
Akustiske billeder
Aliasing
•
•
•
AOAE
Array
Array acoustics
•
•
•
Array-mønster
Array processing algorithms
Arrays b˚
andbredde
•
•
Arrays selektivitet
At beame
•
•
At sample
At stacke
•
•
Beamformer
Beamforming
•
Beampattern
•
•
•
Bl.a.
BNC-stik
Constant beamformer
•
•
•
Crossover -frekvens
Delay
Delay-and-sum
•
•
•
•
•
•
•
•
•
Diffraktion
Diffuse field
Drejebord
DSP
Etc.
Evt.
F.eks.
FIR filter
Flercirkel-array
•
•
Free field
Følsomhedskarakteristik
•
Hhv.
Forklaring
Betegner normalt et koordinatsystems x-akse eller
førsteakse.
Virtuelle“ lydkilder, der opst˚
ar ved refleksioner
”
Signalforvrængning af frekvenser større end samplingfrekvensen
fork., Angle Of Arrival Estimation
Geometrisk fordeling af transducere
Et disciplin inden for akustik, der beskæftiger sig med
akustiske udstr˚
aling eller m˚
aling med flere simultane
transducere.
Retningskarakteristik for array
Array-behandlingsalgoritmer
Angiver størrelsen af det frekvensspektrum, hvor array’et
er i stand til at lokalisere lydkilden
Et m˚
al for lokaliseringsnøjagtigheden for et array
At udstr˚
ale med stor retningsbestemthed, f.eks. som en
lommelygte
At diskretisere et (kontinuert) tidssignal (sampling)
At bringe mikrofonsignaler i fase, s˚
a de adderer konstruktivt, se stacking
Et system, der laver beamforming
Signalbehandlingsprincip til lokalisering og rumlig filtrering af signaler
Retningskarakteristik for beamformer med variabel styringsretning
fork., Blandt andet
Bayonet Neill–Concelman koaksialt kabelstik
En beamformer, der søger at opretholde et fladt frekvensspektrum
Overgangsfrekvens i et delefilter (crossover network)
Forsinkelse
Beamforming-metode, der gør brug af tidsforskelle mellem transducere i et array
Brydningsfænomen inden for bølgeteori
Et mættet lydfelt med uniform akustisk energifordeling
Mekanisk anordning, der kan rotere
Digital Signal Processing
fork., Etcetera
fork., Eventuelt
fork., For eksempel
Finite impulse response filter
Cirkulært array best˚
aende af to eller flere koncentriske
cirkler
Lydfelt uden refleksionsbidrag
Retningskarakteristik for beamformer med fastholdt styringsretning (sensitivity)
fork., Henholdsvis
88
Ordforklaring
•
Hvid Gaussisk støj
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Højtaler-rack
Ifm.
Ift.
Ikke-korrelerede
Immanent
Inkl.
Jf.
Klæbemasse
Korrelerede
Logaritmisk cirkulært array
Lokaliseringsnøjagtighed
Lyddødt rum
Mainlobe
MDF
Mht.
Mind-set
Mismatch
M.m.
Nr.
Omnidirektionel
Ordinat
Pass-by støjlokalisering
Pga.
Phase-matching
•
Pressure field
•
•
Pseudotilfældigt
Retningskarakteristik
•
Retningsstyring
•
Rumlig (spatial) filtrering
•
•
•
Rumlig sampling
Script
Sensitivity
•
Sidelobe
•
•
•
SMB-stik
SNR
Spøgelseskilde
•
•
•
Stacking
Systemrespons
Transducer
•
ULA
Støjsignal med uniformt energispektrum i frekvensdomænet
Række eller søjle af højtalere
fork., I forbindelse med
fork., I forhold til
Ikke sammenhængende signaler
Iboende egenskab
fork., Inklusiv
fork., Jævnfør
Elefantsnot“
”
Sammenhængende signaler
Cirkulært array med logaritmisk fordelt radial akse
Et m˚
al for arrays evne til at lokalisere lydkilde
Rum, der tilnærmelsesvis genskaber et free field
Den retning, hvor array’et har størst følsomhed
Medium-Density Fiberboard
fork., Med hensyn til
Tilgang, mentalitet
N˚
ar styrings- og kilderetning er forskellige
fork., Med mere
fork., Nummer
Uniform polær retningskarakteristik
Betegner ofte et koordinatsystems y-akse eller andenakse.
Lokalisering af støj fra kilder, der bevæger sig, f.eks. toge
fork., P˚
a grund af
Kalibrering af indre fasefejl blandt en række af mikrofoner
Lydfelt med ens amplitude og fase i enhver position i
feltet
Ikke helt tilfældigt, men tilnærmet
En funktion, der beskriver et arrays følsomhed som funktion af retning
En enhedsvektor, som angiver beamformerens
søgeretning
Lyd fra andre retninger end styringsretningen undertrykkes
En rumlig kvantisering af lydfeltet
Et program
Retningskarakteristik for beamformer med fastholdt styringsretning (følsomhedskarakteristik)
Lokale maksima i retningskarakteristikken, der er mindre
end mainlobe
SubMiniature version B koaksialt kabelstik
Signal-to-noise ratio
Et sidelobe, der typisk opst˚
ar som en slags spejling af
mainlobet i en symmetriakse
N˚
ar styrings- og kilderetning er ens. Signalerne er i fase
Et arrays beampattern
En komponent, der omdanner ´en energiform til en anden,
sensor
Uniformt Lineært Array
89
Ordforklaring
•
•
Vha.
Ækvidistant cirkulært array
fork., Ved hjælp af
Cirkulært array, hvor alle indbyrdes transducerafstande
er ens
90
Symboler
13
Symboler
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Symbol
~r0
p(t)
M
~rm
pm (t)
pm (ω)
∆m
wm
z(t)
t
e
j
ω
z(ω)
~k
κ
~u
c
~k0
ps
W
~
K
pss
Rm
∇2
Φ
k
r
A, B
π
ur
p
ρ
ra
u0
2h
A1, A2
r1, r2
P
S
S0
ϕ
•
•
•
•
•
m, n
f
R(f )
λ
Φres
Forklaring
Lydkilde position
Tidsvarierende signal
Antal mikrofoner
Den m’te mikrofonplacering
Lydsignal i tidsdomæne for den m’te mikrofon
Fouriertransformation af pm (t) for den m’te mikrofon
Tidsforsinkelse for den m’te mikrofon
Amplitudevægtning for den m’te mikrofon
Delay-and-sum beamforming resultat i tidsdomænet
Tid
Eulers tal ≈ 2,72
Det imaginære tal
Vinkelfrekvens
Delay-and-sum beamforming resultat i frekvensdomænet
Bølgevektor
Akustisk konstant
Arbitrær enhedsvektor eller styringsretning
Lydens hastighed
Arbitrær bølgevektor
Lydtryksamplitude
Array-mønster
Differens mellem bølgevektorer
Lydtryksamplitude for sfæriske bølger
Afstand mellem lydkilde og den m’te mikrofon
Laplaceoperator
Hastighedspotential (lydfelt)
Bølgetal
Afstand fra monopol
Arbitrær konstant i løsning til bølgeligningen
Pi ≈ 3,14
Partikelhastighed
Lydtryk
Densitet
Monopolradius
Amplitudekonstant
Monopolafstand (dipollængde)
Monopoludstr˚
alingsstyrke
Afstand fra monopoler til punkt P
Position af lydmodtager
Position af monopol
Position af refleksion af S i væg
Vinkel mellem dipols længdeakse og vektor fra dipols centrum til punkt P
Heltalstællevariable
Frekvens
Retningskarakteristik
Bølgelængde
Resulterende hastighedspotential i punkt P
91
Symboler
•
•
Φi
ϕ0i
•
•
•
•
•
ϕi
Rres (f )
Φ0
N
a
•
θ
•
•
•
T
β
θ0
•
m, n
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
l
b
sm
sn
~i
S
~ri
ti
~rs
po
pi
∆i
ta,b
da,b
te
ϕe
dx
tri
•
dri
•
p0 (d)
•
•
•
•
•
•
•
•
•
•
•
•
d
τ
η
θi
O
Ss
rmax
α
w
Sp
SNRi
SNRo
Hastighedspotential produceret af den i’te lydgiver
Indbyrdes faseforskel mellem den i’te lydgivere og referencelydgiver (i = 1)
Den i’te fasedrejning mellem hver lydgiver og -modtager
Resulterende retningskarakteristik for ULA
Arbitrær hastighedspotential
Antal lydgivere (monopoler)
Indbyrdes afstand mellem den i’te og den (i + 1)’te monopol i et ULA
Vinkel mellem lydfeltets indfaldsvinkel p˚
a ULA og normalen til ULAs længdeakse
Periodetid
Substitutionskoefficient
Effektiv lydindfaldsvinkel med indbyrdes monopolfaseforskel
Dimensionerne p˚
a den rektangulære mikrofonmatrice
(række/kolonne)
Længde af rektangulært array
Bredde af rektangulært array
Indbyrdes mikrofonafstand i rækkeniveau
Indbyrdes mikrofonafstand i kolonneniveau
Absolut mikrofonplaceringsmatrice
Relativ mikrofonplaceringsmatrice = (rix , riy , riz )
Tidsforsinkelse mellem lydkilde og den i’te mikrofon
Lydkildens position = (rsx , rsy , rsz )
Beamforming-output
Det i’te mikrofonsignal
Den i’te tidsforsinkelse til det i’te signal
Tidsforsinkelse mellem mikrofon a og b
Afstand mellem mikrofon a og b
Effektiv tidsforskydning for˚
arsaget af fasefejl
Fasefejl for˚
arsaget af positionsusikkerhed
Positionsusikkerhed
Tidsforsinkelse mellem den egentlige lydkilde og det i’te
refleksionsbillede
Afstand mellem den egentlige lydkilde og det i’te refleksionsbillede
Lydfeltets amplitude efter lyden har propageret en afstand d
Propageret afstand
Newtonsk dæmpningsrate
Dynamisk viskositet
Lydfelts indfaldsvinkel fra taler til array
Koordinat for array’ets midtpunkt
Koordinat for lydkildens position
Maksimal cirkulær radius
Absorptionskoefficient i forbindelse med efterklang
Styringsretning til beamformer
Den primære lydkilde
Input signal-to-noise ratio
Output signal-to-noise ratio
92
Symboler
•
•
•
r
C
AdB
Radius af cirkulært array
Antal koncentriske cirkler i cirkulære geometrier
Beamformerens støjreduktion i dB.
93
14
Figurer
3.1
3.2
4.1
4.2
5.1
6.1
6.2
6.3
6.4
6.5
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
Signalteknisk diagram for delay-and-sum beamforming. Illustration venligst
l˚
ant af Dr. Andrew Greensted[17]. . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Mainlobe i retningen 90◦ og sidelobe i retningen 270◦ . . . . . . . . . . . . . . . 7
Indfaldsvinkel p˚
a en mikrofons membran. Figur venligst l˚
ant fra [2]. . . . . . . 9
Følsomhedskarakteristik for en pressure field-mikrofon som funktion af indfaldsvinkel.[2] 10
Frekvensindhold i sætningen I can see you“. Billede er venligst l˚
ant af Brian
”
Moore - An Introduction to the Psychology of Hearing[15] . . . . . . . . . . . 11
”
Konfigurationer af ´en eller to monopoler kan effektivt forst˚
as som dipoler. Illustrationer venligst l˚
ant fra Knud Rasmussen - Lydfelter“ [5] . . . . . . . . . . 13
”
Dipol-retningskarakteristik for forskellige 2h/λ-forhold ved f = 1000 Hz. . . . . 14
N monopoler p˚
a række med styringsretning θ i forhold til normal p˚
a ULA’ets
længdeakse. Illustration venligst l˚
ant fra Knud Rasmussen - Lydfelter“ [5] . . . 15
”
Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = π/2. 16
Analytisk beampattern for ULA med N = 4 monopoler, a = 3, 9 cm og θ0 = 0. 16
Eksempler p˚
a array-geometrier simuleret i MATLAB. . . . . . . . . . . . . . . 20
Afbildning af relative vektorer simuleret i MATLAB. . . . . . . . . . . . . . . . 20
Eksempel p˚
a tidsforsinkelse mellem nærmeste og fjerneste mikrofon i forhold
til lydkilden. f = 4000 Hz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Eksempel p˚
a polær plot af beampattern for frekvenser 1000 Hz, 2500 Hz og 4000
Hz. Lydkilden er placeret i ~rs = (x, y, z) = (−2, 2, 1) m, dvs. 135◦ . Eksemplet
tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. . . . . . . 22
Eksempel p˚
a 3D afbildning af beampattern som funktion af xy-vinkel og frekvens (fra 1000 Hz til 4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10
rektangulært array, sm = sn = 5 cm. Lydkilde placeret i 135◦ . . . . . . . . . . . 23
Eksempel p˚
a 2D repræsentation af 3D afbildning af beampattern som funktion
af xy-vinkel og frekvens (fra 1000 Hz til 4000 Hz). Eksemplet tager udgangspunkt i et 10 × 10 rektangulært array, sm = sn = 5 cm. Lydkilde placeret i
135◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Eksempel p˚
a 100 mikrofoner hver med en fasefejl, der er uniformt fordelt med
0 og 2π rad. Lydkilden er placeret i retning 135◦ . . . . . . . . . . . . . . . . . . 25
Resulterende fasefejl for forskellige positionsusikkerheder, dx. . . . . . . . . . . 26
Eksempel p˚
a simulering af rektangulært rum med dimensionerne (l × b × h) =
(6 × 4 × 3) m og lydkildeposition = (−2, 0, 1) m. . . . . . . . . . . . . . . . . . 27
Eksempel p˚
a 3 dB mainlobe-bredde m˚
alt i grader samt sidelobe-niveau. . . . . 28
Illustration af situation, hvor lydkilde (taler) er siddende foran mikrofonsystemet. 29
Installation set oppefra. Ss er lydkildens position mens O er array’ets midtpunkt 30
Beampattern for 1 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Beampattern ligger langs med periferien af det polære plot. . . . . . . . . . . . . . . . . 30
Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 5 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . 30
Beampattern for 2 × 1 array for frekvenserne 1000, 2500 og 4000 Hz. Mikrofonafstand sm = 10 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . 31
Beampattern for 2 × 2 array for frekvenserne 1000, 2500 og 4000 Hz, Mikrofonafstande sm = 10 cm og sn = 5 cm. Lydkilden er placeret i 90◦ . . . . . . . . . 31
Beampatterns for forskellige array-konfigurationer. Mikrofonafstande sm = sn =
5 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
94
7.18 Optimeret 4×6 rektangulært array med mikrofonafstande sm = 6 cm og sn = 4
cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.19 10 × 10 rektangulært array med mikrofonafstande sm = 5 cm og sn = 5 cm.
Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.20 Cirkulært array med 4 og 8 mikrofoner og radius r = 10 cm. . . . . . . . . . . .
7.21 Beampatterns for 24 mikrofoner med forskellige antal cirkler. Array-radius er
12 cm. Lydkilden er placeret i 90◦ . . . . . . . . . . . . . . . . . . . . . . . . . .
7.22 3D afbildning af beampattern (dB) for cirkulært array med 24 mikrofoner placeret i 3 cirkler med størst radius r = 12 cm. Lydkilden er placeret i 90◦ . . . . .
7.23 Effekt af at placere ´en mikrofon i midten af array’et som erstatning for den
inderste ring. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.24 Sammenligningen mellem ordinært og logaritmisk cirkulær geometri med rmax =
12 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.25 Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde placeret i retning 0◦ , 2 meter væk i samme plan som
array’et. Abcissen angiver frekvens i Hz, mens ordinaten angiver retning i grader.
7.26 Konturplot (frekvensrespons) for 1×4-array med varierende indbyrdes mikrofonafstande. Lydkilde placeret i retning 0◦ , 2 meter væk i samme plan som
array’et. Abcissen angiver frekvens i Hz, mens ordinaten angiver retning i grader.
7.27 Mainlobe-bredde som funktion af indbyrdes mikrofonafstand for 1 × 4-array. . .
7.28 1000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære
arrays har radius N/100, hvor N er antal mikrofoner, s˚
a de indbyrdes afstande
er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . . . . . . . . . . . .
7.29 2500 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære
arrays har radius N/100, hvor N er antal mikrofoner, s˚
a de indbyrdes afstande
er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . . . . . . . . . . . .
7.30 4000 Hz: Forskellige geometriers mainlobe-bredde som funktion af antal mikrofoner i systemet. Rektangulært array simuleret som enkeltrække, cirkulære
arrays har radius N/100, hvor N er antal mikrofoner, s˚
a de indbyrdes afstande
er identiske igennem simuleringerne. Lydkilde placeret i 0◦ . . . . . . . . . . . .
7.31 1000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde
placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.32 2500 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde
placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.33 4000 Hz: Effekten af forskellige antal koncentriske cirkler i de ordinært cirkulære geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde
placeret i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.34 1000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige
geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret
i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.35 2500 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige
geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret
i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.36 4000 Hz: Sidelobe-niveau som funktion af antallet af mikrofoner for forskellige
geometrier. De indbyrdes mikrofonafstande holdes konstant. Lydkilde placeret
i 0◦ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.37 Punktkilder placeret i hhv. (1) z = 0 og (2) z > 0. . . . . . . . . . . . . . . . .
95
33
34
35
36
37
38
39
40
41
42
43
43
44
44
45
45
46
46
47
48
7.38 Simulering af effekt ved at ændre lydkildens højde. . . . . . . . . . . . . . . . .
7.39 Undersøgelse af effekten af mikrofonernes fasefejl. . . . . . . . . . . . . . . . . .
7.40 Visualisering af 4×1 rektangulært mikrofon-array (rød), lydkilde (bl˚
a) og refleksionskilder (grøn). Rummet har dimensionerne l×b×h = 6 m×6 m×2.5 m.
Gennemsigtige bl˚
a overflader indikerer rummets vægge. . . . . . . . . . . . . .
7.41 Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9
cm hhv. med og uden refleksioner, α = 0. Kilde placeret i retning 0◦ . . . . . . .
7.42 Beampattern for 4×1 rektangulært array med indbyrdes mikrofonafstand 3,9
cm hhv. med og uden refleksioner, α = 0. Kilde placeret i retning 30◦ . . . . . .
7.43 Undersøgelse af effekten af refleksioner i et rum med forskellige absorptionskoefficienter α. Kilden er placeret i 30◦ . 4×1 rektangulært array med indbyrdes
mikrofonafstande 3,9 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.44 Visualisering af lydkildesignal (f = 1000 Hz) i hhv. tids- og frekvensdomæne. .
7.45 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ .
Primær lydkilde (f = 1000 Hz) placeret i 0◦ . . . . . . . . . . . . . . . . . . . .
7.46 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 180◦ .
Primær lydkilde (f = 1000 Hz) placeret i 0◦ . . . . . . . . . . . . . . . . . . . .
7.47 Modtagede mikrofonsignaler n˚
ar b˚
ade primær lydkilde (1 kHz-sinustone) og
støjkilde er til stede for mikrofon #1 og #4. Støjkilde: 2,5 kHz-sinustone. Lydkilde placeret i 0◦ , støjkilde placeret i 250◦ . . . . . . . . . . . . . . . . . . . . .
7.48 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ .
Primær lydkilde (1 kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 250◦ . . . .
7.49 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ .
Primær lydkilde (1 kHz) placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ . . . . .
7.50 Beamforming-output i tids- og frekvensdomæne med styringsretning w= 0◦ .
Primær lydkilde placeret i 0◦ , støjkilde (2,5 kHz) placeret i 20◦ . Primær lydkilde: 4 kHz-sinustone. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1 Træplade, der repræsenterer et mødebord, med et drejebord, hvor mikrofonerne
placeres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Opstilling i et lyddødt rum med bordplade, drejebord, mikrofoner og lydkilde. .
8.3 Montering af mikrofoner med klæbemasse p˚
a undersiden af drejebordet. Her ses
ogs˚
a en fastmonteret aksel, der fastholder drejebordets centrum under rotation.
8.4 Mikrofoner monteret i drejebord, s˚
a deres membraner og beskyttelsesgitre er
synlige p˚
a oversiden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
◦
er placeret i 0 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . .
9.2 Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
er placeret i 0◦ og udsender en tone p˚
a 1000 Hz. M˚
alingerne er foretaget i
lyddødt rum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3 Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
er placeret i 267◦ og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . .
9.4 Beampatterns for 2×4 array med kolonneafstand p˚
a 3,9 cm og en rækkeafstand
p˚
a 10 cm. Kilden er placeret i 270◦ og udsender hvid støj. . . . . . . . . . . . .
9.5 Beampatterns for 2×4 array med indbyrdes mikrofonafstand i hver række p˚
a 3,9
cm og afstand mellem rækkerne p˚
a 10 cm. Kilden er placeret i 45◦ og udsender
hvid støj. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.6 Beampatterns for cirkulært array med 8 mikrofoner i ´en cirkel og radius r = 3, 9
cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . . . . . .
9.7 Beampatterns for cirkulært array med 16 mikrofoner i ´en cirkel og radius r =
15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . . . .
96
48
49
50
50
51
52
53
54
54
55
56
56
57
60
61
62
62
63
64
64
65
66
66
67
9.8
9.9
9.10
9.11
9.12
9.13
9.14
9.15
9.16
9.17
9.18
9.19
9.20
9.21
9.22
9.23
9.24
9.25
9.26
9.27
9.28
Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius
r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . .
Beampatterns for cirkulært array med 16 mikrofoner i to cirkler og radius
r = 7, 8 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . .
Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius
r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . .
Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius
r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . .
Mainlobe-bredde og sidelobe-niveau som funktion af antal mikrofoner. M˚
alingerne
er foretaget for fire forskellige cirkler med radius r = 3, 9 cm, r = 7, 8 cm,
r = 11, 7 cm og r = 15, 5 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
◦
er placeret 26 cm fra drejebordets centrum ved vinkel 0 og udsender hvid støj.
Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
er placeret 76 cm fra drejebordets centrum ved vinkel 0◦ og udsender hvid støj.
Beampatterns for cirkulært array med 12 mikrofoner i tre cirkler og radius
r = 12, 4 cm. Kilden er placeret i 0◦ og udsender hvid støj, og m˚
alingerne er
foretaget i lyddødt rum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Illustration af forsøgsopstilling, hvor højtaleren er drejet 90◦ væk fra array’et
p˚
a drejebordet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Illustration af forsøgsopstilling med en reflekterende finerplade p˚
a to forskellige
positioner, som er vinkelrette p˚
a kildesignalets indfaldsvinkel. . . . . . . . . . .
Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
◦
er placeret i 0 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . .
Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
◦
er placeret i 315 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . .
Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
er placeret i 77◦ og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . . .
Beampatterns for cirkulært array med 16 mikrofoner i fire cirkler og radius
r = 15, 5 cm. Kilden er placeret i 0◦ og udsender hvid støj. . . . . . . . . . . . .
M˚
alt efterklangstid for klasselokale p˚
a Teknisk Fakultet, SDU. Venligst l˚
ant af
Peter Møller Juhl. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
◦
er placeret i 120 og udsender hvid støj. . . . . . . . . . . . . . . . . . . . . . .
Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius
r = 15, 5 cm. Kilden er placeret i 120◦ og udsender hvid støj. . . . . . . . . . .
Beampatterns for 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm. Kilden
er placeret i 120◦ og udsender hvid støj. M˚
alingerne er foretaget i et klasselokale.
Beampatterns for cirkulært array med 24 mikrofoner i fire cirkler og radius
r = 15, 5 cm. Kilden er placeret i 120◦ og er drejet 180◦ væk fra array’et, og
den udsender hvid støj. M˚
alingerne er foretaget i et klasselokale. . . . . . . . .
Mikrofonsignal i frekvensdomænet for ´en mikrofon i et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt
mikrofonsignal, og kildesignalet er en tone med frekvensen 2500 Hz. . . . . . .
Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt
mikrofonsignal. Kilden er placeret i styringsretningen, som her er 0◦ , og den
udsender en tone med frekvensen 2500 Hz. . . . . . . . . . . . . . . . . . . . . .
97
68
68
69
69
70
71
72
73
74
74
75
76
77
78
79
79
80
81
82
82
83
9.29 Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt
mikrofonsignal. Kilden er placeret 90◦ forskudt i forhold til styringsretningen,
og den udsender en tone med frekvensen 2500 Hz. . . . . . . . . . . . . . . . . 83
9.30 Beamformerens output-signal i frekvensdomænet for et 1×4 array med en indbyrdes mikrofonafstand p˚
a 3,9 cm. Signalet er normeret i forhold til maksimalt
mikrofonsignal. Kilden er placeret 180◦ forskudt i forhold til styringsretningen,
og den udsender en tone med frekvensen 2500 Hz. . . . . . . . . . . . . . . . . 83
98
15
Tabeller
7.1
7.2
7.3
9.1
9.2
9.3
9.4
Oversigt over indbyggede geometrier i ArrayConfiguration.m“. . . . . . . . .
”
Oversigt over indstillingsmuligheder i ArrayConfiguration.m“ og Beamform”
”
ing FFT.m“. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
SNR-resultater for 1×4-array. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Mainlobe-bredder for hhv. 1 × 4- og 2 × 4-array n˚
ar lydkilde er placeret i 0◦ .
Mainlobe-bredder for cirkulære arrays med ´en cirkel og hhv. 8 mikrofoner (r =
3, 9 cm) og 16 mikrofoner (r = 15, 5 cm). Lydkilde er placeret i 0◦ . . . . . . .
Mainlobe-bredde for cirkulært array med 16 mikrofoner i fire cirkler, r = 15, 5
cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Forstærkning af mikrofonsignaler ved forskellige kildepositioner. Styringsretningen er 0◦ . Resultater ses for et rektangulært 1×4 array med indbyrdes mikrofonafstand p˚
a 3,9 cm og for et cirkulært array med 16 mikrofoner i fire
cirkler og radius r = 15, 5 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
. 18
. 19
. 57
. 65
. 67
. 78
. 84
16
Kode
1
2
Beregning af komplekse faser. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Mikrofonsignalerne dataFFT multipliceres med de tilhørende, komplekse faser.
Resultatet konverteres til effekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
100
Litteratur
17
Litteraturliste
[1] Hesse, Ulrik,
Danskerne bliver højere og tungere“,
”
http://www.si-folkesundhed.dk/Ugens%20tal%20for%20folkesundhed/
Ugens%20tal48 2007.aspx
SDU, 2007.
[2] Br¨
uel & Kjær,
Microphone Handbook“,
”
Br¨
uel & Kjær A/S, Februar 1995.
[3] Br¨
uel & Kjær,
4958 - 20 kHz precision array microphone“,
”
http://www.bksv.dk/Products/transducers/acoustic/microphones/microphonepreamplifier-combinations/4958,
29-04-2014
[4] National Instruments,
NI USB-4431“,
”
http://sine.ni.com/nips/cds/view/p/lang/da/nid/206676
29-04-2014
[5] Knud Rasmussen,
Lydfelter“,
”
Institut for Akustisk Teknologi, DTU, 1996,
Note 2107
[6] Johnson, Don H.; Dudgeon, Dan E.,
Array Signal Processing - Concepts And Techniques“,
”
Prentice Hall, 1993,
ISBN 0-13-048513-6
[7] Bai, Mingsian R.; Ih, Jeong-Guon; Benesty, Jacob,
Acoustic Array Systems - Theory, Implementation, and Application“,
”
Wiley, 2013,
ISBN 978-0-470-82723-9
[8] Brandstein, M.; Ward, D.,
Microphone Arrays - Signal Processing Techniques and Applications“,
”
Springer, 2001,
ISBN 3-540-41953-5
[9] Dmochowski, Jacek; Benesty, Jacob; Aff`es, Sofi`ene,
On Spatial Aliasing in Microphone Arrays“,
”
http://www.researchgate.net/publication/224355184 On Spatial Aliasing
in Microphone Arrays/file/e0b4951a8d4de28459.pdf,
IEEE Transactions on signal processing, Vol. 57, No.4, April 2009
[10] Hald, Jørgen,
Beamforming and Wavenumber Processing“,
”
Br¨
uel & Kjær A/S, Nærum
[11] Forside for Acoustic Camera,
http://www.acoustic-camera.com/en.html,
12-05-2014
101
Litteratur
[12] Forside for Br¨
uel & Kjær,
http://www.bksv.dk/,
12-05-2014
[13] Forside for ClearOne,
http://www.clearone.com/,
12-05-2014
[14] Bhullar, Singh Pushpinder,
Sensitivity Analysis of a Beamforming Technique for Acoustic Measurements“,
”
Punjab Technical University, India, 2004
[15] Moore, Brian C. J.,
An Introduction to the Psychology of Hearing“,
”
Brill, 2013,
ISBN 978-90-04-25242-4
[16] Jacobsen, Finn; Poulsen, Torben; Rindel, Jens Holger; Gade, Anders Christian; Ohlrich,
Mogens,
Fundamentals of Acoustics and Noise Control“,
”
DTU, November 2011
[17] Greensted, Dr. Andrew,
Delay Sum Beamforming“,
”
http://www.labbookpages.co.uk/audio/beamforming/delaySum.html,
The Lab Book Pages, Oktober 2012
102