Grundläggande systemmodeller Klas Nordberg Datorseende Institutionen för systemteknik Linköpings universitet Version: 0.11 – 9 september 2015 2 Innehåll 1 2 3 Signaler och system 1.1 Signaler . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Signaler som representerar fysikaliska storheter 1.1.2 Signaler som representerar information . . . . 1.1.3 Innan vi går vidare . . . . . . . . . . . . . . . 1.2 System . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 System och delsystem . . . . . . . . . . . . . 1.2.2 Flera nivåer av system . . . . . . . . . . . . . 1.2.3 Innan vi går vidare . . . . . . . . . . . . . . . 1.3 Tidsdiskret och tidskontinuerligt . . . . . . . . . . . . 1.3.1 Tidsdiskreta och tidskontinuerliga signaler . . 1.3.2 Binära signaler och meddelanden . . . . . . . 1.3.3 Tidsdiskreta och tidskontinuerliga system . . . 1.4 Enkla system . . . . . . . . . . . . . . . . . . . . . . 1.5 Härnästodeller för signaler och system 2.1 Signalmodeller . . . . . . . . . . . . 2.1.1 Signalrum . . . . . . . . . . . 2.1.2 Begränsade signaler . . . . . 2.2 Systemmodeller . . . . . . . . . . . . 2.2.1 Systemoperator . . . . . . . . 2.2.2 Exempel på systemoperatorer 2.2.3 Kaskadkoppling . . . . . . . 2.2.4 Differentialekvationer . . . . 2.2.5 Linjära ODE . . . . . . . . . 2.2.6 Innan vi fortsätter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 21 22 22 23 23 27 29 31 32 LTI-system 3.1 Linjära system . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Definition av linjärt system . . . . . . . . . . . . . 3.1.2 Hur visa att ett system är linjärt respektive olinjärt? 3.1.3 Exempel på linjära system . . . . . . . . . . . . . 3.1.4 Exempel på olinjära system . . . . . . . . . . . . 3.1.5 Linearisering . . . . . . . . . . . . . . . . . . . . 3.2 Tidsinvarianta system . . . . . . . . . . . . . . . . . . . . 3.2.1 Definition av tidsinvariant system . . . . . . . . . 3.2.2 Hur visa att ett system är tidsinvariant . . . . . . . 3.2.3 Exempel på tidsinvarianta system . . . . . . . . . 3.2.4 Exempel på tidsvarianta system . . . . . . . . . . 3.3 Definiton av LTI-system . . . . . . . . . . . . . . . . . . 3.3.1 Kaskadkoppling av LTI-system . . . . . . . . . . 3.3.2 Linjärkombination av två LTI-systemsystem kommuterar med tidsderivata Stegsvar . . . . . . . . . . . . . . . . . . Impulssvar . . . . . . . . . . . . . . . . . 3.6.1 Definition av impulssvar . . . . . 3.7 Faltning . . . . . . . . . . . . . . . . . . 3.7.1 Tillämpning på LTI-system . . . . 3.8 Kausala system . . . . . . . . . . . . . . 3.9 Stabila system . . . . . . . . . . . . . . . 3.10 Exempel . . . . . . . . . . . . . . . . . . 3.10.1 Förstärkare . . . . . . . . . . . . 3.10.2 Fördröjning . . . . . . . . . . . . 3.10.3 Deriverare . . . . . . . . . . . . . 3.10.4 Linjär ODE . . . . . . . . . . . . 3.11 Tidsdiskreta LTI-system . . . . . . . . . 3.11.1 Faltning . . . . . . . . . . . . . . 3.11.2 Impulssvar . . . . . . . . . . . . 3.12 Innan vi går vidare . . . . . . . . . . . . 3.12.1 I praktiken . . . . . . . . . . . . 3.12.2 Tidsinvariansosinusfunktioner 4.1 Definition av cosinusfunktioner . . . . . . . . . . . . . . . . . . . . 4.1.1 Innan vi fortsätter . . . . . . . . . . . . . . . . . . . . . . . 4.2 Cosinus in - cosinus ut . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Amplitudkarakteristik . . . . . . . . . . . . . . . . . . . . 4.2.2 Faskarakteristik . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Frekvensfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Från impulssvar till frekvensfunktion . . . . . . . . . . . . 4.3.2 Från frekvensfunktion till impulssvar . . . . . . . . . . . . 4.3.3 Frekvens eller vinkelfrekvens? . . . . . . . . . . . . . . . . 4.3.4 Kaskadkopplade system . . . . . . . . . . . . . . . . . . . 4.3.5 Linjärkombinationer av system . . . . . . . . . . . . . . . . 4.3.6 Det inversa systemet . . . . . . . . . . . . . . . . . . . . . 4.3.7 Exempel på frekvensfunktioner . . . . . . . . . . . . . . . 4.4 Generella signaler . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4.1 Linjärkombination av cosinussignaler med samma frekvens 4.4.2 Linjärkombination av cosinussignaler med olika frekvens . . 4.4.3 Bandbegränsade signaler . . . . . . . . . . . . . . . . . . . 4.5 Det tidsdiskreta fallet . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.1 Från impulssvar till frekvensfunktion . . . . . . . . . . . . 4.5.2 Finns negativa frekvenser? . . . . . . . . . . . . . . . . . . 4.5.3 Vikning . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5.4 H(ω) är periodisk för ett tidsdiskret system . . . . . . . . . 4.5.5 Från frekvensfunktion till impulssvar . . . . . . . . . . . . 4.5.6 Innan vi går vidareilter 5.1 Frekvensselektiva filter 5.1.1 Typer av filter . 5.2 Tidsdiskreta filter . . . 5.2.1 FIR-filter . . . 5.3 Filter för detektion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Sampling och rekonstruktion 6.1 Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1.1 Kvantiseringsbrus . . . . . . . . . . . . . . . . . . . . . 6.1.2 Innan vi går vidare . . . . . . . . . . . . . . . . . . . . . 6.2 Rekonstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2.1 Approximativ rekonstruktion . . . . . . . . . . . . . . . . 6.2.2 Ideal rekonstruktion (teori) . . . . . . . . . . . . . . . . . 6.3 Samplingsteoremet . . . . . . . . . . . . . . . . . . . . . . . . . 6.3.1 Formulering av samplingsteoremet . . . . . . . . . . . . . 6.3.2 Ideal rekonstruktion (praktik) . . . . . . . . . . . . . . . 6.4 Omsampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.4.1 Uppsampling . . . . . . . . . . . . . . . . . . . . . . . . 6.4.2 Nedsampling . . . . . . . . . . . . . . . . . . . . . . . . 6.5 Tidskontinuerliga system implementerade med tidsdiskreta system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 85 87 87 88 88 90 92 92 94 95 96 96 97 A Saker vi minns från tidigare kurser A.1 Linjär algebra . . . . . . . . . . A.1.1 Vektorrum . . . . . . . A.1.2 Linjärkombination . . . A.1.3 Linjära transformationer A.1.4 Baser och koordinater . A.1.5 Skalärprodukt och norm A.1.6 Minsta kvadratproblem . A.2 Trigonometri . . . . . . . . . . A.3 Komplexa tal . . . . . . . . . . A.4 Analys . . . . . . . . . . . . . . A.4.1 Definition av derivata . . A.4.2 Några nyttiga uttryck . . A.4.3 Generaliserade integraler A.4.4 Specifika integraler . . . A.4.5 Differentialekvationeroliga funktioner B.1 Arcus tangens med två argument B.2 Enhetssteget . . . . . . . . . . . B.3 Enhetspulsen . . . . . . . . . . B.4 Sinc-funktionen . . . . . . . . . B.5 Ideala impulsfunktionen . . . . B.5.1 Som ett gränsvärde . . . B.5.2 Som en derivata . . . . . B.5.3 Som en funktional . . . B.6 Diskreta Impulsfunktionen . . . B.7 Användbara samband . . . . . . B.8 Gaussfunktionenransmissionssystem C.1 Kanalen . . . . . . C.2 Digital transmission C.2.1 Sändaren . C.2.2 Mottagaren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 114 115 115 118 . . . . . . . . . . . . . . . . . . . . . . . . . . . . D Prediktion 123 D.1 Tillämpningar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 D.1.1 Digital överföring av ljud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 D.1.2 I praktiken . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 5 Index 131 6 Kapitel 1 Signaler och system Två begrepp kommer att dyka upp ofta i den här berättelsen: signaler respektive system. Vi ska därför ägna detta kapitel åt förklara dessa två begrepp och, framförallt, se hur de hänger ihop. Det gör vi med hjälp av de formella definitioner som kan hittas i litteraturen, men också med praktiska exempel. Vi börjar med att titta på signaler. 1.1 Signaler Nationalencyklopedins ordbok förklarar begreppet signal, bland annat, som: “en fysisk företeelse som är bärare av ett budskap från en sändare till en mottagare” [2] och påpekar också att signal har sin rot i det latinska ordet signum som betyder tecken eller märke. Ovanstående definition kan fungera bra som utgångspunkt, men den är inte riktigt på pricken när det gäller denna framställning. Framförallt kommer vi ibland att använda signaler i en lite mer abstrakt form, som inte nödvändigtvis har en koppling till fysiska företeelser. De behöver inte heller vara relaterade på något uppenbart sätt till sändare eller mottagare, även om så ibland är fallet. En för våra ändamål mer precis beskrivning av begreppet signal erbjuds av litteraturen inom området, där en signal kan beskrivas som: “en funktion som innehåller information om beteendet av eller egenskaperna för något fenomen”. [3] Begreppet funktion som förekommer här syftar på en matematisk funktion, dvs. (ofta) en avbildning från reella tal till reella tal. En alternativ definition, om man inte vill trycka på signalens informationsbärande egenskaper, är: “Generellt sett är en signal en tidsvariabel fysisk kvantitet” [4] Lite mer konkreta exempel på vad signaler kan vara ges av den amerikanska organisationen IEEE, vars medlemmar är ingenjörer som arbetar med signaler, när de säger att signaler inkluderar, bland annat: ”ljud, video, tal, bilder, sonar, radar, och signaler för kommunikation, geofysik, medicin och musik” [1] I detta kompendium kommer vi att använda signal i följande betydelse: Definition 1.1: Signal En signal är en funktion av tiden som representerar information eller en fysikalisk kvantitet. Låt oss illustrera med några exempel på signaler som faller inom denna definition. 7 1.1.1 Signaler som representerar fysikaliska storheter Given ovanstående definition av signaler, så kan vi börja med att titta på signaler som utgår från fysikaliska storheter. Här är några exempel på fysikaliska storheter som kan representeras som signaler: • Lufttryck (ljud) • Ljusstyrka • Koncentrationen av ett ämne • Elektrisk spänning eller ström • Temperatur • Position eller hastighet • Elektriskt eller magnetiskt fält • Antalet solfläckar ett visst år • Rotationshastighet De storheter som nämns här handlar inte om, exempelvis, lufttryck eller temperatur i största allmänhet; de flesta storheter är kopplade till någon specifik punkt i rummet. Vad gäller de tre sista storheterna så är de snarare kopplade till specifika objekt, som position och hastighet för ett visst fordon eller rotationshastigheten för en viss motoraxel. Alla dessa storheter ska ses som funktioner av tiden, som fortsättningsvis betecknas t. Eller snarare, det är när vi betraktar storheterna som funktioner av tiden som de blir signaler. Vi kan göra enstaka mätningar av hastigheten på ett fordon, men det ger inte en signal. Om vi däremot utgår från att hastigheten hela tiden har ett bestämt värde så blir den en signal när vi betraktar alla dessa värden sammantagna, i form av funktionen v(t) som anger hastigheten v som funktion av tiden t. Redan här har vi gjort ett grundläggande antagande om en signal. En signal är alltså inte ett värde, exempelvis hastigheten 42 km/h eller temperaturen 800 grader, utan en beskrivning av ett värde som funktion av tiden. Signalen är funktionen och ska inte sammanblandas med signalens, dvs. funktionens, värde vid en viss tidpunkt t. Denna distinktion mellan signalen som en funktion och dess värde vid en viss tidpunkt kan tyckas filosofiskt, men har konsekvenser lite längre fram när vi ska införa matematiska beskrivningar för signaler. För att utgöra en signal är det är inte nödvändigt att en fysikalisk storhet har ett känt numeriskt värde, som observerats med en mätning. Så länge som fysikens lagar säger att storheten existerar och det finns någon slags modell av hur dess värde bestäms vid olika tidpunkter kan vi betrakta den som en signal. Vi behöver inte mäta, till exempel, temperaturen i en punkt för att den ska kunna ses som en signal. De signaler som vi använder i detta kompendium är i huvudsak funktioner av tiden och vars värdemängd är R, de reella talen. Anledningen är att de flesta praktiska exempel på fysikaliska storheter kan representeras med ett reellt tal, exempelvis temperatur, tryck eller elektrisk spänning. Det finns emellertid ingen anledning att vi måste begränsa oss till reellvärda funktioner; exempelvis det elektriska och det magnetiska fältet i en punkt beskrivs bäst med 3-dimensionella vektorer som representerar styrkan och riktningen på respektive fält. Även position och hastighet kan i vissa fall behöva representeras med vektorer. För dessa fysikaliska storheter är det naturligt att signalens värde istället är en vektor med reella tal. Vi kommer även se att det kan finnas anledning att utöka den reella värdemängden till komplexa tal. Det beror inte på att motsvarande fysikaliska storhet har ett komplext värde, utan på att den matematiska beskrivningen av signaler i vissa fall kan förenklas om reella signaler på ett systematiskt sätt översätts till komplexvärda signaler. Det blir alltså enklare när det blir komplext , 1.1.2 Signaler som representerar information Ovanstående exempel på signaler är baserade på fysikaliska storheter, men signaler kan även representera information. En lite mer utförlig definition av begreppet information faller utanför ramen för denna presentation, men låt oss konstatera att det inte enbart är fysikaliska storheter som kan ha ett värde som varierar med tiden. Inom ekonomi och logistik finns det gott om exempel på storheter som låter sig observeras eller har bestämda värden och som varierar som funktioner av tiden, exempelvis: • Priset på en specifik vara • Medelinkomsten eller BNP i ett land • Saldot på ett konto • Arbetslösheten i ett land eller i en yrkeskategori • Antalet producerade enheter av en viss typ • Växelkursen mellan två valutor • Antalet lagrade enheter av en viss typ • Veteskörden globalt ett visst år I dessa exempel är informationen en variabel som, i princip, kan ses som ett reellt tal. 8 1.1.3 Innan vi går vidare Hur är det med tiden, vilken enhet använder vi för tidsvariabeln t? För att använda signaler i praktiken är det viktigt att vi specificerar vilket tidsenhet som används för t, exempelvis sekunder. Det är ofta bra att tänka sig att t anges i sekunder, det är ju en standardiserad enhet för tid, men det är i princip inget som hindrar att t anges i milli- eller mikrosekunder, eller i timmar, dagar eller veckor. Det viktiga är att tidsenheten har definierats när en signal väl ska användas praktiskt och att alla signaler som på något sätt ska kombineras använder samma tidsenhet för sin variabel. Om inget annat anges antar vi att t anges i sekunder. I definition 1.1 på sidan 7 beskrivs en signal som en funktion av tiden. En rimlig fråga att ställa här är: varför kan inte vilken funktion som helst vara en signal? Vi kan t.ex. observera att det finns ett visst samband mellan priset på en vara och efterfrågan på samma vara, där (ofta) efterfrågan kan beskrivas som funktion av priset. Varför är inte denna funktion en signal? Eller funktionen som beskriver sambandet mellan fotoners våglängd och sannolikheten att de ska absorberas av ett visst material, kan inte den vara en signal? Svaret på denna frågeställning har två delar. För det första är den definition som valts här något snäv, den är inte universell. Exempelvis kan en bild ses som en funktion av två rumskoordinater, en horisontell och en vertikal, och faller då inom ramarna för en bredare definition av vad vi menar med signaler. Ett annat exempel på en signal som inte hamnar inom vår definition är om du lyssnar på en radio där du kan ställa in stationen med en ratt. Normalt hör du ljudet som sänds ut av den radiostation som radion är inställd på och ljudet är en signal som egentligen representeras av en fysikaliska kvantitet i form av tryckförändringar i luften. Vrider du ratten så att du hamnar “mellan stationerna” så hörs (ibland) istället ett brus i högtalaren. Bruset representerar varken information eller ljud som vi är vana att höra det, men kan likväl kallas för en signal. För det andra är det inte så att varje funktion som beskriver någon aspekt av verkligheten är en signal. För att utgöra en signal behöver funktionen kopplas till något vi kallar system, vilket beskrivs i nästa avsnitt. 1.2 System När vi studerar signaler är det sällan de förekommer enskilt och isolerade från allting annat. Exempelvis, om vi studerar en signal i form av temperaturen i en viss punkt så är vi förmodligen också intresserad av den process som påverkar denna temperatur. Eller tvärtom, vi vill studera en viss process och det gör vi genom att undersöka de signaler den ger upphov till. För att ta fram en modell av hur vädret förändras över tiden, och över ett större område, kan vi studera hur temperatur, lufttryck, vind, luftfuktighet, etc. varierar över tiden och på olika platser i området. Alla dessa storheter motsvaras av signaler som genereras av den vädermodell vi studerar. Om vi stället vill beskriva en modell för ett lands ekonomi kan vi studera signaler som priser, löner, räntor, och inflation. Baserat på denna beskrivning av sambandet mellan signaler och system, kan vi presentera en första ansats till definition av vad ett system är och hur det relaterar till signaler: Definition 1.2: System Ett system genererar signaler, signaler påverkar system. Påverkan kan vara momentant men kan även ske över tiden. Vi kommer att behöva förfina denna beskrivning av ett system, men den låter oss göra några viktiga observationer. Den innehåller ett explicit samband mellan signaler och system. Det som är upphovet till en signal är ett system, vi skulle till och med säga att till varje signal finns ett system som är orsaken till att signalen varierar som funktion av tiden. Denna ståndpunkt bygger emellertid på vilken del av verkligheten som studeras. För att förstå hur temperaturen i en viss punkt varierar som funktion av tiden kan vi se temperaturen som en aspekt av ett vädersystem. Om punkten istället befinner sig inne i en vattenfylld kastrull är det snarare den energi som tillförs kastrullen genom elektriciteten som värmer plattan den står på som är det relevanta systemet. Dessa två exempel på system, väder respektive en vattenfylld kastrull på en platta, illustrerar att begreppet system kan te sig på en mångfald olika sätt. En del system är stora och komplexa, andra är små och enkla. En del är konkreta objekt som vi hålla i handen och stoppa i fickan, som en mobiltelefon, andra är mer diffusa eller abstrakta och behöver inte ens ha en fysiskt form, som en nationalekonomisk modell av ett land. 9 Ovanstående samband säger också att ett system är något som kan påverkas av signaler. Ett sätt att beskriva ett system är utgå från att det har ett inre tillstånd, en uppsättning tidsvariabla parametrar (signaler) som beskriver samtliga aspekter av systemet som krävs för att det ska kunna generera de signaler som vi observerar. När vi säger att en signal påverkar ett system så menar vi att det är systemets inre tillstånd som påverkas. Systemets inre tillstånd kan ses som ett slags minne som återspeglar hur vissa signaler påverkat systemet, dess inte tillstånd, vilket i sin tur påverkar de signaler som systemet genererar. För att hålla lite mer ordning i denna diskussion, behöver vi skilja mellan olika typer av signaler, från ett specifikt systems perspektiv: Definition 1.3: Insignaler och utsignaler De signaler som påverkar ett system är systemets insignaler. De signaler som genereras av ett system är systemets utsignaler. Låt oss titta på några konkreta exempel på system och försöka identifiera dess in- och utsignaler: • Högtalare: ofta ett membran som sätts i rörelse av ett magnetiskt fält genererat av en elektrisk spole. Insignal är den elektriska strömmen genom spolen och utsignal är lufttrycket framför membranet. Notera att lufttrycksförändringarna fortplantas från högtalaren som en ljudvåg. • Radio: kan i enklaste fallet beskrivas som en apparat som omvandlar en elektromagnetisk (radio)våg som träffar antennen till (ofta) ljudvågor som genereras av en högtalare. Insignal är radiovågen och utsignal är ljudvågen. En radio har ofta en möjlighet att variera vilken station som den är inställd på, liksom styrkan på ljudet (volymen). Även dessa inställningar kan ses som insignaler till radion, exempelvis i form av vinklar på rattar som anger station respektive volym. Om radion har en utgång som kan kopplas till en extern förstärkare eller högtalare motsvarar det ytterligare en utsignal, i form av en spänning som varierar på samma sätt som ljudet. • Bankkonto: som ofta kan vara räntebärande. Systemets insignal är de insättningar, med minustecken om det är uttag, som görs till kontot vid olika tidpunkter. Utsignalen är summan av alla insättningar, inklusive ränta, som gjorts sedan det öppnades, också de som funktion av tiden. Normalt är även räntan en funktion av tiden och blir då ytterligare en insignal till systemet. • Nervcell: en speciell typ av cell, kopplad till andra nervceller, som karakteriseras av den kan generera en elektrokemisk puls som fortplantas längs ett utskott från cellen (axonen). Hur stark pulsen är och hur ofta den genereras beror på hur cellen stimuleras via en annan typ av cellutskott (dendriter) som är kopplade till andra nervcellers axoner och hur starka dessa kopplingar är. Axonen är nervcellens utsignal och dendriterna dess insignaler. • Farthållare: som försöker hålla bilens hastighet relativt konstant genom att jämföra dess verkliga hastighet med den önskade och påverka motorns gasreglage så att motorn ges ett gaspådrag när hastigheten är för låg, och vice versa. Systemets insignaler är dels den verkliga hastigheten liksom dels den önskade hastigheten, båda kan variera över tiden oberoende av varandra, och utsignal är gaspådraget. • Hörapparat: i enklaste fallet kan en hörapparat helt enkelt vara en förstärkare som förstärker ljudet i örats hörselgång innan det når trumhinnan. Moderna hörapparater kan även dela upp ljudet i olika frekvensområden och förstärka varje frekvensintervall olika mycket, vilket ska kompensera för att örat tappat känslighet på motsvarande sätt. Insignal är de ljudvågor som träffar hörapparatens utsida och utsignal är de ljudvågor som genereras av en liten högtalare nära trumhinnan. I mer avancerad fall kan de utgående ljudvågorna ersättas av en utsignal i form av en rent mekanisk vibration i närliggande ben. • Styrsystemet i en helikopter: ett relativt komplext system som kan användas både till att hålla helikoptern svävande i luften och för att flyga framåt, eller utföra mer avancerad förflyttningar. Insignaler är pilotens utslag av både fotpedaler, en central styrspak och ett par styrspakar vid sidan om piloten. Tillsammans styr de utsignaler i form av rotationshastighet på främre och bakre rotorer, rotorernas lutning mot helikopterns kropp, liksom rotorbladens vinklar och hur dessa varierar under ett rotorvarv. 10 Observera att en del system är enkla i den meningen att de enbart har en insignal och en utsignal, medan andra har flera insignaler och/eller flera utsignaler. 1.2.1 System och delsystem Om vi åter konsulterar Nationalencyklopedin får vi reda på att ett system är “en samling element som hänger samman med varandra så att de bildar en ordnad helhet”. [2] Denna beskrivning av system gör inte någon koppling alls till signaler, på det sätt som gjorts ovan, och antyder att vi i denna framställning använder begreppet system i en snäv bemärkelse. Även om detta stämmer, är definition 1.2 på sidan 9 en mycket vanlig ansats inom studiet av system, framförallt när det gäller ingenjörsämnet signaler och system inom elektroteknik. Som vi ska se, är emellertid de matematiska modeller som då används för signaler och system även tillämpbara inom flera andra vetenskapsområden, såsom ekonomi, logistik, fysik, biologi och medicin. Nationalencyklopedins definition är intressant eftersom den pekar på att ett system består av element som på något sätt fogas samman till en helhet, även om den inte säger något om vad dessa element består av eller hur de fogas samman. I denna framställning gör vi en specifik tolkningen av denna definition. Ett system S kan bestå av enheter som i sig själva är system, eller delsystem, och dessa “hänger samman” genom att utsignaler från ett delsystem kopplas som insignaler till andra delsystem, och insignaler till ett delsystem kopplas som utsignaler från andra delsystem. En utsignal från ett delsystem kan kopplas som insignal till flera andra delsystem, men en insignal till ett delsystem måste härröra till enbart en utsignal från ett annat delsystem.1 Även systemet S har ett antal insignaler och utsignaler. Insignalerna är kopplade till en eller flera delsystem, och utgör deras insignaler utan att det är tydligt specificerat var de kommer ifrån. Utsignalerna för S är utsignaler från en eller flera delsystem som kan “hänga lösa”, utan specificerad koppling till en enhet i S eller utanför S . Figur 1.1 illustrerar hur ett system S består av ett antal delsystem, A, B, C, D. Kopplingen av ut- till insignaler anges av pilar på kopplingarna. Systemet S har två insignaler, x(t) och u(t), kopplade som insignaler till delsystemen A, B respektive D. Det har även två utsignaler y(t) och z(t) som är utsignaler från delsystemen A respektive D. Internt har systemet en signal w(t) som är utsignal från delsystem B och insignal till C och D. Ett lite mer konkret exempel på ett system illustreras i figur 1.2, som visar hur temperaturen för luften i ett rum kan kontrolleras av en regulator som styr ett element. Regulatorn är baserad på en sensor som mäter temperaturen i rummet och en önskad temperatur som kan ställas in av dem som vistas i rummet. I enklaste fallet kopplar regulatorn på elementet (eller ökar mängden varmvatten som flödar genom det) om rummets temperatur är lägre än den önskade och, tvärtom, den stänger av elementet (eller minskar flödet) om rummets temperatur är högre än önskat. Rummets temperatur påverkas av elementet, men även av rummets avkylning mot utomhusluften (som i sin tur beror av yttertemperaturen), av solen som kan lysa in genom fönstret och av hur många människor som finns i rummet. När det gäller systemet i figur 1.2 så är dess funktion relativt klar. Men hur är det med systemet S i figur 1.1, har det verkligen någon mening? Det finns ju både insignaler och utsignaler som inte är specificerade var de kommer ifrån eller hur de är kopplade. Systemet S är någon mening en låda som “hänger i luften”. Ett system utmärks emellertid alltid av att utföra en funktion, inte nödvändigtvis i matematisk mening, utan att det svarar på ett behov att generera vissa önskade utsignaler. Enligt definition 1.1 på sidan 7 utgörs de utsignaler som S har av funktioner av tiden som antingen representerar information eller fysikaliska storheter. Det betyder att vi alltid kan göra en tolkning av vad S gör: det genererar dessa utsignaler som har en meningsfull tolkning i termer av information eller fysikaliska storheter. Även insignalerna går att tolka i termer av: det som påverkar hur utsignalerna genereras. Alternativt kan ett system tjäna som modell eller förklaring till observerade mätningar, exempelvis ett vädersystem i form av en matematisk modell som beskriver hur temperatur, lufttryck, luftfuktighet, etc. hänger samman. Det räcker ofta med att veta hur systemet S kan påverkas av andra system och vilken funktion det har, dvs. vilka utsignaler det genererar, för att förstå hur det ska vara uppbyggt. Exempelvis kan vi beskriva konstruktionen av en högtalare utan att behöva veta hur det system fungerar som ska generera strömmen som högtalaren drivs av. Ett exempel så ett system är drivlinan i en bil. Motorn ger en utsignal i form av ett moment på motoraxeln, det omvandlas av växellådan till ett (ofta) högre moment på drivaxeln, som i sin tur driver hjulen som omvandlar momentet till kraft. Växellådan har även som insignal en växelförare, vilken kan ses som en variabel faktor som 1 Här gör vi en förenkling anpassad till denna framställning. Det går att beskriva system där utsignaler från flera delsystem kopplas samman som gemensamma insignaler, så kallade bussar. 11 Figur 1.1: Ett system S , bestående av fyra delsystem (A, B, C, D). Systemet S har två insignaler x(t) och u(t), två utsignaler y(t) och z(t), samt en intern signal W(t). De fyra delsystemen är sammankopplade med varandra och bildar ett framåtkopplat system. anger momentförhållandet mellan växellådans in- och utgående axlar. Motorn har en insignal från föraren i form av gaspådraget, exempelvis hur mycket gaspedalen tryckts ned. Den har även en insignal i form av bilens last (luftmotstånd, vägens lutning, friktion, etc) som omvandlas till ett visst varvtal på motoraxeln. I exemplet med bilens drivlina innebär “hänger samman” att de olika delsystemen är mekaniskt kopplade till varandra, via axlar, kugghjul eller wirar. I allmänhet kan in- och utsignaler i ett system kopplas via elektriska ledningar, trycksatta vätskor eller gaser, akustiska eller elektromagnetiska vågor som utbreder sig i ett lämpligt medium, eller som ett flöde av pengar, varor, eller människor. Delsystemen måste inte befinna sig i fysisk närhet till varandra för att hänga samman, det räcker med att utsignalen som genereras av ett delsystem A kan påverka ett annat system B, och därmed vara en insignal till B, för att A och B ska hänga samman. Framåtkopplade och återkopplade system System kan ibland delas in i två huvudtyper: framåtkopplade respektive återkopplade system. I ett framåtkopplat system2 S finns det ett “flöde” av signaler som går från systemets insignaler, via systemets delsystem, till dess utsignaler utan att det finns “slingor” där utsignalen från ett delsystem A kopplas tillbaka till ett delsystem B som i sin tur påverkar A. Systemet S i figur 1.1 är ett exempel på ett framåtkopplat system. I ett återkopplat system3 finns det delsystem som är återkopplade, deras utsignaler kopplas tillbaka till tidigare enheter i systemet. Figur 1.2 illustrerar ett återkopplat system. Det finns en slinga av signaler från regulatorn, till elementet, till sensorn och tillbaka till regulatorn. 1.2.2 Flera nivåer av system När vi pratar om system i termer av delsystem som är sammankopplade via sina in- och utsignaler kan vi utgå från två olika, och motsatta, perspektiv som båda är relevanta för en ingenjör som arbetar med system. Det första skulle kunna kallas “uppifrån-och-ned” eller “utifrån-och-in”.4 Vi börjar med helheten, exempelvis en bil eller en mobil2 Engelska: feed forward system feedback system 4 Englska: top down eller outside-in. 3 Engelska: 12 Figur 1.2: Ett system som beskriver en regulator som påverkar ett värmeelement som i sin tur påverkar värmen i ett rum. Rummets temperatur mäts av en sensor som påverkar regulatorn. telefon, och frågar oss vad den består av. Svaret på denna fråga är en samling element eller delsystem tillsammans med en beskrivning av hur de hänger samman i form av hur utsignaler och insignaler är sammankopplade. Varje element/delsystem kan vi sedan betrakta som ett nytt system, ett system på en lägre nivå av komplexitet. Detta system kan vi sedan analysera på samma sätt och beskriva i termer av delsystem kopplade till varandra. Om vi väljer att betrakta människokroppen som ett system kan vi se att den har ett nervsystem, ett matsmältningssystem, ett system för syreförsörjning av kroppens celler, osv. Varje sådan system kan delas upp i delsystem, till exempel olika organ, som påverkar varandra. Organen kan delas upp i mindre och enklare delorgan eller vävnader. Till slut kommer vi ned på cellnivån, och kan sedan fortsätta till cellernas organeller (cellkärna, mitokondrier, membran, osv.) och vidare ned till enskilda molekyler. På varje nivå ser vi system som består av enheter som i sig själva är system. Enheterna, delsystemen, påverkar varandra på olika sätt: genom nervimpulser, genom att sända hormoner genom blodet, genom elektriska potentialer, genom att röda blodkroppar binder syremolekyler till sitt hemoglobin, osv. Signalerna som de olika kroppssystemen påverkar varandra med handlar om fysikaliska storheter av typen elektrisk spänning eller koncentration av olika typer av molekyler, ofta proteiner. Signalerna kan även vara mekaniska i form av muskler som dras samman eller slappnar av, exempelvis för att öppna eller stänga klaffar i hjärtat eller ändra buktigheten för ögonens linser. Ett alternativt perspektiv på system är att utgå från de enklaste komponenterna. Ofta, men inte alltid, har de en generell funktion som kan användas i många olika system. En pump skapar ett tryck i en vätska och kan användas i flera sammanhang, pumpa upp vatten till ett vattentorn, pumpa bränsle in i en bilmotor eller spolarvätskan som ska göra ren vindrutan. Samma sak med en fläkt, ett batteri, en säkring eller ett relä. I kroppen finns ett fåtal celltyper som kan fås att “hänga samman” till alla de olika typer av vävnader och organ som kroppen består av. Det finns många olika sätt att koppla samman dessa och andra komponenter till mer och mer komplexa system Vi kan då använda ett “nedifrån-och-upp” eller “inifrån-och-ut” perspektiv,5 där vi börjar med de enklaste och mest generella enheterna, som sedan kopplas samma till ett mer komplext system. Detta system är i sin tur ett delsystem som kopplas samman med andra delsystem till ett än mer komplext system. Till slut bildar alla dessa enheter, till exempel, en dator, en bil eller en mobiltelefon. Varje gång två delsystem kopplats samman så innebär det, precis som tidigare, att det ena påverkar det andra. En ingenjör behöver ofta kunna använda båda dessa perspektiv för att konstruera och använda komplexa tekniska system. Vissa delsystem behöver endast beskrivas på en översiktlig nivå: vilka in- och utsignaler det har och de senare beror av de förra, vilket motsvarar den funktion som delsystemet utför. Andra delsystem behöver analyseras ända från högsta till lägsta nivå av komplexitet, vilket kan leda till en konstruktionsriktning för ett mekaniskt system eller ett kopplingsschema för en elektroniskt system. Från dessa beskrivningar kan sedan delsystemen massproduceras och säljas. I denna framställning är emellertid perspektivet nedifrån-och-upp det vanligaste. Vi kommer att studera olika typer av relativt enkla enheter som kan användas för att bygga upp mer komplicerade system. Vi gör inte en strikt 5 Englska: bottom up eller inside-out. 13 distinktion mellan vad som är ett system och vad som är dess enheter eller delsystem, eftersom även de senare är system fast på en lägre nivå av komplexitet. Istället kommer båda att helt enkelt kallas system. 1.2.3 Innan vi går vidare Den beskrivning av system som presenteras i definition 1.2 på sidan 9 gör en explicit koppling mellan signaler och system. Den innebär ett slags orsakssammanhang som säger att signaler inte existerar isolerade utan uppstår som en konsekvens av ett eller flera bakomliggande system. Det som gör att värdet av ett systems utsignal eller utsignaler ändrar sig från en tidpunkt till en annan tidpunkt är att det inre tillståndet hos systemet har ändrat sig. Det som åstadkommer denna ändring i det inre tillståndet är systemets insignaler, återigen ser vi här ett orsakssamband som verkar över tiden. Det är denna explicita koppling till system och de orsakssamband som finns i dessa relationer som gör att det är specifikt funktioner av tiden som kommer i fråga som signaler. Andra typer av funktioner, med andra typer av variabler, har helt enkelt inte dessa orsakssamband i relation till system. 1.3 Tidsdiskret och tidskontinuerligt Om vi återvänder till avsnitt 1.1.2, till listan med exempel på signaler som representerar information, kan vi göra en viktig observation för i alla fall några av de storheter som nämns. Även om det i princip skulle gå att bestämma deras värde vid varje möjligt värde på tiden t, så är det i praktiken ofta så att de inte varierar (eller har ett bestämt värde) under vissa tidsperioder. Exempelvis bestäms ofta medelinkomst och BNP års- eller kvartalsvis och arbetslösheten på månadsbasis. Priset på en vara i närbutiken ändras normalt högst en gång per dygn, liksom bankernas ränta, medan priset på en aktie visserligen kan variera mellan bråkdelar av en sekund, men även här finns ett kortaste tidsintervall för prisförändring som de datoriserade systemen för aktiehandel kan hantera. Även signalen som anger antalet solfläckar under ett år kan sägas vara av denna typ. 1.3.1 Tidsdiskreta och tidskontinuerliga signaler Vissa storheter som kan representeras i form av en signal förändrar sitt värde endast vid bestämda tidpunkter som är separerade av ett konstant tidsintervall T . Det betyder att tidsvariabeln t, vid de tidpunkter när en förändring sker, kan skrivas på formen t = k · T, k ∈ Z, (1.1) dvs. k är ett heltal. För denna typ av signal finns det ingen anledning att hålla rätt på vad den har för värde vid alla tidpunkter t, det räcker med att ange dess värde just vid de tidpunkter som beskrivs av (1.1). Vi skulle till och med kunna representera denna signal med en ny funktion som tar heltalet k som variabel och som returnerar värdet av signalen s vid tidpunkten t = k · T . Denna typ av signal kommer i fortsättningen att kallas för en tidsdiskreta signal och för att skilja dessa från signaler som är funktioner av godtyckliga värden på t ∈ R kallas den senare typen för tidskontinuerlig signal6 . För att enklare skilja tidskontinuerliga signaler från tidsdiskreta kommer vi att använda heltalet k som variabel för den senare typen av signal, och vi kommer dessutom att beteckna signalen s som funktion av k med s[k], för att skilja den från motsvarande signal som funktion av tiden t, vilken som vanligt betecknas med s(t). Given sambandet i (1.1) kan vi då skriva s[k] = s(k · T ). (1.2) I dessa exempel är sambandet mellan den tidskontinuerliga signalen s(t) och motsvarande tidsdiskreta signal s[k] baserat på att s(t) inte varierar, eller inte har ett bestämt värde, mellan bestämda tidpunkter som ligger på avståndet T från varandra. Det är ett sätt att se på tiddiskreta signaler, men det är inte det enda. Ett annat synsätt bygger på att s(t) verkligen varierar hela tiden och har bestämda värden för alla t. I det fallet kan s[k] snarare ses som en slags approximativ beskrivning av s(t), i alla fall om T är tillräckligt liten. Det innebär att om s[k] är känd så kan s(t) återskapas ur s[k], åtminstone approximativt. Ju mindre T är, desto bättre approximation av s(t) kan vi erhålla. I det sammanhanget kallas de enskilda värdena i den tidsdiskreta signalen s[k] för sampel, de kan ses som “prov” tagna ur den tidskontinuerliga signalen s(t). Den process som skapar den tidsdiskreta signalen s[k] från den 6 I vissa texter kallas de två typerna av signaler ibland för analog respektive digital signal. Vi kommer emellertid att konsekvent kalla dem för tidskontinuerliga respektive tidsdiskreta. 14 tidskontinuerliga signalen s(t) kallas sampling och den motsatta processen som återskapar/approximerar s(t) från s[k] kallas rekonstruktion. Vi återkommer till motivet för denna approximation i avsnitt 1.3.3. Eftersom heltalsvariabeln k i dessa fall har ett linjärt beroende med tiden t, enligt (1.1), kommer vi tänka på k som “tiden” eller som en tidsvariabel. I nästa avsnitt dyker emellertid en tredje variant av tidsdiskreta signaler upp, där k inte behöver ha en explicit koppling till tiden, dvs. s(t) som uppfyller (1.2) existerar inte. I det fallet är k snarare en variabel som “räknar upp” signalens värden, utan att beskriva tidpunkter för varje sampel. 1.3.2 Binära signaler och meddelanden Information behöver inte vara begränsad till värden som varierar över tiden, utan kan även handla om text, bilder, ljud, video, web-sidor eller datorprogram, vilket generellt skulle kunna kallas digital information. För var och en av de nämnda informationstyperna finns flertalet standarder för hur de kan representeras i digital form, som sekvenser av nollor och ettor, eller bitar. Genom att dela in bitarna i sekvensen, exempelvis i grupper om 8, 16 eller fler bitar7 , kan grupperna användas till att representera i stort sett vilken typ av information som helst. Det faller emellertid utanför ramen av denna framställning att gå in i hur detta görs för olika typer av digital information. Figur 1.3 visar ett exempel på hur bokstäver, siffror och andra tecken kan representeras i form av grupper om sju bitar. Att bitarna formar en sekvens betyder att de ska lagras eller överföras i en specifik ordning: det finns en första bit, en andra bit, osv. Vi kan se digital information som en funktion vars värdemängd består av symbolerna “noll” och “ett”, och vars variabel är ett heltal k. Det betyder att vi kan representera digital information med en tidsdiskret signal s[k] som har värdemängden {0, 1}, en binär signal. Det som gör en binär signal lite speciell är att den ofta inte har en explicit koppling mellan heltalsvariabeln k och tiden t, som i (1.2). Om vi vill skicka informationen som den binära signalen representerar, från ett ställe till ett annat, får det gärna ta så liten tid som möjligt att göra detta. Hur lång tid det tar beror emellertid inte enbart på den binära signalen, hur många bitar den innehåller, utan även av hur många bitar per tidsenhet som kan överföras, bithastigheten. Om vi känner bithastigheten så ger dess invers hur många tidsenheter varje bit tar, vilket motsvarar T . Denna parameter beror på den utrustning som ska utföra överföringen av den binära signalen, inte på hur vi tolkar informationen som ska sändas. I praktiken kan det vara lite mer komplicerat än vad som beskrivs ovan: bithastigheten (som anger 1/T ) behöver inte vara en konstant. Om bitarna ska skickas över internet kommer bithastigheten att bero på hur många andra användare som nyttjar samma överföringskanal vid just det tillfället, liksom vilken av ofta flera möjliga vägar som informationen tar från sändare till mottagare. Denna observationer innebär att det inte alltid är meningsfullt göra en explicit koppling mellan den tidsdiskreta binära signalen s[k] och en tidskontinuerlig signal s(t), det är enbart s[k] som egentligen existerar som signal. Denna signal är då relativt abstrakt i den meningen att den inte måste ha en fysik motsvarighet som går att mäta eller observera, det viktiga för tolkningen av innehåller i den binära signalen är i vilken ordning bitarna kommer i sekvensen, vilket anges av heltalet k, inte exakt vilka tidpunkter som bitarna kan hänföras till. På grund av sin speciella natur kommer vi i fortsättningen att ibland kalla binära signaler för meddelanden. Ett meddelande s[k] utgörs av en sekvens med symboler som inte nödvändigtvis uppträder vid vissa tidpunkter utan snarare kommer i en specifik ordning, en ordning som specificeras av k ∈ Z. När ett meddelande ska skickas från en sändare till en mottagare måste emellertid meddelandet omvandlas till någon typ av signal som kan överföras. Symbolerna i ett meddelande kan i enklaste fallet vara binära, dvs. “noll” eller “ett”, men kan i princip även tillhöra en större mängd symboler. Exempelvis är morsesignaler uppbyggda av symbolerna “kort”, “lång” och olika långa pauser mellan bokstäver och ord. 1.3.3 Tidsdiskreta och tidskontinuerliga system Uppdelningen av signaler i tidskontinuerliga respektive tidsdiskreta signaler motiveras inte enbart av att de skiljer sig åt i hur de tillåter att signalen varierar. Eftersom signaler och system är nära relaterade återspeglas denna uppdelning även för de system vi ska studera och då blir skillnaden ännu tydligare. Vi kan klassificera system baserat på om de är tidskontinuerliga eller tidsdiskreta. Ett tidskontinuerligt system genererar tidskontinuerliga utsignaler och påverkas av tidskontinuerliga insignaler. Ett tidsdiskret system genererar tidsdiskreta utsignaler och påverkas av tidsdiskreta insignaler. Det är även möjligt att tänka sig hybridvarianter: system som har in- och utsignaler som är en mix av tidskontinuerliga och tidsdiskreta signaler. 7 En grupp om 8 bitar kallas för en byte, vilket är en vanlig enhet för att beskriva en mängd digital information. 15 0100000 0100001 0100010 0100011 0100100 0100101 0100110 0100111 0101000 0101001 0101010 0101011 0101100 0101101 0101110 0101111 0110000 0110001 0110010 0110011 0110100 0110101 0110110 0110111 0111000 0111001 0111010 0111011 0111100 0111101 0111110 0111111 SPACE ! " # $ % & ’ ( ) * + , . / 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 1000000 1000001 1000010 1000011 1000100 1000101 1000110 1000111 1001000 1001001 1001010 1001011 1001100 1001101 1001110 1001111 1010000 1010001 1010010 1010011 1010100 1010101 1010110 1010111 1011000 1011001 1011010 1011011 1011100 1011101 1011110 1011111 @ A B C D E F G H I J K L M N O P Q R S T U V W X Y Z [ \ ] ˆ _ 1100000 1100001 1100010 1100011 1100100 1100101 1100110 1100111 1101000 1101001 1101010 1101011 1101100 1101101 1101110 1101111 1110000 1110001 1110010 1110011 1110100 1110101 1110110 1110111 1111000 1111001 1111010 1111011 1111100 1111101 1111110 ´ a b c d e f g h i j k l m n o p q r s t u v w x y z { | } ∼ Figur 1.3: Siffror, bokstäver och en del andra användbara tecken representerade som sekvenser av binära symboler (bitar) enligt ASCII-standarden. Den ursprungliga standarden definierades enbart för engelsk text och använder sju bitar, men har senare utökats till fler bitar för att kunna hantera skrivtecken som används utanför det engelska språket. 16 Figur 1.4: Ett tidskontinuerligt system, med tidskontinuerliga insignaler x(t) och y(t) samt utsignal z(t), kan implementeras som ett tidsdiskret system med tidsdiskreta insignaler x[k] och y[k] samt utsignal z[k]. De tidskontinuerliga insignalerna x(t) och y(t) behöver då konverteras till tidsdiskret form, x[k] och y[k], via en speciell typ av delsystem (ADC). På motsvarande sätt behöver den tidsdiskreta utsignalen z[k] omvandlas till en tidskontinuerlig form, z(t), via ett speciellt delsystem (DAC). Som vi har sett kan tidskontinuerliga system implementeras på en mängd olika sätt, exempelvis mekaniskt, akustiskt, hydrauliskt, pneumatiskt eller elektriskt. De behöver inte ens vara konstgjorda system utan kan handla om fysikaliska system i form av väder och vind. I tekniska sammanhang är tidsdiskreta system nästan alltid är implementerade i form av digitala system uppbyggda av digital elektronik. Ett sådant system har en intern “klocka” som med jämna mellanrum, motsvarande tidsintervallet T , levererar en plus till alla de delar i systemet som utför beräkningar och lagrar resultaten i minnen som då låser det senaste sampelvärdet för en tidsdiskret signal till det värde det ska ha fram tills att nästa puls kommer. Inom ekonomi och logistik uppstår de tidsdiskreta signalerna istället genom att vissa parametrar, exempelvis priser, inte ändras annat efter bestämda intervall, eller att mätningen av vissa storheter görs över bestämda intervall. Många av de exempel på system som har presenterats hittills, inklusive de på sidan 10, är tidskontinuerliga: alla in- och utsignaler är tidskontinuerliga. Eller i alla fall, de verkar vara tidskontinuerliga just för att in- och utsignaler är tidskontinuerliga. Moderna tekniska system är ofta uppbyggda internt av tidsdiskreta delsystem. De tidskontinuerliga insignalerna blir omvandlade till tidsdiskreta signaler, som i sin tur blir insignaler till olika interna tidsdiskreta delsystem. På motsvarande sätt blir de tidsdiskreta utsignaler som genereras av olika interna tidsdiskreta delsystem omvandlade till tidskontinuerliga utsignaler från systemet. Ett tidskontinuerligt system uppbyggt på detta sätt illustreras i figur 1.4. Orsaken till att system med tidskontinuerliga in- och utsignaler internt konstrueras med tidsdiskreta system är just att dessa kan implementeras med digital elektronik, vilket har många fördelar. Den är billig, tar liten plats, förbrukar lite energi och kan i vissa fall till och med modifieras för att passa nya tekniska standarder eller ge nya funktioner. I stort sett all konsumentelektronik, exempelvis mobiltelefoner, radio, TV och för ljud är uppbyggd internt av tidsdiskreta system, trots att in- och utsignaler kan vara tidskontinuerliga. Finns det då system som är genuint tidsdiskreta, som inte enbart försöker se ut som ett tidskontinuerligt system? I stort sett all digital elektronik är tidsdiskret, och här är signalerna ofta av den binära typ som beskriv i avsnitt 1.3.2. Exempel på sådana system är datorer av alla de slag, TV-spel, eller något så enkelt som fjärrkontrollen till din TV. Vi kommer emellertid inte att behandla denna typ av system här, digitala system är ett mycket specialiserat område med helt egen teori och praktik som mycket sällan använder de modeller av signaler och system som presenteras här. Däremot kan vi notera att vissa av de system som presenteras i denna framställning med fördel kan implementeras med hjälp av digitala system, dock utan att gå in på i detalj hur detta görs. På liknande sätt kan även ett varulager ses som ett tidsdiskret system. Systemets insignal skulle kunna vara skillnaden mellan de enheter som inkommit (eller tillverkats) under en viss tidsperiod T och de som skickats 17 Figur 1.5: Vänster: Ett varulager kan beskrivas som ett tidsdiskret system vid regelbundna tidpunkter t = k·T lagrar ett saldo i ett “minne” (D) som består av föregående saldo uppräknat med skillnaden mellan tillverkade och sålda enheter under perioden. Insignalen x[t] är antalet tillverkade minus sålda enhet och utsignalen y[t] är lagersaldot. Höger: På liknande sätt kan ett bankkonto beskrivas som ett tidsdiskret system, men här räknas saldot även upp med räntan r för den aktuella perioden. vidare (eller sålts) under samma period. Utsignalen är totala antalet enheter i lagret, saldot. Här är T ofta i storleksordningen av dygn, veckor eller månad. Andra exempel på tidsdiskreta system finns inom ekonomi och logistik. Ett varulager kan ses som ett tidsdiskret system, där insignalen exempelvis är skillnaden mellan de enheter som inkommit (eller tillverkats) under en viss tidsperiod T och de som skickats vidare (eller sålts) under samma period. Här är T ofta i storleksordningen av dygn, veckor eller månad. Ett tidsdiskret system som representerar ett varulager illustreras i figur 1.5, vänster. På liknande sätt kan ett bankkonto kan ses som ett tidsdiskret system, där insignalen exempelvis är summan av insättningar och uttag som gjorts under en dag, och utsignalen är dagens saldo. I denna modell kan vi sätta T = ett dygn, vilket fungerar i det enklaste fallet. I princip skulle samma modell även kunna användas om T = 1 µs om vi dessutom låter insignalen vara = 0 vid alla tidpunkter när inga kontoförändringar görs. I detta fall antar vi att två insättningar eller uttag inte kan ske samtidigt, utan måste skilja sig med minst T tidsenheter. Ett tidsdiskret system som representerar ett bankkonto illustreras i figur 1.5, höger. I detta system räknas saldot upp varje tidsperiod med räntan r. Som nämnts ovan finns det vid sidan av tidskontinuerliga och tidsdiskreta system även hybrider, som har en blandning av tidskontinuerliga och tidsdiskreta in- och utsignaler. Här är några exempel på hybrider mellan tidskontinuerliga och tidsdiskreta system som förekommer i tekniska sammanhang. Ytterligare exempel på system som är hybrider mellan tidsdiskreta och tidskontinuerliga presenteras längre fram. Sampling (ADC) En samplare (eller samplingsenhet) omvandlar en tidskontinuerlig signal s(t) till en tidsdiskret signal s[k], enligt (1.2). Ett annat namn på denna på denna enhet är en analog-till-digital-omvandlare8 eller ADC. En samplare har en intern klocka som kan bestämma tidpunkterna t = k T , för ett bestämt värde på T . I enklaste fallet kan denna typ av system beskrivas som att den mäter insignalen s(t) vid dessa tidpunkter. Efter varje mätning matar den ut mätvärdet (samplet) som den den tidskontinuerliga signalen s[k]. Denna typ av system är inledningsvis tidskontinuerligt, men avslutas som ett tidsdiskret system. Rekonstruktion (DAC) En digital-till-analog-omvandlare9 eller DAC utför den motsatta omvandlingen, från en tidsdiskret signal till en tidsdiskret i enlighet med (1.2). Själva processen att omvandla den tidsdiskreta signalen till en tidskontinuerlig version kallas ibland för rekonstruktion. Ofta kan denna typ av system ansätta att utsignalen s(t) har värdet s[k] vid tidpunkterna t = k · T , men den måste även kunna bestämma rimliga värden för signalen s(t) även för de 8 Engelska: 9 Engelska: analog-to-digital-converter eller ADC digital-to-analog-converter eller DAC 18 mellanliggande tidpunkterna. Det görs ofta genom någon form av interpolation, som bestämmer de mellanliggande värdena för s genom att väga in de sampel som ligger närmast i tiden. 1.4 Enkla system Den beskrivning av system som presenterats ovan är generell och innefattar flera typer av system som kan förekomma i tekniska, ekonomiska och logistiska sammanhang. En del av dessa, som en bil eller en mobiltelefon, kan vara mycket komplicerade eftersom de kan delas upp i många nivåer av system och delsystem, och varje sådant system innehåller en mångfald olika delsystem. Eftersom denna framställning handlar om den grundläggande nivån av system kommer vi att fokusera på mycket enkla typer av system: det som här kallas enkla system. Enkla system är de som endast har en utsignal och en, eller möjligen ett par, insignaler. Ett enkelt system behöver inte vara enkelt till sin funktion, det går att beskriva mycket komplicerade sätt att generera en utsignal från bara en insignal. 1.5 Härnäst Det här kapitlet har presenterat ett stort antal exempel på signaler och system samt även gjort ett formella definitioner av vad dessa två begrepp innebär. Vi har också ett att signaler, men även system, kan delas in i två kategorier: tidskontinuerliga respektive tidsdiskreta. Den matematiska modellen som vi använder för våra signaler är som funktioner av tiden, alternativt av en heltalsvariabel som ibland kan associeras med tiden men ibland bara räknar upp värdena i en sekvens. Däremot har vi inte diskuterat någon matematisk modell för de system som vi undersöker. Vi kommer att fokusera på enkla system och i kapitel 2 presenteras ett par mycket vanliga systemmodeller tillsammans med exempel på när de är relevanta. De är emellertid inte tillräckliga för alla de system vi ska undersöka och fler matematiska modeller av system kommer att introduceras längre fram, när lite mer teori är på plats. En mycket specifik systemmodell, den för linjära och tidsinvarianta system, presenteras sedan i kapitel 3. Trots sin enkelhet är den mycket generell och samtidigt tillämpbar för många av typer av system som förekommer i den lägsta nivån av stora och komplexa system. Att förstå hur dessa enkla system fungerar, liksom de matematiska modeller som används för dom, är därför viktigt för att kunna konstruera mera komplexa system. 19 20 Kapitel 2 Modeller för signaler och system Vi inleder med en påminnelse om notationen. Formellt betecknar x(t) värdet av funktionen x när dess variabel har värdet t, d.v.s. x(t) betecknar ett funktionsvärde (t.ex. ett reellt tal). Informellt kan x(t) även användas för att ange funktionen x och samtidigt deklarera att den specifikt är en funktion av variabeln t, tiden. Det är den senare, informella, användningen som vi nyttjar här när vi pratar om ett system som har insignalen x(t) och utsignalen y(t). De är två funktioner, som egentligen skulle kunna betecknas som x respektive y, men vi vill explicit ange att de beror av en tidsvariabel t. Motsvarande diskussion gäller även för tidsdiskreta signaler: exempelvis x[k] betecknar en funktion av den diskreta tidsvariabeln k. 2.1 Signalmodeller Vi tidigare sagt att signaler utgörs av funktioner av tiden. I detta avsnitt ska vi göra en lite mer specifik tolkning av vad det betyder och definiera en rimlig begränsning i hur vi kan välja våra signaler. 2.1.1 Signalrum Begreppet vektorrum är generellt, det innefattar vektorer av typen Rn men kan användas för att beskriva alla typer av matematiska objekt som uppfyller de två egenskaperna som nämns i beskrivningen av vektorrum, avsnitt A.1.1. De två egenskaperna är vektoraddition och multiplikation mellan vektor och skalär, så länge de operationerna är väldefinierade och uppfyller övriga “normala” krav som kan ställas på sådana operationer utgör en godtycklig mängd med vektorer respektive skalärer ett vektorrum. Ett exempel på ett mer generellt vektorrum är att betrakta funktioner som vektorer och då tillsammans med de reella talen som skalärer. Att det fungerar beror på att det är helt entydigt vad vi menar med den funktion som är summan av två funktioner, liksom den funktion som blir resultatet av att multiplicera en funktion med en skalär (ett reellt tal). Det betyder inte att funktioner och element i Rn är samma sak, det betyder snarare att de uppträder på ett liknande sätt vad gäller de två grundläggande operationerna: addition av vektorer och multiplikation mellan vektor och skalär. På samma sätt som R2 och R3 är två distinkta vektorrum kan vi därför definiera en tredje typ av vektorrum det som uppstår när vi betraktar funktioner som vektorer. Eftersom de funktioner vi är intresserade av utgörs av signaler kommer vi i fortsättningen att kalla denna typ av vektorrum för ett signalrum. I princip skulle vi kunna tänka oss ett signalrum bestående av mängden av alla funktioner som avbildar reella tal till reella tal (vektorerna) tillsammans med mängden av reella tal (skalärerna). Detta signalrum är emellertid lite för stort eftersom det innehåller en del funktioner som inte går att använda praktiskt, t.ex. inte går att derivera eller integrera. Därför brukar de funktioner som får utgöra grunden för vårt signalrum begränsas på olika sätt så att de enbart innehåller funktioner som som ger väldefinierade resultat när de utsätts för, exempelvis, derivering eller integrering. Vi går inte djupare in på exakt vilket eller vilka signalrum som skulle kunna komma ifråga men utgår från att det finns ett sådan signalrum, innehållandes alla de “vanliga” funktioner som du känner till från kurser i matematisk analys. I fortsättningen antar vi att de signaler som förekommer är element i ett signalrum som betecknas med S. Eftersom signaler uppträder som vektorer, element i signalrummet S, kan vi definiera vad som menas med en linjärkombination av signaler. Om vi har n signaler s1 (t), . . . , sn (t) och n skalärer α1 , . . . , αn ∈ R så kallar vi 21 signalen s(t), som erhålls med uttrycket s(t) = α1 s1 (t) + α2 s2 (t) + . . . + αn sn (t) = n X αk sn (t), (2.1) k=1 för en linjärkombination av de nämnda signalerna och skalärerna. På motsvarande sätt kan vi definiera vad som menas med en linjär transformation på ett signalrum: en avbildning H från signalrummet till sig själv som uppfyller H{α1 s1 (t) + α2 s2 (t)} = α1 H{s1 (t)} + α2 {H s2 (t)} (2.2) för alla val av signaler s1 , s2 ∈ S och alla val av skalärer α1 , α2 ∈ R. 2.1.2 Begränsade signaler Verkliga signaler, speciellt insignaler till ett system, inte vara beskaffade hur som helst. Exempelvis kan de i praktiken (normalt) inte bli obegränsat stora, eftersom det inte går att konstruera system som kan hantera sådana signaler utan att de går sönder. Därför har vi anledning att definiera vad som menas med en begränsad signal. För en begränsad signal s(t) finns ett tal M < ∞ sådant att |s(t)| ≤ M, för alla t ∈ R. (2.3) En begränsad signal har alltså ett maxvärde som det aldrig överstiger. I det motsatta fallet har vi att göra med en obegränsad signal. Notera att M i ovanstående definition alltid är ≥ 0, men inte nödvändigtvis måste vara det minsta reella tal som går att hitta och som uppfyller (2.3). Det räcker med att vi hittat något M som uppfyller (2.3) för att signalen ska vara begränsad. Motsvarande definition gäller även för tidsdiskreta signaler. Exempel 1 Signalen s(t) = cos(t) är en begränsad signal, eftersom den uppfyller (2.3), exempelvis för M = 5. Exempel 2 stora t. Signalen s[t] = et är en obegränsad signal, eftersom den kan bli hur stor som helst för tillräckligt Sammanfattningsvis är en signal i praktiken nästan alltid begränsad. Om den kunde bli obegränsat stor skulle något sannolikt gå sönder, explodera, eller någon skulle skadas. Däremot är det inte säkert att ett system alltid genererar begränsade signaler, även om dess insignaler är begränsade. Vi ska återkomma till den frågan i avsnitt 3.9. 2.2 Systemmodeller Givet att de signaler som förkommer i denna presentation kan identifieras med funktioner av tiden, hur är det med de system som genererar signaler och som påverkas av signaler? Hur kan vi matematiskt beskriva att en funktion y(t) på något sätt beror av insignalen x(t), och att den gör det på ett mer intrikat sätt än att värdet av y vid tiden t beror enbart av x vid tiden t? De matematiska beskrivningar av system som är svaret på denna fråga kallas systemmodeller. Det finns flera systemmodeller att välja mellan och vi börjar med den enklaste. 1 En systemmodell är en matematisk beskrivning av hur ett enkelt system avbildar sin insignal (eller insignaler) till utsignalen. 22 2.2.1 Systemoperator För ett enkelt system, med en insignal x(t) och en utsignal y(t) inför vi nu en mer formell beskrivning av sambandet mellan insignalen och utsignalen genom att skriva y(t) = H{x(t)}. (2.4) Givet diskussionen ovan ska detta samband uttydas som: systemets utsignal y, som är en funktion av t, genereras av ett system som tar en insignal x, som även den är en funktion av t. Sambandet i (2.4) ska emellertid inte uttydas som att funktionsvärdet av utsignalen y vid tiden t enbart beror av funktionsvärdet av insigalen x vid samma tid. Det finns system som har ett sådant samband mellan in- och utsignal, men i det allmänna fallet gäller det inte. Kom ihåg definition 1.2 på sidan 9 som nämner att insignaler kan påverka ett system över tiden. Det betyder, i princip, att funktionsvärdet av y vid tiden t kan bero av värdet som x har vid alla tidpunkter, och det är så (2.4) ska uttolkas. Det beskriver hur en hel funktion, x(t), avbildas till en annan funktion, y(t). Ovanstående diskussion kan alltså sammanfattas med att H avbildar en funktion till en funktion, vilket förmodligen skiljer sig från andra avbildningar som du har stött på tidigare, som till exempel avbildar reella tal till reella tal. För att betona denna skillnad kommer vi att kalla denna typ av avbildning för en operator, och i detta specifika sammanhang kommer H att kallas systemoperator, dvs. den operator som beskriver hur utsignalen beror av insignalen för den enkla typ av system som vi tittar på här. Vi kan till och med säga att H är en en slags matematisk representation av själva systemet. Systemet genererar en utsignal, y(t), men exakt vilken utsignal som genereras beror av vilken insignal, x(t), som matas in i systemet och vilken operator systemet har. Det är precis detta samband mellan in- och utsignal som formaliserats i (2.4). I det fall att systemet har flera insignaler, exempelvis två insignaler x1 (t) och x2 (t), kan vi skriva y(t) = H{x1 (t), x2 (t)}. (2.5) Ovanstående notation definierar H som ett tidskontinuerligt system, med tidskontinuerliga in- och utsignaler, men fungerar även för ett tidsdiskret system med tidsdiskret insignal x[k] och utsignal y[k]: y[k] = H{x[k]}, (2.6) eller för en ADC (beskrivs i avsnitt 1.3.3) med tidskontinuerlig insignal x(t) och tidsdiskret utsignal x[k]: y[k] = H{x(t)}. 2.2.2 (2.7) Exempel på systemoperatorer För att bättre förstå hur detta med systemoperator fungerar ska vi titta närmare på ett antal vanliga typer av enkla system. De flesta exemplen illustreras enbart som tidskontinuerliga system, som enkelt kan generaliseras till motsvarande tidsdiskreta system. Adderare En adderare har två eller flera insignaler och genererar en utsignal som summan av insignalerna: y(t) = H{x1 (t), x2 (t), . . . , xn (t)} = x1 (t) + x2 (t) + . . . + xn (t). (2.8) Addition av signaler kan vara en önskad funktion som vi vill kunna åstadkomma i ett system och därför använder vi en adderare som ett delsystem i ett större system. Det kan emellertid lika gärna handla om att en analys av ett större system ger vid handen att signaler på ett naturligt sätt summeras vare sig vi vill det eller inte. Exempelvis, en mikrofon tar upp summan av de ljudvågor som träffar den, även om de kommer från olika ljudkällor. Samma sak gäller för en antenn som registrerar radiovågor. Den elektromagnetiska våg som antennen tar upp är summan av alla vågor som når fram till antennen, även om de kommer från flera olika sändare. Registrering av ljud-, ljus- eller radiovågor är exempel på ett generellt fenomen som finns i många tekniska system: superposition eller överlagring. I en specifik punkt i rummet kommer vågorna att överlagras till den kombinerade signal som kan påverka ett system. Exempelvis, de ljudvågor som sätter trumhinnan i rörelse kan komma från ett flertal olika ljudkällor i örats omgivning. Den effektiva ljudvåg som påverkar trumhinnan är summan (eller överlagringen) av dessa ljudvågor som de uppfattas i en punkt i hörselgången. 23 Subtraherare och multiplikator På liknande sätt kan vi definiera ett system som bildar skillnaden mellan två insignaler, en subtraherare: y(t) = H{x1 (t), x2 (t)} = x1 (t) − x2 (t), (2.9) y(t) = H{x1 (t), x2 (t)} = x1 (t) · x2 (t). (2.10) eller produkten, en multiplikator: I allmänhet och vid behov kan vi givetvis utöka vår repertoar av hur två eller flera funktioner kan kombinera med hjälp av olika matematiska uttryck, men vi stannar vid dessa exempel. Fördröjning En fördröjning är en typ av system som kan beskrivas som y(t) = H{x(t)} = x(t − ∆t), (2.11) där ∆t är en konstant. En fördröjning är ett första exempel på ett system där utsignalens värde vid tiden t inte beror av insignalens värde vid samma tidpunkt. En fördröjning måste ha någon typ av minne, ett inre tillstånd, som minns värdet av insignalen en tid bakåt, motsvarande fördröjningen ∆t. Notera att det som operatorn H egentligen utför när den appliceras på insignalen är att byta ut tidsvariabeln t i insignalen mot t − ∆t i utsignalen. En fördröjning kan vara ett önskad delsystem i ett större system, som vi kommer att se behövs en eller flera sådana i en prediktor. En fördröjning kan även vara en naturlig konsekvens av hur ett system fungerar. Ett exempel är en radiovåg som skickas från en sändare till en mottagare. Det tar då tiden ∆t = L · c innan vågen når fram till mottagaren, där L är avståndet mellan sändaren och mottagaren och c är radiovågens utbredningshastighet. I många fall blir denna fördröjning så liten att den kan försummas, men om kommunikationen sker över stora avstånd och i båda riktningarna kan det vara nödvändigt att explicit ta med fördröjningen i beskrivningen av systemet. Kan fördröjningen ∆t anta vilka värden som helst? I teorin ja, men i praktiken nej. Om ∆t tillåts vara negativt skulle det innebära att utsignalens värde vid tiden t kommer från “framtida” värden i insignalen och det skulle inte gå att konstruera ett sådant system. Därför kan vi tryggt anta att ∆t ≥ 0. I det tidsdiskreta fallet skriver vi systemoperatorn för en fördröjning som y[k] = H{x[k]} = x[k − ∆k], (2.12) där ∆k ∈ Z. Det går alltså enbart att fördröja en tidsdiskret signal med heltal relativt den diskreta tidsvariabeln k vilket, i det fall att s[k] är en samplad version av en tidskontinuerlig signal s(t), betyder att fördröjningen relativt tiden t är heltalsmultiplar av T . Även i det tidsdiskreta fallet måste vi anta att ∆k ≥ 0. Förstärkare En förstärkare har en insignal x(t) och genererar en utsignal y(t) genom att multiplicera insignalen med en konstant faktor, som vi kan beteckna med a: y(t) = H{x(t)} = a · x(t). (2.13) Notera att i detta sammanhang, för en förstärkare, antas a vara en konstant. Skulle a vara tidsvariabel så finns antingen möjligheten att detta beror på yttre påverkan på systemet, vilket motsvarar fallet med den typ av system som beskrivits ovan som en multiplikator. Vi kommer att kalla denna typ av system för en tidsvariabel förstärkare. Ytterligare en karakterisering av en förstärkare är att vi normalt antar att in- och utsignal är av samma typ, exempelvis spänning, tryck, eller moment. Förstärkaren ändrar enbart signalens styrka, inte dess typ. Detta gäller emellertid inte för nästa klass av system, transducer. En kommentar I vardagligt språkbruk brukar vi med förstärkning mena att det som blir förstärkt, i det här fallet insignalen x(t), också blir starkare, vilket antyder att a > 1. Motsvarande system där, exempelvis, a = 0, 5 skulle kanske istället kunna kallas för en dämpare eftersom det dämpar signalens styrka med en viss faktor. Både förstärkare och dämpare har emellertid samma matematiska modell av systemoperatorn, (2.13), och skiljer sig enbart åt i värdet på a. I tekniska sammanhang kallas därför systemet i (2.13) för en förstärkare oavsett värdet på a. I själv verket skulle a kunna vara negativt eller till och med ett komplext tal, (2.13) beskriver fortfarande vad som tekniskt sett är en förstärkare! 24 Transducer Ordet transducer har latinska rötter som betyder ungefär “överförare” eller “omformare” och dess funktion är ofta att omforma en fysikalisk storhet till en annan. En gammaldags kvicksilvertermometer är ett exempel på en transducer. Dess egentliga och önskade funktion är att omforma temperatur till kvicksilverpelarens längd. Anledningen är att vi har lättare att observera denna längd, exempelvis genom att mäta den med en linjal, än vi har att direkt observera temperatur med våra egna sinnen. Vår kunskap om hur kvicksilver (och andra vätskor) reagerar vid olika temperaturer säger oss att pelarens längdförändring är linjärt proportionell mot temperaturförändringen. Termometern överför en temperaturförändring till en längdförändring. Sambandets linearitet är behändigt men i sig inte nödvändigt. Det betyder bara att de olika temperaturangivelserna ligger jämnt utspridda längs skalan, dvs. en temperaturändring på en grad motsvarar samma förändring av pelarens längd oavsett vilken den ursprungliga temperaturen är, men som termometer och transducer skulle det hela fungera bra även om skalan var olinjär. Den generella idén med en transducer kan sägas vara att omvandla en fysikalisk storhet till en annan så att det finns ett enkelt samband mellan de två och ofta, men inte nödvändigtvis, handlar det om ett linjärt samband. Transducerns insignal, som vi kan kalla för x(t), är den fysikaliska storhet som vi vill omvandla från, och dess utsignal, kallad y(t), är den storhet som vi omvandlar till. Båda storheterna betraktar vi som funktioner av tiden. Det vi vill åstadkomma är alltså att det finns ett enkelt samband mellan x(t) och y(t), exempelvis att det är linjärt: y(t) = H{x(t)} = konstant · x(t). (2.14) Notera att den formella beskrivningen av en transducer är samma som för en förstärkare, (2.13). Skillnaden är att en förstärkare ändrar styrkan av en signal, in- och utsignal är av samma typ, medan en transducer överför en signal av en typ till en signal av en annan typ. Konstanten som uppträder i (2.14) är alltså egentligen inte en förstärkningsfaktor utan en proportionalitetsfaktor som anger hur förändringar i insignalen motsvaras av förändringar i utsignalen. I exemplet med termometern kan konstanten ha ett värde som mäts i millimeter per grader Celsius. I stort sett varje typ av sensor kan sägas vara en transducer. Den mäter någon fysikalisk storhet x(t) och omvandlar mätvärdet till en signal y(t), exempelvis en spänning, som sedan kan påverka någon eller några enheter i ett större system. Det finns emellertid även transducrar som inte direkt kan karakteriseras som sensorer. Ett exempel är en högtalare, som omformar en insignal x(t) i form av en elektrisk spänning (volt) till en ljudsignal y(t) i form av lufttryck (pascal eller newton per kvadratmeter). Här är sambandet mellan in- och utsignal egentligen inte att de är proportionella mot varandra, snarare är det att deras tidsderivator är proportionella: d d y(t) = konstant · x(t). dt dt (2.15) Det beror på att alla tryckförändringar som åstadkoms av högtalarens membran genererar en våg som fortplantar sig bort från högtalaren samtidigt som luften framför membranet kommer att vilja återgå till trycket hos den omgivande luften. Derivator En derivator eller deriverare tar en insignal x(t) och genererar en utsignal som är tidsderivatan av signalen: y(t) = H{x(t)} = d x(t). dt (2.16) En derivator är ännu ett exempel på ett system där utsignalens värde vid tiden t, y(t), inte beror enbart av insignalens värde vid samma tidpunkt, x(t). I detta fallet är utsignalens värde, y(t), snarare beroende hur insignalen förändrar sitt värde vid tiden t. En deriverare kan ibland vara ett önskat delsystem i ett större system, för att generera tidsderivatan av en signal. En derivator kan även uppstå naturligt, genom att fysikens lagar ibland innehåller tidsderiveringar. Som ett exempel kan vi betrakta ett system bestående av två elektriska ledare som befinner sig så nära varandra att de kan påverkar varandra genom magnetisk induktion. Vi kan mäta strömmen genom båda ledarna och antar att den ena på något sätt kan kontrolleras så att den varierar enligt funktionen i1 (t). Denna ström är insignalen till detta system. Den andra strömmen i2 (t) antar vi enbart beror av det magnetfält som induceras av strömmen i1 (t), och vi får då sambandet d (2.17) i2 (t) = H{i1 (t)} = konstant · i1 (t). dt 25 Konstanten i detta samband beror av hur de två ledarna är placerade i förhållande till varandra, och av mediet som fyller utrymmet mellan dom.1 Derivering av en signal s(t) definieras som s(t + h) − s(t) d s(t) = lim . h→0 dt h (2.18) Denna typ av gränsvärdesövergång är inte möjlig för en tidsdiskret signal s[k], där ju variabeln k är ett heltal, och därför kan vi inte derivera en tidsdiskret signal. Däremot är det möjligt att på olika sätt definiera operationer på s[k] som liknar derivering. Ett exempel på en sådant system är y[k] = H{x[k]} = x[k] − x[k − 1]. (2.19) Varför denna systemoperator liknar en derivering återkommer vi till. Integrator En integrator eller integrerare integrerar insignalen över tiden. Integrationsintervallet kan vara definierat från −∞ till tidpunkten t, som är variabeln för systemets utsignal: Z t y(t) = H{x(t)} = x(τ) dτ. (2.20) −∞ Notera att eftersom variabeln t förekommer som en av integrationsgränserna måste vi kalla funktionsvariabeln i integranden, dvs. insignalen x, för något annat och här används τ. Även för denna typ av system kommer utsignalens värde vid tiden t att inte enbart bero av insignalens värde vid samma tidpunkt. Den nedre integrationsgränsen behöver inte vara den något obestämda tidpunkten −∞, men är alltid en fix tidpunkt t0 . En annan formulering av en integrator är därför Z t y(t) = H{x(t)} = x(τ) dτ. (2.21) t0 En integrator kan ibland vara en önskat delsystem i ett större system, för att generera tidsintegralen av en signal. En integrator kan även uppstå naturligt, genom att fysikens lagar ibland innehåller tidsderiveringar. Som ett exempel kan vi betrakta en kropp med massan m som kan röra sig fritt i 3 dimensioner. Kroppen påverkas av en kraft, F(t), en 3D-vektor som är en funktion av tiden. Kraften kan komma från ett gravitationsfält eller ett elektriskt fält (om kroppen har elektrisk laddning). Enligt Newtons andra rörelselag finns det ett samband mellan kraften som kroppen utsätts för och dess acceleration a(t): F(t) = m · a(t). (2.22) Även a(t) är en 3D-vektor, som anger accelerationens riktning och styrka. Accelerationen är tidsderivatan av kroppens hastighet, v(t): d F(t) = m · v(t). (2.23) dt Vi kan se kroppen som ett system som påverkas av kraften, dvs. dess insignal är F(t), och resultatet är att den får en viss hastighet, v(t), som vi kan välja att ansätta som dess utsignal. Sambandet mellan in- och utsignal beskrivs då av differentialekvationen i (2.23), vilken i sig inte ger ett direkt uttryck för hur utsignalen v(t) beror av insignalen F(t). Det kan emellertid erhållas genom att uttrycket integreras: Z t Z t d F(τ) dτ = m · v(τ) dτ = m · v(t) − v(t0 ) , (2.24) t0 t0 dτ vilket leder till v(t) = H{F(t)} = v(t0 ) + 1 m Z t F(τ) dτ. (2.25) t0 1 I detta exempel har sambandet mellan de två strömmarna förenklats så att det enbart tar hänsyn till att strömmen i den första ledaren inducerar en ström i den andra ledare. I verkligheten kommer även den andra, inducerade, strömmen att kunna inducera en ström i den första ledaren, som i sin tur inducerar en ström i andra ledaren, osv. Här antar vi helt enkelt att dessa sekundärt inducerade strömmar kan försummas. 26 H3 x(t) H1 H2 y(t) Figur 2.1: Ett system H3 , som består av en kaskadkoppling av H1 och H2 : H3 = H2 H1 Det betyder alltså att så länge som hastigheten vid tidpunkten t0 är känd så kan hastigheten vid en godtycklig tidpunkt beräknas med hjälp av en integrator. Om vi slutligen antar att tidpunkten t0 är vald så att v(t0 ) = 0, så får vi ett system som kan beskrivas enligt Z 1 t v(t) = H{F(t)} = F(τ) dτ. (2.26) m t0 En kommentar I ovanstående exempel valde vi att ansätta kroppens hastighet som dess utsignal men det är ett godtyckligt val. Vi skulle lika gärna kunna välja att sätta kroppens acceleration som utsignal och i så fall konstatera att kroppen agerar som en transducer: den översätter kraft till acceleration med en linjärt samband, (2.23). Alternativt skulle vi kunna sätta kroppens position som dess utsignal. För att erhålla ett samband mellan position och kraft skulle vi då behöva integrera (2.26) en gång till. En tidsdiskret signal kan hanteras på liknande sätt om vi ersätter integralerna med summor: y[t] = H{x[k]} = k X x[l], (2.27) x[l], (2.28) l=−∞ eller y[t] = H{x[k]} = k X l=k0 där k0 är ett fixt heltal. I det tidsdiskreta fallet kallas detta system ibland för summator eller summerare, men det går lika ofta under beteckningen integrator. Ytterligare en kommentar Notera att ett tidsdiskret signal y[k] som bildats genom integration, exempelvis via (2.28), ger en differens med en fördröjd version av sig själv enligt: y[k] − y[k − 1] = k X x[l] − l=k0 k−1 X x[l] = x[k]. (2.29) l=k0 Vidare är denna differens just den tidsdiskreta version av derivering som föreslogs i (2.19). Motivet till detta förslag kan vi se i (2.29): den upphäver integrationsoperationen och vi kan alltså se diskret integration och diskret derivering enligt (2.19) som varandras inverser, på liknande sätt som gäller för tidskontinuerliga signaler. 2.2.3 Kaskadkoppling Låt H1 och H2 vara två enkla system, som båda har varsina in- och en utsignaler. Ett vanligt sätt att konstruera ett mer komplext system är att se dessa två system som delsystem i ett större system och koppa ihop dom. Exempelvis kan vi låta utsignalen från H1 vara insignalen till H2 . Det sammankopplade systemet kan vi beteckna med H3 , och om det får en insignal x(t) kommer det att generera en utsignal y(t): y(t) = H2 {H1 {x(t)}}. 27 (2.30) H1 ⇔ H2 H2 H1 Figur 2.2: Två system H1 och H2 är kommuterande om det inte spelar roll i vilken ordning de kaskadkopplas. Notera att (2.30) innebär att först applicerar vi systemoperator H1 på insignalen x(t), och sedan operator H2 på resultatet av detta. Denna typ av enkel systemkonstruktion kallas seriekoppling eller kaskadkoppling av de två systemen H1 och H2 . Det kaskadkopplade systemet som beskrivs i (2.30) brukar betecknas med H2 H1 . Notera ordning på hur operatorerna står här: H1 är den operator som appliceras först och den står längst till höger. Kaskadkoppling illustreras i figur 2.1. I det generella fallet kan vi kaskadkoppla tre eller flera enkla system på motsvarande sätt. En fråga som kan dyka upp i detta sammanhang är: spelar det någon roll i vilken ordning som vi kaskadkopplar två (eller flera) system? För två godtyckliga enkla system, är H2 H1 samma sak som H1 H2 ? Svaret är nej. Ett exempel är de två systemen H1 {x(t)} = a · x(t), H2 {x(t)} = x(t) + 1. (2.31) I detta fallet får vi H2 H1 {x(t)} = a · x(t) + 1, H1 H2 {x(t)} = a (x(t) + 1) = a · x(t) + a, (2.32) vilket visar att ordningen spelar roll, i alla fall om a , 1. Det finns även gott om fall när inte spelar roll i vilken ordning som systemen kopplas ihop. Exempelvis om det ena är en förstärkare och det andra en fördröjning. Vi kommer att återkomma med fler exempel längre fram, när denna fråga blir aktuell igen. Om två system kan kaskadkopplas i godtycklig ordning har vi att göra med kommuterande system. I motsatta fallet är de icke-kommuterande sysem. 2 I allmänhet spelar det roll i vilken ordning två system kaskadkopplas. Men för kommuterande system spelar det ingen roll. Innan vi går vidare Systemoperatorn kan ses som ett formellt sätt att deklarera att ett enkelt systemet har ett visst antal insignaler, och hur de betecknas, liksom hur dess utsignal betecknas. Om vi har flera olika system kommer varje typ av system att ha sin egen systemoperator. Exempelvis om vi har två olika system med respektive operatorer: y1 (t) = H1 {x1 (t)}, y2 (t) = H2 {x2 (t), x3 (t)}, (2.33) så har vi deklarerat att det första systemet har en systemoperator som tar en insignal, kallad x1 (t), och genererar en utsignal, kallad y1 (t). Det andra systemet tar två insignaler, x2 (t) och x3 (t), och genererar en utsignal y2 (t). Det ligger då nära till hands att vi kan associera ett systems operator med systemet självt, och referera till de två nyss nämnda systemen som H1 respektive H2 . I matematisk mening kan vi se det som att en systemoperator avbildar, eller verkar på, den eller de insignaler som systemet har. Det sker på liknande sätt som en vanligt funktion avbildar reella tal till reella tal, men en operator avbildar istället en eller flera funktioner (insignalerna) till en funktion (utsignalen). I ovanstående exempel, (2.33), finns ingen explicit beskrivning har hur utsignalerna genereras av respektive system. För vissa system går det att ange ett mer eller mindre enkelt uttryck för hur utsignalen beror av insignalen eller insignalerna, exempelvis (2.8) - (2.13), (2.14), (2.16) - (2.21). Detta gäller emellertid inte för alla typer av system som vi kommer att undersöka här. I dessa fall finns det ofta alternativa systemmodeller som ger en användbar beskrivning av systemets funktion, trots att de inte erbjuder ett explicit samband mellan in- och utsignal. I nästa avsnitt ska vi titta på en sådan modell. 28 Figur 2.3: Ett vattentorn består av ett vattenmagasin, med maximal volym ymax , innehållandes y(t) kubikmeter vatten, en huvudledning som förser vattenledningsnätet med x(t) kubikmeter vatten per sekund, en pump som kan fylla på magasinet från en sjö och en regulator som styr pumpen. Pumpen pumpar u(t) kubikmeter vatten per sekund in i magasinet och styrs av en elektrisk effekt p(t) från regulatorn. R Figur 2.4: Ett systemdiagramR som visar hur vattentornets delsystem och signaler är sammankopplade. P är pumpen, R regulatorn och symbolen är en integrator. 2.2.4 Differentialekvationer En omfattande klass av system beskriver sambandet mellan in- och utsignal i form av en differentialekvation. I enklaste fallet kan det handla om att utsignalen y(t) är tidsderivatan av insignalen och i det fallet har vi den typ av system som beskrivs av (2.16), som också ger ett explicit samband som beskriver hur utsignalen beror av insignalen. Alternativt är det tidsderivatan av utsignalen som är proportionell mot insignalen, exempelvis (2.23), och genom att integrera ett sådant uttryck kan vi få ett direkt samband som anger hur utsignalen beror av insignalen, som i (2.25). Det finns emellertid även differentialekvationer som är mer komplicerade att analysera vad gäller sambandet mellan in- och utsignal. Låt oss titta på ett exempel. Ett exempel: vattentorn Ett vattentorn innehållet ett högt beläget vattenmagasin som kan upprätthålla trycket för det vatten som levereras, exempelvis, till ett kommunalt vattenledningsnät. Vattentornet har en pump som pumpar vatten från en intilliggande sjö in i magasinet och en huvudledning som levererar vatten ut i ledningsnätet. Vattentornet behöver även en regulator som styr pumpen så att den pumpar vatten i magasinet för att kompensera för det vatten som levereras 29 till nätet. Se figur 2.3. Vi kan se vattentornet som ett system med ett antal signaler. Vi har x(t) som anger hur mycket vatten som flödar ut ur huvudledningen till vattennätet per tidsenhet, dvs. den totala efterfrågan på vatten per tidenhet av nätets kunder. Signalen x(t) kan mätas med en flödesmätare, exempelvis i kubikmeter per sekund. Vidare y(t) som anger mängden vatten som finns i magasinet, vilken enkelt kan erhållas i kubikmeter genom att mäta vattenytans höjd förutsatt att magasinets väggar kan antas vara vertikala. Pumpen producerar ett vattenflöde u(t) (kubikmeter per sekund) som fyller på magasinet och den styrs av en elektrisk effekt p(t) (Watt) som genereras av regulatorn. Här antar vi att u(t) = kpump · p(t), dvs. pumpen agerar som en transducer som översätter elektrisk effekt till vattenflöde med ett linjärt samband. För att förstå hur detta system fungerar kan vi även rita ett systemdiagram som visar hur de olika delsystemen och signalerna hänger samman, vilka delsystem som påverkar vilka andra delsystem och hur, se figur 2.4. Förutom pumpen och regulatorn ser vi här även en subtraherare och en integrator. Både dessa delsystem är abstrakta i den meningen att de inte motsvaras av en “apparat” och fysisk låda som gör något. Subtraheraren uppstår naturligt i och med att det totala flödet som påverkar volymen i magasinet är skillnaden mellan inflödet från pumpen, u(t), och utflödet till nätet, x(t). Den totala mängden vatten i magasinet, y(t) är integralen av denna differens, där vi antar att integreringen sker från tiden t0 då y(t0 ) = ymax . En kommentar Notera att detta schema anger att x(t) är en insignal till systemet, trots att det anger hur mycket vatten som flödar ut genom huvudledningen. Att vattnet flödar ut betyder alltså inte automatiskt att flödet är en utsignal! Att detta flöde blir en insignal är naturligt eftersom det påverkar systemets inre tillstånd, som i det är fallet är y(t), magasinets volym. Det inre tillståndet är ett “minne” som kommer ihåg differensen av hur mycket vatten som flödat in respektive ut ur magasinet, totalt sett över tiden. Motsatta orsakssambandet finns inte: det kommer inte att flöda ut mer vatten i huvudledningen om vi ökar volymen i magasinet. En kommentar till I fortsättningen kommer vi att sätta systemet utsignal som y(t), mängden vatten i magasinet. Detta är en helt godtyckligt val. Vi kunde lika gärna ha valt att betrakta ett system som har någon annan av de signaler som finns i systemet som utsignal, eller flera av dessa som utsignaler. Alternativt kunde utsignalen(erna) ha varit integraler, derivator eller olika typer av kombinationer av de olika signalerna. Eftersom vi i detta exempel är specifikt intresserade av beskriva hur x(t) påverkar y(t) väljer vi x(t) som insignal och y(t) som utsignal. För att kunna erhålla ett samband mellan x(t) och y(t) måste vi även veta hur regulatorn styr pumpen. Regulatorn har som sagt till uppgift att se till att det vatten som levereras till nätet kompenseras för genom att nytt vatten pumpas in i magasinet, med målet att hålla vattenytan så nära den maximala, vilket motsvarar volymen ymax . Det gör regulatorn genom att förse pumpen med elektrisk effekt p(t) och pumpen omvandlar den effekten linjärt till ett vattenflöde u(t) in i magasinet. Frågan är emellertid hur p(t) ska bero av y(t), möjligen i kombination med x(t). Det finns flera tänkbara varianter, en del bättre och en del sämre. Ett enkelt sätt att reglera pumpen är att starta den på full effekt så fort y(t) < ymax , och sedan stoppa pumpen när y(t) = ymax . Det skulle i princip fungera, men resultatet blir en pump som hela tiden kommer att slås av och på, och då på full effekt, så fort någon vill dricka ett vattenglas ute i nätet. Pumpen skulle sannolikt utsättas för stora mekaniskt påfrestningar under sin livstid, som därmed blir kort. Ett annat alternativ är att låta pumpeffekten vara proportionell mot x(t), dvs. mängden vatten som levereras. På så sätt skulle pumpen kompensera den mängd vatten som levereras i huvudledningen med den mängd vatten som pumpas in. Om magasinet först pumpas upp till volymen y(t) = ymax och vi sedan reglerar pumpen på detta sätt, kommer y(t) = ymax resten av tiden. I praktiken är det emellertid svårt att finna en proportionalitetskonstant mellan pumpeffekten och x(t) så att vattenflödena in och ut ur magasinet exakt balanseras. Om konstanten blir för liten kommer magasinet långsamt att tömmas, och är den för stor går pumpen på för hög effekt och måste stoppas för att inte överfylla magasinet, för att sedan startas igen om det fortfarande finns ett utflöde. Återigen utsätts pumpen för en driftssituation som inte är optimal. En tredje variant som kan användas i praktiken är en variant av den första: att tillåta volymen i magasinet att tömmas ned till en viss gräns y1 innan pumpen slås på med full effekt, varefter den stoppas när y(t) = ymax . Teoretiskt skulle då volymen pendla mellan ymax och y1 , medan pumpen enbart behöver arbeta i vissa begränsade tidsintervall. Denna typ av styrning kallas hysteresstyrning. När pumpen pumpar skulle den emellertid fortfarande arbeta med full effekt, som skulle kunna behöva vara ganska stor för att kunna hantera stora utflöden. 30 Ett lite klurigare sätt att styra pumpen är att låta den pumpa med en effekt som är proportionell mot ymax − y(t). Ju närmare magasinet är att fyllas helt, desto mindre vatten pumpas och tvärtom. På morgonen när många ska duscha och spola i toaletter kommer pumpen att behöva gå nära full effekt, medan på natten när vattenbehovet är lågt kan effekten ligga nära noll. Pumpen kommer alltså enbart att gå på full effekt under de korta perioder när det finns ett stort behöva av vatten i nätet, vilket bör vara nära en optimal driftsituation. Tidsderivatan av y(t) är i detta fallet lika med den mängd vatten som pumpas in minus den mängd som levereras ut i nätet, båda per tidsenhet: d y(t) = k · ymax − y(t) − x(t) . |{z} | {z } dt inflöde (2.34) utflöde Om funktionen x(t), dvs. efterfrågan på vatten i nätet som funktion av tiden, är känd, kan vi bestämma y(t) genom att lösa differentialekvationen i (2.34). Som vanligt i samband med lösning av differentialekvation kan vi även behöva någon typ av randvillkor för att bestämma lösningen entydigt. 2.2.5 Linjära ODE Differentialekvationen (2.34) är en systemmodell och kallas för en systembeskrivande ekvation2 . Den beskriver ett samband mellan in- och utsignaler för ett enkelt system på ett sådant sätt att för varje given insignal, i detta fallet x(t), kan vi ordna en utsignal y(t). Som redan nämnts kan det ofta krävas någon typ av randvillkor för att bestämningen av y(t) ska bli entydig. I just detta exempel kan det handla om att vi känner till att vid någon speciell tidpunkt, t0 , är magasinets volym känd, exempelvis y(t0 ) = ymax = maxvolymen. Givet detta randvillkor kan magasinets volym y(t) bestämmas entydigt så fort x(t) är känd. När differentialekvationer används som systemmodeller är det brukligt att skriva dom på en form så den okända utsignalen y(t) och dess derivator står i vänsterledet och de kända kvantiteterna står i högerledet: d y(t) + k · y(t) = k · ymax − x(t). dt (2.35) Ytterligare en åtgärd som är vanlig i detta sammanhang är att göra sig av med konstanten k · ymax . Det kan göras, exempelvis, genom att ansätta en ny utsignal z(t) = ymax − y(t). (2.36) Notera att på samma sätt som y(t) är en fysikalisk kvantitet, en vattenvolym, är även z(t) en volym, närmare bestämt den volym som återstår innan magasinet är fullt, residualvolymen. Om vi byter till en beskrivning av systemet med utsignalen z(t), kan dess differentialekvation skrivas d z(t) + k · z(t) = x(t). dt (2.37) Detta byte av utsignal är inte nödvändigt, men kan förenkla den praktiska hanteringen av systemet och dess modell i form av en differentialekvation. När väl z(t) bestämts genom att lösa differentialekvationen (2.37), kan även y(t) bestämmas ur (2.36). Differentialekvationen (2.37) är av en typ som kallas linjär ordinär differentialekvation av första ordningen, eller linjär ODE av första ordningen. Den är en differentialekvation eftersom den okända kvantiteten är en funktion, här z(t), och ekvationen innehåller z(t) och dess derivator av olika ordningar. Den är av första ordningen eftersom den okända funktionen z(t) uppträder med derivator upp till första ordningen. Den är linjär eftersom den okända funktionen uppträder enbart i form av linjära uttryck i z(t) eller dess derivator. Slutligen är den ordinär eftersom de funktioner som uppträder här är funktioner av enda variabel (här t). Egentligen skulle vi kunna lägga till att den linjära ODE:n i (2.37) har konstanta koefficienter, dvs. varje derivata av den okända funktionen z(t) är multiplicerad med en koefficient som är en tidsoberoende konstant. I fortsättningen och om inget annat anges, är det underförstått att en linjär ODE alltid har tidsoberoende koefficienter multiplicerade med de olika derivatorna som hör till den okända funktionen. Generellt kan ett enkelt system ha en systemmodell i form av en linjär ODE av n-te ordningen: an 2 Engelska: dn−1 d dn y(t) + a y(t) + . . . a1 y(t) + a0 y(t) = Uttryck i x(t), n−1 n−1 dtn dt dt governing equation. 31 (2.38) där vi antar att an , 0 och i övrigt att alla an , . . . , a0 är konstanter (oberoende av t). Ofta är även uttrycket i högerledet en linjärkombination mellan derivator av x(t), upp till en viss ordning m, och konstanter (oberoende av t) bm , . . . , b0 : an dn−1 d dm−1 d dm dn y(t) + a y(t) + . . . a x(t) + b x(t) + . . . b1 x(t) + b0 x(t) y(t) + a y(t) = b n−1 1 m−1 0 m dtn dt dtm dt dtn−1 dtm−1 (2.39) där an , bm , 0. Linjära ODE:r av den typ som beskrivs i (2.39) är mycket vanliga som modeller för enkla system och i fortsättningen kommer vi med linjär ODE att mena just denna typ av differentialekvation, där både in- och utsignalen och diverse ordningar av deras derivator uppträder tillsammans med (tidsoberoende) konstanter. De uppträder typiskt som resultatet av en analys av hur sambandet mellan in- och utsignal ser ut för mekaniska system, uppbyggda exempelvis av fjädrar och dämpare, liksom för elektriska kretsar. I nästa kapitel ska vi se att system som kan modelleras med hjälp av linjära ODE:r ingår i en ännu större klass av system, så kallade LTI-system. En kommentar Varför bråka om att konstanterna är tidsoberoende? Kan vi inte bara säga att de är konstanter? Det finns emellertid inget i hanteringen av differentialekvationer som verkligen kräver att koefficienterna an , . . . , a0 och bm , . . . , b0 måste vara konstanta i en absolut mening. Det enda som krävs i detta sammanhang är att de inte varierar som funktioner av t. De skulle kunna vara funktioner av någon annan variabel, exempelvis en funktion av skonumret för arkitekten som ritade vattentornet. Så länge dessa koefficienter har beroenden av andra variabler än t så kan lösningen av differentialekvationerna erhållas med standardmetoder för linjära ODE:r. Vi kommer att behöva använda denna möjlighet lite längre fram i berättelsen. En till kommentar Vi har här diskuterat den typ av system som kallas regulator. Vi har redan sett ett exempel på en regulator i figur 1.2 på sidan 13, som styr värmen i ett element baserat på en önskad respektive en uppmätt temperatur, men utan att närmare beskriva hur denna styrning går till. I exemplet med vattentornet och dess pump antyds att styrningen av pumpen kan baseras på skillnaden mellan ett önskat värde för volymen i magasinet, ymax , och ett verkligt värde för volymen, y(t). Denna typ av styrning (reglering) är vanlig i detta sammanhang, men kan även göras på mer sofistikerade sätt. Utformning av regulatorer för olika ändamål studeras i ämnet Reglerteknik. 2.2.6 Innan vi fortsätter I det här avsnittet har vi sett två olika systemmodeller, systemoperator respektive differentialekvation, mera specifikt linjära ODE:r. I fortsättningen kommer vi att se andra och mer specialiserade systemmodeller som är anpassade för vissa typer av system. I nästa kapitel ska vi definiera en stor klass av enkla system som kallas LTI-system och för dessa finns det flera olika systemmodeller att välja mellan. 32 Kapitel 3 LTI-system I detta och några efterföljande kapitel kommer vi att studera en specifik klass av enkla system, med en insignal ofta kallad x(t), och en utsignal ofta kallad y(t), som kallas linjära tidsinvarianta system eller kortare LTI-system. En anledningen till att just dessa är intressanta är dels att flertalet system som förekommer i tekniska, ekonomiska, logistiska, medicinska och biologiska sammanhang är LTI-system, eller i alla fall kan approximeras som sådana. När mer komplexa system bryts ned till enklare delsystem så dyker ofta LTI-system upp i en eller annan form som ett eller flera delsystem. Nästan samtliga exempel på system som har presenterats hittills är LTI-system. En annan anledning är att LTI-system erbjuder ytterligare ett flertal systemmodeller som är enkla men samtidigt kraftfulla beskrivningar av hur dessa system avbildar sin insignal till en utsignal. Det beror på att LTI-system har ett antal specifika egenskaper som gör dom relativt enkla att förstå och hantera praktiskt. I detta kapitel ska vi definiera vad LTI-system är, och även visa några av de speciella egenskaper som dessa system har. I efterföljande kapitel kommer vi sedan in på de systemmodeller som kan användas för att beskriva LTI-system. 3.1 Linjära system Ett LTI-system är ett linjärt system, en egenskap som kommer att definieras i detta avsnitt. För att göra det behöver vi först definiera vad som menas med ett signalrum, och denna definition bygger på att du har de grundläggande begrepp från linjär algebra som beskrivs i avsnitt A.1 klara för dig. 3.1.1 Definition av linjärt system Låt H vara systemoperatorn för ett enkelt system, med en insignal och en utsignal. Om systemoperatorn H uppträder som en linjär transformation på signalrummet S, dvs. uppfyller (2.2) för alla signaler s1 , s2 ∈ S och alla skalärer α1 , α2 ∈ R, då är systemet ett linjärt system. Se figur 3.1 för en illustration. Om H inte är linjärt sägs systemet vara olinjärt eller icke-linjärt. Notera att om systemet H är linjärt så räcker det med att visa (2.2), innehållandes en linjärkombination av två signaler. Denna egenskap leder i sig till att lineariteten även sträcker till linjärkombinationer av tre eller fler signaler. En mer generell definition av ett linjärt system är alltså: för ett godtyckligt antal (n) och godtyckligt valda signaler s1 (t), . . . , sn (t) ∈ S och godtyckligt val av n skalärer α1 , . . . , αn ∈ R ska gälla att H{α1 s1 (t) + . . . + αn sn (t)} = α1 H{s1 (t)} + . . . + αn H{sn (t)}, (3.1) n n X X H α s (t) = αk H{sn (t)}. k n (3.2) eller, ekvivalent, k=1 3.1.2 k=1 Hur visa att ett system är linjärt respektive olinjärt? En viktig fråga i sammanhanget är: för ett givet system H, hur kan jag veta om systemet är linjärt eller inte? Själva definitionen i avsnitt 3.1.1 är naturligtvis en ledtråd, men vad exakt är det som ska göras? 33 För det första räcker det med att använda (2.2), med en linjärkombination av endast två insignaler. För det andra väljer vi en av två möjliga strategier: antingen försöker vi visa att systemet är linjärt eller att det är olinjärt. Om vi inte vet vilken som är den rätta får vi helt prova båda och se vilken som leder till framgång. Vi tar dom i tur och ordning. Visa att systemet är linjärt Om vi antar att systemet är linjärt och ska visa detta så handlar det i grund och botten om att visa att (2.2) gäller för alla val av signaler s1 (t), s2 (t) ∈ S och alla val av skalärer α1 , α2 ∈ R. Enklast görs det genom att applicera systemoperatorn H på s1 (t), s2 (t) efter att de linjärkombineras, i vänsterledet, och före de linjärkombineras, i högerledet. Resultatet ska bli lika om systemet är linjärt. En fälla som kan vara lätt att falla i är att tänka sig att det räcker med att hitta ett eller ett par exempel på signaler s1 (t), s2 (t) för vilka (2.2) stämmer, och sedan tro att systemet är linjärt. För att fastställa att systemet är linjärt kan vi inte begränsa oss till specifika val av insignaler, utan utgå från att s1 (t), s2 (t) är godtyckliga signaler i signalrummet, och även att α1 , α2 ∈ R är godtyckliga. För att kunna genomföra ett sådant bevis måste vi på något sätt kunna bestämma hur systemet H genererar sin utsignal från godtyckliga insignaler. Det är systemmodellerna som diskuterades i kapitel 2 kommer in. Om vi inte vet något om systemet kan vi inte bevisa linearitet, men om vi har en känd systemmodell så är det i alla fall möjligt att göra det, i synnerhet om systemet verkligen är linjärt. Vi återkommer strax med ett antal exempel där vi använder denna strategi på ett antal konkreta system. Ibland måste vi använda alternativa strategier, som är modifikationer av den som föreslås här, för att demonstrera linearitet för ett system. En variant presenteras lite senare i samband med linjära ODE. Visa att systemet är olinjärt Här räcker det med att hitta ett enda exempel på två signaler, s1 (t) och s2 (t), och skalärer α1 , α2 som inte ger likhet mellan vänster- och högerledet i (2.2). För att kunna göra det måste vi återigen ha en matematisk modell av det system som undersöks, exempelvis att dess systemoperator ger ett explicit uttryck för hur utsignalen beror av insignalen, eller att in- och utsignaler är relaterade med en differentialekvation. Vi återkommer strax med ett antal exempel där vi använder denna strategi på ett antal konkreta system. 3.1.3 Exempel på linjära system Finns det då några linjära system? Vi har redan sett flera exempel på linjära system, men kanske inte noterat att de har denna egenskap. Här går vi igenom några av dom, och visar samtidigt att de är linjära. Fördröjning Systemet som utgör en fördröjning i (2.11) är ett linjärt system. Kom ihåg vad dess systemoperator gör med sin insignal: tidsvariabeln t byts ut mot t−∆t. Lineariteten kan vi visa genom att låta x1 (t) och x2 (t) vara två godtyckliga x1 (t) H y1 (t) ⇒ x2 (t) H α1 x1 (t) + α2 x2 (t) H α1 y1 (t) + α2 y2 (t) y2 (t) Figur 3.1: Ett system H genererar utsignalen y1 (t) av insignalen x1 (t) och utsignalen y2 (t) av insignalen x2 (t). Om systemet är linjärt kommer insignalen α1 x1 (t) + α2 x2 (t) att genererar utsignalen α1 y1 (t) + α2 y2 (t). 34 signaler och α1 , α2 ∈ R vara godtyckliga skalärer. Med denna ansats bestämmer vi först vänsterledet i (2.2): VL = H{α1 x1 (t) + α2 x2 (t)} = α1 x1 (t − ∆t) + α2 x2 (t − ∆t), (3.3) HL = α1 H{x1 (t)} + α2 H{x2 (t)} = α1 x1 (t − ∆t) + α2 x2 (t − ∆t). (3.4) och sedan hägerledet: Vi kan sedan konstatera att HL = VL, dvs. vänster- och högerledet är identiska för alla val av signaler x1 (t) och x2 (t) och skalärer α1 , α2 ∈ R. Alltså kan vi dra slutsatsen att systemet är linjärt. Tidsskalning Tidsskalning av en signal x(t) innebär att utsignalen y(t) är identisk med insignalen, men den “matas ut” med en annan hastighet. Formellt kan sambandet mellan in- och utsignal uttryckas som y(t) = H{x(t)} = x(a · t). (3.5) där a är en faktor som anger hastigheten i hur snabbt y(t) varierar i förhållande till x(t). En praktiskt implementering av tidsskalning är en bandspelare som spelat in ljud och som kan spela upp bandet med olika hastigheter, både framåt och bakåt. Om a > 1 spelas ljudet upp snabbare och kommer att låta som mössen i Askungen på julafton, om a = 1 spelas ljudet upp med samma hastighet som det spelades in med och låter helt naturligt, och om 0 < a < 1 spelas ljudet upp långsammare än det spelades in och kommer att låta som när Bowman drar minneskretsarna ur HAL 9000. Om a < 0 kommer ljudet att spelas upp baklänges. Förstärkare Förstärkaren i (2.13) är ett linjärt system. Här blir vänsterledet VL = H{α1 x1 (t) + α2 x2 (t)} = a · (α1 x1 (t) + α2 x2 (t)) = a α1 x1 (t) + a α2 x2 (t), (3.6) HL = α1 H{x1 (t)} + α2 H{x2 (t)} = α1 a x1 (t) + α2 a x2 (t). (3.7) och högerledet De två uttrycken är lika för alla val av signaler x1 , x2 och α1 , α2 ∈ R, och därmed är systemet linjärt. En transducer har samma matematiska representation som en förstärkare och är därmed även den ett linjärt system. En förstärkare har normalt en konstant förstärkningsfaktor: a. En förstärkare med tidsvariabel förstärkning, a(t), är fortfarande ett linjärt system, vilket visas på samma sätt som ovan. Linjära ODE I avsnitt 2.2.5 beskrivs en modell för enkla system i form av en linjär ordinära differentialekvation som beskriver ett samband mellan systemets in- och utsignal. Som antyds av modellens namn är ett system av denna typ även linjärt i den meningen som anges i avsnitt 3.1.1. En linjär ODE är en implicit systemmodell, den anger inte ett explicit uttryck för hur utsignalen bestäms av insignalen. Det gör att vi inte kan använda den strategi som beskrivits ovan för att demonstrera att ett system är linjärt. Om vi vill demonstrera att, exempelvis, det system som beskrivs av den linjära ODE:n i (2.37) är linjärt får vi istället prova en alternativ strategi. Antag att x1 (t) och x2 är två godtyckliga signaler, och skicka in dom i systemet. Var och en av dom kommer att generera en motsvarande utsignal, z1 (t) respektive z2 (t): z1 (t) = H{x1 (t)}, z2 (t) = H{x2 (t)}. (3.8) Dessa två utsignaler kommer då att uppfylla (2.37) i kombination med respektive insignal: d z2 (t) + k · z2 (t) = x2 (t). dt d z1 (t) + k · z1 (t) = x1 (t), dt 35 (3.9) Om systemet är linjärt ska vi kunna skicka in en godtycklig linjärkombination av x1 och x2 som insignal och som utsignal erhålla samma linjärkombination, fast nu av z1 och z2 . Låt α1 , α2 ∈ R vara godtyckliga skalärer och definiera en ny insignal x3 som x3 (t) = α1 x1 (t) + α2 x2 (t), (3.10) och även en signal som är samma linjärkombination av de två utsignalerna: z3 (t) = α1 z1 (t) + α2 z2 (t). (3.11) Om systemet är linjärt ska gälla att z3 (t) är den utsignal som genereras av systemet när den har x3 (t) som insignal, dvs. d z3 (t) + k · z3 (t) = x3 (t). (3.12) dt Det som återstår är alltså att visa att (3.12) följer av (3.9) samt (3.10) och (3.11). Tar vi motsvarande linjärkombination av de två vänsterleden i (3.9), respektive de två högerleden, får vi ! ! d d z1 (t) + k · z1 (t) + α2 z2 (t) + k · z2 (t) = α1 x1 + α2 x2 (t). (3.13) α1 dt dt Vi kan skriva om vänsterledet i denna ekvation för att erhålla α1 d α1 z1 (t) + α2 z2 (t) + k · α1 z1 (t) + α2 z2 (t) = α1 x1 + α2 x2 (t). dt (3.14) Nu återstår endast att sätta in de två sambanden (3.10) och (3.11) i den senaste ekvationen. Resultatet blir (3.12), vilket avslutar beviset att systemet som beskrivs av den linjära ODE:n i (2.37) är linjärt. Ett system som beskrivs av den mer generella formen av linjär ODE, (2.39), kan bevisas vara linjärt på samma sätt som ovan. 3.1.4 Exempel på olinjära system I det här avsnittet ges ett par exempel på system som är olinjära. Exempel 1 Alla system som bestämmer utsignalen y(t) som en olinjär funktion av insignalen, x(t), är olinjära system. Ett enkelt exempel är systemet vars operator ges av y(t) = H{x(t)} = x2 (t) = x(t) · x(t). (3.15) Vi sätter in denna systemoperator i vänsterledet av (2.2): VL = H{α1 x1 (t) + α2 x2 (t)} = α1 x1 (t) + α2 x2 (t) 2 = α21 x12 (t) + 2 α1 α2 x1 (t)x2 (t) + α22 x22 (t), (3.16) och i dess högerled: HL = α1 H{x1 (t)} + α2 H{x2 (t)} = α1 x12 (t) + α2 x22 (t). (3.17) Frågan är nu: kan dessa två uttryck vara lika för godtyckliga val av x1 , x2 ∈ S och godtyckliga skalärer α1 , α2 ∈ R? Prova med att sätta α1 = α2 = 1, vilket ger VL = x12 (t) + 2 x1 (t)x2 (t) + x22 (t), (3.18) HL = (3.19) x12 (t) + x22 (t). Här blir det tydligt att VL , HL för godtyckliga val av x1 , x2 , vilket innebär att systemet inte är linjärt. Ett exempel på val av insignaler och skalärer som gör att det inte är likhet i (2.2) är x1 (t) = x2 (t) = 1 tillsammans med α1 = α2 = 1. Notera att för detta exempel kan vi hitta signaler och reella tal som gör att VL = HL, men det räcker inte; alla val ska ge likhet för att systemet ska vara linjärt. 36 Exempel 2 Ett system som är nästan linjärt, men som inte uppfyller kraven på ett linjärt system, är ett som kan beskrivas med y(t) = H{x(t)} = a · x(t) + k, (3.20) där både a och k är konstanter skilda från noll. För att undersöka systemets linearitet gör vi på samma sätt som ovan: sätter in systemoperatorn i vänsterledet av (2.2): VL = H{α1 x1 (t) + α2 x2 (t)} = a · α1 x1 (t) + α2 x2 (t) + k = a α1 x1 (t) + a α2 x2 (t) + k, (3.21) och i dess högerled: HL = α1 H{x1 (t)} + α2 H{x2 (t)} = a α1 x1 (t) + a α2 x2 (t) + (α1 + α2 ) k. (3.22) Återigen ser vi att, i allmänhet, är VL , HL. I synnerhet är det endast specifika val av skalärerna α1 , α2 som ger VL = HL. Ett exempel på ett val som inte ger liket är α1 = α2 = k = 1. Exempel 3 En tröskling är ett system med insignal x(t) och en utsignal y(t), där 1 x(t) > r, y(t) = H{x(t)} = 0 x(t) < r. (3.23) Här är r en konstant parameter, en tröskel, som insignalen måste överskrida för att utsignalen ska bli = 1. I sammanhanget är det ofta inte viktigt hur fallet x(t) = r hanteras, det kan resultera i endera av de två möjliga värdena av utsignal. Det är inte heller viktigt exakt vilka två värden på utsignal som används, det viktiga är att det finns två distinkta värden på utsignalen som motsvarar att insignalen är mindre eller större än tröskeln r. En tröskling är ett olinjärt system, vilket lämnas som en uppgift att visa. 3.1.5 Linearisering Att systemet i (3.20) är “nästan linjärt” innebär att det enkelt kan göras linjärt om detta är önskvärt. Det görs genom att subtrahera konstanten k från dess utsignal, genom att koppla y(t) till en subtraherare. Resultatet blir en ny utsignal: z(t) = y(t) − k = a · x(t), (3.24) vilket vi känner igen som en förstärkare och det är ett linjärt system. Denna typ av justering av en utsignal så att det totala systemet blir linjärt kallas ibland för linearisering. Detta är samma trick som användes i avsnitt 2.2.5, (2.36), för att erhålla en linjär ODE. Ovanstående metod att göra ett system linjärt kallas linearlisering av ett system. Linearisering är inte något som måste utföras rent praktiskt, genom att koppla in en subtraherare i ett system, det kan lika gärna göras teoretiskt. Om vi vet att ett system är linjärt sånär som på en konstant, räcker det för att kunna analysera systemet, och bestämma vad det har för generella egenskaper med samma metoder som vi använder för linjära system. Linearisering kan även användas mer generellt för att beskriva ett system som är approximativt linjärt, i alla fall om signalen är begränsad, se avsnitt 2.1.2. Ett exempel illustreras i figur 3.2 som visar beroende mellan insignalen x(t) och utsignalen y(t) för det olinjära systemet y(t) = H{x(t)} = x(t)3 − 5x(t) + 2. (3.25) Vi ser här att om vi kan begränsa insignalen så att |x(t)| < 1 och dessutom subtraherar 2 från y så kommer det resulterande systemet att bli approximativt linjärt. Det betyder att det resulterande systemet approximativt har alla de egenskaper som gäller för linjära system och som vi kommer att diskutera framöver, om nämnda begränsning av insignaler gäller. 37 7 6 5 4 y(t) 3 2 1 0 -1 -2 -3 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 x(t) Figur 3.2: Utsignalen från ett olinjärt system H med insignalen x(t) som beskrivs av (3.25). x(t) H x(t − ∆τ) ⇒ y(t) H y(t − ∆τ) Figur 3.3: Ett system H genererar utsignalen y(t) från insignalen x(t). Om systemet är tidsinvariant kommer insignalen x(t − ∆τ) att generera utsignalen y(t − ∆τ). 3.2 Tidsinvarianta system Begreppet tidsinvarians har ingen direkt motsvarighet i linjär algebra, men intuitivt handlar det om ett system som avbildar en insignal till en utsignal “på samma sätt” oberoende av tiden. Lite mer konkret betyder det att: om att vi skickar in en signal x(t) i systemet och får ut en signal y(t) och jämför det med vad som händer om vi istället skickar in en fördröjd version av x(t), dvs x(t − ∆t). Om den utsignal som då produceras är lika med y(t − ∆t) är systemet tidsinvariant. 3.2.1 Definition av tidsinvariant system Den matematiska definitionen av ett tidsinvariant system, med operatorn H, innebär att y(t) = H{x(t)} ⇒ y(t − ∆τ) = H{x(t − ∆τ)} (3.26) för alla signaler x ∈ S och alla fördröjningar1 ∆τ ∈ R. Se figur 3.3 för en illustration. Ett system som inte är tidinvariant är ett tidsvariant system. Första gången denna definition dyker upp framför ögonen kan den se lite underlig ut. Måste inte ovanstående relation alltid gälla? Det enda som skiljer ekvationen till vänster från den till höger är ju att vi bytt ut t mot t − ∆τ. Det som inte syns här är att även H skulle kunna ha ett beroende på t, det skulle kunna finnas någon tidsberoende parameter som styr hur H avbildar insignalen till utsignalen. Definitionen av tidsinvariant system, (3.26), innebär att H inte har ett tidsberoende och ett nödvändigt villkor för detta är just (3.26). 3.2.2 Hur visa att ett system är tidsinvariant Att visa huruvida ett system är tidsinvariant eller inte fungerar på liknande sätt som med linearitet. Vi har två strategier, varav bara den ena kommer att vara framgångsrik: antingen visar vi att systemet är linjärt eller att det är 1 Här ska fördröjningarna verkligen vara alla möjliga reella tal, även ∆τ < 0. 38 olinjärt. Om vi inte vet vilket som ska visas, får vi helt prova båda strategierna och se vilken som leder till målet. Vi tar dom i tur och ordning. Visa att systemet är tidsinvariant Om vi antar att systemet är linjärt och ska visa detta så handlar det i grund och botten om att visa att (3.26) gäller för alla val av x(t) ∈ S och alla val av fördröjningar ∆τ ∈ R. Enklast görs det genom följande steg: 1. Antag att x(t) är en godtycklig insignal och bestämma ett uttryck för motsvarande utsignal, y(t). 2. Fördröj x(t) med godtycklig fördröjning ∆τ, motsvarande x(t − ∆τ). Bestäm vilken utsignal som genereras av denna fördröjda insignal. 3. Kontrollera om systemet är tidsinvariant vilket det är om utsignalen i steg 2 är samma om y(t − ∆τ). På samma sätt som när vi ska visa om ett system är linjärt kan det vara lätt att tänka sig att det räcker med att hitta ett eller ett par exempel på signal x(t) för vilka (3.26) är uppfylld. För att fastställa att ett system är tidsinvariant kan vi emellertid inte begränsa oss till specifika val av insignal, utan utgå från att x(t) är en godtycklig signal och att ∆τ är en godtyckligt fördröjning. För att genomföra denna typ av bevis måste vi, återigen, förlita oss på en modell för det aktuella systemet. Vi återkommer strax med ett antal exempel där vi använder denna strategi på ett antal konkreta system. Visa att systemet är tidsvariant Här räcker det med att hitta ett enda exempel på en signal, s(t), och fördröjning ∆τ som inte ger likhet mellan vänster- och högerledet i (3.26). För att kunna göra det måste vi återigen ha en matematisk modell av det system som undersöks, i enklaste fallet att dess systemoperator ger ett explicit uttryck för hur utsignalen beror av insignalen, eller att in- och utsignaler är relaterade med en differentialekvation. Vi återkommer strax med ett antal exempel där vi använder denna strategi på ett antal konkreta system. 3.2.3 Exempel på tidsinvarianta system Låt oss titta på några exempel med system och undersöka deras tidsinvarians. Fördröjning Systemet som utgör en fördröjning i (2.11) är ett tidsinvariant system. För att visa detta följer vi de tre stegen och ansätter först en godtycklig insignal som betecknas x(t). Den producerar en motsvarande utsignal y(t) som ges av y(t) = H{x(t)} = x(t − ∆t). (3.27) Nästa steg är att undersöka vilken utsignal som genereras om insignalen x(t) fördröjs med ∆τ: H{x(t − ∆τ)} = x(t − ∆t − ∆τ). (3.28) I tredje och sista steget konstaterar vi att nyss erhålla utsignal blir lika med utsignalen y(t) fördröjd med ∆τ: y(t − ∆τ) = x(t − ∆τ − ∆t) = H{x(t − ∆τ)}. (3.29) Alltså har vi visat att (3.26) gäller och därmed är systemet tidsinvariant. Förstärkare Förstärkaren som utgör systemet vars operator definieras i (2.13) är ett tidsinvariant system. För att visa det ansätter vi först en godtycklig insignal, x(t), och ser att den producerar en motsvarande utsignal y(t) som ges av y(t) = H{x(t)} = a · x(t). 39 (3.30) Nästa steg är att undersöka vilken utsignal som genereras om insignalen x(t) fördröjs med ∆τ: H{x(t − ∆τ)} = a · x(t − ∆τ). (3.31) I tredje och sista steget konstaterar vi att nyss erhålla utsignal blir lika med utsignalen y(t) fördröjd med ∆τ: y(t − ∆τ) = a · x(t − ∆τ) = H{x(t − ∆τ)}. (3.32) Alltså har vi visat att (3.26) gäller och därmed är systemet tidsinvariant. Notera att vi i detta fallet har antagit att förstärkningsfaktorn är konstant och att detta är nödvändigt för att förstärkaren ska vara tidsinvariant. Skulle förstärkningen vara tidsvariabel kommer systemet istället att vara tidsvariant. Vi kommer strax att undersöka det fallet. Linjära ODE Ett system som kan modelleras med en linjär ODE är ett tidsinvariant system. För att visa det måste vi använda en variant av den metod som beskrivs i avsnitt 3.2.2. Ett alternativt sätt att beskriva det vi vill kunna visa är att: om systemet för en godtycklig insignal x(t) genererar en viss utsignal y(t), som alltså är en lösning till en linjär ODE, så kommer samma ODE att ge lösningen y(t − ∆τ) om x(t) byts mot x(t − ∆τ). Låt oss testa denna strategi på systemet H som modelleras av den linjära ODE:n i (2.37). För att genomföra ett formellt bevis för att H är tidsinvariant kan vi tänka så här: låt x1 (t) och x2 (t) vara två insignaler, med motsvarande utsignaler z1 (t) = H{x1 (t)}, z2 (t) = H{x2 (t)}, (3.33) där första insignalen x1 (t) är helt godtycklig men den andra ges av x2 (t) = x1 (t − ∆τ). Om systemet är tidsinvariant ska då även gälla att z2 (t) = z1 (t − ∆τ) och det alltså det som ska visas. Eftersom systemet modelleras av en linjär ODE, (2.37), kan sambandet mellan insignalen x2 och motsvarande utsignal z2 skrivas som d z1 (t) + k · z1 (t) = x1 (t), dt d z2 (t) + k · z2 (t) = x2 (t) = x1 (t − ∆τ). dt (3.34) Nu gör vi ett variabelbyte, från t till τ som ges av sambandet: τ = t − ∆τ. (3.35) För att göra det variabelbytet komplett måste vi även byta ut deriveringen med avseende på t till derivering med avseende på τ: d dt d d d = · = ·1= . (3.36) dτ dt dτ dt dt Sätter vi in (3.35) och (3.36) i den andra ODE:n i (3.34) blir resultatet: d z2 (τ + ∆τ) + k · z2 (τ + ∆τ) = x1 (τ). dτ (3.37) För att tydliggöra vad som händer här kan vi definiera en tredje utsignal: z3 (τ) = z2 (τ + ∆τ), (3.38) d z3 (τ) + k · z3 (τ) = x1 (τ). dτ (3.39) vilken insatt i (3.37) ger Här kan vi se att ODE:n i (3.37) är identisk med den första ODE:n i (3.34), bortsett från att variabeln t här betecknas τ. Denna ODE vet vi redan har en lösning z1 , vilket betyder att z3 (τ) = z1 (τ). Vi har alltså visat att z3 (τ) = z2 (τ + ∆τ) = z1 (τ), Av detta kan vi dra slutsatsen att H är ett tidsinvariant system. 40 z2 (t) = z1 (t − ∆τ). (3.40) 3.2.4 Exempel på tidsvarianta system Här är några exempel på system som är tidsvarianta. Tidsvariabel förstärkare Låt H vara ett system är det operator är definierad som y(t) = H{x(t)} = a(t) · x(t), (3.41) där a(t) är en tidsvariabel förstärkningsfaktor vars variation bestäms av systemet självt. Här antar vi att a(t) inte är en konstant. För att undersöka om detta system är tidsinvariant provar vi med att bestämma vilken utsignal som genereras om, istället för x(t), insignalen är x(t − ∆τ): H{x(t − ∆t)} = a(t) · x(t − ∆t). (3.42) Detta ska jämföras med en motsvarande fördröjning av utsignalen y(t): y(t − ∆τ) = a(t − ∆τ) · x(t − ∆τ). (3.43) Eftersom (3.42) och (3.43) inte är lika för alla val av x(t) och ∆τ följer att systemet är tidsvariant. En kommentar Notera att det endast är insignalen x som fördröjs i (3.42), inte förstärkningsfaktorn a. Detta är i enlighet med definitionen av tidinvarians: vi ska undersöka vad som händer vid en tidsfördröjning enbart av insignalen, vi ska inte fördröja även systemets egen tidsvariation, vilket i detta fallet handlar om förstärkningsfaktorn a. Linjär ODE med tidsberoende konstanter Låt oss undersöka ett system vars modell är en variant av (2.37): d z(t) + t · z(t) = x(t). dt (3.44) Här har vi alltså har bytt ut konstanten k mot en tidsvariabel koefficient som är = t. Motsvarande system är tidsvariant, vi kan visa det genom att gå igenom liknande steg som gjordes i avsnitt 3.2.3. Vi matar in de två insignalerna x1 och x2 , där x1 är godtycklig medan x2 (t) = x1 (t − ∆τ), och erhåller de två utsignalerna z1 respektive z2 , (3.33). Dessa utsignaler måste vara lösningen till (3.44), för respektive insignal: d z1 (t) + t · z1 (t) = x1 (t), dt d z2 (t) + t · z2 (t) = x2 (t) = x1 (t − ∆τ). dt (3.45) Nu gör vi variabelbytet enligt (3.35), tillsammans med (3.36), och sätter in detta i den andra ODE:n i (3.45): d z2 (τ + ∆τ) + (τ + ∆τ) · z2 (τ + ∆τ) = x1 (τ). dτ (3.46) Slutligen byter vi z2 mot z3 enligt (3.38): d z3 (τ) + (τ + ∆τ) · z3 (τ) = x1 (τ). dτ (3.47) Om systemet är tidsinvariant skulle denna ODE vara identisk med den högra ODE:n i (3.45), bortsett från att t bytts mot τ. Det är den inte, i alla fall inte för godtyckliga x1 och ∆τ, och därmed har vi visat att systemet är tidsvariant. 41 3.3 Definiton av LTI-system Vi har nu definierat vad som menas med ett linjärt system respektive ett tidsinvariant system. Ett linjärt och tidsinvariant system är ett system som är både linjärt och tidsinvariant. Eftersom denna typ av system är både vanligt och användbart betecknas det ofta kortare med LTI-system. Att visa att ett system är LTI innebär att vi måste visa både linearitet och tidsinvarians, exempelvis på de sätt som demonstrerats i avsnitt 3.1.2 och avsnitt 3.2.2. För att visa att systemet inte är LTI räcker det antingen med att visa att systemet inte är linjärt eller inte tidsinvariant. Exempel på system som är LTI: • Ett tidsfördröjning. • En derivator. • En integrerare • En förstärkare (med konstant förstärkningsfaktor). • En linjär ODE (med konstanta koefficienter). Exempel på system som inte är LTI: • Ett olinjär avbildning från insignal till utsignal (är inte linjärt men kan vara tidsinvariant). • En förstärkare med tidsvariabel förstärkningsfaktor (är linjärt men inte tidsinvariant). • En linjär ODE med tidsvariabla koefficienter (är linjärt men inte tidsinvariant). Vi kommer i fortsättningen av denna berättelse att få se flera andra exempel på system, ofta LTI-system men även system som inte är LTI. Tidigare har sagts att en anledning till att vi studerar just LTI-system är att de är relativt vanliga när ett system ska konstrueras. En annan anledning är att de har specifika egenskaper, som gäller för alla LTI-system men som inte gäller generellt för andra system även om de ibland kan vara tillämpbara utanför LTI-systemens domän. I de återstående avsnitten i detta kapitel kommer vi att gå igenom några av dessa egenskaper, men också fördjupa oss i specifika metoder för LTI-system i några av de efterföljande kapitlen. 3.3.1 Kaskadkoppling av LTI-system Låt H1 och H2 vara två LTI-system, de kan vara två olika system eller möjligen av samma typ. En kaskadkoppling av de två systemen ges då av systemet H3 = H2 H1 som illustreras i figur 2.1, med insignalen kopplad till H1 och utsignalen från H2 . Om båda systemen är LTI gäller följande två observationer: 3 Även det totala systemet H3 är LTI. 4 De två systemen H1 och H2 kommuterar, dvs. det spelar ingen roll i vilken ordning de är ihopkopplade. Det första påståendet är relativt enkelt att visa och lämnas som övningsuppgift. Det andra påståendet är inte trivialt och för att visa det behöver vi först en del andra resultat, så vi ska återkomma till den frågan. 3.3.2 Linjärkombination av två LTI-system Låt H1 och H2 vara två LTI-system och definiera ett tredje system H3 enligt figur 3.4. Det betyder att H1 och H2 vart och ett är kaskadkopplad med en förstärkning, med faktor a1 respektive a2 , och slutligen ska de resulterande signalerna adderas. Systemoperatorn H3 kan alltså skrivas y(t) = H3 {x(t)} = a1 H1 {x(t)} + a2 H2 {x(t)}. 42 (3.48) H3 H1 a1 + x(t) y(t) a2 H2 Figur 3.4: Ett system H3 som utgör en linjärkombination av två andra system, H1 och H2 . Detta uttryck beskriver H3 som en linjärkombination av två LTI-system, vilket betecknas med H3 = a1 H1 + a2 H2 . Det är en enkel övning att visa att även H3 är LTI. Med induktion kan vi även enkelt visa att också en linjärkombination av ett ändligt antal LTI-system är LTI. 5 En linjärkombination av LTI-ssytem är ett LTI-system. 3.4 LTI-system kommuterar med tidsderivata Om H1 är ett godtyckligt LTI-system och H2 en tidsderivator, då kommuterar H1 och H2 . För att visa detta behöver vi demonstrera att för godtycklig insignal2 x(t) gäller att ) ( d d H1 {x(t)} = H1 x(t) . (3.49) dt dt För att visa detta kan vi ansätta y(t) = H1 {x(t)} och använda definitionen av derivata som ett gränsvärde, varvid högerledet i (3.49) kan skrivas som ( ) ( ) x(t + h) − x(t) x(t + h) − x(t) H1 {x(t + h)} − H1 {x(t)} H1 är HL = H1 lim = lim H1 = = lim = linjär h→0 h→0 h→0 h h h y(t + h) − y(t) = VL. (3.50) = H1 är = lim h→0 h TI Alltså gäller (3.49) för godtycklig x(t) ∈ S och vi har därmed visat att tidsderivata kommuterar med ett godtycklig LTI-system. 6 Ett LTI-system H kommuterar alltid med tidsderivering. Om vi deriverar insignalen till H eller utsignalen från H spelar ingen roll, det ger samma resultat. 3.5 Stegsvar Liksom andra enkla system har ett LTI-system en systemoperator, men varje LTI-system kan även karakteriseras av en (eller flera) funktioner. En sådan funktion är dess stegsvar och en annan dess impulssvar. Vi börjar med stegsvaret som är den av de två funktionerna som är enklast att beskriva. För att göra det använder vi enhetssteget (eller stegfunktionen) u(t), som definieras i avsnitt B.2. 2 Minns att x(t) ∈ S där S är ett lämpligt signalrum. I detta fallet måste det rummet bestå av funktioner för vilka deriveringsoperationerna som förkommer här ger väldefinierade resultat. 43 2 1.5 1 0.5 0 -0.5 -1 -5 0 5 10 0 5 10 1 0.5 0 -0.5 -1 -5 Figur 3.5: Övre: stegfunktionen u(t). Nedre: ett exempel på stegsvar för ett specifikt system H. 2 1.5 1 0.5 0 -0.5 -1 -5 0 5 10 0 5 10 1 0.5 0 -0.5 -1 -5 Figur 3.6: Övre: en puls som starar vid t = 0 och slutar vid t = 1. Nedre: motsvarande utsignal från samma system H som i figur 3.5. Stegsvaret för ett LTI-system H är systemets utsignal när insignalen är u(t). Vi betecknar stegsvaret med signalen ĥ(t) och den definieras alltså som ĥ(t) = H{u(t)}. (3.51) För se varför stegsvaret kan vara av intresse för ett LTI-system kan vi anta att systemet har haft en insignal x(t) som under en längre tid varit konstant och vi observerar att nu även utsignalen är konstant och kommer att fortsätta vara konstant. Vi antar vidare att det är möjligt att momentant ändra insignalen till ett nytt konstant värde och att det görs vid tiden t = t0 . Att göra denna plötsliga förändring av insignalen motsvaras av att addera stegfunktionen ∆x · u(t − t0 ) till x(t), där ∆x är förändringen i insignalen. Eftersom systemet är LTI måste den utsignal vi observerar efter t = t0 bli H{x(t) + ∆x · u(t)} = H{x(t)} + ∆x · H{u(t − t0 )} = konstant + ∆x · ĥ(t − t0 ). (3.52) Det betyder alltså att den förändring av utsignalen som vi observerar är stegsvaret multiplicerat med ∆x. Skulle vi lite senare göra en ny justering av insignalen, motsvarande en skalad och tidsfördröjd version av u(t) kommer även då en skalad tidsfördröjd version av stegsvaret att observeras som en komponent i utsignalen. Detta illustreras i figur 3.5. En annan typ av funktion vi skulle kunna prova att skicka in som insignal till systemet är en puls. Exempelvis skulle pulsen kunna starta och avslutas vid tiden t1 respektive t2 och ha höjden ∆x. En sådan puls kan realiseras 44 som en linjärkombination av två enhetssteg (se avsnitt B.3): x(t) = ∆x u(t − t1 ) − u(t − t2 ) . (3.53) Här antar vi att pulsen startar vid t = 0 och tar slut vid t = 1. Om vi skickar in denna puls i systemet kommer utsignalen att bli y(t) = H{x(t)} = H{u(t) − u(t − 1)} = ĥ(t) − ĥ(t − 1) (3.54) dvs. samma linjärkombination fast nu av stegsvaren. Se figur 3.5 för en illustration. Ett LTI-system H har ett entydigt stegsvar ĥ, dvs. två olika LTI-system kan inte ha samma stegsvar. Stegsvaret är alltså en unik och karakteristik funktion för varje LTI-system. Det betyder att stegsvaret för ett LTI-system utgör en systemmodell, som exakt talar om vilket LTI-system som avses. För att visa entydigheten måste vi emellertid har tillgång till ytterligare resultat, varför vi får återkomma till denna fråga inom kort. 3.6 Impulssvar På samma sätt som stegsvaret är impulssvaret en unik och karakteristiks funktion för varje LTI-system, och dessutom mer användbart som modell av ett system. Konstruktionen av denna funktion är emellertid mer långsökt och kräver därför lite mer bakomliggande begrepp. Ett sådant begrepp är den ideala impulsfunktionen. 3.6.1 Definition av impulssvar På liknande sätt som vi definierar stegsvaret ĥ(t) för ett LTI-system som utsignalen när insignalen är u(t), kan vi definiera impulssvaret som utsignalen när insignalen är δ(t), den ideala impulsfunktionen som definieras i avsnitt B.5. Impulssvaret för systemet H betecknas h(t) och den definieras alltså som h(t) = H{δ(t)}. (3.55) Impulssvaret för ett LTI-system H är unikt. Innan vi visar detta ska vi först se att det även har en specifik koppling till hur systemet bestämmer sin utsignal y(t) för en godtycklig insignal x(t): (Z ∞ ) y(t) = H{x(t)} = H δ(t − τ) x(τ) dτ . (3.56) −∞ Notera att det som nu står som en funktion av t, dvs. insignal till systemoperatorn H, inte längre är x(t) utan impulsfunktionen! Vidare är en integral en form av summa och det bör därför vara möjligt att se hela integralen som en slags linjärkombination av oändligt många termer som alla innehåller olika fördröjningar av δ(t). Eftersom systemet är LTI gäller då: ) (Z ∞ Z ∞ Z ∞ linjärt tidsinv. y(t) = H δ(t − τ) x(τ) dτ = H{δ(t − τ)} x(τ) dτ = h(t − τ) x(τ) dτ. (3.57) −∞ −∞ −∞ Det betyder att om vi känner impulssvaret h(t) för ett LTI-system kan vi alltid bestämma utsignalen y(t) för en godtycklig insignal x(t) ∈ S med hjälp av (3.57). Om två LTI-system har samma impulssvar innebär (3.57) att de kommer att generera identiska utsignaler för varje möjlig insignal x(t). Det betyder, med andra ord, att varje distinkt LTI-system H har ett unikt impulssvar, och att vi därmed kan identifiera ett LTI-system H med dess impulssvar h(t). För ett LTI-system är alltså impulssvaret en systemmodell som fungerar minst lika bra som dess systemoperator H. Relation mellan impulssvar h och stegsvar ĥ Vi kan även relatera impulssvar och stegsvar. Med hjälp av beskrivningen av den ideala impulsfunktionen som derivatan av stegfunktionen (B.26) kan vi utveckla uttrycket för h(t) i (3.55) till ) ( ) ( u(t + b) − u(t) u(t + b) − u(t) = lim H = (3.58) h(t) = H{δ(t)} = H lim b→0 b→0 b b = lim b→0 H{u(t + b)} − H{u(t)} ĥ(t + b) − ĥ(t) d = lim = ĥ(t). b→0 b b dt 45 (3.59) Det betyder att vi kan se h(t) som derivatan av ĥ(t) eller, alternativt, att ĥ(t) är en primitiv funktion av h(t). En konsekvens av (3.59) är att även stegsvaret är unikt för varje LTI-system. Visserligen är en primitiv funktion till h(t) inte unik, det finns en godtycklig konstant till varje primitiv funktion, men ett linjärt system kan inte innehålla konstanta termer, se avsnitt 3.1.4 på sidan 37, så det finns bara en primitiv funktion till varje impulssvar som kan vara stegsvaret för ett LTI-system. 7 Både stegsvaret ĥ och impulssvaret h för ett LTI-system H är unika funktioner som karakteriserar det H som genererar dom. Innan vi fortsätter Att varje LTI-system karakteriseras av sitt impulssvar, alternativt stegsvar, innebär i princip att vi kan specificera ett godtycklig LTI-system genom att ange en godtycklig funktion h(t) som dess impulssvar. Det här låter bra, men innebär också att vi bör begränsa vilka impulssvar som väljs. I synnerhet bör ju h(t) väljas så att integralen i högerledet av (3.57) har ett välbestämt värde för alla signaler x(t) ∈ S. Vi ska återkomma till denna fråga längre fram i samband med diskussionen om stabila system. 3.7 Faltning Att kombinera två funktioner så att resultat åter blir en funktion kan göras på många olika sätt. Exempelvis kan vi addera funktionerna, (2.8), eller multiplicera funktionerna, (2.10). Vi ska nu definiera en specifik kombination av två funktioner, f (t) och g(t), så att resultatet åter blir en funktion h(t): h(t) = Z ∞ f (t − τ) g(τ) dτ. (3.60) −∞ Denna kombination kallas faltning3 mellan f och g, och betecknas f ∗ g: h(t) = ( f ∗ g)(t). (3.61) Om vi gör variabelsubstitutionen r = t − τ och sätter in det i (3.60) får vi h(t) = − Z −∞ f (r) g(t − r) dr = Z ∞ ∞ g(t − r) f (r) dr = (g ∗ f )(t). (3.62) −∞ Slutsatsen är att f ∗ g = g ∗ f, (3.63) dvs. det spelar ingen roll i vilken ordning de två funktionerna faltas, resultatet blir samma funktion. Faltning har även en annan viktig egenskap: den associativ. Det betyder att om vi först två funktioner, f och g, och sedan tar resultatet och faltar det med funktionen h så blir det samma sak som att falta f med faltningen mellan g och h: ( f ∗ g) ∗ h = f ∗ (g ∗ h). (3.64) Beviset lämnas som en övning. Notera att associativiteten tillsammans med att faltning är kommutativ innebär: 8 Faltning mellan två eller flera funktioner kan ske i godtycklig ordnig, resultatet blir alltid detsamma. 3 Engelska: convolution. 46 3.7.1 Tillämpning på LTI-system Givet att vi nu har definierat operationen faltning, ger en noggrannare granskning av (3.57) att ett LTI-system H med impulssvaret h(t) genererar en utsignal y(t) enligt: y(t) = H{x(t)} = (x ∗ h)(t) = (h ∗ x)(t). (3.65) 9 Ett LTI-system med impulssvaret h(t) ger en utsignal som är faltningen mellan insignal och impulssvar. Impulssvar för ett kaskadkopplat LTI-system Låt B1 och H2 vara två LTI-system, med impulssvaren h1 (t) respektive h2 (t), och låt H3 = H2 H1 vara kaskadkopplingen av dessa två system, enligt figur 2.1. Impulssvaret för det första systemet ges då av H1 {δ(t)} = h1 (t). (3.66) Impulssvaret för det kaskadkopplade systemet H3 får vi om vi tar h3 som insignal till H2 och tittar på motsvarande utsignal: H2 {h1 (t)} = (h2 ∗ h1 )(t) (3.67) Vi sammanfattar det resultat med: 10 Impulssvaret för ett system som kaskadkopplar två LTI-system, med impulssvaren h1 respektive h2 , ges av h1 ∗ h2 = h2 ∗ h1 . LTI-system kommuterar I observation 4 på sidan 42 sade vi att alla LTI-system kommuterar, dvs. om H1 och H2 är två godtyckliga LTIsystem då är H1 H2 = H2 H1 . Vi har nu tillräckligt på fötterna för att visa detta påstående. Det följer direkt av att varje LTI-system genererar sin utsignal genom en faltning med dess impulssvar och att faltning är en kommutativ operation. Impulssvar för en linjärkombination av LTI-system Låt B1 och H2 vara två LTI-system, med impulssvaren h1 (t) respektive h2 (t), och låt H3 = a1 H1 + a2 H3 vara en linjärkombination av de två systemen. Impulssvaret för H3 ges då av H3 {δ(t)} = a1 H1 {δ(t)} + a2 H2 {δ(t)} = a1 h1 (t) + a2 h2 (t) (3.68) Detta resultat kan sammanfattas som: 11 En linjärkombination av LTI-system har ett impulssvar som är samma linjärkombination av respektive impulssvar. 3.8 Kausala system Impulssvaret för ett LTI-system är en funktion h(t) som, i princip, kan vara en godtycklig funktion. Men vi har även sagt att det finns ett kausalitetssamband som innebär att det är insignalen och hur den varierar över tiden som är orsaken till de variationer vi ser i utsignalen. För ett system som vi kan observera eller konstruera i verkligheten måste gälla att utsignalens värde vid tiden t endast kan bero av insignalens värden fram till och med t, men inte 47 y(t) x(t) Figur 3.7: En gunga kan ses som ett system med insignalen x(t) i form av det vridmoment som tillförs av den som gungar och utsignalen y(t) som är gungans vinkel mot vertikallinjen. senare tidpunkter. Ett system som har denna egenskap kallar vi för ett kausalt system och i motsatta fallet är det fråga om ett icke-kausalt system. I fallet med ett LTI-system, med impulssvar h(t), måste gälla att h(t) = 0, för alla t < 0 (3.69) för ett kausalt system. Om nu alla verkliga system är kausala kan det ju vara på sin plats att fundera över varför detta begrepp över huvud taget behöver nämnas? Vi har sagt att impulssvaret för ett LTI-system är en modell av systemet, dvs. vi kan välja olika typer av LTIsystem genom att välja deras impulssvar på olika sätt. Kausalitetsvillkoret innebär emellertid att vi inte kan välja impulssvaret helt godtyckligt, det måste uppfylla (3.69). Motsvarande villkor gäller även för stegsvaret. Vi kommer senare att introducera andra, relaterade, systemmodeller och även dessa påverkas av kausalitetsvillkoret i (3.69). Däremot finns det inget som hindrar att vi teoretiskt kan analysera system som är icke-kausala. Som exempel kan vi studera icke-kausala system för vilka h(t) = 0, för alla t < t0 < 0. (3.70) Ett sådan system kan enkelt göras kausalt genom att låta fördröja insignalen innan den matas in i systemet som har impulssvaret h(t) enligt (3.70). Detta kaskadkopplade system blir då kausalt och går att realisera i praktiken. 12 Alla verkliga system är kausala. Icke-kausala system kan enbart undersökas teoretiskt. 3.9 Stabila system Ett väl fungerande system utmärks ofta, men inte alltid, av att insignaler som på något sätt är begränsade genererar utsignaler som även de är begränsade. Ett system som inte har denna egenskap skulle kunna gå sönder eller generera utsignaler som inte är användbara även för normalt förekommande insignaler. Ett exempel är en vanlig gunga i en lekpark, som för enkelhets skull kan antas vara upphängd med en helt stel kedja i en balk ovanför gungan. Det kan ses som ett mekaniskt system vars utsignal y(t) är kedjans vinkeln mot 48 vertikala axeln och med en insignal x(t) i form av det vridmoment den som gungar utsätter gungan för. Se figur 3.7 för en illustration av systemet. Normalt är x(t) en periodisk funktion; genom att hela tiden tillföra lite vridmoment kan vi få gungan att fortsätta gunga fram och tillbaka. Men det spelar roll i vilken takt dessa perioder återkommer. Om periodtiden är för lång kommer gungan visserligen att rör sig fram och tillbaka men med relativt litet utslag. På samma sätt är det om vi försöker tillföra vridmoment med mycket kort periodtid: gungan gör snabba rörelser fram och tillbaka, men återigen med relativt litet utslag. Men för en specifik periodtid, som beror av längden av kedjan och vikten på den som gungar, kommer gungan att röra sig relativt lätt fram och tillbaka och vid varje nytt tillskott av vridmoment ge större och större utslag y(t). Om denna process får hålla på tillräckligt länge kan gungan till och med slå över bommen med, möjligen, oönskade konsekvenser för den som gungar. Det fenomen som illustreras ovan i exemplet med gungan kallas resonans och är ett relativt vanligt fenomen i olika typer av system. Resonans kan vara en önskad egenskap men kan även vara problematisk, om systemet eller dess användare utsätts för fara. BIBO-stabilitet Stabilitet för ett system kan definieras på flera olika sätt, men ett enkelt sätt att är säga att systemet är stabilt om alla begränsade insignaler genererar begränsade utsignaler. Ett system med denna egenskap kallas för ett BIBO-stabilt system, där BIBO står för “begränsad-insignal-begränsad-utsignal”. För ett LTI-system med impulssvar h(t) går det att visa att BIBO-stabilitet är ekvivalent med följande villkor: Z ∞ |h(t)| dt < ∞. (3.71) −∞ Det betyder alltså att systemets stabilitetsegenskap är implicit representerad i impulssvaret h(t). Notera att δ(t) inte är en begränsad signal, och därför finns det inget krav att impulssvaret h(t) måste vara en begränsad funktion för ett BIBO-stabilt system. Ett framåtkopplat system, där alla delsystem på alla nivåerna i systemet är framåtkopplade, är alltid stabilt. Det är när system uppvisar återkopplingar som det finns möjlighet till instabilitet. Alla återkopplade system är inte instabila men de kan vara det, beroende på hur de är konstruerade och på val av olika parametrar i systemet. Innan vi går vidare Det bör noteras att instabilitet inte alltid är av ondo. Ett exempel är ett bankkonto som ger ränta, det som illustreras i figur 1.5 på sidan 18. Även om det enbart görs en insättning på kontot efter att det öppnats (en begränsad insignal) kommer räntan göra att så småningom åstadkomma att saldot blir godtyckligt stort bara vi väntar tillräckligt länge. I praktiken kan det naturligtvis diskuteras om det är relevant att vänta 1000-tals år på att saldot ska växa till helt orimliga belopp, men teoretiskt är systemet inte BIBO-stabilt. Ovanstående exempel visar att en teoretisk analys av ett system vad gäller stabilitet bör göras med en viss försiktighet. Även stabila system kan vara problematiska om de uppvisar resonansfenomen som visserligen inte gör att utsignalerna blir obegränsade men ändå tillräckligt stora för att åstadkomma skada. 13 Ofta, men inte alltid, är det önskvärt att ett system är stabilt. 3.10 Exempel Vi ska här bestämma stegsvar och/eller impulssvar för några vanliga typer av LTI-system. 3.10.1 Förstärkare För en förstärkare, (2.13), kan vi direkt bestämma stegssvar och impulssvar: ĥ(t) = H{u(t)} = a u(t), h(t) = H{δ(t)} = a δ(t). Enligt avsnitt 3.6.1 ska h(t) vara derivatan av ĥ(t), vilket stämmer om vi använder oss av (B.27). 49 (3.72) 3.10.2 Fördröjning Samma motsvarande resultat kan tas fram för en fördröjning, som beskrivs av (2.11): ĥ(t) = H{u(t)} = u(t − ∆t), 3.10.3 h(t) = H{δ(t)} = δ(t − ∆t). (3.73) Deriverare När det gäller deriverare blir saken lite mer komplicerad. Vi börjar med stegsvaret, som ges av ĥ(t) = H{u(t)} = d u(t) = /(B.27)/ = δ(t). dt (3.74) Om h(t) är derivatan av ĥ(t) blir alltså impulssvaret något som skulle motsvara derivatan av δ(t). Det går att ge detta koncept en strikt matematisk definition på samma sätt som för δ(t), men det faller utanför denna framställning. Vi nöjer oss därför med att i alla fall stegsvaret är väldefinierat, vilket räcker långt i många fall. 3.10.4 Linjär ODE Ett enkelt exempel på linjär ODE är den som presenteras i avsnitt 2.2.4 där ett system i form av ett vattentorn diskuteras. Systemet har en insignal, x(t) som representerar flödet av vatten ut ur tornets magasin och en utsignal, z(t), som representerar residualvolymen som återstår innan magasinet är fyllt. Vattentornet har ett pump som pumpar in vatten i magasinet och som styrs av ett enkelt reglersystem. In- och utsignal är relaterade enligt (2.37): d z(t) + k z(t) = x(t). dt (3.75) För denna typ av system är det enklast att börja med att bestämma stegsvaret, varför vi nu ska lösa ovanstående differentialekvation för fallet x(t) = u(t) vilket ger lösningen z(t) = ĥ(t) = systemets stegsvar. Generellt löses ekvationen enligt avsnitt A.4.5 i form av en stationär lösning z s (t) = C e−kt (3.76) och en partikulärlösning z p (t), där den senare ska vara av samma typ som x(t). Insignalen är, i princip, en konstant funktion vilket betyder att även z p ska vara en konstant = C p . Men eftersom x(t) = u(t) har en diskontinuitet vid t = 0 måste vi behandla (3.75) som två differentialekvationer, en som ska lösas för t < 0 när x(t) = 0 och en som ska lösas för t > 0 när x(t) = 1. För t < 0 ska z p = C p uppfylla 0 + k C p = 0, dvs. C p = 0. Det betyder att i detta intervall består lösningen z(t) enbart av den stationära lösningen: z(t) = z s (t) = C e−kt . Här kan vi, exempelvis, hänvisa till principen om att ett verkligt system är kausalt, dvs. dess impulssvar och stegsvar är = 0 för t < 0. Det betyder i vårt fall att C = 0 och att z(t) = 0 för t < 0. För t > 0 ska partikulärlösningen istället uppfylla 0 + k C p = 1, vilket get z p (t) = u(t)/k. Den fullständiga lösningen i intervallet t > 0 kan nu formuleras som 1 z(t) = z s (t) + z p (t) = C e−kt + . k Sammanfattningsvis kan den fullständiga lösningen av (3.75) skrivas på formen ! 1 −kt z(t) = +C e u(t), k (3.77) (3.78) där C är en konstant (dvs. beror inte på t) som återstår att bestämma. För att göra det kan vi använda det randvillkor som beskrivs i avsnitt 2.2.4, dvs. att z(0) = 0. Det ger C = −1/k och, slutligen: z(t) = 1 1 − e−kt u(t) = ĥ(t). k Detta stegsvar illustreras i figur 3.8, till vänster. 50 (3.79) 1 1 k t t 0 0 Figur 3.8: Vänster: Stegsvaret ĥ(t) för ODE:n som beskriver återstående vattenvolymen innan vattentornet som beskrivs i avsnitt 2.2.4 är fyllt. Höger: Motsvarande impulssvar h(t). Nu när systemets stegsvar ĥ(t) är bestämt, (3.79), kan vi även ta fram systemets impulssvar h(t) genom att tidsderivera ĥ(t). Återigen måste vi då ta hänsyn till att ĥ(t) består av två “delar”, en del i intervallet t < 0 och en del i intervallet t > 0. I det första intervallet blir derivatan = 0. Återstår att bestämma h(t) för t > 0: d ĥ(t) = e−kt . dt (3.80) d ĥ(t) = e−kt u(t). dt (3.81) h(t) = Sammanfattningsvis, för alla t, kan h(t) skrivas h(t) = Detta impulssvar illustreras i figur 3.8, till höger. En kommentar De stegsvar och impulssvar som har bestämts här förutsätter att k , 0. Om k = 0 innebär (3.75) inget annat än att derivatan av utsignalen z(t) är lika med insignalen x(t), dvs. systemet är en integrator. Vidare måste vi för ett verkligt system anta att k > 0, eftersom k < 0 innebär att både ĥ och h är obegränsat växande funktioner, vilket innebär instabila system. 14 En linjär ODE av typen (3.75) kan vara beskrivningen av ett verkligt system endast om k > 0. Dessa resultat säger något om hur det system som vattentornet utgör kommer att fungera i en verklig situation. Om vi antar att tornets magasin är fyllt vid t = 0 och att fram tills dess är x(t) = 0, och att det just då, vid t = 0, uppstår en konstant efterfrågan på vatten i nätet motsvarande flödet ∆x så motsvarar det att systemets insignal är x(t) = ∆x u(t). Motsvarande utsignal blir då H{∆x u(t)} = ∆x ĥ(t) = ∆x 1 − e−kt . k (3.82) Eftersom z(t) representerar den volym som saknas i magasinet innan det är fullt innebär (3.82) att vid t = 0 sjunker volymen exponentiellt avtagande mot ymax − ∆x k . Denna observation är viktigt för den som konstruerar vattentornet. ∆x motsvarar den största förväntade vattenförbrukningen som förväntas inträffa i nätet, en parameter som konstruktören måste känna till. Vidare är det ∆x önskvärt att vattenmagasinet inte töms, dvs. att ymax − ∆x k > 0. Det betyder att vi måste välja k > ymax . Vidare innebär ovanstående att vid ett flöde på x(t) = ∆x u(t) ut ur magasinet kommer det att fyllas på av pumpen, men inte så att det blir fyllt utan så att det inflöde och utflöde exakt balanserar varandra när den återstående 51 volymen är ∆x/k. För att inte magasinet ska tömmas måste då ∆x/k < ymax = den maximala volymen magasinet har när det är fyllt. Det ger ett villkor på konstanten k: ∆x . ymax k> (3.83) Det innebär att den som konstruerar vattentornet måste känna den största möjliga vattenflödet ut i nätet = ∆x och välja k enligt (3.83), gärna med en god säkerhetsmarginal så att vattentornet inte riskerar att tömmas. Konstanten k I vårt exempel är z(t) en fysikalisk storhet i form av en volym, vilket betyder att tidsderivata av z(t) är ett flöde: volym/tidsenhet. Om vi tittar i den systembeskrivande ekvationen (3.75) så måste då även termen kz(t), som adderas till tidsderivatan, ha dimensionen “volym/tid”. Konsekvensen av det är att konstanten k har dimensionen 1/tid eller, ekvivalent, 1/k har dimensionen “tid”. För ett system med systembeskrivande ekvationen (3.75) kallas 1/k för systemets tidskonstant. Tidskonstanten anger hur snabbt stegsvaret når upp till nivån 1/k eller hur snabbt impulssvaret går ned mot noll, ju mindre tidskonstant desto snabbare system. 15 Ett system med en systembeskrivande ekvation i form av en linjär ODE av första ordingen, (3.75), har en tidskonstant 1/k som anger hur snabbt systemet är. 3.11 Tidsdiskreta LTI-system Så här långt i detta kapitel har vi enbart undersöka tidskontinuerliga signaler och system. Givet att diverse begrepp har blivit definierade för det tidskontinuerliga fallet är det rättframt att göra detsamma även för tidsdiskreta system. Linjärt tidsdiskret system Ett tidsdiskret H system är linjärt om H{α1 s1 [k] + . . . + αn sn [k]} = α1 H{s1 [k]} + . . . + αn H{sn [k]} (3.84) för alla signaler s1 , s2 ∈ S och skalärer α1 , α2 ∈ R. Detta är helt analogt med det tidskontinuerliga fallet. Tidsinvariant tidsdiskret system Begreppet tidsinvariant och tidsdiskret system skiljer sig från det tidskontinuerliga fallet i en liten detalj. Ett tidsdiskret system H är tidsinvariant om y[k] = H{x[k]} ⇒ y[k − ∆k] = H{x[k − ∆k]} (3.85) för alla x[k] ∈ S och alla heltal ∆k. Det betyder alltså att tidsinvarians i det tidsdiskreta fallet enbart handlar om fördröjningar i variabeln k som är heltal. Tidsdiskret LTI-system Ett tidsdiskret LTI-system är både linjärt och tidsinvariant, helt analogt med det tidskontinuerliga fallet. 3.11.1 Faltning Faltning mellan två tidsdiskreta funktioner f och g definieras som h[k] = ∞ X f [k − l] g[l], l=−∞ 52 (3.86) och betecknas som h[l] = ( f ∗ g)[k]. (3.87) På samma sätt som i det tidskontinuerliga fallet kan vi, med lämplig variabelsubstitution, enkelt visa att f ∗g=g∗ f (3.88) även i det tidsdiskreta fallet. 3.11.2 Impulssvar Helt analogt med det tidskontinuerliga fallet: ett tidsdiskret LTI-system H har ett impulssvar h[k]: h[k] = H{δ[k]}. (3.89) Denna definition leder direkt fram till den tidsdiskreta motsvarigheten av (3.57). Antag att H är ett tidsdiskret system med impulssvaret h[k], och att x[k] är en insignal med utsignal y[k]: ∞ X y[k] = H{x[k]} = H δ[k − l] x[l] = l=−∞ = ∞ X H{δ[k − l]} x[l] = l=−∞ ∞ X h[k − l] x[l]. (3.90) l=−∞ På samma sätt som i det tidskontinuerliga fallet är alltså impulssvaret h[k] viktigt om vi vill veta hur systemet genererar en utsignal från insignalen. Med hjälp av faltningsoperationen kan (3.90) formuleras som y[k] = (h ∗ x)[k] = (x ∗ h)[k], (3.91) helt analogt med det tidskontinuerliga fallet. Även i det tidsdiskreta fallet bör vi begränsa valet av impulsfunktion för ett system så att summan i högerledet av (3.90) ger en väldefinierad utsignal y[k] för alla insignaler x[k] ∈ S. 3.12 Innan vi går vidare Några reflektioner värda att ta i beaktande innan vi går vidare. 3.12.1 I praktiken Även om den ideala impulsfunktionen δ(t) känns som ett abstrakt koncept, möjligen också u(t), så är varken stegsvaret ĥ(t) eller impulssvaret h(t) abstraktioner, de kan ofta bestämmas eller åtminstone approximeras med rimlig noggrannhet för varje LTI-system. Stegsvaret erhålls på det sätt som beskrivits tidigare: genom att göra en momentan förändring ∆x av en i övrigt konstant insignal och observera responsen i utsignalen. Den förändring vi då ser är stegsvaret ĥ(t) multiplicerad med ∆x. På motsvarande sätt kan en mycket kort puls skickas in i systemet, exempelvis t ∆x · rect (3.92) ∆t som har arean A = ∆x · ∆t. Systemets respons för denna puls är approximativt dess impulssvar h(t) multiplicerad med A. Approximationen blir bättre ju mindre pulsens tidsuträckning b är. Det betyder att både ĥ och h kan skattas för ett LTI-system, kanske inte i form av ett matematiskt uttryck för respektive funktion, men i alla fall i form av en funktionsgraf på ett begränsat tidsintervall. I det tidsdiskreta fallet går det att definiera en motsvarighet till enhetssteget u(t), men den har mindre praktisk nytta varför vi hoppar över den här. Däremot kan impulssvaret h[k] för ett tidsdiskret system skattas på liknande sätt som ovan: en impuls δ[k] skickas in i systemet och utsignalen är h[k]. 53 3.12.2 Tidsinvarians Tidigare har vi pekat på att det finns flera exempel på enkla system som är tidsinvarianta, men i sig är det kanske inte är skäl nog till att bry sig om detta begrepp. Tidsinvarians har emellertid en mycket viktigt egenskap för ett system, som vi har berört tidigare: att den operation som systemet utför på insignalen inte är tidsberoende. En konsekvens av tidsinvarians är att det inte spelar någon roll vilken tidpunkt som ansätts som t = 0, den kan vara vilken fix tidpunkt som helst och vi till och med tillåta oss att vid behov flytta denna tidpunkt hur vi vill, bara det görs på ett konsekvent sätt. Om vi flyttar en impuls eller ett steg i insignalen, genom en tidsfördröjning ∆t, är det enda som händer utsignalen att motsvarande impuls eller stegsvar fördröjs lika mycket: ∆t. Så är inte fallet om systemet är tidsvariant; då måste vi bestämma en viss tidpunkt som t = 0 och sedan hålla fast vi detta för att kunna beskriva hur utsignalen beror av insignalen. 54 Kapitel 4 Cosinusfunktioner I kapitel 3 har vi dels definierat vad LTI-system är, illustrerat med några exempel och även visat några egenskaper som dessa system har. I detta kapitel ska vi först definiera en specifik klass av funktioner, cosinusfunktioner, och sedan se att de har en mycket speciell relation till LTI-system. Detta kan i sin tur användas för att ge en alternativ beskrivning av vad ett LTI-system gör med sin insignal, en systemmodell. 4.1 Definition av cosinusfunktioner De funktioner vi är intresserad av i denna berättelse är främst funktioner av tiden t. I det sammanhanget är en cosinusfunktion varje funktion som går att skriva på formen A cos(ωt + φ), (4.1) där A, ω och φ är konstanter (oberoende av t). Det betyder alltså att vi inte enbart menar funktionen cos t, utan även andra men nära relaterade funktioner. Notera att argumentet till trigonometriska funktioner alltid är en vinkel mätt i radianer. Konstanten A anger cosinusfunktionens amplitud, dvs. hur “högt” respektive “lågt” från 0 som funktionen varierar. Konstanten ω anger hur snabbt cosinusfunktionen varierar, dess vinkelfrekvens, och mäts i radianer per sekund, ju större ω är desto snabbare oscillerar cosinusfunktionen och tvärtom. Konstanten φ, slutligen, anger vilken vinkel argumentet till cosinusfunktionen har vid t = 0. Den konstant kallas cosinusfunktionens fas och kan ses som en slags tidsfördröjning av funktionen cosinus, mätt som en vinkel (radianer). Sammanfattningsvis: för att ange en specifik cosinusfunktion behöver vi ange de tre parametrarna amplitud A, vinkelfrekvens ω och fas φ. En cosinusfunktion är periodisk, med periodtiden T0 = 2π , ω (4.2) eftersom T 0 är det minsta som uppfyller A cos ω (t + k T 0 ) + φ , för alla k ∈ Z. (4.3) Ett tredje sätt att ange hur snabbt en cosinusfunktion varierar är att ange dess frekvens; hur många perioder per tidsenhet den varierar med. Enheten för frekvens är Hertz, motsvarande 1/sekund eller “cykler per sekund”. Frekvens betecknas med f och är inversen av T 0 . För att specificera en viss cosinusfunktion kan vi ange dess vinkelfrekvens, med det går alltså lika bra med frekvensen f , eller periodtiden T 0 . De tre parametrarna beror av vandra enligt följande: ω 1 2π 2π 1 = , T0 = = , ω= = 2 π f. (4.4) f = T 0 2π f ω T0 Uttrycket för en cosinusfunktion i (4.1) kan skrivas om som A cos(ωt + φ) = A cos(ω(t + φ/ω) ). |{z} :=−∆t 55 (4.5) A cos(ω t + φ) A t ∆t T0 Figur 4.1: En cosinussignal med amplituden A, en vinkelfrekvens ω som motsvarar en periodtid på T 0 , och en fas φ som motsvarar en tidsfördröjning ∆t. Det betyder, som antyddes ovan, att en generell cosinusfunktion med fasen φ motsvarar en tidsfördröjning på ∆t = − φ φ φ T0 =− =− . ω 2π f 2π (4.6) Vi kan alltså översätta fasvinkeln φ till en tidsförskjutning ∆t om vi känner cosinusfunktionens frekvens eller periodtid. Se figur 4.1 för en illustration av de olika parametrarna som diskuterats här. En kommentar Notera att tidsförskjutning och fas anges med motsatt tecken. Det betyder alltså att en liten ökning av φ motsvarar en liten minskning av tidsfördröjningen ∆t. Alternativt: när funktionskurvan för cosinusfunktionen i figur 4.1 flyttas åt höger motsvarar det att ∆t ökar och φ minskar. Från det kända trigonometriska sambandet sin α = cos α − π2 , (A.20), kan vi dra slutsatsen att π . (4.7) A sin(ωt + φ) = A cos ωt + φ − 2 Det betyder alltså att bland mängden av cosinusfunktioner hittar vi även “sinusfunktioner”; de skiljer sig åt endast med en fasförskjutning på π2 radianer. Vi skulle alltså lika gärna kunna kalla de funktioner som definieras i (4.1) för “sinusfunktioner” eller “cosinus- och sinusfunktioner”. Här väljer vi att kalla hela denna klass för enbart cosinusfunktioner. 4.1.1 Innan vi fortsätter Eftersom cosinusfunktioner är periodiska är fasen alltid obestämd vad gäller multiplar av 2 π, dvs. fasen φ och φ + 2 π k anger samma cosinusfunktion när k ∈ Z. Det är brukligt att begränsa fasen till intervallet 0 ≤ φ < 2 π, men andra intervall eller till och med en extra term 2 π k på fasen är också vanliga sätt att ange dess värde. För tillfället antar vi att amplituden A ≥ 0, där A = 0 motsvarar den konstanta funktionen som är = 0 för alla t. I detta fall är vinkelfrekvensen och fasen godtyckliga. Vi antar även att ω ≥ 0, där ω = 0 motsvarar en cosinusfunktion med det konstanta värdet A cos φ. I det här fallet är det brukligt att sätta φ = 0 om det konstanta värdet är positivt (= A) och φ = π om det konstanta värdet är negativt (= −A). 4.2 Cosinus in - cosinus ut Cosinusfunktioner har en speciell egenskapen i förhållande till LTI-system: om insignalen är en cosinusfunktion med amplitud A, vinkelfrekvens ω och fas φ är även utsignalen en cosinusfunktion med samma vinkelfrekvens ω 56 men, i den generella fallet, med annan amplitud och annan fas. För att se detta sätter vi först insignalen till x(t) = cos(ωt) och bestämmer utsignalen y(t) för en godtyckligt LTI-system H: y(t) = H{x(t)} = H{cos(ωt)} (4.8) Det vi vill göra nu är att bestämma ett uttryck för y(t) och för att göra det kan först bestämma dess tidsderivata: ( ) d d y(t) = /(3.49)/ = H cos(ωt) = −ω H {sin(ωt)} , (4.9) dt dt liksom andraderivatan: d2 y(t) = −ω2 H {cos(ωt)} = −ω2 y(t). dt2 Detta kan sammanfattas med: utsignalen y(t) är en lösning till följande ODE av andra ordningen: d2 y(t) + ω2 y(t) = 0. dt2 (4.10) (4.11) Lösningen till (4.11) kan skrivas på formen y(t) = D cos(ωt + ψ), (4.12) där D och ψ är två parametrar som på något sätt behöver bestämmas. Innan vi gör det kan vi konstatera att även utsignalen y(t) är en cosinusfunktion, men det finns ingenting i hur vi har tagit fram y(t) som säger att den måste ha samma amplitud eller fas som insignalen x(t). Däremot ska den ha samma vinkelfrekvens som insignalen! En annan viktig observation i sammanhanget är att när vi löser (4.11) behöver vi enbart anta att utsignalens amplitud och fas, D respektive ψ, inte beror av t. Vidare finns det inget i lösningen (4.12) som antyder att B och ψ måste vara oberoende av ω. Därför antar vi att både amplituden och fasen för utsignalen beror ω, insignalens vinkelfrekvens: y(t) = D(ω) cos(ωt + ψ(ω)). (4.13) En kommentar Detta resultat kan motiveras så här. Antag att insignalen har en viss vinkelfrekvens ω = ω1 och vi löser (4.11) för detta fall, det ger en lösning enligt (4.12). Om vi nu matar in en annan cosinussignal, med vinkelfrekvens ω = ω2 kan vi lösa (4.11) för detta nya fall och återigen är lösningen på formen (4.12). Dessa två fall löser vi oberoende av varandra och det finns inget som tvingar lösningarna att ha samma amplituder och faser. Den amplitud och fas som cosinusfunktionen i (4.12) får är alltså en funktion av vilken vinkelfrekvens ω som insignalen har. En till kommentar I själva verket beror D och ψ inte bara av ω de beror även av H, dvs. vilket LTI-system vi undersöker. Om vi ska lösa (4.11) för två olika LTI-system finns det inget som tvingar oss att anta att D och ψ måste bli desamma för båda systemen. Vi kommer emellertid inte explicit ange att D och ψ beror av H utan det får vara underförstått. Det vi ska göra nu är att undersöka vilken utsignal en mer generell cosinussignal av typen (4.1) genererar: φ H{A cos(ωt + φ)} = ∆t = − = H{A cos(ω(t − ∆t))} = /LTI/ = A y(t − ∆t) = ω = A D(ω) cos(ω(t − ∆t) + ψ(ω)) = A D(ω) cos(ωt + φ + ψ(ω)). (4.14) Vi kan dra tre slutsatser av detta resultat: 1. Om insignalen är en godtycklig cosinusfunktion med vinkelfrekvensen ω, A cos(ωt + φ), är även utsignalen en cosinusfunktion, med samma vinkelfrekvens ω. 2. Utsignalens amplitud ges av A D(ω), dvs. insignalens amplitud multiplicerad med D(ω). 3. Utsignalens fas ges av φ + ψ(ω), dvs. insignalens fas plus ψ(ω). Detta kallas fasförskjutning: utsignalens fas är förskjuten med ψ(ω) relativt insignalens fas. 57 16 Om ett LTI-system har en insignal i form av en cosinusfunktion, med vinkelfrekvens ω, kommer även utsignalen att vara en cosinusfunktion med vinkelfrekvens ω. Utsignalen kan ha en annan amplitud och fas jämförd med insignalens amplitud och fas. Amplituden och fasen för utsignalen beror både av insignalens vinkelfrekvens och vilket system som är aktuellt. Vi kan även sammanfatta resultaten så här långt som 17 För en cosinussignal A cos(ωt + φ) kan ett LTI-system uppfattas som en förstärkare i kaskad med en fördröjning. Systemet förstärker med faktorn D(ω) och tidsfördröjer med ∆t = − ψ(ω) ω . 4.2.1 Amplitudkarakteristik Funktionen D(ω) anger hur mycket systemet förstärker en cosinussignal med vinkelfrekvens ω. Denna funktion kallas för systemets amplitudkarakteristik. För ett specifikt LTI-system kan vi bestämma dess amplitudkarakteristik genom att mäta dess förstärkning av cosinussignaler med olika vinkelfrekvenser ω. I praktiken kan vi enbart mäta D(ω) för ett ändligt antal olika vinkelfrekvenser så denna metod kan bara erbjuda om en skattning av amplitudkarakteristiken. Om den utförs med många värden på ω som dessutom ligger tillräckligt tätt kan emellertid resultatet ändå vara en användbar beskrivning av amplitudkarakteristiken. 4.2.2 Faskarakteristik Funktionen ψ(ω) anger hur mycket systemet förskjuter fasen för (fasförskjuter) en cosinussignal som har vinkelfrekvensen ω. Denna funktion kallas systemets faskarakteristik. För ett specifikt LTI-system kan vi bestämma dess faskarakteristik genom at mäta fasförskjutningen för cosinussignaler med olika vinkelfrekvenser ω. På samma sätt som för amplitudkarakteristiken handlar det om en skattning av ψ(ω) för ett ändligt antal vinkelfrekvenser. 4.3 Frekvensfunktionen För en specifikt LTI-system är varken amplitud- eller faskarakteristikerna unika. Däremot är kombinationen av amplitud- och faskarakteristik unik för varje distinkt LTI-system, och denna kombination utgör därmed en systemmodell som vi kan använda för at specificera ett visst LTI-system. Hur kan vi kombinera de två karakteristikerna till något som är en unik funktion för varje LTI-system? Det finns flera tänkbara varianter, men vi kommer nu att definiera en funktion som kombinerar de två karakteristikerna på ett mycket specifikt sätt och som kanske inte är uppenbart till någon nytta vid första påseende1 : H(ω) = D(ω) e jψ(ω) . (4.15) Den komplexvärda funktionen H(ω) kallas LTI-systemets frekvensfunktion, och om den är känd kan bestämma amplitud- eller faskarakteristikerna genom D(ω) = |H(ω)|, ψ(ω) = arg H(ω). (4.16) 18 För ett system H som har en väldefinierad amplitud- och faskarakteristik, D(ω) och ψ(ω), motsvarande en frekvensfunktion H(ω), utgör dessa funktioner systemmodeller som entydigt karakteriserar H. 1 Som beskrivs i avsnitt A.3 använder vi här j för att beteckna den imaginära enheten. 58 4.3.1 Från impulssvar till frekvensfunktion Än så länge har amplitud- och faskarakteristikerna respektive frekvensfunktionen beskrivits som funktioner ω, men det har också antytts att de beror av vilket system H som genererar utsignalen. Än så länge har vi emellertid inte presenterar en explicit beskrivning av hur, exempelvis H(ω) beror av H. Det är detta vi ska undersöka nu. Det vi ska göra nu är en alternativ härledning av samma resultat som nyss: att cosinus som insignal ger cosinus som utsignal. Den här gången ska vi emellertid använda systemmodellen att utsignalen för ett LTI-system ges som faltningen mellan dess impulssvar h(t) och insignalen. Vi använder uttrycket i (4.1) som insignal x(t) och får då utsignalen Z ∞ Z ∞ y(t) = H{A cos(ωt + φ)} = A h(τ) cos ω(t − τ) + φ dτ = A h(τ) cos ωt + φ − ω τ dτ = −∞ −∞ Z ∞ =A h(τ) cos(ωt + φ) cos(ω τ) + sin(ωt + φ) sin(ω τ) dτ = −∞ Z Z ∞ ∞ (4.17) h(τ) cos(ω τ) dτ + sin(ωt + φ) h(τ) sin(ω τ) dτ = = A cos(ωt + φ) |−∞ {z } |−∞ {z } :=B(ω) :=−C(ω) = A B(ω) cos(ωt + φ) − C(ω) sin(ωt + φ) Notera att i ovanstående formler är ω, i princip, en konstant som anger vilken frekvens insignalen har. Det betyder att även B och C, i princip, är konstanter men de beror på valet av ω. Om vi för enkelhets skulle bortser från beroende av ω kan vi nu definiera två nya konstanter, som av en händelse betecknas med D och ψ, så att B = D cos ψ, Dessa konstanter ges av D= √ B2 + C 2 , C = D sin ψ. (4.18) ψ = atan2(B, C). (4.19) Här är atan2 den funktion som används för att bestämma argumentet av ett komplext tal som definieras i (B.1). Sätter vi in dessa två nya konstanter i (4.17) får vi y(t) = A D cos ψ cos(ωt + φ) − D sin ψ sin(ωt + φ) = A D cos(ωt + φ + ψ), (4.20) vilket visar att även utsignalen är en cosinussignal, med samma vinkelfrekvens ω som insignalen, med en amplitud som förstärkts med faktorn D och en fas som förskjutits med ψ relativt insignalens amplitud respektive fas. Men det visste vi ju redan! Samtidigt ser vi, om beroendet av ω återigen görs explicit, att Re[H(ω)] = D(ω) cos ψ(ω) = /(4.18)/ = B(ω) = Z ∞ h(τ) cos(ω τ) dτ, −∞ Im[H(ω)] = D(ω) sin ψ(ω) = /(4.18)/ = C(ω) = − Z ∞ h(τ) sin(ω τ) dτ. (4.21) −∞ Det betyder att vi kan bestämma real- och imaginärdelarna i frekvensfunktionen H(ω) via de två integralerna i (4.21). Nu blir det komplext Med ovanstående resultat i bakgrunden kan vi gå ett steg längre och teckna frekvensfunktionen H(ω) direkt som ett uttryck i systemets impulssvar h(t): H(ω) = Re[H(ω)] + j Im[H(ω)] = Z ∞ h(τ) cos(ω τ) − j sin(ω τ) dτ = /Euler/ = −∞ Z ∞ −∞ 59 h(τ) e− j ω τ dτ. (4.22) Detta uttryck ger ett explicit samband mellan systemets impulssvar h(t) och dess frekvensfunktion H(ω), i alla fall åt ena hållet. Notera att medan h(t) är en funktion av tiden är H(ω) en funktion av vinkelfrekvens. 19 Givet ett LTI-system med impulssvaret h(t) kan vi bestämma dess frekvensfunktion H(ω) via (4.21) eller (4.22). Uttrycket som bestämmer H(ω) ur h(t) i (4.22) kallas för fouriertransformen2 av h(t), eller mer specifikt för den tidskontinuerliga fouriertransformen av h(t). En kommentar Notera att det finns ett minustecken i exponenten som står i integralen i (4.22). Minustecknet beror på att fasförskjutning och tidsfördröjning går åt “olika håll”. En kommentar Det går bra att tänka på frekvensfunktionen H(ω) som en komplexvärd funktion bestående av en real- respektive en imaginärdel (B och C) som kan bestämmas från h(t) genom att beräkna de två integralerna i (4.21). På så sätt är det inte nödvändigt att blanda in komplexa storheter i integralerna som bestämmer H(ω). Detta kräver emellertid att två integraler beräknas varje gång H(ω) ska bestämmas. Genom att använda uttrycket i (4.22) behöver endast en integral beräknas, men då ingår komplexvärda funktioner i integralen. Välj själv! En kommentar Ett LTI-system har alltid ett impulssvar h(t), som i princip vara en ganska godtycklig funktion. Alla tänkbara impulssvar h(t) kan emellertid inte stoppas in i (4.22) och ge en väldefinierad funktion H(ω), eftersom integralen inte har ett bestämt värde. Ett exempel är det kausala systemet som har impulssvaret h(t) = u(t)et . En tillräcklig krav för att H(ω) ska existera är att systemet är BIBO-stabilt. Det betyder egentligen att påstående om “cosinus in - cosinus ut” stämmer för BIBO-stabila LTI-system, men inte nödvändigtvis för alla system som inte är BIBO-stabila även om de är LTI. 4.3.2 Från frekvensfunktion till impulssvar Det går även att bestämma impulssvaret h(t) om enbart frekvensfunktionen H(ω) är känd. Vi undersöker följande integral: Z ∞ Z ∞Z ∞ byt plats på jωt H(ω)e dω = /(4.22)/ = h(τ) e− jωτ dτ e jωt dω = integralerna = (4.23) −∞ Z ∞ Z ∞−∞ −∞ Z ∞ = h(τ) e jω(t−τ) dω dτ = /(B.42)/ = 2 π h(τ) δ(t − τ) dτ = (4.24) −∞ −∞ −∞ = /(B.31)/ = 2π h(t), (4.25) vilket leder oss till följande samband: h(t) = 1 2π Z ∞ H(ω)e jωt dω. (4.26) −∞ Uttrycket som bestämmer h(t) ur H(ω) i (4.26) kallas för inversa fouriertransformen av H(ω), eller mer specifikt för den tidskontinuerliga inversa fouriertransformen av H(ω). 20 Givet ett LTI-system med frekvensfunktion H(ω) kan vi bestämma dess impulssvar h(t) via (4.26). En kommentar Sambandet i (4.26) innehåller komplexa storheter. Endast ett begränsat val av frekvensfunktioner H(ω) leder till impulssvar h(t) som är reella och kausala. 2 Efter den franske matematikern Joseph Fourier. 60 4.3.3 Frekvens eller vinkelfrekvens? Så här långt har vi beskrivit cosinussignaler med en specifik vinkelfrekvens ω. Men vi har även sagt att att vinkelfrekvens ω motsvarar “vanligt” frekvens f enligt (4.4). I en teoretisk analys av de slag som vi gör här är det ofta till fördel att uttrycka hur snabbt en cosinussignal varierar med dess vinkelfrekvens ω. Om vi istället använder frekvensen f skulle det hela tiden dyka upp faktorer med 2π i alla uttryck som vi slipper om vinkelfrekvensen används. Å andra sidan är det mer naturligt att använda frekvens i praktiska sammanhang, då vi uttrycket hur många svängningar eller perioder som signalen gör per tidsenhet. En konsekvens av detta är att vi kan behöva använda både vinkelfrekvens ω och vanligt frekvens f för att beskriva en och samma cosinussignal, beroende på om det är en teoretisk diskussion eller en praktiskt. Att då kunna relationerna i (4.4) utantill är i det fallet till stor hjälp! En konsekvens av denna diskussion är att vi ibland kan vara intresserad av att uttrycka amplitud- eller faskarakteristikerna som funktion av vinkelfrekvens ω och ibland som funktion av vanlig frekvens f . Samma sak gäller för frekvensfunktionen. Formellt borde vi då definiera två olika frekvensfunktioner, en som funktion av vinkelfrekvens och en som funktion av vanlig frekvens. I praktiken blir det lite praktiskt och istället tummar vi lite på matematisk stringens genom att helt enkelt använda H(ω) för att beteckna en frekvensfunktion som beror av vinkelfrekvens ω, och H( f ) för att beteckna en frekvensfunktion som beror av vanlig frekvens f . Den senare motsvarar egentligen H(2π f ), där H(ω) är ω = 2π f . Det betyder att, formellt, är H(ω) och H( f ) två olika men relaterade funktioner. 4.3.4 Kaskadkopplade system Om vi har två olika LTI-system,H1 och H2 , med varsin frekvensfunktion, H1 (ω) och H2 (ω), kan vi ibland vara intresserade av att bestämma frekvensfunktionen för det kaskadkopplade systemet H2 H1 , som ju även det är ett LTI-system enligt observation 3 på sidan 42. Vi sätter H1 (ω) = D1 (ω) e j ψ1 (ω) , H2 (ω) = D2 (ω) e j ψ2 (ω) , (4.27) där D1 , D2 är amplitudkarakteristikerna för respektive system och ψ1 , ψ2 är faskarakteristikerna för respektive system. På motsvarande sätt sätts frekvensfunktionen för det kaskadkopplade systemet till H3 (ω) = D3 (ω) e j ψ3 (ω) , (4.28) där D3 är amplitudkarakteristiken för H3 och ψ3 är faskarakteristiken för H3 . Det är en enkel övningsuppgift att visa D3 (ω) = D1 (ω) · D2 (ω), ψ3 (ω) = ψ1 (ω) + ψ2 (ω). (4.29) Av detta följer även H3 (ω) = D1 (ω) · D2 (ω) e j ψ1 (ω)+ψ2 (ω) = D1 (ω) e j ψ1 (ω) · D2 (ω) e j ψ2 (ω) = H1 (ω) · H2 (ω). (4.30) Sammanfattningsvis kan vi alltså dra följande slutsats 21 Frekvensfunktionen för två kaskadkopplade LTI-system är produkten av de två systemens frekvensfunktioner. Eftersom produkt mellan två funktioner kommuterar följer även att LTI-system kommuterar i en kaskadkoppling, men det visste vi ju redan. 4.3.5 Linjärkombinationer av system Låt H1 och H2 vara två LTI-system, med frekvensfunktionerna H1 (ω) respektive H2 (ω). Eftersom de är LTI-system har de även varsitt impulssvar: h1 (t) respektive h2 (t) som, i enlighet med (4.22), uppfyller sambanden Z ∞ Z ∞ H1 (ω) = h1 (τ) e− j ω τ dτ, H2 (ω) = h2 (τ) e− j ω τ dτ. (4.31) −∞ −∞ 61 Vi ska nu försöka bestämma frekvensfunktionen för det LTI-system som är en linjärkombination av H1 och H2 , H3 = a1 H1 + a2 H2 . Från observation 11 på sidan 47 vet vi att impulssvaret för H3 ges av h3 (t) = a1 h1 (t) + a2 h2 (t). Dess frekvensfunktion kan då uttryckas som Z ∞ Z ∞ H3 (ω) = h3 (t)e− jωt dt = a1 h1 (t) + a2 h2 (t) e− jωt dt = (4.32) −∞ −∞ Z ∞ Z ∞ = a1 h1 (t) e− jωt dt + a2 h2 (t) e− jωt dt = a1 H1 (ω) + a2 H2 (ω). (4.33) −∞ −∞ Detta resultat kan sammanfattas som: 22 En linjärkombination av LTI-system har en frekvensfunktion som är samma linjärkombination av respektive frekvensfunktioner. 4.3.6 Det inversa systemet Antag att H är ett LTI-system som genererar utsignalen y(t) från insignalen x(t): y(t) = H{x(t)}, (4.34) och att H har frekvensfunktionen H(ω). Vi skulle då kunna fråga oss: vilket system kan ta y(t) som insignal och återskapa x(t) ur denna? Ett sådant system kallas det inversa systemet till H och betecknas med H −1 . Om ett sådant system existerar så ska gälla att kaskadkopplingen H −1 H är ett system som genererar utsignalen x(t) från insignalen x(t): H −1 H {x(t)} = x(t). (4.35) Eftersom kaskadkoppling av två LTI-system ger en frekvensfunktion som är produkten av systemens frekvensfunktioner innebär det att H −1 måste ha en frekvensfunktion som ges av 1/H(omega) för att (4.35) ska gälla för godtyckliga insignaler x(t). Av detta kan vi även dra slutsatsen att det inversa systemet inte alltid existerar. Om H−1 existerar finns ett motsvarande impulssvar hinv som ger Z ∞ 1 = hinv (t) e− jωt dt, (4.36) H(ω) −∞ men för varje väldefinierad H(ω) är det inte säkert att hinv existerar, i alla fall inte som en väldefinierad funktion. I det fallet kan inte heller H −1 existera som ett väldefinierat system. 23 Inversen till ett LTI-system med frekvensfunktionen H(ω) existerar ibland, men ibland inte. Om inversen existerar ges dess frekvensfunktion av 1/H(ω). 4.3.7 Exempel på frekvensfunktioner Frekvensfunktionen kan ofta bestämmas för de flesta av de LTI-system som har nämnts och kommer att nämnas i denna framställning. I detta avsnitt ska vi titta på några exempel och se hur motsvarande frekvensfunktion bestäms. Förstärkare Om vi skickar in signalen x(t) = A cos(ωt + φ) till en förstärkare, som beskrivs med systemoperatorn i (2.13), blir den resulterande utsignalen y(t) = a A cos(ωt + φ). (4.37) Det betyder att cosinussignalen har förstärkts med faktorn a, men inte ändrat sin fas. Det ger D(ω) = a och ψ(ω) = 0, vilket motsvarar frekvensfunktionen H(ω) = a e j·0 = a. 62 (4.38) Notera att en förstärkare med tidsvariabel förstärkning inte är LTI, specifikt är den inte tidsinvariant, och därför inte heller har en frekvensfunktion. Tidsfördröjning På motsvarande sätt kan vi skicka in en cosinussignal i en fördröjning, som fördröjer med ∆t: H{A cos(ωt + φ)} = A cos ω(t − ∆t) + φ = A cos(ωt + φ − ω∆t). (4.39) Det betyder att cosinussignalen har förstärkts med faktorn 1 och fasförskjuts med −ω ∆t. Det ger D(ω) = 1 och ψ(ω) = −ω ∆t, vilket motsvarar frekvensfunktionen H(ω) = e− jω∆t . (4.40) Notera minustecknet i exponenten som, återigen, beror på att tidsfördröjning och fasförskjutning går åt “motsatt håll”. Deriverare För en deriverare får vi H{A cos(ωt + φ)} = π d A cos ωt + φ = −ω A sin(ωt + φ) = ω A cos ωt + φ + . dt 2 (4.41) Det betyder att cosinussignalen har förstärkts med faktorn ω och fasförskjuts med − π2 . Det ger D(ω) = ω och ψ(ω) = − π2 , vilket motsvarar frekvensfunktionen π H(ω) = ω e j 2 = jω. (4.42) En konsekvens av detta resultat är att ett system som deriverar två gånger, vilket kan ses som en kaskadkoppling av två deriverare, har en frekvensfunktion som ges av (− jω)2 = −ω2 . (4.43) Linjära ODE:er Vi ska nu ta oss an ett lite mer komplicerat exempel i form av linjära ODE:er, där ett enkel exempel ges av det system H som beskrivs av följande linjära ODE: d z(t) + k z(t) = x(t). dt (4.44) Detta system studerade vi i exemplet med ett vattentornet i avsnitt 2.2.4, där x(t) är systemets insignal i form av vattenflödet ut ur vattentornen och in i vattennätet och z(t) är residualvolymen som återstår i tornet innan det är fyllt. Vattentornet har en pump som styrs av ett enkelt reglersystem, vilket leder till ett samband mellan in- och utsignal enligt (2.37). Vi har redan bestämt impulssvaret h(t) för detta system, (3.81), och skulle vi kunna bestämma dess frekvensfunktion H(ω) mha. (4.22), men vi ska istället använda en lite mer indirekt metod som i detta fall är något enklare. En närmare undersökning av (4.44) ger vid handen att x(t) kan skrivas som en summa (linjärkombination) av en derivering respektive en förstärkning med k av z(t). Med stöd av observation 23 på sidan 62 kan vi då skriva frekvensfunktionen för det inversa systemet H −1 , som återskapar x(t) från z(t), som 1 = jω + k, H(ω) ⇒ H(ω) = 1 . jω + k (4.45) Vi kan även använda (4.22), med h(t) = e−kt u(t): H(ω) = Z ∞ −∞ e−kt u(t) e− jωt dt = Z ∞ " e−( jω+k)t dt = 0 63 e−( jω+k)t −( jω + k) #t=∞ = /k > 0/ = t=0 1 . jω + k (4.46) 0 1/k 0 π 2 ω ω Figur 4.2: Vänster: amplitudkarakteristiken D(ω) för det system som beskrivs av ODE:n i (4.44). Höger: motsvarande faskarakteristik ψ(ω). Detta är samma uttryck för H(ω) som i (4.45). Notera att vi måste göra antagandet k > 0 för att erhålla detta resultat, vilket är i enlighet med diskussionen i avsnitt 3.10.4. Givet att frekvensfunktionen H(ω) för systemet är bestämd kan vi enkelt ta fram även amplitud- och faskarakteristikerna: D(ω) = |H(ω)| = 1 1 = √ , 2 | jω + k| ω + k2 ω ψ(ω) = arg H(ω) = − arg( jω + k) = − tan−1 . k (4.47) De två karakteristikerna illustreras i figur 4.2. Här ser vi att systemet som vattentornet utgör förstärker cosinussignaler som har låga frekvenser, nära ω = 0, med faktorn 1/k och fasförskjuter nästan ingenting. Ju högre frekvensen blir desto mindre blir förstärkningen och för mycket höga frekvenser kommer cosinussignalen att dämpas nästan helt. Samtidigt ändras fasförskjutningen mot − π2 . Den amplitudkarakteristik som uppvisas av systemet överensstämmer med systemets generella beskrivning i avsnitt 2.2.4. Det reglersystem som styr vattentornets pump ska inte reagera på snabba förändringar i vattenförbrukningen, dvs. höga frekvenser. Däremot långsamma förändringar, exempelvis över ett dygn, ska återspeglas i pumpens arbete. 4.4 Generella signaler I detta kapitel har vi inledningsvis fokuserat på cosinussignaler. En rimlig fråga är då: varför skulle dessa signaler vara intressanta? Ett system kan ju ha alla möjliga sorters insignaler som inte nödvändigtvis är av typen cosinus. Låt oss se vad vi kan göra med två cosinussignaler, lite mer specifikt med linjärkombinationer av två cosinussignaler. 4.4.1 Linjärkombination av cosinussignaler med samma frekvens Sätt x1 (t) = A1 cos(ωt + φ1 ), x2 (t) = A2 cos(ωt + φ2 ), (4.48) vilket ger oss två cosinussignaler med samma vinkelfrekvens ω. Kanske kan vi åstadkomma en mer generell signal genom en linjärkombination av de två? Vi provar x3 (t) = α1 x1 (t) + α2 x2 (t) = α1 A1 cos(ωt + φ1 ) + α2 A2 cos(ωt + φ2 ) = = α1 A1 cos(ωt) cos φ1 − α1 A1 sin(ωt) sin φ1 + α2 A2 cos(ωt) cos φ2 − α2 A2 sin(ωt) sin φ2 = = (α1 A1 cos φ1 + α2 A2 cos φ2 ) cos(ωt) − (α1 A1 sin φ1 + α2 A2 sin φ2 ) sin(ωt) = | {z } | {z } =P (beror inte av t eller ω) =Q (beror inte av t eller ω) = P cos(ωt) − Q sin(ωt) = R cos(ωt + γ) 64 (4.49) där R och γ väljs så att R= p P2 + Q2 , γ = atan2(P, Q). (4.50) Sammanfattningsvis betyder det att även x3 är en cosinussignal, med samma frekvens som x1 och x2 , men med en amplitud som ges av R och en fas som ges av γ. Med induktion är det enkelt att visa att vi skulle få samma principiella resultat även om vi undersöker en linjärkombination av tre eller fler cosinussignaler med samma frekvens. 24 En linjärkombination av två eller fler cosinussignaler som alla har samma frekvens ger en ny cosinussignal med samma frekvens som de övriga. Dess amplitud och fas beror av amplituderna och faserna för de ingående cosinusfunktionerna, men inte av deras frekvens. 4.4.2 Linjärkombination av cosinussignaler med olika frekvens Uppenbarligen kan vi inte åstadkomma mer generella signaler med linjärkombinationer av cosinussignaler som alla har samma frekvens. Vi provar därför med två cosinussignaler som har olika frekvens: x1 (t) = cos(ω1 t + φ1 ), x2 (t) = cos(ω2 t + φ2 ), där ω1 , ω2 . (4.51) Här sätter vi amplituderna = 1 eftersom de ändå skalas med skalärerna i linjärkombinationen. Om vi nu sätter x3 (t) = α1 x1 (t) + α2 x2 (t) = α1 cos(ω1 t + φ1 ) + α2 cos(ω2 t + φ2 ), (4.52) så går det inte att skriva om x3 på något enklare sätt. Om α1 och α2 båda är nollskilda är x3 är inte en cosinussignal, utan av mer generell typ. Vi kan nu undersöka vad denna signal ger för utsignal för ett LTI-system med känd amplitud- och faskarakteristik: H{x3 (t)} = H{α1 cos(ω1 t + φ1 ) + α2 cos(ω2 t + φ2 )} = /LTI/ = α1 H{cos(ω1 t + φ1 )} + α2 H{cos(ω2 t + φ2 )} = (4.53) = α1 D(ω1 ) cos(ω1 t + (ψ(ω1 ) + φ1 )) + α2 D(ω2 ) cos(ω2 t + (ψ(ω2 ) + φ2 )). Detta visar att LTI-systemet tar hand om varje term i x3 , i form av en cosinussignal, separat. Varje term får en egen amplitudskalning med B och fasförskjutning med φ, båda beroende på vilken frekvens som respektive cosinussignal har. Med induktion kan vi enkelt generalisera detta resultat. Låt en insignal vara definierad som X x(t) = αn cos(ωn t + φn ), (4.54) n en linjärkombination av ett antal olika cosinussignaler. Här är vi avsiktligt lite vaga vad gäller exakt hur många cosinussignaler som ingår i linjärkombinationen. Det skulle kunna vara ett ändligt eller oändligt antal. Utsignalen för denna insignal blir X y(t) = H{x(t)} = αn D(ωn ) cos(ωn t + (ψ(ωn ) + φn )). (4.55) n I det generella fallet är både in- och utsignal av en typ som inte kan skrivas som en cosinussignal. Ovanstående resultat betyder att för alla signaler som går att skriva på formen x(t) i (4.54), kan vi bestämma deras utsignal enligt (4.55). För att göra det behöver dels känna skalärerna αn och fasförskjutningarna φn för vår insignal, liksom systemets amplitud- och faskarakteristiker. Det som gör ovanstående resultat användbart är följande påstående, som vi emellertid inte visar här: 25 I princip alla signaler x(t) kan unikt skrivas som linjärkombinationer av cosinussignaler, (4.54). Detta påstående är inte formulerat på ett strikt matematiskt sätt, men fångar ändå essensen av vad signalbehandling går ut på: att försöka beskriva de signaler som är aktuella för ett system som linjärkombinationer av 65 cosinussignaler. Om vi kan bestämma hur signalen x(t) delas upp i sina cosinussignaler, dvs. bestämma alla αn och φn , kan vi också enkelt bestämma motsvarande uppdelning av utsignalen y(t) om vi även känner amplitud- och faskarakteristikerna. En kommentar Begreppet “linjärkombination” kan i det generella fallet behöva utökas till oändliga summor, men även till integraler som innehåller cosinusfunktioner. I det fallet kommer (4.54) att skrivas som Z ∞ x(t) = α(ω) cos(ωt − φ(ω)) dω (4.56) 0 Notera att ovanstående uttryck är en linjärkombination som “summerar” över olika frekvenser på liknande sätt som i (4.54). Att varje signal x(t) unikt kan skrivas på formen (4.54) eller (4.56) innebär att x(t) byggs upp som en linjärkombination av cosinusfunktioner, ofta kallade frekvenskomponenter. Det betyder också att x(t) unikt kan “delas upp” i sina frekvenskomponenter, dvs. att det går att bestämma koefficienterna αn och φn för dess olika komponenter med frekvenserna ωn , eller motsvarande i fallet (4.56). 26 Anledningen till att vi kan vara intresserade av att beskriva en godtycklig signal som en linjärkombination av cosinusfuktioner, frekvenskompoenter, är att det är enkelt att beskriva hur varje frekvenskomponent avbildas av ett LTI-system till motsvarande frekvenskomponent i utsignalen. Ett sätt att tänka på detta resultat är att koppla det till diskussionen i avsnitt A.1.4 om baser och koordinater. Eftersom varje signal i signalrummet S kan uttryckas som en linjärkombination av cosinusfunktioner kan vi se dom som en slags bas för S. 4.4.3 Bandbegränsade signaler Givet att en godtycklig signal s(t) kan delas upp i en linjärkombination av cosinussignaler med olika frekvenser så kommer i det generella fallet s(t) att skivas som en summa/integral av cosinusfunktioner av alla möjliga vinkelfrekvenser ω. För en bandbegränsad signal finns en nedre gräns, ω1 , och en övre gräns, ω2 , för vilka frekvenser som dess cosinusfunktioner innehåller: ω1 ≤ ω ≤ ω2 . (4.57) I fallet att ω1 = 0 sägs signalen s(t) vara ω2 -bandbegränsad, dvs. den kan skrivas som en linjärkombination av cosinussignaler med vinkelfrekvenser upp till ω2 . En kommentar Frekvens kan anges antigen i “vanlig frekvens” (enhet Hz eller perioder per sekund) eller i vinkelfrekvens (enhet radianer per sekund). Eftersom de två typerna av frekvens enbart skiljer sig åt med en faktor 2π innebär en begränsning av vinkelfrekvens även en begränsning av frekvens, och tvärtom. I de fall som ett specifik värde på gränserna anges bör det framgå om det avser frekvens eller vinkelfrekvens, om inte annat så av sammanhanget. En till kommentar I många fall spelar det inte så stor roll om en bandbegränsad signal inkluderar eller inte inkluderar gränserna ω1 respektive ω2 i sitt frekvensinnehåll. Begreppet bandbegränsad signal anger därför inte explicit huruvida dessa gränsfrekvenser ingår eller inte. Om det är viktigt att vara specifik ska detta anges. 4.5 Det tidsdiskreta fallet De resultat och exempel som presenterats så här långt i kapitlet har varit tidskontinuerliga och i det här avsnittet ska vi titta på vad som gäller i det tidsdiskreta fallet. Vi börjar med en generell tidskontinuerlig cosinussignal, med vinkelfrekvens ω: x(t) = A cos(ω t + φ), (4.58) 66 som samplas enligt (1.2), där T är tidsintervallet mellan varje sampel, för att ge den tidsdiskreta signalen x[k] = A cos(ω T k + φ). (4.59) Detta uttryck, (4.59), kan ses som den prototypiska cosinussignalen i det tidsdiskreta fallet. Vi ska emellertid strax se att denna beskrivning måste hanteras med en viss försiktighet. Ett tidsdiskret LTI-system kas ses som ett specialfall av ett tidskontinuerligt LTI-system, där linearitet gäller på samma sätt i båda fallen men där tidsinvarians enbart behöver gälla för heltalsmultipler av samplingsintervallet T i det tidsdiskreta fallet, se avsnitt 3.11. Det betyder, i princip, att begreppet “cosinus in - cosinus ut” gäller även för tidsdiskreta system. Alltså kommer ett tidsdiskret system H som får x[k] i (4.59) som insignal att, i princip, generera en utsignal y[k] enligt: y[k] = H{x[k]} = D(ω) A cos ω T k + φ + ψ(ω) . (4.60) Här är D(ω) och ψ(ω) systemets amplitud- respektive faskarakteristiker, på samma sätt som i det tidskontinuerliga fallet. Av dessa kan vi sedan bestämma en frekvensfunktion H(ω) på samma sätt som i det tidskontinuerliga fallet, (4.15). Det finns emellertid några viktiga observationer vi kan göra i det tidsdiskreta fallet och som måste tas hänsyn till för att effektivt kunna hantera cosinussignaler och frekvensfunktioner i det tidsdiskreta fallet: idén om negativa frekvenser, vikning av samplade cosinussignaler och att H(ω) för ett tidsdiskret system är periodisk. 4.5.1 Från impulssvar till frekvensfunktion I avsnitt 4.3.1 visades att för ett tidsdiskret system finns ett enkelt uttryck som bestämmer dess frekvensfunktion från systemets impulssvar, (4.22). Samma utredning för det tidsdiskreta fallet visar att enda skillnaden är att det som i det tidskontinuerliga fallet är en integral över den kontinuerliga tidsvariabeln t istället blir en summa över den diskreta tidsvariabeln k: ∞ X H(ω) = h[k] e− j ω T k . (4.61) k=−∞ I avsnitt 4.5.5 ska vi se att det även finns en invers formel som bestämmer k[k] ur H(ω), men för att visa det behöver vi först några ytterligare resultat. Uttrycket som bestämmer H(ω) ur h[k] i (4.61) kallas för fouriertransformen3 av h[k], eller mer specifikt för den tidsdiskreta fouriertransformen av h[k]. 4.5.2 Finns negativa frekvenser? I början av detta kapitel definierades begreppet cosinussignal för det tidskontinuerliga fallet, för amplitud A, vinkelfrekvens ω och fas φ, (4.1). I samband med detta nämndes att frekvens måste vara noll eller positiv. Detta antagande är egentligen bara nödvändigt om vi vill kunna göra en entydig koppling mellan en cosinussignal och dess fas och frekvens. Den cosinussignal som definieras i (4.1) kan även skrivas A cos(ω t + φ) = A cos(−ω t − φ), (4.62) eftersom cosinus är en jämn funktion. Vi kan sammanfatta detta med: 27 En och samma cosinussignal kan beskrivas med vinkelfrekvensen ω och fasen φ eller med vinkelfrekvensen −ω och fasen −φ. Om det finns behov av att kunna beskriva cosinussignaler med antingen positiva eller negativa frekvenser behöver vi även utöka frekvensfunktionen H(ω) för ett system så att den är väldefinierad för alla ω ∈ R. Sedan tidigare vet vi att H{A cos(ω t + φ)} = D(ω) A cos ω t + φ + ψ(ω) (4.63) 3 Samme gamle Joseph som förra gången! 67 där D och ψ är systemets amplitud- respektive faskarakteristiker, men nu uppstår även möjligheten att H{A cos(ω t + φ)} = H{A cos(−ω t − φ)} = D(−ω) A cos − ω t − φ + ψ(−ω) = = D(−ω) A cos ω t + φ − ψ(−ω) . (4.64) Vi vill att vänsterleden i (4.63) och (4.64) ska vara lika för alla ω, vilket leder oss till slutsatserna: D(−ω) = D(ω), ψ(ω) = −ψ(ω). (4.65) Det betyder alltså att D är en jämn funktion och att ψ är en udda funktion. Sammanfattningsvis leder detta till att frekvensfunktionen har egenskapen H(−ω) = D(−ω) e jψ(−ω) = D(ω) e− jψ(ω) = D(ω) e jψ(ω) = H(ω). (4.66) Här används komplexkonjugering som definieras i avsnitt A.3. Funktioner som har den egenskap som beskrivs i (4.66) kallas Hermiteska funktioner4 , och vi kan sammanfatta denna utredning med att 28 Frekvensfunktionen H(ω) kan utökas till ω ∈ R, men måste vara en Hermitesk funktion. Denna observation gäller både i det tidskontinuerliga och i det tidsdiskreta fallet, även om konsekvenserna är lite mer uppenbara i det senare fallet. Vi ska strax se vad det handlar om. En kommentar Att H(ω) är Hermitesk kan även enkelt härledas ur (4.22) eller (4.61). Oavsett hur vi gör det så krävs egentligen att h(t) är reell för att komma fram till att H(ω) är Hermitesk. Att h(t) är en reellvärd funktion är emellertid ett rimligt antagande för flesta system. 4.5.3 Vikning Eftersom cos-funktioner är periodiska, med perioden 2π, måste gälla att en alternativ representation av x[k] är ! ! 2πn x[k] = A cos(ω T k + φ + 2 π n k) = A cos ω + T k+φ . (4.67) T Här är både k och n heltal. Konsekvensen av detta är att de sampel som genereras lika gärna skulle kunna komma från en cosinus med vinkelfrekvensen ω + 2πn T för godtyckligt n ∈ Z. En tidsdiskret signal kan alltså inte skilja mellan olika cosinussignaler om de har frekvenser som enbart skiljer sig åt med heltalsmultipler av 2Tπ , men samma amplitud och fas. Detta fenomen kallas vikning5 och innebär att vi kan få en entydigt representation av en tidskontinuerlig signal x(t) i form av dess tidsdiskreta version x[k] endast om frekvensen begränsas på något sätt. Den vanligast förekommande begränsningen för att undvika vikning är 0≤ω< π , T (4.68) vilket alltså innebär att x(t) ska vara Tπ -bandbegränsad. Denna bandbegränsning gör att alla signaler x(t) får en unik representation i den tidsdiskreta formen x[k] även med hänsyn taget till att frekvensen för en cosinussignal inte är entydigt bestämd vad gäller tecken. En kommentar Notera att intervallet som valts i (4.68) slutar redan vid Tπ . En signal som har en högre frekvens, 3π 3π π exempelvis 2T kommer vid samplingen att “vikas” ned till frekvensen 2T − 2π T = − 2T . Med hänvisning till obserπ vation 27 motsvarar det en signal med frekvensen + 2T om också fasen byter tecknen. 4 Efter den franske matematikern Charles Hermite. aliasing. 5 Engelska: 68 Vi kan sammanfatta dessa resultat som 29 En tidskontinuerlig cosinussignal utsätts för vikning när den samplas, vilket innebär att dess frekvens inte är entydigt bestämt från den resulterande samplade signalen. Genom att införa en bandbegränsning, (4.68), av den tidskontinuerliga signalen innan den samplas undviks vikning. Samma bandbegränsning gäller även utsignalen y[k] för att den ska ha en entydig frekvens. 4.5.4 H(ω) är periodisk för ett tidsdiskret system Låt H vara ett godtycklig tidsdiskret system med samplingsperioden T och låt x[k] vara en tidsdiskret cosinussignal med vinkelfrekvens ω, (4.59). Motsvarande utsignal y[k] ges då av (4.60). Motsvarande utsignal för en tidsdiskret signal med vinkelfrekvens ω + 2πn T blir då ( ! !) ! ! !! 2πn 2πn 2πn 2πn H A cos ω + T k+φ = D ω+ A cos ω + T k+φ+ψ ω+ = /vikning/ = T T T T ! !! 2πn 2πn A cos ω T k + φ + ψ ω + . (4.69) = D ω+ T T Om vi tar hand om vikningen redan i insignalen han vänsterledet i ovanstående uttryck även skrivas ( ! !) 2πn H A cos ω + T k + φ = /vikning/ = H{A cos(ω T k + φ)} = T = D(ω) A cos ω T k + φ + ψ(ω) . (4.70) För att högerleden i (4.69) och (4.70) ska bli lika för alla ω och alla φ måste vi anta att både amplitud- och faskarakteristikerna, och därmed även frekvensfunktionen, är periodisk med perioden 2π T : ! ! ! 2πn 2πn 2πn = D(ω), ψ ω + = ψ(ω), ⇔ H ω + = H(ω), n ∈ Z. (4.71) D ω+ T T T Detta kan vi sammanfatta med: 30 För ett tidsdiskret system med samplingsperioden T är amplitud- ochh faskarakteristikerna, liksom dess frekvensfunktion H(ω), periodiska med perioden 2π T . En konsekvens av detta resultat är att för ett tidsdiskret system behöver vi inte beskriva H(ω) för ω > 2π T , eftersom den upprepar sig periodiskt ovanför denna gräns. Men det stannar inte där. I intervallet Tπ < ω < 2π kan vi skriva T frekvensfunktionen som ! 2π −ω . (4.72) H(ω) = /(4.66)/ = H(−ω) = /(4.71)/ = H T Det betyder att H(ω) i detta intervall ges av komplexkonjugatet av frekvensfunktionen i intervallet 0 < ω < Sammanfattningsvis: π T. 31 Frekvensfunktionen för ett tidsdiskret system är entydigt bestämd om vi känner den i intervallet 0 ≤ ω < π T. 4.5.5 Från frekvensfunktion till impulssvar I avsnitt 4.5.1 beskrivs ett uttryck som bestämmer frekvensfunktionen H(ω) för ett tidsdiskret system ur dess impulssvar h[k], (4.61). Vi ska nu visa att det även går att göra den motsatta resan: bestämma impulssvaret h[k] ur 69 frekvensfunktionen H(ω). Vi ska undersöka följande integral: Z π/T H(ω) e jω T k dω = /(4.61), men vi byter k mot l i summan!/ = π/T Z −π/T ∞ X h[l] e− j ω T l e jω T k dω = (4.73) −π/T l=−∞ = /byt plats på integral och summa/ = ∞ X Z = h[l] l=−∞ e jω T (k−l) dω = /(A.39)/ = (4.74) −π/T l=−∞ ∞ X π/T h[l] 2π 2π δ[k − l] = /(B.35)/ = h[k]. T T Av detta kan vi dra slutsatsen att T h[k] = 2π Z (4.75) π/T H(ω) e jω T k dω. (4.76) −π/T Uttrycket som bestämmer h[k] ur H(ω) i (4.76) kallas för inversa fouriertransformen6 av H(ω), eller mer specifikt för den tidskontinuerliga inversa fouriertransformen av H(ω). En kommentar Betänk att inte alla summor med oändligt antal termer konvergerar. Det går att välja H(ω) så att h[k] inte har ett bestämt värde. Så länge som h[k] är en begränsad funktion ges H(ω) av (4.61) och h[k] går att bestämma ur denna frekvensfunktion enligt (4.76). En till kommentar Notera att vi bestämmer h[k] i (4.76) genom att integrera H(ω) över ett begränsat frekvensintervall, − Tπ < ω < Tπ , dvs. vi använder inte alla värden av frekvensfunktionen i denna integral. Men vi vet också från avsnitt 4.5.4 att i det tidsdiskreta fallet är H(ω) periodisk med perioden 2π T , varför det inte finns mer information om H(ω) att hämta utanför detta intervall. Vi kan sammanfatta detta som 32 För ett tidsdiskret system med begränsat impulssvar h[k] är dess frekvensfunktion en fullständig modell av systemet i den meningen att det går att bestämma h[k] ur H(ω). Om vi istället för H(ω) har uttrycket för real- och imaginärdelarna för frekvensfunktioner: B(ω) = Re[H(ω)], C(ω) = Im[H(ω)], H(ω) = B(ω) + j C(ω), (4.77) kan vi alternativt bestämma h[k] utan att blanda in komplexa storheter i integralen: h[k] = T π Z π/T B(ω) cos(ω T k) − C(ω) sin(ω T k) dω, (4.78) 0 vilket lämnas som räkneuppgift att visa. 4.5.6 Innan vi går vidare I detta avsnitt har vi sett att tidsdiskreta signaler och system enbart kan hantera cosinussignaler med ett begränsat frekvensintervall. Det beror dels på vikning av tidsdiskreta signaler och på att frekvensfunktionen för tidsdiskreta system är både periodisk och Hermitesk, även om dessa observationer inte är helt oberoende. Vi kan notera att T är tiden mellan varje sampel när den tidskontinerliga signalen samplas, dvs. samplingsfrekvensen (antalet sampel per tidsenhet) är f s = 1/T . Den bandbegränsning som beskrivs i (4.68) kan även anges i vanlig frekvens: fs π (4.79) 2 πf < , ⇒ f < . T 2 6 Just det: Joseph Fourier igen! 70 Frekvensen fs 2 kallas för Nyquist-frekvensen7 för en signal som samplas med samplingsfrekvensen f s . 33 Tidsdiskreta system kan, i princip, enbart hantera bandbegränsade signaler, som är bandbegränsade upp till Nyquist-frekvensen. Om en signal innehåller en frekvenskomponenter över Nyquist-frekvensen innan den samplas kommer den att tolkas som en frekvenskomponent med en lägre frekvens pga. vikning. Vi ska återkomma tidsdiskreta signaler och system i kapitel 6 som tar upp både praktiska och teoretiska aspekter kring sampling och rekonstruktion av signaler. 7 Efter svensk-amerikanske elektronikingenjören Harry Nyquist. 71 72 Kapitel 5 Filter Vi har sett att ett LTI-system har egenskapen “cosinus in - cosinus ut”, dvs. om signalen är en cosinussignal med en viss frekvens kommer även utsignalen att vara en cosinussignal med samma frekvens. I det generella fallet kommer emellertid amplitud och fas att vara olika för in- och utsignal. Det är systemets frekvensfunktion H(ω) som beskriver hur amplituden och fasen ändras för en cosinussignal, beroende på dess frekvens ω. Att amplitud och fas ändras för en cosinussignal är alltså en generell egenskap som alla LTI-system har. Exempelvis såg vi i avsnitt 4.3.7 att frekvensfunktionen för det system som beskriver hur residualvolymen z(t) i magasinet för ett vattentorn beror av det utgående vattenflödet x(t) på ett sätt som gör att långsamma variationer i x(t) motsvaras av långsamma variationer även i z(t) och med relativt hög amplitud. Snabba variationer i x(t) dämpas emellertid ut i z(t). Detta var i själva verket ett designval när vi beskrev det reglersystem som styr pumpen som fyller på magasinet, även om det inte beskrevs explicit på det sättet. Ett filter är ett system som används för att antingen “ta bort” eller “ta fram” specifika egenskaper i en signal. I en mer strikt tolkning handlar det om LTI-system som tar bort eller dämpar, alternativt förstärker, specifika frekvenskomponenter i en signal. I det generella fallet kan filter även vara olinjära och, exempelvis användas för att ta bort eller reducera brus eller olika typer av störningar, alternativt för att hitta specifika mönster eller signalsekvenser. Filter kan även användas för 2-dimensionella signaler i form av bilder. Även här kan vi vara intresserad av att reducera brus eller störningar eller för att göra bilden skarpare. Ett specifikt exempel är att ta bort “röda ögon” i (digitala) fotografier. Här behöver systemet först hitta ögonen och sedan ta bort de röda fläckarna. Den första delen, att hitta ögonen, är en process som generellt kallas detektion och har en stor tillämpning inom signalbehandling, både för de tidsvariabla signaler vi diskuterar i denna framställning och inom bearbetning av digitala bilder. Detektion bygger på att signaler filtreras för att “peka ut” tidpunkter (eller bildpunkter) där specifika signaler återfinns. I detta kapitel kommer vi att fokusera på filter som utgörs av LTI-system. I detta sammanhang kan vi initialt definiera ett filter som ett LTI-system som har designats för att uppvisa en specifik frekvensfunktion. Vi ska senare även undersöka LTI-system i form av filter för detektion. 5.1 Frekvensselektiva filter Ett frekvensselektivt filter är ett LTI-system som har designats specifikt för att uppvisa en önskad frekvensfunktion. Denna typ av system återfinns i många tekniska system och av flera orsaker, men i samtliga fall handlar det om att frekvenskomponenter i en signal som har olika frekvens ska behandlas på olika sätt. Här är några exempel: • Hörapparaten i listan med exemplen på system, sidan 10, innehåller ofta ett filter som är anpassat till känsligheten för användarens öra, en amplitudkarakteristik för hur ljudsignaler från trumhinnan överförs till hjärnans hörselsinne. Den känslighetskurvan kan skattas genom så kallad tonaudiometri och när en hörapparat är nödvändig uppvisar den ofta att användaren har låg känslighet i vissa frekvensområden. Om hörapparatens har ett filter med en amplitudkarakteristik som i görligaste mån kompenserar för örats karakteristik , dvs.har en högre förstärkning där örats är låg, och tvärtom, kan användarens ljudupplevelse förbättras. • En radio har ofta en stationsinställning som kan ställa in mottagningen på en viss frekvens som motsvarar den frekvens som sändaren sänder ut sina signaler på. Antennen kommer emellertid även att ta in signaler 73 från andra sändare, som sänder på andra frekvenser, och för att fungera effektivt behöver radion därför filtrera bort dessa signaler innan den mottagna signalen omvandlas till en ljudsignal. • Nätspänningen i eluttagen har en frekvens på 50 Hz, en frekvens som kan örat uppfattar tämligen bra. En ljudanläggning, exempelvis en förstärkare, har elektroniska kretsar som kan drivas med nätspänning via ett nätaggregat som omvandlar nätspänningen på 240 volt växelström till, exempelvis 12 volt likström. En sådan anläggning har ett filter som effektivt filtrerar bort 50 Hz från alla spänningar som driver de elektroniska kretsarna så att denna signal inte fortplantar sig till utgången som driver högtalarna. • Ljudet på en LP-skiva spelas in med så kallad RIAA-korrektion som dämpar låga frekvenser och förstärker höga frekvenser i det ljud som spelas in i form av ett spår på skivan. Ett filter med motsatt karakteristik används sedan vid uppspelningen av ljuden från LP-skivan. Genom att dämpa de låga frekvenserna innan inspelningen kan spåren på skivan läggas tätare och genom att dämpa de höga frekvenserna vid uppspelning kan det brus som uppstår av damm och andra defekter från själva skivan reduceras. • Ljud som ska spelas in digitalt behöver samplas och för att det ska fungera bra behöver ljudets frekvensinnehåll dämpas för frekvenser över halva samplingsfrekvensen. Se kapitel 6. • En framgaffel på en motorcykel kan ha resonansfrekvens f0 som göra att vid en viss hastighet, när hjulet roterar med frekvensen f0 , börjar framgaffeln att wobbla. Genom att montera en dämpare mellan ramen och gaffeln som dämpar vibrationer kring frekvensen f0 kan risken för wobbling reduceras signifikant. • En högtalare för HiFi-bruk1 har ofta två eller flera högtalarelement, exempelvis en bashögtalare för de låga frekvenserna och en diskanthögtalare för de höga frekvenserna i ljudet. Ibland kan det även finnas en mellanregisterhögtalare för frekvenser mellan bas och diskant. Varje elementtyp är konstruerad för att återge de aktuella frekvensområdet optimalt, men kan då inte göra detsamma utanför sitt frekvensområde. Den signal som driver varje element måste då begränsas till att innehålla enbart det frekvensområde som högtalarelementet är optimerat för. Det görs genom att signalen in till högtalaren från förstärkaren skickas in i frekvensselektiva filter, ett filter för varje elementtyp, som enbart låter rätt frekvensintervall passera och sedan driva sitt högtalarelement. De filter som beskrivs i ovanstående lista kan ofta vara implementerade i form av elektroniska kretsar. För att åstadkomma ett filter med en viss önskad frekvensfunktion H(ω) behöver vi då först välja ett specifikt sätt att koppla samman de elektroniska komponenterna, ett kopplingsschema som ofta kan ha spänningar som inoch utsignaler. En analys av hur dessa in- och utsignaler beror av varandra leder till ett specifikt matematiskt uttryck för H(ω) som dessutom innehåller ett antal parametrar, värden på olika komponenter i den elektroniska kretsen. Genom att välja dessa komponentvärden på lämpligt sätt kan vi i slutänden erhålla en frekvensfunktion som ligger så nära som möjligt den önskade. I tekniska system kan filter även realiseras i form av mekaniska system, exempelvis med fjädrar och dämpare. Exemplet med ett filter i form av en elektronisk krets illustrerar en viktigt observation i sammanhanget. Teoretiskt sett handlar frekvensselektiva filter om att vi väljer en frekvensfunktion H(ω) som vi vill att systemet ska ha, och sedan försöker implementera ett system som också har det. I praktiken är detta inte så enkelt som det låter, det finns vissa frekvensfunktioner som är lätta att implementera och andra som är omöjliga att uppnå. Däremot går det att approximera alla önskade frekvensfunktioner, vilket kan vara en rimlig strategi för att skapa filter. För ett filter är det ofta så att vi enbart är intresserade av dessa amplitudkarakteristik D(ω) = |H(ω)|. Det betyder inte att vi är ointresserade av faskarakteristiken, ψ(ω) = argH(ω), utan snarare att D(ω) ofta är den viktiga karakteristiken: vilka frekvenser dämpas och vilka förstärks. Därför kommer vi i fortsättningen att fokusera på amplitudkarakteristiken när det gäller filter. 5.1.1 Typer av filter Amplitudkarakteristiken för ett filter kan, i princip, se ut hur som helst. I det sammanhanget bör emellertid nämnas att ju mer komplicerad amplitudkarakteristik vi vill att vårt filter ska ha, desto mer kostar det att realisera det. Kostnaden beror på att det krävs mer komponenter, exempelvis elektroniska komponenter, för att åstadkomma ett system med den önskade amplitudkarakteristiken ju mer komplicerad den är. I praktiken vill vi reducera denna 1 HiFi står för engelskans “High Fidelity” och innebär inspelning/återgivning av ljud med högsta kvalitet. 74 1 1 √1 2 ω 0 ω 0 k k Figur 5.1: Vänster: amplitudkarakteristiken D(ω) för ett typiskt LP-filter. ω0 = k är filtrets gränsfrekvens, då D(ω0 ) = √12 . Höger: filtrets passband indikeras med ljusgrått och dess spärrband med mörkgrått. kostnad och kan då nöja oss med någon av de grundläggande typerna av filter som kan realiseras med ett fåtal systemkomponenter. Nedan beskrivs några av dessa grundtyper. Allpassfilter Ett allpassfilter förstärker alla frekvenskomponenter med samma faktor, typiskt faktorn 1, däremot skulle ett allpassfilter kunna ha en faskarakteristik som inte är konstant. Ett exempel på ett allpassfilter är en tidsfördröjning. Lågpassfilter, LP-filter Ett lågpassfilter eller LP-filter har i det typiska fallet en amplitudkarakteristik D(ω) = |H(ω)| som illustreras till vänster i figur 5.1, dvs. D(0) = 1 och sedan sjunker D(ω) när ω växer. Att D(0) = 1 är inte viktigt, det kan lika gärna handla om att D(0) = a > 0 och att D(ω) sedan sjunker från detta värde ned mot noll när ω ökar. I detta fall kan vi se filtret som ett lågpassfilter i kombination med en förstärkare (eller transducer). I fortsättningen kommer vi att bortse från eventuella förstärkningar av denna typ, även om de i praktiken kan finnas med i filtrets frekvensfunktion. Ett exempel är det system som beskriv i avsnitt 2.2.4, ett magasin i ett vattentorn. Detta system har ett stegsvar som illustreras till vänster i figur 3.8 på sidan 51. Notera att om vi istället för det specifika exemplet med vattentornet betraktar ett LTI-system med insignal x(t) och utsignal y(t) som har den systembeskrivande ekvationen d y(t) + k t(t) = k x(t), dt erhålls en frekvensfunktion HLP (ω) = 1 k = ω jω+k j k +1 (5.1) (5.2) vilken motsvarar precis den amplitudkarakteristik som visas i figur 5.1. En kommentar I avsnitt 3.10.4 gjordes tolkningen av 1/k som en tidskonstant för den linjära ODE:n av första ordningen i (3.75), som anger hur snabbt systemet är. Denna tolkning är fortfarande rimlig för systemet som beskriv i (5.1). Intuitivt kan vi tänka på ett LP-filter som ett system som karakteriseras av det har relativt hög förstärkning för låga frekvenser och en relativt låg förstärkning för höga frekvenser. Det betyder att ett LP-filter definieras av en specifik vinkelfrekvens ω0 (eller motsvarande frekvens f0 ) som anger gränsen mellan vilka frekvenskomponenter som har en relativt hög förstärkning och vilka som dämpas. Denna frekvens kallas filtrets gränsfrekvens eller 75 1 1 √1 2 ω 0 ω 0 k k Figur 5.2: Vänster: amplitudkarakteristiken D(ω) för ett typiskt HP-filter. ω0 = k är filtrets gränsfrekvens, då D(ω0 ) = √12 . Höger: filtrets passband indikeras med ljusgrått och dess spärrband med mörkgrått. brytfrekvens. Exempelvis skulle vi kunna bestämma frekvensen när D(ω) = 21 , men i praktiken definieras gränsfrekvens oftare enligt D(ω) = √12 . Det beror på att de signaler som förekommer i många praktiska tillämpningar har en fysikalisk tolkning som gör att deras värde i kvadrat är proportionell mot signalens energi. Det betyder att för ω < ω0 finns minst hälften av frekvenskomponentens energin kvar efter filtret, medan för ω > ω0 finns mindre än hälften av energin kvar. För ett LP-filter kallas frekvensintervallet ω < ω0 för filtrets passband, motsvarande frekvenskomponenter tillåts passera filtret med ringa eller ingen dämpning. Frekvensintervallet ω > ω0 är filtrets spärrband, motsvarande frekvenskomponenter spärras eller dämpas av filtret. För filtret vars frekvensfunktion HLP beskrivs i (5.2) erhålls gränsfrekvensen ω0 = k, f0 = ⇒ ω0 k = . 2π 2π (5.3) Gränsfrekvensen med tillhörande pass- och spärrband för LP-filtret i (5.2) illustreras till höger i figur 5.1. Notera att detta resultat är konsistent med tolkningen att 1/k är en tidskontant och därmed k kan tolkas som frekvens. Högpassfilter, HP-filter Ett högpassfilter eller HP-filter har den motsatta amplitudkarakteristiken jämförd med ett LP-filter, vilket illustreras till vänster i figur 5.2. Här är D(0) = 0 och går sedan mot 1 när ω växer. Eftersom HLP (0) = 1 för ett typiskt LP-filter kan implementera ett HP-filter som skillnaden mellan ett allpassfilter och ett LP-filter, dvs. dess frekvensfunktion ges av HHP (ω) = 1 − HLP (ω). I fallet att HLP beskrivs av (5.2) får vi då HHP (ω) = 1 − k jω = . jω+k jω+k (5.4) Den systembeskrivande ekvationen för ett LTI-system med denna frekvensfunktion ges av d d y(t) + k y(t) = y(t), dt dt (5.5) vilket visas som räkneuppgift. Precis som i fallet med LP-filter har detta system en gränsfrekvens ω0 = k, men i detta fall är det passbandet som ges av ω > ω0 och spärrbandet av ω < ω0 . Se illustration till höger i figur 5.2. Bandpassfilter, BP-filter Ett bandpassfilter eller BP-filter kan ses som en kombination av ett HP-filter och ett LP-filter, med varsina gränsfrekvenser ω1 respektive ω2 > ω1 . För ett BP-filter ska alla frekvenskomponenter med ω < ω1 dämpas/spärras (ett HP-filter), men det gäller även för ω > ω2 (ett LP-filter). Endast frekvenskomponenter med ω1 < ω < ω2 76 1 1 0 1 0 0 Figur 5.3: Vänster: amplitudkarakteristikerna för ett LP-filter, med gränsfrekvens ω1 , och ett HP-filter med gränsfrekvens ω2 . Höger: amplitudkarakteristiken för ett BP-filter som ges av HBP = HLP · HHP . tillåts passera. Det betyder att ett BP-filter har två spärrband: ett för ω < ω1 och ett ω > ω2 , samt ett passband ω1 < ω < ω2 . Ett HP-filter har en bandbredd som motsvaras av skillnaden ω2 − ω1 , dvs. bredden av passbandet. I detta fall är det oftast centerfrekvensen, dvs. den frekvens där |H(ω)| antar sitt maximala värde, tillsammans med bandbredden som är de intressanta parametrarna, snarare än ω1 och ω2 . Ovanstående resonemang innebär att vi, i princip, kan implementera ett BP-filter som en kaskadkoppling av ett HP-filter, med gränsfrekvens ω1 , med ett LP-filter som har gränsfrekvens ω2 . Enligt avsnitt 4.3.4 ges då resulterande filtrets frekvensfunktion HBP som produkten av frekvensfunktionerna för LP- och HP-filtren, endast i det frekvensintervall där båda amplitudkarakteristikerna är stora kommer motsvarande frekvenskomponenter att kunna passera utan att dämpas. Se figur 5.3 för en illustration. En kommentar Notera att frekvensfunktionen för just detta BP-filtret inte går upp till ett maxvärde nära 1 och att BP-filtrets gränsfrekvenser inte ges exakt av gränsfrekvenserna ω1 och ω2 för HP- respektive LP-filtret. Detta resonemang betyder inte att ett BP-filter måste implementeras som en kaskadkoppling av ett HP- respektive LP-filter. Exempelvis går det att koppla ihop en elektronisk krets som ger motsvarande frekvensfunktion utan att kretsen explicit innebär en kaskadkoppling av ett HP- och ett LP-filter. Bandspärrfilter, BS-filter Ett bandspärrfilter eller BS-filter kan även det ses som en kombination av ett LP-filter och ett LP-filter, med varsina gränsfrekvenser ω1 respektive ω2 > ω1 . För ett BS-filter ska alla frekvenskomponenter med ω < ω1 släppas igenom (ett LP-filter), men det gäller även för ω > ω2 (ett HP-filter). Endast frekvenskomponenter med ω1 < ω < ω2 ska dämpas. Det betyder att ett BS-filter har två passband ω < ω1 och ω > ω2 samt ett spärrband ω1 < ω < ω2 . För ett BS-filter ges bandbredden av bredden på spärrbandet: ω2 − ω1 och centerfrekvensen inträffar där |H(ω)| antar sitt minimala värde. Ovanstående resonemang innebär att vi, i princip, kan implementera ett BS-filter som en linjärkombination av ett LP-filter, med gränsfrekvens ω1 , och ett HP-filter som har gränsfrekvens ω2 . Enligt avsnitt 4.3.5 ges då resulterande filtrets frekvensfunktion HBS som summan av frekvensfunktionerna för LP- och HP-filtren, i de frekvensintervall där den ena eller andra av amplitudkarakteristikerna är stora kommer motsvarande frekvenskomponenter att kunna passera utan att dämpas. Se figur 5.4 för en illustration. En kommentar Notera att frekvensfunktionen för just detta BS-filtret inte går ända ned till 0 i spärrbandet och att BS-filtrets gränsfrekvenser inte ges exakt av gränsfrekvenserna ω1 och ω2 för LP- respektive HP-filtret. 77 1 1 0 1 0 0 Figur 5.4: Vänster: amplitudkarakteristikerna för ett LP-filter, med gränsfrekvens ω1 , och ett HP-filter med gränsfrekvens ω2 . Höger: amplitudkarakteristiken för ett BS-filter som ges av HBP = HLP + HHP . Detta resonemang betyder inte att ett BS-filter måste implementeras som en linjärkombination av ett LP- respektive HP-filter. Exempelvis går det att koppla ihop en elektronisk krets som ger motsvarande frekvensfunktion utan att kretsen explicit innebär en summa av ett LP- och ett HP-filter. 5.2 Tidsdiskreta filter Filter implementeras i allt högre grad i form av tidsdiskreta system. Anledningen till det är att det är relativt lätt att realisera en viss önskad frekvensfunktion, i alla fall approximativt, med just tidsdiskreta system. Som har nämnts i avsnitt 4.5 måste vi då ta hänsyn till att systemet enbart kan hantera frekvenskomponenter upp till Nyquistfrekvensen, vilket betyder att samplingsfrekvensen f s måste väljas med omsorg. Men om samplingen görs på lämpligt sätt finns det ett antal standardtekniker och standardkomponenter för att implementera tidsdiskreta system, inklusive filter. I samband med detta får också begreppet “höga frekvenser” en lite annan innebörd än i det tidskontinerliga π fallet. De högsta tänkbara frekvenserna i det tidsdiskreta fallet är de som ligger nära (strax under) ω = 2T . Ett pi tidsdiskret HP-filter är då ett filter som har en amplitudkarakteristik D(ω) där D(0) är liten och D( 2T ) är ≈ 1. Motsvarande tolkning gäller även för BP- och BS-filter. I det tidsdiskreta fallet är signalerna ofta i form av binära tal som representerar signalvärden, se avsnitt 6.1. De standardkomponenter som behövs för att realisera i stort sett alla typer av tidsdiskreta system som kan hantera dessa signaler begränsar sig till • Fördröjningar: digitala minneskretsar som kan lagra ett sampelvärde. Fördröjningen uppdateras varje samplingsintervall, med perioden T , och får då det värde som ligger på dess insignal. • Förstärkare: en digital krets som kan multiplicera ett binärt tal, exempelvis ett sampelvärde, med en konstant faktor. • Adderare: en digital krets som kan addera två binära tal, som vardera representerar signalvärden. Dessa tre typer av digitala kretsar kan enkelt implementeras i olika typer av tekniker i halvledarchip som sitter i mobiltelefoner, TV-apparater, hörapparater, CD/DVD-spelare, osv. Fördelen med dessa digitala kretsar är att de tar betydligt mindre plats, förbrukar mindre effekt och är billigare än motsvarande system som realiseras med traditionell elektronik. I detta avsnitt ska vi undersöka en speciell klass av digitala filter som ofta, men inte alltid, kan användas för att implementera en valfri frekvensfunktion för ett tidsdiskret system 78 5.2.1 FIR-filter Enligt avsnitt 3.11.2 karakteriseras ett tidsdiskret system H av sitt impulssvar h[k]. I allmänhet kan h[k] vara en godtycklig funktion av en heltalsvariabel k ∈ Z, men för ett kausalt system måste h[k] = 0 för k < 0, och vi vill förmodligen även att systemet ska vara stabilt. Men bortsett från dessa begränsningar finns det oändligt många sätt att välja impulssvaret h[k] och därmed även välja vilket system H som avses. I allmänhet kan filtersvaret vara oändligt långt, dvs. för varje k0 ∈ Z kan vi hitta ett k > k0 så att h[k] , 0. Sådan system, i synnerhet när de används som filter, kallas Infinite Impulse Response Filter eller IIR-filter. Motsatsen är när h[k] är ändligt långt, av längden n, dvs. h[k] = 0 för k ≥ n. Sådana system, i synnerhet om de används som filter kallas för Finite Impulse Response Filter eller FIR-filter. IIR-filter är en mycket generell klass av tidsdiskreta system, som visserligen förtjänar en grundlig utredning men som hamnar utanför vad som tas upp i denna framställning. I detta avsnitt ska vi istället undersöka FIR-filter, som då utgör en mindre klass av tidsdiskreta system, dvs. realisera en mindre klass av frekvensfunktioner H(ω), men som ändå ofta kan användas för att approximera godtyckliga system, dvs. godtyckliga frekvensfunktioner. Ett exempel Vi ska nu undersöka ett tidsdiskret system, ett FIR-filter med längden n = 3. Det har då ett impulssvar som ges av 0 k < 0, ger kausalitet! h k = 0, 0 (5.6) h[k] = h k = 1, 1 h2 k = 2, 0 k ≥ 3, ger FIR av längd 3. Här antar vi att i alla fall h0 , h2 , 0, i annat fall motsvarar systemet ett “kortare” FIR-filter eventuellt i kaskad med en fördröjning. Detta system kan realiseras enligt figur 5.5, som enbart innehåller de tre grundläggande komponenterna som nämndes tidigare: fördröjningar, förstärkare och adderare. Notera att systemet verkligen ger impulssvaret h[k] i (5.6). Vi antar att systemet initialt är “nollställt”, dvs. alla fördröjningar/minnen har utsignalen = 0, vilket även betyder att y[k] = 0 för k < 0. Systemet får en tidsdiskret impuls δ[k] som insignal. Vid k = 0 kommer då en impuls i insignalen, vilken förstärks/multipliceras med h0 och matas ut som utsignal, dvs. y[0] = h0 . Vid k = 1 försvinner återgår insignalen till 0, men den initiala impulsen har nu lagrats i den första fördröjningen D, multipliceras med h1 och ger utsignalen y[1] = h1 . Vid k = 2 är insignalen fortfarande = 0, men nu har den initiala impulsen flyttat sig till den andra fördröjningen, där den multipliceras med h2 och ger y[2] = h2 . Vid k = 3 kommer alla fördröjningarna och insignalen att vara = 0, varför även utsignalen blir y[3] = 0 och dess tillstånd råder sedan för alla k ≥ 0. Ett mer kompakt sätt att specificera ett FIR-filter är att enbart ange sekvensen [h0 h1 h2 ], exempelvis som en n-dimensionell vektor. Generellt kan ett FIR-filter av längden n på motsvarande sätt representeras som en vektor h ∈ Rn . Elementen i en sådan vektor kallas för filterkoefficienter. Enligt (4.61), ges filtrets frekvensfunktion av H(ω) = 2 X hk e− jωT k = h0 + h1 e− jωT + h2 e− jω2T . (5.7) k=0 Notera att sambandet mellan frekvensfunktionens värde vid vissa specifika frekvenser och filterkoefficienterna kan vara relativt enkelt, exempelvis: π π = h0 − h1 + h2 , H = h0 − j h1 − h2 . (5.8) H(0) = h0 + h1 + h2 , H T 2T Med dessa samband kan vi se de tre filterkoefficienterna som parametrar vilka kan varieras och på så sätt åstadkomma olika typer av filter. Med olika val av filterkoefficienter kan vi inte åstadkomma godtyckliga frekvensfunktioner, π π men vi kan i alla fall få ett H(ω) som måste ha specifika värden för de tre frekvenserna ω ∈ {0, 2T , T }. π Exempelvis, om vi vill ha ett LP-filter så kan vi välja H(0) = 1 och H( T ) = 0, vilket ger h1 = 1 , 2 h2 = 79 1 − h0 , 2 (5.9) D(!) 2 h0 = 1 h 0 = 0.75 1 h0 = 0 h 0 = 0.5 h 0 = 0.25 0 :/2 0 ! Figur 5.5: Amplitudkarakteristiken för det filter som beskrivs i avsnitt 5.2.1, för olika värden på parametern h0 . där h0 återstår att välja. Ett sätt att göra det är att undersöka vad som händer vid frekvensen ω = H π 1 = h0 + j h1 − h2 = 2 h0 − (1 + j). 2T 2 π 2T : (5.10) För några olika värden på h0 erhålls då de amplitudkarakteristiker som illustreras i figur 5.5. Notera att för h0 = 0 och h0 = 1/2 fås filterkoefficienterna [0 12 21 ] respektive [ 12 21 0]. Båda dessa filter är egentligen samma FIR-filter, med längd 2, men den senare inkluderar även en fördröjning med 1 sampel. Det vi kan se från detta exempel är att även om vi fixerar frekvensfunktionens värde vid två olika frekvenser, i det här fallet ω = 0 och ω = Tπ , vilket låser upp två av filterkoefficienterna så finns det en frihetsgrad kvar motsvarande den sista av koefficienterna. Beroende på vilket värde som sätts på den erhåller vi olika amplitudkarakteristiker för det resulterande filtret. Om filtret hade längden n = 2 och vi vill ha ett LP-filter är det bästa vi kan göra att använda koefficienterna [ 21 12 ], vilket motsvarar kurvan för h =0 = 0 i figur 5.5, i alla fall om H(0) = 1 och H( Tπ ) = 0. I detta fallet ger de två villkoren på frekvensfunktioner en fullständig beskrivning av de två filterkoefficienterna. Nu när filtret har längden n = 3 går det att få ett filter som går från passband till spärrband med en något brantare kurva och det är precis detta som ligger bakom att välja ett längre filter. Ju längre filter, desto fler filterkoefficienter som kan varieras, och desto större urval av frekvensfunktioner som kan realiseras. Varje filterkoefficient innebär emellertid också en kostnad. För ett FIR-filter kommer varje ytterligare koefficient som läggs till filtret att motsvara ytterligare en fördröjning och en multiplikator som ska få plats på det halvledarchip där filtret implementeras, vilket dessutom ökar effektförbrukningen. Det innebär att även om långa FIR-filter erbjuder ett större urval av möjliga frekvensfunktioner så finns det praktiska begränsningar i hur långa filter vi vill använda. Moderna metoder för halvledarchip gör det möjligt att använda längre och länge FIR-filter för varje ny generation av halvledarteknik. Ytterligare en observation vi kan göra är att även om vi kan ange ange frekvensfunktionens värde för tre olika frekvenser så finns det inga garantier att motsvarande impulssvar h[k] är reell. Den inversa Fouriertransformen i (4.76) innehåller komplexa storheter och enbart för specifika val av H(ω) kan vi garantera att h[k] har längden n = 3 och dessutom är reellt. 80 5.3 Filter för detektion Ett tidsdiskret system har ett impulssvar h[k], vilket i fallet med ett FIR-filter har en ändlig längd n. Från avsnitt 3.11.2 vet vi att utsignalen för en godtycklig insignal x[k] ges av faltningen mellan h och x: y[k] = H{x[k]} = (h ∗ x)[k] = ∞ X h[l] x[k − l] = /h har längden n/ = l=0 n−1 X h[l] x[k − l]. (5.11) l=0 Vi har tidigare tryckt på att y[k] är en signal i form av en funktion, som i det här fallet avbildar hela tal till reella tal. Nu ska emellertid fokusera på funktionsvärdet av y för ett specifikt heltal k, dvs. funktionsvärdet y[k]. Enligt (5.11) ges detta värde som en summa av n termer: y[k] = h[0] x[k] + h[1] x[k − 1] + . . . + h[n − 1] x[k − n + 1] = = h[0] h[1] . . . h[n − 1] · x[k] x[k − 1] . . . x[k − n + 1] = h · x[k]. | {z } | {z } :=h (5.12) (5.13) :=x[k] Det betyder att y[k] kan tolkas som skalärprodukten mellan två vektorer i Rn : en vektor h som innehåller filterkoefficienterna och en som består av ett utsnitt från insignalen, x[k]. Notera att elementen i vektorn h räknas upp “framlänges” i tiden, medan den senare vektorn räknar upp samplen i insignalen med start vid x[k] och sedan “baklänges” i tiden till x[k − n + 1]2 . Samma tolkning gäller för signalvärdet y[k + 1], det kan ses som skalärprodukten mellan impulssvarsvektorn h och ett vektor x[k + 1] som utgör ett utsnitt från insignalen, denna gång mellan x[k − n + 2] och x[k + 1]. Varje gång ett nytt värde för utsignalen ska bestämmas tar vi motsvarande utsnitt av insignalen, av längd n, räknar upp elementen i omvänd ordning och bildar skalärprodukten med impulssvaret En kommentar Eftersom faltning är en kommutativ operation, dvs. vi kan byta plats på h och x i ovanstående uttryck, kan vi lika tänka på h som en en vektor där elementen räknas upp baklänges, från hn−1 till h0 , och x[k] är en vektor som räknas upp framlänges, från x[k] till x[k + n − 1]. Skalärprodukten mellan dessa två vektorer blir samma som (5.13). Med hänvisning till avsnitt A.1.5 kan vi med hjälp av faltning mäta likheten mellan ett utsnitt i insignalen av längd n och impulssvaret för FIR-filtret. Vi kan se både FIR-filtret och utsnitten från signalen som vektorer i Rn , och bestämma “likhetsmåttet” cos α[k] mellan dem som cos α[k] = y[k] h · x[k] = . khk · kx[k]k khk · kx[k]k (5.14) I detta sammanhang har vi ofta möjlighet att välja filter, dvs. välja dess filtersvar h, och kan då se till att det motsvarar en normerad vektor: khk = 1, varvid beräkningarna kan förenklas till cos α[k] = y[k] . kx[k]k (5.15) Tillämpning Vi ska titta på den praktiska tillämpningen av detta resultat. Vi antar att systemets insignal x[k] kan variera på diverse olika sätt, men att vid vissa tidpunkter (eller för den delen en viss tidpunkt) kommer signalen att innehålla en specifik sekvens av längden n, motsvarande elementen i vektorn p = p0 p1 . . . pn−1 . (5.16) Att detta händer kan antingen bero på att någon specifik biologisk eller fysikalisk process genererar just denna sekvens, exempelvis EKG-signalen i ett hjärta. Men det kan även så att x[k] är en signal som skickas mellan en 2 Ordet faltning kommer från tyskans falten, vilket betyder “att vika”, och syftar på att den ena av de två signalerna som faltas med varandra måste vikas, dvs. räknas upp åt andra håller jämförd med den andra. 81 2 0 −2 0 20 40 60 80 100 120 140 160 180 0 20 40 60 80 100 120 140 160 180 0 20 40 60 80 100 120 140 160 180 0 20 40 60 80 100 120 140 160 180 20 0 −20 6 2 4 1 0 2 −1 0 −2 0 2 4 6 8 10 12 14 16 18 20 1 2 1 0 0 −1 −1 −2 0 2 4 6 8 10 12 14 16 18 20 Figur 5.6: Vänster: övre: ett exempel på en sekvens som ska detekteras. Undre: impulssvar för det matchande filtret. Höger: översta signalen: en signal som innehåller sekvensen till höger, samma sekvens plus lite brus, en liknande sekvens, två exempel på sekvenser som inte liknar sekvensen till höger. Andra signalen: utsignalen från det matchande filtret. Tredje signalen: normen kx[k]k. Nedre signalen: matchningsmåttet cos α[k0 ]. sändare och en mottagare, där sändaren använder sekvensen p för till att betyda någon specifik form av information som kan tolkas av en mottagare. Exempelvis att sändaren vill skicka biten “noll” eller “ett”. När sekvensen p dyker upp i signalen x[k] vill mottagaren kunna detektera detta, vilket kan göras på följande sätt. Mottagaren har ett matchande filter, ett FIR-filter som är lika långt som sekvensen p och med samma sampelvärden som p, men uppräknade i omvänd ordning! Vi låter denna “baklängesversion” av p noteras p̃ och använder då ett FIR-filter med impulssvaret h = p̃. Om vi antar att sekvensen startar i insignalen x[k] vid k = k0 − n + 1 och slutar vid k = k0 så kan vi använda (5.13) för att få utsignalens värde vid k = k0 som y[k0 ] = h · x[k0 ] = p̃ · p̃ = p · p = kpk2 . (5.17) Det betyder att utsignalen vid k = k0 är sådan att cos α[k0 ] = y[k0 ] kpk2 kpk2 kpk2 = = = = 1. khk · kx[k]k kp̃k · kp̃k kpk · kpk kpk2 (5.18) dvs. vi erhåller maximal likhet mellan utsnittet i insignalen, x[k], och filtersvaret, h. Genom att applicera ett matchande filter på signalen x[k] kan vi alltså detektera de tidpunkter som ett utsnitt av x[k] innehåller sekvensen p. Vi behöver först bestämma utsignalen y[k] från det matchade filtret och sedan dividera dess utsignal med khk · kx[k]k. Notera att denna division ska göras för varje sampel, dvs. för varje k i utsignalen och att vid denna division är x[k] olika utsnitt från signalen för varje k. Varje gång denna kvot är = 1, eller i praktiken ≈ 1, motsvarar det en detektion av sekvensen p. Om det matchande filtret dessutom är normerat, khk = 1, behöver vi enbart ta med kx[k]k i divisionen. En detektor för sekvensen p har som sista steg en tröskling, se avsnitt 3.1.4 på sidan 37, som genererar en binär utsignal z[k] enligt 1 y[k] > t, z[k] = (5.19) 0 y[k] ≤ t. I detta fall sätter vi t = ett värde straxt under 1, för att tillåta en viss felmarginal. Så länge som sekvensen p inte 82 finns i insignalen är z[k] = 0, men varje gång sekvensen p dyker upp i insignalen blir z[k] = 1 precis i slutet av sekvensen. Se figur 5.6 som illustrerar ett matchande filter. En kommentar I figur 5.6 innehåller signalen x[k] två sekvenser i slutet som inte liknar den sekvens som ska detekteras. Ändå går matchningsmåttet upp till i närheten av 1 för den ena. Vi återkommer till det i ett senare avsnitt. I praktiken är divisionen inte alltid nödvändigt. I många fall kan vi ha en rimlig uppfattning om hur stor kx[k]k är i den signal som mottas, speciellt när sekvensen p dyker upp, samt att det inte finns andra utsnitt i x[k] där kx[k]k blir större än detta. I så fall kan vi utelämna divisionen och istället sätta ett tröskelvärde t som motsvarar den förväntade normen av kx[k]k när sekvensen p dyker upp. Det resulterande systemet består då enbart av ett matchande filter i kaskad med en tröskling. 83 84 Kapitel 6 Sampling och rekonstruktion I kapitel 1 introducerades begreppen tidskontinuerliga respektive tidsdiskreta signaler liksom tidskontinuerliga och tidsdiskreta system. Där antyddes även att det kan finnas ett samband mellan då två typerna av signaler, även om så inte alltid måste vara fallet. I detta kapitel kommer vi att undersöka detta samband , dvs. det finns en tidskontinuerlig signal s(t) och av någon anledning väljer vi att överföra den till en tidsdiskret signal s[k], med hjälp av sampling, enligt s[k] = s(k · T ). (6.1) Sambandet mellan den kontinuerliga tidsvariabeln t och den diskreta tidsvariabeln k ges av t = k · T, k ∈ Z. (6.2) Här är T en konstant som anger samplingsperioden, den tid som går mellan varje sampel s[k]. Samplingsfrekvensen, antalet sampel per tidsenhet, ges av 1/T . Om T har enheten sekund [s] kommer samplingsfrekvensen att anges i enheten Hertz [Hz], dvs. perioder per sekund. Vi kan även definiera en samplingsvikelfrekvens ω s = 2π f s = 2π T . Givet en tidsdiskret signal s[k], som exempelvis kan vara utsignal för ett tidsdiskret system, kan vi vid något tillfälle vara intresserad av att överföra den tillbaka till dess tidskontinuerliga motsvarighet, s(t). Denna process kallas generellt för rekonstruktion. I detta kapitel ska vi undersöka några praktiska och teoretiska aspekter av sampling och rekonstruktion. 6.1 Sampling Vi ska börja med att undersöka den samplingsprocess som beskrivs i (6.1) och (6.2). Ett system som utför den praktiska konverteringen från s(t) till s[k] kallas för en samplare eller ADC och har alltså en tidskontinuerlig insignal s(t) och en tidsdiskret utsignal s[k]. En samplare är nästan alltid ett elektroniskt system som utför samplingen på en insignal s(t) i form av en elektrisk spänning och den innehåller egentligen tre separata delsystem. Först görs en trunkering av insignalen till ett begränsat intervall. Vi återkommer strax till detta delsystem. Därefter kommer ett delsystem som utför själv samplingen, det “plockar ut” ett specifikt värde ur signalen s(t) vid sampeltidpunkterna (6.2). Slutligen görs en mätning av detta värde som överför det till en digital representation i form av ett binärt tal med ett fixt antal bitar (nollor och ettor). Eftersom ett fixt antal bitar används här kan endast ett begränsat intervall i insignalen representeras, vilket är anledningen till den inledande trunkeringen. De signalvärden som ligger utanför det aktuella intervallet trunkeras så att alla värden av insignalen, även de som ligger utanför intervallet, ändå kan tillordnas ett bestämt värde i den digitala utsignalen. Det första steget, trunkeringen, sker genom att insignalen avbildas till en ny signal s̃(t), som garanterat ligger inom intervallet [smin , smax ], enligt: smin s(t) < smin , s̃(t) = (6.3) s(t) smin ≤ s(t) ≤ smax , smax s(t) > smax . Se figur 6.1 för en illustration. 85 s̃(s) smax s(t) smin smax smin Figur 6.1: Innan samplingen måste insignalen trunkeras till ett intervall, [smin , smax ]. Figur 6.2: En samplingsenhet består av samplingskrets med ett minne, här i form av en kondensator, som kan kopplas till insignalen s(t) med hjälp av en transistor. Transistorn öppnar kopplingen varje gång den får en puls. Spänningen över kondensatorn överförs sedan av den efterföljande kvantiseraren till en binär form. I den teoretiska analysen av ett system kan vi i princip bortse från trunkeringen så länge vi kan vara säkra på att de signaler som samplas ligger inom det aktuella intervallet [smin , smax ], eller i alla fall att det är statistiskt mycket osannolikt att signalvärden hamnar utanför. Det betyder att vi måste veta något om i vilket intervall den aktuella signalen antar sina värden och att intervallgränserna väljs i enlighet med detta. I fortsättningen antar vi att samplingen hanteras på detta sätt och bortser därför från eventuella problem eller effekter som kan uppstå på grund av trunkeringen och antar att vi kan sätta s̃(t) = s(t) för de signaler s(t) som förekommer i praktiken. Det andra steget, själva samplingen, sker genom att enheten har en intern klocka som med stor noggrannhet kan bestämma sampeltidpunkterna t = k · T genom att generera en kort puls vid dessa tidpunkter. För att kunna utföra mätningen har samplaren också ett “minne” som kan lagra den spänning som insignalen s(t) har vid sampeltidpunkterna. Det görs genom att pulserna öppnar en koppling mellan insignalen s(t) och minnet. Minnet lagrar spänningen s(t) och när kopplingen stängs ligger denna spänning kvar i minnet och kan mätas. När mätningen är klar kan nästa puls komma, dvs. T kan inte vara kortare än tiden det tar att utföra mätningen. Samplingen illustreras i figur 6.2. Det tredje steget, som utför mätningen, kallas även kvantisering och innebär att spänningen s(t) överförs till en digital representation i form av binära tal med ett begränsat antal bitar. En konsekvens av detta är att endast ett ändligt antal signalvärden kan representeras inom intervallet [smin , smax ]. Det beror på att om b bitar används för det binära tal ŝ[k] som representerar sampel s[k] så finns det endast tillgång till 2b olika binära tal som kan 86 representera olika signalvärden. Överföringen till binär representation görs genom att intervallet [smin , smax ] delas in i 2b lika långa kvantiseringsintervall. Alla kvantiseringsintervall har då en längd ∆s som ges av ∆s = smax − smin = 2−b (smax − smin ). 2b (6.4) Varje kvantiseringsintervall representeras med ett unikt binärt tal som har b bitar. Utsignalens värde vid sampeltidpunkten t = k · T ges av det binära tal som motsvarar det intervall som s(t) befinner sig i. Kvantiseringen kan ses som en slags avrundning eftersom det efteråt inte går att skilja mellan signalvärden som ligger inom samma kvantiseringsintervall. Ett och samma binära tal motsvarar alla signalvärden inom kvantiseringsintervallet, och när de är dags att rekonstruera s(t) ur s[k] måste vi välja ett specifikt värde i det aktuella kvantiseringsintervallet, exempelvis intervallets start-, slut- eller mittvärdet. Vi antar i fortsättningen att det är mittvärdet för varje kvantiseringsintervall som representeras av det binära talet, dvs. kvantiseringen innebär att ett signalvärde s(t) avrundas till närmaste mittvärde i ett kvantiseringsintervall. Formellt kan vi beskriva kvantiseringen som att varje kvantiseringsintervall representeras med ett binärt tal motsvarande heltalet ! s̃(k · T ) ∈ Z, (6.5) ŝ[k] = round ∆s där “round” är avrundning till närmaste heltal och s̃ är den trunkerade version av insignalen som definierades i (6.3). Eftersom det har skett en skalning på grund av divisionen med ∆s är de heltal som den tidsdiskreta signalen ŝ[k] består av egentligen en samplad version av s(t)/∆s, men om ŝ multipliceras med ∆s erhålls den tidsdiskreta signalen s[k] = ∆s · ŝ[k]. (6.6) 6.1.1 Kvantiseringsbrus I teorin borde gälla att den tidskontinuerliga signalen s(t) och den tidsdiskreta versionen av samma signal, s[k], är relaterade enligt (6.1). I praktiken, på grund av kvantiseringen (avrundningen i (6.5)), så ser sambandet snarare ut som s[k] = s(k · T ) + η[k], (6.7) där η är felet som uppstår vid samplingen på grund av kvantiseringen. Detta fel kallas kvantiseringsbrus. Kvantiseringsbruset är en tidsdiskret signal där varje sampel η[k] innehåller det fel som uppstått vid genereringen av sampelvärdet s[k]. Det går att göra olika utredningar av kvantiseringsbrusets statistiska egenskaper, dess medelvärde, standardavvikelse, korrelation mellan brusets sampel, korrelation mellan signal och brus, osv. Vi kommer inte att göra detta här utan stannar vid att varje sampel η[n] ligger inom intervallet ±∆s/2 om samplingen görs enligt (6.5), så storleksordningen av detta brus begränsas av ∆s i (6.4). 34 Kvantiseringsbruset styrka är linjärt propertionell mot ∆s, som i sin tur är proportionell mot 2−b , där b är antalet bitar i den digitala representationen av samplen. 6.1.2 Innan vi går vidare I teorin kan vi beskriva resultatet av att den tidskontinuerliga signalen s(t) samplas i form av den tidsdiskreta signalen s[k] som uppfyller (6.1). På grund av att varje sampel representeras i digital form av b bitar introduceras i praktiken även ett kvantiseringsbrus η, (6.7). För att s[k] ska vara en effektiv representation av s(t) måste vi anta att b är vald så att kvantiseringsbruset är så lågt att det inte påverkar den fortsatta signalbehandlingen av s[k]. För många system kan det räcka med b = 8 bitar vilket motsvarar 28 = 256 olika signalnivåer. Andra system kräver 16 eller ända upp till 24 bitar för att kvantiseringsbruset inte ska få en för stor påverkan. I praktiken är det dessutom så att den samplade signalen egentligen representeras som det binära talen ŝ[k]. Alla efterföljande operationer på denna signal kommer att ske med binära operationer: binär addition, binär multiplikation, osv. Det betyder att faktorn ∆s inte finns med, utan får antas kompenseras för vid rekonstruktionen. En annan konsekvens av detta är att de efterföljande operationerna, som även i fortsättningen måste ske på tal med ett begränsat antal bitar, kan behöva avrunda sina resultat. Även detta introducerar brus på liknande sätt som η i 87 (6.7). Om vi kan anta att antalet bitar som används i de olika beräkningsstegen är valda på lämpligt sätt, kan vi emellertid också anta att detta brus inte är signifikant för de funktioner som ett tidsdiskret system förväntas utföra på en specifik signal. I fortsättningen bortser vi ofta från ovanstående observationer om kvantiseringsbrus och, om inget annat anges, antar att samplingen innebär att (6.1) gäller. Vi kallar detta för ideal sampling. Ideal sampling är ett vanligt antagande vid teoretiska utredningar av hur s(t) förhåller sig till s[k], exempelvis i nästa avsnitt när vi undersöker om och hur det är möjligt att återskapa s(k) från s[k]. 6.2 Rekonstruktion Om vi antar att den tidsdiskreta signalen s[k] är en idealt samplad version av den tidskontinuerliga signalen s(t), enligt (6.1) och (6.2), och s[k] är känd men inte s(t), så ska vi nu undersöka hur s(t) kan återskapas ur s[k] och under vilka villkor detta är möjligt. I det praktiska fallet är s[k] inte en diskret signal som erhållit direkt genom en sampling av s(t), utan snarare något som erhållits genom olika former av digital signalbehandling, exempelvis ett FIR-filter som beskrivs i avsnitt 5.2.1. När denna signalbehandling är slutför vill vi återföra signalen till en tidskontinuerlig form, genom rekonstruktion. Den praktiska implementeringen av denna funktion kallas ofta DAC, eller digital-till-analog-omvandlare. En sak kan vi i alla fall säga direkt: värdet av s(t) vid en samplingstidpunkt, när t = k · T , går att få direkt ur samplen i s[k] för motsvarande värde på k. Det problem vi ska ägna oss åt här handlar alltså om hur vi kan återskapa s(t) även mellan samplingstidpunkterna. Det finna flera strategier som vi kan följa, där en är att på ett eller annat sätt försöka att approximera s(t) snarare än att återskapa exakt. En annan strategi är att verkligen försöka göra en exakt rekonstruktion. Här ska vi titta på båda varianterna och börjar med den första. 6.2.1 Approximativ rekonstruktion Om vi inte har som mål att göra en exakt rekonstruktion kan vi med ledning av de kända samplen i s[k] försöka gissa, eller skatta, vad s(t) har för värden mellan sampeltidpunkterna. Detta ger i det generella fallet inte en exakt rekonstruktion, men kan motiveras med att resultera i enklare typer av signalbehandling än vad är fallet vid exakt rekonstruktion. Det finns flera varianter av approximativ rekonstruktion att välja mellan och här beskrivs två av de enklaste metoderna. Närmsta-granne-interpolation Vid närmsta-granne-interpolation1 sätt värdet av s(t) för godtyckligt t till det sampelvärde som ligger närmast. Konsekvensen blir att s(t) kommer att approximeras som en styckvis konstant funktion som kan byta värde enbart mitt mellan två samplingstidpunkter. Den approximerande funktionen sNG (t) kan formella skrivas som sNG (t) = s[k], där −T/2 < t − kT ≤ T/2. (6.8) Denna typ av interpolation illustreras i figur 6.3. Notera att värdet av sNG (t) för varje t enbart beror av ett enda sampelvärde s[k]. Ett alternativt sätt att uttrycka den interpolation vi gör här är att skriva den på en lite mer generell form: sNG (t) = ∞ X s[k] · rect k=−∞ ! t−kT . T (6.9) Här är rect-funktionen enhetspulsen som definieras i avsnitt B.3 Det som händer i (6.9) är att sNG uttrycks som en linjär kombination av pulser som är skalade och tidsförskjutna versioner av rect-funktionen, så att varje puls ligger “kant i kant”. Varje puls är dessutom skalad med s[k] så att sNG (t) får det konstanta värdet s[k] under motsvarande intervall. I vilken mening (6.9) är en mer generell formulering av interpolationen ska vi återkomma till lite längre fram. En generell observation vi kan göra redan nu är att hur bra approximation av s(t) som sNG (t) utgör beror på hur liten T är i förhållande till hur snabba variationer som finns i s(t). Ju snabbare variationer som förekommer i 1 Engelska: nearest-neighbour-interpolation. 88 2 1.5 1 0.5 0 −0.5 −1 −1.5 −2 −10 −8 −6 −4 −2 0 2 4 6 8 10 Figur 6.3: En tidskontinuerlig signal s(t), tunn kurva, med motsvarande sampelvärden, cirklar, och den signal sNG (t) som rekonstrueras med närmsta-granne-interpolation från sampelvärdena, kraftig kurva. s(t) desto mindre måste T vara för att approximationen ska bli bra. Om T är relativt stor och variationerna i s(t) är relativt snabba blir approximationen dålig och tvärtom. Närmsta-granne-interpolation är enkel att förstå och att implementera, men är ofta inte en effektiv metod för rekonstruktion eftersom den antingen förutsätter att T är mycket lite, vilket innebär många sampel (data) per tidsenhet, eller att signalen är relativt konstant. En bättre approximation kan fås med bilinjär interpolation. Bilinjär interpolation Vid bilinjär interpolation får den approximerande funktionen sBL (t), i intervallet t till t + T , där t är en sampeltidpunkt, bero av två på varandra följande sampelvärden, s[k] och s[k + 1], på så sätt att sBL (t) startar med värdet s[k] vid motsvarande sampeltidpunkt och ändrar sig linjärt till värdet s[k + 1] vid nästa sampeltidpunkt: sBL (t) = (k + 1)T − t t−kT s[k] + s[k + 1], T T då k T ≤ t < (k + 1) T . (6.10) Denna typ av interpolation illustreras i figur 6.4. För bilinjär interpolation kommer den rekonstruerade signalen att i (nästan) alla punkter bero på två intilliggande sampelvärden. På samma sätt som för närmsta-granne-interpolation kan bilinjär interpolation även skrivas på den generella formen ! ∞ X t−kT sBL (t) = s[k] · Λ . (6.11) T k=−∞ Här är Λ en funktion som definieras enligt: 1 + z −1 ≤ z < 0, Λ(z) = 1 − z 0 ≤ z < 1, 0 annars. (6.12) Denna funktion illustreras i figur 6.5. Även i detta fall är den approximerande funktionen sBL (t) en linjärkombination av tidsskalade och tidsförskjutna versioner av en och samma funktion, men i det här fallet ges denna funktion av Λ. 89 2 1.5 1 0.5 0 −0.5 −1 −1.5 −2 −10 −8 −6 −4 −2 0 2 4 6 8 10 Figur 6.4: En tidskontinuerlig signal s(t), tunn kurva, med motsvarande sampelvärden, cirklar, och den signal sNG (t) som rekonstrueras med bilinjär interpolation från sampelvärdena, kraftig kurva. 6.2.2 Ideal rekonstruktion (teori) En noggrannare undersökning av närmsta-granne-interpolation och bilinjär interpolation visar att båda metoderna är varianter på ett och samma tema. Den rekonstruerade signalen sREK kan skrivas på formen ! ∞ X t−kT sREK (t) = s[k] · r , (6.13) T k=−∞ där r är en rekonstruktionsfunktion eller interpolationsfunktion. I fallet med närmsta-granne-interpolation är r(z) = rect(z), (B.7) och i fallet med bilinjär interpolation är r(z) = Λ(z), (6.12). En rimlig fråga i detta sammanhang är: går det att välja interpolationsfunktionen r(z) så att att sREK (t) = s(t)? Det skulle betyda att vi ska välja r(z) så att ! X ! ∞ ∞ X t−kT t−kT s[k] · r s(t) = s(k T ) · r = . (6.14) T T k=−∞ k=−∞ och att detta samband ska gälla för godtycklig signal s(t) ∈ S. Det är denna frågeställning vi ska undersöka här och svaret kommer att bli: ja, det finns en ideal interpolationsfunktion r som ger likhet i (6.14), men samtidigt måste vi då begränsa signalrummet S på ett specifikt sätt för att sambandet ska gälla för alla s(t) ∈ S. Inledningsvis kan vi konstatera att redan i kapitel 4 har vi sagt att, i princip, alla signaler kan entydigt delas upp som en linjärkombination (summa eller integral) av cosinusfunktioner. Om vi antar att för vår signal s(t) går det entydigt att bestämma koefficienter αn och φn så att X s(t) = αn cos(ωn t − φn ) dω, (6.15) n så innebär (6.14) att X αn cos(ωn t − φn ) = n ∞ X X k=−∞ n ! t−kT αn cos(ωn k T − φn ) · r . T (6.16) Byter vi plats på de två summorna i högerledet blir det X n αn cos(ωn t − φn ) = X n αn ∞ X k=−∞ 90 cos(ωn k T − φn ) · r ! t−kT . T (6.17) Λ(t) 1 t 0 −1 0 1 Figur 6.5: Interpolationsfunktionen Λ som definieras i (6.12). Här ser vi att ett tillräckligt villkor för att (6.14) ska gälla är att ∞ X ! t−kT cos(ωt − φ) = cos(ω k T − φ) · r . T k=−∞ (6.18) för alla de frekvenser ω = ωn då αn , 0 och godtyckliga φ = φn . Om vi antar att det existerar en ideal interpolationsfunktion r som ger likhet i (6.18) så måste gälla att Z π T − Tπ cos(ωt − φ) dω = ∞ Z X k=−∞ π T − Tπ ! t−kT cos(ω k T − φ) dω · r . T Integralen i högerledet i denna ekvation kan förenklas till 2π cos φ Z π T T , k = 0, cos(ω k T − φ) dω = 0, π k,0 −T = 2π cos φ · δ[k], T (6.19) (6.20) där δ[k] är den diskreta impulsfunktionen som definieras i avsnitt B.6. Det betyder att hela högerledet reduceras till ! ∞ 2π cos φ X t−kT 2π cos φ t HL = δ[k] · r = r . (6.21) T T T T k=−∞ På motsvarande sätt kan vi bestämma vänsterledet i (6.19) till VL = Z π T − Tπ cos(ω t − φ) dω = För att VL = HL för alla möjliga φ måste då gälla att t T sin π t T r = , ⇒ T πt 2 cos φ sin r(z) = t πt T . sin(π z) = sinc(z). πz (6.22) (6.23) Det vi har gjort här är inget strikt bevis, men vi har i alla fall visat att under vissa rimliga antaganden, exempelvis att den ideala interpolationsfunktionen r existerar och är unik, så måste den vara definierad som r(z) = sinc(z). Denna ideala interpolationsfunktion illustreras i figur B.2 på sidan 107. 91 (6.24) Vi kan summera det resultat vi har tagit fram så här långt som att vi kan rekonstruera en “ideal signal” ! X t−kT , (6.25) sIDEAL (t) = s[k] · sinc T k som verkar ha egenskapen att sIDEAL (t) = s(t) där s(t) är en godtycklig signal i signalrummet S relaterad med s[k] enligt (6.1) och (6.2). Som vi ska se i nästa avsnitt är (6.25) inte hela sanningen när det gäller ideal rekonstruktion. Det visar sig att sIDEAL (t) = s(t) bara gäller om vi begränsar vilka frekvenser som kan förekomma i signalen, dvs. begränsar valet av S. 6.3 Samplingsteoremet Om vi samplar en signal s(t) ideal och sedan rekonstruerar den med hjälp av den ideala interpolationen som beskrivs i (6.25) kan vi inte garantera att sIDEAL (t) = s(t) för godtyckliga signaler s(t). Det är två olika, men relaterade, observationer som leder oss till att sIDEAL (t) , s(t) i det generella fallet. Den första rör den ideala interpolationsfunktionen r som härleddes i avsnitt 6.2.2 och innebär att den byggs upp av cosinusfunktioner med ett begränsad frekvensinnehåll, vilket i sin tur begränsar hur sREK (t) kan väljas. Den andra observationen berört det fenomen som kallas vikning, som diskuterades i avsnitt 4.5.3, och innebär att den tidsdiskreta signalen s[k] inte entydigt kan bestämma s(t). Vi ska undersöka båda dessa observationer och avsluta med att dra en praktiskt användbar slutsats om hur s(t) ska vara beskaffad för att ideal rekonstruktion ska vara möjlig. sinc-funktionen är bandbegränsad Vi ska börja med att undersöka en specifik funktion f (t) som är en linjärkombination av cosinusfunktioner: Z π Z π T T T T cos(ω t − ω k T ) dω = cos(ω (t − k T )) dω. (6.26) f (t) = π 0 π 0 Det betyder att f (t) bildas genom att “addera” alla möjliga cosinusfunktioner med vinkelfrekvens ω som ligger mellan 0 och Tπ , vars fas ges av φ = ω k T . Vi kan bestämma integralen i högerledet: " #π ! T − sin(ω (t − k T )) T T sin(π(t − k T )/T ) t−kT f (t) = = = sinc . (6.27) π t−kT π (t − k T ) T 0 Vi känner igen detta uttryck för f (t) som de interpolerande funktioner som används vid ideal rekonstruktion, (6.25). Den slutsats vi kan dra av detta är att varje interpolerande funktion, för alla k ∈ Z, “byggs upp” av cosinusfunktioner som innehåller vinkelfrekvenser enbart mellan 0 och π/T , dvs. de är Tπ -bandbegränsade (se avsnitt 4.4.3). Det betyder i sin tur att även den resulterande funktionen sIDEAL i (6.25) är Tπ -bandbegränsad. Vi sammanfattar: 35 Den ideala rekonstruktionen sIDEAL (t), (6.25), ger sIDEAL (t) = s(t) enbart om s(t) är Tπ -bandbegränsad. s[k] bestämmer inte s(t) entydigt I avsnitt 4.5.3 konstaterade vi att en tidskontinuerlig signal s(t) som samplas utsätt för vikning, dvs. det går inte längre att hålla rätt på frekvenskomponenter som skiljer sig med multipler av 2π T , och inte heller mellan negativa och positiva frekvenser. För att få en entydig tolkning av hur ett tidsdiskret LTI-system hanterar olika frekvenskomponenter föreslogs att vi den samplade signalen ska vara bandbegränsad enligt π (6.28) 0≤ω< . T 6.3.1 Formulering av samplingsteoremet De två observationerna kan vi ta som intäkt för att ideal sampling och rekonstruktion inte fungerar för generella signaler. De ger emellertid även en tydlig ledtråd till hur vi ska begränsa signalrummet S så att ideal rekonstruktion fungerar. Detta kan göras med samplingsteoremet som här formuleras på följande sätt: 92 Samplingsteoremet Om den tidskontinuerliga signalen s(t) är Tπ -bandbegränsad2 och genom ideal sampling, (6.1), överförs till den tidsdiskreta signalen s[k], är denna bandbegränsning ett tillräckligt villkor för att det ska vara möjligt att entydigt bestämma s(t) ur s[k]. I detta fall gäller dessutom ! X t−kT s(t) = sIDEAL (t) = , (6.29) s[k] · sinc T k En konsekvens av samplingsteoremet är att om samplingsperioden T är fix och bestämd så betyder det att vi måste se till att s(t) är Tπ -bandbegränsad, exempelvis genom att låta den lågpassfiltreras med ett filter som tar bort alla frekvenser över Tπ . Alternativt: om det är möjligt att välja T ska vi göra det så att π > ωmax = 2 π fmax , T (6.30) där ωmax respektive fmax är den högsta vinkelfrekvensen/frekvensen som signalen innehåller. Samplingsfrekvensen ges av fs = 1/T , vilket låter oss skriva fs > fmax . (6.31) 2 Frekvensen 2fs kallas Nyquist-frekvensen för den tidsdiskreta signalen som samplas med samplingsfrekvensen f s . Vi kan därför infoga följande observation som en konsekvens av samplingsteoremet: 36 För att idela rekonstruktion ska vara möjlig får inte signalen som samplas innehålla frekvenskomponenter med frekvens över eller lika med Nyquist-frekvensen. alternativt 37 Om en generell signal s(t) samplas med samplingsfrekvensen fs och rekonstrueras idealt så kommer enbart frekvenser upp till Nyquist-frekvensen att återges korrekt i den rekonstruerade signalen. Samplingsteoremet innebär i att vi inte kan sampla generella signaler, som kan innehålla godtyckliga frekvenskomponenter. Antingen måste vi veta något om vilka de “högsta” frekvenskomponenter är, alltså frekvensen fmax . Vi väljer sedan en samplingsfrekvens f s som är minst dubbelt så hög som fmax . Alternativt tar vi bort alla komponenter med frekvens över Nyquist-frekvensen med ett lämpligt filter. I praktiken räcker det med att vi kan skatta fmax i den meningen att de komponenter vars frekvens är högre än fmax i tillräckligt små för att inte signifikant påverka den samplade signalen genom vikning. Alternativt att ett LP-filter dämpar frekvenskomponenterna över Nyquist-frekvensen så pass att de inte signifikant påverkar den samplade signalen genom vikning. Vikningsdistorsion Vi ska titta på ett exempel där signalen s(t) = cos(πt) + cos(4 π t) (6.32) samplas med samplingsfrekvensen f s = 2 Hz, motsvarande sampelperioden T = 0, 5 s. Vi noterar först att denna samplingsfrekvens motsvarar Nyquist-frekvensen 1 Hz eller 2π rad/s. Vi ser även att av de två frekvenskomponenter i signalen ligger den första under Nyquist-frekvensen medan den andra ligger över. Denna signal uppfyller alltså inte villkoret för att ideal rekonstruktion enligt samplingsteoremet. Sampelvärdena ges av den tidsdiskreta signalen ! π 4π s[k] = cos k + cos k . (6.33) 2 2 På grund av vikningen motsvarar dessa sampelvärden även av ! π π π 4π s[k] = cos k + cos k − 2 π k = cos k + cos(0) = cos k + 1, 2 2 2 2 2 Exklusive gränsen π T. 93 (6.34) vilket motsvaras av att s[k] erhålls genom ideal sampling av signalen s0 (t) = 1 + cos(πt). (6.35) Signalen s0 innehåller inga frekvenskomponenter över Nyquist-frekvensen och uppfyller därmed villkoret som nämns i samplingsteoremet. Det betyder att den signal som rekonstrueras ur s[k] ges av srek (t) = s0 (t) = 1 + cos(πt). (6.36) Det vi ser här är att den komponent i signalen som ursprungligen hade vinkelfrekvens 4π rad/s efter sampling och rekonstruktion får frekvensen 0. Att komponenter i signalen s(t) byter frekvens efter sampling och rekonstruktion kallas vikningsdistorsion och uppträder enbart om s(t) innehåller komponenter med frekvenser över Nyquist-frekvensen. För att undvika vikningsdistorsion behöver vi se till att villkoret på bandbegränsning i samplingsteoremet är uppfyllt. 38 En signal som samplas och rekontrueras ideal men inte är bandbegränsad enligt samplingsteoretmet kommer att uppvisa vikningsdistorsion. Det betyder att frekvenskomponeter över Nyquist-frekvensen “flyttas in” i intervallet 0 ≤ f < f2 /2. En kommentar Att filtrera bort alla frekvenskomponenter ovanför Nyquist-frekvensen är i sig en slags distorsion eftersom detta påverkar signalen och, i princip, signifikant skulle kunna förändra signalen på ett negativt sätt. Att ta bort eller dämpa frekvenskomponenter brukar normalt vara bättre än att “flytta” deras frekvens, vilket är vad som händer vid vikning. 6.3.2 Ideal rekonstruktion (praktik) I de föregående avsnitten har vi sett att, i princip, det är möjligt att sampla en tidskontinuerlig signal s(t), vilket resulterar i den tidsdiskreta signalen s[k], och sedan rekonstruera s(t) ur samplen i s[k]. Ett krav är at s(t) är bandbegränsad på lämpligt sätt, men även att samplingen gjord på ett idealt sätt, liksom att rekonstruktionen görs med den ideala interpolationsfunktionen r i (6.2.2). Det första villkoret är i de flesta fall möjligt att hantera inom de ramar som beskrivs i avsnitt avsnitt 6.1, exempelvis i form av kvantiseringsbrus som emellertid kan reduceras till lämplig nivå genom att representera varje sampel med ett tillräckligt stort antal bitar. Även signalens bandbegränsning går att hantera genom att välja samplingsfrekvensen f s tillräckligt hög i förhållande till de frekvenskomponenter som signalen förväntas innehålla. Det sista villkoret, ideal rekonstruktion, behöver emellertid belysas något eftersom det inte uppenbart går att realisera i praktiken. Ett praktiskt problem ser vi i (6.25): den idealt rekonstruerade signalen srek (t), bestäms vid varje tidpunkt t av en summa med oändligt antal termer, ett IIR-filter. Det finns teori för hur IIR-filter kan hanteras, men det betyder inte att det är enkelt att beskriva ett IIR-filter med en godtyckligt impulssvar. Alternativet är att försöka approximera den ideala interpolationsfunktionen sinc med en “ändlig” funktion, som är = 0 utanför ett begränsat intervall. Funktionen sinct går förvisso mot 0 när t → ±∞, men den gör det relativt långsamt. För att få en bra approximation skulle vi behöva ta med flera “perioder” av sinc-funktionen. Exempelvis: sinc(6, 5) ≈ 0, 05, dvs. för att komma under 5% av sinc-funktionens maxvärdet måste drygt tre perioder av funktionen tas med på varje sida av huvudloben. Ovanstående approximation är emellertid hanterbar rent tekniskt, vi kan trunkera sinc-funktionen, eller på annat sätt approximera den, så att den resulterande funktionen får en ändlig längd. Ju längre den resulterande funktionen är, desto bättre approximation av sinc-funktionen. Det finns emellertid ytterligare ett problem. Även sedan sinc-funktionen approximerats med en ändlig funktion blir det resulterande systemet som utför den (approximativt) ideala rekonstruktionen icke-kausalt. För att bestämma s(t) behöver vi summera ett ändligt antal sampel s[k] viktade med värden ur interpolationsfunktionen på ett sådant sätt att även sampel som ligger “framåt” i tiden relativt tidpunkten t kommer med. Det enklaste sättet att hantera detta i praktiken är att införa en tidsfördröjning i samband med rekonstruktionen. Om den interpolerande funktionen har längden 2t0 , dvs. tar med sinc-funktionen från t = −t0 till t = +t0 , kan vi fördröja utsignalen med t0 . Den interpolerande funktionen kommer då att med en approximation av sinc-funktionen vikta in sampel som motsvarar tiden t och “bakåt” i tiden. 94 Sammanfattningsvis måste ideal rekonstruktion alltid realiserad med en approximation av den ideala interpolationsfunktionen, som dessutom är fördröjd. Denna fördröjning har ofta ingen praktiskt betydelse, varför den ofta bortses från vid de teoretiska utredningar som görs här. 39 Ideal sampling och rekonstruktion är praktiskt möjligt, men bygger på ett antal approxiamtioner som, emellertid, kan göras godtyckligt bra genom att konstruera systemet på lämpligt sätt. Dessutom kommer den rekonstruerade signalen alltid att bli fördröjd. 6.4 Omsampling En tidsdiskret signal som har erhållits via sampling, (6.1), motsvarar en viss samplingsfrekvens, f s , eller samplingsperiod T . Ibland ka vi vara intresserad av att överföra den tidsdiskreta signalen till en ny tidsdiskret signal som motsvarar en annan samplingsfrekvens. Ett exempel är digitalt ljud som spelas upp från en CD skiva i en dator som ska konverteras till en MP3-fil. CD-musik har en samplingsfrekvens på 44, 1 kHz och är optimerad för HiFi-kvalitet, medan MP3 är optimerad för att kunna komprimera ljudet så att det tar så lite data i anspråk som möjligt. För att göra det kan MP3 välja mellan samplingsfrekvenserna 16, 22, 05 och 24 kHz. Om vi vill kunna hantera ljud som spelar upp från en CD och spelar in i MP3-format, eller tvärtom, måste vi då kunna ändras samplingsfrekvens. Detta kallas omsampling. Ett annat exempel är bilder och video, även om det då är fråga om signaler som beror av en vertikal och en horisontell position, snarare än bara av tiden. Det finns ett flertal standarder för TV och video och vissa samplar bilderna med 50 Hz (egentligen 50 halvbilder per sekund), andra med 60 Hz. För att kunna överföra TV-bilder mellan olika system behöver de därför samplas om tidsmässigt. Men bilderna kan även ha olika upplösning, dvs. pixlar per bild. I det fallet behöver bilderna även samplas om spatiellt, i både vertikal och horisontell ledd. Omsampling kan ses som att den tidsdiskreta signalen s1 [k] överförs till en ny tidsdiskret signal s2 [k] där det i bakgrunden finns en tidskontinuerlig signal s(t) så att s1 [k] = s(k T 1 ), s2 [k] = s(k T 2 ). och (6.37) där T 1 och T 2 är samplingsperioderna för s1 respektive s2 . Om T 1 < T 2 , dvs. samplingsfrekvensen för s1 är högre än för s2 [k], kallas omsamplingen för nedsampling. Vid nedsampling genereras färre sampel per tidsenhet än vad som är fallet i den ursprungliga signalen. Det motsatta fallet kallas uppsampling. Ett sätt att implementera omsamplingen, från s1 till s2 skulle kunna vara att först rekonstruera s(t) från s1 [k] och sedan sampla den resulterande tidskontinuerliga signalen, med sampelperioden T 2 , vilket ger s2 [k]. Det första steget producerar den rekonstruerade signalen, enligt (6.14): srek (t) = ∞ X s1 [l] r l=−∞ ! t − l T1 . T1 (6.38) Här är r en lämplig interpolationsfunktion, där vi har sett några olika alternativ. Denna rekonstruerade signal samplad sedan, nu med samplingsperioden T 2 , vilket ger den omsamplade tidsdiskreta signalen s2 [k]: s2 [k] = srek (k T 2 ) = ∞ X l=−∞ s1 [l] r ! k T2 − l T1 . T1 (6.39) I praktiken väljer vi ofta en interpolationsfunktion r som är ändlig, med längden z0 , dvs. r(z) = 0 för när |z| > z0 . Det betyder att (6.39) kan formuleras som s2 [k] = l2 X l=l1 ! k T2 s1 [l] r −l . T1 (6.40) där l1 = kTT12 − z0 , avrundat nedåt, och l2 = kTT12 + z0 , avrundat uppåt. Det intressant med formuleringen av s2 som visas i (6.40) är att varje sampel i den resulterande, omsamplade, signalen s2 [k] erhålls som en linjärkombination 95 av upp till l2 − l1 + 1 sampel i den ursprungliga signalen s1 [k]. Koefficienterna i denna linjärkombination ges av olika värden tagna från interpolationsfunktionen r. Vi kan se en omsampling som en speciell typ av tidsdiskret system, där både in- och utsignal är tidsdiskret, men där de har olika samplingsfrekvens. På grund av detta blir antalet sampel per tidsenhet olika för in- och utsignal, vilket gör att denna typ av system är lite mer komplicerad att hantera i praktiken. Det behövs två olika system som “matar fram” samplen för in- respektive utsignal. En omsamplare är ett linjärt system men, i det generella fallet, inte ett tidsinvariant system. 6.4.1 Uppsampling Av de två varianterna som finns på omsampling är uppsampling den minst komplicerade, i alla fall vad gäller teorin. Här ska den resulterande tidsdiskreta signalen ha fler sampel per tidsenhet än den ursprungliga signalen. Ett enkelt exempel är att T 2 = 2 T 1 , dvs. s2 har dubbla antalet sampel jämförd med s1 . I fallet att r(z) = Λ(z), dvs. vi använder bilinjär interpolation, kan s2 genereras genom k är jämn, s2 [k/2] (6.41) s2 [k] = 1 s2 [(k − 1)/2] + 1 s2 [(k + 1)/2] k är udda. 2 2 Det betyder att vart annat sampel i s2 fås direkt från motsvarande sampel i s1 , medan de udda “mellanliggande” samplen måste interpoleras från två grannsampel. Om en mer komplicerad interpolationsfunktion används, exempelvis den ideala funktion som härleds i avsnitt 6.2.2, kommer uttrycket för s2 att se mer komplicerat ut. Det kommer det även att göra i det fall att T 1 och T 2 förhåller sig till varandra på andra sätt än vad som antas här. I praktiken kan ett uttryck som (6.40) implementeras enkelt i digital elektronik, som utför beräkningen av linjärkombinationen med digital aritmetik (addition och multiplikation). Denna typ av system är relativt vanlig i digitala system för hantering av ljud och/eller bild. 6.4.2 Nedsampling Vid nedsampling ska den resulterande tidsdiskreta signalen ha färre sampel per tidsenhet än den ursprungliga signalen. Detta fall är lite mer komplicerat än uppsampling. Det beror på att vi, normalt, antar att sampling är gjord mer eller mindre enligt samplingsteoremet, dvs. den tidskontinuerliga signalen s(t) i (6.37) är bandbegränsad som att vikningsdistorsion inte uppstår, i alla fall inte bidrar till att signifikant försämra den samplade signalens kvalitet. Vid nedsampling kommer samplingsfrekvensen för s2 att vara lägre än för s1 , dvs dess Nyquist-frekvens ligger lägre än Nyquist-frekvensen för s1 . Om vi då har bandbegränsat s(t) till Nyquist-frekvensen för s1 innan den sampling som resulterade in s1 [k], så kan de fortfarande finnes frekvenskomponenter i s2 som ligger ovanför Nyquist-frekvensen för s2 , vilket då genererar vikningsdistorsion efter omsamplingen. För att undvika detta behöver den tidsdiskreta signalen s1 [k] bandbegränsas till Nyquist-frekvensen för s2 . Sammanfattningsvis: 40 Vid nedsampling bör s1 först bandbegränsas till Nyquist-frekvensen för s2 , annars uppstår vikningsdistorsion efter nedsamplingen. Ett enkelt exempel En enkel typ av nedsampling är att reducera antalet sampel per tidsenhet med en faktor 2, vilket gör genom s2 [k] = s01 [2 k] (6.42) Det betyder att vi får s2 genom att plocka vart annat sampel ur s01 . I enklaste fallet skulle vi kunna sätta s01 = s1 , men enligt ovanstående resonemang riskerar då s2 att utsättas för vikningsdistorsion. Istället bör vi välja s01 = s1 ∗ hLP där hLP är ett tidsdiskret LP-filter som reducerar alla frekvenskomponenter över Nyquist-frekvensen för s2 . 96 (6.43) Figur 6.6: Ett tidskontinuerligt system som implementeras genom en kaskad av ideal sampling, ett tidsdiskret system h[k] och en ideal rekonstruktion. 6.5 Tidskontinuerliga system implementerade med tidsdiskreta system Antag att vi vill åstadkomma att tidskontinuerligt system H, med insignal x(t) och utsignal y(t), som har ett specifikt impulssvar h(t). Som nämnts tidigare är en av poängerna med tidsdiskreta filter att de enkelt och effektivt kan implementeras i digital elektronik. Därför vill vi implementera systemet H genom att först sampla x(t) idealt, vilket resulterar i den tidsdiskreta signalen x[k] som får vara insignal till ett tidsdiskret system H̃ med impulssvaret h̃[k]. Utsignalen y[t] blir sedan idealt rekonstruerad till den tidskontinuerliga signalen y(t), vilken är utsignalen för H. Denna typ av system illustreras i figur 6.6. Frågan som uppstår är hur ska vi välja det tidsdiskreta systemets impulssvar h̃[k] så att impulssvaret för det kaskadkopplade systemet H blir h(t). Svaret är så enkelt som att h̃[k] ska vara en ideal sampling av T h(t), men det hela fungerar bara om både h och x är samplade enligt samplingsteoremet, dvs. att samplingsfrekvensen är vald så att varken h(t) eller x(t) har frekvenskomponenter över Nyquist-frekvensen. Vi ska ägna resten av detta avsnitt till att visa detta påstående. Vi antar att både h(t) och x(t) kan samplas idealt med samplingsperioden T , där T är vald så att ideal rekonstruktion enligt samplingsteoremet är möjligt för båda dessa signaler. I enlighet med (6.29) kan de då formuleras som ! ! ∞ ∞ X X t−lT t−kT , x(t) = x[l] sinc . (6.44) h(t) = h[k] sinc T T l=−∞ k=−∞ Utsignalen från systemet H ges som faltningen mellan h och x Z y(t) = H{x(t)} = (h ∗ x)(t) = ∞ h(τ) x(t − τ) dτ. (6.45) −∞ men vi ska först undersöka den diskreta signalen y[k], utsignalen från det tidsdiskreta filtret h[k]. Eftersom y(t) genererats av en ideal rekonstruktion gäller att: Z ∞ y[k] = y(k · T ) = h(τ) x(k T − τ) dτ = /(6.45)/ = −∞ =x(kT −τ) =h(τ) }| { {z ! ∞ ! byt plats på τ−kT X kT −τ−lT = x[l] sinc dτ = summor och integral = h[k] sinc T T −∞ k=−∞ l=−∞ Z z ∞ ∞ X }| = T δ[n−l−k] ∞ X ∞ X z Z τ−kT = h[k] x[l] sinc T −∞ k=−∞ l=−∞ =T ∞ X ∞ X ∞ ! }| ! { kT −τ−lT sinc dτ = /(B.45)/ = T h[k] x[l] δ[n − l − k] = /(B.35)/ = T k=−∞ l=−∞ ∞ X (6.46) h[k] x[n − k] = T (h ∗ x)[k]. k=−∞ Sambandet mellan y[k] och x[k] kan även skrivas y[k] = (h̃ ∗ x)[k], 97 (6.47) och eftersom impulssvaret för ett system är unikt leder de två senaste ekvationerna till följande samband mellan det tidsdiskreta systemets impulssvar h̃[k] = T h(k · T ). (6.48) 41 Ett tidskontinuerligt system H med insignal x(t) och impulssvar h(t) kan implementeras i form av ett tidsdiskret system H̃, med sampelperiod T , i kaskad med ideal sampling och ideal rekonstruktion, där H̃ har impulssvaret T h(k T ). Ett tillräckligt villkor för detta är att T är vald så att alla frekvenskomponenter i både h(t) och x(t) ligger under Nyquist-frekvensen. 98 Bilaga A Saker vi minns från tidigare kurser I detta kapitel finns samlat en del definitioner och resultat som du ska vara bekant med från tidigare kurser. A.1 Linjär algebra Linjär algebra handlar om studiet av vektorrum och linjära avbildningar i vektorrum. De flesta exempel i en grundläggande kurs om linjär algebra handlar ofta om vektorrummen Rn , där vektorerna är ordnade grupper av n reella tal, och linjära avbildningar Rn → Rm representeras av n×m matriser. Vi ska här repetera några av de grundbegrepp som dyker upp denna framställning. A.1.1 Vektorrum Ett vektorrum består egentligen av två mängder: vektorer och skalärer. Vektorerna kan vara element i Rn och skalärerna motsvarar reella tal. Att det hela utgör ett vektorrum innebär två saker: 1. Det går att addera vektorer med varandra och resultatet blir en vektor. I Rn innebär addition av vektorer att de adderas elementvis. 2. Det går att multiplicera en vektor med en skalär, ett reellt tal, och resultatet blir en vektor. I Rn innebär multiplikation mellan vektor och skalär att skalären multipliceras på varje element i vektorn. För fullständighetens skull kan nämnas att de två operationerna, addition av vektorer och multiplikation mellan vektor och skalär, i sig själva har ett antal specifika egenskaper, exempelvis att det finns en speciell vektor, kallad nollvektorn och betecknad 0, som har egenskapen att 0 + v = v + 0 = v för alla vektorer v ∈ V. Det finns ytterligare några egenskaper, men vi stannar här. A.1.2 Linjärkombination Om v1 , . . . , vn } är en ordnad mängd med n vektorer och c1 , . . . , cn är en ordnad mängd med n skalärer så kan vi bilda en vektorer som en linjärkombination mellan de n vektorerna och de n skalärerna som c1 v1 + c2 v2 + . . . + cn vn . A.1.3 (A.1) Linjära transformationer Låt V vara ett vektorrum, exempelvis Rn och låt T : V → V vara en avbildning från V till V. T kallas då för en linjär transformation om T{α1 v1 + α2 v2 } = α1 T{v1 } + α2 T{v2 }, (A.2) för alla möjliga val av vektorer v1 , v2 ∈ V och val av skalärer α1 , α2 ∈ R. Om vi analyserar definitionen av en linjär transformation lite noggrannare, ser vi att både vänster- och högerledet i (A.2) innehåller en linjärkombination. I vänsterledet sker linjärkombinationen innan T får verka på resultatet, 99 och i högerledet sker linjärkombinationen efter att T fått verka på var och en av de två vektorerna. En alternativ definition skulle alltså vara att T är en linjär transformation om det inte spelar någon roll ifall T appliceras före eller efter en linjärkombination mellan två vektorer, och att det heller inte spelar någon roll vilka två vektorer eller skalärer som ingår i linjärkombinationen. En kommentar (I) Om T är en linjär transformation i ett vektorrum så ger den samma resultat om den får verka före eller efter en linjärkombination av ett godtyckligt ändligt antal vektorer. Om T är en linjär transformation kommer alltså (A.2) att gälla även för linjärkombinationer av tre eller fler vektorer. En kommentar (II) För att visa att en avbildning i ett vektorrum är en linjärtransformation räcker det med att visa (A.2), en linjärkombination mellan två godtyckliga vektorer och två godtyckliga skalärer. A.1.4 Baser och koordinater En bas för ett vektorrum V är en samling vektorer B = {bn ∈ V} som har egenskaperna 1. Linjärt oberoende: ingen av vektorerna bn ∈ B kan skrivas som en linjärkombination av de övriga. 2. Spänner upp: Varje vektor v ∈ V kan skrivas som en linjärkombination av basvektorerna. Egenskap 2 innebär att för varje v ∈ V finns en uppsättning skalärer cn så att v= X cn en . (A.3) n Egenskap 1 innebär att dessa skalärer är unika för varje v, dvs. det finns bara ett enda sätt att uttrycka v som en linjärkombination av basvektorerna. Dessa skalärer kallas koordinater för v relativt basen B. I fallet att B innehåller ett ändligt antal basvektorer är V ett vektorrum av ändlig dimension = antalet vektorer i B. I princip kan B även innehålla oändligt många vektorer, och då är V ett oändligdimensionell vektorrum. A.1.5 Skalärprodukt och norm I ett vektorrum Rn kan vi definiera skalärprodukten mellan två vektorer u = u1 u2 ... un , v = v1 ... v2 vn , (A.4) som u · v = u1 v1 + u2 v2 + . . . + un vv . (A.5) En vektor u sådan att kuk = 1 kallas för en normerad vektor. Normen (längden) av en vektor i Rn kan definieras med hjälp av skalärprodukten som kvk = (v · v)1/2 . (A.6) Vinkeln α mellan två nollskilda vektorer i Rn kan även den definieras via skalärprodukten ur sambandet u · v = kuk · kvk · cos α, ⇒ cos α = u·v . kuk · kvk (A.7) Vi kan använda cos α som ett mått på hur “lika” de två vektorerna u och v är, där vi samtidigt bortser från deras norm. Om de är helt lika, bortsett från olika skalning, är cos α = 1. Om de de är lika, men har motsatt tecken och eventuellt olika skalning, är cos α = −1. Om de är ortogonala vektorer, vilket kan tolkas som helt olika, är cos α = 0. 100 A.1.6 Minsta kvadratproblem Ett ofta återkommande problem att lösa inom ett flertal områden är att hitta den vektor x ∈ Rn som minimerar definierad som = kA x − yk2 , (A.8) där A är en känd m × n matris och y är en känd vektor i Rm . Denna typ av problem kallas minsta kvadratproblem och betyder egentligen att vi vill minimera normen av en skillnad mellan två vektorer, Ax respektive y, men genom att kvadrera normen får vi samma lösning och det blir det ett enklare problem att lösa. Skillnaden mellan de två vektorerna kan ofta ses som ett “fel”, exempelvis mellan vad vi observerar, y, och vad en viss matematisk modell säger att vi borde observera, A x. Genom att minimera felet, dvs. minimera , kan vi bestämma parametrar x som beskriver den modell som bäst förklarar observerade data. Ett typiskt exempel är att anpassa en linje till en mängd punkter. I linjär algebra visas att det x som minimerar måste uppfylla normalekvationen för det aktuella minsta kvadratproblemet: A> A x = A> y, (A.9) där A> är transponatet av A, dvs. en n × m matris som har bytt rader med kolumner relativt A. Normalekvationen (A.9) har en entydig lösning om rangen för matrisen A är ≥ n, dvs. antalet linjärt oberoende rader och kolumner i A är ≥ n. I det fallet är matrisinversen av AT A väldefinierad och ger x = (A> A)−1 A> y. (A.10) Om rangen av A är < n finns ingen entydig invers av AT A och x kan inte bestämmas med (A.10). Istället finns det oändligt många lösningar som kan bestämmas genom att dela upp Rn i ett nollrum till A och dess ortogonala komplement. Det finns då en entydig lösning i det senare rummet, till vilken kan adderas en godtycklig vektor i det förra rummet. A.2 Trigonometri Trigonometriska ettan cos2 x + sin2 x = 1. (A.11) Cosinus och sinus av summa eller skillnad av två vinklar sin(x + y) = sin x cos y + cos x sin y (A.12) sin(x − y) = sin x cos y − cos x sin y (A.13) cos(x + y) = cos x cos y − sin x sin y (A.14) cos(x − y) = cos x cos y + sin x sin y (A.15) 2 cos x sin y = sin(x + y) − sin(x − y). (A.16) Produkter av sinus och/eller cosinus 2 cos x cos y = cos(x + y) + cos(x − y), (A.17) 2 sin x sin y = cos(x − y) − cos(x + y). (A.18) Samband mellan cosinus och sinus π , cos(x) = sin x + 2 π sin(x) = cos x − . 2 . 101 (A.19) (A.20) A.3 Komplexa tal Grundläggande teori relaterade till komplex tal ska du redan känna till från andra kurser. Detta appendix innehållet ett antal formler och andra resultat som vi använder i detta kompendium. Kartesisk representation Ett komplext tal skrivs på formen z = a + j b, (A.21) där j är den imaginära enheten, som uppfyller j2 = −1. Du är sannolikt van vid att den imaginära enheten betecknas med i, vilket är vanligt inom matematik och fysik. Inom området elektriska kretsar används i istället för att beteckna elektrisk ström, och för att inte sammanblandning ska ske brukar j användas som den imaginära enheten i dessa sammanhang. Eftersom elektriska kretsar är en del av denna framställning kommer vi konsekvent att använda j för att beteckna den imaginära enheten för de komplexa talen. De reella talen a och b i (A.21) kallas realdel respektive imaginärdel av det komplex talet z. Formellt kan vi definiera två funktioner som plockar ut real- respektive imaginärdelarna av ett komplext tal Re [z] = a, Im [z] = b. (A.22) Mängden av alla komplexa tal betecknas med C. Formuleringen av z ∈ C som beskrivs in (A.21), en summa av de två termer som representerar realdelen respektive imaginärdelen, kallas för kartesisk representation. Eulers formel Inte bara tal, skalärer, kan vara komplexa. Även funktioner kan vara komplexvärda. Ett exempel ges av Eulers formel, som skrivs e jφ = cos φ + j sin φ. (A.23) Den kas ses som ett sätt att utöka den vanliga reellvärda exponentialfunktionen till komplexa tal. En “invers” form av Eulers formel låter oss uttrycka både cosinus- och sinusfunktionerna i termer av den komplexa exponenialfunktionen: e jφ − e− jφ e jφ + e− jφ , sin φ = . (A.24) cos φ = 2 2j Ett alternativt till den kartesiska representationen av z ∈ C är att använda polär representation: z = A e jφ = /Eulers formel/ = A cos φ + j A sin φ. (A.25) I denna form kallas det reella talet A ≥ 0 för magnituden av z och skrivs A = | z |. Talet φ ∈ R är argumentet av z, vilket skrivs φ = arg(z). Genom att identifiera real- och imaginärdelarna för z i (A.21) respektive (A.25) får vi direkt ett par samband som kan uttrycka dessa i magnituden och argumentet: a = A cos φ, b = A sin φ. (A.26) Ur dessa samband får vi även a2 + b2 = A2 (cos2 φ + sin 2φ) = A2 , ⇒ A= √ a2 + b2 . (A.27) Även argumentet φ går att erhålla ur (A.26), men här måste vi vara lite försiktiga och ta hänsyn till i vilken kvadrant i komplexa talplanet som z ligger. Det görs genom att använda funktionen atan2 som definieras i avsnitt B.1: φ = arg(z) = atan2(a, b). (A.28) Notera att fallet a = b = 0 motsvarar z = 0 och att alla φ är giltiga eftersom även A = 0. Funktionen i (B.1), som bestämmer φ i intervallet −π < φ ≤ π som funktion av a, b, och brukar ibland kallas atan2. Den tar korrekt hänsyn 102 till i vilken kvadrant som z ∈ C ligger i, men den tar inte hänsyn till att även φ + 2 π n fungerar som argument for z, där n är heltal. Denna insikt måste ibland tas med explicit i uttrycket för φ, men kan oftast antas vara underförstådd. 42 Det går inte att bestämma argumentet φ av ett komplext tal a + j b enbart som φ = tan−1 ab . 43 Argumentet för ett komplext tal är inte entydigt bestämt i den meningen att det går att addera godtyckliga heltalsmultiplar av 2 π till argumentet. Komplexkonjugat Ett komplext tal z = a + j b har ett komplexkonjugat, betecknat z, enligt z = a − j b. (A.29) dvs. komplexkonjugatet ges av ett teckenbyte av imaginärdelen av z. I polär representation innebär komplexkonjugering teckenbyte av argumentet: (A.30) z = A e jφ , ⇒ z = A e− jφ A.4 Analys A.4.1 Definition av derivata Derivatan av funktionen f , vid punkten z, bestäms som ett gränsvärde f (z + h) − f (z) d f (z) = lim . h→0 dz h A.4.2 Några nyttiga uttryck Ibland kan det underlätta att kunna uttrycka funktionen 1/x lite krångligare än vanligt: " −xz #z=∞ Z ∞ e 1 e−xz dz = − = , x > 0. x z=0 x 0 A.4.3 (A.31) (A.32) Generaliserade integraler Den generaliserade integralen (eller oegentliga integralen) av en funktion från −∞ till ∞ definieras1 som ett gränsvärde: Z Z ∞ h f (z) dz = lim h→∞ −∞ På motsvarande sätt: Z ∞ f (z) dz = lim 0 En konsekvens av detta är Z h→∞ f (z) dz. (A.33) f (z) dz. (A.34) −h Z h 0 ∞ f (z) dz = 0, om f (z) är en udda funktion, (A.35) −∞ dvs. om f (−z) = f (z) för alla z. 1 Det finns alternativa definitioner av denna typ av generaliserad integral, som inte alltid ger samma resultat. I denna framställning använder vi emellertid ovanstående definition. 103 A.4.4 Specifika integraler En specifik integral som dyker upp i denna berättelse är Z π/T e jω T (k−l) dω. (A.36) −π/T där k, l ∈ Z. För att bestämma denna integral behöver vi undersöka två fall: k = l och k , l. När k = l får vi Z π/T Z π/T 2π jω T (k−l) . e dω = e0 dω = |{z} T −π/T −π/T (A.37) =1 För fallet k , l får vi istället Z π " e jω T (k−l) dω = −π e jω T (k−l) jω T (k − l) #ω=π/T 2Tπ dω = 0 k = l, 2π δ[k]. = /(B.34)/ = T k , l. ω=−π/T = 1 (0 − 0) = 0. jω T (k − l) (A.38) Sammanfattningsvis kan vi då skriva Z π/T e jω T (k−l) −π/T A.4.5 (A.39) Differentialekvationer En första ordningen homogen differentialekvation d f (t) + k f (t) = 0 dt (A.40) är en ekvation där funktionen f är okänd och ska bestämmas. Ekvationen har en lösning f (t) = C e−kt , (A.41) där C är en godtycklig konstant. För att bestämma C behövs någon typ av randvillkor, exempelvis att f (t) har ett bestämt värde för t = t0 . En inhomogen differentialekvation av första ordningen skrivs d f (t) + k f (t) = g(t), dt (A.42) där funktionen g är känd, men f fortfarande är okänd och ska bestämmas. Lösningen av denna typ av differential ekvation kan delas upp i två delar: f (t) = f s (t) + f p (t), (A.43) Här är f s (t) är en lösning av (A.40), dvs. ges av (A.41), och kallas stationär lösning eller homogen lösning av differentialekvationen (A.42). Notera att denna del av lösningen inte beror av g. Den andra delen, f p beror av g och är i det generella fallet inte alltid enkel att bestämma, men generellt kan den sägas vara av “samma typ” som g, dvs. om g är en konstant, ett polynom, en trigonometrisk funktion, en exponentialfunktion, etc. så är f p av motsvarande typ, men typiskt med andra parametrar. Dessa parametrar bestäms genom att (A.42) måste vara uppfylld. Denna lösningen klass den partikulära lösningen eller inhomogenea lösningen av differentialekvationen (A.42). Även i detta fall kan C bestämmas genom någon typ av randvillkor, men nu tillsammans med övriga parametrar som är inblandade i beskrivningen av f p . 104 Bilaga B Roliga funktioner I berättelsen om signaler och system är det ett antal speciella funktioner som förkommer så ofta att de fått egna namn. I detta kapitel presenteras några av de vanligaste funktionerna av denna typ. Ingen av dessa funktioner är i sig själva typiska signaler, men kan antingen användas för att bygga upp riktiga signaler, i form av linjärkombinationer, eller generellt för att analysera hur ett system fungerar. Notera att vi inte automatiskt antar att funktionsvariabeln är av typen “tid” och att den här anges med en generell variabel z. B.1 Arcus tangens med två argument För att korrekt bestämma en vinkel i R2 eller i C behövs en mer utförlig funktion än den vanliga inversa tangens. Denna funktion kallas två-argument-versionen av arcus tangens, betecknas atan2 och definieras som tan−1 tan−1 −1 φ = arg(a + j b) = atan2(b, a) = tan π 2 − π 2 b a a > 0, b a + π a < 0, b ≥ 0, b a − π a < 0, b > 0, (B.1) a = 0, b > 0 a = 0, b < 0. Denna funktion ger ett korrekta värdet för argumentet av ett komplext tal z = a + j b , 0. Notera ordningen för de två argumenten till funktionen atan2: först imaginärdelen sedan realdelen. B.2 Enhetssteget Enhetssteget eller stegfunktionen är en funktion u : R → R som definieras enligt 0 z < 0, u(z) = 1 z ≥ 0. (B.2) I praktiken används u för att symbolisera en funktion som initialt har värdet = 0 och sedan, efter tidpunkten t = 0, antar värdet =. I detta flesta fall spelar det inte någon stor roll om u(0) = 0 eller om u(0) = 1, varför definitionen i (B.2) lika gärna kan skrivas 0 z < 0, 0 z ≤ 0, 1 u(z) = eller u(z) = (B.3) z = 0, 1 z > 0, 2 1 z > 0. 105 u(t) rect(t) 1 1 t 0 0 0 -1 -0.5 0 0.5 1 t Figur B.1: Vänster: enhetssteget u(z), definierad i (B.2). Höger: enhetspulsen rect(z), definierad i (B.7). I det fall att värdet u(0) är viktigt, måste det anges specifikt när funktionen definieras. Enhetssteget illustreras av funktionen till vänster i figur B.1. Om vi är intresserad av ett steg som inträffar vid z = z0 och har höjden A beskrivs det av funktionen A u(z − t0 ). Notera att om h > 0 så är (B.4) z = u(z) = u(h z). (B.5) h vilket kan vara en användbar identitet i vissa sammanhang. Ytterligare en användbar identitet låter oss uttrycka u(x) ett slutet uttryck, snarare än två fall beroende på tecknet av z: u u(z) = z + |z| z + |z| = . 2 |z| 2z (B.6) Att dess kvoter inte är väldefinierade för z = 0 kan vi oftast leva med. B.3 Enhetspulsen Enhetspulsen är en funktion rect : R → R som definieras enligt 1 − 21 < z < 12 , rect(z) = 0 annars. (B.7) på samma sätt som för enhetssteget är det exakta funktionsvärdet för rect-funktionen inte så viktigt vid diskontinuiteterna, den representerar en puls som startar vid z = − 21 och slutar vid z = 12 . Enhetspulsen illustreras av funktionen till höger i figur B.1. Notera att en ekvivalent definition av enhetspulsen är ! ! 1 1 rect(z) = u z + −u z− . (B.8) 2 2 Alternativt, och med hjälp av (B.5), kan vi skriva ! z u(z + z0 ) − u(z − z0 ) = rect . 2z0 (B.9) Enhetspulsen har bredden ∆z = 1. En puls med höjden A som är centrerad kring z = z0 och har bredden ∆z beskrivs av funktionen z − z 0 A rect . (B.10) ∆z 106 sinc(t) 1 t 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 Figur B.2: Sinc-funktionen som definieras i (B.12). Alternativt kan vi vara intresserad av en puls med höjden A som startar vid tiden z = z1 och slutar vid z = z2 , vilken ges av 2 z − z1 +z 2 A rect (B.11) . z2 − z1 B.4 Sinc-funktionen Sinc är en funktion sinc : R → R som definieras enligt sinc(z) = sin(π z) . πz (B.12) I litteraturen definieras sinc-funktionen ibland utan faktorn π. Ovanstående sinc-funktion kallas för den normaliserade sinc-funktionen och den variant som saknar de två faktorerna π kallas för den onormaliserade sinc-funktionen. I denna framställning använder vi konsekvent enbart den normaliserade varianten. Sinc-funktionen har ett väldefinierat värde för sinc(0), eftersom sin(π z) lim sinc z = lim = l’Hopitals regel = lim z→0 z→0 z→0 πz d dz sin(π z) d dz (π z) = lim z→0 π cos(π z) = 1, π (B.13) vilket låter oss sätta sinc(0) = 1 (B.14) för alla heltal z utom z = 0. (B.15) Vidare gäller att sinc(z) = 0, Sinc-funktionen illustreras i figur B.2. Ibland kan det vara bra att ett alternativt och riktigt krångligt sätt att uttrycka sinc-funktionen. Ett exempel ges av följande integral 1 2π Z π −π e jωt dω = " #ω=π ! 1 e jωt sin πt 1 e jπt e− jπt = − = /(A.24)/ = = sinc t 2π jt ω=−π 2π jt jt πt 107 (B.16) Sinc-funktionens integral från −∞ till ∞ har ett ändligt och bestämt värde: Z ∞ Z ∞ sin(π z) dz = /använd (A.32)/ = sincz dz = /jämn funktion/ = 2 πz −∞ 0 Z ∞Z ∞ 2 = e−zx sin(π z) dx dz = /byt intergrationsordning/ = π 0 0 #z=∞ Z Z Z " 2 ∞ ∞ −zx 2 ∞ e−xz π cos(π z) + x sin(πz) = e sin(π z) dz dx = − dx = π 0 π 0 π2 + x 2 0 z=0 Z 2 ∞ π 2 −1 x x=∞ 2 π = dx = tan − 0 =1 = π 0 π2 + x2 π π x=0 π 2 Av detta kan vi dra slutsatsen att Z (B.17) (B.18) (B.19) (B.20) ∞ sincz dz = 1 (B.21) 1 , |a| (B.22) −∞ och via lämplig variabelsubstitution även att: Z ∞ sinc at dt = −∞ B.5 när a , 0. Ideala impulsfunktionen Den ideala impulsfunktionen1 betecknas δ(z) och kan ges flera olika, ekvivalent definitioner, men som har gemensamt att de inte beskriver δ(z) som en funktion. Den ideala impulsfunktionen är alltså inte en funktion! De beskrivningar avδ(z) som vi presenterar här ska inte tas som definitioner i strikt matematisk mening, utan ska snarare ses som praktiska sätt att hantera denna hala tvål. B.5.1 Som ett gränsvärde Ett sätt att beskriva δ(z) är som ett gränsvärde: δ(z) = lim h→0 z 1 rect |h| h (B.23) Notera att detta gränsvärde innebär att uttrycket i högerledet, för h > 0 är en puls som alltid har arean = 1 och att denna puls blir smalare och smalare samtidigt som den blir högre och högre när h → 0. En rimlig konsekvens av denna “definition” är att δ(z) motsvarar en puls som är oändligt smal och samtidigt oändligt hög, eftersom arean hela tiden ska vara = 1. Det är detta som gör att δ(z) inte fungerar bra som en funktion, dess funktionsvärde vid z = 0 kan inte anges som ett reellt tal. Att sätta δ(0) = ∞ leder i bästa fall tankarna åt rätt håll, men erbjuder inte en hållbar beskrivning av δ(z) som en funktion. Eftersom högerledet i (B.23) för h > 0 är en puls med arean = 1 kan vi anta att även δ(z) har denna egenskap: Z ∞ δ(z) dz = 1 (B.24) −∞ Detta erbjuder en annan beskrivning av den ideala impulsfunktionen: som den funktion som uppfyller både (B.24) och δ(z) = för z , 0. Återigen innebär detta emellertid att δ(z) fallet utanför vad vi menar med en funktion. En möjlig nytta vi kan ha av denna beskrivning är att δ(z) med dessa egenskaper även åstadkoms även av följande gränsvärde, som alltså kan fungera som alternativ till (B.25): z + 2h 1 . δ(z) = lim rect (B.25) h→0 h h I (B.23) är högerledet en puls centrerad runt z = 0 som har bredden h, medan pulsen i högerledet för (B.25) startar vid z = −h och slutar vid z = 0, dvs. den har fortfarande bredden h. 1 Andra namn som förekommer i litteraturen är Diracs deltafunktion, Diracs impulsfunktion eller, helt enkelt, impulsfunktionen. 108 B.5.2 Som en derivata Om vi undersöker uttrycket i (B.25) lite närmare och använder (B.8) tillsammans med (B.5) ser vi att2 ! h z ! z + h2 1 1 z+h u(z + h) − u(z) 1 z + 2 1 −u + − u − = lim u = lim δ(z) = lim u h→0 h h→0 h→0 h h 2 h 2 h h h (B.26) Högerledet i denna ekvation kan vi identifiera som derivatan av u(z): δ(z) = d u(z). dz (B.27) Eftersom u(z) är diskontinuerlig vid z = 0 är derivatan av stegfunktionen inte väldefinierad vid z = 0 vilket, återigen, gör att δ inte kan ses som en väldefinierad funktion, i alla fall inte som har ett väldefinierat värdet vid z = 0. Men det vet vi ju redan. B.5.3 Som en funktional Vi ska även titta på ett tredje sätt att beskriva den ideala impulsfunktionen, som “något” som kan kombineras med en godtycklig funktion f (z) i en integral Z ∞ δ(z) f (z) dz. (B.28) −∞ Om vi sätter in (B.27) i denna integral får vi ! Z ∞ Z ∞ ∞ d u(z) f (z) dz = /partiell integrering/ = u(z) f (z) − u(z) f 0 (z) dz = −∞ −∞ −∞ dz Z ∞ ∞ = u(∞) f (∞) − u(−∞) f (−∞) − f 0 (z) dz = f (∞) − f (z) = |{z} | {z } 0 0 =1 (B.29) =0 = f (∞) − f (∞) + f (0) = f (0). Detta är inte en strikt härledning, utan snarare en indikation att vi skulle kunna beskriva den ideala impulsfunktionen som en “funktion” med egenskapen att Z ∞ δ(z) f (z) dz = f (0) (B.30) −∞ för “godtyckliga” val av funktionen f . I själv verket måste vi nog begränsa valet av f , till exempel så att f är en kontinuerlig och integrerbar funktion. Med en enkel variabelsubstitution får vi ett mer generellt användbart uttryck Z ∞ Z ∞ δ(z0 − z) f (z) dz = δ(z) f (z0 − z) dz = f (z0 ). (B.31) −∞ −∞ som gäller för godtycklig val av “rimliga” funktioner, dvs. funktioner för vilka de inblandade uttrycken blir väldefinierade. Given denna beskrivning av den ideala impulsfunktionen, som “något” som kan kombineras med en funktion f i en integral, är det fortfarande inte klart att detta något är vad vi menar med en funktion. Exempelvis kan vi sätta in den konstant funktionen f (z) = 1 i (B.31) och erhålla (B.24). I detta sammanhang kallas δ istället för en funktional, vilket kan ges en strikt matematisk definition som emellertid faller utanför denna framställning. Sammanfattningsvis är (B.31) den enda definition av den ideala impulsfunktionen δ som kan ges en strikt matematisk mening. Vi kan emellertid se både (B.23) och i (B.27) som rimliga konsekvenser av denna definition och som kan användas i praktiken när vi vill härleda olika typer av resultat. En kommentar I sammanhanget kan det vara värt att notera att δ(t) är unik funktional vad gäller de egenskaper som beskrivs ovan. Det finns alltså inte två olika impulsfunktioner med denna kaliber. 2 Här undersöker vi egentligen enbart gränsvärdet när h → 0 för positiva h. En motsvarande undersökning av fallet h < 0 ger emellertid samma resultat. 109 Egenskaper Intuitivt kan det tyckas som att δ(z) och δ(a z), där a , är en konstant, är samma sak. Båda representerar en puls som är oändligt smal (= 0 för alla z , 0) och oändligt hög. En närmare undersökning ger emellertid vid handen att Z ∞ Z ∞ 1 δ(w) dw (B.32) δ(a z) dz = /Variabelsubstitution: w = az/ = |a| −∞ −∞ Det måste kan vi lämpligen tolka som att δ(a z) = B.6 1 δ(z). |a| (B.33) Diskreta Impulsfunktionen Den ideala impulsfunktionen som beskrivs i avsnitt B.5 har en variabel z som är kontinuerlig. Motsvarande funktion för en diskret variabel k ∈ Z kan definieras utan problem med matematisk stringens som 1 k = 0, (B.34) δ[k] = 0 k , 0. Givet (B.34) kan vi enkelt komma fram till den tidsdiskreta motsvarigheten till (B.31): ∞ ∞ X X δ[k − l] s[l] = δ[l] s[k − l] = s[k] l=−∞ (B.35) l=−∞ där s[k] är en godtycklig funktion av en diskret variabel. Notera att (B.15) leder till att vi kan skriva δ[k] = sinc(k), B.7 k∈Z (B.36) Användbara samband Nu när de tre roliga funktionerna rect(z) sinc(z) och δ(z) är beskrivna kan vi även härleda en del samband som knyter samman just dessa tre funktioner. Från rect till sinc Vi börjar med att undersöka följande integral " #ω=π ! Z π 1 1 e jωz 1 e jπz e− jπz sin πz jωz e dω = = − = /(A.24)/ = = sinc z, 2π −π 2π jz ω=−π 2π jz jz πz vilket kan generaliseras till |a| sinc = a 2π z Z ∞ rect −∞ u a 2π e± juz du. (B.37) (B.38) Från sinc till rect Det går även att ta sig åt andra hållet med ett liknande uttryck. Via integralen Z ∞ Z ∞ Z ∞ sin πt sin πt jωt jωt e dt = /Euler/ = (cos ωt + j sin ωt) dt = /(A.16)(A.18)/ = sinc t e dt = πt −∞ −∞ −∞ πt en udda funktion av t = 1 2 Z ∞ −∞ z }| { sin(ω + π) t − sin(ω − π) t j cos(ω − π) t − cos(ω + π) t dt + dt = πt 2 −∞ πt | {z } Z ∞ = 0 enligt (A.35) ! 1 sin(ω + π) t − sin(ω − π) t 1 ω+π ω−π = dt = /(B.22)/ = − = 2 −∞ πt 2 |ω + π| |ω − π| 1 ω = 2 u(ω + π) − 1 − 2 u(ω − π) + 1 = /(B.9)/ = rect , 2 2π Z ∞ 110 (B.39) kan vi generellt skriva rect z a = |a| 2π ∞ Z sinc −∞ aτ 2π e± jzτ dτ. (B.40) Den ideala impulsfunktionen Även den ideala impulsfunktionen går att uttrycka i form av en integral. Vi börjar med “definitionen” av δ i form av gränsvärdet i (B.23) och sätter därefter in (B.40): ! !# Z ∞ Z ∞" z 1 1 hτ jzτ hτ 1 δ(z) = lim = /(B.40)/ = lim sinc lim sinc rect e dτ = e jzτ dτ (B.41) h→0 |h| h→0 2π −∞ h 2π 2π −∞ h→0 2π Enligt (B.13) är gränsvärdet = 1, vilket leder till δ(z) = 1 2π Z ∞ e± jzτ dτ. (B.42) −∞ sinc igen Om vi undersöker följande integral för k, l ∈ Z: Z ∞ Z ∞Z ∞ Z ∞ u byt plats på v 1 j(t−k)u j(t−l)v sinc(t − k) sinc(t − l) dt = rect e du e dv dt = integralerna = rect 2π 2π (2π)2 −∞ −∞ −∞ | {z } | {z } −∞ Sätt in (B.38) Sätt in (B.38) Z ∞ Z ∞ u Z ∞ v 1 − j(ku+lv) rect = e e jt(u+v) dt dv du = rect 2π −∞ 2π (2π)2 −∞ −∞ | {z } Använd (B.42) ∞ u Z ∞ v 1 = rect e− j(ku+lv) δ(u + v) dv du = rect 2π −∞ 2π −∞ 2π | {z } Z (B.43) Använd (B.31) 1 = 2π Z ∞ u −u u 1 rect rect e− j(k−l)u du = rect e− j(k−l)u du = 2π{z 2π} 2π −∞ 2π −∞ | Z ∞ u =rect( 2π ) = /(B.38)/ = sinc(k − l) = /(B.36)/ = δ[k − l], kan vi använda detta resultat till att formulera det mer generella sambandet: ! ! Z τ−lT 1 ∞ τ−kT sinc dτ = δ[k − l], sinc T −∞ T T B.8 (B.44) k, l ∈ Z. (B.45) Gaussfunktionen Brukar definieras med två parametrar z0 och σ, enligt: r f (z) = 2 1 (z−z0 ) 1 e− 2 σ2 2 2πσ (B.46) Denna funktion, som inte har någon egen beteckning eller symbol √ men allmänt kallas Gauss-funktionen, dyker ofta upp inom statistik som en sannolikhetsfördelning. Faktorn 1/(σ 2π) finns med för att normera funktionen så att Z ∞ Z ∞r (z−z0 )2 1 − 12 σ2 e f (z) dz = dz = 1 (B.47) 2πσ2 −∞ −∞ vilket är ett krav för en sannolikhetsfördelning. Parametern z0 är fördelningens medelvärde: R∞ z f (z) dz R−∞∞ = z0 . (B.48) f (z) dz −∞ 111 och σ2 är dess varians: R∞ −∞ (z − z0 )2 f (z) dz R∞ = σ2 f (z) dz −∞ (B.49) vilket motsvarar standardavvikelsen σ. Intuitivt motsvarar därför z0 positionen för maxvärdet av den “puls” som Gauss-funktionen utgör, och σ är bredden av pulsen. Notera att med den normalisering som beskrivs i (B.46) motsvarar en bredare puls också en lägre puls, och tvärtom. Inom signalbehandling dyker Gauss-funktionen upp av en annan anledning: ett system som har som impulssvaret h(t) = f (t) är maximalt koncentrerad både i tidsledd och frekvens. Om pulsen är smal i tiden kan samtidigt dess frekvensfunktion vara maximalt smal även i frekvensledd. I själva verket systemets frekvensfunktion av r Z ∞ Z ∞ (t−t )2 1 2 2 1 − 21 02 − jωt σ e e− jωt dt = e− jωt0 e− 2 ω σ . (B.50) H(ω) = f (t) e dt = 2 2πσ −∞ −∞ Denna typ av funktion av ω brukar kallas för en modulerad Gauss-funktion. Den består av en Gauss-funktion centrerad vid ω = 0 med standardavvikelse 1/σ, multiplicerad med en komplex exponentialfunktion som enligt Eulers formel består av en cosinus- och sinussignal med vinkelfrekvensen t0 . Frekvensfunktionens “puls” blir alltså bredare när pulsen för h(t) blir smalare, och tvärtom. Däremot är deras gemensamma bredd, produkten av deras bredder, minimal bland alla val av impulssvar h(t). Andra användbara samband som innehåller Gauss-funktionen uppstår om vi väljer en frekvensfunktion H(ω) i form av en Gauss-funktion. För att motsvarande impulssvar h(t) ska vara reellt måste vi, enligt avsnitt 4.5.2, då välja H(ω) som är Hermitesk, exempelvis: H(ω) = e− 2 (ω+ω0 ) σ + e− 2 (ω−ω0 ) σ . 1 2 2 1 2 2 Motsvarande impulssvar h(t) ges då av (4.26) som Z ∞ 1 t2 1 1 1 1 2 2 2 2 e− 2 (ω+ω0 ) σ + e− 2 (ω−ω0 ) σ e jωt dω = √ e− 2 σ2 cos ω0 t h(t) = 2π −∞ 2πσ2 (B.51) (B.52) Detta impulssvar är även det en Gauss-funktion, men den är modulerad med en cosinusfunktion som har vinkelfrekvens ω0 . 112 Bilaga C Transmissionssystem En typ av system som ofta förekommer i kommunikationssammanhang består av en sändare och en mottagare, se figur C.1. Ett exempel är en radiosändare som sänder ut en radiosignal i form av en elektromagnetisk våg som fortplantar sig från sändarens antenn, till exempel i alla riktningar (rundstrålande sändare) eller enbart i en viss riktning eller sektor (riktad sändare). Även radiomottagaren har en antenn som istället tar emot radiovågen. I praktiken kan en sändare och en mottagare befinna sig fysiskt i samma enhet (en walkie-talkie eller en mobiltelefon) och även dela på en gemensam antenn, men enheten består då av två separata system: en sändare och en mottagare. Sändaren har en insignal som kan vara av många olika typer. Ofta kan vi anta att den består av en elektrisk signal, x(t), som exempelvis genereras av en mikrofon, en förstärkare, eller annan ljudkälla. Sändaren genererar en utsignal, z(t), som representerar någon typ av fysikalisk storhet som enkelt kan överföras till mottagaren. I radiofallet är z(t) den elektromagnetiska våg som sänds ut från antennen, men det skulle lika gärna kunna vara ljuspulser som sänds längs med en optisk fiber. Det system som sändaren utgör kan vara relativt komplicerat och är oftast inte ett LTI system: även om det i princip kan vara tidsinvariant så är det ofta inte linjärt. Mottagaren tar emot den utsända signalen och dess uppgift är att återföra denna signal till den ursprungliga signalen, x(t). I princip betyder det att mottagarens utsignal, y(t), kan sägas utgöra en approximation av sändarens insignal: y(t) ≈ x(t). Det är i alla fall hur ett idealt transmissionssystem är tänkt att fungera. i verkligheten är det lite mer komplicerat. Exempelvis är den signal som mottagaren tar emot, w(t), inte identisk med den signal z(t) som sändare skickar ut. När vi pratar om sändare/mottagare-system är det i praktiken så att sändaren och mottagaren är åtskilda på minst ett av följande sätt: • I rummet: Sändaren och mottagaren befinner sig på två olika platser i rummet och den signal som sänds ut av sändaren måste färdas genom rummet innan den kommer fram till mottagaren. Ett exempel är en radiovåg som breder ut sig från en sändarantenn, eller ljudpulser som skickas längs med en optisk fiber. • I tiden: Sändaren spelar i signal på någon typ av lagringsmedium, exempelvis ett magnetiskt band (kassettbandspelare) eller i digital form på hårddisken i en dator, eller i optiskt form på en CD/DVD. Givetvis kan inspelning och uppspelning av signalerna ske både vid olika tidpunkter och vid olika platser i rummet. Figur C.1: En enkel modell av ett transmissionssystem, bestående av en sändare, en kanal som den utsända signalen passerar innan den tas emot och en mottagare. Kanalen påverkar den utsända signalen genom dämpning, tidsfördröjning och additivt brus. 113 Det här betyder att signalen färdas genom rummet och/eller tiden och kan då påverkas av yttre faktorer som inte har med sändaren eller mottagaren att göra. Påverkan beror på det medium genom vilket den utsända signalen fortplantar sig, eller på det medium en signal lagras i, innan signalen når mottagaren. C.1 Kanalen Den externa del av överföringen, som befinner sig mellan sändaren och mottagaren och som transporterar signalen från sändaren till mottagaren, kallas i tekniska sammanhang för kanal. Kanalen har den utsända signalen z(t) som insignal och den mottagna signalen w(t) som utsignal. För fallet med en rundstrålande radiosändare, där det typiskt finns många separata mottagare, finns det en kanal per mottagare. Den kanalen beskriver vad som händer med den utsända signalen innan den når sin specifika mottagare och beror primärt av avståndet mellan sändare och mottagare liksom, men kan även beskriva reflektioner som den utsända signalen gör innan den når mottagaren, I fallet med en optisk fiber finns det normal enbart en sändare och en mottagare (i varje fall i varje riktning) och då finns det enbart en kanal som behöver beskrivas. En kanal som beskriver en rumslig separation mellan sändare och mottagare kallas för en transmissionskanal och om det är en separation i tiden kallas den istället för en lagringskanal. Även om transmissions- respektive lagringskanaler har stora praktiska skillnader skiljer de sig inte åt ur ett grundläggande systemperspektiv. Denna framställning ägnar sig inledningsvis åt de generella aspekterna av en kanal och kommer därför inte skilja mellan de två typerna. Kanalen kan ofta beskrivas approximativt som ett LTI-system och innehåller följande typiska delsystem: Fördröjning: I fallet med en transmissionskanal beskriver kanalen hur den utsända signalen z(t) fortplantar sig genom mediet, vilket den gör med en viss hastighet c (exempelvis, c = ljusets hastighet i fallet med radio och optisk fiber). Det betyder att en fördröjning på ∆t = L/c, där L är avståndet mellan sändare och mottagare, uppstår i kanalen. I fallet med lagringskanal finns naturligt en fördröjning mellan när signalen spelas in eller lagras i mediet och när det sedan spelas upp. I det allmänna fallet går det inte att ange hur lång tid det handlar om och vi kan oftast spela upp signalen flera gånger efter varandra. Denna fördröjning blir därför irrelevant att specificera för en lagringskanal. Dämpning: Den utsända signalen z(t) motsvarar en viss mängd energi per tidsenhet. När denna energi fortplantar sig genom mediet sker normalt förluster, dels genom absorption i mediet men även genom att signalen sprids ut i rummet. Den mottagna energin från en rundstrålande antenn reduceras med en faktor 4 varje gång avståndet till antennen dubblas, helt enkelt för att den utsända energin ska fördelas över en större yta. Om kanalen motsvarar transmission över en ledning, eller en optiskt fiber, reduceras denna effekt till att nästan enbart handla om absorption. En konsekvens av detta är att den mottagna signalen w(t) är dämpad (förstärkt med en faktor < 1) relativt z(t). Även en lagringskanal kan ha en dämpning. Brus: I verkliga transmissionssystem måste vi räkna med att mottagaren kan ta emot signaler som inte är utsända av den aktuella sändaren och som uppstår på grund av olika typer av störningar. I fallet med radioutsändning finns det diverse källor till elektromagnetisk strålning som kommer att tas upp av mottagarantennen, men som inte härrör från sändaren. Några exempel: andra sändare i närheten, andra mottagare i närheten, elektriska kretsar i närheten inklusive kraftledningar, men även strålning från solen och kosmisk strålning bidrar till dessa störningar. I fallet med en optisk fiber kommer den transmitterade ljuset till viss del att absorberas. Fotonabsorption är en kvantmekanisk effekt: för en viss foton äger den rum med en bestämt sannolikhet per tidsenhet. Även om det genomsnittliga antalet fotonabsorptioner per tidsenhet är konstant uppstår en variation kring detta genomsnitt varje tidsenhet som fotonerna transporteras genom fibern. Denna variation uppfattas i mottagaren som ett brus. De två första effekterna kan beskrivas som LTI-system, medan den tredje påverkan av signalen varken är linjär eller tidsinvariant. Ofta kan denna påverkan beskrivas som att brus adderas till den effektiva signalen u(t) som härrör till sändaren, så kallat additivt brus. Bruset beskrivs ofta i termer av medelvärde, standardavvikelse, och andra statistiska egenskaper. Ibland kan mer komplicerade brusmodeller behöva användas, exempelvis multiplikativt brus, tidsvariabelt brus, men den additiva är för många system ofta tillräckligt bra, i alla fall som en första approximation. Den kanalmodell som beskrivits hittills är relativt enkel, den tar enbart hänsyn till att den utsända signalen går mer eller mindre raka vägen från sändare till mottagare i fallet med en transmissionskanal. I fallet med en radiosändare kommer det även att finnas möjligheten att en radiovåg som inte sänds ut i riktning rakt mot mottagaren 114 reflekteras mot lämplig yta och därefter rör sig mot en specifik mottagare. Givetvis kan denna mottagare även ta emot radiovågor från flera olika reflektioner. Varje reflektion kommer att ha rört sig olika långa sträckor, från sändaren till mottagaren, och när de till slut når mottagaren överlagras de till den mottagna signalen w(t). Dessa reflektioner kan beskrivas av en mer komplicerad kanalmodell, exempelvis: w(t) = Hkanal {z(t)} = X ak z(t − ∆tk ) + brus. (C.1) k Denna modell innehåller en summa med en term för varje möjlig reflektion som kan nå mottagaren, inklusive en term för den direkta vågen, med en specifik förstärkningsfaktor ak och tidsfördröjning ∆tk för varje term. En ännu mer generell modell är Z ∞ w(t) = Hkanal {z(t)} = h(τ) z(t − τ) dτ + brus. (C.2) −∞ Här är summan ersatt med en integral som tar med varje möjlig fördröjning signalen kan ha från sändare till mottagare, där h(τ) anger motsvarande förstärkning vid en specifik fördröjning. Notera att denna beskrivning av en kanal består av den generella LTI-modellen som beskrivs i avsnitt 3.6.1, med impulssvar h, i kaskad med det additiva bruset. Som alla LTI-system har kanalen även en frekvensfunktion H(ω) som anger, för varje vinkelfrekvens, motsvarande amplitudförstärkning D(ω) och fasförskjutning ψ(ω). För att analysera kanalens egenskaper kan vi välja att göra det med hjälp av impulssvaret eller frekvensfunktionen, beroende på vilka egenskaper som undersöks. C.2 Digital transmission Transmissionskanaler är relevanta för många olika typer av överföring av signaler från sändare till mottagare. Några exempel är AM- och FM- radio, eller hur ljudet i en konsertsal överförs från en sångare på scenen till örat hos en person som sitter i publiken och lyssnar. I detta avsnitt ska vi undersöka grundläggande egenskaper hos en specifik typ av transmissionssystem, som överför digital information från en sändare till en mottagare. I detta fall är både in- och utsignalerna tidsdiskreta digitala signaler, x[k] och y[k], som representerar sekvenser av bitar: “nollor” och “ettor”. Exakt vad för information som överförs spelar ingen roll för denna diskussion, vi är enbart intresserade av hur denna överföring sker och inte hur informationen sedan används av mottagaren. Denna typ av transmissionssystem motsvarar överföringen av digital information i, exempelvis, system för mobil telefoni, trådlöst internet (WiFi), digital television (DTV), Bluetooth, men även telefonmodem för internetanslutning fungerar på liknande sätt. Som nämnts ovan kommer i praktiken den mottagna signalen w(t) att innehålla ett visst mått av additivt brus. Det betyder att med en viss sannolikhet kommer den mottagna signalen tolkas fel, som en nolla istället för en etta eller tvärtom. Detta är ett något som måste lösas på ett eller annat sätt, först och främst genom att detektera när felaktiga bitar uppstår i mottagaren, och helst även genom att korrigera de felaktiga bitarna. Principen för att hantera detta är att, förutom de bitar som innehåller den information som ska överföras, även sända extra bitar som innehåller någon typ av redundans och som låter mottagare upptäcka och korrigera felaktiga bitar. Hur detta görs ligger emellertid utanför denna presentation och tas inte upp här. I resten av detta avsnitt kommer vi att fokusera på problemet att överhuvudtaget kunna överföra bitar från sändaren till mottagaren, även om en eller annan kommer att tolkas fel på grund av bruset. C.2.1 Sändaren Sändarens primära funktion är att översätta den digitala och tidsdiskreta insignalen x[k] till en signal z(t) som är lämpad för överföring till sändaren och som på något sätt kan återföras till x[k] av mottagaren. Det första kravet, att den utsända signalen är lämpad för överföring innebär ofta att sändaren har en relativt komplex systemoperator Htrans , som inte är ett LTI-system. Generellt kallas den funktion som sändaren utför för modulation, insignalen x[k] moduleras av sändaren vilket genererar den signal z(t) som sänds in i kanalen. Vi ska nu undersöka ett par enkla och en lite mer sofistikerad metod för modulation av digitala signaler. 115 Figur C.2: Ett exempel på unipolär modulation. Bild tagen från en.wikipedia, skapad av användare Mancini. Figur C.3: Ett exempel på bipolär modulation. Bild tagen från en.wikipedia, skapad av användare Omegatron. Unipolär modulation Enklaste tänkbara form av modulation är att helt enkelt låta sändarens utsignal z(t) vara linjärt proportionellt mot x[k] enligt ! ∞ X t−kT z(t) = x[k] rect . (C.3) T k=−∞ Det betyder att den utsända signalen består av en sekvens med pulser, vardera med bredden T (= sampelperioden för x[k]), men höjden av varje puls bestäms av om biten är noll (puls med höjden = 0) eller ett (puls med höjden = 1). Denna typ av modulation kallas unipolär modulation, se figur C.2 för en illustration. Ett mer generellt sätt att formulera modulationen i detta fall är z(t) = ∞ X p x[k] (t − k T ), (C.4) k=−∞ där t t , p1 (t) = 1 · rect . (C.5) T T Här ser vi den resulterande signalen z(t) som en summa av “pulser”, en för varje bit i x[k] i form av antingen p0 eller p1 , och var och en tidsfördröjd med T i förhållande till föregående puls. Vilken typ av puls som används för varje k beror på x[k]: om biten är = 0 används pulsen p0 (z) i (C.5), om biten är = 1 används istället pulsen p1 (z). Notera att i praktiken motsvaras en nolla av “ingen puls” eftersom p0 (z) = 0 för unipolär modulation. p0 (t) = 0 · rect Bipolär modulation Istället för låta nollor representeras av “ingen puls”, kan vi använda en variant av unipolär modulation och låta nollorna representeras av en negativ puls, vilket ger bipolär modulation. Den utsända signalen z(t) genereras fortfarande som en summa av pulser, enligt (C.4), men i det bipolära fallet definieras de två pulstyperna av t t p0 (t) = −rect , p1 (t) = rect . (C.6) T T Även om både unipolär och bipolär modulation förekommer inom digital kommunikation är ingen av dom riktigt lämpad för avancerade tillämpningar, som exempelvis mobiltelefoni. För det första behövs en synkronisering 116 p 0(t) 1 p 1(t) 1 0 1 0 0 1 0 Figur C.4: Frekvensmodulation av digital information enligt (C.7). Vänster: de två pulstyperna för “noll” respektive “ett”. Höger: exempel på utsänd signal z(t) som representerar ett antal bitar. mellan sändaren och mottagaren, som gör att mottagaren “vet” när en viss utsänd puls kommer fram och kan översättas tillbaka till en bit. Mottagaren kan endast kan observera den mottagna signalen w(t), som i bästa fall är en dämpad och fördröjd version av z(t). Vi kan även anta att mottagaren känner T , avståndet mellan varje puls. För ovanstående typer av modulation finns det emellertid inget enkelt sätt för mottagaren att veta exakt när de olika pulserna kan förväntas dyka upp i den mottagna signalen, w(t). Om ett stort antal bitar sänds över och T inte är känd med stor noggrannhet kan mottagaren “komma ur fas” när den ska översätta pulser till bitar. För det andra är det inte säkert att pulserna överförs effektivt till mottagaren. En basstation för mobiltelefoni kan typiskt betjäna i storleksordningen 100 mobiltelefoner och varje mobiltelefon kan ha tiotals basstationer inom räckhåll att kommunicera med. Vid varje tidpunkt agerar både basstationer och mobiltelefoner som både sändare och mottagare, och de behöver kunna skilja mellan överlagrade radiosignaler från många olika sändare när de tar emot digitala signaler. Det finns ett flertal mer eller mindre komplicerade varianter av ovanstående modulationer för digital kommunikation, som vi inte går in på här. De flesta av dessa kan lösa problemet med synkronisering men inte överlagringen, vilket istället kräver en mer avancerad modulation. Ett exempel är frekvensmodulation av digitala signaler. Frekvensmodulation Digitala signaler, sekvenser av nollor och ettor, kan sändas över en kanal med så kallad frekvensmodulation. Det innebär att varje bit som ska sändas representeras med en puls pk (t) som innehåller en cosinussignal med en frekvens ω som beror på om bitens värde är noll eller ett. Eftersom varje bit har en period T innan nästa bit ska sändas måste cosinussignalen multipliceras med en funktion som lokaliserar den till en puls med ändlig utsträckning som “får plats” i ett intervall med längden T . Ett exempel skulle vara att, precis som tidigare, bestämma den utsända signalen z(t) som en summa av pulser enligt (C.4), men nu låta de två pulstyperna definieras av t t p0 (t) = rect cos(ω0 t), p1 (t) = rect cos(ω1 t). (C.7) T T Här är ω0 och ω1 två lämpligt valda frekvenser som representerar en bit med värdet 0 respektive 1. Frekvenserna väljs så att de ligger tillräckligt långt från varandra för att mottagaren enkelt ska kunna detektera skillnaden mellan mottagna pulser av vardera typen. Se figur C.4 för en illustration. Tidigare beskrevs att den kanal som överför signalen z(t) till mottagaren har en frekvensfunktion Hkanal (ω) och det är då lämpligt att välja frekvenserna ω0 och ω1 så amplitudkarakteristiken |Hkanal (ω)| har en relativt stark förstärkning (eller låg dämpning) för just dessa frekvenser. De två pulserna som beskrivs i (C.7) är en produkt mellan en cosinussignal och en funktion som kallas envelopp, den anger amplituden för cosinussignalen som en funktion av tiden. Enveloppen är i det här fallet en rektangelfunktion som själv består av olika frekvenskomponenter, enligt avsnitt 4.4. Tillsammans med cosinusfunktionen kommer de resulterande pulserna p0 och p1 därför att även bestå av andra komponenter än enbart en med frekvensen ω0 respektive ω1 . Beroende på hur kort T är kan dessa komponenter i pulserna ha frekvenser som 117 p 0(t) 1 p 1(t) 1 0 1 0 0 1 0 Figur C.5: Frekvensmodulation av digital information enligt (C.8). Vänster: de två pulstyperna för “noll” respektive “ett”. Höger: exempel på utsänd signal z(t) som representerar ett antal bitar. ligger relativt långt från ω0 eller ω1 , och de kommer inte säkert att förstärkas på samma sätt som just dess två frekvenskomponenter. En konsekvens av detta är att enveloppen kan förändras signifikant. Ovanstående resonemang är en av orsakerna till att en envelopp i form av en rektangelfunktion i praktiken inte är det lämpligaste valet. För att lindra problemet med att de resulterande pulserna innehåller frekvenskomponenter över ett brett frekvensintervall är det bättre att använda en envelopp som är “mjukare”, som uppvisar en lugnare kurva när den går från värdet 0 upp till 1 och sedan tillbaka till 0 igen. En vanligt envelopp som har denna karaktär är Gauss-funktionen som beskrivs i avsnitt B.8 och de två pulserna definieras då som1 t2 t2 p0 (t) = e− 2σ2 cos(ω0 t), p1 (t) = e− 2σ2 cos(ω1 t). (C.8) Modulation av digital information med denna typ av frekvensmodulation illustreras i figur C.5. En kommentar Parametern σ anger hur “bred” motsvarande envelopp är. Den måste vara anpassad till T som är tiden mellan varje puls som sänds ut, så att pulsen “får plats” inom ett intervall som är T långt. Frekvensmodulerade pulser med gaussisk envelopp är den typ av modulation som vi kommer att undersöka i resten av detta avsnitt. Sändaren överför en tidsdiskret digital signal x[k] till en tidskontinuerlig signal2 z(t), exempelvis i form av en radiovåg som utbreder sig från sändarens antenn. I praktiska tillämpningar, exempelvis mobiltelefoni och WiFi, ligger de frekvenser som används för dessa pulser i storleksordningen GHz, dvs. 109 svängningar per sekund. Sändaren är inte ett LTI-system. Den kan sägas vara tidinvariant i den meningen att om sekvensen x[k] fördröjs med ∆k sampel kommer utsignalen z(t) att fördröjas med ∆k T tidsenheter. Sändaren är inte ett linjärt system: det är inte ens uppenbart vad linearitet skulle innebära när x[k] innehåller binära värden. C.2.2 Mottagaren Den utsända signalen z(t) är insignal till kanalen som överför z(t) till den signal w(t) som mottagaren tar emot. Enligt avsnitt C.1 innebär det någon typ av dämpning, fördröjning och att brus adderas till z(t). Mer generellt har kanalen ett impulssvar h(t), med motsvarande frekvensfunktion H(ω), som beskriver hur z(t) överförs till w(t). En praktisk implementering av ett digitalt transmissionssystem måste ta hänsyn till hur kanalen påverkar z(t), men för den principiella analys vi ska göra av mottagarens funktion kan vi bortse från dessa effekter. Vi antar därför initialt att w(t) = z(t). Den funktion som mottagaren utför kallas demodulation: att återföra den tidskontinuerliga signalen w(t) till en sekvens av bitar, motsvarande utsignalen y[k]. Om överföringen fungerar korrekt ska y[k] = x[k], men i praktiken 1I detta fallet används inte den normaliserande faktor som finns i (B.46). med funktionen hos en DAC. 2 Jämför 118 q 0(t) q0 (t) H0 w(t) = z(t) 1 1 0 1 0 0 1 0 q 1(t) q1 (t) H1 Figur C.6: Mottagaren innehåller två matchande filter, ett för varje typ av puls som överförs: p0 och p1 . Figuren visar även filtrens utsignaler när insignalen w(t) ges av z(t) i figur C.5 måste vi även anta att det uppstår en fördröjning så att sambandet snarare ser ut som y[k] = x[k − ∆k]. Demodulationen måste alltid vara anpassad till den modulation som sändaren använder sig av och att demodulera en signal som innehåller unipolär eller bipolär modulation är trivialt, bortsett från problemet med synkronisering som nämndes tidigare. Vi ska nu undersöka hur den frekvensmodulerad signal z(t) som beskrivs av pulserna i (C.8) kan demoduleras. Grunden är att använda sig av de matchande filter, som ger en stor utsignal när de tar emot en puls av den typ som filtren är matchade för och annars en liten utsignal. Matchade filter beskrivs i avsnitt 5.3, i samband med tidsdiskreta signaler, men det är en generell idé och kan lika gärna användas för tidskontinuerliga signaler. I avsnitt 6.5 har vi dessutom sett att tidskontinuerliga system i princip kan implementeras med tidsdiskreta system. Enligt samplingsteoremet, avsnitt 6.3, måste samplingsperioden för det tidsdiskreta system som implementerar mottagarens funktion vara anpassad till frekvensinnehåller i den mottagna signalen w(t). Denna samplingsperiod är då inte samma som samplingsperioden för den digitala signalen x[k], här betecknad T , den är typiskt signifikant kortare. . Vi använder två olika pulser, p0 och p1 som beskrivs i (C.8), och mottagaren ska därför innehålla två matchande filter, ett filter för varje pulstyp. Enligt avsnitt 5.3 ska de matchande filtrens impulssvar definieras som motsvarande puls men speglad i tidsledd. I vårt fall är båda pulserna symmetriska i tiden: pk (−t) = pk (t), varför de matchande filtren ska ha impulssvaren t2 t2 h0 (t) = e− 2σ2 cos(ω0 t), h1 (t) = e− 2σ2 cos(ω1 t), (C.9) vilket motsvarar två LTI-systemen H0 och H1 . Se figur C.6. Vi kan nu bestämma vilka utsignaler dessa två filter genererar när de får den mottagna signalen w(t) = z(t) som insignal. Enligt (C.4) kan z(t) beskrivas som en linjärkombination av pulser, en puls per bit i x[k]. Eftersom filtren är LTI-system blir deras utsignaler då linjärkombinationer av “pulssvaren” från respektive filter: ∞ ∞ ∞ X X X q0 (t) = H0 {z(t)} = H0 p (t − k T ) = /H är LTI/ = H {p (t − k T )} = s (t − k T ), x[k] 0 | 0 x[k]{z } k=−∞ 0,x[k] k=−∞ k=−∞ :=s0,x[k] (t−k T ) (C.10) q1 (t) = H1 {z(t)} = ... = ∞ X k=−∞ ∞ X H1 {p x[k] (t − k T )} = s (t − k T ). | {z } k=−∞ 1,x[k] :=s1,x[k] (t−k T ) där s0,x[k] (t) = H0 {p x[k] (t)}, s1,x[k] (t) = H1 {p x[k] (t)}. (C.11) Det betyder att vi kan bestämma de två utsignalerna q0 (t) och q1 (t) om vi känner de fyra signalerna: Hi {pm (t)} = (hi ∗ pm )(t), 119 i = 0, 1, m = 0, 1. (C.12) Eftersom både impulssvaren h0 , h1 och de två pulserna p0 , p1 är en cosinussignal, med en specifik frekvens och multiplicerad med en gaussisk envelopp, räcker det med att vi undersöker resultatet av att falta en sådan signal, med vinkelfrekvens ω med en annan som har vinkelfrekvens ω0 : Z ∞ (t−τ)2 τ2 (hi ∗ p j )(t) = e− 2σ2 cos(ω τ) e− 2σ2 cos ω0 (t − τ) = . . . = −∞ ! !! √ σ2 (ω−ω0 )2 πσ − t22 − σ2 (ω+ω0 )2 ω − ω0 ω + ω0 4 = e 4σ e cos t + e− 4 cos t . (C.13) 2 2 2 Här är ω antingen ω0 eller ω1 och detsamma gäller för ω0 . Det betyder att ω + ω0 är som minst dubbla det lägsta av ω0 och ω1 . I praktiken är dessa två frekvenser alltid valda så att de är signifikant större än 1/σ, vilket leder till att e− σ2 (ω+ω0 )2 4 ≈ 0: √ ! ω + ω0 πσ − σ2 (ω−ω0 )2 − t22 4 4σ cos e e t . (hi ∗ p j )(t) = 2 | {z } |{z} 2 |{z} envelopp | faktor {z } konstant (C.14) cosinussignal Om vi undersöker detta resultat ser vi att det är en puls i form av en cosinussignal med gaussisk envelopp, lik0 nande p0 eller p1 , men med skillnaden att dess vinkelfrekvens ges av ω+ω 2 och enveloppen har en standardavvikelse √ 2σ (dvs. alltså pulsen blir lite bredare). Den stora poängen i sammanhanget är emellertid att pulsen multipliceras σ2 (ω−ω0 )2 med en faktor e− 4 . Om de två frekvenserna är lika, dvs. filtret tar emot en matchande puls, är ω = ω0 och faktorn blir då = 1. Om frekvenserna är olika tar filtret emot en puls som det inte är matchad för och då vill vi att utsignalen ska bli så liten som möjligt. Om vi väljer frekvenserna ω0 och ω1 så att |ω0 − ω1 | = n σ (C.15) där n är en lämplig parameter, får vi att faktorn i det fallet att ω , ω0 ges av e− σ2 (ω−ω0 )2 4 n2 = e− 4 (C.16) Om vi väljer n = 3 blir faktorn ≈ 0, 1 och om n = 4 blir den istället ≈ 0, 02 för detta fall. Vi sammanfattar: när “rätt” puls passerar genom ett av de matchande√ filtren, dvs. en puls som filtret är matchat för, kommer resultatet att bli en ny puls, med ett bestämt maxvärde på 2πσ . När istället “fel” puls passerar blir det igen en ny puls men den dämpas med minst 90% om vi väljer n > 3. Varje puls som tas emot av mottagaren kommer då att effektivt ta sig igenom endast ett av de två filtren, det filter som pulsen är matchad till. Se figur C.6 för en illustration av hur de matchande filtren hanterar den signal z(t) som genereras av sändaren i figur C.5. Notera att pulserna är något bredare efter filtren än de är i den mottagna signalen, vilket är vad som förutsägs i beräkningarna ovan. 1 1 1 0 1 0 0 1 1 0 1 0 0 1 0 0 Figur C.7: Vänster: Beloppet av de utsignaler som visas i figur C.6. Höger: Lågpass filtrerad version av signalerna till vänster. 120 Avslutande systemkomponenter Ovanstående resultat leder fram till att, för lämpligt val av frekvenserna ω1 och ω2 samt pulsbredden σ, går det att separera de två typerna av pulser så att de återfinns i var sin utsignal från respektive matchande filter. Nu återstår att med hjälp av dessa signaler återskapa den digitala sekvensen x[k], vilket är mottagarens utsignal: y[k] = x[k]. Båda pulserna som återfinns i q0 (t) och q1 (t) svänger mellan positiva och negativa värden, kring nollan. Ett enkelt sätt att återskapa x[k] är att först ta beloppet av dessa signaler, så att resultatet hela tiden befinner sig på positiva sidan men fortfarande svänger upp och ned, se figur C.7, vänster, för en illustration. För att ta bort dessa svängningar kan båda signalerna filtreras med var sitt lämpligt LP-filter, vars gränsfrekvens är avpassad så att dessa svängningar dämpas effektivt. Det som blir kvar är den långsammare variation som motsvaras av enveloppen för varje puls. Dessa kan vara delvis överlagrade på varandra, men har tydliga “toppar” som motsvarar de bitar som överförs. Beroende på i vilken av de två signalerna som toppen återfinns är det en puls motsvarande x[k] = 0 eller en puls motsvarande x[k] = 1 som tas emot. Se figur C.7, höger, för en illustration. Det som återstår nu är att bestämma när det inträffar en “topp”, ett maxvärde, i de två signalerna och mata ut en nolla eller etta som värde för nästa sampel i y[k] när det händer. Det betyder att mottagaren enkelt kan synkronisera sig gentemot sändaren genom att observera den mottagna signalen. Den behöver känna T hos sändaren på ett ungefär och kan själv justera och anpassa sin egen sampelperiod för utsignalen y[k] genom bestämma när maxvärdena inträffar. Detta är en stor fördel med den valda moduleringsmetoden jämförd med, exempelvis unipolär eller bipolär modulation. En sammanställning av de delsystem som mottagaren består av återfinns i figur C.8. I praktiken Vi har tidigare kommit fram till att den utsända signalen z(t) inte är identisk med den mottagna signalen w(t). I det enklaste fallet skiljer de sig åt med en dämpning, en tidsfördröjning och ett visst mått av additivt brus. Tidsfördröjningen är okomplicerad, den innebär endast att y[k] är tidsfördröjd i förhållande till x[k]. I sammanhangen finns ytterligare en källa till fördröjning. De två matchande filtren har här beskrivits med impulssvar som gör dem ickekausala. För att de ska bli kausala måste filtren fördröjas så att hela pulsen effektivt hamnar på “positiva tidsaxeln”. Även LP-filtren introducerar en viss fördröjning. Den dämpning som kanalen innebär kan, i princip, kompenseras för genom att förstärka den mottagna signalen innan de matchande filtren. Detta innebär emellertid att även kanalens brus förstärks. Den bästa strategin är därför att förstärka den utsända signalen så mycket som möjligt och utgå från att den mottagna signalen är tillräckligt kraftig efter kanalens dämpning för att kunna demoduleras. I praktiken är det förhållandet mellan effektiv signal u(t) och bruset som tas emot som är den viktiga parametern. Ju kraftigare u(t) i förhållande till bruset desto mindre risk att de mottagna bitarna tolkas fel. Figur C.8: Sammanställning av de delsystem som återfinns i mottagaren vid frekvensmodulation. 121 122 Bilaga D Prediktion En prediktor är ett tidsdiskret system som försöker gissa värdet av den tidsdiskreta signalen s[k], vid sampel k, givet n kända sampelvärden bakåt i tiden: s[k − 1], s[k − 2], . . . , s[k − n]. Tanken med det hela är att det ska gå att säga något om signalvärdet s[k] innan detta värde har observeras i sekvensen, baserat på de n senaste signalvärdena som har observerats. En kommentar I princip finns det inget som kräver att signalen måste vara tidsdiskret och inte heller att ett ändligt antal, n, sampel används för prediktionen. Det är emellertid det enklaste och naturligaste ansatsen och därför det som vi kommer att hålla oss till i detta kapitel. I vilken mån prediktionen blir bra eller dålig beror dels på n, generellt bör prediktionen bli bättre ju större n är, dels på hur regelbundet signalen s[k] varierar. Om s varierar relativt långsamt och utan plötsliga hopp fram eller tillbaka bör det gå att gissa ett framtida värde baserar på tidigare kända värden. Om signalen stället varierar mer eller mindre slumpmässigt är det omöjligt att prediktera dess nästa värde i en sekvens. Generellt kan prediktion beskrivas som att vi ur s[k] vill generera en predikterad signal sp [k]: sp [k] = H{s[k]}, (D.1) där H enbart beror av signalvärdena s[k − 1], s[k − 2], . . . , s[k − n]. Prediktion kan göras på många olika sätt, dvs. det finns många olika sätt att beskriva H som har denna egenskap. Det vi ska göra här är att undersöka en enkel klass av prediktorer som kan beskrivas som LTI-system. Eftersom vi har att göra med tidsdiskreta signaler och system så betyder det att sp [k] kan skrivas som en faltning mellan s[k] och systemets impulssvar h: sp [k] = (p ∗ s)[k] = n X h[l]s[k − l]. (D.2) l=1 I det här fallet kommer h att ha egenskapen h[k] = 0 för k ≤ 0 och k > n, vilket motsvaras av ett FIR-filter av längd n, se avsnitt 5.2.1. Det predikterande systemet H bestäms alltså av de n samplen i dess impulssvar: h[1], . . . , h[n]. I detta sammanhang brukar dessa även kallas för prediktionskoefficienter och frågan vi ställer oss är: hur bestämmer vi koefficienterna? Det vi ska göra här är undersöka en metod som bygger på att signalen s[k] inte är en helt slumpmässig signal, utan verkligen har den informationsbärande egenskap som introducerades i kapitel 1, dvs. det finns någon typ av systematik i hur s[k] varierar även om det inte nödvändigtvis betyder att det exakt går att prediktera signalen med ett LTI-system. Metoden bygger på att vi kan bestämma, eller i alla fall skatta, specifika statistiska egenskaper för s[k]. För att göra det antar vi att vi har tillgång till en representativ sekvens av signalen s[k], med m sampel, där m gärna får vara så stor som är praktiskt möjligt. Att sekvensen är representativ betyder att den ska innehålla alla de typer av variationer vi förväntar oss att observera i signalen. Denna sekvens använder vi för att skatta prediktionskoefficienterna, vilka sedan kan användas på nya sekvenser av samma signal för att prediktera framtida okända värden. 123 För att bestämma prediktionskoefficienterna (impulssvaret) i h[k] undersöker vi prediktionsfelet, skillnaden mellan prediktionen sp [k] och den verkliga signalen s[k]: d[k] = s[k] − sp [k]. (D.3) Vi behöver vi även definiera en specifik felfunktion eller kostnadsfunktion , som anger hur stort prediktionsfelet är över de m samplen: m m X X s[k] − s [k] 2 , d[k] 2 = (D.4) = p k=1 k=1 där vi summerar över de m samplen i d[k]. Om prediktionen är bra kommer sp [k] ≈ s[k] för de flesta av alla de m samplen. Vi vill välja prediktionskoefficienterna h så att blir så liten som möjligt. Det visar sig att detta problem kan formuleras som ett minsta-kvadratproblem, som kan lösas med vanliga metoder för denna typ av problem. Det är detta vi ska titta på härnäst. Vi börjar med att formulera om (D.4) genom att sätta in (D.2), vilket leder till 2 2 m n m n X X X X s[k] − s[k] − (D.5) h[l]sk [l] . = h[l]s[k − l] = l=1 k=1 k=1 l=1 Här är sk ett avsnitt ur signalen s[k] med n sampel, som startar vid sampel k − 1 och slutar vid sampel k − n. Notera att samplen räknas upp “baklänges” i tiden, eftersom faltning innebär att den ena funktionen ska speglas i tiden. För varje k är sekvensen sk lika lång som sekvensen med prediktionskoefficienter, h. Vi kan därför se både h och sk som vektorer, här betecknade med h, sk ∈ Rn , och utnyttja att den inre summan i (D.5) är skalärprodukten mellan dessa vektorer: m X (D.6) = ks[k] − sk · hk2 . k=1 Summan i (D.6) har m termer, en för varje sampel i s[k] ska predikteras. Vi kan uttrycka hela denna summa som normen i kvadrat mellan två vektorer i RK : > 2 > 2 s[1] s1 h s[1] s1 s[2] s>2 h s[2] s>2 (D.7) = . − . = . − . h .. .. .. .. > > s[m] sm h s[m] sm Givet detta resultat kan vi definiera en vektor b ∈ Rm och en m × n matris A som > s1 s[1] s> s[2] 2 A = . b = . , . .. . > sm s[K] (D.8) Varje element i b är ett sampel från s[k] som ska predikteras och motsvarande rad i A innehåller de n föregående samplen från vilka prediktionen görs. Felfunktionen kan nu skrivas = k b − A h k2 . (D.9) Vi har nu skrivit om kostnadsfunktionen som skillnaden mellan en känd vektor b ∈ Rm och produkten av en känd m × n matris A med den okända vektorn h ∈ Rn . Att bestämma den vektor h som minimerar är ett problem känt från linjär algebra kallat minsta-kvadratproblem. Vi härleder inte lösningen1 utan påminner enbart att den h som minimerar måste uppfylla den så kallade normalekvationen som hör till detta problem: A> A h = AT b. (D.10) Det som återstår är att lösa ut h ur normalekvationen i (D.10). Enligt avsnitt A.1.6 behöver vi då försäkra oss om att A har rang ≥ n, vilket leder till den unika lösningen: h = (A> A)−1 A> b. Vi sammanfattar dessa resultat med att vi behöver 1 Se lämplig kursbok i linjär algebra. 124 (D.11) 1. m kända sampel ur sekvensen s[k]. Dessa motsvarar tillsammans vektorn b ∈ Rm . 2. m kända vektorer sk ∈ Rn . Dessa motsvarar tillsammans m × n matrisen A (vektorerna sk ligger i matrisen rader). Ur dessa kända storheter kan vi, om A> A är inverterbar, bestämma prediktionskoefficienterna h med hjälp av (D.11). För varje k hör sampel s[k] och vektorn sk ihop och tillsammans utgör de en sekvens om n + 1 sampel ur den tidsdiskreta signalen s. Det sista samplet i denna sekvens predikteras av de n föregående samplen. De m samplen av s[k] med tillhörande sk kan vara tagna var som helst i signalen, men kan enklast ses som tagna ur en sammanhängande del som är m + n sampel lång. För att ge en bra prediktion måste vi även anta att m och n är valda med omsorg. /m kan ses som en skattning av väntevärdet i kvadrat av felet mellan s[k] och dess prediktion sp [k] (varians). Denna skattning bli bättre och bättre ju större m är, varför vi bör välja m så stor som är praktiskt möjligt. Om allt annat är fixt så kommer att bli mindre (eller lika) när n växer. Därför kan det vara lockande att även välja n så stort som praktiskt möjligt, men det är inte säkert att det är en bra strategi. Varje prediktion som ska göras innebär en beräkning av en skalärprodukt mellan två vektorer som är n-dimensionella, en beräkning som har en kostnad som ökar linjärt med n. För det andra så är det inte säkert att minskar särskilt mycket om n görs större. Det kan vara så att egenskaper i signalen s[k], t.ex. att den innehåller brus, gör att inte kan reduceras under en viss nivå. När n har valts så att kommer nära denna nivå kan den inte att bli mycket mindre även om n görs större. Då är det bättre att välja ett n som reducerar till i närheten av denna minsta nivå, men inte större. D.1 Tillämpningar Det finns gott om tillämpningar när prediktion, prognostisering eller förutsägelser kan vara till nytta. Inom ekonomi finns det många fördelar med att kunna förutsäga olika typer av kurser eller köp-sälj-beteenden baserat på kända tidigare värden (sampel) av tidsdiskreta signaler som exempelvis representerar antal sålda varor per tidsenhet. Ett annat exempel är inom logistik där prognoser för hur mycket av olika varor som behövs hållas i lager vid en viss tidpunkt kan vara till stor fördel. I dessa och andra exempel kan prediktionen behöva generaliseras så att prediktionen av en specifik signal s baseras delvis på tidigare kända värden av signalen s men även på andra korrelerade signaler. Exempelvis kan medelpriset på en aktie en viss dag beror på dess medelpris under tidigare dagar, men även av priset på andra relaterade aktier, liksom av priset på en viss råvara. Prediktionen måste inte vara baserad på alla n tidigare sampel som föregår det som vi vill prediktera. Exempelvis kan efterfrågan på en säsongsvara (exempelvis glass) en viss månad vara mindre beroende av efterfrågan de närmast tidigare månaderna som av efterfrågan samma månad året innan. D.1.1 Digital överföring av ljud En specifik tillämpning för prediktion är inom överföring av en ljudsignal, från en sändare till en mottagare. Sändaren får en ljudsignal, x(t), exempelvis från en mikrofon, och överför den till mottagaren som spelar upp ljudet i en högtalare. Nästan alla moderna typer av system som kommunicerar på det viset är i grunden digitala, och överför tidsdiskreta signaler. Det innebär att ljudsignalen som ska sändas först måste överföras till en tidsdiskret version genom att den samplas på det sätt som beskrivs i avsnitt 6.1. Resultatet blir en sekvens av sampel, x[k], som alla representeras med binära tal, ett visst antal antal nollor och ettor per sampel. Denna digitala signal kan sedan överföras till mottagaren, enligt vad som beskrivs i avsnitt C.2, som ur x[k] slutligen rekonstruerar den tidsdiskreta signalen x(t) enligt avsnitt 6.2 och spelar upp den i högtalaren. Se figur D.1 för en illustration. Denna beskrivning för överföring av ljud är, på grundläggande nivå, vad som händer när du pratar i din mobiltelefon. Mobiltelefonen har en mikrofon som generar signalen x(t), den samplas vilket ger x[k], vilken kan representeras med en sekvens av nollor och ettor. Denna digitala signal överförs till mottagaren, i det här fallet den basstation för mobiltelefoni som finns i närheten av din mobiltelefon. Basstationen skickar den digitala sekvensen vidare till en annan basstation nära den mobiltelefon du pratar med. Denna basstation sänder över den digitala signalen till mottagarens mobiltelefon, som slutligen rekonstruerar ljudsignalen och spelar upp den i telefonens högtalare. I det system som illustreras i figuren antas att samplingen (ADC) sker idealt, vilket i praktiken innebär att det kvantiseringsbrus som beskrivs i avsnitt 6.1.1 är försumbart. Vidare antar vi att överföringen av den digitala 125 Figur D.1: Ett system för digital överföring av ljud från en sändare till en mottagare. signalen, från sändaren till mottagaren, sker utan bitfel; att nollor misstas som ettor eller tvärtom. I praktiken kommer bitfel att inträffa, men genom att lägga till extra information i den digitala signal som sänds över till mottagaren kan felen detektera och de flesta kommer att kunna rättas, varför vi bortser från effekter av bitfel här. Vi antar vidare att rekonstruktionen till x(t) på mottagarsidan (DAC) är ideal, enligt avsnitt 6.2.2. Det kommer att gälla approximativt, och vi bortser därför från den distorsion som beror på att icke-ideal rekonstruktion. I praktiken uppkommer även en fördröjning när signalen ska ta sig från sändaren till mottagaren, men vi antar att fördröjningen är tillräckligt liten för att den ska kunna bortses från. Sammanfattningsvis kommer mottagaren att kunna återskapa, i alla fall approximativt, samma signal x(t) som matas ut till högtalaren som den signal x(t) som genererades av mikrofonen. En viktig faktor för ett system av den typ som beskrivs här är hur många bitar per sekund som kan skickas från sändaren till mottagaren. Om de approximationer som beskrivs ovan ska gälla behöver samplingen ske med relativt många bitar, så att kvantiseringsbruset reduceras till rimlig nivå. Alltså kan det krävas att relativt många bitar per sekund överförs för att kvaliteten på det mottagna ljudet ska bli acceptabel. Det transmissionssystem som ska överföra ljudet har emellertid en begränsad kapacitet vad gäller bitar per sekund. Ju fler bitar per sekund som ska överföras, desto kortare blir samplingstiden T för den digitala signalen. Det betyder att de pulser som sänds över kanalen behöver bli kortare, men även att de frekvenser ω0 och ω1 som används av frekvensmodulationen i avsnitt C.2.1 måste bli högre. Det finns praktiska begränsningar för hur högra modulationsfrekvenser som kan användas, vilket då även begränsar hur många bitar som kan överföras per sekund. En basstation för mobiltelefoni ska dessutom kunna kommunicera med flera mobiltelefoner samtidigt och alla dessa kommer att dela på den tillgängliga kapaciteten av bitar per sekund som basstationen kan hantera. Sammanfattningsvis finns det också ett behov av att hålla överföringshastigheten (bitar per sekund) så låg som möjligt. Ett sätt att möta båda dessa krav på överföringshastighet är att på något sätt komprimera den information som ljudsignalen innehåller, innan den skickas från sändaren till mottagaren. En metod för att göra det är prediktiv kodning som går ut på att ljudsignalen relativt enkelt kan predikteras och att det enda som då behöver skickas över är prediktionsfelet, vilket i allmänhet kräver färre bitar per sekund för att uppnå samma ljudkvalitet. Se figur D.2 för en illustration av prediktion av en ljudsignal med n = 10. Notera att prediktionsfelet är av storleksordningen 10% av signalen x[k]. En kommentar Att prediktionsfelet är signifikant mindre än själva signalen skulle felaktigt kunna tolkas som att det innehåller mindre information än signalen. Det är precis tvärtom! I det här fallet innehåller signalen x[k] en viss redundans, vilket är det som låter oss prediktera dess framtida värden med god noggrannhet. Prediktionsfelet innehållet mycket information om signalen eftersom det berättar hur prediktionen måste korrigeras för att bli helt rätt. Den variant av prediktiv kodning som har potential att verkligen reducera antalet bitar som sänds över kallas förstörande prediktion. För att förstå hur det fungerar behöver vi först titta på förlustfri prediktion. 126 Figur D.2: Överst: en tidsdiskret ljudsignal x[k], där samplen ligger mycket tätt och inte syns tydligt. Mitten: prediktion av x[k] baserad på de n = 10 föregående samplen. Nederst: prediktionsfelet i detta fall. förlustfri prediktiv kodning Ett system som använder sig av förlustfri prediktiv kodning visas i figur D.3. Den tidsdiskreta signalen x[k], som innehåller sampel av den tidskontinuerliga signalen x(t), är insignal till sändaren. Istället för att helt enkelt sända de bitar som motsvarar dessa sampel innehåller sändaren en prediktor som från de n senaste samplen predikterar nästa sampel i sekvensen, den predikterade signalen. Denna jämförs sedan med den verkliga signalen och skillnaden mellan dem, prediktionsfelet, är den tidsdiskreta signal som skickas över till mottagaren. Även mottagaren har en prediktor, identiskt med den som sändaren använder, som kan prediktera nästa sampel i sekvensen. Även här uppstår ett prediktionsfel, och eftersom mottagaren tar emot just detta fel, kan det adderas till den predikterade signalen vilket genererar den signal x[k] som matades in i sändaren. Notera att sändaren innehåller ett framåtkopplat system. Det enda som har hänt så här långt är att i den översända signalen ersätt x[k] med prediktionsfelet, vilket låter sändaren återskapa x[k] ur dess egen prediktion. För att fungera väl behöver prediktionsfelet representeras med ungefär lika många bitar per sampel som x[k] tidigare överfördes med. Om prediktionsfelet representeras med få bitar innebär det att när mottagaren ska bestämma x[k], genom att addera prediktionsfelet, så uppstår en distorsion, ett brus som överlagras på utsignalen och som hörs i högtalaren. Felet beror på att den predikterade signalen som finns hos sändaren och mottagaren tillåts att avvika godtyckligt mycket från varandra. Felet kommer att ackumuleras över tiden, så om inte medelvärdet av felet är = 0 kan den rekonstruerade signalen på mottagarsidan “driva iväg” och så småningom blir hur olik x[k] som helst. Detta kan i princip hända även om många bitar används för att representera prediktionsfelet. Vi har alltså ännu inte minskat överföringshastigheten för det totala systemet som överför ljudet. För att göra det behöver vi använda förstörande prediktion. 127 Figur D.3: Sändare och mottagare som bygger på förlustfri prediktion. Systemet som betecknas Digital överföring motsvaras av den modulation, överföring genom en kanal och demodulation som beskrivs i avsnitt C.2. Figur D.4: Sändare och mottagare som bygger på förstörande prediktion. Förstörande prediktiv kodning Begreppet “förstörande‘” innebär inget värre än att vi tillåter att prediktionsfelet representeras med ett färre antal bitar än vad som är nödvändigt för att förlustfri kodning ska fungera väl. Enligt vad som beskrivit ovan är en konsekvens av detta att den rekonstruerade signalen kommer att innehålla en mer eller mindre stort avvikelse (distorsion). Detta kan emellertid hanteras med den modifikation av sändarsidan som visas i figur D.4. Notera att mottagaren fungerar på samma sätt som vid förlustfri prediktion. Mottagaren är emellertid modifierad och innehåller nu en återkoppling: prediktionsfelet adderas till den signal från vilken prediktionen görs. Vi förstörande prediktiv kodning sker en (om)kvantisering av prediktionsfelet, vilket i detta fall innebär en reducering av antalet bitar som representerar prediktionsfelet. Exempelvis, om signalen x[k] har 8 bitar per sampel skulle prediktionsfelet kunna reduceras ned till 2 bitar per sampel. Det ger en reduktion av antalet bitar som måste överföras per sekund med en faktor 4. Detta “förstörda” prediktionsfel ska sedan användas på mottagarsidan för att återskapa x[k]. Om prediktionsfelet som bestäms på sändarsidan enbart är baserat på en prediktion utifrån tidigare sampel som observerats av sändaren kommer detta att fungera dåligt, enligt tidigare diskussion. Men om det fel som skickas till mottagaren både innehåller prediktionsfelet och det fel som beror på kvantiseringen blir det emellertid möjligt att få det hela att fungera även med få bitar i prediktionsfelet. Den prediktion som sändaren beräknar är vid förstörande prediktiv kodning identisk med den som sker på mottagarsidan, dvs. prediktionen kompenseras med aktuellt prediktionsfel som i det här fallet har ett visst mått av distorsion. Det betyder att utsignalen från prediktorn på sändarsidan kommer att bli identiskt med utsignalen från prediktionen på mottagarsidan. Det fel som beräknas och sedan kvantiseras innan det skickas till mottagaren kan därför sägas vara en summa av det “vanliga” prediktionsfelet som beror på att vi inte alltid kan prediktera en signal med stor noggrannhet och ett fel som beror på att prediktionen skett från en delvis förvrängd signal eftersom den kompenserats med ett förvrängt (förstört) prediktionsfel. Genom att återkoppla det kvantiserade prediktions128 felet på mottagarsidan kan alltså ett fel beräknas som även tar hänsyn till att kvantiseringen introducerar en slags förvrängning. Ett system baserat på förstörande prediktiv kodning kommer alltid att introducera ett visst fel i den rekonstruerade signalen på mottagarsidan (därav förstörande kodning) men detta fel kan begränsas genom att det kompenseras för vid prediktionen även på sändarsidan. Det skulle i princip räcka med att representerar prediktionsfelet med en eller ett par bitar som kan ange om x[k] ökar, minskar eller är ungefär konstant, även om signalen x[k] representeras med betydligt fler bitar. För att fungera väl krävs då också att det är möjligt att prediktera x[k] med lågt prediktionsfel. För ljudsignaler som representerar “vanligt ljud”, som tal och musik, är detta möjligt för rimliga värden på n, exempelvis n = 10. Kompression av ljudsignaler baserad på förstörande prediktiv kodning är därför en vanlig metod för system av digital ljudöverföring. D.1.2 I praktiken Den beskrivna kompressionsmetoden är en av flera tekniker som används av avancerade system för hantering av digitalt ljud, men inte bara för mobiltelefoni. Som nämndes i inledning av kapitel C kan vi se system för överföring av digitala signaler antingen som överföring genom rummet eller genom tiden, eller båda. Även system som lagrar digitalt ljud, exempelvis MP3-spelare bygger på olika metoder för prediktiv kodning, som i grunden fungerar enligt de principer som beskrivits här. All överföring av ljud över internet, exempelvis Skype eller Spotify, använder även de prediktiv kodning. Metoden kan även generaliseras till signaler som utgörs av bilder, och blir då aktuella för digital lagring och överföring av bilder och video. Att du kan titta på DVD-filmer, Youtube-klipp och på Netflix beror på att mängden bitar kan behöver överföras eller lagras effektivt kan reduceras med hjälp av prediktiv kodning. 129 130 Litteraturförteckning [1] IEEE Transactions on Signal Processing, Aims & Scope:. http://ieeexplore.ieee.org/xpl/ aboutJournal.jsp?punumber=78#AimsScope. [2] Nationalencyklopedins ordbok, 2004. [3] Roland Priemere. Introductory Signal Processing. World Scientific, 1991. Tillgänglig genom Google Books. [4] Priyabrata Sinha. Speech Processing in Embedded Systems. Springer, 2010. 131 Sakregister överlagring, 23 ADC, 17, 18, 85 adderare, 23 additivt brus, 114 allpassfilter, 75 amplitud, 55 amplitudkarakteristik, 58 argumentet, 102 bandbegränsad signal, 66 bandbredd, 77 bandpassfilter, 76 bandspärrfilter, 77 bas, 100 begränsad signal, 22 BIBO-stabilt system, 48 binär signal, 15 bipolär modulation, 116 bithastigheten, 15 BP-filter, 76 brytfrekvens, 76 BS-filter, 77 centerfrekvensen, 77 cosinusfunktion, 55 DAC, 17, 18, 88 demodulation, 118 derivator, 25 deriverare, 25 detektion, 73 digital-till-analog-omvandlare, 88 enhetspulsen, 106 enhetssteget, 105 enkla system, 19 envelopp, 117 fördröjning, 24 förlustfri prediktion, 126 förstärkare, 24 förstörande prediktion, 126, 127 faltning, 46 fas, 55 fasförskjutning, 57 faskarakteristik, 58 felfunktion, 124 filterkoefficienter, 79 Finite Impulse Response Filter, 79 FIR-filter, 79 fouriertransformen, 60, 67 frekvens, 55 frekvensfunktion, 58 frekvenskomponenter, 66 frekvensmodulation, 117 frekvensselektivt filter, 73 funktional, 109 gränsfrekvens, 75 högpassfilter, 76 Hermiteska funktioner, 68 homogen lösning, 104 HP-filter, 76 hysteresstyrning, 30 icke-kausalt system, 48 icke-kommuterande sysem, 28 icke-linjärt system, 33 ideal sampling, 88 ideala impulsfunktionen, 108 IIR-filter, 79 imaginära enheten, 102 imaginärdel, 102 impulsfunktionen, 108 Infinite Impulse Response Filter, 79 inhomogenea lösningen, 104 inre tillstånd, 10 insignaler, 10 integrator, 26 integrerare, 26 interpolation, 19 interpolationsfunktion, 90 inversa fouriertransformen, 60, 70 inversa systemet, 62 kanal, 114 kartesisk representation, 102 kaskadkoppling, 28 kausalt system, 48 kommuterande system, 28 132 komplexkonjugat, 103 koordinater, 100 kostnadsfunktion, 124 kvantisering, 86 kvantiseringsbrus, 87 kvantiseringsintervall, 87 lågpassfilter, 75 lagringskanal, 114 linearisering, 37 linearlisering, 37 linjär ODE, 31 linjär transformation, 99 linjärkombination, 99 linjärkombination av två LTI-system, 43 linjärt och tidsinvariant system, 42 linjärt system, 33 LP-filter, 75 LTI-system, 42 magnituden, 102 matchande filter, 82 meddelanden, 15 minsta kvadratproblem, 101 minsta-kvadratproblem, 124 modulation, 115 modulerad Gauss-funktion, 112 multiplikator, 24 närmsta-granne-interpolation, 88 nedsampling, 95 nollvektorn, 99 normalekvationen, 101, 124 normerad vektor, 100 Nyquist-frekvensen, 71, 93 obegränsad signal, 22 olinjärt system, 33 omsampling, 95 ortogonala vektorer, 100 partikulära lösningen, 104 passband, 76 polär representation, 102 prediktionsfelet, 124, 127 prediktionskoefficienter, 123 prediktiv kodning, 126 prediktor, 123 sampel, 14 samplare, 85 sampling, 15, 85 samplingsperioden, 85 samplingsteoremet, 92 seriekoppling, 28 signaler och system, 11 signalrum, 21 spärrband, 76 stationär lösning, 104 stegfunktionen, 105 subtraherare, 24 superposition, 23 systembeskrivande ekvation, 31 systemmodeller, 22 tidsdiskret system, 15 tidsdiskreta fouriertransformen, 67 tidsdiskreta signal, 14 tidsinvarianta system, 38 tidskonstant, 52 tidskontinuerlig signal, 14 tidskontinuerliga fouriertransformen, 60 tidskontinuerliga inversa fouriertransformen, 60, 70 tidskontinuerligt system, 15 tidsvariabel förstärkare, 24 tidsvariant system, 38 tröskling, 37 transducer, 25 transmissionskanal, 114 transponatet, 101 trunkering, 85 unipolär modulation, 116 uppsampling, 95 utsignaler, 10 vektorrum, 99 vikning, 68 vikningsdistorsion, 94 vinkelfrekvens, 55 rangen för matrisen, 101 realdel, 102 regulator, 32 rekonstruktion, 15, 18, 85 rekonstruktionsfunktion, 90 residualvolymen, 31 resonans, 48 133
© Copyright 2025