Adott a régi vicc:

- Hány veréb fér fel egy két tonna teherbírású teherautóra?
- Egy darab két tonnás vagy két darab egy tonnás!


    Már korábban spekuláltam azon, hogy kéne írni a témakörről, de aztán úgy gondoltam, hogy ezek a kérdések nekünk még a nyolcvanas években érdekesek lehettek, a mai szintetizátor használók számára már kevéssé izgalmasak. Azonban azt látom, hogy mégis elég gyakran keresnek bennünket konkrétan ezzel a területtel kapcsolatos kérdésekkel, meg aztán a számítógépes zeneszerkesztésen szocializálódott emberek számára nem is mindig könnyű ezeket a fogalmakat mihez kötni.


    Kiindulásként nézzük egy ősi monofonikus szintetizátor végtelenül leegyszerűsített Móricka rajzát:   
   A régi analógoknál a billentyűzet érintkezői egy ellenálláslétra osztópontjaira vannak rákötve. A nagyon kis tűrésű ellenállásokat úgy építették be az osztóba, hogy amikor egy adott billentyűt lenyomunk, akkor az adott osztópontról az oszcillátor vezérlő bemenetére jutó feszültség pontosan az adott zenei hang frekvenciáját állítsa elő. Ez a jól ismert CV (feszültségvezérlés), ami lehetővé teszi, hogy ne csak a saját keyboardról, hanem külső forrásból is vezérelhessük az oszcillátorunkat. Egy VCA (feszültségvezérelt oszcillátor) bemenetéra azonban értelemszerűen egyszerre csak egy feszültségszintet juttathatunk, tehát ez a szintetizátor kőkeményen monofonikus, vagyis egyszerre csak egy hangot képes megszólaltatni. A fenti rajzon a billentyűzettől az oszcillátor felé azért rajzoltam két nyilat, mert az egyik a CV feszültséget jelképezi, a másik pedig a "Gate" vagyis kapuzó jelet. Ez utóbbi arra hivatott, hogy a billentyű lenyomásakor indítsa el a burkológörbe generátor  (ADSR) működését, legalábbis az "ADS" szakaszokét, felengedéskor pedig az "R" szakaszt, vagyis a lecsengést, majd adott idő elteltével zárja le a kimenetet. Ebből a sémából tehát nem lehet polifonikus, vagyis egyidejűleg több zenei hangot is megszólaltató hangszert kialakítani. A megoldást a digitális vezérlés hozta. A következő ábrán egy alapvetően analóg hangkeltésű, de digitális vezérlésű hangszer (még az előbbihez képest is jobban leegyszerűsített) vázlatát próbáltam felskiccelni.
A kis sárga kockák nagyjából a fenti ábra szintén sárgával jelölt blokkját jelentik, azzal a különbséggel, hogy az effekt egység kikerült az egyedi hangkeltő blokkból, és egységesen hat az oda már összekeverve érkező jelekre. Nyolc kis kockát rajzoltam, vagyis nyolc oszcillátor szólhat egyidejűleg. A régi szintikben ezek a hangkeltő egységek mindig jól elkülönülnek, akkor is, ha egy áramköri lapon kaptak helyet. Ebben a rendszerben a billentyűzetet lekezelő elektronika kap nagyon fontos szerepet. A digitális vezérlésű szintetizátorokban a billentyűk alatti kontaktusokat diódákkal mátrixba rendezik, és a kiolvasó processzor nagyon sűrűn átszkenneli ezt a mátrixot. A CPU egy belső "adminisztrációs rendszert" vezet, mely tartalmazza, hogy éppen melyik billentyűt nyomtuk meg, illetve ha felengedjük az adott billentyűt, akkor törli az ahhoz tartozó bejegyzést. Valamilyen mechanizmus szerint figyeli vagy kötötten vezérli a nyolc oszcillátor állapotát. Ha lenyomunk egy billentyűt, akkor az első szabad oszcillátorhoz irányítja az ahhoz tartozó, digitálisan előállított CV jelet. Természetesen elindítja a burkológörbe generátort is. Hogy ezt a processzor végzi-e, vagy programozható számláló IC-k vannak erre befogva, az részletkérdés. Ahogy nyomkodjuk a billentyűket, ez a folyamat ismétlődik. Bizonyos szintikben, például a KORG PolySix-ben LED jelzi, hogy melyik oszcillátorok élnek éppen. Ez szervizszempontból roppant praktikus. Addig nincs is baj, amíg a rendszer talál szabad oszcillátort. Azonban kétkezes játéknál könnyen előfordul, hogy nincs már  egy sem szabadon. Ilyenkor azt mondjuk, hogy elfogyott a polifónia. A legtöbb hangszerben ebben az esetben a vezérlő az időben legrégebben megszólított oszcillátort fogja leállítani, és felszabadítva átadni a frissen leütött hangnak.   
     Ezt a mechanizmust a korai digitális hangkeltésű  (pl. FM) hangszerekbe is átültették. Azokban persze már nem vacakoltak CV jelekkel, és a hangkeltő egységek sem különülnek el a panelen, hiszen gyakran egy IC az egész hanggenerátor. Mindössze annyit csináltak, hogy digitális jelutak hardver kialakításában és azok vezérlésében követték a fenti sémát. Beszéltem egyik bejegyzésben a jó öreg KORG 707-ről, ott is hasonló rendszer működik, a maximális polifónia nyolc. Van azonban egy érdekes újdonság az említett hangszerben, ami ebben és a nagyobbik tesójában, a DS-8 - ban volt tettenérhető először a KORG-nál. A multitimbralitás
Az analóg hangkeltésű hangszereknél a hanggenerálás egységeit azonos paraméterekkel vezéreljük. A fenti rajzról ugyan nem derül ki, de a burkológörbék, a szűrők és a modulációs vezérlések paramétereit minden hangkeltő blokk azonos módon kapja meg. Azért is macera ezeknek a hangszereknek a szervizelése, mert tökéletesen egyformán is kell a vezérlő jelekre reagálnia valamennyi egységnek, és ez csak hosszadalmas kalibrációs folyamattal érhető el. A digitális hangkeltésű szintik esetében a vezérlés lehetővé teszi, hogy a chipekben megvalósított virtuális hangkeltő egységeket külön-külön is paraméterezzük, vagyis eltérő preseteket rendeljünk hozzájuk. Képzeljük el, hogy a nyolc hangkeltő egységből háromhoz mondjuk egy "String" hangszínt rendelünk, a fennmaradó öthöz pedig mondjuk "Piano"-t.
    Eljutottunk tehát a multimbrális szintetizátorhoz. Nagyon egyszerűen úgy tudjuk meghatározni, hogy egyidejűleg több hangszín preset megszólaltatására alkalmas hangszerről van szó. A multitimbralitásnak komoly gyakorlati hasznát vesszük:

  • Több felé oszthatjuk a billentyűzetet (SPLIT). A fenti példát tekintve például a billentyűzet alsó részére kerülhet a string, a felsőre a zongora.
  • Egymásra rétegezhetünk hangszíneket (LAYER). Ilyen esetben praktikus ugyanannyi polifóniafokot hagyni az egymásra rétegezett hangszíneknek.
  • Megtehetjük, hogy a kettő (vagy több) aktív hangszínhez külön midi csatornákat rendelünk, és közülük csak egy azonos a billentyűzet adó csatornájával. Ezen játszunk tehát valójában, a többi megszólaltatása külső vagy belső szekvencerről történhet.
  • A fentieket tetszés szerint kombinálhatjuk, így adódnak a mai szintetizátorokban található fejlett rétegezési lehetőségek, gondoljunk pl. a KORG hangszerek "Combi", vagy a Roland szintik "Performance" beállításaira. A színpadi zenészek ragyogóan előkészülhetnek a produkciókra nagyon komplex beállításokkal is.
     

    Azért színeztem a billentyűzetvezérlő blokk kimeneti részeit is eltérő módon, hogy jelezzem, ilyenkor ennek az egységnek a beállított üzemmódnak megfelelően kell a hangkeltő egységek menedzselését végezni, intelligens módon kell tudnia kezelni a mindenkori helyzetet.

    Láthatjuk, hogy miként határozza meg a polifónia fokát (vagyis az egyidejűleg megszólaltatható hangok számát) a hardver és a vezérlő szoftver kialakítása. A multitimbralitás foka, tehát az egyidejűleg megszólaltatható KÜLÖNFÉLE hangszínek száma ebből következően nem haladhatja meg a polifónia fokát.
    A fentiek ismeretében már könnyebben értelmezhetjük konkrét hangszerek paramétereit, illetve a paramétermegadás "érdekességeit". Vegyünk például egy olyan "ACME" szintit, aminek 16 a multitimbralitása, és a gyártó 64-es polifóniát ad meg. A 16-os multimbralitás általánosan elterjedt, mivel így a MIDI adta lehetőségeket kényelmesen kihasználhatjuk. A 64-es polifónia elvileg bőségesen elég. Azonban mégis kipukkaszthatjuk, ha nem figyelünk. Mert ha például egy olyan layert képezünk, melyben egymásra rakunk 8 hangszínt, akkor a 64-es polifóniánk összeesett nyolcra, és ez már nem túl sok. Bizonyos esetekben a "sima" alap hangszíneknél is úgy tűnhet, mintha elveszítenénk hangokat. Miként lehet ez? A legtöbb gyártó az alaphangszínek összeállításához is lehetőséget ad arra, hogy több "oszcillátort" használjunk fel. (Nem szeretem ezt a szóhasználatot a PCM szintéknél, mert nem valódi oszcillátorokról van szó, hanem a PCM mintákat "ledaráló" kis alapegységekről). Elterjed, hogy egy alaphangszínhez 1, 2 vagy 4 "oszcillátort" használjunk fel, de vannak sokkal többet megengedő gyárak is. A KORG például teljesen korrekt, amikor az EDS szintézissel működő népszerű M-50 szintire a következő specifikációt adja:
   
Maximum Polyphony
80 voices, 80 oscillators max, single mode
40 voices, 80 oscillators max, double mode*
* The actual maximum polyphony will vary depending on oscillator settings such as stereo multisamples and velocity crossfading.

   Néha megkérdezik tőlem, hogy tulajdonképpen minek is a mai hangszerekben ez a sok (64, 80, 128) polifónia, mikor korábban a 16 és 32 polifóniájú szintetizátorokkal is jól el lehetett boldogulni. Nos, azért a bőséges polifónia sohasem árt. Már persze, ha nem megy a hangminőség rovására. Néha ugyanis érezhető volt, hogy a polifónia jelentős növelése egy adott gyár korábbi hangszereihez képest azt eredményezte, hogy a PCM jelfeldolgozásban minőségi kompromisszumokat hoztak, azt pedig a zenészek nem szeretik. A magas polifónia viszont nagyon kell:

  • Ha nagyon összetett hangzásokat rakosgatunk össze
  • Workstation-nel dolgozva vagy külső szekvencerrel, számítógéppel dolgozva, különösen nagy, "szimfonikus" hangszereléseket használva
  • Zongorázáshoz

    Utóbbi dolog kicsit magyarázatra szorul. Egyik ismerősöm azzal érvelt, hogy egy embernek csak tíz ujja van, miért kéne ennél magasabb polifóniafok egy zongorához? A gyakorlatban pedig tudjuk, hogy 16 fokú tényleges polifónia is kevés szokott lenni. Ha egy gyorsabb futamot játszunk, a 16 hangot pillanatok alatt leütjük, az utána leütött billentyűk hangját már csak úgy tudja a hangszer megszólaltatni, hogy a korábbiaktól elveszi a hangot. Így azok a hangok, melyeknek billentyűjét már ugyan elengedtük, de a zongorahang természetéből fakadóan még kicsengési szakaszban vannak, el fognak némulni. Ezt a hatást a digitális hangszerek ellenzői mindjárt setét összeesküvésként értékelik a zongora ellen. Valljuk be, igazuk is van, mert hiába használ szépen mintavett hangokat a digitális zongora, ha egy virgásabb résznél elnémulnak a lecsengő hangok, az bizony nagyon elrontja a hatást, és ezt nem lehet jó zengető processzorral kompenzálni. A jó minőségű zongora reprodukcióhoz tehát szükség van a komoly polifóniára. Emellett a gyártók mindenféle ravasz algoritmusokat is bevetnek (nem csak a zongoráknál) annak érdekében, hogy a lecsengő hangok közül is azokat szabadítsák fel szükség esetén, amelyek a legkisebb veszteséget okozzák a hangzásban. Érdekes volt annak idején, hogy a Kurzweil a K2XXX sorozatú hangszerekbe belerakott egy "Stealer" nevű menüpontot, amit aktiválva a kijelzőn követhettük a hangszer bűvészkedését az oszcillátorokkal. A zongorára visszatérve nem lehet kikerülni a sustain pedál használatából következő polifónia igényt sem. Az igazán komoly gyártók olyan hangszereket alkotnak, amelyeknél a pedál használata olyan finoman van beépítve a polifónia menedzselésébe, hogy teljesen természetesen reagál a hangkeltő rendszer a pedál lenyomására, illetve felengedésére ilyen szempontból is.

    Ha szó esett a zongorákról, akkor pár szóval meg kellene emlékezni az orgonákról is. A régi, 1970-1980 körül készült elektromos orgonák hangkeltés szempontjából nem azt a sémát követték, mint a bevezető ábra szerinti szintetizátor. Volt egy alaposzcillátor, melynek jelét úgy osztották le, hogy előállt a 12 fokú kromatikus skála, az egyes hangokhoz tartozó frekvenciákat pedig annyiszor osztották tovább kettővel, ahány oktávnyi hangterjedelem kellett. A hangszer hangterjedelmének összes hangja "szólt" tehát egyszerre, de csak akkor került valami ezekből a jelformáló egységre és azután a kimenetre, amikor a billentyűket nyomkodva rákapuztuk a kívánt hangokat a kimenetre. Ilyen értelemben a hagyományos tranzisztoros és IC-s orgonák teljes polifóniát tudtak, hasonlóan eredeti, sípos őseikhez. Az újabb digitális (PCM vagy modellező) orgonák esetében már ugyanúgy értelmezhető a polifóniafok, mint a szintik esetében.  
    A modellező hangkeltésű szintetizátoroknál is lehet polifóniáról beszélni, de kicsit más megközelítéssel, mint az eddig tárgyalt esetekben. Itt a használt DSP-től és a kiszolgáló szoftvertől függ, hogy mit bír a rendszer. Gyakori, hogy a presetek (vagy alap algoritmusok) mellett megadják, hogy annak konkrétan mekkora a polifóniája. Máskor csak egy "maximális polifónia" értéket adnak meg, amit általában csak nagyon egyszerű hangzásoknál teljesít a hangszer. 
    A szintetizátoroknál találkozhatunk mesterséges polifónia csökkentő megoldásokkal is. Többnyire szintetikus hangszínek esetében lehet praktikus "unison" vagy "detuned monophonic" módot használni, amikor kettő vagy több oszcillátor együtt szól, emiatt vastagabb, zsírosabb hangzást érhetünk el. Persze a polifónia rovására.
   
    Érdemes pár szót a szoftsztintikről is szólni. Azt hihetnénk, hogy itt korlátlan polifóniákkal adják ki a fejlesztők ezeket a programokat. Azonban ez egyáltalán nem így van. Sok monofonikus plugin van. Természetesen ezeket egy host rendszerben (pl. Cubase) használva többet is futtathatunk igény szerint. Vannak aztán kifejezetten nagy polifónia fokú pluginek, például zongora vagy orgona megfejtésekre. Aztán léteznek olyan megoldások is (pl. Halion Sonic), ahol multimbrális és egyben magas polifóniafokú pluginnel dolgozhatunk. A szoftvervilágban egy keretrendszerben futtatott plugin szintetizátoraink összes polifóniájának tényleg csak a rendszer teljesítménye szab határt.

    Nemrég az is felmerült kérdésként, hogy némelyik hangszer esetében mire való a 16-nál magasabb multitimbralitás? Vannak 17, 18, vagy 32 fokra multitimbrális hangszerek. Ilyenkor többnyire arról van szó, hogy a hangszer valamilyen szekciója kétféleképpen is elérhető, pl. két MIDI IN van rajta, vagy az egyik szekció csak billentyűről érhető el, vagy például különálló ritmus csatorna egy szekvenceres hangmodulon, szóval hasonló módon lehet értelmezni az efféle megadást.
 

A bejegyzés trackback címe:

https://bitzenede.blog.hu/api/trackback/id/tr762775148

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

djuice 2011.03.28. 15:06:24

Nagyon jó, kimerítő leírás! Köszönjük szépen!
Ugyan én az index midis fórumán is felvetettem korábban e problémát, most mégis kicsit áttekinthetőbben jöttek rá a válaszok.
Kérdések azonban vannak még:
- Tamás, írod, hogy anno a polifóniákért diszkrét áramköri egységek feleltek. Namost pl. ott a Korg Prophecy, ami jelentős DSP teljesítményt igényelt a fizikai modellezéshez, ellenben ha jól emléxem ő is monofónikus volt. Itt gyakorlatilag akkor már nem beszélhetünk diszkrét oszcillátor egységekről, mindent egy bizonyos DSP kellett lekezeljen nem? Felteszem a későbbi Z1 modell 6 hangig polifónikus mivolta már elérhetővé tett úgymond "6db" Prophecy DSP-t is egy hangszerben, melynek az előd idején valószínűleg magas kifejlesztési költsége szabott túlzott alkalmazási határt. ???
- fentiek tekintetében mikortól lehet tisztán DSP alapú polifóniakeltésről beszélni? Pl. az M1 szintitől? És mellesleg ilyen részletekhez Te a gyártóktól jutottál, vagy külföldi szaklapoktól vetted át?
- a Korg tényleg érdekes, mert korábban a jól ismert 2 hatványai szerint mentek a polifóniaszámok (8,16,32,64 - jó, Rolandnál volt 28 is) és pl. a Tritonnál volt először 62! hang, most az M50-nél 80/40. Erről mit lehet tudni mitől a csonka számok?

Amúgy az egész polifónia kérdést szerintem az is magyarázza miért tisztán és pusztán csak DSP alapú, mert ugye a PC-k hangkártyái csak szoftveresen programozhatók, így az alkalmazott algoritmusokban írják le az oszcillátor modelleket is, amitól egy VSTi utánna képes megszólalni vagy rosszul gondolom?
Mellesleg anno 1995-ben az Emulator IV megjelenésével is beszéltek az akkor sosem látott teljesítményű saját Emu fejlesztésű, ún. "G-chip"-ről, ami először adott 128 hang egyidejű keltésére lehetőséget és a Z-filterek számításaihoz is kötötték, hogy ezt korábbi technológiákkal kivitelezni nem lehetett volna!

djuice 2011.03.28. 15:12:15

Ezt nem hiszem el! Írok 2 oldalt, erre a comment nem jelenik meg az oldal alján, de jobbfent az értesítősávban meg kint van az eleje! Mi történhetett? Most akkor elveszett vagy megvan?

djuice 2011.03.28. 15:13:06

Erre meg megjelenik, pedig másik böngészőből sem nyitotta meg idáig! ???

djuice 2011.03.28. 15:42:46

Még egy eszembe jutott!
Az igazi csoda mégis pl. a régi kis 16 polifóniás (de még a 32-est is ide lehet venni) Yamaha, Roland automatáknál volt, mert ott ugye komplett kíséret mellett még duál-hangszín lehetőséget is kínáltak egyidejűleg való megszólalásban!
(persze nem szólt minden kísérőhangszer egyszerre és polifónikusan, de nagy kunszt lehetett!)

És egy nagyon érdekes dolog a végére!
Sokan prüszkölnek a PC-k audio latencyétől és veszekedni a 3 v. 4 ms-on.
Én hozzátenném, egy M1 esetében, (pláne a DX7 esetében!) hol volt akárcsak 10-ed annyira gyors elektronika, mint ma vagy akár csak 10 éve is egy PC-ben?
Mégis világsztárok játszottak nevezett hangszereken, tömött stadionok előtt gond nélkül. Ellenben ha valaki azt mondja SVlive hangkártyával zenélget otthon, kiröhögik, mondván az nem zenélés, hanem várakozás a latencyre.
Itt említhetők, pl a Clavia hangszerei, amiben állítólag a vasak közt is leggyorsabb hangképzési managelés (legminimálisabb latency) van megvalósítva. Én próbálgattam szimultán több Claviát és melettük, Yamahát, Korgot stb. boltokban és nem hiszem hogy valaki is észrevenne, pláne kihallana 3-4 ms különbséget. Egyszerűen nincs ilyen gyors agya az embernek, hisz akkor egy kilőtt puskagolyót is simán láthatnánk a cső végén előbújni...
De csak ha azt vesszük, egy akusztikus zongora billentyűjének leütése és a fellendülő kalapács húrt való megütése közt is több mint 4ms telik el. ár elnézést hogy ide hozom fel, de valahogy összhangban érzem a kérdést a midi események lekezelését bonyolító DSP fejezetével. (és mint tudjuk a midi egy soros adatáramlás!)

Prophecy · http://www.grapeski.com/ 2011.03.28. 19:15:05

@djuice: az EMU 4-es Ultra szeriaban is a DSP boardok feleltek a polifoniakert, pl az E6400-t 64 hang polifoniaval adtak, az E4XT-t pedig egy plusz DSP boarddal fizikalisan megduplaztak. Igy lett meg a 128 hang.

Ha jol emlekszem az EMUkban jo oreg Motorola chipeket hasznaltak.

Az M1 tipikusan PCM szintetizator volt nem keverendo ossze a Prophecy/Z1 fizikai modellezesevel hiszen ott tulajdonkeppen joval osszetettebb szamitasok futnak a DSP-n mint egy sima PCM hang megszolaltatasakor...

Az az erdekes hogy a Trinity-hez kesobb kijott MOSS board meretben ugyanakkora mint a Plus board, holott az elso a 6hang a masodik monofon.

Egyebkent annyiban meg szeretnelek kijavitani, hogy a Z1 12 hang polifon (18-ra bovitheto). :)

djuice 2011.03.29. 11:03:21

@Prophecy:
természetesen tisztában vagyok vele, hogy a Prophecy fizikai modellezésű volt, csakúgy mint előde a Yamaha VL-1. Arra próbáltam célozni, hogy anno ez az új technológia nagyon nagy számításigényt követelt, ellenben a sima romplayer szintiktől. Azért gondolom, hogy gyakorlatilag ott a hangkeltést egy komplett egységnek véve lehet elképzelni, mint pl. egy régi analóg monofon szintit. A Z1 idejére sokat fejlődött a félvezetőipar, lejjebb csúsztak az árak és így megengedhető volt több párhuzamos hangkeltő (kvázi Prophecy egység) a hangszerbe, feltételezem. Nyilván a konkrét műszaki megoldásait nem ismerem, nem vagyok szervizes, csak következtetek, hogy 1 DSP a fizikai paraméterek bonyolult kiszámítása mellett egy adott hangot bírt már csak megszólaltatni, ezért kellettek a bővítőkártyák, ahogy írod is a Z1 kapcsán...
A cikkben Tamás leírta az oszcillátorblokkokkal való polifóniaképzést, de nyilván ez kb. a 80-as években volt divat. Az érdekel hogy tisztán DSP alapú polifóniaképzésről mióta beszélhetünk. Errefel hoztam föl az M1 példáját, de már a DX7-től is el bírom képzelni e megoldást.
Az Emu ultrák viszont 2000 körül jöttek, ellentétben az első Emulator IV samplerrel, ami 95-ben jelent meg. Az alapból 128 hang polis volt, utána nem sokkal adták ki az e64-et, amit fel lehetett tornázni 128-ra.
Biztos voltak Motorola IC-k is benük, de a hangképzésért a bizonyos G-chip felelt! Ezt több helyen leírták és hogy ez saját tervezés volt elsősorban a Z-filterek miatt. emléxem, a Rolandosok annyival méltatták akkor ezt a samplert, hogy "vannak akik nem sajnálják a pénzt az erőfitogtatásra". Csak mellesleg hangban is megevett az EIV mindenkit szőröstül, bőröstül.