Computationeel modelleren van beat-inductie

Peter Desain (NICI) & Henkjan Honing (ILLC)

[Published as: Desain, P., & Honing, H. (In Preparation). Computationeel modelleren van beat-inductie. In Van frictie tot wetenschap. Jaarboek 1994-1995. Amsterdam: Vereniging van Academie-onderzoekers.]

Inleiding

Computationeel modelleren is een methode in de cognitiewetenschap waarbij een theorie over een specifiek aspect van menselijke mentale vermogens zover uitgewerkt en geformaliseerd wordt, dat het mogelijk is om een implementatie van die theorie in de vorm van een computerprogramma te geven. We zijn daarbij niet zozeer geïnteresseerd in het verkrijgen van een werkend systeem dat een menselijke eigenschap simuleert, maar in de inzichten die het nabouwen van het proces oplevert. Wij gebruiken deze methodiek bij het in kaart brengen van de processen die bij de perceptie van muziek een rol spelen.

Deze methode van onderzoek steunt op drie poten. De psychologie levert de theorieën over de waarnemingsprocessen van de menselijke luisteraar en met name de experimentele psychologie levert de methodes om hypotheses daarover te toetsen. In de informatica zijn de formalismen ontwikkeld om algoritmen te beschrijven en daarover te redeneren. Uit de muziekwetenschappen stammen de theoretische concepten en structurele beschrijvingen van het domein zelf. Hoewel deze niet noodzakelijkerwijs direct te vertalen zijn in cognitieve termen, kunnen zij daar wel gegronde hypotheses voor aandragen. Inzichten uit elke discipline maken muziekcognitie-onderzoek mogelijk en de onderzoeksresultaten zijn op hun beurt vruchtbaar voor de afzonderlijke disciplines. Dit is ook de reden waarom het onderzoek hier gepresenteerd wordt in de vorm van een gezamenlijk verslag. Het onderzoek is het resultaat van de nauwe inhoudelijke samenwerking tussen de het Nijmeegs Instituut voor Cognitie en Informatie (NICI) en de vakgroep Alfa-informatica/Institute for Logic, Language and Computation (ILLC), Amsterdam. Als voorbeeld van dit interdisciplinaire onderzoek beschrijven we de studie naar beat-inductie die op dit moment plaatsvindt.

Beat-inductie is het proces waarbij een regelmatig isochroon patroon, de tel of puls, geactiveerd kan worden bij het luisteren naar muziek. Deze beat, die vaak door musici met de voet meegetikt wordt, is een centraal concept in de verwerking van muziek. Maar ook voor niet-experts blijkt het proces van beat-inductie een fundamenteel aspect van de verwerking, codering en beleving van temporele patronen. Om enkele voorbeelden te geven: de geïnduceerde beat `draagt' de tempo waarneming en het vormt de basis voor de temporele codering van ritmische patronen. Verder bepaalt de beat het relatieve belang van de verschillende noten in ondermeer de melodische en harmonische structuur.

Er zijn verschillende aspecten die beat-inductie tot een proces maken dat niet eenvoudig te modelleren is. Beat-inductie is een snel proces. Na slechts enkele noten kan een sterk gevoel van "beat" of puls door een patroon geïnduceerd worden (een "bottom-up" proces). Na de inductie van een stabiel beat-percept kan deze gaan functioneren als een referentiekader voor de verwerking van nieuwe informatie (een "top-down" proces). Dit referentiekader maakt het mogelijk dat een zgn. syncope waargenomen wordt, als er een beat verwacht wordt op een moment waar geen noot gespeeld wordt - dit introduceert een mate van spanning in een ritme. Dit referentiekader is echter niet geheel rigide. Als er bijvoorbeeld genoeg evidentie is voor een veranderende beat (of metrum) dan zal het oude percept afbreken en een nieuw percept opgebouwd worden. Deze interactie, waarin een beat geïnduceerd wordt vanuit een patroon, maar waarin tevens een reeds geïnduceerde beat de organisatie beïnvloedt van het inkomende materiaal, is moeilijk te modelleren.

Een indicatie van de complexiteit van het proces is misschien wel de hoeveelheid literatuur over beat-inductie en de diversiteit van de formalismen die in de voorgestelde computationele modellen gebruikt worden. In dit artikel zullen we een alles behalve volledige taxonomie van de gebruikte formalismes geven en aangeven hoe zij gebruikt zijn om de verschillende aspecten van beat-inductie te modelleren. Theorieën die geïnterpreteerd zouden kunnen worden als theorieën van beat-inductie maar niet computationeel volledig geformaliseerd zijn laten we buiten beschouwing. Verder zal in het kort recent onderzoek worden beschreven dat zich richt op een vergelijking tussen deze benaderingen. Hoewel er zeker toepassingen van deze theorieën zijn (bijvoorbeeld multimedia en synchronisatie toepassingen in de muziek studio en automatische transcriptie van ingespeelde muziek), staat op het ogenblik in ons onderzoek de fundamentele vraag centraal hoe dit proces zich bij de luisteraar voltrekt.

Aspecten van beat-inductie

Er zijn verschillende aspecten van beat-inductie die beschreven zijn in de muziektheoretische, cognitieve en experimenteel psychologische literatuur. Een aantal eigenschappen kwam reeds aan de orde in de introductie. Beat-inductie is een snel proces, met zowel bottom-up als top-down invloeden. Na enkele noten kan een syncope (een beat die niet met een noot samenvalt) "gehoord" worden - een bewijs dat er reeds beat-inductie heeft plaatsgevonden. Soms is het metrische referentiekader zo sterk dat syncopatie kan worden aanhouden over een aantal beats zonder dat het beat-percept wordt aangepast (bijvoorbeeld bij reggae ritmes). Maar een te grote mate van syncopering kan het beat-percept instabiel maken - vooral als er een alternatieve organisatie mogelijk is. Dit geeft het belang aan van de tijdsrichting in de verwerking. Een ritmisch patroon dat omgekeerd in de tijd gepresenteerd wordt kan een andere beat induceren. Dat maakt dat het proces van beat-inductie essentieel een incrementeel karakter heeft: muziek ontvouwd zich in de tijd. Maar als een musicoloog een partituur bestudeerd, het hele stuk in één keer overziend, komt de beredeneerde beat volgens een ander proces tot stand. Het is belangrijk dit onderscheid in de theorievorming expliciet te maken.

Een ritmisch patroon kan tegelijkertijd verschillende interpretaties hebben. Verschillende luisteraars kunnen in een dergelijk geval een andere organisatie verkiezen. De notie van de `correcte' beat is dus geen juist concept.

Vanuit het beat-niveau kan ook temporele regelmaat op hogere en lagere niveaus waargenomen. In dit proces van metrum-inductie is de beat slechts één laag in een hiërarchisch systeem van tijdsdelingen. Als de term beat op meer abstracte wijze gebruikt wordt voor een willekeurig niveau in de metrische hiërarchie, dan wordt de term tactus aangewend om aan te geven op wel specifiek niveau men met de muziek meetelt . Dit gebeurt ongeveer tussen 40 en 300 tellen per minuut met een voorkeur voor een tempo rond 100 tellen per minuut, de zogenoemde "preferred rate" - een tijdsinterval van 600 msec (Fraisse, 1982). Deze voorkeur maakt duidelijk dat globaal tempo een belangrijke factor is in beat-inductie. Een ander tempo kan een andere interpretatie opleveren. Tempo kan de tactus naar een ander niveau van de metrische structuur verschuiven. En in ambiguë patronen, die verschillende alternatieve organisaties toelaten, zal onder invloed van het tempo de ene interpretatie boven de andere verkozen kunnen worden, gerelateerd aan de "preferred rate" voor beats.

Als we luisteren naar een muziekuitvoering dan bevat die veel meer informatie dan de geïdealiseerde partituur. Musici voegen allerlei continue betekenisvolle variaties toe, gezamenlijk gegroepeerd onder de noemer expressie (Clarke, 1987). Expressieve timing bijvoorbeeld (de subtiele structuur van tempovariatie en asynchronie die door de uitvoerder bewust gebruikt wordt) is een rijke bron van informatie over de structurele aspecten van de gespeelde muziek, zoals metrum en beat (Sloboda, 1983). Deze informatie kan het beat-inductie proces ondersteunen of zelfs sturen.

De mechanische traagheid van het bewegingsapparaat bij het geven van een respons (zoals het meetikken met de voet) noodzaakt tot anticipatie en planning. Zo maakt de feitelijke "embodiment" van het abstracte proces van beat-inductie -in de concrete vorm van de directe aansturing van bijvoorbeeld een robotvoet door de computer-, de noodzaak duidelijk van planning, aspecten die voorheen weinig aandacht kregen.

Er zijn, tenslotte, nog verschillende aspecten die niet aan de orde geweest zijn. Bijvoorbeeld de invloed van toonhoogte, met name melodische herhaling (Simon & Sumner, 1968; Steedman, 1977) en harmonie. Ook andere parameters, zoals timbre en dynamiek, kunnen het beat-inductie proces sturen. In deze studie beperken wij ons echter tot het beschrijven van het proces voor temporele patronen van aanzetmomenten.

Taxonomie van gebruikte formalismes

Er is een aanzienlijke hoeveelheid literatuur over beat-inductie. Wij zullen ons hier beperken tot die theorieën die zover geformaliseerd zijn dat zij in principe als computationeel model te beschrijven zijn. De hieronder voorgestelde taxonomie maakt het mogelijk deze modellen te karakteriseren aan de hand van het gebruikte paradigma - de methode van formalisatie en implementatie (zie Tabel I).

Tabel I. Formalismes gebruikt in het modelleren van beat-inductie.

Regel-gebaseerd

Longuet-Higgins & Lee (1982)
Lee (1985; 1991)
Miller, Scarborough & Jones (1992)

Optimaliseren

Povel & Essens (1985)
Parncutt (1994)

Symbolisch zoeken

Longuet-Higgins (1976)

Systeem- en besturingstheorie

Dannenberg & Mont-Reynaud (1987)
Large (1994)

Gedistribueerd

Desain (1992)
Desain & Honing (1994a)

Minskiaans

Pennycook, Stammen & Reynolds (1993)
Rowe (1993)
Rosenthal (1992)

Connectionistisch

Miller, Scarborough & Jones (1992)

Statistisch

Palmer & Krumhansl (1991)
Brown (1993)

Musicologisch

Lerdahl & Jackendoff (1983)

Auditief

Vercoe (1985)
Todd (1994)

Regel-gebaseerd. In regel-gebaseerde systemen, een veel gebruikte opzet in het artificiële intelligentie (AI) onderzoek, worden procedurele aspecten van kennis expliciet beschreven in de vorm van een verzameling regels die samen een probleem kunnen oplossen. Elke regel bestaat uit een conditie, dit is een patroon dat in de toestand van het systeem herkend kan worden, en een actie die dan toegepast moet worden en de toestand kan modificeren.

Hoewel elke regel op zich simpel en expliciet is, is het gedrag van dit soort systemen niet goed van te voren te voorzien. Het uiteindelijke gedrag van het systeem wordt immers bepaald door de interactie tussen de regels, en bijvoorbeeld de volgorde van toepassing van de regels. Juist deze aspecten worden impliciet gelaten. Dat maakt het vaak moeilijk te redeneren over deze systemen. Hoewel in de individuele regels de kennis van het domein intuïtief kan worden vormgegeven, zoals dat bijvoorbeeld gedaan is door Longuet-Higgins & Lee (1982), is de onvoorziene interactie tussen de regels het grote nadeel van deze benadering.

Optimaliseren. Het probleem van beat-inductie kan ook worden geformaliseerd als het kiezen van de best passende beat bij het muzikale materiaal uit alle mogelijke oplossingen. Als we een maat kunnen geven voor `goodness-of-fit' of `passendheid' en mogelijk ook een apriori wenselijkheid van een bepaalde beat, dan kan met deze methode de beat geoptimaliseerd worden. Povel & Essens (1985) gebruikten deze aanpak en definieerden de mate van passendheid op grond van de notie van subjectief accent, waarbij dus niet alle individuele noten even belangrijk zijn. Ambiguë patronen kunnen in dit formalisme op een natuurlijke manier beschreven worden door een gelijke waardering aan verschillende beats te geven. Het is echter een vrij abstracte methode. Er wordt geen luisterproces gemodelleerd: de beste beat wordt gekozen voor een min of meer globaal fragment. Deze methode wordt daarom ook vaak toegepast voor cyclische patronen waarbij een natuurlijke keuze van het fragment voorhanden is (i.e. één periode).

Connectionistisch. Dit sub-symbolische paradigma kan gezien worden als een uitbreiding op de optimalisatie benadering. In dit type modellen zijn een relatief groot aantal eenvoudige cellen met elkaar verbonden, elke verbinding met een bepaalde sterkte. Elke cel heeft een eigen activatie niveau en de verbindingen maken wederzijdse inhibitie mogelijk. De cellen kunnen bijvoorbeeld de verschillende beat-hypotheses en hun `juistheid' representeren, zoals in het model van Miller, Scarborough & Jones (1992). Voor een specifiek patroon geeft de cel met de meeste activatie de best passende beat. Doordat de activatiepatronen geleidelijk kunnen worden opgebouwd tijdens de verwerking van de invoer en cellen met een hoge activatie (de winnaars) de anderen kunnen onderdrukken is het procesmatige karakter van het beat-inductie proces natuurlijk te modelleren.

Symbolisch zoeken. Zoeken is een van de meest gebruikte methodes uit de symbolische AI. In plaats van alle mogelijke hypothesen expliciet te representeren (zoals in de bovengenoemde benaderingen) wordt bij deze methode gezocht in de ruimte van mogelijke beats, vanuit één oplossing naar andere, mogelijk betere oplossingen. De methode laat zowel incrementeel als globale verwerking toe. De kandidaatoplossing kan bijvoorbeeld de beat zijn die tot nu toe gekozen is, en terwijl nieuw materiaal wordt verwerkt, wordt er gezocht naar betere kandidaten, gebruikmakend van één van de vele mogelijke zoekstrategieën. De specifieke zoekstrategie maakt dan vaak gebruik van kennis over muzikale structuur. Het model van Longuet-Higgins (1976) bijvoorbeeld, doorloopt de ruimte van mogelijke metra en vergelijkt een kandidaat metrum met het binnenkomende muzikale materiaal, terwijl syncopen geminimaliseerd worden. Dit model is vrij uniek omdat het de numerieke verwerking van expressieve timing combineert met symbolische beslissingen over het metrum op een hoger niveau. Het model vereist echter een startwaarde voor de beat bij de aanvang van de verwerking.

Patroon codering. Patroontalen kunnen gebruikt worden bij het beschrijven van beat-inductie in muziek. Een dergelijke codeertaal bestaat uit een alfabet (een verzameling van basis elementen) en een verzameling van operaties die samen een meer abstracte beschrijving kunnen geven van een bepaald patroon. Een patroon kan bijvoorbeeld beschreven worden als een herhaling of spiegeling van een eenvoudiger deelpatroon. Voordelen van deze aanpak is dat zaken als ritmische structuur en herhaling goed verwoord kunnen worden (Simon & Sumner, 1968). Pogingen om deze aanpak voor beat-inductie te gebruiken zijn echter relatief onsuccesvol gebleken. Met name door de complexe, of beter gezegd, onbegrepen interactie tussen ritmische en metrische structuur.

Systeem- en besturingstheorie. Beat tracking is het volgen van de beat in een gespeeld patroon met tempo variaties. Het kan geformaliseerd worden als een besturingsprobleem. Gegeven een eerste benadering van de beat kan deze doorlopend aangepast worden door middel van een schatting van de fout en een mechanisme van correctieve terugkoppeling (zie bijvoorbeeld Mont-Reynaud & Dannenberg, 1987). Systeem- en besturingstheorie leveren hiervoor de theoretische fundamenten. Ook een complex dynamische aanpak, als een systeem van gekoppelde oscillatoren, wordt wel gebruikt om een beat-tracker met een geavanceerde fout- en zekerheidsmaat te beschrijven (Large, 1994; Large & Kolen, in press). Een probleem bij deze methode is dat ze doof is voor het materiaal binnen elke beat, hoewel dat immers ook informatie over het tempoverloop bevat.

Gedistribueerd. Een alternatief voor de symbolische formalismes is een methode die gebaseerd is op een sub-symbolische, gedistribueerde representatie van de data. Door het relatief hoge niveau van abstractie verschilt deze methode van een neuronaal netwerk. Het continue, numerieke karakter van deze representatie zorgt er echter voor dat een aantal aspecten van beat-inductie natuurlijker gemodelleerd kunnen worden dan in het symbolische paradigma, zoals bijvoorbeeld ambiguïteit, expressieve timing en tempo afhankelijkheid. Desain & Honing (1994a) beschrijven een model dat beat-inductie verklaart op basis van een notie van verwachting (Desain, 1992). Door noten met hoge verwachtingen te labellen als beat en zwaarder mee te laten wegen in het netwerk, wordt isochronie van de beat een emergente eigenschap van het gedrag van het model (Zie het einde van dit artikel voor een uitgebreidere beschrijving van dit model).

Statistisch. Beat-inductie kan ook beschreven worden als het ontdekken van statistische regelmaat in temporeel patronen. Palmer & Krumhasl (1990) gebruiken deze benadering. Zij geven profielen die de kans aangeven dat een noot voorkomt op een bepaalde positie in een maat. Deze profielen zijn verkregen uit tellingen in een collectie van partituren. Impliciet wordt daarmee ook een methode voor metrum-detectie gegeven: de keuze van het profiel dat de hoogste waarschijnlijkheid heeft om het materiaal gegenereerd te hebben.

Ook autocorrelatie wordt gebruikt als methode om periodieke regelmaat in ritmes te detecteren en deze te relateren aan de verschillende niveaus van het metrum (Brown, 1993). Dit kan echter het proces van beat-inductie slechts partieel beschrijven: informatie over de fase van de beat wordt niet geleverd.

Minskiaans. In deze heterogene gedistribueerde aanpak wordt essentieel naar verschillende aspecten van muziek tegelijkertijd gekeken, geïnspireerd op Marvin Minsky's notie van een "collection of specialized agents" (Minsky, 1986). Rowe (1993) gebruikt in Cypher (een systeem dat in een real-time situatie muzikaal reageert op een musicus) o.a. gelijktijdige melodische, harmonische analyses om het beat-inductieproces te helpen en vice versa.

Auditief. In het zogenoemde "auditory modelling" wordt gepoogd zo accuraat mogelijk de opvang van auditive signalen door het menselijke gehoororgaan, en het deel van de cortex dat deze informatie verwerkt, na te bouwen. Hierbij wordt zoveel mogelijk informatie uit het audiosignaal zelf gehaald. Een scala van signaalverwerkingstechnieken wordt gebruikt in het extraheren van o.a. de beat direct uit het geluidssignaal (Todd, 1994).

Het indelen van de modellen is min of meer kunstmatig, omdat vaak verschillende methoden gecombineerd worden. Ook geeft een indeling op grond van het gebruikte computationele paradigma op zich niet voldoende inzicht in de wezenlijke mogelijkheden en beperkingen van de modellen. Een alternatief is bijvoorbeeld een classificatie op basis van het soort materiaal dat de verschillende modellen verwerken en het resultaat dat ze leveren.

We zullen nu ter illustratie twee zeer verschillende benaderingen in wat meer detail beschrijven, waarbij deze aspecten aan de orde komen.

Regel-gebaseerde modellen van beat-inductie

De in Longuet-Higgins & Lee (1982), Lee (1985; 1991) en Miller, Scarborough & Jones (1992) beschreven modellen van beat-inductie maken gebruik van dit regel-gebaseerde paradigma. Deze modellen hebben als invoer een reeks van nootduren (i.e. gehele getallen, afgeleid van nootwaarden in een partituur) - expressieve timing en globaal tempo hebben geen invloed op het proces. Elk van de modellen heeft een set van vier tot tien regels, afgeleid van muzikale intuïtie. Deze regels verwerken het ritme incrementeel, beginnend met de eerste nootduur als de initiële beat, en veranderen de fase en duur van de beat tijdens dit proces. Ze modelleren het proces van initiële beat-inductie.

Figuur 1. De verwerking van een simpel patroon door het regel-gebaseerde model van Longuet-Higgins & Lee (1982).

Figuur 1 laat een concreet voorbeeld zien van een verwerkingsspoor voor een specifiek muzikaal fragment door het Longuet-Higgins & Lee (1982) model. In deze representatie wordt de tijd van links naar rechts gelezen in discrete tijdstappen, en de tijd in rekenstappen van boven naar beneden. De bovenste regel beschrijft het invoerpatroon in een notatie op een tijdrooster ("!" voor een noot-aanzet, "." voor een rust) met daarboven één van de mogelijke muziek notaties. Iedere regel beschrijft een rekenstap: de regel die geactiveerd wordt en het aangepaste beat-interval. Voor het patroon in Figuur 1 maakt de initialize regel de beat gelijk aan de eerste noot. Daarna herkent de stretch regel een noot (de derde) die langer is dan de noot die begint op het einde van de beat en verlengt het de beat zodat die samenvalt met het begin van die noot. De update regel vuurt daarna omdat diezelfde noot zelfs langer is dan de beat. Deze regel verschuift de beat naar het begin van die noot. Omdat er daarna op het einde van de volgende beat een noot staat, kan de conflate regel in werking treden. Deze maakt de beatlengte dubbel zo lang. Daarna vindt nog een stretch plaats en daarmee is de beat zo lang geworden dat de confirm regel de verwerking stopt. De resulterende beat voor het patroon in Figuur 1 is dus 12 tijdseenheden lang en is 4 tijdseenheden verschoven t.o.v. van het invoer patroon (een opmaat), met de eerste tel op de derde, lange noot. Voor dit specifieke patroon geven alle genoemde regel-gebaseerde modellen dezelfde oplossing, alhoewel ze gebruik maken van verschillende regels en combinaties daarvan. Voor een grote verzameling van ritmes echter, bijvoorbeeld alle mogelijke ritmes op een tijdsrooster van 30 punten lang, geven de modellen voor slechts 1% hetzelfde resultaat. Echter, hoe meer muzikale structuur er in deze verzamelingen aanwezig is, hoe meer er overeenstemming tussen de modellen is, tot ca. 20% (zie Desain & Honing, 1994b). Al deze modellen vermijden in zekere zin syncopatie, lange noten die niet met de beat samenvallen veranderen de beat. Deze modellen kunnen dus de verwerking van een aangehouden serie van syncopen niet goed beschrijven. Ook is het is moeilijk ambiguïteit in een symbolisch paradigma te beschrijven. Dat is reden dat dit aspect in deze theorieën weinig aandacht gekregen hebben en alle modellen met één resultaat komen.

Gedistribueerd model van beat-inductie gebaseerd op de notie van verwachting

In Desain (1992) werd een gedistribueerd model van ritmeperceptie gepresenteerd dat, gegeven een temporeel patroon, een profiel van verwachting voor de toekomst postuleert. Dit profiel bestaat uit componenten, bijgedragen door ieder tijdsinterval dat impliciet in het invoer patroon aanwezig is. De verwachtingscurve (zie figuur 2) representeert wanneer, en in welke mate, nieuwe noten worden verwacht. Omdat bleek dat hoge pieken in de patronen overeenkomen met de metrisch belangrijke punten was het een kleine stap een theorie voor beat-inductie op deze notie van verwachting te baseren (Desain & Honing, 1994a). De hoogste piek in de toekomst definieert de beat, en het maakt mogelijk dat noodzakelijke acties (zoals het bewegen van de voet) op tijd geïnitieerd kunnen worden. Als de verwerking rond het tijdspunt van de piek is aangekomen kan de eventuele aanzet van een noot als beat geïnterpreteerd worden. Als zodanig wordt de expressieve timing in muzikale uitvoeringen direct verwerkt. De als beat herkende gebeurtenissen krijgen een hogere weegfactor bij het opwekken van nieuwe verwachtingen. Daardoor wordt het isochrone karakter van de beat als vanzelf verkregen. Indien er geen noot aanzet optreedt rond een dergelijke piek dan wordt de ontbrekende beat toch als gebeurtenis aan de invoer toegevoegd, weliswaar met een lage weegfactor. Deze temporele ankers dragen hierna ook bij aan de verwachtingspatronen en maken zo een correcte verwerking van een aangehouden serie syncopen mogelijk. Op het moment concentreert het onderzoek zich op de empirische onderbouwing van dit model en de juiste instelling van de parameters.

Figuur 2. De verwerking van een simpel patroon door het gedistribueerde model van Desain & Honing (1994a).

Conclusie

In ons huidige onderzoek brengen we de belangrijkste modellen van beat-inductie die gebruik maken van de verschillende formalismen in één computeromgeving samen. Een eerste stap is gedaan met de familie van regel-gebaseerde modellen. Het beschikbaar hebben van deze modellen als algoritme maakt ook een meer volledige evaluatie mogelijk dan één op basis van enkele zorgvuldig gekozen voorbeelden (een niet ongebruikelijke werkwijze in AI onderzoek). Het gedrag van deze modellen kan nu voor combinatorisch complete verzamelingen van patronen bestudeerd worden. Er kan zo een gedetailleerde beschrijving gegeven worden van het invoer/uitvoer gedrag van deze modellen (abstraherend van de interne details). Door karakteristieke deelverzamelingen te gebruiken (bijvoorbeeld alle strikt-metrische patronen) kan gemeten worden in hoeverre de resultaten van de modellen overeensteemen. Op deze wijze kunnen ook andere karakteriseringen gemaakt worden van het globale gedrag van de modellen, zoals bijvoorbeeld de snelheid van beat-inductie (zie Desain & Honing 1994b).

Computationeel modelleren is geen doel op zich. Het gaat in ons in dit onderzoek in eerste instantie om het begrijpen van het beat-inductie proces bij de mens. Dit wordt echter bemoeilijkt doordat de verschillende theorieën in verschillende paradigma's beschreven en getest zijn. Goede ideeën zijn vaak diep verstopt in de programmacode. In het algemeen is het niet eens duidelijk of de verschillende modellen een oplossing zijn voor hetzelfde probleem. De grote uitdaging ligt nu in een unificatie en generalisatie van de bestaande, gedeeltelijk succesvolle theorieën, gedeeltelijk in de zin dat zij soms een deelaspect van beat-inductie succesvol beschrijven. Computationeel modelleren lijkt een geschikte methode om deze uitdaging aan te gaan. Hoewel het een geaccepteerde en goed uitgewerkte methode is in verschillende wetenschapsgebieden is een verantwoord gebruik van deze aanpak in het domein van muziekcognitie nog niet breed doorgedrongen. Deze benadering bevat volgens ons de belofte een beter inzicht te geven in de fundamentele processen van muziekwaarnemening.

Summary

The paper presents a study on beat induction in an inter-disciplinary domain: the computational modeling of music cognition. Beat induction is the process in which a regular isochronous pattern (the beat) is activated while listening to music. The construction of a beat-percept is a fundamental aspect in the processing, coding and experience of temporal patterns. Next to an overview of the different aspects of beat induction, a taxonomy is given of the existing computational models. Aim of this research is to get a better insight in this only partially understood aspect of music perception.

Bibliografie

Brown, J.C. Determination of meter of musical scores by autocorrelation. J. Acoust. Soc. Am., 1993, 94(4), 1953-1957.

Clarke, E.F. Levels of structure in the organisation of musical time. In " Music and psychology: a mutal regard" S. McAdams (ed). Contemporary Music Review, 1987, 2(1).

Dannenberg, R.B. & B Mont-Reynaud. Following an improvisation in real-time. In Proceedings of the 1987 International Computer Music Conference. 1987, 241 - 248. San Francisco: International Computer Music Association.

Desain, P. A (de)composable theory of rhythm perception. Music Perception, 1992, 9(4), 439-454.

Desain,P. & H. Honing. Advanced issues in beat induction modeling: syncopation, tempo and timing. In Proceedings of the 1994 International Computer Music Conference.. 1994a. San Francisco: International Computer Music Association.

Desain,P. & H. Honing. Rule-based models of initial-beat induction and an analysis of their behavior. In Proceedings of the 1994 International Computer Music Conference.. 1994b, San Francisco: International Computer Music Association.

Fraisse, P. Rhythm and tempo. In D. Deutsch (ed.), The Psychology of Music New York: Academic, 1982, p. 149-180.

Large, E. W. & J. F. Kolen. Resonance and the perception of musical meter. Connection Science. In press.

Large, E. W.The resonant dynamics of beat tracking and meter perception. In Proceedings of the 1994 International Computer Music Conference.. 1994, San Francisco: International Computer Music Association.

Lee, C. S. The rhythmic interpretation of simple musical sequences: towards a perceptual model. In R. West, P. Howell, & I. Cross (eds.) Musical Structure and Cognition. London: Academic Press, 1985, 53-69.

Lee, C.S. The perception of metrical structure: Experimental evidence and a model. In P. Howell, R. West, & I. Cross (eds.), Representing musical structure . London: Academic Press, 1991, p. 59-127.

Lerdahl, F., & R. Jackendoff.A generative theory of tonal music. Cambridge, MA: MIT Press, 1983.

Longuet-Higgins, H.C. & C.S. Lee. Perception of musical rhythms. Perception. 11, 1982, 115-128.

Longuet-Higgins, H.C. Mental Processes. Cambridge, Mass.: MIT Press, 1987.

Longuet-Higgins, H.C. The Perception of Melodies Nature , 1976, 263: 646-653. Also in Longuet-Higgins, 1987.

Miller, B. O., D. L. Scarborough, & J. A. Jones. On the perception of meter. In M. Balaban, K. Ebcioglu, & O. Laske (eds.), Understanding Music with AI: Perspectives on Music Cognition. Cambridge: MIT Press, 1992, 428 - 447.

Minsky, M. The Society of Mind. New York: Simon and Schuster, 1986.

Palmer, C. and C.L. Krumhansl. Mental representations of musical meter. Journal of Experimental Psychology: Human Perception and performance . 1990, 16(4), 728-741.

Parncutt, R. A perceptual model of pulse salience and metrical accent in musical rhythms. Music Perception, 1994, 11, 409-464.

Povel, D.J. & P. Essens. Perception of temporal Patterns. Music Perception. 1985, 2(4):411-440

Rosenthal, D. Emulation of human rhythm perception. Computer Music Journal, 1992, 16 (1), 64-76.

Rowe, R. Interactive Music Systems: Machine Listening and Composing. MIT press: Cambridge, 1993.

Simon, H. A. & R. K. Sumner. Pattern in music. In B. Kleinmuntz (ed),Formal representation of Human Judgement. New York: John Wiley, 1968.

Sloboda, J. The communication of musical metre in piano performance. Quarterly Journal of Experimental Psychology , 1983, 35.

Steedman, M. The perception of musical rhtyhm and metre. Perception . 1977, 6: 555-569.

Todd, N. P. M. The auditory "primal sketch": A multi-scale model of rhythmic grouping. Journal of New Music Research, 1994, 23(1).

Vercoe, B. The synthetic performer in the context of live music. In Proceedings of the 1985 International Computer Music Conference. 1985, 199-200. San Francisco: Computer Music Association.