Zegel NWO RUG
Meerweganalyse van Multivariate Longitudinale Data
(Multiway analysis of Multivariate Longitudinal Data)

JAARVERSLAG 2000

Meerweganalyse van Multivariate Longitudinale Data
(575-30.005 t/m .008)


Contents


Personeel

Coordinator dr. H.A.L. Kiers
Uitvoerdersdr. F.J. Oort (post-doc; tot augustus 1999)
drs. M.J. de Rooij (oio)
drs. M.E. Timmerman (oio)
G.T. van Donselaar (wetenschappelijk programmeur)
dhr. H.-J. Slotboom (studentassistent: tot 1-9- 2000)
Projectleidersprof. dr. W.J. Heiser, Rijksuniversiteit Leiden
dr. H.A.L. Kiers, Rijksuniversiteit Groningen
dr. P.M. Kroonenberg, Rijksuniversiteit Leiden
prof. dr. J.M.F. ten Berge, Rijksuniversiteit Groningen

Algemeen

Veel onderzoek binnen de ontwikkelingspsychologie en de pedagogiek heeft te maken met de vraag hoe gedrag van individuen verandert in de loop van de tijd. Inzicht hierin kan worden verkregen door middel van longitudinaal onderzoek. Bij longitudinaal onderzoek wordt een aantal personen herhaaldelijk geobserveerd, en worden de observaties uitgedrukt in scores op soms één maar meestal meer dan één variabele. Dergelijke multivariate longitudinale gegevens kunnen worden verzameld in een zogenaamde drie-weg matrix. Voor kwalitatieve variabelen is de oorspronkelijke drie-weg matrix vaak niet beschikbaar, maar beschikt men wel over de frequenties van transities tussen categorieën over een reeks tijdstippen. Vanwege de ingewikkelde structuur van dergelijke gegevens is het van het grootste belang om spaarzame beschrijvingen van dergelijke gegevens te vinden. Het aandachtsgebied richt zich op technieken die inzicht geven in de veranderende samenhang tussen de variabelen in de tijd. Het onderzoek is in vier deelprojecten gesplitst. Het eerste deelproject (uitgevoerd door de postdoc met ondersteuning van de programmeur) is gericht op de integratie van het hele onderzoek. In dit project wordt een theoretische vergelijking gemaakt van diverse technieken, en wordt voorts aandacht besteed aan de keuzen die onderzoekers met longitudinale gegevens maken in met name de eerste fasen van de analyse. Ook het aanreiken van gebruikersvriendelijke programmatuur ligt op de weg van het eerste project. Elk van de overige projecten (uitgevoerd door de oio's) richt zich op de onderlinge vergelijking van telkens één soort technieken. In onderling overleg is besloten dat de uitvoerder van het derde deelproject een deel van het voor de postdoc beoogde onderzoek overnam. Dit onderzoek betrof een inventarisatie van welke technieken er in de praktijk worden gebruikt en is midden 2000 afgesloten. Daarmee is overigens ook dit deelproject als geheel voortijdig afgesloten. Ook de postdoc heeft zijn werkzaamheden binnen het project voortijdig beŽindigd gezien het feit dat hem elders een baan met betere carrière-perspectieven werd: geboden. Het belangrijkste deel van het onderzoek wat hiermee is blijven liggen, namelijk het schrijven van een boek over multivariate longitudinale data analyse, wordt echter alsnog voltooid door de projectleider van het betreffende deelproject (zie beschrijving aldaar). De overige twee projecten zijn in 2000 in de afrondingsfase beland (zie beschrijvingen aldaar) waarbij het deelproject van de Rooij geresulteerd heeft in een overzicht van analyse-technieken voor multivariate longitudinale kwalitatieve data en dat van Timmerman voor multivariate longitudinale kwantitatieve data.


Deelproject 1

Multivariate longitudinale analyse: Theorie en praktijk
(575-30.005)

Projectleider: dr. P.M. Kroonenberg
Uitvoerders:dr. F.J. Oort (post-doc:tot augustus 1999)
G.T. van Donselaar (wetenschappelijk programmeur)
dhr. H.-J. Slotboom (studentassistent: tot 1-9- 2000)
Projectduur: 1 september 1996 t/m 31 augustus 2000
Locatie:Rijksuniversiteit Leiden, Algemene en Gezinspedagogiek

Wetenschappelijk verslag

Afronding werk post-doc

De post-doc had bij beŽindiging van zijn aanstelling in 1999 als laatste gewerkt aan een algemeen stochastisch drieweg model dat speciaal geschikt is voor multivariate longitudinale data-analyse: het Longitudinale three-mode model . Het artikel hierop gebaseerd (Oort, 2001) zal nu in 2001 verschijnen. Voortgang is geboekt bij het omwerken van het rapport Kroonenberg, Oort, Stebbins &Leurgans (1999) tot een artikel en dit zal volgens planning in 2001 aangeboden worden aan een tijdschrift. Kroonenberg en Oort (2000) is in geheel gereviseerde vorm ten tweede male ingediend.

Handboek voor toegepaste drieweganalyse

Overeenkomstig afspraken met NWO, wordt de laatste taak van de post-doc, namelijk een boek schrijven over het gebruik van drieweganalyse in de praktijk met een nadruk op longitudinale methoden, door de projectleider van dit onderdeel ter hand genomen. Hij zal hiervoor gedeeltelijk vrijgesteld worden van andere taken door zijn vakgroep en zijn vervanging zal worden geregeld op basis van de overgebleven NWO-financiering.

Programmatuur

Binnen het project was in 1999 een onderzoek gestart naar de mogelijkheden om MatLab-programmatuur zelfstandig te kunnen aansturen op een manier die voor personen onbekend met Matlab niet te moeilijk is. Het werk hiervoor was in 2000 reeds ver gevorderd, maar moest worden beŽindigd bij het aflopen van de financiering. Een voorlopig rapport over de resultaten is nog in voorbereiding. De bestaande driewegprogrammatuur ontwikkeld door de projectleider wordt op het moment aangestuurd door een in Pascal ontwikkeld programma dat binnen de Windows-omgeving enige beperkingen kent. Met behulp van Delphi wordt nu door de programmeur gewerkt aan een specifieke Windows-interface. Na vertraging door ziekte van de programmeur is het project eind 2000 in een stroomversnelling gekomen. De verwachting is nu dat medio 2001 een draaiend prototype beschikbaar zal zijn. Ondertussen zijn ook de drieweg-programma's zelf gemoderniseerd en uitgebreid met diverse technieken en meer geavanceerde uitvoer- en plotmogelijkheden. Een beta-versie wordt begin april 2001 verwacht.

Publikatie

Oort. F.J. (2001). Three-mode models for multivariate longitudinal data. British Journal for Mathematical and Statistical Psychology (te verschijnen in 2000).

Rapport

Kroonenberg, P.M., Oort, F.J., Stebbins, G.T., &Leurgans, S.E. (1999) Confirmatory factor analysis of the motor section of the UPDRS. Education and Child Studies, Leiden University &Rush-Presbyterian-St.Luke's Medical Center, Chicago, IL.

Ingediend voor publicatie

Kroonenberg, P.M., &Oort, F.J. (ingediend2). Three-mode analysis of multimode covariance matrices (2e versie 2000). Department of Education, Leiden University.


Deelproject 2

Sequentiële multivariate analyse van kwalitatieve variabelen op basis van transitie-tabellen
(575-30.006)

Projectleider: prof.dr. W.J.Heiser
Uitvoerder:drs. M.J. de Rooij (oio)
Projectduur: 1 augustus 1996 t/m 31 juli 2000
Locatie:Rijksuniversiteit Leiden, Vakgroep Psychologie

Wetenschappelijk verslag

Multivariate longitudinale categorische data kunnen gerepresenteerd worden in een transitie-tabel. Bij de analyse van dergelijke tabellen kunnen we een aantal problemen aanwijzen. In de meest gangbare analysemethode, te weten log-lineaire analyse, wordt het aantal te schatten en te interpreteren parameters erg groot bij een toenemend aantal tijdstippen of variabelen. In dit project is het de bedoeling analyse methoden te ontwikkelen voor dergelijke data, waarin het aantal te schatten parameters substantieel kleiner wordt en de interpretatie gemakkelijker en vervolgens deze technieken te vergelijken met bestaande technieken. We kunnen twee gevallen onderscheiden: Ten eerste, het aantal tijdtsippen is klein (2,3,4) en het aantal proefpersonen groot; Ten tweede, het aantal tijdstippen is groot (> 100) en het aantal proefpersonen is klein. In het tweede geval kunnen we gebruik maken van Markov-chain theorie om de tijdreeks op te delen in kleine stukjes. Wanneer we dat gedaan hebben kunnen we dezelfde technieken gebruiken voor zowel het eerste als tweede geval. In dit project hebben we bekeken in hoeverre de afstand tussen een aantal categorieŽn kan verklaren hoeveel overgangen er tussen de categorieŽn plaats hebben. Hoe dichter categorieŽn bij elkaar liggen in een ruimte des te vaker hebben overgangen plaats tussen deze twee categorieŽn. Door een dergelijke afstandsbenadering te kiezen voor de analyse van transitie-gegevens kan het aantal te schatten parameters enorm worden gereduceerd. Voor het geval van overgangen tussen twee categorieŽn is het afstandsbegrip wel bekend: we kunnen de gewone Euclidische afstand nemen. Wanneer we echter overgangen tussen drie tijdstippen hebben, moeten we dit weergeven door middel van afstanden tussen drie categorieŽn. Naast het probleem van drie-punts of triadische afstanden, hebben we een tweede probleem, namelijk dat het aantal overgangen tussen twee categorieŽn in de ene richting niet altijd gelijk is aan het aantal overgangen tussen dezelfde twee categorieŽn maar in de andere richting. In het geval van overgangen op drie tijdstippen, wordt dit probleem alleen maar sterker.

In het project zijn een aantal dingen onderzocht. Deze zijn beschreven in het proefschrift Distance models for transition frequency data geschreven door de projectuitvoerder.

Publicaties

De Rooij, M. (2001). Distance models for the analysis of transition frequency data. Unpublished doctoral thesis. Leiden University.

De Rooij, M. and Heiser, W.J. (2000). Probabilistic Unfolding models for the analysis of change. Proceedings of the fifth International conference on logic and Methodology, Cologne, Germany, 3-6 October 2000.

De Rooij, M. and Heiser, W.J. (2000). Triadic distance models for the analysis of asymmetric three-way proximity data. British Journal of Mathematical and Statistical Psychology, 53, 99-119.

De Rooij, M (2000). Asymmetric Triadic Distance Models: What they do and how they achieve it. Proceedings of The International Conference on Measurement and Multivariate Analysis, May 2000, Banff, Alberta, Canada. Vol.1. pp.120-123.

De Rooij, M. and Heiser, W.J. (1998). Multidimensional Scaling of Longitudinal Categorical data. In: Data, Science, Classification and Related methods.

Sumitted for publication

De Rooij, M. and Heiser, W.J. (submitted). Graphical Representations and Odds Ratios in a Distance Association Model for the Analysis of Cross Classified Data.

De Rooij, M. and Kroonenberg, P.M. (submitted). Models for forecasting in Dyadic Sequential Interaction Data with and without the use of Weights.

De Rooij, M. (submitted). Three-way distance models and three-way association: A theoretical note.

De Rooij, M. (submitted). Distance-Association models for the analysis of repeated transition frequency tables.

Voordrachten

De Rooij, M. and Heiser, W.J. (2000). Probabilistic Unfolding models for the analysis of change. Paper presented at the fifth International conference on logic and Methodology, Cologne, Germany, 3-6 October 2000.

De Rooij, M. (2000). Distance-Association models for the analysis of repeated transition frequency tables. Paper presented at the International Conference for repeated cross-sectional data, Nijmegen, 15-16 June, 2000.

De Rooij, M (2000). Asymmetric Triadic Distance models. Paper presented at the IMMCA, Banff, Canada, 11-14 Mei, 2000.

De Rooij, M. and Heiser, W.J. (1999). Triadic Distance Models for the analysis of asymmetric three-way proximity data. Paper presented at the 11th European Psychometric Society Meeting, Lueneburg, Germany, 19-22 July 1999.

De Rooij, M. and Heiser, W.J. (1998). Multidimensional Scaling of Longitudinal Categorical data. Paper presented at the 6th conference of the IFCS, Rome, Italy. 21-24 July 1998.

De Rooij, M (1998). Analysis of Sequential Data with distance and generalized distance Models. Paper presented at the joint annual meeting of the psychometric society and the classification society of north america, University of Illinois, Urbana, Illinois, USA, 17-21 Juni, 1998.

De Rooij, M. (1997). Scaling procedures for three-way one-mode transition tables. Paper presented at the 10th European meeting of the Psychometric Society, Universiy of Santiago de Compostella, Spain, 15-18 July, 1997


Deelproject 3

Multivariate longitudinale analyse van kwantitatieve variabelen zonder tijdspecifieke assumpties
(575-30-007)

Projectleider: prof.dr. J.M.F. ten Berge
Uitvoerder:drs. J.M. van der Meulen
Projectduur: 1 september 1996 t/m juli 2000
Locatie:Rijksuniversiteit Groningen, Vakgroep Psychologie
drs. J.M. van der Meulen Titel project: Multivariate longitudinale analyse van kwantitatieve variabelen, zonder tijdsspecifieke restricties

Wetenschappelijk verslag

Bij de aanstelling van drs. J.M. van der Meulen is met haar afgesproken dat zij de uitvoerder van deelproject 575-30-005 zou assisteren bij het inventariseren van welke multivariate longitudinale vraagstellingen en technieken er vooral in de praktijk aan de orde zijn. Tegelijkertijd is zij begonnen zich voor te bereiden op het onderzoek waarin een vergelijking van diverse technieken voor multivariate longitudinale analyse zou plaatsvinden.

De inventarisatie van onderzoeken leidde uiteindelijk tot 35 onderzoeken die betrekking hadden op multivariate longitudinale vraagstellingen. In zes hiervan ging het om onderzoek waarin gebruik werd gemaakt van kortere of langere tijdreeksen, terwijl in de overige 29 eerder sprake was van onderzoeken met betrekking tot een beperkt aantal relatief ver uit elkaar liggende meetmomenten. Daarbij ging het in 9 gevallen om leeftijdsgerelateerde veranderingen (groei-data), terwijl in de overige 20 veranderingen over de tijd in het algemeen werden bestudeerd. Uit deze 35 onderzoeken werden er 13 geselecteerd voor nadere bestudering door middel van interviews met de betreffende onderzoekers. Hierin is geÔnformeerd naar details over de onderzoeken, en ook naar welke technieken voor data-analyse werden gebruikt, alsmede of men bekend was met drieweg-analyse. De onderzoeken waren zodanig geselecteerd dat er naast interesse in gemiddelde scores op variabelen ook interesse was in (causale) verbanden tussen variabelen.

Dergelijke verbanden werden vooral onderzocht door middel van principale componenten-analyse, of "structural equation modeling". Verder werd vooral gebruik gemaakt van variantie-analyse (en aanverwante) technieken om vragen omtrent hoogte van scores en veranderingen daarin te beantwoorden. Veelal werd de keuze van de techniek gebaseerd op het feit dat de techniek gangbaar was in het betreffende soort onderzoek, en soms ook omdat deze door een statisticus was aangedragen. Drieweg-analyse was onder de meeste onderzoekers onbekend, en werd in elk geval niet toegepast.

Toch kon op grond van de onderzoeksvraagstelling en de verzamelde data worden vastgesteld dat 12 van de 13 onderzoeken zich in principe lenen voor analyse met behulp van drieweg-technieken, waaruit blijkt dat grotere bekendheid aan deze technieken gegeven zou moeten worden.

Na dit praktijkonderzoek heeft de onderzoekster, medio 2000, besloten een andere loopbaan te kiezen. Bijgevolg is dus het overige onderzoek wat geplanned was binnen dit project niet uitgevoerd. Vervanging van de onderzoekster leek, gezien de benodigde inwerktijd, niet haalbaar, zodat het project per juli 2000 is afgesloten.

Publicatie

J.M. van der Meulen (2000) An inventory of applied multivariate longitudinal psychological and educational research in the Netherlands. Internal report

Deelproject 4

Multivariate longitudinale analyse van kwantitatieve variabelen met tijdspecifieke modellen
(575-30-008)

Projectleider: dr. H.A.L. Kiers
Uitvoerder:drs. M.E. Timmerman(oio)
Projectduur: 1 september 1996 t/m juli 2001
Locatie:Rijksuniversiteit Groningen, Vakgroep Psychologie

Wetenschappelijk verslag

Dit project richt zich op de ontwikkeling van technieken voor componenten analyse van longitudinale kwantitatieve multivariate data van meerdere proefpersonen. Een onderscheid wordt gemaakt tussen 'longitudinale drie-weg data' en 'multi-subject multivariate tijdreeksen'. Bij longitudinale drie-weg data vinden de meetingen voor de verschillende proefpersonen plaats op vergelijkbare momenten in een proces dat gemeten wordt. De onderzoeker is voornamelijk geÔnteresseerd in interindividuele verschillen in intra-individuele verandering. Bij tijdreeksen zijn de meetmomenten voor de proefpersonen onvergelijkbaar, en de onderzoeker is met name geïnteresseerd in intra-individuele verandering.

Een klasse van component modellen die geschikt zijn om longitudinale drie-weg data te modelleren omvat CANDECOMP/PARAFAC (CP), en de Tucker3, Tucker2 en Tucker1 modellen. Het gegeven dat de drie-weg data longitudinaal gemeten zijn levert mogelijkheden op om restricties aan de modellen op te leggen. Hierdoor wordt de mate waarin ruis gefit wordt kleiner, en de interpreteerbaarheid vergroot. Bij het gebruik van deze restricties is het niet langer noodzakelijk dat de scores op gelijke meetmomenten verzameld zijn voor de proefpersonen, en de variabelen. Twee typen restricties voor CP model en het Tucker3 model zijn uitgewerkt, namelijk het opleggen van gladheidrestricties, en het opleggen van bepaalde (niet-lineaire) functies, waarvan de parameters geschat worden.

Voor de analyse van multi-subject multivariate tijdreeksen is een klasse van vier Simultane Componenten Modellen voorgesteld. Deze modellen zijn succesvol toegepast op empirische data. Twee van deze modellen zijn nieuw, twee zijn eerder voorgesteld, maar deze werden tot nu toe toegepast in een andere context (namelijk bij de analyse van multivariate gegevens verkregen van proefpersonen uit meer dan 1 populatie). Een uitbreiding van de Simultane Componenten Modellen klasse is de klasse van Dynamische Componenten Modellen (DCM). In de DCM worden behalve simultane relaties ook vertraagde effecten gemodelleerd. Een aantal eigenschappen van de DCM is onderzocht in een simulatie-experiment. Een succesvolle toepassing op empirische data ontbreekt vooralsnog. De hierboven geschetste ontwikkelingen en bevindingen zijn gerapporteerd in een proefschrift, waarvan het manuscript inmiddels door de promotores is goedgekeurd. Een deel is tevens in artikelvorm bewerkt, en ingediend bij (internationale) tijdschriften.

Publikaties

Timmerman, M.E. &Kiers, H.A.L. (2000). Three Mode Principal Components Analysis: Choosing the numbers of components and sensitivity to local optima. British Journal of Mathematical and Statistical Psychology, 53, 1-16.

Timmerman, M.E. &Kiers, H.A.L. (2001). Three Mode Principal Components Analysis and PARAFAC/CANDECOMP with smoothness constraints. Submitted.

Timmerman, M.E. &Kiers, H.A.L. (2001). Four Simultaneous Component Models of multivariate time series from more than one subject to model intraindividual and interindividual differences. Submitted.


|Top | Algemene en GezinsPedagogiek | The Three-Mode Company | NWO Meerweganalyseproject Home Page |
P.M. Kroonenberg
Education and Child Studies, Leiden University
Wassenaarseweg 52, 2333 AK Leiden, The Netherlands
Tel. *-31-71-5273446/5273434 (secr.); fax *-31-71-5273945 E-mail: kroonenb at fsw.leidenuniv.nl

Created: 7-4-2001
Last Updated: 7-4-2001