Zegel NWO RUG
Meerweganalyse van Multivariate Longitudinale Data
(Multiway analysis of Multivariate Longitudinal Data)

JAARVERSLAG 1997

Meerweganalyse van Multivariate Longitudinale Data
(575-30.005 t/m .008)


Contents


Personeel

Coordinator dr. H.A.L. Kiers
Uitvoerdersdr. F.J. Oort (post-doc)
drs. M.J. de Rooij (oio)
drs. M.E. Timmerman (oio)
vakature (oio)
G.T. van Donselaar (wetenschappelijk programmeur)
Projectleidersprof. dr. W.J. Heiser, Rijksuniversiteit Leiden
dr. H.A.L. Kiers, Rijksuniversiteit Groningen
dr. P.M. Kroonenberg, Rijksuniversiteit Leiden
prof. dr. J.M.F. ten Berge, Rijksuniversiteit Groningen

Algemeen

Veel onderzoek binnen de ontwikkelingspsychologie en de pedagogiek heeft te maken met de vraag hoe gedrag van individuen verandert in de loop van de tijd. Inzicht hierin kan worden verkregen door middel van longitudinaal onderzoek. Bij longitudinaal onderzoek wordt een aantal personen herhaaldelijk geobserveerd, en worden de observaties uitgedrukt in scores op soms één maar meestal meer dan één variabele. Dergelijke multivariate longitudinale gegevens kunnen worden verzameld in een zogenaamde drie-weg matrix. Een drie-weg matrix kan weergegeven worden als een 'ladenkast' met gegevens: Hierin bevat elke 'lade' een matrix met scores van alle personen, op alle variabelen op een bepaald meetmoment. Voor kwalitatieve variabelen is de oorspronkelijke drie-weg matrix vaak niet beschikbaar, maar beschikt men wel over de frequenties van transities tussen categorieën over een reeks tijdstippen. Vanwege de ingewikkelde structuur van dergelijke gegevens is het van het grootste belang om spaarzame beschrijvingen van dergelijke gegevens te vinden. Eén manier om dit te bereiken is om de gegevens over één van de 'wegen' te aggregeren, en vervolgens met gangbare technieken te analyseren, maar hierbij kan essentiële informatie verloren gaan. Het aandachtsgebied richt zich op technieken die inzicht geven in de veranderende samenhang tussen de variabelen in de tijd.

Voor de analyse van multivariate longitudinale gegevens zijn diverse technieken beschikbaar. Sommige technieken veronderstellen dat de gegevens minstens op interval-niveau gemeten zijn (kwantitatieve variabelen), terwijl andere technieken geschikt zijn voor analyse van variabelen van lager meetniveau (kwalitatieve variabelen). Van de technieken voor kwantitatieve variabelen veronderstellen sommige dat de veranderingen over de tijd zich laten beschrijven door een model waarin de tijdscomponent expliciet een rol speelt (bij voorbeeld: de scores op moment t laten zich via regressie voorspellen uit de scores op moment t-1, maar niet door scores op eerdere momenten), terwijl die in andere technieken ontbreken. Hiermee hebben we een indeling in vier soorten technieken verkregen. Voor de onderzoeker is het, zelfs na zo'n eerste indeling in soorten technieken, doorgaans niet eenvoudig om te kiezen welke techniek te gebruiken. Het doel van het aandachtsgebied is dan ook om een overzicht aan te brengen in de veelheid van technieken voor multivariate analyse van longitudinale gegevens, en na te gaan wat de (relatieve) voor- en nadelen van diverse technieken voor toepassing in diverse situaties zijn.

Vanwege de omvang van een dergelijke vergelijking van technieken is het onderzoek in vier deelprojecten gesplitst. Het eerste project (uitgevoerd door de postdoc met ondersteuning van de programmeur) is gericht op de integratie van het hele onderzoek, waarbij uitdrukkelijk rekening wordt gehouden met de onderzoekspraktijk. In dit project wordt een theoretische vergelijking gemaakt van diverse technieken, en wordt voorts aandacht besteed aan de keuzen die onderzoekers met longitudinale gegevens maken in met name de eerste fasen van de analyse. Elk van de overige projecten (uitgevoerd door de oio's) richt zich op de onderlinge vergelijking van één soort technieken: Technieken voor de analyse van kwalitatieve variabelen (met en zonder tijdspecifieke assumpties), technieken voor de analyse van kwantitatieve variabelen met behulp van tijdspecifieke modellen, en technieken voor de analyse van kwantitatieve variabelen zonder tijdspecifieke modelassumpties. Deze deelprojecten zullen zonodig worden bijgestuurd op grond van inzichten uit het eerste deelproject. In het eerste deelproject zullen aan het eind van de onderzoeksperiode de resultaten van de specialistische deelprojecten worden geïntegreerd, en worden teruggekoppeld naar de onderzoekspraktijk, bij voorbeeld door publicatie van illustratieve analyses van praktijkgegevens. Ook het aanreiken van gebruikersvriendelijke programmatuur ligt op de weg van het eerste project. Op deze manieren wordt er zorg voor gedragen dat de resultaten van de deelprojecten ook buiten het laboratorium beschikbaar worden gemaakt.

In 1997 zijn alle participanten in het aandachtsgebied twee maal bijeen geweest: op 18 april in Leiden, en op 31 oktober in Groningen. In beide gevallen waren ook enkele geïnteresseerden aanwezig. Naast de gebruikelijke besprekingen over de voortgang van de diverse projecten, was er tijdens de eerste bijeenkomst speciale aandacht voor SEM-technieken bedoeld voor de analyse van multivariate longitudinale data; deze technieken zijn gedeeltelijk gebaseerd op autoregressie-modellen. Deze technieken werden besproken door F. Oort, die in een notitie hierover al deze technieken heeft geïnventariseerd en in één familie ondergebracht. Een soortgelijke notitie over groeicurve-modellen is in voorbereiding. Verder is er tijdens beide bijeenkomsten overlegd over de samenwerking binnen het project, en vooral over de centrale rol van deelproject I.

Naast de twee reguliere bijeenkomsten is een bijeenkomst belegd samen met prof. dr. P.C.M. Molenaar (UvA) en zijn buitenlandse gast, prof. J. Nesselroade, die beiden expert zijn in de analyse van longitudinale data. Tijdens deze bijeenkomst is door leden van ons aandachtsgebied uit de doeken gedaan met welke technieken wij ons momenteel bezig houden, terwijl Molenaar en Nesselroade hebben verteld over hun aanpakken.


Deelproject 1

Multivariate longitudinale analyse: Theorie en praktijk
(575-30.005)

Projectleider: dr. P.M. Kroonenberg
Uitvoerders:dr. F.J. Oort (post-doc)
G.T. van Donselaar (wetenschappelijk programmeur)
Projectduur: 1 september 1996 t/m 31 augustus 2000
Locatie:Rijksuniversiteit Leiden, Algemene Pedagogiek

Wetenschappelijk verslag

Drieweg-analyse van multivariate longitudinale data betreft de simultane analyse van drie modussen: variabelen, tijdpunten, respondenten. In de gebruikelijke drieweg-analyse, zoals bijvoorbeeld geïmplementeerd in het computerprogramma TUCKALS, worden alledrie modussen als gefixeerd opgevat. Men kan er echter voor kiezen de respondenten-modus als stochastisch op te vatten. Zodoende krijgt men een nieuwe variant van de gebruikelijke drieweg-analyse. Deze variant noemen wij ‘stochastische drieweg-analyse’ en het meest algemene model noemen wij het Basis ‘Three-Mode’ Model (Basis 3MM).

In de huidige praktijk worden multivariate longitudinale data veelal geanalyseerd via ‘structural equation modeling’ (SEM). In 1997 is een inventarisatie gemaakt van de verschillende SEM-technieken voor de analyse van multivariate longitudinale data. Het blijkt dat twee klassen van SEM veruit het populairst zijn: autoregressie-modellen en groeicurve-modellen. De relaties tussen stochastische drieweg-modellen, autoregressie-modellen, en groeicurve-modellen zijn onderzocht. Gebleken is dat het Basis 3MM een zeer algemeen model is. Door restricties op te leggen aan het Basis 3MM krijgt men een model dat speciaal geschikt is voor multivariate longitudinale data-analyse: het Longitudinale 3MM. Gebleken is verder dat zowel de autoregressie-modellen als de groeicurve-modellen geschreven kunnen worden als speciale gevallen van het Longitudinale 3MM. Ook andere, in de literatuur beschreven modellen blijken speciale gevallen van het Basis 3MM te zijn: ‘three-mode factor analysis’, ‘longitudinal factor analysis’, ‘composite direct product models’, ‘invariant factors models’, en meer. In de loop van het jaar zijn over de genoemde onderwerpen afzonderlijke notities geschreven. Daarna is een begin gemaakt met het samenvatten van deze drie notities tot één rapport: "Introduction to stochastic three-mode models, and their application to multivariate longitudinal data". Op basis van het rapport zullen drie of vier artikelen geschreven worden. Bovendien kan het rapport misschien ook zelfstandig als boekje gepubliceerd worden. Behalve met SEM, kan de stochastische drieweg-analyse ook vergeleken worden met de gebruikelijke drieweg-analyse. Ook hiermee is reeds een begin gemaakt.

Sinds 1 januari 1997 is G.T. van Donselaar bij het project werkzaam als part-time wetenschappelijk programmeur. In het afgelopen jaar is het reeds bestaande menu-gestuurde pakket voor drieweg-analyse geschikt gemaakt voor zowel Windows3.1 als Windows95, zij het dat het nog steeds een zogenaamde 16-bits applicatie is, in plaats van een oorspronkelijk Windowsprogramma.

Tevens is begonnen met het bouwen van een proto-type in de computertaal Delphi van een geheel nieuwe gebruikersinterface die geheel ge-ent is op het Windows95 besturingssysteem. De ontwikkeling is inmiddels zo ver dat op redelijk korte termijn een eerste werkende versie verwacht mag worden. Deze interface is zodanig ontworpen dat later ook de Matlab programma's van de andere projectleden er in opgenomen kunnen worden.

Voordrachten:

Kroonenberg, P.M. & Heiser, W.J. Parallel factor analysis with constraints: Recent developoments. Three-way Methods in Chemistry and Psychology (TRICAP97), Lake Chelan, WA, USA, 4-9 May 1997.

Oort, F.J. (1997). Autoregressiemodellen voor de analyse van multivariate longitudinale data, met een voorbeeld uit de Arbeids- en Organisatiepsychologie. Voordracht gehouden te Amsterdam, Faculteit der Psychologie, Universiteit van Amsterdam, op 26 Mei 1997.

Oort, F.J. (1997). General autoregressive model for longitudinal three-mode analysis. Voordracht gehouden te Santiago de Compostela, Spanje, ter gelegenheid van de "Tenth European Meeting of the Psychometric Society", 15-18 Juli 1998.

Conferentiebezoek

Berliner Summer School and Conference on Longitudinal Structural Equation Modeling (Prof dr. J. Baumert, Dr. T Little, K. Schnabel, Max-Planck-Institut für Bildungsforschung), 25-30 Juni 1998.

Tenth European Meeting of the Psychometric Society, Santiago de Compostela, Spain, 15-18 Juli 1998.


Deelproject 2

Sequentiële multivariate analyse van kwalitatieve variabelen op basis van transitie-tabellen
(575-30.006)

Projectleider: prof.dr. W.J.Heiser
Uitvoerder:drs. M.J. de Rooij (oio)
Projectduur: 1 augustus 1996 t/m 31 juli 2000
Locatie:Rijksuniversiteit Leiden, Vakgroep Psychologie

Wetenschappelijk verslag

Multivariate longitudinale categorische data kunnen gerepresenteerd worden in een transitie-tabel. Bij de analyse van dergelijke tabellen kunnen we een aantal problemen aanwijzen. In de meest gangbare analysemethode, te weten loglineaire analyse, wordt het aantal te schatten en te interpreteren parameters erg groot bij een toenemend aantal tijdstippen of variabelen. In dit project is het de bedoeling analyse-methoden te ontwikkelen voor dergelijke data, waarin het aantal te schatten parameters substantieel kleiner wordt en de interpretatie makkelijker. We kunnen twee gevalen onderscheiden: Ten eerste, het aantal tijdstippen is klein (2,3,4) en het aantal proefpersonen groot; Ten tweede, het aantal tijdstippen is groot (> 100) en het aantal proefpersonen klein. In het eerste geval willen we zogenaamde meerdimensionele schalingsmethoden ontwikkelen, in het tweede geval tijdreeksanalyse-methoden.

Met betrekking tot meerdimensionele schalingsmethoden kunnen we een aantal problemen onderscheiden. Ten eerste, hoe de frequenties in de transitie-tabel om te zetten naar zogenaamde proximity-maten, die dan met meerdimensionele schalingsmethoden geanalyseerd kunnen worden.

Ten tweede, hoe triadische, of meer algemeen polyadische, proximity-gegevens te representeren in een Euclidische ruimte. Ten derde, hoe met asymmetrie om te gaan.

Met betrekking tot tijdreeksanalyse moet het werk van S. Van Buuren (1990) verder uitgebreid worden. Het gaat dan voornamelijk om het aanpassen van zijn optimale schalingstechniek voor symmetrische gegevens.

De reeds in 1996 gevonden methode om de frequenties om te zetten naar proximity-maten en proximity-maten te representeren in een Euclidische ruimte, is in 1997 verder uitgewerkt. Ook is er een methode ontwikkeld voor de representatie van asymmetrische gegevens in een triadische context. Verder is er een begin gemaakt met het onderzoek naar methoden voor tijdreeksdata en multivariate data. De laatste twee methoden moeten nog nader worden bestudeerd. Dit zal in het volgende jaar gebeuren, ook zal daarin aandacht zijn voor passingsmaten voor de diverse methoden.

Voordracht

"Scaling Procedures for Three-way One-mode Transition Tables."Mark de Rooij 10th European Meeting of the Psychometric Society. University of Santiago de Compostella, Spain 15-18 July 1997


Deelproject 3

Multivariate longitudinale analyse van kwantitatieve variabelen zonder tijdspecifieke assumpties
(575-30-007)

Projectleider: prof.dr. J.M.F. ten Berge
Uitvoerder:vakature oio
Projectduur: 1 september 1996 t/m 31 augustus 2000
Locatie:Rijksuniversiteit Groningen, Vakgroep Psychologie

Deelproject 4

Multivariate longitudinale analyse van kwantitatieve variabelen met tijdspecifieke modellen
(575-30-008)

Projectleider: dr. H.A.L. Kiers
Uitvoerder:drs. M.E. Timmerman(oio)
Projectduur: 1 september 1996 t/m 31 augustus 2000
Locatie:Rijksuniversiteit Groningen, Vakgroep Psychologie

Wetenschappelijk verslag

Een groot aantal modellen is beschikbaar voor het beschrijven van kwantitatieve multivariate longitudinale variabelen gemeten bij meerdere proefpersonen. Een onderscheid kan gemaakt worden tussen exploratieve en confirmatieven modellen, en tussen modellen waarbij de relaties tussen onderlinge tijdstippen expliciet gemodelleerd worden, en methoden waarbij dat niet het geval is. Tijdsrelaties worden voornamelijk bij confirmatieve modellen gemodelleerd. Modelleren van tijdsrelaties kan echter ook bij exploratieve technieken van belang zijn: door restricties op te leggen aan het model kan de interpreteerbaarheid vergroot worden en het schatten van de parameters vergemakkelijkt. Een aanvang is gemaakt met het uitwerken van gerestricteerde varianten van ‘standaard’ exploratieve drie-weg technieken, de Drie-Modale Componentenanalyse (3MCA) en PARAFAC. Een model waarbij gladheidsrestricties met behulp van B-splines worden opgelegd, is uitgewerkt en getest met behulp van een simulatie experiment. Ook is een aanvang gemaakt met het uitwerken van een exploratieve variant van Dynamische Factoranalyse, en het opleggen van latente curven. Voor het uitvoeren van (gerestricteerde varianten van) een 3MCA moet een keuze gemaakt worden voor het aantal te behouden componenten. Een methode hiervoor, gebaseerd op de verschillen in fit tussen ‘opeenvolgende’ geneste 3MCA-modellen, is uitgewerkt en vergeleken met ‘standaard’ methoden voor keuze van aantal componenten in 2-weg componentenanalyse, via een simulatiestudie. De voorgestelde methode bleek in vrijwel alle gevallen superieur aan de overige methoden.

Voordrachten:

Kiers, H.A.L. (1997) Recent developments in three-mode factor analysis: Constrained Three-mode factor analysis and core rotations. Paper presented at TRICAP'97, Lake Chelan, WA, USA, May 4-9.

Kiers, H.A.L. (1997) Three-way data analysis and some new developments. Paper presented at the European Meeting of the Psychometric Society, Santiago de Compostela, Spain, July, 15-18.

Kiers, H.A.L., & Timmerman, M.E. (1997) Some recent developments in constrained three-way analysis. Paper presented at the 51st Session of the International Statistical Institute, Istanbul, August 18-26.

Timmerman, M.E. (1997). Drie-weg data analyse van longitudinale kwantitative data met tijdsspecifieke restricties. Voordracht bij nationale bijeenkomst van Interuniversitaire Onderzoekschool voor Psychometrie en Sociometrie, 13 juni, Technische Universiteit Twente, Enschede.

Timmerman, M.E. (1997). Three basic issues in fitting the three-mode factor analysis model. Paper gepresenteerd bij het Psychometrika congres, 15-18 juli, Santiago de Compostela, Spanje.


|Top | Algemene en GezinsPedagogiek | The Three-Mode Company | NWO Meerweganalyseproject Home Page |
P.M. Kroonenberg
Education and Child Studies, Leiden University
Wassenaarseweg 52, 2333 AK Leiden, The Netherlands
Tel. *-31-71-5273446/5273434 (secr.); fax *-31-71-5273945 E-mail: kroonenb at fsw.leidenuniv.nl

Created: 1-9-1998
Last Updated: 1-9-1998