Zegel NWO RUG
Meerweganalyse van Multivariate Longitudinale Data
(Multiway analysis of Multivariate Longitudinal Data)

JAARVERSLAG 1996

Meerweganalyse van Multivariate Longitudinale Data
(575-30.005 t/m .008)


Contents


Personeel

Coordinator dr. H.A.L. Kiers
Uitvoerdersdr. F.J. Oort (post-doc)
drs. M.J. de Rooij (oio)
drs. M.E. Timmerman (oio)
drs. W.M.A. Weltens (oio)
G.T. van Donselaar (wetenschappelijk programmeur)
Projectleidersprof. dr. W.J. Heiser, Rijksuniversiteit Leiden
dr. H.A.L. Kiers, Rijksuniversiteit Groningen
dr. P.M. Kroonenberg, Rijksuniversiteit Leiden
prof. dr. J.M.F. ten Berge, Rijksuniversiteit Groningen

Algemeen

Veel onderzoek binnen de ontwikkelingspsychologie en de pedagogiek heeft te maken met de vraag hoe gedrag van individuen verandert in de loop van de tijd. Inzicht hierin kan worden verkregen door middel van longitudinaal onderzoek. Bij longitudinaal onderzoek wordt een aantal personen herhaaldelijk geobserveerd, en worden de observaties uitgedrukt in scores op soms één maar meestal meer dan één variabele. Dergelijke multivariate longitudinale gegevens kunnen worden verzameld in een zogenaamde drie-weg matrix. Een drie-weg matrix kan weergegeven worden als een 'ladenkast' met gegevens: Hierin bevat elke 'lade' een matrix met scores van alle personen, op alle variabelen op een bepaald meetmoment. Voor kwalitatieve variabelen is de oorspronkelijke drie-weg matrix vaak niet beschikbaar, maar beschikt men wel over de frequenties van transities tussen categorieën over een reeks tijdstippen. Vanwege de ingewikkelde struktuur van dergelijke gegevens is het van het grootste belang om spaarzame beschrijvingen van dergelijke gegevens te vinden. Eén manier om dit te bereiken is om de gegevens over één van de 'wegen' te aggregeren, en vervolgens met gangbare technieken te analyseren, maar hierbij kan essentiële informatie verloren gaan. Het aandachtsgebied richt zich op technieken die inzicht geven in de veranderende samenhang tussen de variabelen in de tijd.

Voor de analyse van multivariate longitudinale gegevens zijn diverse technieken beschikbaar. Sommige technieken veronderstellen dat de gegevens minstens op interval-nivo gemeten zijn (kwantitatieve variabelen), terwijl andere technieken geschikt zijn voor analyse van variabelen van lager meetnivo (kwalitatieve variabelen). Van de technieken voor kwantitatieve variabelen veronderstellen sommige dat de veranderingen over de tijd zich laten beschrijven door een model waarin de tijdscomponent expliciet een rol speelt (bij voorbeeld: de scores op moment t laten zich via regressie voorspellen uit de scores op moment t-1, maar niet door scores op eerdere momenten), terwijl die in andere technieken ontbreken. Hiermee hebben we een indeling in vier soorten technieken verkregen. Voor de onderzoeker is het, zelfs na zo'n eerste indeling in soorten technieken, doorgaans niet eenvoudig om te kiezen welke techniek te gebruiken. Het doel van het aandachtsgebied is dan ook om een overzicht aan te brengen in de veelheid van technieken voor multivariate analyse van longitudinale gegevens, en na te gaan wat de (relatieve) voor- en nadelen van diverse technieken voor toepassing in diverse situaties zijn.

Vanwege de omvang van een dergelijke vergelijking van technieken is het onderzoek in vier deelprojecten gesplitst. Het eerste project (uitgevoerd door de postdoc met ondersteuning van de programmeur) is gericht op de integratie van het hele onderzoek, waarbij uitdrukkelijk rekening wordt gehouden met de onderzoekspraktijk. In dit project wordt een theoretische vergelijking gemaakt van diverse technieken, en wordt voorts aandacht besteed aan de keuzen die onderzoekers met longitudinale gegevens maken in met name de eerste fasen van de analyse. Elk van de overige projecten (uitgevoerd door de oio's) richt zich op de onderlinge vergelijking van één soort technieken: Technieken voor de analyse van kwalitatieve variabelen (met en zonder tijdspecifieke assumpties), technieken voor de analyse van kwantitatieve variabelen met behulp van tijdspecifieke modellen, en technieken voor de analyse van kwantitatieve variabelen zonder tijdspecifieke modelassumpties. Deze deelprojecten zullen zonodig worden bijgestuurd op grond van inzichten uit het eerste deelproject. In het eerste deelproject zullen aan het eind van de onderzoeksperiode de resultaten van de specialistische deelprojecten worden geïntegreerd, en worden teruggekoppeld naar de onderzoekspraktijk, bij voorbeeld door publikatie van illustratieve analyses van praktijkgegevens. Ook het aanreiken van gebruikersvriendelijke programmatuur ligt op de weg van het eerste project. Op deze manieren wordt er zorg voor gedragen dat de resultaten van de deelprojecten ook buiten het laboratorium beschikbaar worden gemaakt. Op 18 oktober 1996 zijn de medewerkers van het aandachtsgebied, samen met de projectleiders, voor het eerst bijeen gekomen. Bij deze eerste bijeenkomst lag het accent op kennismaking en op onderlinge afstemming van de werkzaamheden. Er is afgesproken twee keer per jaar dergelijke bijeenkomsten te organiseren, en hierbij ook de andere leden van de locale werkgroepen te betrekken.


Deelproject 1

Multivariate longitudinale analyse: Theorie en praktijk (575-30.005)

Projectleider: dr. P.M. Kroonenberg
Uitvoerders:dr. F.J. Oort (post-doc)
G.T. van Donselaar (wetenschappelijk programmeur)
Projectduur: 1 september 1996 t/m 31 augustus 2000
Locatie:Rijksuniversiteit Leiden, Algemene Pedagogiek

Voor onderzoekers in de praktijk is het vaak moeilijk te kiezen welke techniek gebruikt dient te worden voor de analyse van multivariate longitudinale gegevens. Een overzicht van voor- en nadelen van bestaande technieken ontbreekt, en vaak is gebruikersvriendelijke programmatuur niet beschikbaar. Met behulp van resultaten uit de andere projecten in het aandachtsgebied zal in het huidige project getracht worden een dergelijk overzicht aan te brengen, en zal, waar nodig, gebruikersvriendelijke programmatuur worden ontwikkeld. Dit project is gericht op de theoretische en praktische onderbouwing van de drie andere onderzoeksprojecten in het aandachtsgebied. Enerzijds wordt er gezocht naar op grond van theorie beschikbare of afleidbare resultaten waarmee keuzes tussen (in de oio-projecten) te bestuderen technieken en keuzes voor succesmaten kunnen worden beargumenteerd. Anderzijds wordt in dit project nagegaan welke onderzoeksvragen (met betrekking tot multivariate longitudinale data) er vooral leven in de praktijk, en met welke specifieke problemen de praktijkonderzoeker te kampen heeft.

Aangezien het project gestart is op 1 september, betreft het wetenschappelijk verslag van 1996 de eerste vier projectmaanden. Deze eerste vier maanden zijn gebruikt voor oriëntatie. Begonnen is met een verkenning van de literatuur over meerweg-analyse, en bestudering van de handleiding van TUCKALS, een computerprogramma voor meerweg-analyse. Voornamelijk ter bevordering van goed begrip is, met behulp van Maple, een computer-programma geschreven voor het uitvoeren van een soort restrictieve TUCKALS. Daarnaast heeft een summiere verkenning plaatsgevonden van wat voor multivariate longitudinale data er door Nederlandse pedagogen verzameld worden, en wat daarbij de onderzoeksvra- gen zijn. Hiertoe zijn de laatste drie jaargangen van het Nederlandse wetenschappelijke tijdschrift 'Pedagogische Studieën' doorgenomen. De resultaten zijn gepresenteerd op de eerste bijeenkomst van het aandachtsgebied.

Naar aanleiding van bovengenoemde bijeenkomst is daarna begonnen met een inventarisatie van 'structural equation modeling' (SEM)-technieken voor de analyse van multivariate longitudinale data. Deze technieken kunnen gezien worden als concurrenten voor meerweg-analyse, en als zodanig hoort een beschrijving ervan tot het onderzoeksplan zoals beschreven in de oorspronkelijk projectaanvraag. Het doel van de inventarisatie is te komen tot een beschrijving van een aantal klassen van SEM-technieken. Er worden vier tot zes klassen voorzien. Voor twee van dergelijke klassen, autoregressie modellen en latente curve modellen, zijn reeds opzetjes geschreven. Deze notities kunnen wellicht uitmonden in wetenschappelijke publicaties en/of hoofdstukken in het praktijkboek dat voorzien is in de projectbeschrijving. Teneinde de verschillende klassen van SEM-technieken goed te kunnen vergelijken is een computerprogramma, in C, geschreven ter vergemakkelijking van simulatie-onderzoek. Het programma genereert ruwe 'steekproef'-data op basis van een 'populatie'-variantie/covariantiematrix.

Aangezien de heer Van Donselaar pas per 1 januari 1997 is aangesteld, heeft dit verslag nog geen betrekking op de werkzaamheden van de programmeur.


Deelproject 2

Sequentiële multivariate analyse van kwalitatieve variabelen op basis van transitie-tabellen (575-30.006)

Projectleider: prof.dr. W.J.Heiser
Uitvoerder:drs. M.J. de Rooij (oio)
Projectduur: 1 augustus 1996 t/m 31 juli 2000
Locatie:Rijksuniversiteit Leiden, Vakgroep Psychologie

Multivariate longitudinale categorische data kunnen gerepresenteerd worden in een transitie-tabel. Bij de analyse van dergelijke tabellen kunnen we een aantal problemen aanwijzen. In de meest gangbare analysemethode, te weten loglineaire analyse, wordt het aantal te schatten en te interpreteren parameters erg groot bij een toenemend aantal tijdstippen of variabelen. In dit project is het de bedoeling analyse-methoden te ontwikkelen voor dergelijke data, waarin het aantal te schatten parameters substantieel kleiner wordt en de interpretatie makkelijker, en vervolgens deze nieuwe technieken te vergelijken met bestaande technieken. We kunnen twee gevallen onderscheiden: ten eerste, het aantal tijdstippen is klein (2,3,4) en het aantal proefpersonen groot; ten tweede, het aantal tijdstippen is groot (> 100) en het aantal proefpersonen klein. In het eerste geval willen we zogenaamde meerdimensionele schalingsmethoden ontwikkelen, in het tweede geval tijdreeksanalyse-methoden.

Met betrekking tot meerdimensionele schalingsmethoden kunnen we een aantal problemen onderscheiden. Ten eerste, hoe de frequenties in de transitie-tabel om te zetten naar zogenaamde proximity maten, die dan met meerdimensionele schalingsmethoden geanalyseerd kunnen worden. Ten tweede, hoe triadische, of meer algemeen polyadische, proximity gegevens te representeren in een Euclidische ruimte. Ten derde, hoe met asymmetrie om te gaan. Met betrekking tot tijdreeksanalyse moet het werk van S. Van Buuren (Optimal Scaling of time series. Leiden: DSWO Press, 1990) verder uitgebreid worden. Het gaat dan voornamelijk om het aanpassen van zijn optimale schalingstechniek voor symmetrische gegevens.

Het eerste jaar is voornamelijk gericht geweest op inlezen in de literatuur en de problemen met betrekking tot meerdimensionele schalingsmethoden. Er is een methode gevonden om de frequenties om te zetten naar proximity maten en hoe proximity maten te representeren in een Euclididsche ruimte. Verder is er een begin gemaakt met de representatie van triadische asymmetrische gegevens. Het tweede geval, aandachtspunten met betrekking tot tijdreeksanalyse methoden is nog niet aan de orde geweest, maar zal in het komende jaar aandacht krijgen.

Voordracht

de Rooij, M.J. (1996). Multidimensional scaling for longitudinal data. Paper presented at the 6th International Meeting of Dissertation Research in Psychometrics and Sociometrics, 12-13 December 1996, University of Leuven, Belgium.

Deelproject 3

Multivariate longitudinale analyse van kwantitatieve variabelen zonder tijdspecifieke assumpties (575-30-007)

Projectleider: prof.dr. J.M.F. ten Berge
Uitvoerder:drs. W.M.A. Weltens(oio)
Projectduur: 1 september 1996 t/m 31 augustus 2000
Locatie:Rijksuniversiteit Groningen, Vakgroep Psychologie

Er bestaan allerlei multivariate methoden voor de exploratieve analyse van longitudinaal gemeten kwantitatieve variabelen. Het belangrijkste opzicht waarin deze methoden zich van elkaar onderscheiden betreft de specifieke vorm waarin de gegevens worden geanalyseerd: Wanneer de drieweg-gegevens betrekking hebben op drie verschillende "wegen" (bronnen van verschil) dan komen methoden in aanmerking die recht doen aan dit pure drie-weg karakter, zoals TUCKALS3 en PARAFAC1. Ze leveren coëfficiënten (scores, ladingen) op van personen, variabelen, en tijdstippen op componenten, alsmede, in het geval van TUCKALS3, een kernmatrix die het gezamenlijk belang van verschillende soorten componenten aangeeft.

In veel toepassingen zijn de complete drie-weg gegevens niet beschikbaar, maar wel de correlatie-matrices betrekking hebbend op dezelfde variabelen, op diverse tijdstippen gemeten. Bij dergelijke "cross-sectionele" gegevens kunnen de algemene drieweg-methoden die we hierboven hebben aangegeven niet langer zinvol worden gebruikt, omdat niet gegarandeerd is dat de componenten van twee "wegen" die samenvallen identiek uit deze methoden tevoorschijn zullen komen. Voor cross-sectionele en soortgelijke longitudinale twee-modale drieweg-gegevens staan technieken als TUCKALS2, PARAFAC2, INDSCAL en SCA ter beschikking. De vraag die in dit onderzoek centraal staat is welke methode voor welke type data het meest geschikt is.

Afgezien van het bovenbeschreven verschil tussen (exploratieve) technieken voor longitudinale analyse, ontstaat er ook een verschil tussen technieken als gevolg van het verschillend 'voorbehandelen' ("preprocessen") van de gegevens. Hiermee wordt bedoeld dat men, in plaats van variabelen te standaardiseren (zoals gebruikelijk is), ook ruwe skores, of afwijkingsskores kan gebruiken voor analyse met bovenbeschreven technieken. Bij drieweg-gegevens is overigens preprocessen op meerdere manieren mogelijk. Een tweede vraagstelling die in dit project aan bod komt is derhalve hoe de gebruiker dient te kiezen uit de veelheid aan preprocessings-methoden.

De eerste maanden van dit project zijn besteed aan het lezen van literatuur over drie-weg technieken. Voorts is uitvoerig kennis gemaakt met de meest geëigende programmatuur voor dergelijke matrix-gebaseerde methoden, het programma PCMATLAB.


Deelproject 4

Multivariate longitudinale analyse van kwantitatieve variabelen met tijdspecifieke modellen (575-30-008)

Projectleider: dr. H.A.L. Kiers
Uitvoerder:drs. M.E. Timmerman(oio)
Projectduur: 1 september 1996 t/m 31 augustus 2000
Locatie:Rijksuniversiteit Groningen, Vakgroep Psychologie

Er zijn verscheidene technieken voorgesteld voor de analyse van kwantitatieve multivariate longitudinale gegevens. Een aantal hiervan maken gebruik van de relaties tussen gegevens die op opeenvolgende tijdstippen zijn geobserveerd, door deze relaties expliciet te betrekken in de modellen die gebruikt worden om dergelijke gegevens te beschrijven. Voorbeelden van dergelijke technieken zijn Longitudinale Factoranalyse, Dynamische Factoranalyse, Multivariate Tijdreeksanalyse, Toestand-Ruimte Modellen en Analyse van Groeicurven. De genoemde technieken zijn gebaseerd op verdelingsassumpties waaraan in de praktijk niet altijd voldaan is. Wanneer multivariate longitudinale gegevens bij meer dan één observatie-eenheid gemeten zijn, dan zijn deze gegevens drie-weg gegevens. Daarom vormen technieken voor exploratieve drieweg-analyse, zoals PARAFAC en Driemodale Factoranalyse, een alternatief voor bovenstaande technieken. Deze technieken berusten niet op verdelingsassumpties, en zouden de voorkeur kunnen verdienen als dergelijke assumpties geschonden zijn. Deze methoden negeren echter de relaties tussen scores van opeenvolgende tijdstippen. In het onderhavige onderzoek worden daarom varianten van deze technieken ontworpen die wel rekening houden met de tijdsrelaties tussen observaties, zonder verdelingsassumpties te gebruiken. Het hoofddoel van het onderzoek is de resulterende varianten van drie-weg technieken te vergelijken met de eerder genoemde, op verdelingsassumpties gebaseerde technieken. De vergelijking zal zowel op empirische als gesimuleerde gegevens worden gebaseerd.

De eerste maanden van dit project in 1996 zijn voornamelijk besteed aan het lezen van een deel van de omvangrijke literatuur die beschikbaar is over de genoemde technieken. Er is kennis gemaakt met simulatietechnieken. Voorts is een aanvang gemaakt met het verzamelen van geschikte empirische gegevenssets.


|Top | Algemene en Gezinspedagogiek | The Three-Mode Company | NWO Meerweganalyseproject Home Page |
P.M. Kroonenberg
Education and Child Studies, Leiden University
Wassenaarseweg 52, 2333 AK Leiden, The Netherlands
Tel. *-31-71-5273446/5273434 (secr.); fax *-31-71-5273945 E-mail: kroonenb at fsw.leidenuniv.nl

Created: 4-11-1997
Last Updated: 4-11-1997