Zegel NWO RUG
Meerweganalyse van Multivariate Longitudinale Data
(Multiway analysis of Multivariate Longitudinal Data)

DEELPROJECT 3

Technieken voor de analyse van kwantitatieve variabelen zonder tijdspecifieke modelassumpties

Projectleider prof. dr. J.M.F. ten Berge
Uitvoerdersdrs. W. Wilmink (oio)
Werkgroepledendr. H.A.L. Kiers
prof. dr. W. Molenaar
LokatieVakgroep Psychologie
Heijmans Instituut, Rijksuniversiteit Groningen

Algemeen

Wetenschappelijk kader en infrastructuur.

Het onderzoek naar technieken voor de analyse van drieweg-gegevens vormt één van de belangrijkste onderdelen van het methodologisch onderzoek aan de Vakgroep Psychologie van de RUG. De betrokken stafleden (Ten Berge en Kiers) zijn lid van het Heymans Instituut wat het psychologisch onderzoek en haar grensgebieden aan de RUG bundelt. Eén afdeling van dit instituut is de afdeling Statistiek, Meettheorie en Psychometrie. Van hieruit wordt geparticipeerd in de door de KNAW erkende onderzoekschool IOPS (Interuniversitaire Onderzoekschool voor Psychometrie en Sociometrie).

Kroonenberg's (1983) monografie vormt een eerste overzichtswerk van technieken voor de analyse van drieweg-gegevens, en biedt tevens een aantal verbeteringen en uitbreidingen van met name de door Tucker (1966) voorgestelde drie-weg factoranalyse. Bovendien hebben Kroonenberg en De Leeuw (1980) een algoritme ontwikkeld voor het vinden van de (in kleinste-kwadraten zin) best passende drie-weg factoroplossing. Later hebben Ten Berge en Kiers, soms samen met Kroonenberg, gepubliceerd over deelaspecten van deze en van andere drieweg-technieken, en heeft Kiers (1991) aangetoond hoe diverse drieweg-technieken aan elkaar gerelateerd zijn.

Een parallelle onderzoekstraditie bouwt voort op Ten Berge's (1986) methode voor vergelijking van factoroplossingen. Kiers en Ten Berge (1989) ontwikkelden (algoritmen voor) technieken waarmee men kan nagaan in hoeverre er in verschillende populaties, dezelfde factor-oplossingen gevonden worden. Vergelijkingen van dergelijke technieken zijn beschreven door Kiers & Ten Berge (1994) en vormen momenteel het onderwerp van een promotie-onderzoek binnen het Heymans Instituut. Wat betreft programmatuur-ontwikkeling dient vermeld te worden dat Kroonenberg en Brouwer een pakket hebben ontworpen voor drieweg-analyse, genaamd 3WAYPACK, wat in de toekomst diverse drieweg-analysetechnieken dient te omvatten. Kiers (1990) heeft een programma voor Simultane Componenten Analyse op de markt gebracht.

Probleemstelling.

Er bestaan allerlei multivariate methoden voor de exploratieve analyse van longitudinaal gemeten kwantitatieve variabelen. Het belangrijkste opzicht waarin deze methoden zich van elkaar onderscheiden betreft de specifieke vorm waarin de gegevens worden geanalyseerd: Wanneer de drieweg-gegevens betrekking hebben op drie verschillende "wegen" (bronnen van verschil) dan komen methoden in aanmerking die recht doen aan dit pure drie-weg karakter. Deze methoden zijn TUCKALS3 (Tucker, 1966; Kroonenberg & De Leeuw, 1980), PARAFAC1 (Carroll & Chang, 1970; Harshman, 1970; Harshman & Lundy, 1984), LCA en LCDA (Meredith, 1991). Ze leveren coëfficiënten (scores, ladingen) op van personen, variabelen, en tijdstippen op componenten, alsmede, in het geval van TUCKALS3, een kernmatrix die het gezamenlijk belang van verschillende soorten componenten aangeeft.

In veel toepassingen zijn de gegevens niet puur drie-weg in die zin dat twee van de drie "wegen" dezelfde zijn. Zo zijn symmetrische matrices van verwantschap of ongelijkheid tussen objekten, verkregen op verschillende tijdstippen, géén pure drieweg-gegevens, maar "twee-modale" drieweg-gegevens, omdat er slechts twee verschillende "wegen" zijn, nl. objekten en tijdstippen. Vaak zien we bijvoorbeeld een stel correlatiematrices betrekking hebbend op dezelfde variabelen, op diverse tijdstippen gemeten. Bij dergelijke "cross-sectionele" gegevens kunnen de algemene drieweg-methoden die we hierboven hebben aangegeven niet langer zinvol worden gebruikt, omdat niet gegarandeerd is dat de componenten van twee "wegen" die samenvallen identiek uit deze methoden tevoorschijn zullen komen.

Voor cross-sectionele en soortgelijke longitudinale twee-modale drieweg-gegevens staan de volgende technieken ter beschikking: TUCKALS2 (Tucker, 1966; Kroonenberg & De Leeuw, 1980), PARAFAC2 (Harshman & Lundy, 1984), INDSCAL (Carroll & Chang, 1970), SCA (Millsap & Meredith, 1988; Kiers & Ten Berge, 1989; 1994), LDA (Meredith, 1991), en stationaire faktormodellen, al dan niet beschermd tegen hertest-effecten (Tisak & Meredith, 1989). De vraag die in dit onderzoek centraal staat is welke methode voor welke type data het meest geschikt is.

Afgezien van het bovenbeschreven verschil tussen (exploratieve) technieken voor longitudinale analyse, ontstaat er ook een verschil tussen technieken als gevolg van het verschillend 'voorbehandelen' ("preprocessen") van de gegevens. Hiermee wordt bedoeld dat men, in plaats van variabelen te standaardiseren (zoals gebruikelijk is), ook ruwe skores, of afwijkingsskores kan gebruiken voor analyse met bovenbeschreven technieken. Bij drieweg-gegevens is overigens preprocessen op meerdere manieren mogelijk. Derhalve ontstaat er bij drie-wegtechnieken een heel arsenaal aan preprocessingsmethoden, waaruit het moeilijk keuzes maken is zonder nadere informatie. Een tweede vraagstelling die in dit project aan bod komt is derhalve hoe de gebruiker dient te kiezen uit de veelheid aan preprocessingsmethoden.

Beoogd resultaat

Doel van dit onderzoek is de technieken op gesimuleerde gegevens te vergelijken zodat gerichte adviezen aan potentiële gebruikers kunnen worden gegeven. Daarbij dienen met name antwoorden gegeven te worden op de vragen:
  1. In hoeverre loont het de moeite pure drieweg-gegevens als zodanig intact te laten en te analyseren met pure drieweg-methoden? Denkbaar is dat in diverse situaties het analyseren van scores (bijv. PARAFAC1) geen extra informatie oplevert boven het analyseren van correlatiematrices (bijv. PARAFAC2).
  2. In hoeverre is het van belang op welke wijze de gegevens vooraf gecentreerd en/of genormeerd ("preprocessed") worden? Voorts zullen toepassingen op empirische data worden uitgevoerd, ter illustratie van de technieken.

Werkwijze

Er worden gegevens geconstrueerd bestaande uit een "theoretische structuur" plus "toegevoegde ruis". Vervolgens wordt gekeken welke methoden er het best in slagen de theoretische structuur dwars door alle ruis heen terug te vinden. De tweede onderzoeksvraag zal in eerste instantie een uitdieping vergen van de theoretische resultaten van Kruskal (1984) en Harshman en Lundy (1984) inzake "preprocessing". In tweede instantie zal via simulatie-onderzoek uitsluitsel gegeven worden over het praktisch nut van de verschillende preprocessingsmethoden.

Werkplan/Publikatieplan

In het eerste jaar zal een grondige literatuurstudie plaatsvinden van de te vergelijken drieweg-technieken en van efficiënte simulatietechnieken. De hoofdmoot van het daadwerkelijke simulatie-onderzoek zal in het tweede en derde jaar plaatsvinden waarna tenslotte het rapporteren van de resultaten in een dissertatie in monografievorm zijn beslag krijgt. In de dissertatie, en in eventuele andere publikaties, wordt verslag gedaan van de simulaties en worden aanbevelingen gegeven voor de gebruikers van drieweg-methoden.

Kernpublikaties van de projectleiders


|Top | Algemene en Gezinspedagogiek | The Three-Mode Company | NWO Meerweganalyseproject Home Page |
P.M. Kroonenberg
Education and Child Studies, Leiden University
Wassenaarseweg 52, 2333 AK Leiden, The Netherlands
Tel. *-31-71-5273446/5273434 (secr.); fax *-31-71-5273945 E-mail: kroonenb at fsw.leidenuniv.nl

Created: 26-04-1997
Last Updated: 1-06-1997