Labour market history analysis and longitudial surveys -väitöskirja

Hanketiedot

Hankenumero
110422

Hakija
Marjo Pyy-Martikainen

Toteuttaja
Marjo Pyy-Martikainen

Lisätietoja
Marjo Pyy-Martikainen
marjo.pyy-martikainen@stat.fi

Toteutusaika
17.1.2011 - 31.5.2011

Työsuojelurahaston päätös
21.10.2010
8 000 euroa

Kokonaiskustannukset
8 000 euroa

Tulokset valmistuneet
31.5.2011

Tiivistelmä

Suomalaisen väestön ikääntyminen on herättänyt vilkkaan keskustelun siitä, kuinka aktiivisten vuosien määrää työmarkkinoilla saataisiin lisättyä. Tavoitteen saavuttamiseksi on keskeistä ymmärtää, mitkä tekijät vaikuttavat yhtäältä työttömyyden kestoon ja työllistymistodennäköisyyteen ja toisaalta työuran pituuteen. Keräämällä henkilötason työmarkkinahistoriatietoa voidaan tutkia esimerkiksi, kuinka työttömyyden pitkittyminen vaikuttaa työllistymistodennäköisyyteen tai mitkä tekijät ovat yhteydessä pitkään työuraan. Surveypohjaisten työmarkkinahistoria-aineistojen (STH-aineisto) ongelmana ovat erilaiset virhelähteet, kuten mittausvirheet, kato ja attritio. Virhelähteiden vaikutuksesta STH-aineistojen analyysissa ei ole olemassa riittävästi tutkimustietoa.

Väitöskirjassa tutkitaan STH-aineistojen virhelähteiden määrää, niitä selittäviä tekijöitä, niistä tavallisesti tehtävien oletusten paikkansapitävyyttä sekä niiden aiheuttamaa harhaa tutkimustuloksissa. Väitöskirja tuottaa suositukset siitä, kuinka STH-aineistoa tulisi analysoida mahdollisimman luotettavien tutkimustulosten aikaansaamiseksi.

Väitöskirja hyödyntää henkilötasolla linkitettyä rekisteri-survey työmarkkinahistoria-aineistoa. Aineisto sisältää työmarkkinahistoriatietoja vuosilta 1995-1999 sekä taustamuuttujia, joita käytän työllistymistodennäköisyyttä selittävissä malleissa.

Osa artikkeliväitöskirjan artikkeleista on jo julkaistu. Väitöskirjan arvioitu valmistumisaika on kesällä 2011.

Hankkeen vastuuhenkilö

Marjo Pyy-Martikainen

Tiedote

Pitkittäisten survey-tutkimusten virhelähteet huomioon

31.5.2011

Suomalaisen työelämän keskeisenä tavoitteena on pidentää
työuria. Tavoitteen saavuttamiseksi on tärkeää ymmärtää, mitkä
tekijät vaikuttavat työttömyyden kestoon, todennäköisyyteen
työllistyä ja työuran pituuteen. Näitä tekijöitä voidaan tutkia
keräämällä tietoa henkilötason työmarkkinahistoriasta.

Valtiotieteen lisensiaatti
Marjo Pyy-Martikainen tarkasteli
väitöstutkimuksessaan kadosta, attritiosta eli paneelikadosta ja
mittaamisesta johtuvia virheitä survey-pohjaisessa
työmarkkinahistoria-aineistossa sekä virheiden aiheuttamaa harhaa
tällaisen aineiston analyysissa. Työsuojelurahasto tuki tutkimusta
stipendillä.

Tutkimus käsitteli myös survey-aineistoon perustuvien
tapahtumahistoriatietojen tilastollisessa analyysissa
vastaantulevia valintoja ja niiden vaikutusta tuloksiin. Tällaisia
valintoja ovat: valitaanko asetelma- vai malliperusteinen
lähestymistapa; mitä osaa aineistosta hyödynnetään sekä valittaessa
asetelmaperusteinen lähestymistapa, mitä painoja käytetään.

Tutkimuksessa hyödynnettiin yhdistettyä pitkittäistä
survey-rekisteriaineistoa. Eurooppalaisen elinolotutkimuksen Suomea
koskeva, tutkimuskerrat 1-5 kattava aineisto yhdistettiin
henkilötasolla rekisteripaneeliaineistoon.

Pyy-Martikaisen väitöskirja tilastotieteen alalta tarkastettiin
Åbo Akademin luonnontieteiden laitoksella maanantaina
11.11.2013.

Väitöskirjan otsikko on Statistical analysis of survey-based
event history data with application to modeling of unemployment
duration.

Harhan lähteitä ja luokitteluvirheitä

Tutkimuksessa näytettiin, kuinka yhdistettyä pitkittäistä
survey-rekisteriaineistoa voidaan hyödyntää kadon ja attrition
analysoinnissa, puuttuneisuuden mekanismin testaamisessa sekä
kadosta ja attritiosta johtuvan harhan estimoinnissa.

Ensimmäisen tutkimuskerran kato osoittautui tutkimuksen
empiirisissä analyyseissa attritiota merkittävämmäksi harhan
lähteeksi.

Survey-vastauksiin perustuvissa työttömyysjaksoissa oli jaksojen
alkujen ja loppujen kasautumista viiteajankohtien ääripäihin,
jaksojen raportoimatta jättämistä ja jossain määrin myös
yliraportointia. Raportoimatta jättämisen todennäköisyys oli
yhteydessä sijaisvastaajan käyttöön.

Työttömyysjaksojen päättymissyissä oli luokitteluvirheitä.
Empiiristen analyysien perusteella klassiset oletukset
mittausvirheistä tai oletukset puuttuneisuuden satunnaisuudesta
eivät pitäneet paikkaansa.

Sekä työttömyysjaksojen kestoon että päättymissyihin liittyvät
mittausvirheet aiheuttivat harhaa tapahtumahistoria-analyysin
tuloksiin.

Empiiristen analyysien perusteella harhaisimpia olivat kaikkiin
tutkimusaaltoihin vastanneiden henkilöiden osa-aineistoon
perustuvat, viimeisen tutkimusaallon painoilla painotetut
asetelmaperusteiset estimaatit.

Aineiston laajentaminen kattamaan kaikki vähintään ensimmäiseen
tutkimusaaltoon vastanneet henkilöt pienensi harhaa.

Suosituksia survey-tutkimuksiin

Tutkimuksensa tulosten perusteella Pyy-Martikainen antaa
suosituksia survey-tutkimuksia tekeville organisaatioille,
survey-pohjaisia mikroaineistoja käyttäville tutkijoille sekä
survey-aineistojen virheiden korjausmenetelmien kehittäjille.

Survey-tutkimuksia tekevien organisaatioiden pitäisi hyödyntää
rekisteripaneeliaineistoa analysoitaessa pitkittäisen
survey-aineiston virhelähteitä.

Ensimmäisen tutkimuskerran kadon ennaltaehkäisy ja korjaaminen
on estimaattien laadun kannalta keskeistä.

Tapahtumahistoriaa koskevien tietojen keräämisessä olisi hyvä
välttää sijaisvastaajaa, ja tapahtuma-aikojen mittaustarkkuuden
tulisi perustua tapahtuma-aikojen jakaumatarkasteluun.

Survey-pohjaisen tapahtumahistoria-analyysin tulisi pohjautua
koko havaittuun aineistoon eikä, kuten tavallisesti, kaikkiin
kiinnostuksen kohteena oleviin tutkimusaaltoihin vastanneiden
aineistoon.

Survey-aineistojen virheiden korjaamiseksi tarvittaisiin
menetelmiä, joilla voitaisiin korjata katoa, poistumaa ja
mittausvirheita ilman, että jouduttaisiin tekemään epärealistisia
oletuksia klassisista mittausvirheistä tai kadon ja poistuman
satunnaisuudesta.

Toimittaja
Liisa Strann

Aineisto

Pyy-Martikainen Marjo. 2013. Statistical analysis of survey-based event history data with application to modeling of unemployment duration. Statistics Finland Research Reports 260. ISSN 1798–8578 ISBN 978–9 52–244–456–1 (pdf) ISBN 978–952–244–455–4 (print) http://www.doria.fi/handle/10024/93412 Avaa

Väitöstiedote: Väitös pitkittäisistä surveytutkimuksista. http://www.abo.fi/public/fi/News/Item/item/7792