Luin tämän linkin osan 2 ensimmäisestä kappaleesta, joka kertoo hot decistä ”” se säilyttää nimellisarvojen jakauman ””.

En ymmärrä, että jos yhtä ja samaa luovuttajaa käytetään monille vastaanottajille, tämä voi vääristää jakelua vai kaipaanko jotain täällä?

Hot Deck-imputoinnin tuloksen on oltava riippuvainen sovitusalgoritmista, jota käytetään luovuttajien sovittamiseen vastaanottajiin?

Yleisempää, tietääkö kukaan viitteitä, joissa verrataan hotdeckiä useisiin imputointeihin?

Kommentit

  • En tiedä kuumakannen imputointia, mutta tekniikka kuulostaa ennustavalta keskiarvolta (pmm). Ehkä löydät vastauksen täältä?
  • Ei ole paljon käytännön järkeä verrata yksittäisen imputointimenetelmää (kuten hot-deck) moninkertaiseen imputointi: moninkertainen imputointi on aina erinomaista ja on melkein aina vähemmän kätevää.

Vastaa

Puuttuvien hot-deck-imputointi arvot on yksi yksinkertaisimmista yksittäisistä imputointimenetelmistä.

Intuitiivisesti ilmeinen menetelmä on, että puuttuvan arvon omaava tapaus saa kelvollisen arvon tapauksesta, joka on valittu satunnaisesti niistä tapauksista, jotka ovat maksimaalisesti samanlaisia kuin puuttuu yksi, perustuu joihinkin käyttäjän määrittelemiin taustamuuttujiin (näitä muuttujia kutsutaan myös ”kannen muuttujiksi”). Luovuttajatapauksia kutsutaan kanneksi.

Peruskenaariossa – ei taustan ominaisuuksia – voit ilmoittaa kuuluvan samoihin n -tapauksiin. tietojoukko on se ja ainoa ”taustamuuttuja”; silloin imputointi on vain satunnainen valinta n-m kelvollisista tapauksista luovuttajiksi m -tapauksille, joilta puuttuu arvo. Satunnainen korvaaminen on hot-deckin ydin.

Korrelaatioon vaikuttavien arvojen ajatuksen huomioon ottamiseksi käytetään täsmällisempiä muuttujia. Voit esimerkiksi laskea 30-35-vuotiaan valkoisen miehen puuttuvan vasteen luovuttajista, jotka kuuluvat kyseiseen erityisominaisuuksien yhdistelmään. Taustaominaisuudet tulisi – ainakin teoreettisesti – liittää analysoitavaan ominaisuuteen (lasketaan); yhdistyksen ei kuitenkaan pidä olla tutkimuksen kohteena – muuten se tapahtuu, teemme kontaminaation imputoinnin avulla.

Kuumakannen imputointi on edelleen suosittua, koska se on sekä yksinkertaista että idea ja sopii samalla tilanteisiin, joissa puuttuvien arvojen käsittelymenetelmät, kuten listwise deletion tai mean / mediaan korvaaminen , eivät toimi, koska puutteet on jaettu dataan ei kaoottisesti – ei MCAR-mallin mukaan (puuttuu kokonaan satunnaisesti). Hot-deck soveltuu kohtuullisesti MAR-malliin (MNAR: lle moninkertainen imputointi on ainoa kunnollinen ratkaisu). Hot-deck, koska se on satunnaista lainaa, ei puolue marginaalijakaumaa, ainakin potentiaalisesti. Se voi kuitenkin vaikuttaa korrelaatioihin ja vääristää regressioparametreja; tämä vaikutus voitaisiin kuitenkin minimoida monimutkaisemmilla / kehittyneemmillä hot-deck-menettelyjen versioilla.

Hot-deck-imputoinnin puute on, että se vaatii, että yllä mainitut taustamuuttujat ovat varmasti kategorisia (kategorisen vuoksi ei tarvita erityistä ”sovitusalgoritmia”); kvantitatiiviset kannen muuttujat – eritellä ne luokkiin. Mitä tulee muuttujiin, joilta puuttuu arvo – ne voivat olla minkä tahansa tyyppisiä, ja tämä on menetelmän etu (monet yksittäisen imputoitumisen vaihtoehtoiset muodot voivat johtua vain kvantitatiivisista tai jatkuvista ominaisuuksista).

Toinen kuuma -deck-imputointi on tämä: kun lasketaan puutteet useista muuttujista, esimerkiksi X ja Y, eli suoritetaan imputointifunktio kerran X: llä, sitten Y: llä, ja jos tapaus i puuttui molemmista muuttujista, i: n imputointi Y: ssä ei liity siihen, mikä arvo oli laskettu i: ssä X: ssä; toisin sanoen X: n ja Y: n mahdollista korrelaatiota ei oteta huomioon laskettaessa Y: tä. Toisin sanoen syöttö on ”yksimuuttujainen”, se ei ”tunnista” riippuvaisen ”(ts. vastaanottajan potentiaalista moniarvoista luonnetta) muuttujat. $ ^ 1 $

Älä väärinkäytä hot-deck-imputointia. Missing-ilmoitusten tekeminen on suositeltavaa vain, jos muuttujasta puuttuu enintään 20% tapauksista. Potentiaalikanta luovuttajien on oltava riittävän suuria. Jos luovuttajia on yksi, on vaarallista, että epätyypillinen tapaus laajentaa epätyypillisyyttä muihin tietoihin.

Lahjoittajien valinta korvaavilla tai korvaamattomilla . Se on mahdollista tehdä kummallakin tavalla: Ei korvaavalla järjestelmällä satunnaisesti valittu luovuttajan tapaus voi laskea arvoa vain yhdelle vastaanottajalle.Luvanvaihtojärjestelmässä luovuttajasta voi tulla jälleen luovuttaja, jos se valitaan satunnaisesti uudelleen, mikä johtuu useista vastaanottajan tapauksista. Toinen hallinto voi aiheuttaa vakavaa jakautumisharhaisuutta, jos vastaanottajataustoja on paljon, kun taas luovuttamiseen soveltuvia luovuttajatapauksia on vähän, sillä silloin yksi luovuttaja laskee arvonsa monille vastaanottajille; Kun on paljon luovuttajia, joista valita, puolueellisuus on siedettävää. Korvaamaton tapa ei johda ennakkoluuloihin, mutta se voi jättää monet tapaukset selväksi, jos luovuttajia on vähän.

Melun lisääminen . Klassinen hot-deck-imputointi vain lainaa (kopioita) sellaisenaan. On kuitenkin mahdollista ajatella satunnaisen melun lisäämistä lainattuun / laskennalliseen arvoon, jos arvo on kvantitatiivinen.

Osittainen ottelu kannen ominaisuuksissa . Jos taustamuuttujia on useita, luovuttajatapaus voidaan valita satunnaisesti, jos se vastaa kaikkia taustamuuttujia joihinkin vastaanottajan tapauksiin. Yli 2 tai 3 tällaista kannen ominaisuutta tai kun ne sisältävät monia luokkia, on todennäköistä, ettei tukikelpoisia luovuttajia löydy lainkaan. Voittaakseen on mahdollista vaatia vain osittainen ottelu tarpeen mukaan, jotta luovuttaja voidaan hyväksyä. Edellytetään esimerkiksi k minkä tahansa kannen muuttujien g vastaavuutta. Voit myös vaatia vastaavuuden kannen muuttujien k ensimmäinen luetteloon g. Suurempi on tapahtunut, että k potentiaaliselle luovuttajalle, sitä suurempi on sen potentiaali valita satunnaisesti. [Osittainen ottelu samoin kuin korvaaminen / korvaaminen toteutetaan SPSS: n hot-dock-makrollani.]


$ ^ 1 $ Jos vaadit tämän huomioon ottamista, sinulle saatetaan suositella kahta vaihtoehtoa : (1) Y: n laskennassa lisää jo laskettu X taustamuuttujien luetteloon (sinun pitäisi tehdä X kategorinen muuttuja) ja käyttää hot-deck-imputointitoimintoa, joka sallii osittaisen sovituksen taustamuuttujiin; (2) ulotetaan Y: n yli imputointiratkaisu, joka oli syntynyt X: n imputoinnissa, eli käytä samaa luovuttajatapausta. Tämä toinen vaihtoehto on nopea ja helppo, mutta se on X: lle tehdyn imputoinnin tiukka toisto Y: ssä – kahden imputointiprosessin välillä ei ole mitään riippumattomuutta – joten tämä vaihtoehto ei ole hyvä .


kirjoita kuvan kuvaus tähän

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *