Löysin äskettäin kaavion upottamisen, kuten DeepWalk ja LINE. Minulla ei kuitenkaan ole vielä selvää ajatusta siitä, mitä kuvaajan upottamisella tarkoitetaan ja milloin sitä (sovelluksia) käytetään? Ehdotukset ovat tervetulleita!
Kommentit
- Kaavion upottaminen on kaavioiden upottaminen! Joten se vie kaavion ja palauttaa upotukset kaavioon, reunoihin tai pisteisiin. Upotukset mahdollistavat samankaltaisuushaun ja helpottavat yleensä koneoppimista tarjoamalla esityksiä .
- @Emre mitä se tarkoittaa upottamalla? 🙂
- Embedin merkityksen mukaan asioiden kiinnittäminen johonkin. Kaavion upotus on eräänlainen kuin piikkien kiinnittäminen pinnalle ja reunojen piirtäminen edustamaan sanottuna verkkoa. Joten esimerkki on kuin tasomainen kaavio voidaan upottaa $ 2D $ -pintaan ilman reunan ylitystä. Reunoille voidaan määrittää painot ja sopivat reunan pituudet. auttaa meitä ymmärtämään / arvioimaan, kun @Emre mainitsi samankaltaisuushaun jne.
- @KiriteeGak Kiitos 🙂 Mitkä ovat heidän todellisen maailman sovelluksensa? He sanovat, että niitä voidaan käyttää suosituksiin ja kaikki? mutta miten?
- Youtube-videosuositukset voidaan visualisoida mallina, jossa parhaillaan katsomasi video on solmu, jota seuraavaksi katsot, ja seuraavat suosituksessasi olevat videot ovat eniten samanlaisia kuin sinä siitä, mitä samankaltaiset käyttäjät ovat seuranneet seuraavaksi, ja tietysti monia muita tekijöitä, mikä on valtava verkko kulkea. Tämä artikkeli on yksinkertainen hyvä lukemus sovelluksen ymmärtämisestä.
vastaus
Kaavion upottaminen oppii kartoituksen verkosta vektoritilaan säilyttäen samalla asiaankuuluvat verkko-ominaisuudet.
Vektoritilat soveltuvat datatieteelle paremmin kuin kaaviot. Kaaviot sisältävät reunoja ja solmuja, nämä verkkoyhteydet voivat käyttää vain tiettyä matematiikan, tilastojen ja koneoppimisen osajoukkoa. Vektoritiloissa on rikkaampi työkalupakki näistä toimialueista. Lisäksi vektoritoiminnot ovat usein yksinkertaisempia ja nopeampia kuin vastaavat graafioperaatiot.
Yksi esimerkki on lähimpien naapureiden löytäminen. Voit suorittaa ”humalaa” solmusta toiseen kaavion solmuun. Monissa tosimaailman kaavioissa parin humalan jälkeen on vähän merkityksellistä tietoa (esim. Ystävien ystävien ystävien suositukset). Vektoritiloissa voit kuitenkin käyttää etäisyystietoja kvantitatiivisten tulosten saamiseksi (esim. Euklidinen etäisyys tai kosini-samankaltaisuus). Jos sinulla on kvantitatiivisia etäisyystietoja mielekkäässä vektoritilassa, lähimpien naapureiden löytäminen on helppoa.
” Kaavion upottamistekniikat, sovellukset ja suorituskyky: tutkimus ”on yleiskatsausartikkeli, joka menee yksityiskohtaisemmin.
Vastaus
Mitä ovat graafin upotukset? ”Kaavion upotukset” on nykyään kuuma alue koneoppimisessa. Se tarkoittaa periaatteessa graafien ”piilevän vektoriesityksen” löytämistä, joka sieppaa kuvaajan topologian (hyvin perustavassa mielessä). Voimme tehdä tämän ”vektoriesityksen” rikkaaksi ottamalla huomioon myös kärkipiste-piste-suhteet, reuna-informaation jne. Kaaviossa on suunnilleen kaksi upotustasoa (tietysti voimme milloin tahansa määrittää enemmän tasoja jakamalla loogisesti koko kuvaajan erikokoisia aligrafeja):
- Vertex Upotukset – Täältä löydät piilevän vektoriesityksen jokainen kyseisen kaavion kärki. Sitten voit verrata eri pisteitä piirtämällä nämä vektorit avaruuteen ja mielenkiintoisesti ”samanlaiset” pisteet on piirretty lähemmäksi toisiaan kuin ne, jotka eivät ole samankaltaisia tai vähemmän yhteydessä toisiinsa. Tämä on sama työ, jonka Perozzi tekee ”DeepWalk” -ohjelmassa.
- Kaavion upotukset – tässä löydät koko graafin piilevän vektoriesityksen. Esimerkiksi sinulla on ryhmä kemiallisia yhdisteitä, joiden osalta haluat tarkistaa, mitkä yhdisteet ovat keskenään samanlaisia, kuinka monta tyyppistä yhdistettä ryhmässä on (klustereita) jne. Voit käyttää näitä vektoreita ja piirtää ne avaruuteen ja löytää kaikki yllä olevat tiedot. Tämän työn tekee Yanardagin ”Deep Graph Kernels”.
Sovellukset – Tarkkaan katsomalla upotukset ovat ”piileviä” esityksiä, mikä tarkoittaa, että kuvaajalla on | V | * | V | vierekkäisyysmatriisi missä | V | = 1M, sen on vaikea käyttää tai käsitellä 1M * 1M-lukuja algoritmissa. Joten ulottuvuuden ”d” piilevä upottaminen, jossa d < < | V |, tekisi vierekkäisyysmatriisin | V | * d ja suhteellisen helpompi käyttää. Toinen sovellus voisi olla – Harkitse yksinkertaista skenaariota, jossa haluamme suositella tuotteita ihmisille, joilla on samanlaisia kiinnostuksen kohteita sosiaalisessa verkostossa.Saamalla kärkipisteiden upotukset (tässä se tarkoittaa jokaisen henkilön vektoriesitystä) voimme löytää samanlaiset piirtämällä nämä vektorit ja tämä tekee suosituksen tekemisestä helppoa. Nämä ovat joitain sovelluksia ja toisia. Voit viitata hienoon kyselyyn – Kaavion upottamistekniikat, tutkimus .
Mistä se kaikki tuli? Tällä alueella on ollut paljon teoksia, ja melkein kaikki on peräisin uraauurtavasta tutkimuksesta luonnollisen kielen käsittelyalalla – Mikolovin ”Word2Vec”. Jos haluat aloittaa graafin upotusten tutkimuksen, suosittelen ensin ymmärtämään Word2Vecin toimintaa. Löydät hienoja selityksiä – Word2Vec-parametrien oppiminen selitetty ja Stanfordin luento . Sitten voit siirtyä luettelossa oleviin papereihin. Nämä teokset voidaan luokitella seuraavasti:
-
”Vertex Embeddings” -työhön perustuvat teokset: – DeepWalk , Node2Vec , LINE .
-
Perustuu ”Kaavion upotukset”: – Deep Graph Ytimet , Subgraph2Vec .
kommentit
- Wowww !! Tämä on ehdottomasti täydellinen vastaus. Kiitos paljon 🙂 Hyvin tehty 🙂
- Hei Mausam Jain. Voitteko ilmoittaa minulle, voinko käyttää kaavio upotuksia tunnistaaksesi tärkeät solmut verkossa?
- Hei, Volka. Vastaamaan tähän kysymykseen minun on tiedettävä minkä tyyppistä kuvaajaa työskentelet; onko se twitter, facebook, reddit vai jotain muuta?
- Kiitos vastauksestasi. Työskentelen todella sosiaalisessa verkostossa, jossa haluan tunnistaa eniten sosiaalisia ihmisiä 🙂
- Tässä ’ on tarkempi versio tästä vastauksesta. suuntaandatascience.com/…
Vastaa
Paperissa Levin ym. satunnaisten pisteiden tuotekaavioiden omnibusin upottamisen keskeinen rajalauseke. paperi, tietyn tyyppinen kuvaajan upottaminen (Omnibus-upotus) määrittelee kuvaajan upottamisen metodologiana ”, jossa kuvaajan kärjet kartoitetaan vektoreihin matalaulotteisessa euklidisessa avaruudessa”. Tarkista linkki saadaksesi lisätietoja.
Kommentit
- tervetuloa foorumille. Jos haluat mainita paperin, kirjoita myös osan nimi tekstiin (koska linkit voivat olla rikki).