Egyetlen oldal mentéséhez a Wayback Machine n keresztül a következő helyre mehetek:

Hogyan archiválhatom a webhelyet rekurzív módon a Wayback Machine segítségével ?


Van néhány projekt, például wayback-machine-downloader , de olyan funkciót keresek, amely lehetővé teszi a webhely rekurzív feltöltését.

Megjegyzések

  • Van-e bármilyen nehézsége az URL-technika használatával megemlítem a kérdésében? Én ' több százszor működtem, de én ' is sokszor kudarcot vallottam. körülbelül 80% -os sikerarányt kap, még ugyanazon oldalak esetében is, különböző dátumokon.

Válasz

Mivel Wayback Machine nem nyújt ilyen funkciót, találtam valamilyen megoldást.

  1. Először tükrözze a webhelyet a wget, pl

    wget -m https://example.com/ 
  2. Ezután a curl paranccsal archiválja az összes oldalt az egyik, amelyet letöltöttél.

    find . -name "*.html" -exec curl -v "https://web.archive.org/save/https://{}" ";" 

    Megjegyzés: Az .html értéket .php, vagy tartalmazzon bizonyos típusú fájlokat.

Megjegyzések

  • Ha a webhely nem használ ' kiterjesztéseket (például html vagy php – mint például az SE beállítása), akkor hogyan módosíthatja a parancsot?
  • megváltoztathatja a -name "*.html" értéket -type f -re az összes fájl felvételére.
  • Hogyan működik ez a lekérdezési paraméterekkel?
  • Úgy tűnik, hogy már ' nem működik: 429 túl sok kérést nyomtat ki
  • A --convert-links az argumentumok szintén hasznosak lehetnek – az előbbi relatívvá teszi a linkeket; ehhez meg kell adni a domain URL-jét a " save / https:///domain&quot fájlba; de segít, ha a webhely nem ' nem használ abszolút URL-eket.

Válasz

Ha kis weboldalt kíván archiválni, akkor az Archív csapat fenntartja az ArchiveBot , egy IRC bot, ahol webhelyek feltérképezését kérheti. Az Archív csapat ezután elküldi a feltérképezett oldalakat az Internet Archívum Wayback Machine-jének.

Megjegyzések

  • Ez hihetetlenül hasznos.

Válasz

A Wayback Machine nem kínál módot egy teljes webhely, csak egyetlen oldal beküldésére. már megtalálható. Ezt megérinti a Wayback Machine GYIK néhány pontja:

Hozzáadhatok oldalakat a Wayback Machine-hez?

Be https://archive.org/web használhatja a " Oldal mentése most " szolgáltatás egy adott oldal egyszeri mentéséhez. Ez jelenleg nem adja hozzá az URL-t a jövőbeni feltérképezésekhez, és nem menti el az egynél többet. oldalak, könyvtárak vagy teljes webhelyek .

és

Hogyan kaphatom webhelyemet a a Wayback Machine?

Archivált webes adataink nagy része saját feltérképezéseinkből vagy az Alexa Internet feltérképezéseiből származik. Egyik szervezet sem " feltérképezi a webhelyemet! " beküldési folyamat . Az Internetes archívum feltérképezése általában olyan webhelyeket talál, amelyek jól kapcsolódnak más webhelyekhez. A legjobb módszer annak biztosítására, hogy megtaláljuk az Ön webhelyét, az az, ha megbizonyosodunk arról, hogy szerepel-e az online könyvtárakban, és hogy hasonló / kapcsolódó webhelyek hivatkoznak-e Önre. p>

Megjegyzések

  • Ez nem válasz a kérdésre. Csak azért, mert nincs hivatalos módja annak, hogy tegye meg, a feladat végrehajtása nem lehetetlen. Valójában elég egyszerűnek kell lennie egy olyan szkript felkorbácsolásában, amely rekurzív linkeket ad hozzá.
  • @db, Úgy tűnik, hogy a kenorb ' válasz az, amit kért. Egyébként ez a válasz nekem jelenleg hasznosabb, mivel csak azt szerettem volna, ha a The WaybackMachine elkapja most nekem egy oldal.

Válasz

Mostantól archiválni lehet egy oldalt és az összes linkelt oldal t. Webhelyének beállításaitól függően meg tudja csinálni a trükköt.

Idézet a közleményből :

Mostantól egyetlen kattintással elmentheti a weboldal összes” outlinkjét “.A „outlinks mentése” jelölőnégyzet bejelölésével elmentheti a kért oldalt és az összes kapcsolódó oldalt is.

Megjegyzések

  • Hol érhető el ez az opció?
  • Én ' szerkesztettem a választ (remélem, hogy ' Elfogadom), hogy a Oldal mentése most használatához Bejelentkezés szükséges ennek a lehetőségnek a használatához (amelyet 2019 végén adtunk hozzá). @kenorb kérjük, fontolja meg az elfogadott válasz megváltoztatását erre!

Válasz

Ez az cikk egy fizetős szolgáltatást is javasol, amely olyan gyakran végzi el a feltérképezést az Ön számára, ahányszor csak szeretné:

  1. Iratkozzon fel az Archive-It fiókra

Archive-It az Internet Archive által biztosított előfizetői szolgáltatás, amely lehetővé teszi saját feltérképező projektjeinek futtatását bármilyen technikai szakértelem nélkül. Mondja el, hogy mi és milyen gyakran kell feltérképeznie, mi pedig végrehajtjuk a feltérképezést, és az eredményeket a Wayback Machine-be helyezzük.

Valószínűleg nem erre törekszel, de néhány vállalkozás számára hasznos lehet ez a szolgáltatás. Feltételezem, hogy ez segít az archive.org finanszírozásában, amely egyébként ingyenes.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük