Egyetlen oldal mentéséhez a Wayback Machine n keresztül a következő helyre mehetek:
Hogyan archiválhatom a webhelyet rekurzív módon a Wayback Machine segítségével ?
Van néhány projekt, például wayback-machine-downloader
, de olyan funkciót keresek, amely lehetővé teszi a webhely rekurzív feltöltését.
Megjegyzések
- Van-e bármilyen nehézsége az URL-technika használatával megemlítem a kérdésében? Én ' több százszor működtem, de én ' is sokszor kudarcot vallottam. körülbelül 80% -os sikerarányt kap, még ugyanazon oldalak esetében is, különböző dátumokon.
Válasz
Mivel
-
Először tükrözze a webhelyet a
wget
, plwget -m https://example.com/
-
Ezután a
curl
paranccsal archiválja az összes oldalt az egyik, amelyet letöltöttél.find . -name "*.html" -exec curl -v "https://web.archive.org/save/https://{}" ";"
Megjegyzés: Az
.html
értéket.php
, vagy tartalmazzon bizonyos típusú fájlokat.
Megjegyzések
- Ha a webhely nem használ ' kiterjesztéseket (például html vagy php – mint például az SE beállítása), akkor hogyan módosíthatja a parancsot?
- megváltoztathatja a
-name "*.html"
értéket-type f
-re az összes fájl felvételére. - Hogyan működik ez a lekérdezési paraméterekkel?
- Úgy tűnik, hogy már ' nem működik: 429 túl sok kérést nyomtat ki
- A
--convert-links
az argumentumok szintén hasznosak lehetnek – az előbbi relatívvá teszi a linkeket; ehhez meg kell adni a domain URL-jét a " save / https:///domain" fájlba; de segít, ha a webhely nem ' nem használ abszolút URL-eket.
Válasz
Ha kis weboldalt kíván archiválni, akkor az Archív csapat fenntartja az ArchiveBot , egy IRC bot, ahol webhelyek feltérképezését kérheti. Az Archív csapat ezután elküldi a feltérképezett oldalakat az Internet Archívum Wayback Machine-jének.
Megjegyzések
- Ez hihetetlenül hasznos.
Válasz
A Wayback Machine nem kínál módot egy teljes webhely, csak egyetlen oldal beküldésére. már megtalálható. Ezt megérinti a Wayback Machine GYIK néhány pontja:
Hozzáadhatok oldalakat a Wayback Machine-hez?
Be https://archive.org/web használhatja a " Oldal mentése most " szolgáltatás egy adott oldal egyszeri mentéséhez. Ez jelenleg nem adja hozzá az URL-t a jövőbeni feltérképezésekhez, és nem menti el az egynél többet. oldalak, könyvtárak vagy teljes webhelyek .
és
Hogyan kaphatom webhelyemet a a Wayback Machine?
Archivált webes adataink nagy része saját feltérképezéseinkből vagy az Alexa Internet feltérképezéseiből származik. Egyik szervezet sem " feltérképezi a webhelyemet! " beküldési folyamat . Az Internetes archívum feltérképezése általában olyan webhelyeket talál, amelyek jól kapcsolódnak más webhelyekhez. A legjobb módszer annak biztosítására, hogy megtaláljuk az Ön webhelyét, az az, ha megbizonyosodunk arról, hogy szerepel-e az online könyvtárakban, és hogy hasonló / kapcsolódó webhelyek hivatkoznak-e Önre. p>
Megjegyzések
- Ez nem válasz a kérdésre. Csak azért, mert nincs hivatalos módja annak, hogy tegye meg, a feladat végrehajtása nem lehetetlen. Valójában elég egyszerűnek kell lennie egy olyan szkript felkorbácsolásában, amely rekurzív linkeket ad hozzá.
- @db, Úgy tűnik, hogy a kenorb ' válasz az, amit kért. Egyébként ez a válasz nekem jelenleg hasznosabb, mivel csak azt szerettem volna, ha a The WaybackMachine elkapja most nekem egy oldal.
Válasz
Mostantól archiválni lehet egy oldalt és az összes linkelt oldal t. Webhelyének beállításaitól függően meg tudja csinálni a trükköt.
Idézet a közleményből :
Mostantól egyetlen kattintással elmentheti a weboldal összes” outlinkjét “.A „outlinks mentése” jelölőnégyzet bejelölésével elmentheti a kért oldalt és az összes kapcsolódó oldalt is.
Megjegyzések
- Hol érhető el ez az opció?
- Én ' szerkesztettem a választ (remélem, hogy ' Elfogadom), hogy a Oldal mentése most használatához Bejelentkezés szükséges ennek a lehetőségnek a használatához (amelyet 2019 végén adtunk hozzá). @kenorb kérjük, fontolja meg az elfogadott válasz megváltoztatását erre!
Válasz
Ez az cikk egy fizetős szolgáltatást is javasol, amely olyan gyakran végzi el a feltérképezést az Ön számára, ahányszor csak szeretné:
- Iratkozzon fel az Archive-It fiókra
Archive-It az Internet Archive által biztosított előfizetői szolgáltatás, amely lehetővé teszi saját feltérképező projektjeinek futtatását bármilyen technikai szakértelem nélkül. Mondja el, hogy mi és milyen gyakran kell feltérképeznie, mi pedig végrehajtjuk a feltérképezést, és az eredményeket a Wayback Machine-be helyezzük.
Valószínűleg nem erre törekszel, de néhány vállalkozás számára hasznos lehet ez a szolgáltatás. Feltételezem, hogy ez segít az archive.org finanszírozásában, amely egyébként ingyenes.