Tölts le teljes weboldalt wget-tel - janupclos.janu.hu/wp-content/uploads/2016/01/01_02_16_wget.pdf · 2016. 1. 6. · LinuxOS Magazine – 2016. január. PCLinuxOS Magazine Page

Post on 25-Feb-2021

0 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

Transcript

PCLinuxOS Magazine Page 1

Írta: Paul Arnote (parnote)

Szerettél volna valaha is online talált információkatmenteni, megőrizni, de túl nehéznek és időrablónaktaláltad az egyes oldalak letöltését? Vagy esetleglélekölőnek találtad az egyes oldalak kinyomtatását,akár papírra, akár PDF fájlba? Vagy kellett mármentened egy, vagy több weboldaladat?

Semmi gáz, a wget megmenthet téged. A wget-telteljes weblapokat, vagy csak részét letöltheted. Bekell vallanom, hogy a cikk „ötletét” a Linux Journalezen 2008-as cikke adta.

VIGYÁZAT! NE HASZNÁLD az eljárást nagy fájlokattartalmazó, vagy nagyon nagy weboldalakon! Nagyvalószínűséggel ki fogsz fogyni a tárolókapacitásból.Emellett, sokáig tart azon fájlok letöltése – és mégtovább a nagy fájloké. Még az olyan oldalak is, minta PCLinuxOS Magazine-ém több mint 2 GB adatotés fájlt tartalmaznak. Szintén, NE foglald le ugyanazt

a weboldalt újra, meg újra. Továbbá, bizonyostartalmakat nem szabad letölteni (pl. jelszó fájlok,bankkártya információk, stb.) és „helytelen internetesviselkedés” olyan adatok, vagy tartalmak piszkálása,amikhez normálisan nem lenne hozzáférésed.

A figyelmeztetések után, próbáljunk némi alapvetőismeretet szerezni a wget-ről magáról és haszná-latáról.

A wget parancssori eszköz (hé, ne bátortalanodj el,ha grafikus srác, vagy csaj lennél). Ha beírod a wget--help-et terminálba, akkor ez lesz az első, amit látnifogsz:

Usage: wget [OPTION]... [URL]...

Majd ezt követi pár ezer (szélsőségesen sok) opció.

Kétségtelen, hogy a wget RENGETEG opcióval bír,ami a wget erejét mutatja. Ugyanakkor, ezen opciókösszessége egy új wget-felhasználó számára túlzás.Nem fogunk ebben a cikkben mindent érinteni,

amire a wget képes. A cikk leginkább arra vállalko-zik, hogy bemutassa a wget-et és megértesse annakhasználatát.

Akkor, most vessünk egy pillantást a wgetparancsra. Ha már megnézted így egyben, akkorelemeire fogjuk szedni. A parancsot egyetlen,összefüggő sorként kell beírni.

wget -x -r -np -k -vhttp://pclosmag.com/html/Issues/201511/ -P/home/parnote-toshiba/Downloads/PCLOSMag/

Szedjük szét a parancsot. Természetesen a wgetutasítással indítunk. A követő -x megmondja a wget-nek, hogy a könyvtár létrehozását erőltesse. A -rhatására a wget rekurzívan beolvassa a kiindulóalatti könyvtárakat is. Következik a -np opciójelentése „no parents,” mondja a wget-nek, hogy netöltse le a hierarchiában fölötte álló könyvtárakat. A-k a következő opció, utasítva a wget-et a fájlbakerülő hivatkozások konvertálására a helyifelhasználáshoz, a -v bekapcsolja bőbeszédű

Tölts le teljes weboldalt wget-telLinuxOS Magazine – 2016. január

PCLinuxOS Magazine Page 2

módot, ami a letöltés előrehaladásáról ad rengeteginformációt.

A http://pclosmag.com/html/Issues/201511/ opciómeghatározza a weblap letöltésének kiindulóoldalát, ami megegyezik a letölteni tervezetthonlapon az információt tartalmazó könyvtárral. AMagazin honlapján az egyes hónapok HTML fájljai a/html/Issues könyvtárban vannak, minden hónap egynégyjegyű év és kétjegyű hónap adattalmeghatározott alkönyvtárban. Így, a 2015.decemberi kiadás HTML változatának letöltéséhez a201511-et ki kell cserélni 201512-re, illetve a 2010.márciusi szám HTML változatához pedig a 201511-et 201003-ra cserélni.

Végül, a -P /home/parnote-toshiba/Downloads/PCLOSMag/ opció mondja meg a wget-nek, hogyhová mentse a letöltött fájlokat. Ebben az esetbenaz én /home könyvtáram (/home/parnote-toshiba)Downloads könyvtárának /PCLinuxOSMag alkönyv-tárába. A beírás a /home könyvtárad pontos nevétől,és attól függ, hogy hová akarod az általad letöltöttfájlokat menteni.

Ez a parancs majdnem az összes, a PCLinuxOSMagazine 2015. novemberi számának HTMLváltozatához tartozó fájlt letölti a számítógépedáltalad meghatározott könyvtárába. Lesznek olyanfájlok, amiket nem tölt le, mint az egyes számokbanmegjelenített reklámok. Ezek egy másik könyvtárbantalálhatók, „off limits” jelölés alatt az adatgyűjtőprogramok számára. Ezeket a könyvtárakat aRobots.txt fájl határozza meg a Magazin honlapján.

Van néhány wget parancsopció, ami nem használ-ható egymással. Ilyen a -nc opció, ami a „no-clobber” (nincs rátöltés) helyett áll. Ez nemkompatibilis a -k opcióval, ami konvertálja az összeshivatkozást, hogy a kapcsolat nélküli fájlok rendbenműködjenek. A „no-clobber” lehetővé teszi a letöltésfolytatását onnan, ahol abbahagytad, nem felülírva amár a letöltés teljes végrehajtása előtti kilépéstmegelőzően letöltötteket. Egy másik a -O opció a

letöltési fájl nevének megadásához (igen, a wgetképes egyetlen fájlt is letölteni). Ismét csak, nemkompatibilis a -k opcióval. Biztos vagyok benne,hogy még vannak ezen felül inkompatibilitások,amiket még nem fedeztem fel.

Természetesen, ha a wget összes opcióját nézzük,lehetnek még további olyan parancsok, amik érde-kelhetnek. Első a -D pclosmag.com megmondja awget-nek, hogy ne kövesse a pclosmag,comdomain-ről kilépő hivatkozásokat. Másik a -p, a --p-requisites helyett, megmondja a wget-nek, hogyszedje le a HTML oldal helyi megjelenítéséhezszükséges összes képet, css stíluslapot stb.-t.Harmadik a -o opció, lehetővé téve a wget számáraegy log fájl meghatározását, amibe kiírja azinformációkat, ahelyett, hogy a terminál képernyőjénjelenítené meg. Negyedik a --user [username] és --password [password] (lecserélve a [username]-et

és [password]-öt adott felhasználóra és jelszóra)átadja az adott mezőket, amennyiben felhasználótés jelszót igénylő oldalra mész. Végül a -m opció azegész weblapot letükrözi a helyi számítógépre, azadott kiindulási ponttól kezdve. Mindent megkapsz,kivéve azokat a könyvtárakat, amik a Robots.txtfájlban off-limit-ként vannak megjelölve.

A wget kétségkívül az online szköztár egyik nagyonhasznos eszköze. Remélem, hogy a bemutató adottnémi betekintést és megmutatta a wget hatalmaserejét. Javaslom, hogy ismerd meg a wget számostovábbi elérhető opcióját is.

linuxfordummies.org

There Are No Stupid Questions

Figyeld meg az URL címsort. A Firefox a helyi fájlt mutatja… és az összes hivatkozás is él!

Tölts le teljes weboldalt wget-tel

top related