Cześć, nazywam się pixel. Mam 23 lata, problemy w szkole, zastój tworczy, jazdy ze starymi, chorobę Scheuermanna, wrodzony talent do komplikowania sobie życia i... Ech, szkoda gadać...
Po prostu przejebane.
Wpisy z kategorii 'Art'
27
12

now loopin’: NOT - To Taka Gra

Lobo, Superman, czy Spiderman nigdy mnie nie ruszali, za to nie można było mnie oderwać od Szninkla, czy Osiedla Swoboda. Mam dość specyficzny gust, jeżeli chodzi o komiksy. Wstyd się przyznać, ale nie pamiętam już kiedy ostatni raz miałem w łapach Produkt, czy coś równie interesującego… Ale jest kilka internetowych wytwórni pasków, których odwiedzanie poprawia mi humor. Znasz Sinfest? Tatsuya Ishida wyprodukowal już ponad 2600 pasków z przygodami Slick’a, Nique i reszty bandy.

Wpadłem ostatnio na pomysł, żeby zdobyć je wszystkie. Nie ma nigdzie gotowej paczki, więc trzeba zrobić to samemu. Żeby oczywiście nie było za lekko, okazało się, że nazwy plików zawierają daty wydania, a nie same numery odcinków. Narzędzia zbrodni? Ja wybralem BASH’a i cURL’a :)

sinfestdl.gif

Skrypt odpalamy na każdej maszynie z bash’em klepiąc ./dl.sh. Nie zapomnij o utworzeniu katalogu img/w katalogu ze skryptem, do którego zapisywane będą paski komiksu. Legenda:

$ddd - double digit day
$ddm - double digit month
curl -x 209.81.96.54:8080 - adres serwera proxy, przez który puszczamy cały ruch. Nie chcemy przecież, żeby właściciel się zorientował, że kto właśnie zużył mu ponad 130MB quoty i w ramach zemsty zablokował nam dostęp do nowych odcinków ;) Chociaż z drugiej strony - oglądając je strona po stronie wygenerowalibyśmy większy ruch… :P

Teraz wypadałoby się wytłumaczyć z niechlujnego algorytmu, z którego wynikałoby m.in, że każdy miesiąc ma 31 dni… W historii publikacji komiksu zdarzały się dni, a nawet tygodnie, kiedy nie był on publikowany i w przypadku próby sciągnięcia takiego pliku kończymy z plikiem tekstowym z komunikatem błędu zwróconym przez serwer. Skoro i tak będziemy musieli to odcedzić, to załatwimy przy okazji dni, które nie istnieją (np. 31 lutego). Wystarczy posortować pliki wg. rozmiaru i wywalić najmniejsze (przyda się włączenie podglądu miniaturek zawrtości plików).

Kilka podpowiedzi na koniec: serwery proxy możesz znaleźć na proxy-list (podrzucił Malin). Czasami zdarza się, że proxy dostaje timeout, plik nie zostaje pobrany i curl przechodzi do następnego (i często pomija w ten sposób po kilkanaście odcinków z rzędu) - Na koniec, po odcedzeniu śmieci, przelicz pliki, zeby upewnić się, że masz komplet. Przy okazji odkryłem również, że w archiwum sinfest’a jest błąd w numeracji - brakuje jednego numeru, choć komiksy ukazały się dzień po dniu ;)

linkdump