U organizaciji Botmaster Labs, nije planirano. Nema vremena, video je potreban za takmičenje, kao novi trend, mada je lakše sve objasniti dobrim snimcima ekrana (moj IMHO), a ne želim baš ništa da snimam. Tako da je ostalo jako malo profitabilnih, glupi spam vise ne vlada uopste, ovde treba razmisliti i niko nece paliti temu, samo da se oni zastareli pokusaju malo ugurati i napudrati u prelepi omot. :) Ali ovo nije o nama. Generalno, ova 3 "ne", mislim, u osnovi su postala barijera za učešće u takmičenju za većinu potencijalnih učesnika. To je kao da popravite automobil od tri: jeftino, kvalitetno, brzo - usluga može ispuniti samo 2 uslova istovremeno. sedi i biraj šta ti je bliže. :) Konkurencija je ista: imam vremena, mogu da snimam video, ali nemam temu, ili mogu da napravim video, imam temu, ali nemam vremena, ili imam slobodnog vremena i imam malu temku, ali video je strasan. Ali dobro je ako su istovremeno ispunjena 2 uslova. Pa, ok, ostavimo stihove. Nastaviću sebi. Nisam planirao, što znači da sam učestvovao na konkursu, čak sam birao za koji članak ću glasati. Reci šta hoćeš, ali Doz veoma dobro poznaje softver i zna kako da ga koristi veoma razumno. Ali danas sam saznao da se intriga pojavila na takmičenju. Ispostavilo se da neću moći da glasam, ali to će moći da urade samo početnici koji su kupili softver 2011. godine i konkurs je za njih osmišljen. Malo sam se iznenadio, ali vlasnik je majstor. Konkurs je reklamna kampanja i Aleksandar bolje zna kako da je sprovede. Uglavnom, odlučio sam tada da objavim članak, nešto je lakše napisati kada je jasno za koga, za cijeli kolektivni farmu to je zapravo nemoguće učiniti.
Dugi uvod je završen, sada na stvar.
Šta je potrebno početniku kada je nabavio takav super-žetač, a to je kompleks Xrumer + Hrefer? Tako je, naučite kako da radite na tome i odbacite iluziju da možete zaraditi novac ako počnete da šaljete neželjenu poštu sa listovima. Ako tako mislite, odmah donirajte svoj novac u dobrotvorne svrhe. Morate naučiti kako koristiti alate kompleksa, po mogućnosti tako da ga sami izoštrite. Vrijeme "uzmi više - bacaj više" je nestalo. Količina ustupa mjesto kvaliteti. Dakle, mi ćemo prikupiti bazu za sebe, nemojte naučiti kako to učiniti - zaostat ćete za vozom. Naravno, Hrefer će nam pomoći u tome. Ako planirate promovirati svoje resurse na Google-u, onda moramo tražiti i donatorske stranice putem Google-a. Mislim da je ovo jasno i logično. Ali Google, kao vlasnik bakarne planine, ne poklanja svoje bogatstvo svima. Potreban vam je pristup tome. Odmah želim da kažem da se nemojte nadati da ćete uspeti da prikupite nešto na osnovu znakova koje nađete u javnosti. Zato su i dostupni javnosti, jer su bezvrijedni. Neću dalje razvijati temu. Bolje da vam kažem kako ga pravilno sastaviti tako da vidite rezultat, ostalo ćete završiti sami, glavno je razumjeti princip. Potrebno je prikupljati na ispravnoj osnovi na osnovu konkretnih motora koji su nam potrebni, a ne na osnovu foruma općenito. Ovo je glavna greška koju prave novajlije – ne da se koncentrišu na konkretno, već da pokušavaju da pokriju sve u celini. Pa ipak, ako želite da raščlanite više ili manje normalnu bazu, odbijte da je koristite u upitima operatora. Nema "inurl:", "site:", "title" itd. Google će trenutno zabraniti pretraživače poput vas. Stoga pažljivo proučavamo motore s kojima Hrumer trenutno radi:
Pokreće php-Fusion
U verziji Hrumer 7.07 program je obučen u nekoliko novih motora:
forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, itd.
phpBB-fr.com, Solaris phpBB tema
A proces učenja novih stvari se nastavlja kontinuirano.
Općenito, moramo pripremiti ispravne upite za raščlanjivanje od strane Hrefera. Uzmimo forum djoka kao primjer. SMF Forumi... I počnimo ga rastavljati na dijelove za raščlanjivanje. U tome će nam pomoći naš voljeni Google. Unošenje zahtjeva u Google SMF Forumi- ima puno smeća u rezultatima pretrage, premotavamo na neku 13. stranicu i biramo bilo koji link. Naišao sam na ovo: http://www.volcanohost.com/forum/index.php?topic=11.0. Otvaramo ga i pregledavamo. Moramo pronaći nešto karakteristično na stranici što se može primijeniti na pretragu drugih stranica na ovom motoru. U podnožju primjećujemo sljedeći natpis Pokreće SMF 1.1.14, citiramo ga i unesemo u Google, pokazuje nam da za ovaj zahtjev zna oko 59 miliona opcija. Brzo pregledamo linkove, dodamo još par ili dvije opcije ovoj ključnoj riječi, na primjer, "Powered by SMF 1.1.14" topola ili "Powered by SMF 1.1.14" viagra... Uvjereni smo da je zahtjev prekrasan, u rezultatima postoje samo forumi i skoro da nema smeća za vas.
Osim toga, ne zanima nas kvantitet, već kvalitet, kao što sam već rekao. Pomakni se. Sa istog foruma preuzimamo još jednu frazu iz podnožja: , također ga citiramo i dostavljamo Googleu. Kao odgovor, otkriva da zna više od 13 miliona rezultata. Opet, pregledavamo rezultate pretraživanja, dodajemo dodatne riječi i provjeravamo rezultate s njima. Vodimo računa da upit bude odličan i da skoro da nema smeća. Generalno, već postoje 2 željezna zahtjeva. Predlažem da za sada ostavite prvi forum na miru i da nastavite sa prikupljanjem zahtjeva za druge forume. Srećom, Google je otvoren na zahtjev 2006-2008, Simple Machines LLC... Uzimamo iz rezultata, na primjer, ove forume: http://www.snowlinks.ru/forum/index.php?topic=1062.0 i http://litputnik.ru/forum/index.php?action=printpage; topic=380.0 u njihovim podnožjima uzimamo sljedeće upite: "Powered by SMF 1.1.7" i "Powered by SMF 1.1.10" (Uvijek savjetujem da se za Hrefer vozi pod navodnicima, jer nam je prije svega potreban kvalitet). Mislim da je jasno šta radimo, na kraju ćemo imati određenu bazu upita za traženje foruma na SMF engine-u (odabrano je za primjer, sa ostalim motorima je isto).
To će izgledati otprilike ovako:
"Pokreće SMF 1.1.2"
"Pokreće SMF 1.1.3"
"Pokreće SMF 1.1 RC2"
"Pokreće SMF 1.1.4"
"Pokreće SMF 1.1.8"
"Pokreće SMF 1.1.7"
"2006-2008, Simple Machines LLC"
I to nije sve. Prilikom prikupljanja verzija motora, na nekim SMF forumima u podnožju nalazimo nadvis "2001-2006, Lewis Media". Provjeravamo ovaj zahtjev, on nas također u potpunosti zadovoljava. Nalazimo sličan upit: "2001-2005, Lewis Media". Prolazeći kroz podnožja, nalazimo sljedeći upit: "SMFone dizajn od A.M.A, portiran na SMF 1.1". Provjeravamo - odlično. itd. Pola sata rada i imate prekrasnu bazu upita za motor, a Google će biti zabranjen za ove upite mnogo rjeđe nego ako u njima koristite operatere. A u isto vrijeme, vaša baza podataka će biti mnogo čistija nego ako koristite upite poput "index.php? Topic =", jer ovdje će Google dati ne samo forume koji su nam potrebni, već i puno preostalih resursa gdje smo uspjeli otići link do teme foruma. Možete se svađati, kažu, šta je loše u tome? Drugi su napustili vezu, što znači da možemo. Ali! Linkove može ostaviti ne samo Hrumer, već i drugi programi. štaviše, mogu se posebno izoštriti da ostavljaju komentare u određenom resursu, takozvani visoko specijalizovani softver, plus takve veze mogu se ostaviti ručno. Opet ću ponoviti da nam nije bitna količina smeća, već kvalitet, baza sa ispravnim zahtjevima i tako ćemo skupljati. Prednost ove metode je što praktički ne morate konfigurirati u Hreferu sito -filter
, možete ga jednostavno isključiti, jer vam Google praktično neće dati smeće.
Vjerujem da je jako važno naučiti kako se Hrefer pravilno koristiti u početnoj fazi, jer naučivši to, Hrumeru uvijek možete pronaći primjenu, ma kako se situacija promijenila. Zaštite se usložnjavaju, a ako je na nekim tipovima motora zaštita pojačana i Hrumer trenutno ne može da se nosi s tim, onda nema smisla trošiti sredstva na prikupljanje ovih linkova, a zatim na rad na njima sa Hrumerom , bolje se fokusirati na ono što daje rezultat... A u isto vrijeme, ako je tim Botmaster Labsa naučio Hrumera nečemu novom, možete brzo secirati novog pacijenta i pripremiti bazu za Hrumera dok je pacijent još mlak. Vrijeme je novac, resurs možda više nije relevantan kada kupite bazu. neko prikupio. Osim toga, ispravna kolekcija baza za sebe značajno proširuje "bijelu" upotrebu Hrumera. I upravo tu se sve kreće, htjeli mi to ili ne, i u toku je proces izbjeljivanja ili sijedenja. Crne čaršave su prošlost.
Svi ostali, već tehnički aspekti rada sa Hreferom, mogu se vidjeti u pomoći i nema smisla zadržavati se na njima, svi ciljevi-poeni-sekunde se postavljaju empirijski za svaki automobil pojedinačno.
Kao bonus, postaviću ovde šablon za raščlanjivanje kineskog pretraživača Baidu, neki dan su me pitali za to, pa sam to uradio između vremena, izvinite na igri reči. :)
Ime hosta = http://www.baidu.com
Upit = s?Wd =
LinksMask =
Ukupno stranica = 100
NextPage =
NextPage2 =
CaptchaURL =
CaptchaImage =
CaptchaField =
Pokušao sam da ih raščlanim testom, nije bilo zabrane, Hrefer je živo prikupljao resurse, svi zahtjevi za raščlanjivanje su bili slični Googleovim, ali kineski resursi su bili more, i sa visokim PR-om, a osim toga, bilo je mnogo mjesta gdje su Evropljanina noga nije išla. Bolje je analizirati sa kineskim zahtjevima. Ovo će pomoći Google-prevoditelju, otkucati listu ključnih riječi na ruskom i prevesti je na kineski. Istina u " riječi„Reči se ne mogu dodavati na kineskom, morate ih prekodirati.
Umjesto kineskog:
伟哥 - viagra
吉他 - gitara
其他 - odmor
保险公司 - osiguranje
Stavite ove kodove da ih zamijenite u word fajlu:
% E4% BC% 9F% E5% 93% A5
% E5% 90% 89% E4% BB% 96
% E5% 85% B6% E4% BB% 96
% E4% BF% 9D% E9% 99% A9% E5% 85% AC% E5% 8F% B8
Ako promovirate web stranicu za osiguranje, onda postavljanjem linka u svoj profil na tematski (!) Čak i kineski forum pronađen na zahtjev " Forum SMF "保险公司 biće veoma lepo.
U zaključku, želio bih reći da nikad nisam razumio ljude koji su se žalili da su Khreferi loši ili nisu nažvrljani, uvijek sam htio ovo reći, samo ne znate kako ih kuhati. Bolje od hrefera, nijedan parser ne zna kako prikupiti rezultate, samo zahtjevi moraju biti tačni. Hrefer je auto: dobar, solidan, nemacki, ali ga covek vozi i sve zavisi koliko je razumno vozen, ne mozes naterati auto da ide levo i desno u isto vreme.
Posebna tema je čišćenje baza, jednom sam radio prije 3 godine za prethodno takmičenje. Sa više, sve je i dalje relevantno, ali sada možete odbiti provjeru za 200 OK, stvarno mi se nije sviđao ovaj proces, greške su bile jako velike, dosta nepotrebnih stvari je filtrirano. Sada se to može učiniti gotovo automatski u procesu Hrumerovog rada, iako ovaj proces nije potpuni analog provjere za "200 OK". Općenito, do točke: ne tako davno u Hrumeru se pojavila divna prilika - otimati informacije iz resursa u vrijeme pokretanja projekta. To izgleda ovako. Ubacujete šablon, koji će biti obrađen u procesu, a informacije prikupljene iz šablona će biti unesene u xgrabbed.txt datoteku u folderu Dnevnici. Ovu funkciju možete koristiti za bilo šta, polet mašte je ogroman. Koristim ovu funkciju jednom sedmično da uklonim "istekle" veze iz radne baze podataka. Nije tajna da se forumi gase svaki dan kako bi očistili bazu od takvih resursa, a alat "Autograbbing" će nam pomoći u ovom slučaju.
Uostalom, morate priznati, često kucajući, na primjer, http://www.laptopace.com/index.php, vidimo da je ovaj domen već, na primjer, gaddyad, ali tamo nema foruma. Dakle, da bismo izbacili ovu šljaku iz baze, mi ćemo pljačkati. :) Otvorite izvorni kod stranice i tamo pogledajte ovaj unos:
Sada će nam svi "mrtvi" iz goudaddija biti poznati po imenu.
Evo malog izbora za "Autograbbing" alat, ako želite očistiti bazu podataka iz različitih "isteklih" domena: