Organisert av Botmaster Labs, ikke planlagt. Det er ingen tid, videoen er nødvendig for konkurransen, som en nymotens trend, selv om det er lettere å forklare alt med gode skjermbilder (min IMHO), og jeg vil egentlig ikke skyte noe. Så det er veldig få lønnsomme igjen, dum spam hersker ikke lenger i det hele tatt, her må du tenke deg om og ingen vil brenne emnet, hvis bare de utdaterte prøver å dytte og pudre litt i en vakker innpakning. :) Men dette handler ikke om oss. Generelt sett ble disse 3 "ikke", tror jeg, i utgangspunktet barrierene for deltakelse i konkurransen for flertallet av potensielle deltakere. Det er som å reparere en bil av tre: billig, høy kvalitet, rask - tjenesten kan bare oppfylle 2 betingelser samtidig. sitte og velge det som er nærmere deg. :) Konkurransen er den samme: Jeg har tid, jeg kan lage videoer, men jeg har ikke et emne, eller jeg kan lage en video, jeg har et emne, men jeg har ikke tid i det hele tatt, eller jeg har fri og jeg har litt temka, men videoen er skummel. Men det er bra om 2 betingelser er oppfylt samtidig. Vel, ok, la oss droppe teksten. Jeg vil fortsette for meg selv. Jeg planla ikke, noe som betyr at jeg deltok i konkurransen, jeg valgte til og med hvilken artikkel jeg ville stemme på. Si hva du liker, men Doz kjenner godt til programvaren og vet hvordan du bruker den veldig fornuftig. Men i dag fant jeg ut at intriger dukket opp i konkurransen. Det viser seg at jeg ikke vil kunne stemme, men bare nybegynnere som kjøpte programvaren i 2011 og konkurransen er laget for dem vil kunne gjøre dette. Jeg ble litt overrasket, men eieren er en mester. Konkurransen er en reklamekampanje og Alexander vet bedre hvordan den skal gjennomføres. Generelt bestemte jeg meg da for å legge ut en artikkel, det er noe lettere å skrive når det er klart for hvem, for hele kollektivbruket er det faktisk umulig å gjøre dette.
Den lange introduksjonen er over, nå til poenget.
Hva trenger en nybegynner når han har anskaffet en slik superhøster, som er Xrumer + Hrefer-komplekset? Det stemmer, lær deg hvordan du jobber med det og forkast illusjonen om at du kan tjene penger ved å begynne å spamme med ark. Hvis du tror det, doner pengene dine til veldedige formål med en gang. Du må lære å bruke verktøyene til komplekset, helst ved å skjerpe det selv. Tiden «ta mer – kast mer» er borte. Kvantitet viker for kvalitet. Så vi vil samle basen for oss selv, ikke lær hvordan du gjør dette - du vil henge etter toget. Hrefer vil selvfølgelig hjelpe oss med dette. Hvis du planlegger å markedsføre ressursene dine på Google, må vi også se etter givernettsteder gjennom Google. Jeg synes dette er klart og logisk. Men Google, som eier av kobberfjellet, gir ikke bort sin rikdom til alle. Du trenger en tilnærming til det. Jeg vil si med en gang at ikke håp at du vil kunne samle noe basert på skiltene du finner i offentligheten. Det er derfor de er tilgjengelige i offentligheten, fordi de er verdiløse. Jeg vil ikke utvikle temaet videre. Jeg bør fortelle deg hvordan du monterer det riktig slik at du ser resultatet, du vil fullføre resten selv, det viktigste er å forstå prinsippet. Det er nødvendig å samle inn på riktig grunnlag på grunnlag av spesifikke motorer vi trenger, og ikke på grunnlag av forum generelt. Dette er hovedfeilen nybegynnere gjør - ikke å konsentrere seg om det spesifikke, men å prøve å dekke alt i sin helhet. Og likevel, hvis du ønsker å analysere en mer eller mindre normal base, nekter du å bruke den i operatørspørringer. Ingen "inurl:", "site:", "tittel" osv. Google vil utestenge søkere som deg umiddelbart. Derfor studerer vi nøye motorene som Hrumer jobber med:
Drevet av php-Fusion
I versjon Hrumer 7.07 er programmet trent i flere nye motorer:
forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, etc.
phpBB-fr.com, Solaris phpBB-tema
Og prosessen med å lære nye ting fortsetter kontinuerlig.
Generelt må vi forberede de riktige spørringene for parsing av Hrefer. La oss ta en forumdjok som eksempel. SMF-fora... Og la oss begynne å demontere den i deler for å analysere. Vår elskede Google vil hjelpe oss med dette. Legger inn en forespørsel i Google SMF-fora- det er mye søppel i søkeresultatene, vi spoler tilbake til en 13. side og velger en hvilken som helst lenke. Jeg kom over denne: http://www.volcanohost.com/forum/index.php?topic=11.0. Vi åpner den og undersøker den. Vi må finne noe karakteristisk på siden som kan brukes til å søke etter andre sider på denne motoren. I bunnteksten legger vi merke til følgende inskripsjon Drevet av SMF 1.1.14, siterer vi den og legger den inn i Google, den viser oss at for denne forespørselen vet den omtrent 59 millioner alternativer. Vi ser raskt gjennom lenkene, legger til et par eller to alternativer til dette søkeordet, for eksempel, "Drevet av SMF 1.1.14" poppel eller "Drevet av SMF 1.1.14" viagra... Vi er overbevist om at forespørselen er nydelig, i resultatene er det bare fora og nesten ikke noe søppel for deg.
I tillegg er vi ikke interessert i kvantitet, men i kvalitet, som jeg sa ovenfor. Gå videre. Fra samme forum tar vi en annen setning fra bunnteksten: , siterer vi den og sender den til Google. Som svar avslører han at han vet mer enn 13 millioner resultater. Igjen blar vi gjennom søkeresultatene, legger til flere ord og sjekker resultatene med dem. Vi sørger for at spørringen er stor og at det også nesten ikke er søppel. Generelt er det allerede 2 strykeforespørsler. Jeg foreslår at du lar det første forumet være i fred for nå og fortsetter å samle inn forespørsler til andre forum. Heldigvis er Google åpen på forespørsel 2006-2008, Simple Machines LLC... Vi tar fra resultatene, for eksempel disse foraene: http://www.snowlinks.ru/forum/index.php?topic=1062.0 og http://litputnik.ru/forum/index.php?action=printpage; topic=380.0 i bunntekstene deres tar vi følgende spørsmål: "Powered by SMF 1.1.7" og "Powered by SMF 1.1.10" (jeg anbefaler alltid å kjøre i anførselstegn for Hrefer, fordi vi trenger kvalitet først av alt). Jeg tror det er klart hva vi gjør, til slutt vil vi ha en viss base av spørringer for å søke etter fora på SMF-motoren (den er valgt for et eksempel, med resten av motorene er det det samme).
Det vil se omtrent slik ut:
"Drevet av SMF 1.1.2"
"Drevet av SMF 1.1.3"
"Drevet av SMF 1.1 RC2"
"Drevet av SMF 1.1.4"
"Drevet av SMF 1.1.8"
"Drevet av SMF 1.1.7"
"2006-2008, Simple Machines LLC"
Og det er ikke alt. Mens vi samler inn versjonene av motorene, på noen SMF-fora i bunnteksten, finner vi nadvis "2001-2006, Lewis Media". Vi sjekker denne forespørselen, den tilfredsstiller oss også fullt ut. Vi finner et lignende søk: "2001-2005, Lewis Media". Når vi går gjennom bunntekstene finner vi følgende spørring: "SMFone design by A.M.A, ported to SMF 1.1". Vi sjekker - utmerket. Etc. En halvtimes arbeid og du har en fantastisk database med spørringer for motoren, og Google vil bli utestengt for disse spørringene mye sjeldnere enn hvis du bruker operatører i dem. Og samtidig vil databasen din være mye renere enn hvis du bruker spørringer som "index.php? Topic =", for her vil Google gi ikke bare de foraene vi trenger, men også mange ressurser igjen der vi lyktes. en lenke til forumets emne. Du kan argumentere, sier de, hva er galt med det? Andre forlot linken, noe som betyr at vi kan. Men! Lenker kan ikke bare legges igjen av Hrumer, men også av andre programmer. dessuten kan de være spesielt skjerpet for å legge igjen kommentarer i en bestemt ressurs, den såkalte høyspesialiserte programvaren, pluss at slike lenker kan legges igjen for hånd. Igjen vil jeg gjenta at det ikke er mengden søppel som er viktig for oss, men kvaliteten, basen med riktige forespørsler, og så skal vi samle inn. Fordelen med denne metoden er at du praktisk talt ikke trenger å konfigurere i Hrefer sil -filter
, kan du ganske enkelt slå den av, fordi Google praktisk talt ikke vil gi deg søppel.
Jeg tror at det er veldig viktig å lære å bruke Hrefer riktig i det innledende stadiet, for etter å ha lært dette, kan du alltid finne bruk for Hrumer, uansett hvordan situasjonen endrer seg. Beskyttelsene blir mer kompliserte, og hvis beskyttelsen på noen typer motorer er styrket og Hrumer ikke kan takle det for øyeblikket, gir det ingen mening å bruke ressurser på å samle disse koblingene, og deretter på å jobbe med dem med Hrumer , det er bedre å fokusere på det som gir resultatet ... Og samtidig, hvis Botmaster Labs-teamet lærte Hrumer noe nytt, kan du raskt dissekere en ny pasient og forberede en base for Hrumer mens pasienten fortsatt er lunken. Tid er penger, ressursen er kanskje ikke lenger relevant når du kjøper basen. samlet inn av noen. I tillegg utvider den riktige samlingen av baser for deg selv den "hvite" bruken av Hrumer betydelig. Og det er akkurat her alt beveger seg, enten vi liker det eller ikke, og prosessen med bleking eller gråning pågår. Svarte ark hører fortiden til.
Alle de andre, allerede tekniske aspektene ved å jobbe med Hrefer, kan sees i hjelpen, og det gir ingen mening å dvele ved dem, alle mål-poeng-sekunder er satt empirisk for hver bil individuelt.
Som en bonus vil jeg her legge ut en mal for å analysere den kinesiske søkemotoren Baidu, her om dagen ble jeg spurt om det, så jeg gjorde det innimellom, beklager ordspillet. :)
Vertsnavn = http://www.baidu.com
Spørring = s? Wd =
LinksMask =
Totalt antall sider = 100
Neste Side =
Neste Side2 =
CaptchaURL =
CaptchaImage =
CaptchaField =
Jeg prøvde å analysere dem med en test, det var ingen forbud, Hrefer samlet ressurser livlig, alle forespørsler om parsing var lik Googles, men kinesiske ressurser var et hav, og med høy PR, og dessuten var det mange steder hvor Europeerens fot gikk ikke. Det er bedre å analysere med kinesiske forespørsler. Dette vil hjelpe Google-oversette, skrive inn en liste over søkeord på russisk og oversette det til kinesisk. Sannheten i " ord«Hviserord kan ikke legges til på kinesisk, du må kode om.
I stedet for kinesisk:
伟哥 - viagra
吉他 - gitar
其他 - hvile
保险公司 - forsikring
Sett disse kodene for å erstatte dem i word-filen:
% E4 % BC % 9F % E5 % 93 % A5
% E5 % 90 % 89 % E4 % BB % 96
% E5 % 85 % B6 % E4 % BB % 96
% E4 % BF % 9D % E9 % 99 % A9 % E5 % 85 % AC % E5 % 8F % B8
Hvis du markedsfører et nettsted for forsikring, så ved å plassere en lenke i profilen din på et tematisk (!) Til og med kinesisk forum funnet på forespørsel " Forum SMF "保险公司 blir veldig fint.
Avslutningsvis vil jeg si at jeg aldri har forstått folk som klaget over at khreferne er dårlige eller ikke skriblet, jeg har alltid ønsket å si dette, du vet bare ikke hvordan du skal lage dem. Bedre enn en hrefer, ingen parser vet hvordan de skal samle inn resultater, bare forespørslene må være korrekte. Hrefer er en bil: god, solid, laget på tysk, men en person kjører den og alt avhenger av hvor smart den kjøres, du kan ikke tvinge bilen til å gå til høyre og venstre samtidig.
Et eget tema er rengjøring av baser, jeg gjorde en gang for 3 år siden til forrige konkurranse. Med mer er alt fortsatt relevant der, men nå kan du nekte å sjekke for 200 OK, jeg likte egentlig ikke denne prosessen, feilene var veldig store, mye unødvendig ble filtrert ut. Nå kan dette gjøres nesten automatisk i prosessen med Hrumers arbeid, selv om denne prosessen ikke er en komplett analog av å sjekke for "200 OK". Generelt, til poenget: for ikke så lenge siden dukket det opp en fantastisk mulighet i Hrumer - å frarøve informasjon fra ressurser på tidspunktet for prosjektkjøringen. Det ser slik ut. Du kjører inn en mal, som vil bli behandlet i prosessen, og informasjonen som samles inn fra malen vil legges inn i filen xgrabbed.txt i Logger-mappen. Du kan bruke denne funksjonen til hva som helst, fantasien er enorm. Jeg bruker denne funksjonen en gang i uken for å fjerne de "utløpte" koblingene fra arbeidsdatabasen. Det er ingen hemmelighet at fora dør ut hver dag for å rense basen fra slike ressurser, og "Autograbbing"-verktøyet vil hjelpe oss i dette tilfellet.
Tross alt må du innrømme, ofte ved å skrive for eksempel http://www.laptopace.com/index.php, vi ser at dette domenet allerede er for eksempel gaddyad, men det er ikke noe forum der. Så for å kaste dette slagget ut av basen, vil vi plyndre. :) Åpne kildekoden til siden og se denne oppføringen der:
Nå vil alle "døde" fra goudaddi bli kjent for oss ved navn.
Her er et lite utvalg for "Autograbbing"-verktøyet, hvis du ønsker å rense databasen fra forskjellige "utgåtte" domener: