Hov. Du er ikke logget ind.
DU SKAL VÆRE LOGGET IND, FOR AT INTERAGERE PÅ DENNE SIDE

Hvad er betingelserne for at man kan crawle et site og hvad koster en crawler?

Side 1 ud af 2 (19 indlæg)
Fra Fredericia
Tilmeldt 21. Dec 08
Indlæg ialt: 679
Fra  Asia Property Innovation Co. Ltd. Skrevet kl. 15:37
Hvor mange stjerner giver du? :

2 spørgsmål vedr. en crawler:

1. Hvad er betingelserne for at man kan crawle et site og hente specifikke oplysninger derfra? Jeg mener, hvordan kan det rent teknisk lade sig gøre at hente forskellige oplysninger fra en masse sites, når alle disse sites er bygget forskelligt op? Hvad er muligt og hvad er ikke?
Eksempler: http://www.boligportal.dk/ & http://www.pricerunner.dk

2. Hvad koster det ca. at lave sådan en fætter, som f.eks. den på www.boligportal.dk

Dbh fra Jørgen

Fra Helsingborg
Tilmeldt 3. Apr 05
Indlæg ialt: 6555
Fra  TextReactor Skrevet kl. 15:47
Hvor mange stjerner giver du? :

1) Den læser en side som en browser men så skal man lære den hvilke tags der er vigtige for at den skal kunne læse teksten. Det der tager længst tid med en crawler er at lære den de forskellige sites at kende.

2) Det er umuligt at svare på uden at lave en analyse af det den skal hente.

Fra Ringsted
Tilmeldt 19. Mar 10
Indlæg ialt: 266
Skrevet kl. 15:48
Hvor mange stjerner giver du? :

Hej Jørgen.

Betingelserne er ikke så store, ud over de oplysninger du ønsker at hente ikke må være flash og skal bare forekomme i kildekoden i en form for ensrettet måde.

Alle sider er stortset bygget forskelligt op, selv 2 magento webshops kan have forskellig design struktur.
Så det vil kræve et script per hjemmeside du ønsker at crawle.

Med hensyn til prisen, kan det godt blive en halvdyr fornøjelse hvis det skal sættes ordenligt op med forskellige sider der skal crawles, samt disse data skal gemmes og løbende opdateres. Eksempelvis hvis du vil hente boliger fra div. mæglere, vil du jo gerne have opdateret boligerne når de er solgt eller fjernet fra markedet.

 
Du velkommen til at smide en pb med lidt mere info om din idé, så kan jeg godt komme med noget mere specifikt.

Mvh.
Casper Fischer 

Fra Fredericia
Tilmeldt 21. Dec 08
Indlæg ialt: 679
Fra  Asia Property Innovation Co. Ltd. Skrevet kl. 15:52
Hvor mange stjerner giver du? :

1. Okay, så der ligger en del tilpasning heri på hvert enkelt site, når først "Motoren" er lavet? Det drejer sig om ca 180 sites der skal trækkes data ud fra og ja, gerne mere eller mindre hver dag, eller hver uge.

2. Jeg ved godt at det er svært at slynge en eksakt pris ud, men hvad vil I tro at det ca vil koste at lave den crawler som www.boligportal.dk bruger?

Fra Helsingborg
Tilmeldt 3. Apr 05
Indlæg ialt: 6555
Fra  TextReactor Skrevet kl. 16:04
Hvor mange stjerner giver du? :

Det man gør er at man laver en basiscrawler hvor der er nogle ting man SKAL have ud. Så kigger man på kilden og fortælller crawleren hvad den skal kigge efter på det pågældende site.

Jeg kan ikke give en ca. pris fordi mit skud er lige så nøjagtigt som andres.

Fra Næstved
Tilmeldt 19. Apr 10
Indlæg ialt: 165
Fra  http://kjmedia.dk/ Skrevet kl. 16:05
Hvor mange stjerner giver du? :

Nu skal du jo også lige huske på det juridiske aspekt i denne sammenhæng. Hvis du vil hente data fra andre hjemmesider og udgive på din egen, så skal du jo have tilladelse til dette fra de enkelte ejere.

Kom til tops i Google med effektiv søgemaskineoptimering fra KJMedia.dk

Fra Fredericia
Tilmeldt 21. Dec 08
Indlæg ialt: 679
Fra  Asia Property Innovation Co. Ltd. Skrevet kl. 16:06
Hvor mange stjerner giver du? :

Okay.
Jeg mener bare, snakker vi kr. 10.000 mere end vi snakker kr. 100.000? 

Fra Københavnsområdet
Tilmeldt 16. Mar 11
Indlæg ialt: 712
Skrevet kl. 16:08
Hvor mange stjerner giver du? :

Casper Fischer:

... Så det vil kræve et script per hjemmeside du ønsker at crawle.

Nej, ikke nødvendigvis. Det er relativt simpelt at sætte en enkelt crawler/et enkelt script op til at lede efter indhold i predefinerede HTML-elementer - udfordringen består i at indsamle og vedligeholde en database med de HTML-mønstre, som crawleren skal lede efter, for at finde indholdet.

Casper Fischer:

Med hensyn til prisen, kan det godt blive en halvdyr fornøjelse hvis det skal sættes ordenligt op med forskellige sider der skal crawles, samt disse data skal gemmes og løbende opdateres.

Her er jeg til gengæld enig i, at opsætning og vedligeholdelse kan være (igen, relativt) dyrt eller tidskrævende, hvis man selv gør det.

Fra Fredericia
Tilmeldt 21. Dec 08
Indlæg ialt: 679
Fra  Asia Property Innovation Co. Ltd. Skrevet kl. 16:09
Hvor mange stjerner giver du? :

Kim Jørgensen:

Nu skal du jo også lige huske på det juridiske aspekt i denne sammenhæng. Hvis du vil hente data fra andre hjemmesider og udgive på din egen, så skal du jo have tilladelse til dette fra de enkelte ejere.



Ja ja, men jeg skal ikke udgive data på mit eget site - i hvert fald ikke i første omgang og desuden er det ikke i DK. Jeg skal bare have data smidt ind i en database...

Fra Helsingborg
Tilmeldt 3. Apr 05
Indlæg ialt: 6555
Fra  TextReactor Skrevet kl. 16:10
Hvor mange stjerner giver du? :
Gennemsnit 5,0 stjerner givet af 1 person

Jørgen Linnet:

Okay.
Jeg mener bare, snakker vi kr. 10.000 mere end vi snakker kr. 100.000? 

Ja deromkring. Det er bedre med et højere bud og så blive positivt overrasket over at det blev billigere end at du bliver spist af med en lav pris der viser sig at blive dyrer.

Skulle jeg skrive sådan en crawler så vil jeg ikke lave den til bare ét site men skrive et helt system hvor du kan tilføje site og prøve at få den til at lære dem at kende. Så rammer vi nok omkring 50-60k

Side 1 ud af 2 (19 indlæg)