Semaltguide om skrapaxtension för Chrome

För att alla företag ska överleva och i slutändan växa är det nödvändigt att ligga före sina konkurrenter och olika risker. Att fatta beslut baserat på analytiska data är ett säkert sätt att glömma bort dessa problem. Sådan data kan förvärvas genom dataskrotning. Det är där enkel skraptillägg för Chrome kommer in: det kommer inte bara att underlätta processen för dataskörning utan också göra det möjligt att skrapa på språng utan komplicerade inställningar.

Hur man använder Scraper

    1. Det första du behöver göra är att installera tillägget, så gå över till kromwebben, sök efter "skrapa" och klicka på lägg till Chrome.

    2. Navigera till webbplatsen som du tänker skrapa data från, markera posten som du är intresserad av genom att markera den. Högerklicka på den och välj "skrapa liknande" på menyn som dyker upp.

    3. Om du gör det startar ett separat fönster för skraparkonsol. Här ser du en lista med skrapade data .

    4. För att spara innehållet, klicka på "spara i Google-dokument". Detta exporteras automatiskt till ett Google-kalkylblad.

Utökad skrapning

Om du planerar att skrapa mer data kan du använda den avancerade metoden. Observera att det är mycket lättare att arbeta med verktyget om du har viss kunskap om HTML. Anta att du ville skrapa data från en källa som har ett arkiv baserat på tidsseriedata. I sådant fall, om du försöker metoden som beskrivs ovan, skulle du få de trasiga uppgifterna.

För att lösa problemet kan du använda ett HTML- och XML-frågespråk som kallas XPath. Vad gör det? XPath känner igen data om de olika elementen i varje val. Följande är en guide för hur du kan göra det:

1. Gå till Scraper-konsolen, uppe till vänster bör du märka en "XPath" -knapp, klicka på den och fortsätt att montera den initiala tabellen.

2. Du måste skriva XPath för rätt element. Den nuvarande XPath som innehåller hela informationen kommer att visas i ett format som detta "// div [3] / div [3] / div [2] / div". Elementen <div> kommer att kännas igen i HTML-dokumentet av datorn.

3. För att skilja den identifierade informationen måste du använda skrapkolumnerna. För att göra det måste du leta efter de olika typerna av information du har tillgänglig. Beroende på vilken data du skrapar kan du ha titlar. Dessa titlar finns bredvid varje uppsättning data. De åtföljs av en tagg, i detta fall en <b> tagg.

4. Använd inspekteringselementet för att leta och lägga till <b> -taggen till din XPath. Nu kan du märka den här första kolumnen som "titelkolumnen", eftersom den kommer att lista upp titlarna. Fortsätt för att skapa olika XPaths för varje kolumn du behöver.

5. Klicka på skrapa och tillägget skördar automatiskt uppgifterna och organiserar dem i de olika kolumnerna du har angett.