Ako indexovo prehľadávať veľké stránky a extrahovať údaje pomocou SEO Spider od spoločnosti Screaming Frog

Screaming Frog SEO Spider

Momentálne pomáhame niekoľkým klientom Trhy migrácie. Pretože veľké spoločnosti využívajú také podnikové riešenia, je to ako pavučina, ktorá sa v priebehu rokov pretvára do procesov a platforiem ... až do momentu, keď si spoločnosti neuvedomujú každý kontaktný bod.

S platformou pre automatizáciu podnikového marketingu, ako je Marketo, sú formuláre vstupným bodom údajov na všetkých weboch a vstupných stránkach. Spoločnosti majú na svojich stránkach často tisíce stránok a stovky formulárov, ktoré je potrebné pri aktualizácii identifikovať.

Skvelý nástroj na to je Kričiaci Žabí SEO Spider... možno najpopulárnejšia platforma na trhu na prehľadávanie, auditovanie a extrakciu údajov z webu. Platforma je bohatá na funkcie a ponúka stovky možností pre prakticky každú úlohu, ktorú požadujete.

Screaming Frog SEO Spider: plazenie a extrakcia

Kľúčovou vlastnosťou aplikácie Screaming Frog SEO Spider je, že na základe môžete vykonávať vlastné extrakcie regex, XPath, Alebo CSSPath špecifiká. To je veľmi užitočné, pretože chceme prehľadávať weby klienta a auditovať a zaznamenávať hodnoty MunchkinID a FormId zo stránok.

Pomocou nástroja otvorte Konfigurácia> Vlastné> Extrakcia na identifikáciu prvkov, ktoré chcete extrahovať.

screamingfrog vlastnú extrakciu

Extrakčná obrazovka umožňuje prakticky neobmedzené zhromažďovanie údajov:

Screaming Frog SEO Pravidlá pre extrakciu pavúkov

Extrakcia regulárnych výrazov, XPath a CSSPath

Pre MunchkinID je identifikátor umiestnený v skripte formulára, ktorý je na stránke:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Potom aplikujeme a Pravidlo regulárneho výrazu zachytiť ID zo značky skriptu vloženej na stránke:

Regex: ["']id["']: *["'](.*?)["']

Pre ID formulára sú údaje vo vstupnej značke vo formulári Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Aplikujeme Pravidlo XPath na zachytenie ID z formulára vloženého na stránku. Dotaz XPath hľadá formulár so vstupom s názvom formid, potom extrakcia uloží hodnota:

XPath: //form/input[@name="formid"]/@value

Screaming Frog SEO Spider Javascript Rendering

Ďalšou skvelou možnosťou aplikácie Screaming Frog je, že sa neobmedzujete iba na HTML na stránke, môžete vykresliť akýkoľvek JavaScript, ktorý sa chystá vložiť formuláre na vaše stránky. V rámci Konfigurácia> Spider, môžete prejsť na kartu Vykreslenie a povoliť to.

Screaming Frog SEO Spider Javascript Rendering

To samozrejme trvá o niečo dlhšie, kým indexovo prehľadáte web, ale získate formuláre vykreslené na strane klienta pomocou jazyka JavaScript, ako aj formuláre vložené na strane servera.

Aj keď sa jedná o veľmi špecifickú aplikáciu, je to neuveriteľne užitočná, pretože pracujete s veľkými stránkami. Určite budete chcieť skontrolovať, kde sú vaše formuláre vložené na celom webe.

Stiahnite si Screaming Frog SEO Spider

Čo si myslíte?

Táto stránka používa Akismet na zníženie spamu. Zistite, ako sa spracúvajú údaje vašich komentárov.