17. Screaming Frog SEO Spider

Onze meest geliefde tool voor het controleren van een site is Screaming Frog. Er is een gratis versie en een betaalde. De betaalde kost £ 149, maar die is zijn geld meer dan waard. Hieronder bespreken we de betaalde versie. In de training Webtechniek bespreken we deze tool uitgebreid.

17.1 Installeren

Ga naar Screaming Frog SEO Spider en kies voor de optie Download.
Download en installeer het programma.

Wil je de betaalde versie, koop dan een licentie en kies in Screaming Frog voor License » Enter License.

17.2 Over Screaming Frog

Screaming Frog is een spider. Dus net zo'n stukje software als Google gebruikt voor het indexeren van jouw site. Hij bezoekt alle pagina's, bekijkt de code en geeft bijvoorbeeld ook terug welke server-response-codes worden gebruikt.

Voorbeelden van wat je kunt controleren:

Gebruik van inline stijlen (zie het hoofdstuk over CSS). Je controleert dan op de code style=".
Dode links
Duplicate titels
Responscodes
Aanwezigheid alt-tekst
Aanwezigheid tabellen (die je dan met de hand kunt controleren)
Aanwezigheid Google Analytics- of Piwik-trackingcode

Soms krijgen wij vragen over de privacy: Screaming Frog slaat geen gegevens op, alles wordt opgeslagen op je eigen computer. Geen zorgen over de privacy dus.

17.3 Spideractie voorbereiden en starten

Beperk de snelheid van de spider voordat je start

Het spideren van een site kan belastend zijn voor de website die je spidert en ook voor je eigen computer. Het is daarom vaak verstandig om de snelheid van de spider te beperken. Dat doe je als volgt:

Ga naar Configuration ▸ Speed.
Vink de checkbox Limit URI/s aan.
Kies voor Max URI/s 2,0.

Spideractie starten

Open Screaming Frog.
Ga naar het invoerveld bovenin "Enter URL to spider".

Invoerveld voor invoer url in Screaming Frog
Voer daar jouw domeinnaam in en klik op Start.
De spider start nu met het indexeren van de site. Dat kan even duren. Als de spider klaar is, kun je starten met analyseren.

onderschrift

Enkele opmerkingen hierbij:

Gebruik geen 'https' of 'http' in de url, want dan kun je gelijk kijken of het redirecten hiernaar goed gaat.
Als de spider na 10 minuten nog doorgaat of als je intussen al duizenden pagina's hebt geïndexeerd, klik dan op stoppen. Op sommige onderdelen, zoals agenda's, blijft ze maar 'doorspideren'.
Als je op een later moment verder wilt met de resultaten kun je deze ook opslaan.

Opmerking: het kan zijn dat de site niet gespiderd kan worden. Dit kan namelijk worden geblokkeerd door de webbouwer of eigenaar.

17.4 Controleren op dode links (404-meldingen)

Zorg dat in het bovenste menu het tabblad "Internal" open is.
Klik in het venster met de webadressen op Status Code, zodat deze aflopend sorteert (vaak 2 x klikken). Als er 404-meldingen zijn, komen deze bovenaan (tenzij er nog 500-meldingen zijn).

Statuscodes, aflopend gesorteerd
Selecteer een 404-melding.
Kies uit het ondermenu de optie InLinks.

Rechtermuismenu bij 'From' in 'Inlinks'
Daar zie je de pagina staan die leidde tot een 404-melding.
Bekijk daar de anchor text. Dit is de linktekst. Onthoud deze, die heb je zo nodig.
Klik met de rechtermuisknop op de url onder 'From'.
Kies in de pop-up die opent de optie Open From in Browser.
De pagina op de site opent nu. Zoek daar op de ankertekst om de dode link te vinden.

17.5 Controleren op unieke paginatitels

Het belangrijkste kenmerk van elke pagina is de paginatitel. Deze vind je in het HTML-element title. Voor Google is het belangrijk dat elke pagina een unieke titel heeft. Als dat niet het geval is en je hebt 2 verschillende pagina's met dezelfde titel is dat verwarrend voor Google.

Het is ook belangrijk voor de bezoekers van je site, want als ze in de zoekresultaten 2 resultaten zien met dezelfde titel, welke pagina is dan de juiste?

Vergelijk dit met dat je een boekhandel binnenloopt en er liggen 2 verschillende boeken met dezelfde titel; welk boek was nu het boek dat je wilde kopen?

Ergo: het is een goed streven om elke pagina een unieke titel te geven. Om te controleren of je dat gedaan hebt, gebruik je Screaming Frog.

Kies in het bovenmenu voor Page Titles.
Kies in het filter voor Duplicate

Duplicate titels in onderdeel Page Titles
.

Je krijgt nu een overzicht van pagina's die geen unieke titel hebben, zoals in het voorbeeld hieronder.

Er zijn verschillende oorzaken van duplicate titels, bijvoorbeeld:

Webadressen zijn bereikbaar op http EN https. Het is beter slechts 1 protocol te gebruiken, waarschijnlijk bij voorkeur het https-protocol.
De website is bereikbaar met en zonder www in het webadres. Beter is het om hier 1 domein voor te kiezen.
Alle vacatures hebben de titel 'Vacatures'. Beter is het om hier elke vacature zijn eigen titel te geven, namelijk de titel van de vacature.

17.6 Controleren of elke pagina 1 h1 heeft

Elke pagina heeft bij voorkeur 1 h1, dus niet 0 of meer dan 1.

Ga naar het tabblad h1 en klik op de kolomkop Occurences.
De kolom wordt oplopend gesorteerd. Als er pagina's zijn zonder h1, dan komen deze bovenaan.

Pagina's zonder h1
Klik nog een keer op Occurences, de kolom is nu aflopend gesorteerd. De pagina's met meerdere h1's staan bovenaan.

Pagina's met 2 h2's
Open deze pagina (rechtermuisknop) en analyseer de headings met het programma Web Developer (zie vorige hoofdstukken).
Inderdaad zijn er op 1 pagina 2 h1's.

Pagina met dubbele h1, zichtbaar gemaakt met Web Developer

17.7 Zoeken met custom search

Handig in de betaalde versie van Screaming Frog is het onderdeel Custom search. Daarmee kun je zoeken op tekstfragmenten, bijvoorbeeld op het gebruik van inline stijlen (zie het hoofdstuk over CSS).

Je komt daar via Configuration ▸ Custom ▸ Search.

In het dialoogvenster dat je dan krijgt, stel je de zoekopdrachten in.

Vul in het 1e veld de naam in van de zoekopdracht. In het 4e veld het tekstfragment. Er zitten bij de andere velden nog meer mogelijkheden. Bekijk ze even, zodat je weet wat er kan.

In het voorbeeld hierboven hebben we bijvoorbeeld een zoekopdracht ingesteld om te kijken op welke pagina's tabellen voorkomen met de hmtl-code "<table".

Indexeer vervolgens de hele site. Ga dan in het bovenmenu naar het item Custom Search en daar zie je alle URL's die voldoen aan een filter.

Je kunt deze optie ook gebruiken om te controleren of de trackingcode van je statistiekpakket overal geïnstalleerd is. Als filter gebruik je dan Does not contain en als het goed is vind je na het spideren geen pagina's waarin de code niet voorkomt.

17.8 Deel van de site onderzoeken of weglaten

Als je slechts een specifiek onderdeel wilt onderzoeken dan kan dat ook. Ook kun je juist iets uitsluiten.

Specifieke directory van de site onderzoeken

Stel we willen alleen het onderdeel trainingen op onze site onderzoeken. Deze staan op www.theinternetacademy.nl/trainingen.

Dan kiezen we voor:

Configuration ▸ Include
Je krijgt een dialoogvenster.
Geef daar het adres van de directory dat je wilt onderzoeken en typ daarachter '.*'. In ons geval is dat: https://www.theinternetacademy.nl/trainingen/.* Met .* geef je aan: elk teken (een punt) een of meerdere keren (het sterretje). Zo pak je alle bestanden in die directory.
Kies OK.
Start dan de zoekactie op dit onderdeel in Screaming Frog.

Directory uitsluiten

Stel dat we de directory trainingen niet willen meenemen in ons onderzoek.

Configuration ▸ Exclude
Je krijgt opnieuw een dialoogvenster.
Voer in https://www.theinternetacademy.nl/trainingen/.*
Kies OK.
Start dan de zoekactie op de site in Screaming Frog.