SEO forum - SEOgurus

Ga terug   SEOguru Home > SEO forum > Zoekmachine optimalisatie (SEO) > Vragen en discussies
Crawl fouten in Webmaster Hulpprogramma  

Crawl fouten in Webmaster Hulpprogramma


Reageren
 
LinkBack Discussietools Weergave
  #1 (permalink)  
Oud 24 June 2011, 09:36
Junior Member
 
Geregistreerd: 30 May 2011
Berichten: 19
Standaard Crawl fouten in Webmaster Hulpprogramma

Ik krijg 9 crawlfouten in Webmaster Hulpporgramma van Google. Dit geeft hij aan:
404 (Niet gevonden) gekoppeld vanaf 11 pagina's en gedetecteerd op 1 jun. 2011

Op het moment dat ik mn site online zette, waren deze indd niet aanwezig (deze pagina's had ik nog niet af en nog niet geupload).

Een week later heb ik ze wél online gezet, maar hij blijft deze markeren als Niet gevonden 404. Hij wordt ook niet geindexeerd terwijl de rest van de site wel goed geindexeerd is.

Ophalen als Googlebot geeft eigenlijk geen foutmeldingen. Hoe krijg ik deze foutmeldingen weg en belangrijker nog, hoe krijg ik deze urls wel geindexeerd?
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #2 (permalink)  
Oud 24 June 2011, 14:29
Member
 
Geregistreerd: 12 February 2009
Locatie: Delft
Berichten: 39
Standaard

@iwanino
Webmaster Central heeft wel vaker van dit soort 'verouderde' data. Ik heb bij een site ook een rijtje 404 staan en deze verwijderd via URL verwijderen in Webmaster Tools. Hij geeft aan de URLs verwijderd te hebben, maar staan in een ander menu nog steeds vrolijk als 404. Dat zou niet mogelijk moeten zijn.

Belangrijk is dat die pagina´s wel gewoon geindexeerd worden. Kijk bijvoorbeeld naar de cache van een aantal van die nep-404´s. Is de crawldatum recent? Dan is er niets aan de hand.
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #3 (permalink)  
Oud 24 June 2011, 14:52
Junior Member
 
Geregistreerd: 30 May 2011
Berichten: 19
Standaard

@Bert bedankt voor je uitgebreide reactie!

Mijn wedervraag is alleen waar ik die cache kan vinden aangezien de paginas die in WMH 404 foutmeldingen krijgen ook niet geindexeerd zijn in Google.

kan ik dat zien via Ophalen Als Googlebot? Want die geeft dit aan (het eerste gedeelte van wat hij dan vindt):

Dit is het resultaat nadat Googlebot de pagina heeft opgehaald.

URL: http://www.mijndomeinnaamxxx.nl/mijndomeinvoorbeeld/

Datum: vrijdag 24 juni 2011 02:04:18 PDT

Googlebot-type: Web

Download Time (in milliseconds): 212

HTTP/1.1 200 OK
Last-Modified: Mon, 20 Jun 2011 20:07:24 GMT
ETag: "1e7dcf-2b26-4a62a489fac62"
Vary: Accept-Encoding
Content-Encoding: gzip
Content-Type: text/html
Server: PCX/No-Cache (cache01)
Content-Length: 3282
Date: Fri, 24 Jun 2011 09:04:20 GMT
Age: 0
Connection: keep-alive
X-Cache-Hit: No
X-Cache: 1786016689

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>
etc.
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #4 (permalink)  
Oud 24 June 2011, 16:25
Member
 
Geregistreerd: 12 February 2009
Locatie: Delft
Berichten: 39
Standaard

Citaat:
Oorspronkelijk geplaatst door iwanino Bekijk bericht

Een week later heb ik ze wél online gezet, maar hij blijft deze markeren als Niet gevonden 404. Hij wordt ook niet geindexeerd terwijl de rest van de site wel goed geindexeerd is.
Okay, dus de pagina's staan nu wel online? Raar dat Google ze niet indexeert.

En Google kan ook bij die URLs, maw die pagina's zijn gelinked vanaf een wel geindexeerde pagina?
Heb je de robots.txt gechecked?
Heb je toevallig een noindex,nofollow tag op die pagina's staan?
Geven deze pagina's een code 200 terug (hier testen)?
Zijn er problemen met de HTML (hier checken)?
Heb je (verkeerd) gebruik gemaakt van canonical tags?


Als hier het probleem niet ligt dan ligt het dus aan een glitch bij Google. Ik raad je aan om die pagina's net even wat anders te noemen: meindomijn.nl/mijn-url naar bijv meindomijn.nl/mijn-url1 en dan deze pagina's even te linken vanaf de homepage totdat ze geindexeerd zijn.
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #5 (permalink)  
Oud 27 June 2011, 09:40
Junior Member
 
Geregistreerd: 30 May 2011
Berichten: 19
Standaard

Wederom bedankt voor je uitgebreide reactie!

Inderdaad vreemd dat ze niet geindexeerd worden. Mijn pagina bestaat uit 23 pagina's waarvan er 14 geindexeerd zijn. De andere 9 zijn de paginas waar hij een '404 fout niet gevonden' melding voor geeft. Als aanvullende informatie geeft hij ook aan: Gekoppeld vanaf 14 pagina's (de andere, wél geindexeerde paginas)



Google kan zeer zeker wel goed bij de URL's komen, mijn site-navigatie is zonder twijfel zeer goed te noemen.

Ik maak nergens gebruik van robots.txt en nergens een noindex of nofollow tag. Ook maak ik nergens gebruik van Canonical tags.

Via de W3C successfully checked as XHTML 1.0 Transitional.


Wat is een "Glitch"? Soort van bug?
Raad je me aan om ze eerst te hernoemen en zodra ze geindexeerd zijn, te vernaderen naar de juiste naam?
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #6 (permalink)  
Oud 27 June 2011, 13:10
Junior Member
 
Geregistreerd: 30 May 2011
Berichten: 19
Standaard

Moet ik misschien toch aan deze paginas deze meta toevoegen? Voor de zekerheid?


<meta name="robots" content="index,follow" />
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #7 (permalink)  
Oud 27 June 2011, 13:28
Senior Member
 
Geregistreerd: 7 November 2010
Locatie: Eindhoven City
Berichten: 160
Standaard

Als je index,follow weglaat gebruikt Google index,follow want dat is de default.
__________________
Wees gegroet,
Bart van de plaatjes en website tips
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #8 (permalink)  
Oud 29 June 2011, 13:50
Junior Member
 
Geregistreerd: 30 May 2011
Berichten: 19
Standaard

Ja weet ik Glompie, maar ik bedoelde meer als test voor de zekerheid. Ik ga nu op 1 van de paginas die een 404 foutmelding krijgt toch <meta name="robots" content="index,follow" /> toevoegen. Bij wijze van test. Baat het niet dan schaadt het niet.

Ik wil gewoon graag dat ze geïndexeerd gaan worden omdat het wel belangrijke pagina's zijn...

En het liefste zónder de url-namen aan te passen.
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #9 (permalink)  
Oud 29 June 2011, 17:06
Senior Member
 
Geregistreerd: 7 November 2010
Locatie: Eindhoven City
Berichten: 160
Standaard

Misschien zien we iets als je zo'n 404 url hier geeft.
Die metatag kun je testen maar ik denk niet dat dat gaat helpen.
__________________
Wees gegroet,
Bart van de plaatjes en website tips
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
  #10 (permalink)  
Oud 5 July 2011, 16:46
Junior Member
 
Geregistreerd: 30 May 2011
Berichten: 19
Standaard

De Url kan ik, om privacyredenen, hier niet geven maar wellicht wel via een privebericht. Maar ik ben ervan overtuigd dat het aan de link niet te zien is. Via "Ophalen als Googlebot" krijg ik te zien "succesvol" bij alle "crawlfouten" en dit komt er dan uit:

HTTP/1.1 200 OK
Last-Modified: Mon, 13 Jun 2011 13:27:09 GMT
ETag: "1036855e-2811-4a597e0568f3c"
Accept-Ranges: bytes
Vary: Accept-Encoding
Content-Encoding: gzip
Content-Type: text/html
Server: PCX/No-Cache (cache01)
Content-Length: 2942
Date: Tue, 28 Jun 2011 07:39:56 GMT
Age: 0
Connection: keep-alive
X-Cache-Hit: No
X-Cache: 514356742

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>


Daar is toch ook niets mis mee??
Digg this Post!Add Post to del.icio.usBookmark Post in TechnoratiFurl this Post!
Met citaat reageren
Reageren

Labels
crawlfouten, google, webmasterhulpprogramma

Discussietools
Weergave

Regels voor berichten
Je mag geen nieuwe discussies starten
Je mag niet reageren op berichten
Je mag geen bijlagen versturen
Je mag niet je berichten bewerken

BB code is Aan
Smileys zijn Aan
[IMG]-code is Aan
HTML-code is Uit
Trackbacks are Aan
Pingbacks are Aan
Refbacks are Aan


Alle tijden zijn GMT +2. Het is nu 20:23.


Forumsoftware: vBulletin®, versie 3.7.3
Copyright ©2000 - 2012, Jelsoft Enterprises Ltd.
Content Relevant URLs by vBSEO 3.2.0