<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>DRISOL &#187; Crawler</title>
	<atom:link href="http://www.drisol.com/suchmaschine/crawler/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.drisol.com</link>
	<description>SEO &#38; Suchmaschinenoptimierung</description>
	<lastBuildDate>Tue, 03 Jan 2012 11:30:08 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Yahoo mit neuem Crawler &#8211; Slurp/3.0</title>
		<link>http://www.drisol.com/news/179/yahoo-mit-neuem-crawler/</link>
		<comments>http://www.drisol.com/news/179/yahoo-mit-neuem-crawler/#comments</comments>
		<pubDate>Tue, 15 Apr 2008 20:50:16 +0000</pubDate>
		<dc:creator>DRISOL</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[Crawler]]></category>
		<category><![CDATA[Indexierung]]></category>
		<category><![CDATA[Yahoo]]></category>
		<category><![CDATA[Yahoo Slurp]]></category>

		<guid isPermaLink="false">http://www.drisol.com/news/179/yahoo-mit-neuem-crawler/</guid>
		<description><![CDATA[Wie Yahoo vermeldet&#160;, haben sie vor kurzem begonnen eine neue Crawler-Version zu implementieren, die nun nach und nach den alten Robot abl&#246;sen soll. Der neue Bot weist sich einem Server als &#8220;Yahoo! Slurp/3.0&#8243; aus. Was hat das f&#252;r Auswirkungen? Wer in seiner Robots.txt-Datei diverse Eintr&#228;ge f&#252;r den Yahoo-Slurp-Crawler stehen hat, der kann diese auch so [...]]]></description>
			<content:encoded><![CDATA[<p>Wie <a href="http://www.ysearchblog.com/archives/000531.html" >Yahoo vermeldet&nbsp;<img src="/wp-content/themes/drisol/img/extlinks.gif" alt="" width="10" height="10" style="border:0px;" /></a>, haben sie vor kurzem begonnen eine neue <a href="http://www.drisol.com/informationen/seo-lexikon/crawler/" class="kblinker" title="More about Crawler &raquo;">Crawler</a>-Version zu implementieren, die nun nach und nach den alten Robot abl&#246;sen soll. Der neue Bot weist sich einem Server als &#8220;Yahoo! Slurp/3.0&#8243; aus.</p>
<h2>Was hat das f&#252;r Auswirkungen?</h2>
<p>Wer in seiner Robots.txt-Datei diverse Eintr&#228;ge f&#252;r den Yahoo-Slurp-Crawler stehen hat, der kann diese auch so belassen, denn der neue Bot wird sich ebenfalls an diese Eintr&#228;ge halten.</p>
<p>Hat aber jemand den Yahoo-Bot ausgesperrt, weil er damit Bandbreite und Serverressourcen sparen wollte, dann k&#246;nnte es durchaus wieder Sinn machen, die Eintr&#228;ge aus der robots.txt zu entfernen. Die alte Version des Crawlers war zwar ein Trafficmonster (siehe dazu auch <a href="http://seo.emn.de/such-technologie/shorty-slurp30-der-neue-yahoo-bot/" >Johannes&#8217; Beitrag&nbsp;<img src="/wp-content/themes/drisol/img/extlinks.gif" alt="" width="10" height="10" style="border:0px;" /></a>), die neue soll diese Fehler aber nicht mehr haben und deutlich performanter und ressourcenschonender sein. Erste <a href="http://www.sistrix.com/news/750-yahoo-mit-neuer-crawlerversion.html" >Beobachtungen von Sistrix&nbsp;<img src="/wp-content/themes/drisol/img/extlinks.gif" alt="" width="10" height="10" style="border:0px;" /></a> scheinen das auch zu best&#228;tigen.</p>
<p>Dar&#252;ber hinaus werden sich auch die IP-Bereiche &#228;ndern, von denen aus Yahoo die Crawlvorg&#228;nge durchf&#252;hrt. Seitenbetreiber, die beispielsweise <a href="http://www.drisol.com/informationen/seo-lexikon/cloaking/" class="kblinker" title="More about Cloaking &raquo;">Cloaking</a> auf IP-Basis betreiben, m&#252;ssen daher acht geben, und auf die neuen Bereiche umstellen bzw. eine DNS-/ReverseDNS-Abfrage zur Verifizierung des Yahoo-Bots durchf&#252;hren.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.drisol.com/news/179/yahoo-mit-neuem-crawler/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>GoogleBot f&#252;llt Formulare selbst&#228;ndig aus</title>
		<link>http://www.drisol.com/news/178/googlebot-fuellt-formulare-aus/</link>
		<comments>http://www.drisol.com/news/178/googlebot-fuellt-formulare-aus/#comments</comments>
		<pubDate>Mon, 14 Apr 2008 13:43:44 +0000</pubDate>
		<dc:creator>DRISOL</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[Crawler]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[GoogleBot]]></category>
		<category><![CDATA[HTML-Formulare]]></category>

		<guid isPermaLink="false">http://www.drisol.com/news/178/googlebot-fuellt-formulare-aus/</guid>
		<description><![CDATA[Wie im Google Webmaster Central Blog zu lesen&#160; ist, testet Google schon bereits seit ein paar Monaten das Spidern von Seiten, die sich hinter einem HTML-Formular verstecken. Dabei versucht der Googlebot herauszufinden, was der Besucher der jeweiligen Website auf der das Formular eingebaut ist, denn dort als Suchbegriff eingeben k&#246;nnte und f&#252;llt das Formular dementsprechend [...]]]></description>
			<content:encoded><![CDATA[<p>Wie im <a href="http://googlewebmastercentral.blogspot.com/2008/04/crawling-through-html-forms.html" >Google Webmaster Central Blog zu lesen&nbsp;<img src="/wp-content/themes/drisol/img/extlinks.gif" alt="" width="10" height="10" style="border:0px;" /></a> ist, testet Google schon bereits seit ein paar Monaten das Spidern von Seiten, die sich hinter einem HTML-Formular verstecken. Dabei versucht der Googlebot herauszufinden, was der Besucher der jeweiligen Website auf der das Formular eingebaut ist, denn dort als Suchbegriff eingeben k&#246;nnte und f&#252;llt das Formular dementsprechend selbst&#228;ndig aus.</p>
<p>Bekommt der <a href="http://www.drisol.com/informationen/seo-lexikon/crawler/" class="kblinker" title="More about Crawler &raquo;">Crawler</a> von Google dann eine valide Seite geliefert, die zudem noch Inhalte enth&#228;lt, die bisher noch nicht im Google-Index zu finden sind, dann wird diese Seite neu in den Index aufgenommen.</p>
<p>Wer sich jetzt allerdings schon freut und auf viele Millionen Seiten im Index hofft, der muss entt&#228;uscht werden, denn diese Tests beschr&#228;nken sich in erster Linie auf wenige hundert wirklich wichtige Internetseiten und nicht auf jede einzelne Website mit Formular. Auch ist nicht davon auszugehen, dass Google sich damit eine Menge doppelte Inhalte in den Index holt bzw. holen will und auch nicht, dass man -wie von <a href="http://www.sistrix.com/news/747-googlebot-fuellt-formulare-aus.html" >Sistrix angesprochen&nbsp;<img src="/wp-content/themes/drisol/img/extlinks.gif" alt="" width="10" height="10" style="border:0px;" /></a>- Suchergebnisseiten in den Suchergebnissen pr&#228;sentieren will, sondern eher, dass man individuelle Inhalte, die eben ausschlie&#223;lich &#252;ber Formulare erreichbar sind, ebenfalls erfassen will.</p>
<p>Ob ein solches Feature irgendwann einmal auf die breite Masse losgelassen wird, das werden wir sehen. Bis dahin d&#252;rfte es aber noch ein wenig dauern.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.drisol.com/news/178/googlebot-fuellt-formulare-aus/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

