Webcrawler Beschreibung Webcrawler  
 
   
Beschreibung von Webcrawler Infos zu Webcrawler und Beschreibung.
Nicht angemeldet: Anmelden | Impressum 
Navigation
· Hauptseite
· Know Forum - neu!
· Zufälliger Artikel
· Spezialseiten
· Alle Artikel
· Eingeordnet unter
Aktueller Artikel
· Seite bearbeiten
· Links auf diese Seite
· Verlinkte Seiten
· Versionen


 
 



Letzte Beiträge
Die Klimalüge CO2Guten Abend Herr Enger
"Meine Fr...
Volumenausdehnung be...Hallo da draußen, ich h
abe folgendes ...
Osterrätsel der Fran...Hallo, ich hab' mich leide
r mit meinere ...
was ist denn mit dem...Hallo, der Song heißt Cal
istan "...
Strichcode entschlüs...Hallo benni, ich stehe
gerade vor dem...
Lust auf Focus Rätse...Hallo, an alle Spezialist
en dieses Räts...
ErdölServus, Erdöl hat keine
Formel, da es...
Frage an die Student...Hallo, im Prinzip ist das
eine gute Ide...
CO2 chemische Trennu...Hallo ....... CO2 in der
Luft wird begr...
IGBT ansteuerschaltu...Guten Tag, Wer weiss lief
ert eine funk...


Webcrawler

Dieser Text beschreibt Webcrawler.


Der untere Text beinhaltet die Webcrawler Beschreibung. Soweit es sich um ein definierbares Objekt handelt, sollte hier eine Webcrawler Definition vorhanden sein. Sollte eine Definition von Webcrawler fehlen, kann diese von Ihnen verfaßt werden. Wir sind bestrebt die Beschreibung von Webcrawler möglichst ausführlich zu halten.

Jeder Text bei Know-Library, sowie ein Teil davon (Definition, Beschreibung etc.), außer Bücher Beschreibungen kann bearbeitet werden. Falls die Beschreibung auf dieser Seite nicht korrekt ist klicken Sie auf 'Beschreibung editieren' um den Text zu korrigieren bzw. neuen einzufügen. Weitere Informationen und Bücher zum Thema Webcrawler Beschreibung , so wie Link zum Forum finden Sie weiter unten. Eine Übersicht der Texte, die das Thema Webcrawler beschreiben finden Sie auf der Seite alle Artikel über Webcrawler. Fragen zu dem Thema Webcrawler können im Forum gestellt werden. Klicken Sie hier um zu dem Forum zu wechseln.

Webcrawler Artikel

Ein Webcrawler (auch Spider oder robot) ist ein Computerprogramm, das automatisch das World Wide Web durchsucht und Webseiten analysiert. Webcrawler werden vor allem von Suchmaschinen eingesetzt. Weitere Anwendungen sind beispielsweise das Sammeln von Mailadressen oder anderen Informationen.

Wie beim Internetsurfen gelangt ein Webcrawler über Hyperlinks von einer Webseite zu weiteren URLs. Dabei werden alle bisher bekannten Adressen gespeichert und der Reihe nach besucht. Die neu gefundenen Hyperlinks werden zur Liste aller URLs, hinzugefügt. Auf diese Weise können theoretisch alle erreichbaren Seiten des WWW gefunden werden können. In der Praxis wird jedoch häufig eine Auswahl getroffen und der Prozess wird irgendwann beendet und von vorne begonnen. Webcrawler sind eine spezielle Art von Bots und werden auch als Spinnen genannt, da sich sich wie diese in einem Netz fortbewegen.

Ja nach Aufgabe des Webcrawlers wird der Inhalt der gefundenen Webseiten beispielsweise mittels Indexierung ausgewertet und gespeichert, um ein späteres Suchen in den so gesammelten Daten zu ermöglichen. Dabei werden verschiedene Ranking-Algorithmen eingesetz. Webcrawler werden auch zu dem Data Mining und zur Behandlung des Internets (Webometrie) eingesetzt und müssen nicht zwangsläufig auf das WWW beschränkt sein. Ein Großteil des gesamten Internets wird jedoch von Webcrawlern und damit auch mit bekannten Suchmaschinen nicht erfasst, da viele Inhalte nicht über einfache Links sondern beispielsweise ca. über Suchmasken und zugangsbeschränkte Portale erreichbar sind. Man spricht bei diesen Bereichen auch vom "Deep Web".

Mit Hilfe des Robots Exclusion Standards kann ein Webseitenbetreiber in der Datei robots.txt und in bestimmten Meta-Tags in dem HTML-Header einem Webcrawler mitteilen, welche Seiten er indexieren soll und welche nicht, sofern sich der Webcrawler an das Protokoll hält.


Eine besondere Form von Webcrawlern sind Software-Agenten, bei denen eine Menge von autonomen Programmen das Web gemeinsam durchsuchen.==Siehe auch== Webspinnen (die Tiere), Wrapper, Metasuchmaschine, Bot, Suchmaschine

Buch-Tipp: Assimil. Türkisch ohne Mühe. Lehrbuch mit 500 Seiten, 71 Lektionen, 145 Übungen + Lösungen Bu ders cok iyi, . . . . . . dieser Unterricht ist sehr gut. Die erste Hälfte der insgesamt 71 Lektionen soll man erst mal ca. verstehen. Auch bei diesem Kurs muss man Vokabeln und Grammatik lernen - allerdings nicht trocken und stur eingepaukt, sondern verpackt in kurzen Texten aus dem täglichen Leben. Diese Texte sind teils recht amüsant...

Weblinks

Weiteres zu dem Artikel Webcrawler

Andere Leser interessierten sich auch für folgende Beschreibungen: Spinnen, Menge, Untersuchung, Www, Protokoll
Schnellzugrif auf verwandte Texte:
 
NEU! Frage im Forum zum Thema:
 
Wenn die Beschreibung 'Webcrawler' Ihrer Meinung nach nicht korrekt ist oder in aktueller Version Fehler enthalten sind oder es fehlt die Webcrawler Definition, dann klicken Sie bitte auf "Beschreibung bearbeiten" und schreiben Sie die Eigene Version des Textes. Die Änderungen in der Beschreibung werden sofort aktiv und für alle sichtbar. Ein Administrator wird Ihre Version der Beschreibung und Definition von 'Webcrawler' nachher prüfen. Bitte achten Sie auf die Urheberrechte (Copyright). Wir sind für die besseren Beschreibung von 'Webcrawler' und 'Webcrawler' Definition sehr dankbar.

Alle Tipps zu den Bücher auf dieser Seite wurden automatisch generiert. D.h. die Bücher wurden aus einer Datenbank von dem Computer ausgesucht. Deshalb kann es vorkommen, dass vorgeschlagene Bücher nicht ganz der 'Webcrawler' Beschreibung entsprechen.

Liste aller verwandten Artikel: Aufgabe, Datei, Daten, Indexierung, Inhalt, Internetsurfen, Links, Liste, Menge, Mining, Portale, Praxis, Protokoll, Prozess, Reihe, Sammeln, Spider, Spinnen, Standards, Suchen, Suchmaschinen, Untersuchung, Webcrawler, Webseite, Webseiten, Weise, Www
· Diese Seite wurde bisher 475 mal abgerufen.
· Letzte Counteraktualisierung erfolgte am 16.05.2008 um 08:01:35
· Diese Seite wurde zuletzt geändert um 03:40, 23. Aug 2004.
· Letzte Portalaktualisierung erfolgte um 08:00:00 GMT, 25.02.2008
Dieser Artikel basiert auf dem Artikel Webcrawler aus der freien Enzyklopädie Wikipedia und steht unter der GNU-Lizenz für freie Inhalte. In der Wikipedia ist eine Autorenauflistung verfügbar.

Von ""

· Diese Seite wurde bisher 475 mal abgerufen.
· Letzte Counteraktualisierung erfolgte am 16.05.2008 um 08:01:35
· Diese Seite wurde zuletzt geändert um 03:40, 23. Aug 2004.
· Letzte Portalaktualisierung erfolgte um 08:00:00 GMT, 25.02.2008