Segmentierung von Webseiten
38,20 €*
Sofort verfügbar, Lieferzeit: 1-3 Tage
Produktnummer:
9783639429404
In diesem Buch wird ein Verfahren zur Segmentierung von Webseiten in kohäsive, semantische Teile vorgestellt. Dabei werden rauschende Komponenten, wie Werbung, Menüs, Fußzeilen usw. von informativen Komponenten getrennt. So wird der eigentliche Inhalt eines XHTML-Dokuments, insbesondere einer Webseite, extrahiert. Die beschriebene Heurisitk vollzieht dies auf Basis einer Analyse des Textes der Seite und deren XHTML-Strukturen, in dem davon Verhältnisse abgeleitet werden. Anhand dieser Verhältnisse und der daraus bestimmten Kriterien sollen die einzelnen Komponenten gefunden und extrahiert werden.
Autor: | Burgess, Alexander |
---|---|
EAN: | 9783639429404 |
Sprache: | Deutsch |
Seitenzahl: | 100 |
Produktart: | kartoniert, broschiert |
Verlag: | AV Akademikerverlag |
Untertitel: | Heuristik zur Segmentierung von XHTML-Seiten für die rauschfreie Suche und Indexierung |
Schlagworte: | HTML Indexierung Suchmaschine Web |
Größe: | 220 |