| SciPort RLP

Wir weisen darauf hin, dass wir technisch notwendige Cookies verwenden. Weitere Informationen

Extracting the Main Content of Web Documents based on Character Encoding and a Naive Smoothing Method

María José Escalona; José Cordeiro; Boris Shishkov (Hrsg). Software and Data Technologies: 6th International Conference, ICSOFT 2011, Seville, Spain, July 18-21, 2011. Revised Selected Papers. Bd. 303. Berlin: Springer 2013 S. 217 - 236

Erscheinungsjahr: 2013

ISBN/ISSN: 978-3-642-36176-0

Publikationstyp: Diverses (Konferenzbeitrag)

Sprache: Englisch

Doi/URN: 10.1007/978-3-642-36177-7_14

Volltext über DOI/URN

Geprüft:

Bibliothek

Inhaltszusammenfassung

HTML documents
Main content extraction
R2L languages
UTF-8 encoding form
Unicode character set

Autoren

Mohammadzadeh, Hadi (Autor)

Gottron, Thomas (Autor)

Schweiggert, Franz (Autor)

Nakhaeizadeh, Gholamreza (Autor)

Beteiligte Einrichtungen

Universität Koblenz
(Universität Koblenz)

Universität Koblenz
(Universität Koblenz)

Starten Sie Ihre Suche...

Extracting the Main Content of Web Documents based on Character Encoding and a Naive Smoothing Method

Inhaltszusammenfassung

Autoren

Beteiligte Einrichtungen