Starten Sie Ihre Suche...


Wir weisen darauf hin, dass wir technisch notwendige Cookies verwenden. Weitere Informationen

Extracting the Main Content of Web Documents based on Character Encoding and a Naive Smoothing Method

María José Escalona; José Cordeiro; Boris Shishkov (Hrsg). Software and Data Technologies: 6th International Conference, ICSOFT 2011, Seville, Spain, July 18-21, 2011. Revised Selected Papers. Bd. 303. Berlin: Springer 2013 S. 217 - 236

Erscheinungsjahr: 2013

ISBN/ISSN: 978-3-642-36176-0

Publikationstyp: Diverses (Konferenzbeitrag)

Sprache: Englisch

Doi/URN: 10.1007/978-3-642-36177-7_14

Volltext über DOI/URN

Geprüft:Bibliothek

Inhaltszusammenfassung


  • HTML documents
  • Main content extraction
  • R2L languages
  • UTF-8 encoding form
  • Unicode character set

Autoren


Mohammadzadeh, Hadi (Autor)
Gottron, Thomas (Autor)
Schweiggert, Franz (Autor)
Nakhaeizadeh, Gholamreza (Autor)