The Importance of Sibling Clustering for Efficient Bulkload of XML Document Trees
Kanne, Carl-Christian
;
Moerkotte, Guido
URL:
|
http://ub-madoc.bib.uni-mannheim.de/1137
|
URN:
|
urn:nbn:de:bsz:180-madoc-11374
|
Dokumenttyp:
|
Arbeitspapier
|
Erscheinungsjahr:
|
2005
|
Titel einer Zeitschrift oder einer Reihe:
|
None
|
Sprache der Veröffentlichung:
|
Englisch
|
Einrichtung:
|
Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik > Sonstige - Fakultät für Wirtschaftsinformatik und Wirtschaftsmathematik
|
MADOC-Schriftenreihe:
|
Veröffentlichungen der Fakultät für Mathematik und Informatik > Institut für Informatik > Technical Reports
|
Fachgebiet:
|
004 Informatik
|
Normierte Schlagwörter (SWD):
|
Datenbanksystem , XML , Baum <Mathematik>
|
Freie Schlagwörter (Deutsch):
|
Partitionierung, Clustering
|
Freie Schlagwörter (Englisch):
|
Partitioning, Clustering
|
Abstract:
|
In an XML Data Store (XDS), importing documents from external sources is a very frequent operation. Since a document import consists of a large number of individual node inserts, it is essentially a small bulkload operation. Hence, efficient bulkload support is crucial for XDSs. Essentially, XML bulkload is the transformation of an XML parser's output into the XDS's persistent storage structures. This involves two major subtasks: (1) Partitioning the documents' logical tree structure into subtrees smaller than a disk page in a way that is both space-efficient an suitable for later processing. (2) Mapping the subtrees to the XDS's internal page representation. In enterprise-scale environments with very large documents and/or very many parallel bulkloads, task (1) is particularly challenging, as not only disk space consumption, but also CPU and main-memory usage are important factors. In this article, we (1) discuss requirements for an XML bulkload module, (2) examine existing algorithms for tree partitioning with respect to their applicability as XML bulkload algorithms, (3) derive a new tree partitioning algorithm, (4) present the design and implementation of the bulkload module used in our Natix XDS, and (5) evaluate the implementation.
|
Zusätzliche Informationen:
|
|
| Das Dokument wird vom Publikationsserver der Universitätsbibliothek Mannheim bereitgestellt. |
Suche Autoren in
Sie haben einen Fehler gefunden? Teilen Sie uns Ihren Korrekturwunsch bitte hier mit: E-Mail
Actions (login required)
|
Eintrag anzeigen |
|
|