Une base de données sémantique a pour fonction le stockage des données sémantique organisées sous forme de triplets RDF. Ces bases de données doivent pouvoir stocker plusieurs milliards de triplets et supporter la croissance exponentielle de ces données. Dans le même temps elles doivent garantir, grâce à un langage de requête riche, un accès rapide et fiable à ces données. Ainsi, les techniques misent en œuvre dans ces bases de données pour assurer un chargement et un stockage optimal puis une interrogation rapide et pertinente des données représentent un enjeu important pour les entreprises qui veulent mettre en place des applications sémantiques.
A semantic database has the function of semantic data storage organized as RDF triples. These databases must be able to store several billions of triples and support the exponential growth of data. At the same time they must ensure, through a rich query language, a fast and reliable access to data. Thus, the techniques implemented in these databases to ensure optimum storage, loading and quick and relevant interrogation of the data represents an important issue for companies that want to implement semantic applications.
Ce document expose différentes techniques implémentées par les systèmes de bases de données sémantiques pour répondre à cet enjeu et les illustre à travers trois études de cas. Les différents concepts aux travers desquels les trois bases de données seront étudiées y sont d’abord définis : 1) Le stockage des données sémantiques ; 2) le chargement des données ; 3) le calcul des inférences ; 4) la recherche des données. Les différentes implémentations de ces concepts sont ensuite décrites dans les systèmes de bases de données AllegroGraph (Franz Inc.), Virtuoso (openlink Software) et Semantic Plateform (Intellidimension).
This document presents different techniques implemented by semantic databases systems to meet this challenge and illustrate them through three case studies. The different concepts through which the three databases will be studied are defined first: 1) The storage of semantic data, 2) the data loading, and 3) the calculation of inferences; 4) the data research. The different implementations of these concepts are then described in the systems database AllegroGraph (Franz Inc.), Virtuoso (openlink Software) and Semantic Platform (Intellidimension).