Transforming Ontology-Based Conceptual Models into Relational Schemas

Guidoni, Gustavo Ludovico (2023)

tese_doutorado

RESUMO: Apesar das contribuições relevantes da modelagem conceitual baseada em ontologias e do amplo uso de esquemas relacionais na implementação de bancos de dados, a combinação da modelagem conceitual baseada em ontologias e dos esquemas relacionais ainda não recebeu a devida atenção. Dentre as tecnologias de modelagem conceitual, a OntoUML se destaca como linguagem para descrever o domínio do problema, tendo como nicho principal a formulação e propagação do conhecimento. Portanto, o modelo produzido pela OntoUML pode ser visto como um “ponto de partida” para outros artefatos, como o esquema relacional. Para produzir o esquema relacional a partir do modelo conceitual de maneira automatizada, é necessário compatibilizar uma série de construtos. A literatura atual disponibiliza algumas abordagens de transformação objeto-relacional que poderiam, em princípio, ser aplicadas a modelos conceituais orientados a ontologias, como aqueles produzidos em OntoUML. No entanto, há construtos importantes que não são cobertos por tais abordagens. A maioria das abordagens de transformação objeto-relacional não dá suporte a modelos conceituais que: (i) incluem generalizações ortogonais (overlapping) ou incompletas (incomplete); (ii) adotam classi cação dinâmica; ou (iii) empregam herança múltipla. Isso ocorre porque muitas das abordagens discutidas na literatura assumem primitivas subjacentes às linguagens de programação orientadas a objetos (em vez da linguagens de modelagem conceitual). Para resolver essa lacuna, este trabalho visa compreender as forças que regem as estratégias clássicas de transformação das hierarquias de classes em esquemas relacionais, identi cando meta-propriedades ontológicas que caracterizam as classes nesses modelos (como sortalidade e rigidez). As informações obtidas são utilizadas para orientar a transformação do modelo conceitual no esquema relacional a m de evitar alguns problemas das abordagens existentes. Além de automatizar a geração do esquema relacional, também propusemos um mapeamento automatizado de acesso a dados baseado em ontologia para o esquema relacional resultante, com o objetivo de expor os dados em termos do modelo conceitual original, permitindo a produção de consultas em um alto nível de abstração (em SPARQL), independentemente da estratégia de transformação selecionada. Além disso, incorporamos restrições adicionais ao longo do processo de transformação objeto-relacional (implementadas através de triggers) para garantir que seja respeitada a semântica do modelo original. A abordagem proposta é contrastada com as abordagens de transformação dominantes na literatura a partir das perspectivas: (i) das primitivas de modelagem conceitual suportadas; (ii) do tamanho do esquema resultante; (iii) do desempenho quanto ao tempo de resposta em consultas; e (iv) da usabilidade do esquema resultante, para o qual é relatado um estudo empírico.

ABSTRACT: Despite the relevant contributions of ontology-based conceptual modeling and the widespread use of relational schemas, the combination of these two technologies has ot yet received due attention. Among the conceptual modeling technologies, OntoUML stands out as a language to describe a domain of interest, having as its main niche the formulation and propagation of knowledge. Conceptual models produced with OntoUML can be seen as a “starting point” for other artifacts, such as relational schemas in a database realization. To produce a relational schema from the conceptual model in an automated way, it is necessary to bridge the gap between a series of constructs. The current literature provides some object-relational transformation approaches that could, in principle, be applied to ontology-driven conceptual models, such as those produced in OntoUML. However, there are important constructs that are not covered by such approaches that must be addressed. Most of the existing object-relational transformation approaches fail to support conceptual models that: (i) include overlapping or incomplete generalizations; (ii) support dynamic classi cation; (iii) have multiple inheritance; and (iv) have orthogonal hierarchies. This is because many of the approaches discussed in the literature assume primitives underlying object-oriented programming languages (instead of conceptual modeling languages). To solve this gap, this work aims to understand the forces that govern classical strategies for transforming class hierarchies into relational schemas, while raising some ontological meta-properties that characterize the classes in these models (like sortality and rigidity). The information obtained is used to guide the transformation of the conceptual model into a relational schema in rder to avoid some problems in existing approaches, leading to the novel one table per kind strategy. In addition to automating relational schema generation, we also propose an automated ontology-based data access mapping for the resulting relational schema, in order to provide access data in terms of the original conceptual model, and hence queries can be written at a high level of abstraction (in SPARQL), independently of the transformation strategy selected. Further, we forward engineer additional constraints along with the transformed schema (ultimately implemented as triggers) to guarantee that the semantics of the source model is respected. The proposed approach is contrasted with dominant transformation approaches in the literature from the perspectives of: (i) the supported conceptual modeling primitives; (ii) size of the resulting schema; (iii) query answering performance; and (iv) usability of the resulting schema, for which an empirical study is reported.