Support uniforme de types de données personnalisés dans RDF et SPARQL
Résumé
Les littéraux sont les noeuds terminaux du modèle de données RDF, et permettent d'encoder des données telles que des nombres ("12.5" xsd:decimal), des dates ("2017-01-26T23:57:15" xsd:dateTime), ou tout autre type d'information ("vert pomme" ex:couleur). Les moteurs RDF/SPARQL savent tester l'égalité ou comparer les littéraux RDF dont le type de données leur est connu (ce qui est le cas de xsd:decimal et xsd:dateTime). Mais lorsqu'un type de données est inconnu d'un moteur RDF/SPARQL (comme ex:couleur), il n'a à priori aucun moyen d'en « découvrir » la sémantique. Dans cet article, nous attaquons ce problème et étudions comment permettre: (i) aux éditeurs de données de publier la définition de types de données personnalisés sur le Web, et (ii) aux moteurs RDF/SPARQL de découvrir à la volée ces types de données personnalisés, et de les utiliser de manière uniforme. Nous discutons de différentes solutions possibles qui tirent partie des principes du Web des données, et détaillons une solution concrète basée sur le déréférencement et le langage JavaScript, suffisamment générique pour être utilisée pour des types de données personnalisés arbitrairement complexes.