«

»

Nov 22

Types de données

Le typage stricte des données que l’on manipule est d’une importance fondamentale pour la conception que l’on en a et l’analyse qui peut en résulter.

On identifie habituellement ce que l’on mesure, ce que l’on compte, ce que l’on catégorise, ce que l’on hiérachise et ce que l’on lit.

  1. Ce que l’on mesure :
    Il s’agit des variables qui nécessitent le plus souvent un intermédiaire métrologique : toise, balance, chronomètre,… et qui ne sont pas directement évaluable par l’homme sauf de manière approximative. Ceci met d’ailleurs en évidence la nature continue de la variable concernée, c’est-à-dire le fait qu’elle varie sans rupture et qu’elle est éventuellement évaluable avec une précision absolue. Il s’agit de variables comme la taille, le poids, l’âge, voire le revenu même si la plupart des systèmes réels arrondissent la valeur marchande à quelques décimales (souvent 2). On appelle habituellement ces variables variables continues mais aussi comme elles sont souvent mesurées à une certaine précision : variables décimales.
  2. Ce que l’on compte :
    Il s’agit de variables que l’on peut dénombrer, habituellement sans aucun intermédiaire autre que la capacité à identifier, organiser et comptabiliser. Ceci met en évidence la nature éminemment discrète de la variable concernée et le caractère entier (naturel) du résultat. Il n’y a aucune imprécision possible, seule une erreur grossière de dénombrement peut intervenir. Les variables concernées portent souvent le nom de « nombre de quelque chose », par exemple : le nombre d’enfants (dans une famille), le nombre de feuilles (d’un pied de maïs), le nombre de défauts (d’un produit manufacturé). Ces variables sont appelées variables entières ou variables cardinales.
    Remarque : les deux types précédents sont souvent regroupées sous un terme générique : variables quantitatives car dans les deux cas, elles correspondent à une quantité.
  3. Ce que l’on catégorise :
    Il s’agit de variables qui consistent en l’affectation à une catégorie, un groupe, une modalité. Les catégories doivent être connues à l’avance et identifiables sans ambiguïté. Il s’agit de variables comme la couleurs des yeux, le département de naissance, le groupe sanguin,….. On appelle ces variables variables catégorielles, variables qualitatives ou variables nominales.
  4. Ce que l’on hiérarchise :
    Un cas particulier de variables catégorielles concerne les catégories hiérarchisées c’est-à-dire celles pour lesquelles il existe un ordre structurant dont un exemple est celui des types d’appartement  : T1, T2, T3, T4, T5. Les classes hiérarchisées sont souvent construites à partir d’une variable  quantitative sous-jacente. Dans le cas des types d’appartement il s’agit par exemple du nombre de pièces et/ou de la surface. Ces variables sont appelées variables ordinales ou variables qualitatives ordonnées.
  5. Ce que l’on renseigne :
    Il s’agit de variables qui correspondent souvent à des informations spécifiques que l’on renseigne sous forme de chaînes de caractères et qui ne sont pas identifiées a priori à la différences de catégories qui ont une définition précise et qui sont clairement identifiées. Ces variables sont cependant relativement normalisées comme par exemple : le nom de famille, le prénom, l’adresse postale ou l’adress e-mail.
  6. Ce que l’on exprime :
    On considère ici des production textuelles sous forme de chaînes de caractères assez libres dans la forme et le fond. Ces productions, comme des réponses à des questions ouvertes peuvent être assez longues et avoir une structure assez riche. On appelle ces variables variables textuelles.