Données Structurées

Le chapitre Données Structurées se concentre sur les ensembles de données tabulaires et les séries chronologiques.

Notre équipe d'experts effectue des recherches sur les techniques d'apprentissage automatique pour des ensembles de données que l'on trouve habituellement dans des feuilles Excel, des CSV ou des bases de données relationnelles. Nous traduisons les connaissances les plus récentes de la littérature en directives pratiques, et fournissons à ML6 les connaissances et les outils nécessaires pour résoudre divers problèmes :

Domaines

Régression et prévisions

Prédire l'avenir est difficile. Nous étudions des outils qui nous permettent de faire des prédictions sur la consommation d'énergie de la semaine prochaine ou sur les volumes de vente de l'année prochaine en août. Pour ce faire, nous nous appuyons sur notre ensemble de sources de données externes et nous tirons parti des dernières améliorations apportées aux modèles.

Classification et clustering

L'ajout d'étiquettes aux données peut apporter une valeur ajoutée considérable pour donner un sens à de grandes quantités de données et pour automatiser certaines actions. La création de types d'étiquettes (clustering) et l'attribution d'étiquettes connues aux nouvelles données (classification) sont utilisées dans de nombreux environnements différents. Les applications englobent la compréhension des types de pannes de machine, les raisons de se désengager dans un processus de vente ou le regroupement des utilisateurs sur une plateforme de e-commerce.

Détection d'anomalies

Les machines tombent en panne et les systèmes/processus sont malmenés. De temps en temps, il se produit des événements qui ne sont pas censés se produire. La détection des valeurs aberrantes est un véritable défi et nous aimons trouver comment devenir vraiment bons pour séparer les événements "anormaux" du comportement "normal". L'explicabilité et la causalité sont ici essentielles : pourquoi certains éléments sont-ils anormaux ? Ces informations sont essentielles pour améliorer vos systèmes.

Recherche opérationnelle et optimisation

Il est possible qu'un processus fonctionne bien, mais vous avez le sentiment qu'il pourrait fonctionner encore mieux. Dans ce contexte, nous cherchons comment résoudre des problèmes difficiles : par exemple, la planification de la production, l'ordonnancement des tâches, l'acheminement des véhicules, l'emballage des boîtes, ...

Démos

Similitude des séries temporelles multivariées

Cette démo est le résultat de recherches menées dans le domaine des similarités de séries temporelles multivariées. L'objectif était de développer un système rapide et évolutif, capable de trouver de manière non supervisée les 5 points de données les plus similaires pour une référence donnée.

Voir la démo complète

Conseils rapides

5 conseils pour commencer à travailler avec des ensembles de données déséquilibrés

Lire la suite

Données tabulaires : Servir les forêts de décision avec Tensorflow Serving

Lire la suite

Outils d'étiquetage des séries chronologiques

Lire la suite
Découvrez d'autres conseils

Études de cas et travaux de recherche

Stages

Similitude des séries chronologiques
Solveur d'optimisation interactif
Concours de prévisions financières
Recherche de métriques de similarité et contribution à la TF
Cockpit d'apprentissage actif pour les managers avec détection (non supervisée) des anomalies
Commençons à travailler ensemble
Prenez contact avec nous
Contactez-nous