Le contexte actuel dans les Data Sciences
Les "data sciences", dans la pratique qui est celle des entreprises, conjuguent :
• différents domaines des mathématiques, en premier lieu la statistique et les apprentissages automatiques (machine learning) , mais aussi le traitement du signal, la vision, la reconnaissance des formes, et d'autres encore, concourant ensemble à l'intelligence artificielle,
• et différents domaines du traitement de l'information ou de l'informatique, comme le traitement des données massives (big data) - qu'il s'agisse de stockage, de calcul haute performance, de visualisation - la programmation en langage naturel ou les mesures physiques.
Il s'agit d'opérer le passage des données à des connaissances, en traitant la création même des données si c'est nécessaire.
Selon les applications, ces données sont structurées ou non structurées, elles sont issues de textes, d'images, de mesures, d'évaluations; différents types de prétraitements, puis d'apprentissages peuvent s'envisager: supervisés, non supervisés, à renforcement etc. De cette diversité découle la grande variété des sujets relevant des data sciences.
Kannon MSD s'est nativement donnée une capacité fondamentale, et deux lignes directrices dont témoigne sa dénomination "Modélisation-Simulation-Décision":
• Capacité : KMSD est une émanation du Centre de Mathématiques et Leurs Applications (CMLA), unité mixte de recherche de l'ENS de Paris-Saclay et du CNRS. Ce centre, non seulement regroupe des équipes du meilleur niveau international en big data et machine learning, traitement d'images, et simulation physique à base de calcul haute performance, mais il a créé il y a 20 ans et dirige depuis le master de référence en data sciences en France (MVA, Master Datasciences de Paris Saclay). Kannon MSD est nativement un acteur de la même rigueur scientifique et technique, très au fait de l'état de l'art, tout en délivrant des résultats et outils répondant aux attentes et contraintes de ses entreprises clientes,
• 1ère ligne directrice : l'enjeu du passage des données aux connaissances dans les entreprises est de pouvoir prendre des décisions éclairées, optimisées, en regard de leurs objectifs, et permettre leur mise en œuvre efficace. KMSD tient toujours l'objectif recherché comme un élément structurant de sa démarche ; le retour d'expérience est que cela est déterminant dans la définition des programmes de travail et des méthodes et outils à employer,
• 2ème ligne directrice : la réussite passe par la capacité, dans une logique de stricte limitation au nécessaire, à appréhender l'état de l'art dans le domaine ciblé, et à passer par des modélisations et simulations maîtrisées, au niveau d'approche pertinent. KMSD, tant par ses ressources propres que par son réseau d'experts dispose précisément des compétences et moyens correspondants.
Les datasciences par KMSD sont ainsi la voie des données aux connaissances, puis des connaissances aux décisions, et enfin des décisions aux résultats pour les entreprises clientes.