Human Protocol finalise l'intégration de CVAT pour ouvrir l'accès à des données nettement meilleures pour les scientifiques de l'IA
L'outil sera disponible au sein d'une communauté de 750 000 travailleurs internationaux
La Fondation Human Protocol annonce l'intégration de CVAT (Computer Vision Annotation Tool), anciennement Intel, dans son offre d'annotation de données.
L'intégration de CVAT dans Human Protocol permettra aux scientifiques de surmonter l'un des plus grands obstacles à la création de produits d'IA de pointe : le manque de données spécifiques et granulaires.
L'annotation des données pour l'apprentissage automatique et les simulations d'IA fait l'objet d'une demande croissante, notamment dans le domaine des essais scientifiques où la solution de CVAT permet aux chercheurs de recueillir en quelques semaines des données qui auraient auparavant pris des siècles. Des instituts de recherche tels que le Salk Institute utilisent déjà cet outil pour mieux comprendre la prévention et le traitement des maladies.
« L'annotation des données est le fondement de tant d'IA, et CVAT est l'un des outils d'annotation de données les plus puissants qui existent, sinon le plus puissant. L'intégrer dans Human Protocol est une étape importante pour le projet ; maintenant, le protocole peut commencer à aider une plus grande variété de scientifiques des données sur une plus grande variété de problèmes, et ainsi créer de meilleures données pour tout le monde, et de meilleurs produits d'IA à l'avenir », rappelle Alex Newman, concepteur de protocole chez Human Protocol
CVAT a vu le jour chez Intel, où l'équipe était à la recherche de l'outil d'annotation de données ultime pour normaliser, simplifier et unifier les dizaines de données dont elle disposait auparavant. Grâce à cet outil extrêmement puissant, Human Protocol permettra aux praticiens de l'apprentissage automatique de créer des ensembles de données beaucoup plus détaillés dans un laps de temps beaucoup plus court, ce qui peut aider l'IA à réaliser des fonctions plus détaillées et à atténuer les préjugés.
L'adoption croissante de l'IA a entraîné une demande illimitée de la part des concepteurs de l'apprentissage automatique pour l'annotation humaine des données brutes. Ces données doivent être décomposées et annotées (ou "étiquetées") par un humain afin d'être prêtes pour l'apprentissage automatique et d'en améliorer la qualité.
Par exemple, une image d'un lac prise par un drone est une donnée brute ; un humain annote ensuite un bateau, un canoë et un quai dans cette image, même en annotant à main levée. Les données annotées sont prêtes pour les produits d'apprentissage automatique, car ces "annotations" peuvent être utilisées pour apprendre aux machines à quoi ressemble chacun de ces objets.
« L'infrastructure de Human Protocol confère une nouvelle échelle et une nouvelle automatisation à l'outil. Cela signifie que les projets peuvent facilement augmenter leur recherche et la capture de données rapidement avec le niveau de qualité auquel ils se sont habitués avec CVAT. L'annotation des données peut être déployée dans un certain nombre de domaines différents, mais elle devient de plus en plus importante dans le domaine de la recherche scientifique où d'énormes quantités de données doivent être annotées. Dans certains cas, cela pourrait réduire le temps nécessaire de plusieurs années à quelques minutes », conclut Nikita Manovitch, Co-founder of CVAT.ai Corp.