Artelys x CodaLab : optimisation du stockage des données de compétitions de Data Science
Depuis la version 1.5, les organisateurs peuvent déporter les calculs d’évaluation de code sur leur propre parc de machines, ouvrant la porte aux compétitions Big Data. Le projet souhaite désormais expérimenter de nouveaux protocoles de compétition respectant la confidentialité des données et supportant les compétitions de Big Data à destination de l’industrie et des start-ups.
C’est plus de 1 000 compétitions qui ont été créées sur la nouvelle version depuis sa mise en production en novembre dernier et les énormes volumes de données des compétitions historisées depuis l’origine de Codalab sont de l’ordre de plusieurs dizaines de To. Ces données sont issues des soumissions de solutions par plus de 25 000 participants à ce jour et du stockage du jeu de données nécessaire à chacune des compétitions. Le succès de la plateforme a mené à la nécessité d’avoir un système de stockage adapté à la demande afin d’éviter la saturation. Plutôt que d’entrer dans une logique de payer plus pour avoir plus de stockage, l’idée a été de travailler sur l’optimisation des ressources existantes.
Artelys a accompagné CodaLab dans la maintenance et l’amélioration des plateformes déployées. En procédant par étapes et en commençant par réaliser un état des lieux avant de fournir des solutions, il s’est avéré qu’un Dashboard de Storage Analytics permettait d’identifier les causes du surstockage. Certaines solutions mises en place prennent en compte la recherche de données obsolètes ou redondantes, la limitation du nombre de soumissions par les participants et de la taille des jeux de données initiaux pouvant être déposés par les organisateurs ou encore la recherche d’usages inadaptés de la plateforme. La configuration d’un système de stockage distribué avec MinIO a également permis l’interfaçage automatique des différents systèmes de stockage afin de faciliter le management de ces données. La combinaison de ces approches participe efficacement au bon fonctionnement des serveurs de CodaLab.
L’hébergement des compétitions de Data Science est de plus en plus demandé par divers acteurs souhaitant valoriser leurs données et l’apport continu d’Artelys à la plateforme CodaLab permet d’avoir une vision optimale du stockage en cours. Cette approche proactive pérennise la quantité de stockage disponible rendant la plateforme toujours plus disponible pour des compétitions futures.
Si vous voulez en savoir plus sur la plateforme CodaLab, vous pouvez nous contacter ou visiter leur site web.
Artelys poursuit sa croissance à l’international
Avec une présence internationale croissante, grâce à ses filiales au Canada, en Belgique, aux États-Unis, et depuis l’année dernière en Italie et en Espagne, Artelys étend sa portée et renforce son engagement à fournir des solutions innovantes à ses clients et partenaires à l’international.
Analyse de l’impact environnemental des énergies renouvelables
— L’étude réalisée par Artelys met en lumière l’intérêt des énergies renouvelables dans la lutte contre le changement climatique. L’analyse porte également sur d’autres enjeux majeurs, comme la biodiversité, l’utilisation de matières premières ou la réduction de la pollution.
Participez à l’événement de clôture du projet METIS 3 !
— Artelys a le plaisir de vous inviter à l’événement de clôture de METIS 3 le 17 avril prochain. Au cours de cet événement en ligne, nous présenterons les derniers résultats du projet METIS en illustrant les atouts de l’outil pour assister la prise de décision en matière de politiques énergie-climat.
Artelys Knitro 14 : nouvelle version de notre solveur d’optimisation non linéaire
– Nous avons le plaisir d’annoncer qu’Artelys Knitro 14.0 est maintenant disponible ! Cette nouvelle version permet aux entreprises de résoudre des problèmes complexes d’optimisation non linéaire avec une efficacité et une précision sans précédent.