Services de génération d'images d'IA sur mesure pour les artistes

Impact

CF a créé une marque ombrelle appelée CF Spark et a travaillé avec ML6 pour développer une gamme de services de génération d'images personnalisés et faciles à utiliser qui répondent à des besoins spécifiques tels que la génération de motifs et les variations de design. À ce jour, les clients ont émis près de 10 millions d'invites, générant plus de 40 millions d'images, dont plus de 4 millions ont été publiées pour être partagées avec d'autres sur la plateforme.

Présentation du client

Creative Fabrica est un marché en ligne destiné aux créateurs à la recherche de ressources numériques de haute qualité pour leurs projets personnels ou professionnels dans le domaine de la conception graphique ou web, de l'artisanat, des travaux d'aiguille ou autres. Il propose plus de 125 000 polices de caractères et plus de 6,5 millions de graphiques et compte plus de 4 millions d'utilisateurs enregistrés dans le monde entier, notamment aux États-Unis, en Europe, en Asie et en Afrique.

Image par Susan Fernandes

Défi

Lorsque la génération d'images par l'IA a décollé avec des services tels que DALL-E et Midjourney, Creative Fabrica (CF), une place de marché en ligne pour les actifs numériques graphiques, a vu une grande opportunité. En tant que point d'accès à une communauté de millions de créateurs, elle était particulièrement bien placée pour tirer parti de la révolution de l'IA générative. Elle pourrait lui permettre de renforcer son public en facilitant la création de contenu original et de haute qualité pour la place de marché CF. Cela pourrait à son tour attirer des abonnés supplémentaires et augmenter les revenus.

Creative Fabrica (CF) souhaitait créer une collection d'outils d'IA générative personnalisés, adaptés aux besoins spécifiques de ses clients en matière d'artisanat. Les technologies d'IA générative telles que la diffusion stable étaient encore très expérimentales à l'époque et leur mise au point ajoutait une couche de complexité supplémentaire. Cela a entraîné un certain nombre de défis.

Un premier défi important était lié au positionnement et à la stratégie. Plusieurs services de génération d'images étaient déjà disponibles et il était important pour CF de se positionner clairement par rapport à ces concurrents. 

Deuxièmement, les modèles de génération d'images d'IA à source ouverte, tels que la diffusion stable, étaient tout nouveaux en 2022 et leur utilisation dans un environnement de production était un terrain inconnu pour CF. Il fallait donc un partenaire ayant l'expérience de la mise en place de tels services à partir de zéro.

Enfin, servir des réseaux neuronaux de plusieurs milliards de paramètres est très différent de servir un site web de marché en ligne. La génération d'une image à l'aide de l'IA prend plusieurs secondes sur une unité de traitement graphique (gpu) haute puissance entièrement dédiée. La génération de huit images en parallèle nécessite huit fois plus de temps. Avec potentiellement des milliers ou des dizaines de milliers d'utilisateurs simultanés envoyant des requêtes, l'infrastructure devait être extrêmement robuste. En outre, la solution devait également être très évolutive. Lorsque l'Amérique se réveillera, par exemple, le nombre d'utilisateurs pourrait augmenter de manière exponentielle en très peu de temps et des quantités massives d'infrastructure devraient être mises en œuvre rapidement.

Par

Solution

Pour répondre à la nécessité d'un positionnement clair par rapport aux services existants, Creative Fabrica (CF) a créé une marque ombrelle appelée CF Spark (qui fait référence à la capacité de l'IA à stimuler l'imagination), regroupant une gamme d'outils de productivité de l'IA visant à "libérer la créativité de leurs utilisateurs". Pour réussir, les services devaient être à la fois distinctifs et adaptés aux besoins et aux capacités spécifiques du public de CF. Plutôt que de créer une interface complexe avec de nombreuses fonctionnalités, CF a choisi d'offrir une série de services de génération d'images clairement identifiables et faciles à utiliser, en tirant parti des possibilités spécifiques de l'IA, telles que la génération d'images en parallèle, et en répondant à des besoins spécifiques tels que la génération de motifs, les cliparts transparents et nets et les variations de design. Pour le développement technique de ces services personnalisés, CF s'est tourné vers ML6, qui possédait une vaste expérience dans le développement et l'amélioration de grands modèles et dans l'IA générative par le biais de sa marque gener8.ai. ML6 a aidé CF, entre autres services, à créer un modèle personnalisé de génération de clipart à partir d'un fichier de coupe nette, un service d'outpainting efficace et à grande vitesse, ainsi qu'un upscaler.

Pour faire face à la relative nouveauté des logiciels de génération d'images d'IA, CF a décidé, avec ML6, d'utiliser la bibliothèque open source Diffusers de Hugging Face, qui est devenue entre-temps la norme de facto pour ce type de configuration. De plus, en créant une API personnalisée encapsulée dans un conteneur Docker, il a été possible de trouver le bon équilibre entre personnalisation et robustesse.

Enfin, pour relever les défis technologiques associés à la fourniture de grands réseaux neuronaux à un grand nombre d'utilisateurs simultanés, l'équipe chargée de l'infrastructure du FC a collaboré avec ML6 pour mettre au point une configuration sur AWS qui traite les données de la manière la plus rapide et la plus efficace possible. Amazon EC2 donne accès à des GPU de grande puissance de manière très efficace. Amazon ECS a automatiquement adapté la solution aux pics d'activité des utilisateurs. La possibilité d'utiliser une combinaison d'instances ponctuelles et d'instances à la demande a permis d'obtenir un excellent rapport coût-efficacité. Enfin, Amazon Simple Queue Service a permis à la solution de découpler facilement les microservices d'intelligence artificielle du reste de la pile technologique. Grâce à l'élasticité et à l'évolutivité d'Amazon ECS et d'Amazon SQS, Creative Fabrica a pu se concentrer sur la valeur et la rapidité de l'innovation, sans avoir à se préoccuper des frais généraux liés à la gestion d'une infrastructure complexe.

Par

Résultats

À ce jour, les clients ont émis près de 10 millions d'invites, générant plus de 40 millions d'images, dont plus de 4 millions ont été publiées pour être partagées avec d'autres sur la plateforme.

Pour ce projet, Creative Fabrica a choisi ML6 en raison de son expertise préexistante en matière d'IA générative et de sa méthode de travail agile et pratique. Bien qu'étant un natif du numérique et ayant beaucoup d'expertise technique, servir des modèles d'IA, en particulier des réseaux neuronaux à grande échelle, était une nouveauté pour Creative Fabrica. ML6 a travaillé en étroite collaboration avec l'équipe de Creative Fabrica, et a été en mesure de partager son expérience et d'améliorer les compétences de l'équipe au cours du projet.

Vous voulez en savoir plus sur cette affaire ? N'hésitez pas à consulter cet article de presse .