Unconventional AI vise à réduire la consommation d'énergie de l'IA par 1 000
Alors que la demande mondiale en intelligence artificielle menace de dépasser les réserves d'énergie disponibles, une nouvelle startup tente de réécrire les règles de l'architecture matérielle. Dirigée par l'ancien responsable de l'IA chez Databricks, Naveen Rao, Unconventional AI mise sur une nouvelle méthode de calcul radicale pour résoudre la crise énergétique imminente du secteur.
Dépasser les architectures silicium traditionnelles
Le cœur de la mission d'Unconventional AI réside dans sa rupture avec les puces conventionnelles qui alimentent actuellement les grands modèles de langage (LLM) et les modèles de diffusion. Alors que l'industrie s'est largement concentrée sur l'optimisation des architectures GPU et TPU existantes, Rao et son équipe repartent de zéro en utilisant une architecture informatique basée sur des oscillateurs.
Cette approche est fondamentalement différente des transistors utilisés dans l'informatique numérique standard. En exploitant des oscillateurs, l'entreprise vise à effectuer le traitement de l'inférence avec une efficacité sans précédent. Rao avance que ce changement pourrait à terme réduire la consommation d'énergie requise pour l'inférence de l'IA jusqu'à 1 000 fois, transformant l'IA d'un fardeau énergivore en un service durable.
Un0 : le « Hello World » de l'informatique basée sur les oscillateurs
Pour démontrer la viabilité de ce concept matériel radical, l'entreprise a récemment dévoilé son premier modèle, Un0. Bien qu'Un0 fonctionne actuellement sur une simulation logicielle des puces à oscillateurs prévues par l'entreprise, les résultats sont significatifs. Le modèle est un système de génération d'images qui reproduit les performances des modèles de diffusion de pointe tels que Stable Diffusion ou GPT Image 1 d'OpenAI.
Décrivant cette sortie comme le « hello world » d'un nouveau type d'ordinateur, Rao a souligné que l'objectif était de prouver qu'une logique matérielle complètement différente peut toujours produire des résultats de haute qualité et de haute fidélité. Le document de recherche qui l'accompagne détaille comment cette architecture simulée peut gérer avec succès des tâches génératives complexes, fournissant une feuille de route pour le futur matériel physique.
Résoudre le goulot d'étranglement énergétique du passage à l'échelle de l'IA
Le moment de ce développement est crucial. À mesure que les modèles d'IA augmentent en nombre de paramètres et en complexité, la principale contrainte à la croissance passe de la disponibilité des données à la disponibilité de l'énergie. Rao soutient que l'énergie deviendra la « limite fondamentale » de l'IA dans les années à venir, créant un plafond strict à la quantité d'intelligence qui pourra être déployée.
Unconventional AI prévoit de s'attaquer à ce problème en construisant une pile d'inférence complète. La feuille de route comprend :
- Le développement de puces physiques basées sur des oscillateurs et la publication de leurs schémas.
- La construction de systèmes entiers composés de ces puces propriétaires.
- La fourniture de capacité de calcul en tant que service, où les utilisateurs envoient des requêtes via un câble réseau et reçoivent des inférences pour 1/1000e du coût énergétique actuel.
Bien que l'entreprise reste agile avec moins de 50 employés, sa mission s'attaque à l'obstacle macroéconomique le plus important auquel est confronté l'ensemble du secteur de l'IA : le coût insoutenable de l'électricité.
Points clés
- Changement matériel radical : Unconventional AI s'éloigne du silicium traditionnel pour adopter une architecture basée sur des oscillateurs afin d'optimiser l'inférence de l'IA.
- Performance prouvée : Le modèle Un0 de l'entreprise démontre que cette nouvelle architecture peut égaler les capacités de génération d'images des leaders du secteur comme Stable Diffusion.
- Résolution de la crise énergétique : L'objectif ultime est de réduire la consommation d'énergie de l'IA par 1 000, répondant ainsi au goulot d'étranglement énergétique imminent qui menace de limiter le passage à l'échelle de l'IA.
