Positron AI lève 230 millions de dollars en série B avec une valorisation supérieure à 1 milliard de dollars visant à développer l'inférence IA écoénergétique

Codirigé par ARENA Private Wealth, Jump Trading et Unless, avec des investissements stratégiques de la Qatar Investment Authority (QIA), Arm et Helena

Ce financement accélère la feuille de route de Positron, qui prévoit de passer des systèmes Atlas actuels à la prochaine génération de silicium Asimov, avec une mise en production prévue fin 2026 et un lancement commercial début 2027, comme annoncé lors du Web Summit Qatar

Thomas Sohmers (L), CTO and cofounder, and Mitesh Agrawal (R), CEO of Positron AI (Credit: Kavita Agrawal)

RENO, Nevada--(BUSINESS WIRE)--Positron AI, leader dans le domaine du matériel d'inférence IA économe en énergie, a annoncé aujourd'hui une levée de fonds de série B sursouscrite de 230 millions de dollars, avec une valorisation post-financement supérieure à 1 milliard de dollars.

Cette levée de fonds a été codirigée par ARENA Private Wealth, Jump Trading et Unless, et comprend de nouveaux investissements stratégiques de la Qatar Investment Authority (QIA), d'Arm et d'Helena. Les investisseurs existants Valor Equity Partners, Atreides Management, DFJ Growth, Resilience Reserve, Flume Ventures et 1517 ont également participé. Ce financement valide la mission de Positron consistant à rendre l'inférence IA considérablement moins coûteuse et plus économe en énergie à grande échelle.

« Nous sommes reconnaissants de l'enthousiasme des investisseurs, qui reflète lui-même les attentes du marché », déclare Mitesh Agrawal, directeur général de Positron AI. « La disponibilité de l'énergie est devenue un obstacle majeur au déploiement de l'IA. Notre puce de nouvelle génération offrira 5 fois plus de tokens par watt dans nos charges de travail principales que le prochain GPU Rubin de Nvidia. La mémoire est l'autre obstacle majeur à l'inférence, et notre silicium personnalisé Asimov de nouvelle génération sera livré avec plus de 2 304 Go de RAM par appareil l'année prochaine, contre seulement 384 Go pour Rubin. Cela constituera un facteur de différenciation essentiel dans les charges de travail telles que la vidéo, le trading, les modèles à plusieurs billions de paramètres et tout ce qui nécessite une fenêtre contextuelle énorme. Nous prévoyons également de surpasser Rubin en termes de performances par dollar pour certaines charges de travail spécifiques gourmandes en mémoire. »

Positron met en place l'infrastructure qui rend l'IA utilisable à grande échelle en réduisant le coût et la puissance nécessaires pour faire fonctionner les modèles modernes. Le produit commercialisé par l'entreprise, Atlas, est un système d'inférence conçu pour un déploiement et une mise à l'échelle rapides. Atlas est également un silicium et un système entièrement fabriqués aux États-Unis, ce qui permet une montée en production rapide et un approvisionnement fiable pour les clients qui ont besoin de capacités rapidement.

« La bande passante et la capacité mémoire sont deux des principaux facteurs limitant la mise à l'échelle des charges de travail d'inférence IA pour les modèles de nouvelle génération », déclare Dylan Patel, fondateur et directeur général de SemiAnalysis, conseiller et investisseur chez Positron. SemiAnalysis est un cabinet de recherche de premier plan spécialisé dans les semi-conducteurs et les infrastructures IA qui fournit des informations détaillées sur l'ensemble de la pile informatique. « Positron adopte une approche unique visant à résoudre le problème de l'évolutivité de la mémoire et, grâce à sa puce Asimov de nouvelle génération, est en mesure d'offrir une capacité de mémoire haute vitesse par puce supérieure d'un ordre de grandeur à celle des fournisseurs de silicium établis ou émergents. »

Jump Trading prend les devants après avoir déployé Atlas

L'un des faits marquants de cette levée de fonds est la décision de Jump Trading de codiriger l'opération après être devenu client.

« Pour les charges de travail qui nous intéressent, les goulots d'étranglement sont de plus en plus la mémoire et la puissance, et non le calcul théorique », déclare Alex Davies, directeur technique de Jump Trading. « Lors de nos tests, Positron Atlas a offert une latence de bout en bout environ trois fois inférieure à celle d'un système comparable basé sur H100 pour les charges de travail d'inférence que nous avons évaluées, dans un environnement refroidi par air, prêt pour la production et avec une chaîne d'approvisionnement que nous pouvons planifier. Plus nous avons approfondi notre analyse, plus nous avons adhéré à la feuille de route de Positron (les systèmes Asimov et Titan) en tant que plateforme axée sur la mémoire et conçue pour les charges de travail futures. Nous avons investi parce que Positron combine une traction immédiate avec une feuille de route capable de remodeler la courbe des coûts et les capacités d'inférence. »

« Jump Trading est venu chez Positron en tant que client », déclare M. Agrawal. « Lorsqu'ils ont vu notre feuille de route pour Asimov, notre silicium personnalisé, et Titan, notre système de nouvelle génération, ils ont choisi de devenir co-investisseur principal. Le fait qu'un client devienne investisseur est l'une des plus fortes validations que nous puissions recevoir. Cela témoigne à la fois d'une conviction technique et d'une demande réelle. »

Vers Asimov et Titan : une plateforme axée sur la mémoire pour l'inférence de nouvelle génération

Le silicium personnalisé de nouvelle génération de Positron, Asimov, est conçu pour répondre au fait que les charges de travail de l'IA moderne sont de plus en plus limitées par la bande passante et la capacité de la mémoire, et pas seulement par la puissance de calcul. Asimov est conçu pour prendre en charge 2 téraoctets de mémoire par accélérateur et 8 téraoctets de mémoire par système Titan, avec une bande passante mémoire similaire à celle du GPU Rubin de nouvelle génération de NVIDIA. À l'échelle d'un rack, cela se traduit par une capacité de mémoire bien supérieure à 100 téraoctets.

« À mesure que l'inférence IA évolue, l'efficacité et la conception du système importent davantage que les benchmarks bruts », déclare Eddie Ramirez, vice-président de la division Cloud AI Business Unit chez Arm. « L'approche centrée sur la mémoire de Positron, basée sur la technologie Arm, reflète la manière dont des systèmes étroitement couplés et un vaste écosystème s'associent pour offrir des gains évolutifs en termes de performances par watt dans l'infrastructure IA de nouvelle génération. »

Cette architecture axée sur la mémoire permet de traiter des charges de travail d'inférence à forte valeur ajoutée, notamment les modèles linguistiques à contexte long, les flux de travail agentique et les modèles multimédias et vidéo de nouvelle génération. Positron est en bonne voie pour commercialiser sa puce Asimov seulement 16 mois après que son financement de série A en juin lui ait donné les ressources nécessaires pour lancer pleinement le processus de conception, et la société a l'intention de maintenir ce rythme avec ses futures puces. « Pour nous, la vitesse de développement est un avantage concurrentiel essentiel », déclare M. Agrawal. « Pour rivaliser avec Nvidia, il faut égaler leur fréquence de livraison, et nous avons conçu notre organisation autour de cet objectif. »

« Positron résout l'un des goulots d'étranglement les plus importants de l'IA : fournir une inférence à grande échelle dans le cadre des contraintes réelles en matière d'énergie et de coûts », déclare Ari Schottenstein, responsable des alternatives chez ARENA Private Wealth. « La combinaison de la traction actuelle avec Atlas et d'une voie crédible vers Asimov crée une occasion rare de définir une nouvelle catégorie dans l'infrastructure de l'IA. »

Positron construit cette plateforme avec un écosystème de leaders du secteur, notamment Arm, Supermicro et d'autres partenaires clés dans les domaines de la technologie et de la chaîne d'approvisionnement.

Dynamique et trajectoire de croissance

Positron prévoit une forte croissance de son chiffre d'affaires en 2026, ce qui positionne l'entreprise comme l'une des sociétés de silicium à la croissance la plus rapide jamais enregistrée, avec une traction commerciale à grande échelle environ 2,5 ans après son lancement. La société travaille avec plusieurs clients pionniers dans les domaines du cloud, du calcul avancé et des secteurs verticaux sensibles aux performances, et continue d'étendre ses déploiements et ses programmes clients.

À propos de Positron AI

Positron AI développe du matériel et des logiciels spécialement conçus pour rendre l'inférence IA nettement moins coûteuse et plus économe en énergie. Le produit commercialisé par Positron, Atlas, est conçu pour un déploiement rapide et évolutif, et le silicium personnalisé de nouvelle génération de l'entreprise, Asimov, devrait être mis en production fin 2026, avec un lancement prévu début 2027. Les systèmes de Positron sont conçus pour prendre en charge des charges de travail d'IA de nouvelle génération et à long terme avec une rentabilité optimale. Pour en savoir plus, rendez-vous sur positron.ai.

Le texte du communiqué issu d’une traduction ne doit d’aucune manière être considéré comme officiel. La seule version du communiqué qui fasse foi est celle du communiqué dans sa langue d’origine. La traduction devra toujours être confrontée au texte source, qui fera jurisprudence.

Contacts

Contact médias :
Helen Cho
Bonfire Partners
press@bonfirepartners.io

Industry:

Back to Newsroom

Services & Solutions

Services

Solutions For

Resources

Education

Why Business Wire

Positron AI lève 230 millions de dollars en série B avec une valorisation supérieure à 1 milliard de dollars visant à développer l'inférence IA écoénergétique

Contacts

Positron AI

Contacts

Positron AI

Contacts