Logical Intelligence erreicht 76 Prozent beim Putnam-Benchmark und unterstreicht damit den Wandel von großen Sprachmodellen hin zu sprachfreien, mathematisch fundierten Modellen
Logical Intelligence erreicht 76 Prozent beim Putnam-Benchmark und unterstreicht damit den Wandel von großen Sprachmodellen hin zu sprachfreien, mathematisch fundierten Modellen
SAN FRANCISCO--(BUSINESS WIRE)--In den letzten zehn Jahren wurde künstliche Intelligenz (KI) weitgehend auf der Grundlage großer Sprachmodelle (LLMs) entwickelt. Diese Systeme basieren auf einer Sprache und erraten Wörter in einer Kette in Form von Tokens. Infolgedessen kommt es häufig zu Halluzinationen, und zur Lösung von Aufgaben ist eine umfangreiche Rechen- und Energieinfrastruktur erforderlich. In Situationen, in denen Systeme wie öffentliche Sicherheit, nationale Infrastruktur und industrielle Automatisierung Logik erfordern, können große Sprachmodelle versagen und Sicherheitsrisiken verursachen. Tokenfreie sprachunabhängige Modelle stellen eine neue Richtung für die KI dar. Sie sagen keine Wörter voraus. Sie suchen nach korrekten Lösungen und erfordern weniger Rechenleistung. Logical Intelligence ist das erste Unternehmen, das sich ausschließlich auf mathematisch abgeleitete, nicht autoregressive EBM-Argumentation (Energy Based Model) stützt.
Logical Intelligence hat heute bekannt gegeben, dass sein Tool Aleph beim Putnam Benchmark, einem der anspruchsvollsten Tests für mathematisches Denken im Bereich der künstlichen Intelligenz, eine Punktzahl von 76 Prozent erreicht hat. Die Benchmark misst die Fähigkeit eines Modells, formale mathematische Probleme zu lösen, indem es verifizierte Beweise erzeugt, anstatt sich auf die Textgenerierung zu stützen. Obwohl Aleph ein internes Tool ist, das auf einem LLM basiert, übertrifft es mit seiner Leistung alle öffentlich bewerteten LLMs und die hybriden EBM-Systeme, die nach wie vor auf LLM-Gerüsten basieren. Die Ergebnisse sind ein deutliches Signal dafür, dass native EBM-Architekturen einen klaren Weg zu vertrauenswürdiger KI bieten.
„Wir haben Aleph als internes Tool entwickelt, um die mathematische Genauigkeit der von uns geschaffenen Umgebung zu testen, nicht als unser Kernmodell“, erklärte Eve Bodnia, Gründerin und CEO von Logical Intelligence. „Die Leistung von Aleph bestätigt, dass unsere Grundlagen solide sind, obwohl Aleph selbst auf einem LLM entwickelt wurde. Das Tool stellt nur einen Bruchteil dessen dar, was wir von unserem Kernmodell erwarten."
Warum Logical Intelligence EBMs anstelle von LLMs einsetzt
Die meisten KI-Systeme denken genauso, wie sie schreiben: Wort für Wort. Dies erzeugt lange, empfindliche Ketten von Token, die durch einen einzigen falschen Schritt auseinanderfallen können. Das Modell erhält erst am Ende der Kette eine „Endnote“, ohne dass erkennbar ist, an welcher Stelle die Argumentation fehlerhaft war. Dies macht LLMs unvorhersehbar und ungeeignet für Umgebungen, in denen garantierte Korrektheit erforderlich ist.
Logical Intelligence setzt EBMs ein, da diese nach einem anderen Prinzip funktionieren. Ein EBM denkt nicht in Worten. Es argumentiert in kontinuierlichen mathematischen Zuständen, die durch die Struktur des Problems geprägt sind. Anstatt Text Token für Token zu erzeugen, aktualisiert das Modell seinen gesamten internen Zustand auf einmal. Dies ermöglicht es, den Kurs zu korrigieren, Alternativen zu erkunden und zu stabilen, überprüfbaren Antworten zu gelangen. Das System verhält sich eher wie ein ausgebildeter Mathematiker als wie eine Textvorhersage-Engine.
EBMs sind darauf ausgerichtet, das Rückgrat von Systemen zu werden, in denen Unsicherheit nicht akzeptabel ist. Dazu gehören vollständig selbstfahrende Fahrzeuge, fortschrittliche Luftfahrt, automatisierte Fertigung, Stromnetze, Verteidigungssysteme, autonome Robotik, Chipdesign und nationale Infrastruktur. Jede Umgebung, die darauf angewiesen ist, dass sich Logik jedes Mal gleich verhält, erfordert die Art von deterministischer Argumentation, die EBMs bieten können.
„Wenn Sie Gewissheit benötigen, können Sie sich nicht auf Wortvorhersagen verlassen“, Bodnia. „Sie brauchen ein System, das die Struktur eines Problems durchdringt. EBMs bieten uns die Grundlage dafür.“
Warum Aleph von Bedeutung ist
Aleph wurde für einen bestimmten Zweck entwickelt. Es handelt sich um ein Tool, das mathematische Probleme in formale Aussagen umwandelt und Beweise generiert, die maschinell überprüft werden können. Dadurch können Forscher überprüfen, ob eine Antwort mathematisch korrekt ist. Selbst als internes Tool, das auf einem LLM basiert, stellt die Fähigkeit von Aleph, große Mengen an überprüfbaren Nachweisen zu generieren, einen bedeutenden Fortschritt dar. Die meisten KI-Systeme sind in der Lage, Mathematik zu beschreiben. Nur sehr wenige können etwas nachweisen.
„Aleph bietet uns heute ein neues Maß an Sicherheit in der KI“, erklärte Bodnia. „Dies ist ein erstes Anzeichen dafür, was möglich ist, wenn man Systeme auf mathematischer Wahrheit aufbaut.“
Logical Intelligence arbeitet bereits mit einer kleinen Gruppe von Organisationen zusammen, um erste Anwendungen von Aleph in kontrollierten Umgebungen in wichtigen vertikalen Branchen zu testen. Diese Pilotprojekte dienen dazu, zu untersuchen, wie mathematische Verifizierung reale Systeme unterstützen kann.
Logical Intelligence wird sein Allzweckmodell mit formaler, maschinell überprüfbarer Argumentation im Jahr 2026 veröffentlichen. Dieses System wird weit über Aleph hinausgehen und demonstrieren, wie mathematisches Denken komplexe, hochsichere Umgebungen in großem Maßstab unterstützen kann. Das Unternehmen wird demonstrieren, wie sein Ansatz in Branchen eingesetzt werden kann, in denen perfekte Logik erforderlich ist.
„Aleph ist unser erster Meilenstein“, erklärte Bodnia. „Das vollständige System wird im Jahr 2026 eingeführt werden.“
Für weitere Informationen und um das Aleph-Whitepaper zu lesen, besuchen Sie bitte www.logicalintelligence.com/aleph-prover.html.
Über Logical Intelligence
Logical Intelligence ist ein Forschungsunternehmen im Bereich der künstlichen Intelligenz, das die ersten vollständig sprachfreien, mathematisch fundierten energiebasierten Modelle entwickelt. Diese Systeme unterscheiden sich von LLMs und hybriden EBM-Ansätzen dadurch, dass sie direkt im strukturierten Zustandsraum argumentieren und Beweise generieren, deren Richtigkeit überprüft werden kann. Logical Intelligence entwickelt seine Modelle zur Unterstützung kritischer Infrastrukturen, fortschrittlicher Automatisierung und hochzuverlässiger Datenverarbeitung. Zu seinem Team gehören Forscher mit höheren Abschlüssen in Mathematik und Informatik, ICPC- und IMC-Medaillengewinner, Mitwirkende an bedeutenden Beweissystemen, ein Fields-Medaillengewinner und ein Turing-Preisträger, der die langfristige wissenschaftliche Ausrichtung des Unternehmens leitet. Für weitere Informationen besuchen Sie bitte www.logicalintelligence.com oder folgen Sie uns auf X unter @logic_int und unserer Gründerin und CEO unter @EveLovesOlive.
Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.
