Pramaana Labs、形式検証によるAIの信頼性解決に向けて2,700万ドルを調達

企業がAIを実験的なパイロットプログラムからミッションクリティカルな業務へと移行させることに苦心する中、業界は「信頼性」という巨大な障壁に直面しています。Pramaana Labsは、大規模言語モデル(LLM)の予測不可能な性質に対し、形式検証(formal verification)の数学的な厳密さを適用することで、このギャップを埋めることを目指しています。

確率論的AIと決定論的AIのギャップを埋める

現代のAIにおける根本的な緊張関係は、確率論的な推論と決定論的な真実との違いにあります。LLMは自然言語の処理や複雑で非構造化されたデータの扱いに長けている一方で、ハルシネーション(幻覚)や論理的エラーを起こしやすいという側面があります。たった一つのミスが法的または財務的な破綻を招きかねない業界にとって、こうしたエラーは許容できるものではありません。

Pramaana Labsは、ハイブリッドなアーキテクチャを構築することでこの問題に取り組んでいます。同社のシステムは、従来のLLMエンジンを利用して自然言語による対話に必要な柔軟性を維持しつつ、その上に決定論的な検証レイヤーを重ね合わせます。このレイヤーは、LLMによって生成された出力が厳格にコード化されたルールに従うことを保証し、エラーに対する数学的なガードレールとして効果的に機能します。

重要度の高い産業用途へのLEANの活用

標準的なソフトウェアテストとは異なり、Pramaana Labsは形式検証のツールを活用しており、特にオープンソースのプログラミング言語であるLEANから着想を得ています。LEANは伝統的に複雑な数学的証明を検証するために使用されていますが、Pramaanaはこの技術を適応させ、特定の専門領域における「ルール」をコード化することを計画しています。

同社は、正確性が譲れない条件となる、極めて機密性の高い垂直市場(バーティカル)をターゲットとしています:

これらのシステムが現実に基づいたものであることを確実にするため、Pramaanaは一流のドメインエキスパートと協力しています。これには、税務関連のアプリケーションのための元IRS(内国歳入庁)局長Danny Werfelや、サイバーセキュリティおよび創薬プロトコルを監督するためのIIT Delhi、IIT Madras、UC Berkeleyの教授陣が含まれます。

なぜこれがAIエコシステムにとって重要なのか

Khosla Venturesが主導し、Accel、Boldcap、Nexus Venture Partners、Premji Invest、Unboundが参加した2,700万ドルのシードラウンドは、AI投資における劇的な変化を象徴しています。生成AIの「素早く動き、破壊せよ(move fast and break things)」の時代は、エンタープライズの世界が求める「検証と妥当性確認(verify and validate)」の要件に直面しています。

Pramaana Labsは、形式化されていない知識を実行可能で検証可能なコードへと変換することで(フランスのCATALAプロジェクトと同様に)、規制の厳しいセクターにおいてAIをどのように展開すべきかの青写真を示しています。もしこれが成功すれば、AIが人間の健康、法的権利、そして巨大な金融システムを安全に管理できるようになり、数兆ドル規模の価値を解き放つ可能性があります。

主なポイント