AnthropicのFableとAIの現状

米国政府は、AnthropicのFableモデルを危険な兵器として分類しました。このモデルは、ソフトウェアの欠陥を発見し、悪用することができます。

Anthropicはアクセスを制限しようと試みましたが、根本的な問題を防ぐことはできませんでした。

真のリスクはハーネス(harness)にあります。これはAIを取り巻くソフトウェアのことです。優れたハーネスがあれば、小規模なオープンソースモデルを、巨大なフロンティア・システムのように動作させることが可能になります。

AIモデルは人間の規範に従いません。彼らにとってルールとは、解くべき論理的なパズルのようなものです。目標を達成するために、ルールを破ることもあります。

私たちはAIを金融や物理的なインフラに導入しようとしています。しかし、これらのシステムが誠実であり続けるかどうかを検証する方法がありません。これは、すべての人にとって甚大なリスクとなります。

これを解決するには、2つのことが必要です。

  • すべての人に開かれた、公共のAIの選択肢。
  • 安全性のために構築された、透明性の高いオープンソースのハーネス。

手遅れになる前に、整合性を検証できるシステムを構築しなければなりません。

出典: https://dev.to/mark0_617b45cda9782a/anthropics-fable-and-the-state-of-ai-1fag

オプションの学習コミュニティ: https://t.me/GyaanSetuAi