𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

Translated for your language. 原文を読む.

AI-assisted draft.

一昨日2分で読めます

OpenAIとAnthropicがAIシステムを設計する方法

多くの人が、APIドキュメントやブログ記事を見て、AI企業の仕組みをリバースエンジニアリングしようとします。彼らはモデルやエンドポイントに注目しがちですが、これは誤った結論を導くことにつながります。

モデルはパズルのほんの一部に過ぎません。

OpenAIやAnthropicのような企業は、単にモデルを構築しているだけではありません。彼らは巨大なエコシステムを構築しています。大規模な分散システムを構築しているのです。

もし彼らが単により優れたモデルを持っているだけだと思っているなら、本当の秘密を見逃しています。彼らの成功は、統合されたループを通じて、それらのモデルをどのようにトレーニング、デプロイ、そして改善していくかという点にあります。

この規模のプロダクションAIシステムには、いくつかのレイヤーが必要です：

• Data Pipelines: トレーニングデータの収集とクリーニングのため。 • Training Infrastructure: 膨大な計算コストと並列処理を管理するため。 • Model Layer: 精度を担保するためのコアアーキテクチャ。 • Inference Layer: 低レイテンシでレスポンスを提供するため。 • Safety Layer: ガードレールとアライメントを適用するため。 • Observability: パフォーマンスの監視とエラーのデバッグのため。 • Feedback Loops: 時間の経過とともにモデルを改善するため。

各レイヤーは互いに依存しています。一つを変更すれば、システム全体に影響が及びます。

トレーニングも継続的なプロセスです。これらの企業は、一度モデルをトレーニングして終わり、というわけではありません。彼らは継続的なトレーニング・パラダイムを採用しています。絶え間なく流入する新しいデータを処理するために、数千ものGPUを使用しています。

アライメントと安全性も、彼らの設計の核心です。彼らはモデルの挙動を制御するために、さまざまな戦略を用いています：

• RLHF: 高品質なアライメントのために人間のフィードバックを利用。 • Constitutional AI: スケーラビリティのためにルールベースのガイダンスを利用。 • Prompt Constraints: 素早いセットアップのためにシステム指示を利用。 • Output Filtering: モデレーションのために後処理を利用。

彼らはこれらの手法を組み合わせて、堅牢性を維持しています。

モデルの準備ができたら、それをサービング（提供）しなければなりません。彼らはバッチ処理、キャッシュ、量子化（quantization）などの技術を使用しています。これらは、速度とコストのトレードオフを管理するのに役立ちます。

最後に、彼らはすべてを把握するためにオブザーバビリティ（観測性）を活用します。AIの出力は常に同じとは限らないため、デバッグは困難です。単一のエラーを見るだけでは不十分です。システム全体のパターンを見る必要があります。

AIにおける成功は、これらの複雑な相互作用を管理することから生まれます。彼らはAIを静的な製品ではなく、進化し続けるシステムとして扱っているのです。

Source: https://dev.to/stack_overflowed/how-companies-like-openai-and-anthropic-design-their-ai-systems-2537

Optional learning community: https://t.me/GyaanSetuAi

𝗛𝗼𝘄 𝗢𝗽𝗲𝗻𝗔𝗜 𝗮𝗻𝗱 𝗔𝗻𝘁𝗵𝗿𝗼𝗽𝗶𝗰 𝗗𝗲𝘀𝗶𝗴𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

続きを読む

AI開発について語るべきこと

OpenAIとAnthropicはどのようにAIシステムを設計しているのか

𝗕𝗶𝗮𝘀 𝗜𝗻 𝗔𝗜 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

OpenAI、少量の有益なトレーニングがAIの安全性を高めることを発見

本番環境におけるAI技術の失敗：AIの調整ギャップを埋める