Anthropicは、GPT-4などの他の業界モデルを上回る、Claude 3ファミリーを発表した。Claude 3ファミリーは3つの異なるモデルで構成されている。能力の高い順に、"Opus"、"Sonnet"、"Haiku"の3つのモデルが存在し、それぞれ知能、スピード、コストの面で多様なユーザーニーズに応えるように設計されている。
Anthropicは、OpusがOpenAIのGPT-4モデルよりも優れていることを、評価されたすべての側面で強調する比較データを明らかにした。例えば、大学院レベルの専門家による推論(GPQA)では、Opusのスコアは50.4%で、GPT-4の35.7%を14.7%も上回っている。同様に、基本的な数学のテストでは、OpusはGPT-4の92%を上回る95%を達成し、MMLU知識ではGPT-4の86.4%をわずかに上回る86.8%を記録している。
また、Claude 3はマルチモーダル機能に優れており、写真、表、グラフ、テクニカルダイアグラムなど、さまざまなビジュアル形式を処理できる。
さらに、Claude 3は文脈理解の向上を示しており、無害なユーザーリクエストへの回答を拒否する確率を低減した。Anthropicは、既知のモデルの弱点に関連する複雑な事実の質問を利用し、大規模でも高い精度を維持できることを強調している。
回答は、正解・不正解・不確実性の容認に分類され、モデルが不正確な情報を提供する代わりに、答えが不足していることを認める。このアプローチにより、OpusはClaude 2.1と比較して2倍の回答精度を提供可能になった。責任あるAI開発に関して、Anthropicは、Claude 3モデルファミリーは、専門チームが誤った情報や自律的な複製などのリスクを特定し、軽減することで、可能な限り信頼できるように設計されている点を強調している。
OpusはClaude 3の前衛として輝きを放ち、複雑な仕事における並外れた「人間に近い」把握力と明瞭な表現力で称賛を集めている。しかし、Hugging Faceの共同設立者兼CEOであるClement Delangue氏は、自身のXアカウントでこのようにコメントしている。
AI/Claudeはもちろん素晴らしいですが、(名前とは裏腹に)入力を受けて出力を生成できるよう、APIの背後にあるデータセットで訓練されたコードと確率的アルゴリズムの束であり、人間ではありません。より健全な議論と恐怖を煽るような言動を減らすために、このことを覚えておきましょう!
Anthropicは、バイアスを減らし中立性を促進しながら、モデルのセキュリティ、透明性、プライバシーを改善したと主張している。以前のAIバージョンより進歩したにもかかわらず、Claude 3モデルは、Anthropicの責任あるスケーリングポリシーのASL-2セキュリティレベルを維持している。
OpusとSonnetモデルは、開発者向けのClaude APIを通じて利用可能で、SonnetはAmazon BedrockとGoogle CloudのVertex AIModel Gardenのプライベートプレビューでもアクセスできる。