AnthropicとOpenAIが安全・保護強化

2025年12月18日 OpenAI Anthropic Stripe Notion Claude エコシステム

Anthropicの安全施策

Agent Skillsをオープン公開

SB53準拠の透明性枠組み

過度な同調性を抑制評価

U18原則を仕様に追加

自傷会話の評価結果公開

企業ポリシーを一元管理

発達科学に基づく安全応答定義

詳細を読む

AnthropicはAgent Skillsをオープンスタンダードとして公開し、企業がAIエージェント機能を既存のワークフローや社内システムに容易に組み込めるよう標準化の取り組みを進めました。

Atlassian・Figma・Canva・Stripe・Notionなどの主要パートナーがすでに独自のSkillsを構築しており、エコシステムが急速に拡大しつつある状況が明らかになっています。

エンタープライズ顧客向けに組織全体でのClaude利用ポリシーを一元管理できる管理ツールも同時に発表され、大企業での全社導入をさらに後押しする機能として注目されています。

OpenAIはモデル仕様に「U18原則」を追加し、13歳から17歳のユーザーに対して発達科学に基づいた安全で年齢に適切な応答パターンを明確に定義することで保護を強化しました。

Anthropicは自傷・自殺関連の会話でのClaudeの評価結果を積極的に公開し、共感的かつ正直にAIとしての限界を伝えながら適切な支援につなげる方針の詳細を明文化しています。

過度な同調性（sycophancy）を抑制するための評価基準も新たに導入され、ユーザーが望む答えよりも真実を優先するAIの動作が技術的かつ体系的に促進される仕組みが整いました。

AnthropicはカリフォルニアのフロンティアAI透明性法（SB53）への準拠フレームワークを詳細に公開し、法令遵守を超えた業界全体の透明性向上に積極的に貢献しています。