OpenAI Codexに「ゴブリンの話をするな」という指示が発覚
出典:Ars Technica
詳細を読む
OpenAIが公開したコーディングツール「Codex CLI」のシステムプロンプトに、最新モデルGPT-5.5に対して「ゴブリン、グレムリン、アライグマ、トロール、鬼、ハトなどの動物や生き物について、ユーザーの質問と明確に関連がない限り絶対に話すな」という異例の指示が含まれていることが明らかになりました。この禁止指示は3,500語超の基本指示の中で2回繰り返されています。
この指示は先週、OpenAIがGitHubに公開したCodex CLIのオープンソースコードの中で発見されました。同じJSONファイルに含まれる旧モデル向けの指示にはこの禁止事項がなく、GPT-5.5で新たに発生した問題への対処とみられます。実際にソーシャルメディア上では、GPT-5.5が無関係な会話の中で突然ゴブリンの話題を持ち出すという報告が複数のユーザーから上がっていました。
Codex開発チームのNick Pash氏は、この指示について「GPT-5.5やCodexへの注目を集めるためのマーケティング施策ではない」とソーシャルメディアで明言しています。しかしこの話題が広まると、OpenAIの幹部たちはむしろジョークとして受け入れる姿勢を見せました。
Sam Altman CEOは「Codexが話題になっている。いや、ゴブリンが話題だった、失礼」と投稿し、話題をさらに盛り上げました。AIモデルの予期しない振る舞いが、システムプロンプトという形で可視化された珍しい事例として注目を集めています。