OpenAI Codexに「ゴブリンの話をするな」という指示が発覚

異例の禁止指示

GPT-5.5向けシステムプロンプトに記載
ゴブリンなど7種の生物への言及を禁止
旧モデル向け指示には同様の記載なし

背景と反応

GPT-5.5が無関係な会話でゴブリンに言及する問題
OpenAI社員はマーケティング施策ではないと否定
Altman CEOはジョークで反応し話題が拡散
詳細を読む

OpenAIが公開したコーディングツール「Codex CLI」のシステムプロンプトに、最新モデルGPT-5.5に対して「ゴブリン、グレムリン、アライグマ、トロール、鬼、ハトなどの動物や生き物について、ユーザーの質問と明確に関連がない限り絶対に話すな」という異例の指示が含まれていることが明らかになりました。この禁止指示は3,500語超の基本指示の中で2回繰り返されています。

この指示は先週、OpenAIGitHubに公開したCodex CLIのオープンソースコードの中で発見されました。同じJSONファイルに含まれる旧モデル向けの指示にはこの禁止事項がなく、GPT-5.5で新たに発生した問題への対処とみられます。実際にソーシャルメディア上では、GPT-5.5が無関係な会話の中で突然ゴブリンの話題を持ち出すという報告が複数のユーザーから上がっていました。

Codex開発チームのNick Pash氏は、この指示について「GPT-5.5やCodexへの注目を集めるためのマーケティング施策ではない」とソーシャルメディアで明言しています。しかしこの話題が広まると、OpenAIの幹部たちはむしろジョークとして受け入れる姿勢を見せました。

Sam Altman CEOは「Codexが話題になっている。いや、ゴブリンが話題だった、失礼」と投稿し、話題をさらに盛り上げました。AIモデルの予期しない振る舞いが、システムプロンプトという形で可視化された珍しい事例として注目を集めています。