AIエージェントがHugging Face Spacesを連鎖し3Dギャラリーを自動構築
詳細を読む
Hugging FaceのエンジニアMishig Davaadorj氏が2026年6月9日、AIコーディングエージェントが2つのHugging Face Spacesを連鎖させてパリの名所を3Dガウシアンスプラットで表示するギャラリーサイトを自動構築した事例をブログで公開しました。画像生成にはIdeogram4、単一画像からの3D再構成にはTripoSplatが使われ、エージェントは画像生成からファイル圧縮、ビューア構築、デプロイまでを一貫して実行しました。
この事例の技術的な核となるのが、Gradio Spaceが自動公開するagents.mdという仕様ファイルです。agents.mdにはAPIスキーマのURL、エンドポイントの呼び出し方法、ファイルアップロード手順、認証方式がプレーンテキストで記載されており、エージェントはクライアントライブラリやSDKなしでSpaceを操作できます。これにより、異なる組織が開発した最先端モデル同士を統合コードゼロで連鎖させることが可能になります。
Davaadorj氏はMitchell Hashimoto氏が提唱する「ビルディングブロック経済」の概念を引用し、AIがゼロからの構築よりも実績あるコンポーネントの組み合わせに優れている点を強調しています。従来コードライブラリの文脈で語られてきたこの考え方が、画像生成・動画・音声・3Dなどマルチメディア領域にも波及しつつあるという見解を示しました。
実用性を示す証拠として、パリのギャラリー構築後に同じパイプラインで日本とエジプトのギャラリーも「1文の指示」で量産できたことが報告されています。エッフェル塔やカルナック神殿、姫路城など各国6つの名所が3Dスプラットで再構成され、Three.jsベースのビューアにスクロール切替やドラッグ回転のUIが実装されました。人間が介入したのは「もう少しズームアウトして」「オベリスクを別の建造物に差し替えて」といった審美的な判断のみでした。
この事例は、モデルの統合に伴うSDK管理やGPU確保、入力形式の変換といった障壁がagents.mdによって大幅に低下したことを示しています。「プロンプトから回転する3Dモニュメントを生成する」という作業が、かつてはプロジェクト単位の取り組みだったものが、パイプラインの1ステップに縮小されたとDavaadorj氏は述べています。