PinterestがQwen改造でAIコスト90%削減
詳細を読む
Pinterestは月間アクティブユーザー6.2億人を抱えるビジュアル発見プラットフォームです。同社CTOのMatt Madrigal氏は、オープンソースモデルQwen3-VLの視覚エンコーダ層を取り除き、独自のマルチモーダル埋め込みで再構築することで、AIコストを90%削減し、精度を30%向上させたことを明らかにしました。
従来の手法では、推論時に返される画像を1枚ずつエンコードする必要があり、レイテンシが大幅に悪化していました。独自埋め込みの導入により、ピンや画像のメタデータをオフラインで事前計算し、定期的に再学習できるようになったため、推論速度は20倍に改善しています。Madrigal氏は「独自データで微調整すれば、データ品質がモデルサイズを上回る」と述べています。
同社はGoogleのBERTやOpenAIのCLIPの時代からオープンソースモデルの社内カスタマイズに取り組んできました。会話型ショッピングアシスタント「Navigator 1」もQwen3-VLをベースに大幅な改造を施して構築されています。Apache 2.0ライセンスのモデルを活用し、重みレベルで自社ユースケースに最適化する戦略が、コスト効率とパフォーマンスの両立を可能にしています。
さらにPinterestは「テイストグラフ」と呼ばれる嗜好表現の仕組みを構築しています。これはソーシャルグラフではなく、数十億人のユーザーが何に興味を持ち、次に何をしたいかを動的に捉えるプリファレンスグラフです。ユーザー埋め込みは行動や新規コンテンツに基づいて常時更新され、ミッドセンチュリーモダンやナンタケットスタイルといった個人の美的嗜好に合った商品をパーソナライズして提示します。
この仕組みにより、インスピレーションの発見から購買意図への転換という「上位ファネルから下位ファネルへの誘導」が実現されています。Madrigal氏は、6億人超のユーザーに対してスケールが求められる機能については「自社構築するか、オープンソースを徹底的にカスタマイズする」と方針を示しました。