Midjourney(プロダクト)に関するニュース一覧

Midjourney技術者がWeb設計を革新するOSSライブラリPretext公開

Pretextの技術革新

DOM迂回でテキスト計測を高速化
15KBのゼロ依存TypeScriptライブラリ
300〜600倍の描画性能向上を実現
モバイルでも120fps動作可能

開発手法と反響

48時間でGitHub星1.4万獲得
X上で1900万回閲覧を記録

企業への示唆

生成AIのUI構築に即時導入推奨
アクセシビリティ管理は自社責任に

MidjourneyエンジニアCheng Lou氏が2026年3月27日、Webテキストレイアウトを根本から変えるオSSライブラリPretextMITライセンスで公開しました。15KBのゼロ依存TypeScriptライブラリで、ブラウザのDOM操作を迂回し、テキストの計測と配置を高速に行います。

従来のWeb開発では、テキストの高さや位置を取得するたびにブラウザがレイアウトリフローと呼ばれる再計算を実行し、深刻なパフォーマンス低下を招いていました。PretextはブラウザのCanvasフォントメトリクスと純粋な算術演算を組み合わせ、DOMに一切触れずに文字・単語・行の配置を予測します。

ベンチマークによると、Pretextのlayout関数は500種類のテキストを約0.09ミリ秒で処理でき、従来のDOM読み取りと比較して300〜600倍の性能向上を達成しています。この速度により、ウィンドウリサイズや物理演算中でもリアルタイムにテキスト再配置が可能になりました。

開発にはAnthropicClaudeOpenAICodexなどAIコーディングツールが活用されました。多言語データセットや小説全文を用いてブラウザ実装とのピクセル単位の整合性を反復検証し、WebAssemblyやフォント解析ライブラリなしで高精度を実現しています。

公開から48時間でGitHubスター1万4000超、X上で1900万回閲覧を記録しました。コミュニティでは雑誌レイアウト、物理演算テキスト、ディスレクシア向けフォント調整など多彩なデモが登場し、Web表現の可能性が大きく広がっています。

企業にとっては、生成AI UIや高頻度データダッシュボードを構築する場合に即時導入が推奨されます。ただしレイアウトをユーザーランドに移すことで、ブラウザが担っていたアクセシビリティや標準準拠の責任を自社で管理する必要がある点には留意が必要です。

AIエージェントがVCの投資判断を自動化するADIN登場

ADINの仕組みと実績

複数のAIエージェントが審議
1時間でデューデリ完了
実案件に10万ドルを出資

VC業界への二重の脅威

AIでスタートアップ低コスト化加速
資金需要の消滅が最大の懸念
SaaS投資モデルの崩壊リスク

残る人間の役割

ネットワーク形成は人間が担当
最終投資決定は人間が判断

2025年、米国のTribute Labsが立ち上げたADIN(自律型ディール投資ネットワーク)は、複数のAIエージェントがピッチデッキを解析し、約1時間で投資判断を下すプラットフォームです。実際にAIスタートアップへ10万ドルの出資を実行しました。

ADINはTech Oracle・Unit Master・Monopoly Makerなど個性の異なる12種類のエージェントを擁し、技術・財務・市場独占性をそれぞれ評価します。過半数が支持した案件に推奨投資を提示する仕組みで、通常数週間かかるデューデリジェンスを大幅に圧縮します。

VC業界はここ10年でソフトウェアSaaSから多くの利益を得てきましたが、AIの進化でスタートアップ創業コストが激減しています。かつて200万ドルのシードが必要だったプロダクトが、今や数十万ドル以下で実現可能となり、Midjourneyのように約100人で年間3億ドル超の売上を誇る無資金ユニコーンも登場しました。

ADINの共同創業者Aaron Wrightは、AIが「悪い案件を排除し、成功確率を高める」と期待する一方、著名VCのマーク・アンドリーセンは「VC投資はサイエンスではなくアートであり、最後まで人間が担う仕事だ」と反論します。KhoslaやFelicisなど大手VCもAIをメモ作成・ディールソーシング・創業者評価に活用し始めており、人とAIの協業が加速しています。

最大のリスクは、AIがVCを代替することではなく、スタートアップVC資金を必要としなくなることです。ロボティクスやバイオテックなどハードウェア領域を除き、巨額調達の需要が消滅すれば、VC業界は小規模な専門領域へ回帰する可能性があります。「資金はあるが創業者に必要とされない」という構造的危機に、投資家たちは今夜も眠れぬ夜を過ごしています。

GoogleがNB2を全ユーザーに開放

モデルの技術的優位性

Gemini 3.1 Flash Imageベースの次世代画像生成
旧Pro版のテキスト描画画像検索グラウンディングを統合
フラッシュ速度を維持しつつ視覚品質を大幅向上
無料ユーザーにもプロ機能を全面開放
Vercel AI GatewayやGemini APIでも即日利用可

エンタープライズへの影響

高品質×低コストで企業導入障壁を解消
AIメディア制作・広告制作のコスト構造を変革
OpenAIMidjourneyへの競争優位を強化
製品ロードマップへの即時統合が可能に

Googleは2026年2月26日、画像生成AIモデルNano Banana 2(正式名:Gemini 3.1 Flash Image)を発表し、Geminiアプリや主要AIプラットフォームで全ユーザーへの提供を開始しました。

本モデルは旧Nano Banana Proのテキスト精密描画能力と、リアルタイムのGoogleイメージ検索を活用したグラウンディング機能を統合し、フラッシュ速度での生成を実現しています。

エンタープライズにとって最大の意義は、従来Proモデルに必要だったコスト負担なしに、同等以上の高品質出力が得られる点です。VentureBeatの分析によれば、これは過去6カ月間の「品質か速度か」というジレンマを解消するものです。

Vercel AI GatewayにもNano Banana 2が即日対応し、既存のAPI統合でシームレスに切り替えが可能です。フラッシュティアのコスト水準を維持しながらより優れた出力が得られます。

GoogleNano Banana 2をAI Studio、Imagen API、Geminiアプリ全体に展開することで、AIクリエイティブ制作の民主化を進めています。企業は今すぐプロダクションへの統合を検討すべきです。

Black Forest LabsがFlux.2オープンソースモデルを公開、1秒以内で画像生成

モデルの技術的特徴

1秒未満での画像生成を実現
完全オープンソースで公開
Flux.1の後継モデル
Stability AI元メンバーが開発
高品質と超高速を両立

市場と競合への影響

Midjourney・DALL-Eとの差別化
ローカル実行が可能になる
開発者応用範囲が大幅拡大
コスト削減に貢献
商用利用での自由度が高い

ドイツのAIスタートアップBlack Forest Labsは、1秒未満でAI画像を生成できるオープンソースモデル「Flux.2 [klein]」をリリースしました。同社はStability AI出身のエンジニアが設立したことで知られています。

Flux.2は前作Flux.1の性能をさらに高めており、生成速度画像品質の両面で大きな改善が見られます。オープンソースでの公開により、開発者が自由に応用できます。

完全オープンソースのAI画像モデルが高速化されたことで、プロダクション環境への組み込みがより現実的になりました。コスト面でも有料APIを使わずに運用できるメリットがあります。

欧州発のAI技術として注目されており、米国中国勢が支配するAI画像生成市場に新たな競争軸をもたらしています。

仏・馬当局がGrokの性的ディープフェイク捜査、国際包囲網が拡大

フランス・マレーシアが正式調査を開始

フランスデータ保護機関CNILが調査着手
マレーシア政府が即時対応を要求
インドに続き3カ国目・4カ国目の規制対応
EU圏でのGDPR違反の可能性が焦点
CSAM(児童性的虐待素材)として法的追訴の可能性
X・xAIの対応遅延が各国の怒りを招く

国際規制包囲網とプラットフォーム責任

主要民主主義国が一斉に規制行動を開始
EU AI法のリスク分類でGrokの扱いが問題化
プラットフォーム責任の国際標準化が加速
Elon Muskの政治的影響力が規制交渉を複雑化
X・xAIへの業務停止命令の可能性も
他のAI画像生成サービスも規制の波及を警戒

フランスのデータ保護機関CNILとマレーシア当局がGrokによる性的ディープフェイク生成問題の正式調査を開始した。インドに続くこの動きにより、国際的な規制包囲網xAIとXプラットフォームを取り囲む形になっている。

フランスの調査はEUのGDPR(一般データ保護規則)の観点から進められており、特にユーザーの同意なしに画像を改変するというプライバシー侵害の側面が焦点となっている。EU AI法も施行されており、高リスクAIシステムとしての分類・対応が問われる可能性がある。

マレーシアでは主に未成年保護と公序良俗の観点から政府が即時対応を要求しており、プラットフォームへのアクセス制限を含む強硬措置も検討中だ。東南アジア各国でも同様の動きが広がる可能性がある。

xAIとXの対応の遅さが各国当局の怒りを招いており、Elon Muskの政治的影響力や米国政府との関係が規制交渉を複雑にしているとも指摘される。米国内では共和党政権下での規制が緩和される方向にある一方、欧州では厳格化が進む対照的な状況だ。

この問題は単にGrokだけでなく、AIによる画像操作全般への規制強化の引き金となる可能性がある。AdobeMidjourney・Stable Diffusionなど他の画像生成AIサービスも、ガードレール強化の国際圧力を受ける見通しだ。

2025年AI総括:GPT-5実用化と中国・小型モデルの台頭

OpenAIの進化と実用化加速

GPT-5と5.1が始動、ZenDeskで解決率9割事例も
Sora 2やブラウザAtlas、OSSモデルも全方位展開
コーディング特化モデルで長時間タスクが可能に

中国勢と多様なモデルの台頭

DeepSeekQwen3など中国OSSが世界を席巻
Google Gemma 3など超小型モデルが実用段階へ
Gemini 3やClaude Opus 4.5で競争激化

2025年11月、米VentureBeatは今年のAI業界を振り返る総括記事を公開しました。2025年は、特定の最強モデル一強ではなく、オープンソースや中国勢、エッジ向け小型モデルを含めた「エコシステムの多様化」が決定的となった年です。経営者エンジニアにとって、用途に応じて最適なAIを選択できる環境が整ったことが、今年最大の収穫と言えるでしょう。

OpenAIは待望のGPT-5およびGPT-5.1をリリースし、市場を牽引し続けました。初期の反応は賛否両論ありましたが、改良を経てZenDeskなどの企業導入が進み、顧客対応の自動解決率が80〜90%に達する事例も報告されています。さらに、動画生成AI「Sora 2」やブラウザ統合型「Atlas」、そして意外にもオープンウェイトモデルの公開など、全方位での攻勢を強めています。

特筆すべきは中国発のオープンソースモデルの躍進です。DeepSeek-R1やAlibabaのQwen3シリーズなどが、推論能力やコーディング性能で米国のフロンティアモデルに肉薄しています。MITなどの調査によれば、中国製モデルのダウンロード数は米国をわずかに上回る勢いを見せており、コストパフォーマンスを重視する企業にとって無視できない選択肢となりました。

「巨大化」へのカウンターとして、小型・ローカルモデルの実用性も飛躍的に向上しました。GoogleGemma 3やLiquid AIのLFM2は、パラメータ数を抑えつつ特定タスクに特化し、エッジデバイスやプライバシー重視の環境での利用を可能にしました。すべての処理を巨大クラウドAIに依存しない、分散型のAI活用が現実味を帯びています。

画像生成や競合他社の動きも活発です。MetaMidjourneyの技術ライセンスを取得し、自社SNSへの統合を進めるという驚きの戦略に出ました。一方、GoogleGemini 3に加え、ビジネス図解に強い画像生成モデル「Nano Banana Pro」を投入しています。AnthropicClaude Opus 4.5やBlack Forest LabsのFlux.2など、各領域でハイレベルな競争が続いています。

多機能とSNS連携で覇権、ByteDanceのAI『Doubao』

中国で最も人気なAIアプリ

月間利用者1.57億人中国首位
世界でも4番目に人気の生成AI
親しみやすいアバターとUI/UX

成功を支える『全部入り』戦略

チャットから動画生成まで多機能
AIに不慣れな層も取り込む設計
TikTok(Douyin)とのシームレスな連携

バイラル設計とエコシステム

SNSでの共有を促すバイラル設計
競合からユーザーの4割が流入
自動車など他デバイスへの展開

TikTokを運営する中国ByteDance社が開発したAIアシスタント「Doubao(豆包)」が、中国市場を席巻しています。2025年8月には月間アクティブユーザー数が1億5700万人に達し、競合のDeepSeekを抜いて国内首位となりました。その成功の裏には、チャットから画像動画生成までを網羅する多機能性と、ショート動画アプリ「Douyin(抖音)」と連携した巧みなバイラル戦略があります。

Doubaoの躍進は、データにも裏付けられています。中国のデータインテリジェンス企業QuestMobileによると、月間アクティブユーザー数は1億5700万人。競合のDeepSeekは1億4300万人で2位に後退しました。また、ベンチャーキャピタルa16zの調査では、ChatGPTGeminiに次ぐ世界で4番目に人気の生成AIアプリにランクインしています。

Doubaoの最大の特徴は「全部入り」とも言える包括的な機能です。テキスト対話だけでなく、画像生成、短い動画作成、データ分析、AIエージェントのカスタマイズまで、一つのアプリで完結します。これはまるで、ChatGPTMidjourneySoraCharacter.aiといった複数の最先端ツールを一つに集約したような体験をユーザーに提供するものです。

なぜ、この「全部入り」戦略が受け入れられたのでしょうか。それは、DoubaoがAIに詳しくない一般ユーザーを明確にターゲットにしているからです。親しみやすいアバターやカラフルなUIに加え、テキスト入力より音声動画での対話を好む層を取り込み、AI利用のハードルを劇的に下げることに成功しました。

成功のもう一つの柱が、ByteDanceの得意とするSNS連携とバイラル設計です。ユーザーはDoubaoで生成したコンテンツを、Douyin(中国TikTok)ですぐに共有できます。逆にDouyinの動画要約をDoubaoにさせることも可能です。この利便性と楽しさが爆発的な拡散を生み、ユーザーエンゲージメントを高めています。

競合のDeepSeekがモデルの性能や論理的タスクに注力する一方、Doubaoは消費者向けアプリとしての完成度で差をつけました。QuestMobileのデータでは、DeepSeekを離れたユーザーの約4割がDoubaoに移行したとされています。これは、ByteDanceが長年培ってきた「アプリ工場」としての開発力が発揮された結果と言えるでしょう。

ByteDanceはスマートフォンの枠を超え、Doubaoをエコシステムの中核に据えようとしています。すでにスマートグラスや自動車メーカーとの提携を進めており、車載アシスタントやAIコンパニオンとしての搭載が始まっています。Doubaoは、私たちの生活のあらゆる場面に浸透するプラットフォームを目指しているのです。

AIは「低品質なゴミ」ではない:個人のシネマティックユニバース構築事例

AI時代の映像制作術

AIの制約を逆手に取り、独自の世界観を構築。
Midjourney/Runway等のマルチAIツールを組み合わせ活用。
不完全さを隠すため、あえてレトロな画質を採用。

従来のスキルとの融合

従来の脚本執筆ストーリーボード作成を徹底。
モーションキャプチャを活用し、俳優として全役を演じる。
AIの技術的欠陥を作品設定(Lore)として昇華。

ハリウッドからの独立

スタジオ依存から脱却し、個人で収益化・知的財産を所有
AIの勝者はツールを使いこなすアイデアマン

AIが生成する映像は「低品質なゴミ(Slop)」ばかりという認識を覆す事例が登場しました。ジョシュ・ウォレス・ケリガン氏(Neural Viz)は、MidjourneyRunwayなどの複数の生成AIツールを駆使し、複雑な設定を持つSFシネマティックユニバースを構築しています。彼はAIを単なるツールとして捉え、高品質な映像作品を個人で制作し、ハリウッド業界からも注目されています。

ケリガン氏の成功の鍵は、AIの限界を把握し、それを回避する戦略にあります。AIが苦手なアクションシーケンスを避け、あえて「トーキングヘッド」のドキュメンタリー形式を採用。また、人間の「不気味の谷」を避けるため、エイリアンキャラクターを主役に据えました。古いTVのような粗い画質にすることで、レンダリングの不完全さも隠しています。

AIが全てのプロセスを自動化するわけではありません。ケリガン氏は、まず従来のやり方で脚本を書き、ストーリーボードを作成します。さらに、彼は照明の均一性や視線の一貫性を保つなど、10年以上のキャリアで培った映像制作のノウハウを全て適用しています。AIを使いこなすには、高度な伝統的スキルが必要不可欠なのです。

特に重要なのが、Runwayモーションキャプチャ機能の活用です。ケリガン氏は自身で全キャラクターのセリフを演じ、表情や動きをAIモデルにマッピングさせています。これにより、彼は監督としてだけでなく、ゴラムを演じたアンディ・サーキスのように、AIをマスクとして使いこなす俳優としても機能しています。

AIのバグや不具合さえも、作品の創造的なインスピレーションとしています。例えば、AIがキャラクターの肌の一貫性を保てなかった際、それを「モーフ抑制剤」を止められたことによるエイリアンの変態(メタモルフォーゼ)という設定として物語に取り込みました。機械のミスが、世界観の深みへと昇華されています。

この事例は、ハリウッドの伝統的な労働モデルに大きな変化をもたらしています。ケリガン氏のように、AIを活用することで、個人クリエイタースタジオからの独立性を高め、自ら制作した知的財産を所有できます。AI時代において成功するのは、技術者ではなく、これらのツールを最大限に活用できる「アイデアを持つ人」と予測されています。

a16z調査、スタートアップのAI支出先トップ50公開

支出先トップ企業の傾向

1位はOpenAI、2位はAnthropic
コーディング支援ツールが上位に多数
人間を支援するCopilot型ツールが主流

新たな市場トレンド

消費者向けツールの業務利用が加速
特定分野に特化した垂直型アプリも4割
セールス・採用・顧客対応が人気分野

今後の市場予測

特定カテゴリでの市場独占はまだない
自律型エージェントへの移行はこれから

著名ベンチャーキャピタルAndreessen Horowitz (a16z)は10月2日、フィンテック企業Mercuryと共同で、スタートアップが実際に支出しているAI企業トップ50に関するレポートを公開しました。Mercuryの取引データに基づくこの調査では、OpenAIが首位を獲得。人間の作業を支援するCopilot型ツールが主流である一方、市場はまだ特定ツールに集約されておらず、急速に変化している実態が明らかになりました。

ランキングのトップはOpenAI、2位はAnthropicと、大規模言語モデルを開発する主要ラボが独占しました。一方で、Replit(3位)やCursor(6位)といったコーディング支援ツールも上位にランクインし、開発現場でのAI活用が定着していることを示しています。スタートアップ開発者生産性の向上への強い関心がうかがえます。

現在、支出の主流は人間の生産性を高める「Copilot(副操縦士)」型ツールです。これは、多くの企業がまだ業務を完全に自動化する「自律型エージェントへの移行に慎重であることを示唆しています。しかし専門家は、技術の進化に伴い、今後はより自律的なツールへのシフトが進むと予測しています。

市場はまだ勝者が決まっていない「戦国時代」の様相を呈しています。例えば、議事録作成ツールではOtter.aiやRead AIなど複数のサービスがリスト入りしました。これは、スタートアップ画一的な製品に縛られず、自社のニーズに最適なツールを自由に選択・試用している段階であることを物語っています。

興味深いのは、CapCutやMidjourneyといった消費者向けツールがビジネスシーンで採用されている点です。個人が使い慣れた優れたUI/UXのツールを職場に持ち込む動きが加速しており、コンシューマー向けとエンタープライズ向けの垣根はますます低くなっています。この傾向は新たなビジネス機会を生むでしょう。

a16zのパートナーは、このランキングが今後1年で大きく変動する可能性を指摘しています。「12カ月前のレガシー」という言葉が示すように、AI業界の進化は非常に速いのです。既存企業もAI機能を追加しており、新旧プレイヤーが入り乱れる激しい競争環境が続くとみられます。

Meta、AI動画の新フィード『Vibes』を開始

AI動画の発見と創作

AI生成の短尺動画専用フィード
クリエイター作品からの着想を促進
プロンプト表示で制作過程を可視化

リミックスとSNS連携

音楽画像・アニメーションの変更機能
Instagram等への簡単クロス投稿
MetaのAIエコシステム拡大戦略

Metaは9月26日、AIが生成した短尺動画を発見・共有するための新フィード「Vibes」を、Meta AIアプリ内で公開しました。この機能は、クリエイターやコミュニティが作成したAI動画をユーザーがリミックス(再編集)し、新たな創作活動を促すことを目的としています。

「Vibes」は、以前ユーザーがAIとの対話やプロンプトを共有していた「Discover」フィードに代わるものです。テキスト中心の共有から、動画コンテンツの創作と発見に焦点を移したことは、MetaのAI戦略における重要な転換点と言えるでしょう。

フィード上の動画には、生成に使用されたプロンプトが併記されており、ユーザーは制作の裏側を覗くことができます。さらに、音楽画像、アニメーションを変更する「リミックス機能」を活用し、独自の作品をVibesやInstagramFacebookに手軽にクロス投稿できます。

この動きは、Metaが全社的に進めるAI機能統合の一環です。同社はFacebookInstagramなど主力製品にAI画像生成機能を組み込むほか、先日には画像生成AIの有力企業Midjourneyとの提携も発表しました。MetaはAIによるコンテンツ制作エコシステムの構築を加速させています。