Manus(企業)に関するニュース一覧

Manus(企業)に関するニュース一覧

LangChain、自律エージェントに「Skills」機能実装

ファイルシステム活用の新潮流

Anthropic提唱のSkillsに対応
マークダウン形式で動的に指示を読込
汎用エージェントツール数削減に寄与
シェル操作と連携し多様なタスク実行

コンテキスト効率と拡張性の向上

トークン消費を抑えコンテキスト節約
エージェント認知負荷を大幅軽減
CLIでフォルダ配置だけで機能拡張
エージェント自身によるスキル生成も視野

LangChainは2025年11月25日、オープンソースの自律エージェント基盤「Deep Agents」に対し、Anthropicが提唱する「Skills」機能を追加したと発表しました。これにより、エージェントは外部ファイルとして定義された手順書やスクリプトを必要に応じて動的に読み込み、複雑なタスクを効率的に実行することが可能になります。

Claude CodeManusといった最新の汎用エージェントは、個別の専用ツールを多数装備するのではなく、ファイルシステムへのアクセス権とコマンド実行という「少数の強力な手段」で多様な作業をこなす傾向にあります。今回実装された「Skills」はこの潮流を体系化したもので、`SKILL.md`を含むフォルダ単位で能力をモジュール管理する仕組みです。

従来のツール定義(Function Calling)はすべての情報を常にプロンプトに含めるためトークンを大量消費していましたが、Skillsは概要のみを提示し、詳細は実行が必要な時だけ読み込む「プログレッシブ・ディスクロージャー」を採用しています。これにより、コンテキストウィンドウの消費を劇的に抑え、より長い文脈での推論を可能にします。

この仕組みは、ツール選択肢の過多によるエージェントの「コンテキストの混乱」を防ぎ、認知負荷を低減する効果もあります。ユーザーは`deepagents-CLI`の所定フォルダにスキルセットを配置するだけで機能を拡張でき、将来的にはエージェント自身が新しいスキルを作成・共有する「継続的な学習」への発展も期待されています。

AIエージェント、複雑業務の遂行能力は未だ3%未満

AIの実務能力を測る新指標

新指標「Remote Labor Index」登場
データ企業Scale AIなどが開発
フリーランス業務での能力を測定

トップAIでも能力に限界

最高性能AIでも遂行率3%未満
複数ツール利用や多段階作業に課題
長期記憶や継続的な学習能力が欠如

過度な期待への警鐘

「AIが仕事を奪う」説への反論
OpenAIの指標とは異なる見解

データ注釈企業Scale AIと非営利団体CAISが、AIエージェントの実務能力を測る新指標を発表。調査によると、主要AIはフリーランスの複雑な業務を3%未満しか遂行できず、AIによる大規模な業務代替がまだ現実的ではないことを示唆しています。AIの能力に関する過度な期待に警鐘を鳴らす結果です。

新指標「Remote Labor Index」は、デザインやデータ収集など実際のフリーランス業務をAIに与え、その遂行能力を測定します。中国Manusが最高性能を示し、xAIGrokOpenAIChatGPTが続きましたが、いずれも低い成果でした。

AIの課題は、複数のツールを連携させ、多段階の複雑なタスクを計画・実行する能力にあると指摘されています。人間のように経験から継続的に学習したり、長期的な記憶を保持したりする能力の欠如も、実務における大きな壁となっているようです。

この結果は「AIが仕事を奪う」という過熱した議論に一石を投じます。過去にも同様の予測は外れてきました。今回の調査は、AIの現在の能力を客観的に評価する必要性を示唆しており、技術の進歩が必ずしも直線的ではないことを物語っています。

OpenAIベンチマーク「GDPval」はAIが人間に近づいていると示唆しましたが、今回の指標は実世界に近いタスクでは大きな隔たりがあることを明らかにしました。指標の設計によってAIの能力評価は大きく変わることを示しています。

Amazonが人員削減の一因にAIを挙げるなど、AIと雇用の関係が注目される中、その真の実力を見極めることは不可欠です。AIを脅威と見るだけでなく、生産性を高めるツールとして活用する視点が、今後ますます重要になるでしょう。