記事一覧に戻る

マルチモーダルAIの「静的融合」の限界を打破し、動的編成へ転換する「Chain of Modality」フレームワークが提案される

arXiv cs.CV · 2026年4月17日

マルチモーダルAIの「静的融合」の限界を打破し、動的編成へ転換する「Chain of Modality」フレームワークが提案される

AI要約

  • Omni-MLLMsが複数の感覚ストリームを統合する一方で、単一モーダルベースラインの方がパフォーマンスで優れる「逆説的現象」が報告されている
  • 現在のモデルで採用されている静的融合トポロジーが、位置バイアスと配置トラップという2つの構造的病理を引き起こし、注意メカニズムを歪めている
  • 新提案の「Chain of Modality (CoM)」は、パラレル、シーケンシャル、インターリーブされたパスウェイを動的に切り替えることで、マルチモーダル融合を受動的な連結から能動的編成へと転換する
  • CoMは認知実行をタスク適応的な2つのパスウェイに分岐させ、構造的バイアスを中立化する

関連記事

AIニュースを毎日お届け

200以上のソースから厳選したAIニュースを毎日無料でお届けします。

無料で始める