自動運転向けVLMの合成生成MCQAにおけるテキストバイアスの削減
自動運転向けVLMの合成生成MCQAにおけるテキストバイアスの削減 ビジョン言語モデルにおけるテキスト悪用の問題 自動運転評価向けに設計されたビジョン言語モデル(VLM)は、十分に文書化された現象に根ざした根本的な検証危機に直面しています。すなわち、モデルが視覚情報を処理することなくベンチマークレベルのパフォーマンスを達成するという現象です。実証的知見は、合成生成された多肢選択問題回答(MCQA)データセットで微調整されたVLMが、視覚入力が完全に削除され...