AI・機械学習
2026年5月22日 15:59
フラットな最小値は幻想なのか
フラットな最小値は幻想なのか フラットネスのパラドックス:損失ランドスケープの幾何学が測定アーティファクトになるとき 主張: フラットな最小値がより良い汎化と相関するという広く信じられている見方は、モデル自体の根本的な性質ではなく、パラメータ化の選択によって生じた幻想に基づいているかもしれません。 根拠: ニューラルネットワークの損失ランドスケープは座標に依存しません。損失関数 $\mathcal{L}(\theta)$ はパラメータ化 $...