ご質問いただきありがとうございます。
「指標R2」と「評価>残差>精度パラメータのR2」それぞれの定義に違いはありません。
ただし、グラフの方はチャートを描くために1000サンプルで描画しているため、
異なる結果が表示されているかと思われまれます。
ご回答いただきありがとうございます。
サンプルサイズが1000以上の場合、グラフの方は1000サンプルに限定されたR2が表示されるため、「指標R2」と「グラフR2」との結果が異なると理解しました。
しかし、サンプルサイズが1000以下の場合でもR2の数値が異なることを確認しています。
このことから、サンプルサイズの大小にかかわらずCVのスコアが変化する理由は「CV平均」と「OOF」の差と考察しました。
これについてご意見お聞かせください。
@doi 様、ご質問ありがとうございます。リーダーボードのR Squaredと、残差のr^2の計算方法は以下になります。
上記のように算出方法が異なるため、同じ「交差検定」のスコアでもリーダーボードと残差で異なっております。
また、残差タブでは計算は最高1000レコードで行われますが、プロットには500レコードしか表示されません。その理由は、「限られたRAMおよび/または古いCPUを持つクライアントでは、残差チャートが完全なデータセットをレンダリングするのに許容できないほど長い時間がかかる」ためです。エクスポートには同じ500レコードが含まれます。