regr_r2()
2 つの数値項目を使用して、R 二乗 (適合度) を計算します。regr_r2() を使用すると、トレンド線がどの程度データに当てはまっているかを理解できます。
1regr_r2(field_y, field_x)field_y は、グループ化した連動数値式、field_x は、グループ化した独立数値式です。regr_r2(field_y, field_x) は、単純な線形回帰を使用してトレンド線を計算し、R 二乗を計算します。返された値が小さい場合、regr_slope() や regr_intercept() などの関数は、正確な結果を返す可能性が高くなります。
入力項目 (field_y、field_x) には、null 以外の値のペアが 2 つ以上必要です。この関数は、共通グループではなく、単純なグループ化された値に対して機能します。
例 - 計算されたトレンド線が自分のデータにどの程度当てはまっているか
(ミーティングなどの) 活動数と商談成立金額が含まれるデータセットがあるとします。

計算されたトレンド線の「適合度」を調べて、他の統計関数の結果がどの程度正確であるかを確認します。
1q = load "regression";
2q = group q by all;
3
4q = foreach q generate trunc(regr_r2('Amount', 'NumActivities'),2) as 'R Squared';R 二乗の値は 0.95 です。
