regr_slope()
2 つの数値項目を使用してトレンド線を計算してから、傾きを返します。この関数は、2 つの数値項目の関係についての詳細を確認する場合に使用します。
1regr_slope(field_y, field_x)field_y は、グループ化した連動数値式、field_x は、グループ化した独立数値式です。regr_slope(field_y, field_x) は、単純な線形回帰を使用してトレンド線を計算します。入力項目 (field_y、field_x) には、null 以外の値のペアが 2 つ以上必要です。この関数は、共通グループではなく、単純なグループ化された値に対して機能します。
例 - 活動数と商談金額の関係を計算する
(ミーティングなどの) 活動数と商談成立金額が含まれるデータセットがあるとします。

活動を追加するたびに商談規模はどの程度大きくなりますか? regr_slope は、データに対する線形解析を実行してから、傾き (活動を追加するたびに得られる金額の増���) を計算します。
1q = load "data/sales";
2q = group q by all;
3
4--trunc() truncates the result to two decimal places
5q = foreach q generate trunc(regr_slope('Amount', 'NumActivities'),2) as 'Gain per Activity';既存のデータを基にすると、商談規模は、活動を追加するたび平均 145 万ドルずつ増加する傾向があります。
