union を使用してデータセットを追加する
union を使用して、複数のデータストリームのデータを追加して 1 つのデータストリームにまとめることができます。データストリームの項目名と構造は同じでなければなりません。
union を使用するには、まずデータセットを読み込んで、次に foreach を使用して射影を実行します。このプロセスをもう 1 つのデータセットで繰り返します。結果として得られる 2 つのデータストリームが同一の構造を持つ場合、union を使用してそれらを追加できます。
たとえば、Salesforce マルチ組織コネクタを使用して結合した、異なる地域の 2 つの商談があるとします。これらのデータセットを 1 つにまとめてパイプライン全体を確認したいとします。
OppsRegion1 データストリームには、次の項目が含まれます。

OppsRegion2 データストリームには、次の項目が含まれます。

union を使用して、2 つのデータストリームを組み合わせます。
1ops1 = load "OppsRegion1";
2
3ops1 = foreach ops1 generate 'Account_Owner', 'Account_Type', 'Amount';
4
5ops2 = load "OppsRegion2";
6ops2 = foreach ops2 generate 'Account_Owner', 'Account_Type', 'Amount';
7
8-- ops1 and ops2 have the same structure, so we can use union
9opps_total = union ops1, ops2;結果として得られるデータストリームには、データの両方のセットが含まれます。
