Unique() の使用制限
クエリで unique() を使用することが必要になる場合がありますが、一意の値が大量にあるとパフォーマンスに影響する可能性があります。
たとえば、商談がある異なる業種の数をカウントしたいとします。
1q = load "DTC_Opportunity_SAMPLE";
2q = group q by all;
3q = foreach q generate unique('Industry') as 'unique_Industry';データに含まれている業種の数が数千であれば、このクエリはパフォーマンスに悪影響を与えません。
ただし、一意の顧客 (取引先) の数をカウントする場合、
1q = load "AcquiredAccount";
2q = group q by all;
3q = foreach q generate unique('Account_Id') as 'unique_Account_Id';会社の顧客数が数百万になると、このクエリはパフォーマンスに影響します。