次の方法で共有


theta_difference 関数

適用対象:はい Databricks SQL チェックが Databricks Runtime 18.0 以降" とマークされているチェック

2 つの Theta Sketch バイナリ表現のセット差 (A - B) を計算します。 返されるスケッチには、最初のスケッチに表示される値のみが含まれますが、2 番目のスケッチには含まれません。

構文

theta_difference ( first, second )

論争

  • 最初: バイナリ形式 (セット A) の Theta スケッチ。
  • 2 番目: バイナリ形式の Theta スケッチ (セット B)。

返品ポリシー

セット差 (A - B) を表すシリアル化された Theta スケッチを含む BINARY 値。

注記

  • 操作は可換ではありません: theta_difference(A, B)theta_difference(B, A)
  • 結果には、最初のスケッチに表示される値が含まれますが、2 番目のスケッチには表示されません。

エラー メッセージ

例示

-- Find values in first sketch but not in second
> SELECT theta_sketch_estimate(theta_difference(theta_sketch_agg(col1), theta_sketch_agg(col2)))
  FROM VALUES (5, 4), (1, 4), (2, 5), (2, 5), (3, 1) tab(col1, col2);
2