次の方法で共有


特徴量ガバナンスと系統

このページでは、Unity カタログの機能エンジニアリングのガバナンスと系列の機能について説明します。

提供されたモデルのパフォーマンスと特徴テーブル データの変更の監視については、「 データ プロファイル」を参照してください。

フィーチャ テーブルへのアクセスを制御する

Unity カタログの機能テーブルのアクセス制御は、Unity カタログによって管理されます。 Unity カタログの権限 を参照してください。

特徴テーブル、関数、およびモデル系列を表示する

FeatureEngineeringClient.log_modelを使用してモデルをログに記録すると、モデルで使用されている機能が自動的に追跡され、カタログ エクスプローラーの [系列 タブで表示できます。 機能テーブルに加えて、オンデマンド機能の計算に使用される Python UDF も追跡されます。

特徴テーブル、関数、またはモデルの系列をキャプチャする方法

モデルで使用される系列情報追跡機能テーブルと関数は、log_model呼び出すと自動的にキャプチャされます。 次のコード例を参照してください。

from databricks.feature_engineering import FeatureEngineeringClient, FeatureLookup, FeatureFunction
fe = FeatureEngineeringClient()

features = [
    FeatureLookup(
        table_name = "main.on_demand_demo.restaurant_features",
        feature_names = ["latitude", "longitude"],
        rename_outputs={"latitude": "restaurant_latitude", "longitude": "restaurant_longitude"},
        lookup_key = "restaurant_id",
        timestamp_lookup_key = "ts"
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.extract_user_latitude",
        output_name="user_latitude",
        input_bindings={"blob": "json_blob"},
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.extract_user_longitude",
        output_name="user_longitude",
        input_bindings={"blob": "json_blob"},
    ),
    FeatureFunction(
        udf_name="main.on_demand_demo.haversine_distance",
        output_name="distance",
        input_bindings={"x1": "restaurant_longitude", "y1": "restaurant_latitude", "x2": "user_longitude", "y2": "user_latitude"},
    )
]

training_set = fe.create_training_set(
    label_df, feature_lookups=features, label="label", exclude_columns=["restaurant_id", "json_blob", "restaurant_latitude", "restaurant_longitude", "user_latitude", "user_longitude", "ts"]
)

class IsClose(mlflow.pyfunc.PythonModel):
    def predict(self, ctx, inp):
        return (inp['distance'] < 2.5).values

model_name = "fe_packaged_model"
mlflow.set_registry_uri("databricks-uc")

fe.log_model(
    IsClose(),
    model_name,
    flavor=mlflow.pyfunc,
    training_set=training_set,
    registered_model_name=registered_model_name
)

フィーチャ テーブル、モデル、または関数の系列を表示する

特徴テーブル、モデル、または関数の系列を表示するには、次の手順に従います。

  1. カタログ エクスプローラーのテーブル、モデル バージョン、または関数ページに移動します。

  2. 系列 タブを選択します。左側のサイドバーには、このテーブル、モデル バージョン、または関数でログに記録された Unity カタログ コンポーネントが表示されます。

    カタログ エクスプローラーの [モデル] ページの [系列] タブを Catalog Explorer のモデル ページの [系列] タブ

  3. をクリックして、系列グラフを表示します。 系列グラフが表示されます。 系列グラフの探索の詳細については、「 Unity Catalog を使用してデータ系列を表示する」を参照してください。

    系列画面

  4. 系列グラフを閉じるには、右上隅 系列グラフ の [閉じる] ボタンをクリックします。