機械学習の設計パターン(マクロ&ミクロ)

自分用のメモです。

マクロなパターン(≒システム、運用)

tech.mercari.com

ミクロなパターン(≒前処理、EDA、モデル構築)

courses.edx.org

www.kaggle.com

  • 前処理
    • cell_17: 経験則ぽいEDA
    • cell_25: columnsの選択基準がよくわからない
    • cell_27: サンプルの半分以上が目的変数に対して強い相関を持つ特徴量の抽出。17/81
    • cell_30: outlier(外れ値)排除
    • cell_: 目的変数SalesPriceを対数に変換
  • モデル作成
    • cell_40: 一般的な正規化StandardScaler()の他に RobustScaler(), PowerTransformer() ?? も別途実施。結局使っているのは、PowerTransformer()だけ。変数のスケールを変えて分布を正規分布(ガウス分布)の形に変えてくれる変換らしい。
    • cell_42~46: 推定器としてregressor()を5種類生成。選択基準は不明。
    • ell_47: () で 5つのregressorをスタッキング。

scikit-learn.org

www.kaggle.com

www.kaggle.com