2020-05-04 機械学習の設計パターン(マクロ&ミクロ) 機械学習 深層学習 DeepLearning 自分用のメモです。 マクロなパターン(≒システム、運用) tech.mercari.com ミクロなパターン(≒前処理、EDA、モデル構築) courses.edx.org www.kaggle.com 前処理 cell_17: 経験則ぽいEDA cell_25: columnsの選択基準がよくわからない cell_27: サンプルの半分以上が目的変数に対して強い相関を持つ特徴量の抽出。17/81 cell_30: outlier(外れ値)排除 cell_: 目的変数SalesPriceを対数に変換 モデル作成 cell_40: 一般的な正規化StandardScaler()の他に RobustScaler(), PowerTransformer() ?? も別途実施。結局使っているのは、PowerTransformer()だけ。変数のスケールを変えて分布を正規分布(ガウス分布)の形に変えてくれる変換らしい。 cell_42~46: 推定器としてregressor()を5種類生成。選択基準は不明。 ell_47: () で 5つのregressorをスタッキング。 scikit-learn.org www.kaggle.com www.kaggle.com