データサイエンス特論

科目名
Course Title
授業コード 単位数 配当年次 開講期間
Term
科目分類 ナンバリング
コード
曜日
コマ
教室 担当教員氏名
Instructor
データサイエンス特論
Special Topics in Data Science
Q123430001 2 1 後期授業 専門科目 HSAID6516-J1 金3 B1-4 楠木 祥文

オフィスアワー

楠木 祥文:金曜日9:00-12:00

授業目標

データサイエンスで中心的な役割を果たす機械学習について、その基礎知識を学ぶ。実際に機械学習を用いる場合に必要となる技術である前処理やモデル選択などを学習する。また、代表的な機械学習手法のアプローチであるベイズ学習とカーネル法について学習する。

教科書

配付資料

参考書

・有賀, 大橋,RとPythonで学ぶ[実践的]データサイエンス&機械学習,技術評論社,2019
・杉山,機械学習のための確率と統計,講談社,2015
・C. M. Bishop, Pattern Recognition and Machine Learning, Springer, 2006
・須山,ベイズ推論による機械学習入門, 講談社, 2017
・福水,カーネル法入門,朝倉書店,2010

授業時間外の学習(準備学習等について)

前期の機械学習特論の復習をすること。解析学(微分積分)、線形代数、確率統計学などの数学の基礎を復習すること。

授業計画

第1回 データサイエンス概論 準備学習等
第2回 前処理1
・カテゴリ変数と数値変数
・数値変数のスケーリング
・変数選択と次元削減
準備学習等
第3回 前処理2
・欠損値の取り扱い
・外れ値の取り扱い
・アンダーサンプリングとオーバーサンプリング
準備学習等
第4回 交差確認法
・汎化性能とは
・学習データ,評価データ,検証データ
・交差確認法(CV,LV1)
準備学習等
第5回 モデル評価基準(1)
・種々のタスクと評価基準
・不均衡データの識別
・情報検索
準備学習等
第6回 モデル評価基準(2)
・ROC と AUC
・異常検知
準備学習等
第7回 ハイパーパラメータ
・グリッドサーチ
・ヒューリスティックサーチ
準備学習等
第8回 モデルの信頼性
・分散とバイアス
準備学習等
第9回 確率統計の復習(1)
・確率変数と確率分布
・離散型確率分布の例
・連続型確率分布の例
準備学習等
第10回 確率統計の復習(2)
・多次元確率分布の性質
・多次元確率分布の例
・独立な確率変数の和の確率分布
・統計的推定
準備学習等
第11回 機械学習とベイズ学習
・機械学習とは
・機械学習の基本的なタスク
・機械学習の2つのアプローチ
・グラフィカルモデル
・モデルの構築と推論
・各タスクにおけるベイズ推論
・複雑な事後分布に対する近似
・ベイズ学習の利点と欠点
準備学習等
第12回 ベイズ推論による学習と予測(1)
・学習と予測
・離散確率分布の学習と予測
・1次元ガウス分布の学習と予測
準備学習等
第13回 ベイズ推論による学習と予測(2)
・多次元ガウス分布の学習と予測
・線形回帰の例
準備学習等
第14回 カーネル法:カーネル法への招待
・カーネル法の基本的なアイデア
・カーネル法の例
・再生核ヒルベルト空間
準備学習等
第15回 カーネル法:カーネル法の実際と誤差の解析
・カーネル主成分分析
・カーネル正準相関分析
・カーネルFisher判別分析
・サポートベクターマシンの基本事項
・Representer定理
・グラム行列の低ランク近似
・さまざまなカーネル法
・カーネル法の性質
・カーネルの選択
・期待損失の上界
準備学習等

成績評価

授業目標の達成度を、レポート問題によって評価する。授業で取り上げた機械学習の枠組みの基本的なアイディアを理解しているかが求められる。

備考(実務経験の活用を含む)

授業開始前日までに受講申請を終えておくこと