生物統計学

科目名
Course Title
授業コード 単位数 配当年次 開講期間
Term
科目分類 ナンバリング
コード
曜日
コマ
教室 担当教員氏名
Instructor
生物統計学
Biometry
B301190001 2 2 後期授業 専門科目 CAABS2205-J1 火1 C5-実習室1-A,C5-実習室1-B,C5-実習室1-C 尾形 善之

オフィスアワー

月曜日 12:00~13.00

授業目標

 生命環境科学や分子生物学の分野では、分析機器が急速に発達したおかげで、学生が手にするデータでさえ、ビッグデータとなってきた。生物学的なビッグデータから役に立つ情報を「客観的に」取り出すために、統計学的手法が使われている。それぞれの受講者が自分の研究課題で統計解析をするときに、最初に何を確認するべきか、ふさわしい方法をどうやって選ぶか、実際にどういう作業をするのか、さらに得られた解析結果をどのように解釈するのか、その解釈は本当に妥当であるか、について、しっかりと実習する。
 まず最初にすべきこととして、1) データが統計解析に適していることを確認する(研究目的に見合うデータかどうか)、2) データ全体を眺めてみる(主成分分析など)、3) データの特性を調べる(ヒストグラムなど)、4) 得られた解析結果を「元のデータを踏まえて」生物学的に解釈する、ことを習熟する。
 次に研究目的とデータの特徴から、適切な統計手法を選んで実行できるようにする。特に、多変量解析と検定手法について詳しく学習する。また、統計解析で陥りやすい判断ミスとして、データに含まれるノイズの影響について具体的に説明し、ノイズを扱う方法を学ぶ。
 さらにビッグデータを処理するスキルとして、エクセルやRを用いて解析する手順について丁寧に説明し、実習する。

達成目標(何をできるようになるか)
1. 生物、生命科学データに対する統計解析の心構え
2. エクセル:基本操作、データ分析、統計関数を用いた作業、マクロプログラムの実行
3. R:基本操作、各種統計解析の実行
4. ビッグデータ(遺伝子発現データ)の処理
5. 統計解析の実行:主成分分析、基本統計量の算出、検定、相関係数の算出、ネットワーク解析

教科書

生物統計学のウェブ資料:「解説編」、「実習編」(入手先のウェブサイトについては、下記URLリンク1を参照)

参考書

「Excel関数辞典  秀和システム」
「Excelで学ぶ統計解析入門  オーム社」
「Rによるデータサイエンス  森北出版株式会社」

関連科目

植物バイオサイエンス情報処理演習、統計学基礎

授業時間外の学習(準備学習等について)

 1コマ目の実習ですので、実習時間を確保する必要があります。講義内容の「解説編」および「実習編」を予め提供しますので、必ず予習しましょう。
 実習では、エクセルやRを使って統計解析しますので、実習を通じて、操作方法に慣れましょう。内容が不足している場合には、インターネットなどを利用して情報を収集しましょう。
 期末レポートの課題については第1回の講義中に提供します。各回の講義で習熟した実習内容について、そのつど期末レポートに取り組むことで、早く着実にスキルを習熟できます(期末レポートの完成も早まります)。

授業の概要

 毎回、授業計画に記載したテーマに沿って講義と実習の形式で行います。原則として「当日レポート方式」で行います。授業の構成は前半20分程度が講義で後半が実習となります。講義の後に「チェックポイント」の時間を設けて講義内容の理解度を確認します。毎回の実習の際に課題を出しますので、レポートに纏めます。レポートの提出は出席の確認も兼ねます。
 期末試験は行わず、代わりに期末レポートを出します。各授業の配点については「成績評価」を参照してください。質問は授業中、授業の前後、オフィスアワー、メール等でいつでも受け付けます。

授業計画

第1回 タイトル:木を見て森を見てまた木を見る、注目要素を決める
目的:生物統計学に取り組む心構えについて学ぶ。実習環境を確認する。ウェブツールを使えるようにする。
達成目標:統計学と生物統計学の違いについて理解を深める。実習環境について理解する。発現傾向や機能から判断して、注目する遺伝子を決める。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、注目要素をどのように決めるか考えておく。
第2回 タイトル:全体を眺める(1)、平均、分散、標準偏差、ヒストグラム
目的:エクセルで基本的な統計指標を計算し、ヒストグラムを作れるようにする。
達成目標:注目遺伝子の発現量の傾向を全体的に眺める。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、実習するエクセルの作業についてよく読んでおく。
第3回 タイトル:違いを調べる(1)、t検定
目的:エクセルでt検定を実行できるようにする。
達成目標:注目遺伝子と他の遺伝子との発現傾向の違いについて考察する。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、実習するエクセルの作業についてよく読んでおく。
第4回 タイトル:違いを調べる(2)、U検定
目的:Rでt検定とU検定を実行できるようにする。
達成目標:t検定とU検定との結果の違いについて考察する。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、前回のt検定の内容についてよく理解しておく。
第5回 タイトル:違いを調べる(3)、ふたつのエラー、P値とFDR
目的:t検定の結果としてのp値に対してFDR (false discovery rate)を計算できるようにする。
達成目標:違いの明瞭なふたつの実験群でのp値とFDRとの関係について考察する。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、FDRの意味と求め方についてよく理解しておく。
第6回 タイトル:違いを調べる(4)、多重比較
目的:さまざまな多重比較の方法について学ぶ。
達成目標:Rを用いて多重比較を実行できるようにする。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、多重比較の方法についてよく理解しておく。
第7回 タイトル:類似性を調べる、相関係数
目的:エクセルとRで相関係数を計算できるようにする。
達成目標:注目遺伝子と相関の高い遺伝子と低い遺伝子を見つける。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、実習するエクセルとRでの作業内容についてよく読んでおく。
第8回 タイトル:全体を眺める(2)、回帰分析
目的:回帰分析の目的と方法を知り、実行できるようにする。
達成目標:エクセルで回帰分析を実行する。
準備学習等 「解説編」および「実習編」をよく読んでおく。特に、エクセルで回帰分析を実施する手順を理解しておく。
第9回 タイトル:全体を眺める(3)、主成分分析-1(目的と原理、標準化と寄与率の関係)
目的:主成分分析について理解し、基本的な作業をできるようにする。
達成目標:寄与率のデータを見て、有効な主成分を選ぶ。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、Rでの打ち間違いをなくすため、作業内容をよく読んでおく。
第10回 タイトル:全体を眺める(4)、主成分分析-2(負荷量の評価)
目的:主成分分析の各種グラフを描けるようにする。注目する主成分を選ぶ。
達成目標:負荷量のグラフから、実験間の関係を評価する。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、寄与率および負荷量の求め方と解釈について理解しておく。
第11回 タイトル:全体を眺める(5)、主成分分析-3(得点の活用)
目的:主成分分析の得点の結果を使って、エクセルで統計解析できるようにする。
達成目標:主成分分析の得点から、注目遺伝子が特異的に発現する実験を選ぶ。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、作業内容と考察する内容についてよく理解しておく。
第12回 タイトル:全体を眺める(6)、相関ネットワーク解析
目的:ビッグデータ解析に活用できるネットワーク解析を実行できるようにする。
達成目標:発現傾向が似ている実験をグループに纏め、そのグループの特徴を評価する。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、実習するConfeitoGUIツールの作業内容についてよく読んでおく。
第13回 タイトル:全体を眺める(7)、クラスタリング、ヒートマップ
トピックとの関係:トピック6に対応
目的:Rを使って、クラスター分析やヒートマップを使えるようにする。
達成目標:注目遺伝子と他の遺伝子との発現傾向の違いを全体的に眺める。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、実習するRでの作業内容についてよく読んでおく。
第14回 タイトル:外れ値を取り除く
目的:Rを使って、遺伝子発現データの外れ値を統計学的に取り除く方法を実行できるようにする。
達成目標:どのようなデータの場合に外れ値を省けるのかについて理解する。
準備学習等 「解説編」および「実習編」をよく読んでおく。
特に、外れ値を統計的に取り除く方法について理解しておく。
第15回 タイトル:期末レポートの説明
目的:期末レポートの目的と作業内容について説明する。
達成目標:期末レポートの作業内容について理解する。
準備学習等 予め提供してある、期末レポート用のデータと作業内容について、よく理解しておく。

成績評価

授業目標の項で述べた5項目の達成目標に従い、当日レポート(第1~15回の授業、75%)と期末レポート(25%)により評価します。当日レポートは出席確認を含み、5%×15回として計算します。合計で60%以上を合格(C以上)とします。期末レポートの内容は第1回の講義中に知らせます。各回の時間外学習として取り組むことで、効果的な復習になります。

備考(実務経験の活用を含む)

 当日レポートは原則として授業終了時に提出するものですが、当日中であれば受け付けます。担当教員の部屋(尾形、B11棟4階413号室)のレポート入れに提出してください。後日提出したものでも採点はしますが、出席扱いにならない場合があります(学籍番号で出席が確認できた場合は、出席扱いにします)。
 病気や公欠のため出席できない場合は、欠席届とともに証明書などの書類を提出してください。その場合であれば、後日のレポート提出を受け付けます。電車の遅延で遅れた場合は、遅延証明書の裏に学籍番号と氏名を書いて提出してください。その場合でも、当日レポートは当日中に提出してください。