シラバス詳細

シラバス詳細

タイトル「2023年度」、カテゴリ「全学共通教育-データサイエンス科目」

科目情報

科目名

データサイエンス・アドバンスド・プログラム

講義名

データサイエンス・アドバンスド・プログラム

クラス

01

担当教員

田村 光太郎、五十嵐 康彦、志田 洋平

実務経験のある教員による科目
配当

全2-4

キャンパス区分

成城キャンパス①

開講学期

後期

開講時期

曜日・時限

金4

科目種別

演習

単位数

2

講義情報

副題

授業の内容

 コンビニの売上、電車の乗降記録、インターネット上の書き込み、アプリの利用履歴など大量のデータがビジネスでは日々収集されている。これらデータから即座にインサイトを生み出し、ビジネスに貢献することが求められるデータサイエンスに大きな期待が寄せられる。データ利活用の初期段階として、データの基礎的な集計や統計処理により、ビジネスにおける着目する問題を明確化したり、課題解決のための糸口を引き出すことが必要である。そこでは、分析操作の技術だけでなく、ビジネスへの貢献やコミュニケーションも求められる人材(データサイエンティスト)が社会から強く求められている。
 データアナリティクス応用では、データ分析からインサイトを引き出し、ビジネスの改善を行っていくことを主眼に置いたが、データサイエンス・アドバンスド・プログラムでは、機械学習・AIモデルを利用し、業務の自動化や拡大を行っていくためのモデリングの基礎を習得する。例えば、画像、文章やネットワークといったデータの扱いや、予測や分類といったタスクに強い機械学習・AIの手法を「Python」を通して触れていく。より高度な分析手法を身につけ、データサイエンティストとして社会のニーズに応えられる技術力を身につけられるよう授業を行う。

到達目標

データサイエンスのプロジェクトに関わる一連のプロセスを体験する。
・データサイエンスの知識を用いることで,分析課題の特定や解決の糸口を見いだせるようになる。
・統計処理、機械学習・AIのプログラミング言語「Python」による実践的なデータ処理やモデリングができるようになる。
・実施したモデリングで得られた知見や結果をを効果的に他人に説明できるようになる。

授業の方法

 第9回までの講義では、統計学の知識などを講義し、実データを「Python」を用いて自らの手で解析、グラフ化を行い簡単なレポートにまとめる。第10回からのデータ解析プロジェクトでは、自ら課題と感じるテーマを設定し、解析するデータを選び、これまでの知識をフル活用したデータ解析を行い、得られた結果の発表を行う。
 公立はこだて未来大学との連携協定事業の一つとして、大学院生がティーチングアシスタントとして参加し、授業支援等の業務を行う。
 ※講義はすべてZoomによるオンライン授業とする。WebClass上で配布された資料やデータ等を用い、講義時間中に講義と演習を行う。

授業の計画

内容

ガイダンス:Pythonの基本操作

Pythonの基礎:基本的な統計操作(集計,描画,ロジスティック回帰の復習)

教師あり学習1:データの分類と重要変数の抽出(決定木・回帰木+RF,交差検証)

教師あり学習2:モデルの簡略化(リッジ回帰,ラッソ回帰,Elastic Net)

教師なし学習1:データ間の距離を測る(距離+主成分分析)

教師なし学習2:データのグループ分け(クラスタリング(k-meansなど))

教師なし学習3:データの「カタチ」を調べる(ネットワーク分析)

深層学習1:ニューラルネットワークの設計(MNIST,3層+DNN)

深層学習2:AIでテキスト解析(W2V,分散表現,単語埋め込み,Skip-gramモデル)

10

データ解析プロジェクト1:解析するデータを決める,データの下処理を行う

11

データ解析プロジェクト2:データを解析する①

12

データ解析プロジェクト3:データを解析する②

13

データ解析プロジェクト4:データを解析する③

14

データ解析プロジェクト5:発表資料の作成

15

発表会

授業の計画の補足

課題に対するフィードバックの方法

講義中に課す小レポートは、講義時間中に時間をとるので、TAサポートのもと解答して提出する。

授業時間外の学修(予習・復習等)

予習:事前に配布資料に目を通しどのような内容を学習するのかを確認する。
復習:授業で行った内容を確認し,「Python」のコマンドをもう一度実行する。
※発表会に向けた準備では、slack上での質疑応答やディスカッションを行うこともある。

成績評価の基準と方法

成績評価の基準と方法

割合(%)

平常点(授業への参加度等)

小テスト

小レポート

50

定期試験

定期試験に代わるレポート

25

その他(補足欄参照)

25

成績評価の基準と方法の補足

その他(補足欄参照)は、第15回発表会への参加と発表の評価:25%である。
※発表会の準備、発表者としての参加、最終レポート(定期試験に代わるレポート)の提出は必須であり、正当な理由のない欠席は成績評価を行わない。

教科書

著者名

書籍名

出版社

発行年

価格

ISBN

教科書の補足

<教科書不要科目>

参考文献

著者名

書籍名

出版社

発行年

価格

ISBN

辻 真吾

Pythonスタートブック

技術評論社

2010

Wes McKinney,瀬戸山 雅人,小林 儀匡,滝口 開資 訳

Pythonによるデータ分析入門

オライリー・ジャパン

2018

杉山 聡

分析モデル入門

ソシム出版

2022

参考文献の補足

履修者への要望

教員との連絡・相談方法

相談可能場所

相談可能時間

E-mail Address※ [at]は@に置き換える。

補足

k.tamura.phd[at]gmail.com
igayasu1219[at]cs.tsukuba.ac.jp
shida[at]sk.tsukuba.ac.jp
※[at]を@に変換

その他

備考(特記事項)