シラバス詳細

シラバス詳細

タイトル「2023年度」、カテゴリ「全学共通教育-データサイエンス科目」

科目情報

科目名

データアナリティクス基礎

講義名

データアナリティクス基礎

クラス

02

担当教員

稲垣 佑典

実務経験のある教員による科目
配当

全2-4

キャンパス区分

成城キャンパス①

開講学期

前期

開講時期

曜日・時限

水3

科目種別

講義・演習

単位数

2

講義情報

副題

授業の内容

 現在の社会では、様々な分野でエビデンスに基づく意思決定が重要視されており、それを支えるデータサイエンス人材が求められています。
とはいえ、明確な目的を持たずにデータを弄んでいるだけでは、データサイエンスとは名ばかりの「サイエンス」の本質を欠いた行為に過ぎません。
 そこで本授業では、人文・社会科学のフィールドでいかにデータを活用すべきかを念頭に、文部科学省の「数理・データサイエンス・AI教育プログラム認定制度
(応用基礎レベル)」モデルカリキュラムの「1.データサイエンス基礎」および、「2.データエンジニアリング基礎」に準拠した内容を学んでいきます。
さらに座学だけではなく、クラウドを利用したシステムなどを使って実際にデータ分析を体験することで、今後に向けた基礎固めを行います。

到達目標

・自ら課題を設定し、いかなるデータと分析技法を用いればそれを解決に導くことができるのか考えられるようにする。
・データの特性を正しく把握し、目的に適った分析を選択して実行できるようにする。
・ソフトウェア操作法(Excelおよびフリーの統計アドインHADなど)やプログラミング(Python)の基本を身につけ、
 独力で目的とした結果を導出できるようにする。
・分析結果を適切に読み取り、科学的な意思決定を行えるようにする。

授業の方法

・オンデマンド形式での授業を行います。
・配布資料・分析用データはWebClassへアップロードします。
・フリーのExcel統計用アドインHADは各自でダウンロードし設定してもらいます(詳細は授業で説明します)
・データ分析の実習を含みます。ExcelおよびHADを用いた分析に加えて、Google Colaboratory(Colab)を
 使用してPythonによる分析も行います。

授業の計画

内容

イントロダクション:なぜデータを分析するのか? データ駆動型社会と新しいビジネスモデル、ビッグデータの活用

データの構造と特性①:コンピュータで扱うデータ、データの単位、データの構造

データの構造と特性②:データが表す対象の違い(量的/質的)・尺度水準、各種データの取得方法

データの構造と特性③:データの特徴を表す値とデータを可視化する方法

HADとPythonの基礎①:ExcelとHADによる代表値の算出と基本的なグラフ作成

HADとPythonの基礎②:Colab上でのPythonプログラミングの基本

HADとPythonの基礎③:Pythonによる代表値の算出と基本的なグラフ作成

データの背後にある法則;確率・期待値・分布、母集団と標本、サンプリング法

分析の進め方と仮説検定の考え方:仮説の立て方と検証方法の選び方、統計的検定における帰無仮説と対立仮説の関係

10

質的なデータの関連性を検討する:クロス集計表とχ2(カイ二乗)検定

11

量的なデータの関連性を検討する:散布図と相関係数、無相関検定

12

原因と結果を想定した関連の検討①:単回帰分析と最小二乗法、回帰に用いる微分の基礎とその意味

13

原因と結果を想定した関連の検討②:重回帰分析、多重共線性の問題

14

原因と結果を想定した関連の検討③:ロジスティック回帰分析と最尤法、指数・対数のおさらい

15

まとめ:「データの科学」とデータサイエンスの類似点と相違点、統計分析からAI・機械学習への発展

授業の計画の補足

※1. 1~3回の授業は主に座学となりますが、4回目以降は実習の時間を設けます。
※2. 進捗状況や理解度に応じて授業内容が前後したり、部分的な変更が生じたりすることがあります。

課題に対するフィードバックの方法

提出されたリアクションペーパーのコメントや小課題に対しては、教員による説明・コメントを加えたうえで
補足資料として公開してフィードバックします。

授業時間外の学修(予習・復習等)

予習:本シラバスと授業で配布する資料を確認し、要点となりそうな内容や理解が難しそうな点の洗い出しをしてください。
   また必要があれば、各自で高校数学の復習や関連する講義を積極的に履修するなどして、知識を補うようにしてください。

復習:授業動画や配布資料を確認し、実習した分析を独力で実行できるように繰り返し練習してください。

成績評価の基準と方法

成績評価の基準と方法

割合(%)

平常点(授業への参加度等)

60

小テスト

小レポート

定期試験

定期試験に代わるレポート

40

その他(補足欄参照)

成績評価の基準と方法の補足

成績評価は以下の2つの合計点(計100点)に基づいて行います。

・毎回の授業で提出するリアクションペーパー/小課題:60点(各4点×15回)
・期末レポート(レポートテーマは12回目の授業にて発表します):40点

教科書

著者名

書籍名

出版社

発行年

価格

ISBN

教科書の補足

<教科書不要科目>

参考文献

著者名

書籍名

出版社

発行年

価格

ISBN

阿部真人

データ分析に必須の知識・考え方 統計学入門 仮説検定から統計モデリングまで重要トピックを完全網羅

ソシム株式会社

2021

2750円

978-4-8026-1319-4

参考文献の補足

※ 有用な参考文献は各回の授業にて、適宜紹介していきます。

履修者への要望

・授業の前にWebClassへ資料や課題をアップロードするので、確認してください。
・授業内容を理解するために履修者本人・他履修者同士の努力を推奨します。
 わからないことがある時には初めから教員や人に尋ねるのではなく、まずは書籍や
 インターネットを通じて情報を集め、自ら解決する道を探ってみてください。
                         (※ 質問は歓迎します)

教員との連絡・相談方法

相談可能場所

相談可能時間

E-mail Address※ [at]は@に置き換える。

補足

・教員研究室
・オンライン(Zoomなど)

オフィスアワー(木曜 12:00-13:00)、その他随時(※要相談)

授業時にお知らせします。

相談事がある場合は、下記のいずれかの手段を通じて連絡をください。
1)メール(※連絡・相談用のアドレスは、配布資料などでお知 らせします)
2)授業時間前後の空き時間(※時間の都合により、対応できないことがあります)
3)メールで事前連絡をした上での対面による面談
4)メールで事前連絡をした上でのZoomなどによるオンライン面談

その他

備考(特記事項)