タイトル
     2024 年度 後学期  情報学部 日英区分 :日本語 
  
データマイニング演習   
時間割コード ナンバリング 科目分野
JB4007 JB-3-DS4007-J  
担当教員(ローマ字表記)
  松野 省吾 [Matsuno, Shogo]
対象学生 対象年次 単位数
  3年次 ~ 2
授業の目的  
大量のデータから有用な情報を知識として抽出する手法について学び,それらを駆使して実際のデータから意味のある情報を発見する基本的な技術の習得を目的とする.
 
授業の到達目標  
データの構造と性質を理解し,適切な分析手法を検討できる.
知識発見プロセスを理解し,知識発見とその解釈や評価といった一連の流れを実施できる.
チームでのディスカッションを通して獲得した知識の整理とプレゼンテーションができる.
 
ディプロマポリシーとの関連(評価の観点)  

A:諸科学についての基礎的知識と理解 ー
B:論理的・創造的思考力  ◎
C:コミュニケーション能力  〇
D:社会的倫理観・国際性  ー
E:情報社会の諸課題の理解と情報学的知の活用能力  ◎
F:社会組織や制度に対する知識と社会科学的分析能力  〇
G:データサイエンスの基礎知識と社会実装提案能力  ◎
H:情報技術を創出し利活用するための知識基盤  △
K:データの収集・分析と数理最適化による課題解決能力  〇
 
授業概要  
データから知識を発見する一連のプロセスを確認しながら,データの種類に応じた基本的な分析手法について講義と演習を通じて身につける.また,チームによるデータ分析と解釈を実施し,データから発見した知識の解釈と整理,他者へのプレゼンテーション手法を身につける.
 
授業の形式(授業方法)  
講義,演習(パソコンを使用)
 
授業スケジュール  
No.内容
第1回 導入:科目紹介、データマイニングの概要
第2回 データセットの分析:基本的な集計とビジュアライゼーション
第3回 データセットの分析:演習
第4回 テキストデータの分析:ワードクラウド、共起ネットワーク、Bag of Words
第5回 テキストデータの分析:文書表現、埋め込み表現、コーパスの活用
第6回 テキストデータの分析:演習
第7回 ドメインの分析:特徴ベクトル、距離と類似度、感情分析、極性分析
第8回 ドメインの分析:演習
第9回 時系列データの分析:時系列特徴量、変動成分
第10回 時系列データの分析:時系列の予測モデル
第11回 時系列データの分析:演習
第12回 総合演習:課題データセットを用いた分析のグループワーク
第13回 総合演習:中間報告1
第14回 総合演習:中間報告2
第15回 総合演習:最終発表
 
授業時間外学修情報
「学修」とは授業と授業時間外の予習・復習などを含む概念です。1単位につき45時間の学修が必要です。
学則で定められている1単位の時間数は次のとおりです。
講義・演習    授業15~30時間、授業時間外30~15時間
実験・実習・実技
 
復習を毎回行うこと.
指示された演習課題について取り組むこと.
 
成績評価基準(授業評価方法) 及び 関連するディプロマポリシー  
授業で実施する演習課題(複数回:計40%:B, C, E, F, K)とグループワーク発表(60%:B, C, E, F, G, H, K)の予定.
グループワークの評価は発表内容だけでなく,積極性や貢献を総合的に評価する.
 
受講条件(履修資格)  
特になし.
 
メッセージ  
 
キーワード  
実務経験、プログラミング、Python、データハンドリング、知識発見
 
この授業の基礎となる科目  
データエンジニアリング
 
次に履修が望まれる科目  
 
関連授業科目  
 
教科書  
備考 なし
 
参考書  
備考 適宜紹介.
 
教科書・参考書に関する補足情報  
 
コース管理システム(Moodle)へのリンク  
https://mdl.media.gunma-u.ac.jp/course/view.php?id=6360
 
授業言語  
 
学生用連絡先  
【匿名アクセスではこの情報を閲覧できません。】
 
学生用メールアドレス  
【匿名アクセスではこの情報を閲覧できません。】
 
オフィスアワー (※教員が研究室に在室し、学生からの質問・相談等に応じる時間のことです。)  
【匿名アクセスではこの情報を閲覧できません。】
 
教員ホームページ  
 
関連ホームページ  
 
ページの先頭へ