科目名[英文名]
テキストデータと機械学習(国際学類学生)[Machine Learning with Text Data]
担当教員[ローマ字表記]
藤井 美娜
科目ナンバー
HSSTB1102A
科目ナンバリングとは
時間割番号
10075.1
科目区分
-----
講義形態
-----
開講学域等
人間社会学域
適正人数
81人
開講学期
Q4
曜日・時限
集中
単位数
1単位
授業形態
60単位上限
対象学生
-----
キーワード
テキストデータ, 自然言語処理, 機械学習, 機械翻訳, Python
講義室情報
人間社会第2講義棟 402講義室(対面のみ)
開放科目
-----
備考
日程:1/21(土)~1/22(日)
授業の主題
単語や文を機械的に処理したいとき、単語や文などのテキストデータはどのように扱えばいいのでしょうか?
本講義では、テキストデータを統計的に扱うための考え方や、自然言語処理系の機械学習タスクを解くために必要な知識を理解することを主な目的とします。
授業の目標
以下にあげる項目の達成を目指します。
・ テキストデータとは何かを理解する
・ テキストデータを扱う際の注意点について理解する
・ テキストデータの統計的な分析手法について理解する
・ 任意のテキストデータを用い、形態素解析や構文解析ができる
・ 解析結果から、そのテキストデータの特徴をまとめ、報告することができる
授業概要
本講義では、講義と演習を行います。
できる限り数式や難しい用語を使わず概念の解説を行う予定なので、事前知識は不要です。
演習では、ご自身のpc上で単語の分割や文の類似度を計算するので、各自pcと電源を持参してください。
【集中講義1日目】
1. 機械学習概説
2. ことばを機械的に扱うとはどういうことか
3. 演習準備、pc設定
4. テキストデータの統計的な分析
【集中講義2日目】
5. 形態素解析と構文解析
6. テキスト分類
7. 機械翻訳
8. 課題演習(試験)
評価方法と割合
評価方法
次項の項目及び割合で総合評価し、次のとおり判定する。
「S(達成度90%~100%)」、「A(同80%~90%未満)」、
「B(同70%~80%未満)」、「C(同60%~70%未満)」を合格とし、
「不可(同60%未満)」を不合格とする。(標準評価方法)
評価の割合
【授業には3分の2以上の出席を必要とする】
・(40)% 小テスト
・(60)% 学期末試験
授業時間外の学修に関する指示
予習に関する指示
特になし
予習に関する教材
復習に関する指示
復習に関する教材
教科書・参考書
教科書・参考書補足
特になし
オフィスアワー等(学生からの質問への対応方法等)
slackもしくはメールで対応します。具体的な方法は、授業の際に指示します。
履修条件
特になし
特記事項
特記事項
特になし
ページの先頭へ