- ベンチャー体験工房4
- 機械学習とデータマイニングとディープラーニングによるテキスト処理(分類と翻訳)
- ディープラーニングなどのAI技術により、チャットボット、自然言語機械翻訳、テキスト分類、画像・音声認識など、人間のように振る舞う多くのアプリケーションが開発されている。 このコースでは、機械学習とディープラーニングを用いて、テキスト分類と自然言語翻訳を学ぶ。
シラバス詳細
2023年4月
4月10日
授業内容:授業の導入と計画 授業の冒頭で自己紹介とシラバスの概要を説明し、その後、学期中の活動計画を立てるための説明を行いました。また、データマイニングの概念について説明し、AIの未来について議論しました。
4月17日
授業内容:データマイニングの基礎 I: データマイニングの意味、分類、クラスタリング、関連など、色々な手法について説明しました。
4月24日
授業内容:テキストマイニングの基礎:前回に引き続き、Text処理の基礎と検索について説明し、文書の特徴の取り方で、TF-IDFを説明しました。
2023年5月
5月1日
授業内容:Calculating TF-IDF & Obtaining Data from Web
PythonでTF-IDFを生成し、ウェブページからテキストを抽出する方法を学びました。NLTKとStanford NL Libraryを使って、TF-IDFの生成、HTMLからのテキスト抽出、POSタグ付けの例とチュートリアルを探りました。
5月15日
授業内容:Machine Learning (SVM) & Evaluation
NB, SVMなど機械学習の基礎の勉強とSKLearnを使ったPythonでの例題を紹介した。SVMとRFを使った文書分類に焦点を当てました。また、機械学習の応用としてSVM Lightを利用して学習の過程を観察した。
5月22日・29日
授業内容:Team Project Ⅰ&Ⅱ
各チームメンバーが、色々なCorpusからデータを用意し、SVMアルゴリズムを利用して文書分類機の作成をした。各メンバーは自分で、データを読むこど、それからTF-IDFを計算し、訓練データ、テストデータを作って、機械学習モデルを作って性能を測ってみて、望む結果を得た。
2023年6月
6月12日
授業内容:Deep Learning Basic (I):
「Deep Learning Basic (I)」では、Word Embeddingの重要性とその具体的な例について学びました。自然言語処理におけるWord Embeddingの応用方法を実践的に学び、様々なタスクへの適用の知見を深めました。さらに、NN-BP、RNN、LSTM、DL、CNNなど、深層学習の基礎的な概念とアルゴリズムにも触れ、その有用性を体感しました。
6月19日
授業内容:Deep Learning Basic (II):
「Deep Learning Basic (II)」では、Transformer、BERT、GPTなどの最新のモデルに焦点を当てました。自然言語処理の分野での革新的な手法に触れることで、より高度な情報処理と解析の手法を学びました。これらのモデルがどのようにデータを理解し、予測を行うのかについて深い洞察を得ることができました。
6月26日
授業内容:Code and Data of Twitter Classification in Github:
Twitterの感情分類に関する研究では、実際のデータとコードを活用しました。GitHub上で公開されているリポジトリからコードとデータを入手し、畳み込みニューラルネットワーク(CNN)を用いた感情分類の実装に取り組みました。
2023年7月
7月3日
授業内容:「Neural Language Translation」の授業では、自然言語処理技術について学びました。具体的には、RNNエンコーダー・デコーダーやseq2seq、transformerなどのモデルについて詳しく解説がありました。また、word embeddingという手法を学び、言葉を数値化して意味を捉える方法についても理解を深めました。
7月10日・18日
授業内容:「Transformer Test Code Handson and Project」という実践的な授業が行われました。ここでは、実際にtransformerの評価を行い、コードを書きながら理解を深める機会を得ました。自分自身でコードを組むことで、transformerの仕組みや挙動をより具体的に理解できるようになりました。
7月24日
授業内容:「Project Evaluation」が行われ、自分が取り組んできたプロジェクトの成果を評価しました。その際に、プロジェクトにおける自分の役割や成果について振り返りを行い、今後の改善点や展望を考えることができました。これらの経験を通じて、新たな知識とスキルを身につけるとともに、自己成長を感じることができました。
2023年10月
10月10日
授業内容:授業の冒頭で、最初に自己紹介とシラバスの概要を行い、その後、学期の活動計画を共有するための説明を行いました。同時に、データマイニングの基本概念を紹介し、AIの未来についてのディスカッションを行いました。
10月16日
授業内容:データマイニングの基礎 I: データマイニングの意味、分類、クラスタリング、関連など、色々な手法について説明しました。
10月23日
授業内容:テキストマイニングの基礎:前回に引き続き、Text処理の基礎と検索について説明し、文書の特徴の取り方で、TF-IDFを説明しました。
10月30日
授業内容:テキストマイニングの基礎:前回に引き続き、Text処理の基礎と検索について説明し、文書の特徴の取り方で、TF-IDFを説明しました。そして、理解の為にTF-IDFをJavaで実装しました。
2023年12月
12月11日
授業内容:rewrite TF-IDF code and learning python basics
前月に続き、Pythonコードを使用してTF-IDFを実装する作業に取り組んでいます。理解を一層深めるために、Pythonの基礎を習得するための時間を割り当て、皆で学習を進めています。これにより、グループ全体でのスキル向上とプロジェクトへの意欲的なアプローチが育まれています。
12月18日
授業内容:rewrite TF-IDF code and review
グループ全体で、各自がPythonコードに書き直したTF-IDFのコードを検討・レビューしました。これにより、コードの品質向上と効果的な学習が促進され、新たな発見や理解が得られました。