ベンチャー体験工房4
機械学習とデータマイニングとディープラーニングによるテキスト処理(分類と翻訳)
ディープラーニングなどのAI技術により、チャットボット、自然言語機械翻訳、テキスト分類、画像・音声認識など、人間のように振る舞う多くのアプリケーションが開発されている。 このコースでは、機械学習とディープラーニングを用いて、テキスト分類と自然言語翻訳を学ぶ。
シラバス詳細

2023年4月

4月10日
授業内容:授業の導入と計画 授業の冒頭で自己紹介とシラバスの概要を説明し、その後、学期中の活動計画を立てるための説明を行いました。また、データマイニングの概念について説明し、AIの未来について議論しました。

2023_04_10.jpg

4月17日
授業内容:データマイニングの基礎 I: データマイニングの意味、分類、クラスタリング、関連など、色々な手法について説明しました。

2023_04_17.jpg

4月24日
授業内容:テキストマイニングの基礎:前回に引き続き、Text処理の基礎と検索について説明し、文書の特徴の取り方で、TF-IDFを説明しました。

2023_04_24.jpg

2023年5月

5月1日
授業内容:Calculating TF-IDF & Obtaining Data from Web

PythonでTF-IDFを生成し、ウェブページからテキストを抽出する方法を学びました。NLTKとStanford NL Libraryを使って、TF-IDFの生成、HTMLからのテキスト抽出、POSタグ付けの例とチュートリアルを探りました。 2023_05_01.jpg

5月15日
授業内容:Machine Learning (SVM) & Evaluation

NB, SVMなど機械学習の基礎の勉強とSKLearnを使ったPythonでの例題を紹介した。SVMとRFを使った文書分類に焦点を当てました。また、機械学習の応用としてSVM Lightを利用して学習の過程を観察した。

2023_05_15.jpg

5月22日・29日
授業内容:Team Project Ⅰ&Ⅱ

各チームメンバーが、色々なCorpusからデータを用意し、SVMアルゴリズムを利用して文書分類機の作成をした。各メンバーは自分で、データを読むこど、それからTF-IDFを計算し、訓練データ、テストデータを作って、機械学習モデルを作って性能を測ってみて、望む結果を得た。 2023_05_22.jpg 2023_05_29.jpg

2023年6月

6月12日
授業内容:Deep Learning Basic (I):

「Deep Learning Basic (I)」では、Word Embeddingの重要性とその具体的な例について学びました。自然言語処理におけるWord Embeddingの応用方法を実践的に学び、様々なタスクへの適用の知見を深めました。さらに、NN-BP、RNN、LSTM、DL、CNNなど、深層学習の基礎的な概念とアルゴリズムにも触れ、その有用性を体感しました。

2023_06_12.jpg

6月19日
授業内容:Deep Learning Basic (II):

「Deep Learning Basic (II)」では、Transformer、BERT、GPTなどの最新のモデルに焦点を当てました。自然言語処理の分野での革新的な手法に触れることで、より高度な情報処理と解析の手法を学びました。これらのモデルがどのようにデータを理解し、予測を行うのかについて深い洞察を得ることができました。

2023_06_19.jpg

6月26日
授業内容:Code and Data of Twitter Classification in Github:

Twitterの感情分類に関する研究では、実際のデータとコードを活用しました。GitHub上で公開されているリポジトリからコードとデータを入手し、畳み込みニューラルネットワーク(CNN)を用いた感情分類の実装に取り組みました。

2023_06_26.jpg

2023年7月

7月3日
授業内容:「Neural Language Translation」の授業では、自然言語処理技術について学びました。具体的には、RNNエンコーダー・デコーダーやseq2seq、transformerなどのモデルについて詳しく解説がありました。また、word embeddingという手法を学び、言葉を数値化して意味を捉える方法についても理解を深めました。

2023-07-03 .jpg

7月10日・18日
授業内容:「Transformer Test Code Handson and Project」という実践的な授業が行われました。ここでは、実際にtransformerの評価を行い、コードを書きながら理解を深める機会を得ました。自分自身でコードを組むことで、transformerの仕組みや挙動をより具体的に理解できるようになりました。

2023-07-10.jpg 2023-07-18.jpg

7月24日
授業内容:「Project Evaluation」が行われ、自分が取り組んできたプロジェクトの成果を評価しました。その際に、プロジェクトにおける自分の役割や成果について振り返りを行い、今後の改善点や展望を考えることができました。これらの経験を通じて、新たな知識とスキルを身につけるとともに、自己成長を感じることができました。

2023-07-24.jpg

2023年10月

10月10日
授業内容:授業の冒頭で、最初に自己紹介とシラバスの概要を行い、その後、学期の活動計画を共有するための説明を行いました。同時に、データマイニングの基本概念を紹介し、AIの未来についてのディスカッションを行いました。

kobo4_1010.jpg

10月16日
授業内容:データマイニングの基礎 I: データマイニングの意味、分類、クラスタリング、関連など、色々な手法について説明しました。

kobo4_1016.jpg

10月23日
授業内容:テキストマイニングの基礎:前回に引き続き、Text処理の基礎と検索について説明し、文書の特徴の取り方で、TF-IDFを説明しました。

kobo4_1023.jpg

10月30日
授業内容:テキストマイニングの基礎:前回に引き続き、Text処理の基礎と検索について説明し、文書の特徴の取り方で、TF-IDFを説明しました。そして、理解の為にTF-IDFをJavaで実装しました。

kobo4_1030.jpg

2023年12月

12月11日
授業内容:rewrite TF-IDF code and learning python basics
前月に続き、Pythonコードを使用してTF-IDFを実装する作業に取り組んでいます。理解を一層深めるために、Pythonの基礎を習得するための時間を割り当て、皆で学習を進めています。これにより、グループ全体でのスキル向上とプロジェクトへの意欲的なアプローチが育まれています。

12月18日
授業内容:rewrite TF-IDF code and review
グループ全体で、各自がPythonコードに書き直したTF-IDFのコードを検討・レビューしました。これにより、コードの品質向上と効果的な学習が促進され、新たな発見や理解が得られました。