機械学習・ディープラーニング
-
ロジスティック回帰と分類問題・流れ・ロジット・偏回帰係数について
ロジスティック回帰 ロジスティック回帰(Logistic Regression)は、分類問題に用いられる統計モデルで、特に二値分類(2つのクラスに分類する問題)に適しています。このモデルは、入力データ …
-
自然言語処理とコーパス・具体例について
コーパスとは コーパス(corpus)は、自然言語処理(NLP)や言語学の分野で使用される用語で、言語データの大量の集合を指します。具体的には、文章や単語、文などのテキストデータが集められたもので、特 …
-
NLTKとWordNetの基本的な使い方・類義語について
NLTKとWordNet NLTK (Natural Language Toolkit) は、WordNet という辞書データベース(シソーラス)にアクセスするための便利なインターフェースを提供してい …
-
MDPの定義・具体例・状態価値関数・方策・練習問題について
MDPとは MDPはMarkov Decision Processの略です。マルコフ決定過程と呼ばれます。 MDPの定義 MDPの遷移は次のような時系列データとなります。ここで \( t \) は時刻 …
-
強化学習とバンディット問題・練習問題について
バンディット問題の問題設定 バンディット問題とは、画像のように複数のスロットマシンが並ぶ環境で、どのレバーを引けば最も多くの報酬を得られるかを探る問題です。プレイヤーは、各スロットマシンのレバーを引く …
-
自然言語処理と分布仮説について
分布仮説とは 分布仮説(Distributional Hypothesis)とは、単語の意味はその単語が文脈内でどのように使われるかに依存しているという考え方です。この仮説は、分散表現や単語埋め込みに …
-
「Gemma-2-9B」の力を試す!アニメと数学についてGoogleのAIに質問してみた
モデルの概要 「Gemma」は、Googleによって開発された最新の言語モデルの一つであり、最初に発表されたのは2月で、その時点では20億パラメータと70億パラメータの2つのバージョンが提供されていま …
-
PythonでDatasetsのmapメソッドを使ったデータ整形の方法
Datasetsのmap datasetsライブラリのmapメソッドは、データセット内の各サンプルに関数を適用するために使用されます。これにより、データセットを前処理したり、特定の操作を実行することが …