機械学習・ディープラーニング
-
【scikit-learn】特徴量スケーリングの意味と使い方について
Scikit-learnの特徴量スケーリング 機械学習のモデルを構築する際、特徴量スケーリング(Feature Scaling)は非常に重要な工程です。データセット内の特徴量(各列のデータ)が異なるス …
-
【scikit-learn】ラッソ回帰の意味と使い方について
ラッソ回帰 ラッソ回帰とは? ラッソ回帰(Lasso Regression)は、線形回帰モデルの1つで、データの特徴量選択を自動的に行うことができる点が特徴です。具体的には、モデルの精度を保ちながら、 …
-
【scikit-learn】データを訓練データとテストデータに分割するtrain_test_splitについて
訓練データとテストデータの分割 機械学習のプロジェクトを進めるうえで、データを適切に分割することは非常に重要です。モデルを訓練するためのデータ(訓練データ)と、モデルの性能を評価するためのデータ(テス …
-
【ディープラーニング】密ベクトルと疎ベクトルの意味と例について
密ベクトルと疎ベクトルとは? ベクトルは機械学習・ディープラーニングなどでは、特にデータの集まりを表現する概念です。その中でも、密ベクトルと疎ベクトルは特にデータの「密度」に注目して分類されます。 密 …
-
JSダイバージェンスの意味と性質について
JSダイバージェンス JSダイバージェンスとは、Jensen-Shannonダイバージェンスの略で、2つの確率分布間の類似度を測るための指標です。これは、Kullback-Leiblerダイバージェン …
-
大規模言語モデル(LLM)と語彙(vocabulary)の関係と意味について
語彙とは 「語彙」とは、特定の言語や文脈で使われる単語や記号などの集まりを指します。言語モデルにおける語彙は、モデルが理解し、処理できるすべての単語や記号、トークンの集合です。日常的な言葉とコンピュー …
-
【デコーディング手法】top_p(nuclear sampling)の意味と使い方について
top_p 近年、自然言語処理の分野で大規模な言語モデルが注目を集めています。これらのモデルはテキスト生成や対話システムなど、多岐にわたる応用が可能です。その中で、モデルが生成するテキストの質を左右す …
-
【深層学習】活性化関数Parametric ReLU (PReLU)の意味と性質について
Parametric ReLU (PReLU)とは? Parametric ReLU(パラメトリックReLU、PReLU)は、活性化関数の一つです。ReLU(Rectified Linear Unit …