sklearnのTfidfVectorizerについて
sklearn
でKMeansを利用しようと考えています。
https://github.com/luispedro/BuildingMachineLearningSystemsWithPython/blob/master/ch03/rel_post_20news.py
上記のサンプルを参考にしています。
上記サンプルのL58でTfidfVectorizer.fit_transform()
で学習データをベクトル化し、L91で新しいクラスタリング対象のデータをTfidfVectorizer.transform()
でベクトル化しています。
これは、必ずfit_transform()
を呼び出してからtransform()
を呼びださなければならないのでしょうか。
もしそうなら、fit_transform()
した状態を保存しておき新しい対象に対してはfit_transform()
を省略することはできるでしょうか。