scikit-learnの2クラス分類におけるしきい値について
scikit-learnを利用して2クラス分類をしています。
pred_proba(X)を利用すると、
クラスの所属確率がわかるかと思います。
ここで、ROC曲線などから今回のタスクにおける最適なしきい値が0.3と判明したとします。
その時にあるサンプルXをpred_proba(X)にかけると、
[0.2, 0.8]が出力された際には、しきい値0.3を超えてるので1が正解になると思います。
しきい値が0.5の時は、出力された値がそのまま所属確率だったと思いますが、
しきい値を変更した場合の、そのクラスだと考えた確率はどのように計算したらよいでしょうか。
よろしくお願いいたします。