OCRするときの湾曲ノイズ線の削除方法
OCRをかける際になんらかの要因でノイズが入ったとします。
直線に近いものであればハフ変換抽出で削除することができます。
↓このような削除する方法もあります。
http://www.morethantechnical.com/2015/02/05/using-hidden-markov-models-for-staff-line-removal-in-omr-wcode/
文字とノイズの黒の濃さが異なれば二値化で飛ばせますし、
文字とノイズの線の太さが異なれば膨張・収縮でもいけそうですが
以下のような
①濃さが同じ
②太さも同じ
③湾曲している
ノイズ線を削除することは可能でしょうか?
ノイズ入ったままOCRの学習モデルをつくればよい、
というのもありますが現実的には難しいと考えておりまして
何かロジックで解決できないか質問させてください。
最終的な補正した結果のイメージ画像は以下になります。