タイトルの通りです
Sentencepieceをmodel_type=bpeで訓練を行いました。
corpus.txtはプロによる校正済みの日本語文書です。一行あたりに一文が書かれています。
文章の総数は約200,000文です。

import sentencepiece as spm
spm.SentencePieceTrainer.Train('--input=corpus.txt --model_prefix=index --vocab_size=32000 --model_type=bpe --max_sentence_length=200000 --character_coverage=1.0')
sp = spm.SentencePieceProcessor()
sp.Load("index.model")
sp.EncodeAsIds("総務省は地方自治体に向けて改善案を提出した。") #著作権の都合により適当な文章を入力としています
sp.EncodeAsPieces("総務省は地方自治体に向けて改善案を提出した。")

訓練に使用した一部をIDに変換したところ以下のようにUNKを指すIDが発生しました。

[12667, 28077, 15866, 25464, 0, 21805, 0, 19801, 21301, 27760, 0, 23969, 0, 31770, 19800, 0]
['▁', '総', '務', '省', 'は地方', '自', '治体に向け', 'て', '改', '善', '案を', '提', '出', 'し', 'た', '。']

UNKを発生しないようにするにはどのような処理が必要でしょうか。

追記:
sentencepieceのversionを確認したところ0.1.83でした