Wordで文書内の文字をUnicode NFC正規化する方法
Microsoft Wordで文書内の文字をUnicode NFC正規化する簡単な方法はないでしょうか。Emacsでいうと ucs-normalize-NFC-region
のような機能をイメージしています。
macOS上で作られたテキストやWord形式などの文書の内容では、かなの濁点や半濁点の扱いとして、結合文字列と合成済み文字が混在していることがしばしばあります。おそらくアプリケーション間でコピー&ペーストしたときの挙動の違いによるものではないかと想像しています。このままだと検索などで不都合があるので、NFC正規化をしたいというのがやりたいことです。
なお、Word文書の書式を維持するというのは必須条件です。また、ここで言っているのは文書の内容のことであり、ファイル名のことではありません。