PythonでMicrosoftWordの.doc形式のファイルからテキストを抽出する方法
お世話になります。
PythonでWord文章の表部分を取り出して、CSVで保存するツールを作ろうとしています。
そこで、その前段階として、Wordから文章を取得して、テキストファイルに変換しようとしています。
とりあえず、python-docxライブラリでできそうなことはわかったのですが、.docxのファイルは読み込めますが、.doc形式のファイルが読み込めずに困っています。
また、COMを使う方法もあるようですが、Wordがインストールされていないと利用できないと思われるため、除外しています。
何か良い方法はないでしょうか。
なお、対象OSはWindowsとし、MacOSやLinuxは除外します。
また、Pythonのバージョンは3.7系を利用します。
それから、できれば外部の実行ファイル(.exeファイル)を呼び出す方法ではなく、Python単体で実装することができれば助かります。
以上、何かアドバイスを頂けると幸いです。よろしくお願いいたします。