Python やそのほかのプログラミング言語、プラットフォームで、Shift_JIS っぽい日本語のデータをデコードするのに失敗した人たちが、文字エンコーディングとして Shift_JISX0213 や Shift_JIS-2004 を指定すると読める、というノウハウを公開しています。

しかしもし Windows 由来のデータを Shift_JIS X 0213 系の文字コードとして読んでしまうとバックスラッシュ \ 0x5c, たちさき 0xfa0xb1, はしごだか 0xfb0xfc がそれぞれ ¥ U+00A5, , に文字化けします。

自分のブログに、その文字コードを使うのはほぼ誤解であり、正しくは cp932 (ms932) であると書いた のですが、はっきりさせたくなりました。

実際に誤解ではなく Shift_JIS X 0213 系の文字コードを使うシステムはあるのでしょうか? ブラウザはほぼ対応していないです。

2010年の本『プログラマのための文字コード技術入門』(矢野啓介)では適した用途として

Shift_JIS-2004 は Shift_JIS の資産と互換性を保ちつつ JIS X 0213 に対応するのに適した符号化方式です。(…中略…)今後は、Shift_JIS というときにもっぱら Shift_JIS-2004 を用いるという手もあります。

と、可能性が示唆されている感じでした。