rubyの正規表現を扱う際の文字セットについて
rubyの正規表現を扱う際の挙動についてよくわからないことがあります。
HTMLのパースをしているのですが、
Regexp.new("スタックオーバーフロー")
=> /スタックオーバーフロー/
Regexp.new("<h1>スタックオーバーフロー</h1>")
=> /<h1>\u30B9\u30BF\u30C3\u30AF\u30AA\u30FC\u30D0\u30FC\u30D5\u30ED\u30FC<\/h1>/
というような、上はUTF-8そのままで正規表現化できるのですが下の場合はunicodeがそのまま出てきてしまうという動きになっており、なぜこのようになるのかわかりません。
理想としては
=> /<h1>スタックオーバーフロー<\/h1>/
という正規表現がほしいのですが、どのようにすればよいでしょうか?
あまり文字コードや文字セットなどに詳しくないので見当ハズレなことを聞いているのかもしれませんが、よろしくお願いします。