正規表現を用いた、不規則な文字列からの数値の抽出
「徒歩分数」と「電車の乗車時間」が混在したデータがあります。
徒歩分数のみを取り出して、それ以外は欠損値とする、
新たなデータを作成したいと考えています。
y: [4, NaN, 5]
現在は「分」を取り除く所までですが、以下のようになっています。
どなたか、ご教示頂けるとありがたいです。
import pandas as pd
import numpy as np
df = pd.DataFrame(
{'x': ['徒歩4分', '2駅12分', '約5分']},
index=[1, 2, 3])
df["walk_time"] = df.x.str.extract(r'(\d*)分')