ここでは,統計ソフトstataにおける前処理,id(連番)の振り方について解説します。また,グループ毎の連番の振り方も見ていきます。
データをパネル認識させる際にはxtsetなどで個体識別番号と時間番号のどちらも必要としますが,時間番号についてこれが連番ではない(たとえば,営業日で休日祝日が抜けている)場合に,一度連番を振り直して認識させ直すとデータに欠損が出にくいです。
単純に一番上のサンプルから順に
1
2
3
・・・・
のようなid(連番)を振る場合は,
gen id(任意の変数名) = _n
でできます。
さらに,
個体識別番号 | year |
1 | 2020 |
1 | 2021 |
2 | 2020 |
2 | 2022 |
のように,個体識別番号毎(グループ毎に連番を振る場合),
bysort 個体識別番号: gen id = _n
で下記のようにグループ毎にid(連番)をふることができます。
個体識別番号 | year | id |
1 | 2020 | 1 |
1 | 2021 | 2 |
2 | 2020 | 1 |
2 | 2022 | 2 |
注意点としては,_nでは単純に上から順に番号が振られるため,おそらく事前に
sort 個体識別番号 year
などで順番を整えてから行わないと酷いことになるのでお気を付けください。
また,連番を作成するコマンドとしては他にも
seq()
があります。
株式リターンのような日次データを扱う際に便利なので是非使ってみてください。