Rを用いたデータの整理と生成
time data
1 67
2 39
2000 45
time.csvというデータが有りますが(下参照)、2つ実現できないことがあって困っています。
1,R上で1~1500まで切り取って新しいデータセットを作る。
2,すでに推定の終わっているモデルを用いてdataの隣にpredictのデータを並べる。
(例) predict=3+time*1.4
一応いろいろ試してはいますがうまく行きません。
下のコードだとエラーが出てしまいます。
data <-read.csv("time.csv",header=TRUE)
pre<-data.frame(time=1:1500,data=data,predict=3+time*1.4)
EXCELだと簡単ですがRだとパッケージ分析ばかりやっていてクリーニングはEXCELにやらせていましたが、データが大きくなったり複雑になるとRのほうが楽だと思い今回質問させていただきました。RstudioやパッケージでSQLを使うという手もあるかと思いましたがRを用いる方向でお願い致します。
結果
1の方でとりあえずやってみましたが、
data <-read.csv("time.csv", header=TRUE)
pre<-data.frame(jikan=data$time[1:1000,],deeta=data$data[1:1000,])
Error in data$data[1:1000,]: incorrect number of dimensions
のようなエラーが出てしまいます。元データを見てもずれはないようですし、timeがintでdataがnumだったのをどちらもnumに揃えてもエラーが変わりません。
どこに問題があるのでしょうか?
結果2
> pre<-data.frame(jikan=data$time[1:1000],deeta=data$data[1:1000])
Error in data.frame(jikan = data$time[1:1000], deeta = data$data[1:1000]) :
引数に異なる列数のデータフレームが含まれています: 0, 1000
と今度はエラーが出ました。どのように対処すればよろしいでしょうか。
追記
> head(data,n=10)
time data
1 1 7.8
2 2 5.6
3 3 5.1
4 4 7.3
5 5 10.8
6 6 6.2
7 7 5.2
8 8 5.5
9 9 5.7
10 10 6.3
です。