У меня есть кадр данных, который состоит из первого столбца (experiment.id), а остальные столбцы - значения, связанные с этим идентификатором эксперимента. Каждая строка является уникальным идентификатором эксперимента. В моем кадре данных есть столбцы порядка 10⁴ - 10⁵.
data.frame(experiment.id=1:100, v1=rnorm(100,1,2),v2=rnorm(100,-1,2) )
Этот кадр данных является источником моего пространства выборки. То, что я хотел бы сделать, - это для каждого уникального эксперимента. (Строка) случайным образом выборка (с заменой) одного из значений v1, v2, ...., v10000, связанных с этим id, и построения образца s1. В каждом образце s1 представлены все идентификаторы эксперимента.
В конце концов я хочу выполнить 10⁴ выборок, s1, s2, ...., s 10⁴ и рассчитать некоторую статистику.
Каким будет наиболее эффективный способ (вычислительно) выполнить этот процесс выборки. Я бы хотел как можно больше избегать циклов.
Update:
My questions in not all about sampling but also storing the samples. I guess my real question is if there is a quicker way to perform the above other than
d<-data.frame(experiment.id=1:1000, replicate (10000,rnorm(1000,100,2)) )
results<-data.frame(d$experiment.id,replicate(n=10000,apply(d[,2:10001],1,function(x){sample(x,size=1,replace=T)})))