Kandoの日記: R言語: メモ「lm関数のweight引数」
日記 by
Kando
「Rによるデータサイエンス」(金明哲、森北出版)の7章136ページにweight引数は「説明変数に重みを与える」とあって「説明変数に重みを指定する」と言われると「どの説明変数に」の意味に読めるので???と混乱したが、ちゃんとRのオンラインヘルプ(英語)を当たると重み付き最小二乗法でフィッティングをやる際に「どのデータに」重みを付けるかということであったらしい。わかってみれば当たり前ではあるのだが・・・。
というわけでデータ(観測値)に繰り返しがある場合、シミュレーションからのデータの収集を集めたデータの平均値と標準偏差が収束したところで打ち切っていて条件ごとにサンプル数が不ぞろいである場合にどうするかという問題は重みづけで解決できそう。
----
例えば目的変数1説明変数2のモデルを仮定している時
繰り返し2回づつ3組で合計6個のデータが本来あるとして
仮に最終組のデータで2つの値が同じだからと1個サボって合計データが5個になっている時は
1/6, 1/6, 1/6,1/6, 2/6
のように重みを付ければよいと。
R言語: メモ「lm関数のweight引数」 More ログイン