Top | Profile | R | Intro to R | Workshop | Statistics | TeX

 

Top > 無料統計ソフトRで心理学 > R雑記1-8: 海外でのRの普及状況〜メタ分析

無料統計ソフトRで心理学

R雑記1-8: 海外でのRの普及状況〜メタ分析

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1. 海外でのRの普及状況

心理学でもRを使った学術論文が増えつつあります。Journal of Abnormal Psychologyで特に多いです。Taxometricという統計手法を利用しているケースが多いです(私も学会発表で使っている)。

 

 

2. データマイニング

データマイニングは心理学ではあまり使われないが,標本サイズが大きいケースでは有効です。 無料のソフトウェアではWEKAという有名なソフトがあります。Rでは,Association Ruleのpackageが最近発表されました(arules)。もちろん,決定木や自己組織化マップは昔からできます。

 

 

3. コンジョイント分析

Conjoint分析のpackageは多分存在しないが,他のpackageを利用すれば,分析することはできます。しかし,数理的側面をかなり知る必要がありそうです。ordered probit model と conjoint analysis の両者を扱った分かりやすいデータ付きの教科書があれば助かるのだが。。。

コンジョイント分析の教科書は,「理論家向け」と「ユーザー向け」の格差が高い気がしてならない。「ユーザー向け」の教科書は,日本語でも多数あるが,プログラムを書くレベルでは記載されていません。一方,「理論家向け」の教科書は,私程度(高校数学をかじっている程度)では理解できなく,データも付いていません。

内容的な不足は感じられるが,Sas Technical Report R-109 はユーザーにとって良い教科書だとは思います。(1) データ付き,(2) プログラムを書ける程度の数式と理論,(3) プログラム付き,と重要な3点を押さえています。


4. 欠損値処理

心理学の人に「Rを使いたい」と思わせるポイントは欠損値処理にあると思います。Rは,欠損値処理のpackageが豊富です(多すぎる)。もちろん,EMアルゴリズムや多重代入法を使えます。有名なソフトウェアの,NORMMICEが移植されていることは,論文を書く上でも不都合が少ないと思います。


 

5. 効果量

心理学研究でRを使う上で,不満を挙げるとすれば効果量の計算をするpackageが十分ではないことでしょう。もっとも,計算方法自体は簡単なので,自作可能なのだが。。。

注) library(MBESS) の登場で状況改善中です (2006/8/23追記)
注) 状況改善の一助を願い,library(rpsychi) の開発をしました (2010/4/29追記)

6. 潜在変数を仮定するモデル

心理学研究で頻出する,因子分析や構造方程式モデルは,どうしてもRでやる気がしません。
忍者ハットリ君という無料のソフトウェアと,Mplusという結構な額のソフトウェアの使い勝手が良過ぎるのが原因です。もしも,Rでこれらの分析をやる時が来るとすれば,平行分析・カテゴリカルデータの分析が対応されることが条件となると思います(部分的に既に実装されていますが)。

このようなプログラムをRから利用する方法もありますので,
詳しくは,Rによる外部プログラムの利用をご参考下さい (2007/6/29)。

 

7. Rの教育

UCLAの"Stat Consulting Support Policies for R"は,的を得た指摘な気もするが, 不満も沸きます。"(R) It emphasizes power over ease of use."とあるが,果たしてそうでしょうか。

例えば,SAS/IMLは,Rでやると簡単な処理が,かなり面倒なときがあります(さらに,IMLの学習資料は英語中心なので大変)。また,"While R is free of charge in terms of dollars, it can be more costly than other packages in terms of time to learn and time to solve problems." とあるが,人生で1度しかデータ解析しないのならば,この立場は納得できます。
しかし,学ぶ立場から長い目で見ると,「オリジナル関数を書く手間が楽」「どこでも使える」というメリットを重視したいです。

それに,学習/問題解決コストの大きさは,説明する教科書に拠って,大きく変わると思います。
良いことに,最近は,読みやすいRの書籍は増えてきています。

もっとも,教科書を読むコストすら惜しいという人は,データ解析などしない方が良いと思いますが…


8. メタ分析

メタ・アナリシスは,Rでは2つのpackageが発表されています(meta, rmeta)。meta packageの方が優れているようです。もっとも,計算方法は簡単なので,自作可能ですが。。。

しかし,計算が簡単と言っても,メタ分析が日本の心理学領域に普及するには,4つの理由から時間を要すると思います。

第1に,文献検索データベースが欧米のものに比べて貧弱である。
第2に,追試が少ない。
第3に,データベース構築の莫大な手間が大変である。
第4に,RCTが少ない。

特に,(欧米でも状況は変わらないはずだが)3番目の理由は,切実です。メタ分析をする以上,大量の論文をコード化する必要があります。コード化した結果を系統的に蓄積するためには,研究目的に合ったデータベースを研究者が「自作」する必要が生じます。そのため,例えば,MS Accessなどの比較的簡単なデータベースなどを利用して,コード化専用のデータベースを作成する必要が生じます。

しかし,データベース作成は,表計算ソフトなどと違い取っ付き難いので,ハードルが高い研究領域だと言えそうです。

そんなことを考えていると,現状で最も効率的に知見を蓄積する現実的な方法は,メタ分析ではなく,データアーカイブ(e.g., ICPSR)の作成ではないかと思い始めました。研究プロトコル,生データ,変数リスト,質問票の4点を提出しなければ学会にも出れないようにすれば,かなり理想的な環境が作成できる気がします(夢想だが)。

目次: R雑記

Rや統計学に関して,研究者として思うことを書いています。

  1. 海外でのRの普及状況
  2. データマイニング
  3. コンジョイント分析
  4. 欠損値処理
  5. 効果量
  6. 潜在変数を仮定するモデル
  7. Rの教育
  8. メタ分析
  9. 心理学におけるRの普及
  10. 2005年度の普及
  11. Rを薦める・薦めない
  12. 心理学におけるRの普及II
  13. 教科書,マニュアルを読むこと
  14. 2006年度の普及
  15. 統計学 (R) の勉強会
  16. 反R派・信仰派?
  17. Rと論文
  18. How to 学習
  19. 統計ユーザーとしての基準
  20. RとOS/ブラウザ
  21. 2007年度の普及
  22. 初学者が陥りやすい罠
  23. Rを薦める・薦めないII
  24. 心理学におけるRの普及III
  25. キャリアパスと統計学
  26. 医学における検定力,効果量,区間推定
  27. 精神科領域のためのRパッケージ
  28. Rによる論文の審査/印刷期間の管理図
  29. 精神科領域におけるデータ解析環境Rの使用論文
  30. 統計学 (R) の勉強会 (研究会) II
  31. ポスドク問題と統計学
  32. 5年後のあなたへ
  33. データサイエンティスト一考
 

What's New

   
 

目次: 無料統計ソフトRで心理学

勉強会

練習

関数の調べ方

雑多な知識

  1. テキストエディタを使用する
  2. 潜在変数を扱うモデルはRでは,今のところ使わないでおこう
  3. Rを学習する意義とデメリット
  4. Rを学習する前に…
  5. 「Rは大変だから勉強しないでおこう」と思う前に…
  6. Rによる関数の作り方
  7. Rによるシミュレーション

R雑記

  1. 海外でのRの普及状況
  2. データマイニング
  3. コンジョイント分析
  4. 欠損値処理
  5. 効果量
  6. 潜在変数を仮定するモデル
  7. Rの教育
  8. メタ分析
  9. 心理学におけるRの普及
  10. 2005年度の普及
  11. Rを薦める・薦めない
  12. 心理学におけるRの普及II
  13. 教科書,マニュアルを読むこと
  14. 2006年度の普及
  15. 統計学 (R) の勉強会
  16. 反R派・信仰派?
  17. Rと論文
  18. How to 学習
  19. 統計ユーザーとしての基準
  20. RとOS/ブラウザ
  21. 2007年度の普及
  22. 初学者が陥りやすい罠
  23. Rを薦める・薦めないII
  24. 心理学におけるRの普及III
  25. キャリアパスと統計学
  26. 医学における検定力,効果量,区間推定
  27. 精神科領域のためのRパッケージ
  28. Rによる論文の審査/印刷期間の管理図
  29. 精神科領域におけるデータ解析環境Rの使用論文
  30. 統計学 (R) の勉強会 (研究会) II
  31. ポスドク問題と統計学
  32. 5年後のあなたへ
  33. データサイエンティスト一考

リンク集

 

 

 

 

 

 

 

 

 

 

 

 

 
 

著者: 奥村泰之 (Curriculum Vitae)
所属: 一般社団法人 臨床疫学研究推進機構 代表理事
e-mail: yokumura @ blue.zero.jp
Researchmap: http://researchmap.jp/yokumura/
ResearchGate: https://www.researchgate.net/profile/Yasuyuki_Okumura/
Google Scholar: http://scholar.google.com/citations?hl=en&user=c9qyzRkAAAAJ
facebook: http://facebook.com/okumura.yasuyuki
Twitter: http://twitter.com/yachu93