Top | Profile | R | Intro to R | Workshop | Statistics | TeX

 

Top > 無料統計ソフトRで心理学 > R雑記19-22: 統計ユーザーとしての基準〜初学者が陥りやすい罠

無料統計ソフトRで心理学

R雑記19-22: 統計ユーザーとしての基準〜初学者が陥りやすい罠

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

19. 統計ユーザーとしての基準 (2007/10/24)

10月と11月は,毎年,学位を取得するために,統計学について色々と調べる学生が多い時期です。必然的に,色々とご質問を受けることが多くなってしまう時期なのですが,色々と,悩ましい場面に遭遇することが多いです。

根本的には,「心理学におけるRの普及II」に記載したように,competency guidelineが作成されていないことが原因だと思っていますので,現在の私には,対処することが難しいのが現状です。

たとえば,下記のような質問を最近受けたことがあります。

  • 「因子分析の母数推定法は,主因子法が主流だと思っていたのですが,だめですか (直す時間はありません)」
  • 「重回帰分析の繰り返しによるパス解析を行っているのですが,今から構造方程式モデルを覚える時間的余裕はありません」
  • 「実験を行う際の,標本サイズの設定を,1セル20人としましたが,それで何か問題がありますか」
  • 「大量の交互作用を考えた仮説なのですが,どのように検定すれば良いかわかりません」
  • 「従属変数の得点可能範囲が3点しかないものに,分散分析しても良いのでしょうか」

このような質問をされた場合,まず最初に悩むことは,「どこまで,統計手法を追求するべきか」ということです。「査読付きの学術誌に受理されるレベル」を基準とした場合,多少,統計的な事実と異なった分析 (ある意味,誤った分析) をしていようが,学術誌を選べば受理されます。また,多少基準を厳しくして,「APAの投稿要綱が主張している規定を満たすと言う観点から基準を決める」とした場合でも,多くの多変量解析には,APAの規定がないという問題があります。そして,基準を決めずに意欲的に,統計的な事実を追求すればするほど,ユーザーの負担は増え,論文を書く際にも,詳細な統計的説明をユーザーが記載しなければならないという現象が生じてしまいます

私自身は,「統計学は独習できないといふけれど…」に記載するように,数多くの分析手法の説明とガイドラインを読むことで,時間の許す限り,その時点で知るベスト・メソッドを使おうとしています。しかし,この方法は,ユーザーとしては負担がかなり大きいことは,実感しています。

特に,Rという統計ソフトは,最新の統計手法を搭載している場合が多いため,当該領域で利用されている,オーソドックスな方法とは全く異なる手法を採用しているケースも見受けられます。「どのレベルまで,ユーザーは,統計学の学習をする必要があるのか」という問題は,答えが存在しない問いだと思いつつ,一定のラインがあれば,どんなに便利になるのだろうかと思っている昨今です。統計学を,追求すれば追求するほど,多くの人が知らない分析手法になるため,多くの人が評価不可能な分析手法になってしまいます。このジレンマは,永遠の課題かもしれませんが,解決の糸口が掴めれば助かります。



20. RとOS/ブラウザ (2007/11/9, 2010/4/29更新)

最近,Rを紹介する,書籍やホームページが増えてきました。このようなユーザーの敷居が低くなるような現象は,初学者にとって,良いことかと思います。

書籍やホームページで,Rというソフトウェアを紹介する方は,まず,どのようなユーザーを対象としているかを気にしています。具体的には,OSは何か,ブラウザは何かといった情報です。このような,情報を知らない限り,適切な情報提示をすることが難しいからです。

そのような方の一助になることを願い,本ホームページをご覧になる方の過去1000アクセスログ情報を掲載します。

まず,OSは,Windows 7 11.5%, Windows Vista 26.2%, Windows XP 44.6%,Winxows (バージョン不明) 8.2%, Intel Mac OS X (5.9%) という順になっています。つまり,Windows系が全体の90%以上を占めます。次に,ブラウザは,Internet Explore 60.5%,Mozilla 23.8%というような数値となっています。もちろん,このHPをご覧になっている方の情報ですので,私の環境に似た人 (OS = Windows XP/Vista; ブラウザ = Internet Explore) が多いかもしれません。しかし,質的情報 (私の周囲の方の環境を観察した結果) を参考にしても,おそらく,この知見は,バイアスの少ないものかと思います。

一人の人間が,マルチプラットフォームに対応するよう説明すると言うことは,多大な労力を消費してしまいますので,まずは,マスであるWindows + Internet Explore という多くの方のOS/ブラウザ環境に合致した情報提供を試みることが効率性に繋がるかと思います。

もちろん,PCのハードユーザーは,LINUX系を利用することを推奨することは,私程度でも認知しております。しかし,おそらく,多くのWindowsユーザーは,OSを乗り換えるという大作業をすることは好みません。そのような事情から,私は,あくまで,マスを対象とするという,知識がないなりの対処をしているつもりであります。

Windowsユーザーを対象とする際,そもそも,OSに対する知識など,Rに直接は関連しない情報もR習得には重要となってきてしまいます。「Rを学習する前に…」に記載しているような情報は,このような事情から掲載しております。

 

 

21. 2007年度の普及 (2007/12/15)

以下のグラフは2007年12月15日現在の,当ページのアクセス集計です。○は今年,△は去年,+は一昨年前のデータを示しています。今年のデータは,残念ながら,1月から9月のものを不手際で消去してしまったので,欠損となっています。
残りの3ヶ月のデータを去年と比較すると,去年とほとんどコンテンツの変化がないにもかかわらず,月間アクセス平均は,454件上昇しています。

このようなアクセスが増えてきている最大の要因は,和書のR本が,すでに20冊を超えるという情報の蓄積の結果だと思います。私の周囲の人々を観察していると,やはり,Rの利用率は5%程度ですが,Rの存在自体を知らない方は,大分減ってきたようです。統計ソフトを乗り換えるという作業は,結構な労力を要します。特にRは,CUI中心のソフトウェアですので,労力を要することになります。John Fox は学部学生には,GUI中心のRcmdrを教え,大学院生にはCUI中心で教えているそうです。その意味でも,R Commanderハンドブック―A Basic-Statistics GUI for RRとRコマンダーではじめる多変量解析の2冊が発刊されたことは,敷居を低める作業に多大な貢献をされていることになるかと思います。



22. 初学者が陥りやすい罠 (2008/2/15)

Rの話題と少しズレますが,修士課程の方から,以下のような発言を聞いたことがあります.

A氏:「私は分散分析ぐらいしか使わないから,あまり統計学を勉強する必要がないのです」

私は,分散分析は,とても難しい分析手法だと思っておりますので,この発言は,とても受け入れがたい内容です。

  • 「母数モデル,変量モデル,混合モデルの違い」
  • 「分散分析の多くのモデルの,効果量とその信頼区間の算出」
  • 「分散分析の多くのモデルの,検出力の算出法」
  • 「数多くの多重比較の使い分け」

を理解することは,少なくとも私が知っている限り,1-2冊の教科書では対応できない範囲です。かく言う私自身,未だに,もっとも単純な「母数モデル1元配置」という条件だけで,上記の内容を理解して,使えるという情けないレベルです。

このような発言を平気で恥ずかしげもなくできるということは,論文を執筆する効率性を考えると,良いことかもしれません。ここで,初学者が陥りやすい罠は,「私が知っている範囲は,必要十分である」という思いこみでしょう。

統計学の世界は,膨大です。1つの分析手法だけを集中して勉強したとしても,膨大すぎて,一人の人間が知ることのできる内容は,限られてしまうということは,致し方ない事実かとは思います。しかし,少しでも自分が知っている範囲は狭いと言うことを認識し,少しでも,知っている範囲を広げるという誠実な努力は,とても重要なことかと思います。

 

目次: R雑記

Rや統計学に関して,研究者として思うことを書いています。

  1. 海外でのRの普及状況
  2. データマイニング
  3. コンジョイント分析
  4. 欠損値処理
  5. 効果量
  6. 潜在変数を仮定するモデル
  7. Rの教育
  8. メタ分析
  9. 心理学におけるRの普及
  10. 2005年度の普及
  11. Rを薦める・薦めない
  12. 心理学におけるRの普及II
  13. 教科書,マニュアルを読むこと
  14. 2006年度の普及
  15. 統計学 (R) の勉強会
  16. 反R派・信仰派?
  17. Rと論文
  18. How to 学習
  19. 統計ユーザーとしての基準
  20. RとOS/ブラウザ
  21. 2007年度の普及
  22. 初学者が陥りやすい罠
  23. Rを薦める・薦めないII
  24. 心理学におけるRの普及III
  25. キャリアパスと統計学
  26. 医学における検定力,効果量,区間推定
  27. 精神科領域のためのRパッケージ
  28. Rによる論文の審査/印刷期間の管理図
  29. 精神科領域におけるデータ解析環境Rの使用論文
  30. 統計学 (R) の勉強会 (研究会) II
  31. ポスドク問題と統計学
  32. 5年後のあなたへ
  33. データサイエンティスト一考
 

What's New

   
 

目次: 無料統計ソフトRで心理学

勉強会

練習

関数の調べ方

雑多な知識

  1. テキストエディタを使用する
  2. 潜在変数を扱うモデルはRでは,今のところ使わないでおこう
  3. Rを学習する意義とデメリット
  4. Rを学習する前に…
  5. 「Rは大変だから勉強しないでおこう」と思う前に…
  6. Rによる関数の作り方
  7. Rによるシミュレーション

R雑記

  1. 海外でのRの普及状況
  2. データマイニング
  3. コンジョイント分析
  4. 欠損値処理
  5. 効果量
  6. 潜在変数を仮定するモデル
  7. Rの教育
  8. メタ分析
  9. 心理学におけるRの普及
  10. 2005年度の普及
  11. Rを薦める・薦めない
  12. 心理学におけるRの普及II
  13. 教科書,マニュアルを読むこと
  14. 2006年度の普及
  15. 統計学 (R) の勉強会
  16. 反R派・信仰派?
  17. Rと論文
  18. How to 学習
  19. 統計ユーザーとしての基準
  20. RとOS/ブラウザ
  21. 2007年度の普及
  22. 初学者が陥りやすい罠
  23. Rを薦める・薦めないII
  24. 心理学におけるRの普及III
  25. キャリアパスと統計学
  26. 医学における検定力,効果量,区間推定
  27. 精神科領域のためのRパッケージ
  28. Rによる論文の審査/印刷期間の管理図
  29. 精神科領域におけるデータ解析環境Rの使用論文
  30. 統計学 (R) の勉強会 (研究会) II
  31. ポスドク問題と統計学
  32. 5年後のあなたへ
  33. データサイエンティスト一考

リンク集

 

 

 

 

 

 

 

 

 

 

 

 

 
 

著者: 奥村泰之 (Curriculum Vitae)
所属: 公益財団法人 東京都医学総合研究所 精神行動医学研究分野 心の健康プロジェクト 主席研究員
e-mail: yokumura @ blue.zero.jp
Researchmap: http://researchmap.jp/yokumura/
ResearchGate: https://www.researchgate.net/profile/Yasuyuki_Okumura/
Google Scholar: http://scholar.google.com/citations?hl=en&user=c9qyzRkAAAAJ
facebook: http://facebook.com/okumura.yasuyuki
Twitter: http://twitter.com/yachu93