|
|||||||||||||
Top > 無料統計ソフトRで心理学 > R雑記19-22: 統計ユーザーとしての基準〜初学者が陥りやすい罠 無料統計ソフトRで心理学 R雑記19-22: 統計ユーザーとしての基準〜初学者が陥りやすい罠 |
|||||||||||||
|
10月と11月は,毎年,学位を取得するために,統計学について色々と調べる学生が多い時期です。必然的に,色々とご質問を受けることが多くなってしまう時期なのですが,色々と,悩ましい場面に遭遇することが多いです。 根本的には,「心理学におけるRの普及II」に記載したように,competency guidelineが作成されていないことが原因だと思っていますので,現在の私には,対処することが難しいのが現状です。 たとえば,下記のような質問を最近受けたことがあります。
このような質問をされた場合,まず最初に悩むことは,「どこまで,統計手法を追求するべきか」ということです。「査読付きの学術誌に受理されるレベル」を基準とした場合,多少,統計的な事実と異なった分析 (ある意味,誤った分析) をしていようが,学術誌を選べば受理されます。また,多少基準を厳しくして,「APAの投稿要綱が主張している規定を満たすと言う観点から基準を決める」とした場合でも,多くの多変量解析には,APAの規定がないという問題があります。そして,基準を決めずに意欲的に,統計的な事実を追求すればするほど,ユーザーの負担は増え,論文を書く際にも,詳細な統計的説明をユーザーが記載しなければならないという現象が生じてしまいます。 私自身は,「統計学は独習できないといふけれど…」に記載するように,数多くの分析手法の説明とガイドラインを読むことで,時間の許す限り,その時点で知るベスト・メソッドを使おうとしています。しかし,この方法は,ユーザーとしては負担がかなり大きいことは,実感しています。 特に,Rという統計ソフトは,最新の統計手法を搭載している場合が多いため,当該領域で利用されている,オーソドックスな方法とは全く異なる手法を採用しているケースも見受けられます。「どのレベルまで,ユーザーは,統計学の学習をする必要があるのか」という問題は,答えが存在しない問いだと思いつつ,一定のラインがあれば,どんなに便利になるのだろうかと思っている昨今です。統計学を,追求すれば追求するほど,多くの人が知らない分析手法になるため,多くの人が評価不可能な分析手法になってしまいます。このジレンマは,永遠の課題かもしれませんが,解決の糸口が掴めれば助かります。
20. RとOS/ブラウザ (2007/11/9, 2010/4/29更新) 最近,Rを紹介する,書籍やホームページが増えてきました。このようなユーザーの敷居が低くなるような現象は,初学者にとって,良いことかと思います。 書籍やホームページで,Rというソフトウェアを紹介する方は,まず,どのようなユーザーを対象としているかを気にしています。具体的には,OSは何か,ブラウザは何かといった情報です。このような,情報を知らない限り,適切な情報提示をすることが難しいからです。 そのような方の一助になることを願い,本ホームページをご覧になる方の過去1000アクセスログ情報を掲載します。 まず,OSは,Windows 7 11.5%, Windows Vista 26.2%, Windows XP 44.6%,Winxows (バージョン不明) 8.2%, Intel Mac OS X (5.9%) という順になっています。つまり,Windows系が全体の90%以上を占めます。次に,ブラウザは,Internet Explore 60.5%,Mozilla 23.8%というような数値となっています。もちろん,このHPをご覧になっている方の情報ですので,私の環境に似た人 (OS = Windows XP/Vista; ブラウザ = Internet Explore) が多いかもしれません。しかし,質的情報 (私の周囲の方の環境を観察した結果) を参考にしても,おそらく,この知見は,バイアスの少ないものかと思います。 一人の人間が,マルチプラットフォームに対応するよう説明すると言うことは,多大な労力を消費してしまいますので,まずは,マスであるWindows + Internet Explore という多くの方のOS/ブラウザ環境に合致した情報提供を試みることが効率性に繋がるかと思います。 もちろん,PCのハードユーザーは,LINUX系を利用することを推奨することは,私程度でも認知しております。しかし,おそらく,多くのWindowsユーザーは,OSを乗り換えるという大作業をすることは好みません。そのような事情から,私は,あくまで,マスを対象とするという,知識がないなりの対処をしているつもりであります。 Windowsユーザーを対象とする際,そもそも,OSに対する知識など,Rに直接は関連しない情報もR習得には重要となってきてしまいます。「Rを学習する前に…」に記載しているような情報は,このような事情から掲載しております。
以下のグラフは2007年12月15日現在の,当ページのアクセス集計です。○は今年,△は去年,+は一昨年前のデータを示しています。今年のデータは,残念ながら,1月から9月のものを不手際で消去してしまったので,欠損となっています。 このようなアクセスが増えてきている最大の要因は,和書のR本が,すでに20冊を超えるという情報の蓄積の結果だと思います。私の周囲の人々を観察していると,やはり,Rの利用率は5%程度ですが,Rの存在自体を知らない方は,大分減ってきたようです。統計ソフトを乗り換えるという作業は,結構な労力を要します。特にRは,CUI中心のソフトウェアですので,労力を要することになります。John
Fox は学部学生には,GUI中心のRcmdrを教え,大学院生にはCUI中心で教えているそうです。その意味でも,R
Commanderハンドブック―A Basic-Statistics GUI for R,RとRコマンダーではじめる多変量解析の2冊が発刊されたことは,敷居を低める作業に多大な貢献をされていることになるかと思います。
Rの話題と少しズレますが,修士課程の方から,以下のような発言を聞いたことがあります. A氏:「私は分散分析ぐらいしか使わないから,あまり統計学を勉強する必要がないのです」
を理解することは,少なくとも私が知っている限り,1-2冊の教科書では対応できない範囲です。かく言う私自身,未だに,もっとも単純な「母数モデル1元配置」という条件だけで,上記の内容を理解して,使えるという情けないレベルです。 統計学の世界は,膨大です。1つの分析手法だけを集中して勉強したとしても,膨大すぎて,一人の人間が知ることのできる内容は,限られてしまうということは,致し方ない事実かとは思います。しかし,少しでも自分が知っている範囲は狭いと言うことを認識し,少しでも,知っている範囲を広げるという誠実な努力は,とても重要なことかと思います。
|
|
|||||||||||
|