Top | Profile | R | Intro to R | Workshop | Statistics | TeX

 

Top > 無料統計ソフトRで心理学 > R雑記30-33: データサイエンティスト一考

無料統計ソフトRで心理学

R雑記30-33: データサイエンティスト一考

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

30. 統計学 (R) の勉強会 (研究会) II (2011/5/14)

先日、Tokyo.Rに参加し、Rユーザーの裾野の広がりを実感いたしました。自分でも何かできることはないかと考え、久しぶりに、論文を執筆する研究者向けの勉強会 (研究会) を開催することに致しました。

「心理・医学系研究者のためのデータ解析環境Rによる統計学の研究会」という名称にしています。この研究会では、 「データ解析環境Rを共通言語として、なるべく正しく統計学を使えるように勉強する場」を提供することを主眼としたものです。詳細は,広報用のページを御参照下さい。

31. ポスドク問題と統計学 (2011/8/27)

先日、統計学の研究会で、私の紹介をしてくれた先生が、「ポスドク問題に強い関心がある人」と紹介下さいました。
言われてみて初めて気づきましたが、「ポスドク問題」や「研究者のあり方」に関する書籍の所蔵数は20冊を超えています。。。

そういえば、修士課程の学生に統計学の講義をするとき、「統計学が必要な理由」を納得いただくために、以下のように説明をしていました。

  1. 研究者に必要な最低限の能力として
  2. 研究者の厳しい生存競争に勝ち抜くよう業績 (査読付き論文) をコンスタントに出すため


まず、統計学の知識は、研究者に必要な、最低限の能力として不可欠であると思っています。こうした点は、科学者たちの奇妙な日常科学者という仕事といった、おもしろい「研究者のあり方」に関する書籍でも指摘されております。

次に、厳しい生存競争に勝ち抜くためには、統計学の能力を高めることが有益だと思っています。コンスタントに査読付き論文を出すためにも、しっかりした研究計画のもと、統計学を活用して論文を書かなくてはいけません。

しかし「データ解析は、データを取った後に考える」という不可解な行動特性を持っている方は、とても多いのです。こうした方は、残念ながら、論文を出すときに失敗する確率 (リジェクト率) が非常に高いと思います。なぜなら、統計学の知識は、データ解析をするときだけに、必要ではないからです。

そもそも、先行研究を読む段階から統計学や研究法の知識をフル活用する必要があります。私の場合は、1つの研究の完了までに、100-300編ぐらいの査読付き論文を収集します (管理している、総所蔵論文数は3636編です)。数多くの論文を収集して、統計学や研究法の知識を使って、信頼できる先行研究を選別 (スクリーニング) して、研究計画に反映させます。スクリーニングしない限り、情報の海に流されてしまい、「信頼に足る専門知識を増やせない」からです。 このような理由により、「データ解析は、データを取った後に考える」という行動特性を持っている方は、残念ながら 「信頼に足る専門知識を基に研究計画を立てていない可能性が高い」と思います。こうした問題の解決のためには、データを取るより、ずいぶん前から、統計学の学習を始めなくてはいけません。もちろん、データ解析の時に使わない統計手法も学習しなければ、審美眼を持って先行研究を評価できません。

ポスドク問題の決定的な解決策はないとは思いますが、研究者の厳しい生存競争に勝ち抜くためにも、統計学や研究法の「継続的な学習」は一助を担うと信じています。

32. 5年後のあなたへ (2012/3/17)

「私は統計学初心者だから」「R難しい」と、かわいい発言をする修士・博士課程の学生の方々へ。

「あなた方は、研究に対して、尊大な態度を持ち、大いなる勘違いをしていると思います。『統計学やRを知らない』と言うより、『研究を知らない』と表現する方が的確です。色々な専門家と共同して研究を遂行すること、批判的吟味に基づく専門知識を増やし続けること、英語論文を生産し続けることの労力は、半端なく大変です。年間3500時間以上、研究だけに時間を投資しても、毎年1つの論文を、国際誌に出し続けることは、至難の業だと思います。一方、Rの基礎能力なんか、たかだか400時間程度、集中的に勉強すれば、獲得できます。ユーザーとしての統計学の学習は、たしかに相当な学習時間が必要ですが、自分ひとりの努力だけで獲得できる分、相当楽です。」とお伝えしたいと、常々思っています。

私は、真剣に研究のための学習を始めてから、ついに10年が経ってしまいました。研究者の世界では、10年程度のキャリアでは「駆け出し (未熟者)」と、適正に認知・評価されます。学部4年の23歳から、現在32歳、そろそろ33歳!です。5年後の私は、脳のピークを感じ、研究を主で行うのを辞めて、教育に注力し始めるかもしれません。いま修士・博士課程に在籍しているあなたは、5年後に大学や研究所などに就職する確率が高いと思います。研究所に勤めている私の立場からは、あなたがもしも、研究所に勤めるならば、以下の能力・経験を獲得していることを期待しています。(注) いろいろなタイプの研究者がいるので、「私の期待 = すべての研究所の職員の期待」という等式は成り立ちません。

  1. 学位を取得していること
  2. 国際雑誌に査読付き論文の掲載経験があること (日本の雑誌の英語論文ではありません)
  3. 論文の批判的吟味ができること (STROBE声明などの知識)
  4. 新しい超一流の英語論文を常に確認していること
  5. データハンドリング能力が高いこと (R/SQLなどで、文字列処理や条件処理などができること)
  6. 統計解析の広範な知識を有すること (自分の論文で使用したことがある統計解析しか知らないのは論外)
  7. 研究所でのアルバイトの経験を有すること (多くの研究所は、優秀な学生を常に求めています)

学生のうちに「ぼーっ」と暮らして、研究所に就職したあとに、これらの能力・経験を獲得することは、あまりお勧めできません。研究所の任期は3年程度と短いので、「目に見える業績を出すこと」の優先順位が高くなってしまうからです。だからこそ、いま、学生という研究の基礎能力向上に時間投資することが社会的に許されていて、脳がフレッシュな若いうちに、こうした能力・経験を獲得して欲しいのです。若い学生のうちに、信じられないぐらい基礎的な学習に、膨大な時間を投資して欲しいのです。

5年後のあなたと、私が一緒に研究所で働く確率は、天文学的に低いのですが。。。期待を込めて。

33. データサイエンティスト一考 (2013/7/6)

産業界では受動データの集積に伴い「データサイエンティスト」というキャッチーなフレーズが流行っています。高度なデータ解析をできる人材は貴重なので,この職種の方々は高所得者となっているようです。アカデミックな世界で生計を立てている私からは,非常に,羨ましい職種ですけれども。

心理・医学系の研究者の間でも,いわゆるデータ解析に強いヒトは存在します。データ解析に強いヒトの棲み分けは,いくつかあるように思います。

第1カテゴリとして,「プロの統計学者」がいます。こうした方々は,統計学的手法の開発や評価に関心があります。生物統計学や心理統計学などの教室で,PhDを取得しています。数理統計学への知識の深さは,尋常ではない人たちが多いように思います。

第2カテゴリとして,「統計学を活用するのプロの研究者」がいます。公衆衛生学や臨床疫学などの教室で,PhDを取得しています。統計学的手法の開発をしないけれども,統計学を非常に大事にする集団です。こうした人たちは,特定の医学領域の問題解決に関心があり,統計学の応用のレベルを,学術論文としてのAcceptabilityに合わせることに置いていることが多いように思います。私も,その末席にいるつもりです。

第3カテゴリとして,「データアナリスト」がいます。統計学的な手法の開発や評価をせず,特定の医学領域の問題解決にも関心がないけれども,統計学の活用自体に関心がある集団です。生物統計学や心理統計学の教室で,修士の学位を取得しているヒトが多いように思います。こうした人たちは,主著の論文執筆よりも,第2著者以降としてサポートすることを好むことが多いように思います。

こうしたタイプが存在していますが,もっとも大事ことは,データ解析に強くないヒトが,こうした人たちに研究の一部を委託をする際に,何を提供すればWin-Winの関係性が保てるかという点かと思います。第1カテゴリの研究者の場合,現在関心のある統計手法の開発や評価の一環で,Appliedに必要なデータセットを提供できれば,大きなメリットになると思います。第2カテゴリの研究者の場合,現在関心のある医学領域の問題解決に,主体的に関与させることができれば,大きなメリットになると思います。第3カテゴリの研究者の場合,所属機関等で統計相談業務等を本務とする役職を与えることができれば,メリットになると思います。

いずれにせよ重要なことは,専門知識の提供にあたる報酬を含めた契約を結ぶということかと思います。「共著者に入れるから統計解析の相談をしたい」「共著者に入れるから統計解析を依頼したい」と,提案をする方がいらっしゃいます。こうした御依頼を頂いたとき,光栄なことだと思いつつ,「そのような価値が,あなたの研究におありですか?」とストレートに苦言を呈したくなることは少なくありません。「共著者の基準というのは,AMAなどのAuthorshipの基準に該当すればいれるものです。XX時間を要する希少な専門知識を無償で提供するに値する価値は,共著者という役割と対価ではない」と思っています。おそらく,この信念は,タイプに寄らず共有できるかと思います。

データサイエンティストの需要が高まりますが,アカデミアでは,その対価が正当に評価されているとは言えない状況です。専門職の専門職たる評価が,少しでも向上することを願っています。

目次: R雑記

Rや統計学に関して,研究者として思うことを書いています。

  1. 海外でのRの普及状況
  2. データマイニング
  3. コンジョイント分析
  4. 欠損値処理
  5. 効果量
  6. 潜在変数を仮定するモデル
  7. Rの教育
  8. メタ分析
  9. 心理学におけるRの普及
  10. 2005年度の普及
  11. Rを薦める・薦めない
  12. 心理学におけるRの普及II
  13. 教科書,マニュアルを読むこと
  14. 2006年度の普及
  15. 統計学 (R) の勉強会
  16. 反R派・信仰派?
  17. Rと論文
  18. How to 学習
  19. 統計ユーザーとしての基準
  20. RとOS/ブラウザ
  21. 2007年度の普及
  22. 初学者が陥りやすい罠
  23. Rを薦める・薦めないII
  24. 心理学におけるRの普及III
  25. キャリアパスと統計学
  26. 医学における検定力,効果量,区間推定
  27. 精神科領域のためのRパッケージ
  28. Rによる論文の審査/印刷期間の管理図
  29. 精神科領域におけるデータ解析環境Rの使用論文
  30. 統計学 (R) の勉強会 (研究会) II
  31. ポスドク問題と統計学
  32. 5年後のあなたへ
  33. データサイエンティスト一考

 

What's New

   
 

目次: 無料統計ソフトRで心理学

勉強会

練習

関数の調べ方

雑多な知識

  1. テキストエディタを使用する
  2. 潜在変数を扱うモデルはRでは,今のところ使わないでおこう
  3. Rを学習する意義とデメリット
  4. Rを学習する前に…
  5. 「Rは大変だから勉強しないでおこう」と思う前に…
  6. Rによる関数の作り方
  7. Rによるシミュレーション

R雑記

  1. 海外でのRの普及状況
  2. データマイニング
  3. コンジョイント分析
  4. 欠損値処理
  5. 効果量
  6. 潜在変数を仮定するモデル
  7. Rの教育
  8. メタ分析
  9. 心理学におけるRの普及
  10. 2005年度の普及
  11. Rを薦める・薦めない
  12. 心理学におけるRの普及II
  13. 教科書,マニュアルを読むこと
  14. 2006年度の普及
  15. 統計学 (R) の勉強会
  16. 反R派・信仰派?
  17. Rと論文
  18. How to 学習
  19. 統計ユーザーとしての基準
  20. RとOS/ブラウザ
  21. 2007年度の普及
  22. 初学者が陥りやすい罠
  23. Rを薦める・薦めないII
  24. 心理学におけるRの普及III
  25. キャリアパスと統計学
  26. 医学における検定力,効果量,区間推定
  27. 精神科領域のためのRパッケージ
  28. Rによる論文の審査/印刷期間の管理図
  29. 精神科領域におけるデータ解析環境Rの使用論文
  30. 統計学 (R) の勉強会 (研究会) II
  31. ポスドク問題と統計学
  32. 5年後のあなたへ
  33. データサイエンティスト一考

リンク集

 

 

 

 

 

 

 

 

 

 

 

 

 
 

著者: 奥村泰之 (Curriculum Vitae)
所属: 公益財団法人 東京都医学総合研究所 精神行動医学研究分野 心の健康プロジェクト 主席研究員
e-mail: yokumura @ blue.zero.jp
Researchmap: http://researchmap.jp/yokumura/
ResearchGate: https://www.researchgate.net/profile/Yasuyuki_Okumura/
Google Scholar: http://scholar.google.com/citations?hl=en&user=c9qyzRkAAAAJ
facebook: http://facebook.com/okumura.yasuyuki
Twitter: http://twitter.com/yachu93