|
|||||||||||||
Top > 無料統計ソフトRで心理学 > R雑記30-33: データサイエンティスト一考 無料統計ソフトRで心理学 R雑記30-33: データサイエンティスト一考 |
|||||||||||||
|
30. 統計学 (R) の勉強会 (研究会) II (2011/5/14) 先日、Tokyo.Rに参加し、Rユーザーの裾野の広がりを実感いたしました。自分でも何かできることはないかと考え、久しぶりに、論文を執筆する研究者向けの勉強会 (研究会) を開催することに致しました。 「心理・医学系研究者のためのデータ解析環境Rによる統計学の研究会」という名称にしています。この研究会では、
「データ解析環境Rを共通言語として、なるべく正しく統計学を使えるように勉強する場」を提供することを主眼としたものです。詳細は,広報用のページを御参照下さい。 先日、統計学の研究会で、私の紹介をしてくれた先生が、「ポスドク問題に強い関心がある人」と紹介下さいました。 そういえば、修士課程の学生に統計学の講義をするとき、「統計学が必要な理由」を納得いただくために、以下のように説明をしていました。
そもそも、先行研究を読む段階から統計学や研究法の知識をフル活用する必要があります。私の場合は、1つの研究の完了までに、100-300編ぐらいの査読付き論文を収集します (管理している、総所蔵論文数は3636編です)。数多くの論文を収集して、統計学や研究法の知識を使って、信頼できる先行研究を選別 (スクリーニング) して、研究計画に反映させます。スクリーニングしない限り、情報の海に流されてしまい、「信頼に足る専門知識を増やせない」からです。 このような理由により、「データ解析は、データを取った後に考える」という行動特性を持っている方は、残念ながら
「信頼に足る専門知識を基に研究計画を立てていない可能性が高い」と思います。こうした問題の解決のためには、データを取るより、ずいぶん前から、統計学の学習を始めなくてはいけません。もちろん、データ解析の時に使わない統計手法も学習しなければ、審美眼を持って先行研究を評価できません。 「私は統計学は初心者だから」「Rは難しい」と、かわいい発言をする修士・博士課程の学生の方々へ。 「あなた方は、研究に対して、尊大な態度を持ち、大いなる勘違いをしていると思います。『統計学やRを知らない』と言うより、『研究を知らない』と表現する方が的確です。色々な専門家と共同して研究を遂行すること、批判的吟味に基づく専門知識を増やし続けること、英語論文を生産し続けることの労力は、半端なく大変です。年間3500時間以上、研究だけに時間を投資しても、毎年1つの論文を、国際誌に出し続けることは、至難の業だと思います。一方、Rの基礎能力なんか、たかだか400時間程度、集中的に勉強すれば、獲得できます。ユーザーとしての統計学の学習は、たしかに相当な学習時間が必要ですが、自分ひとりの努力だけで獲得できる分、相当楽です。」とお伝えしたいと、常々思っています。 私は、真剣に研究のための学習を始めてから、ついに10年が経ってしまいました。研究者の世界では、10年程度のキャリアでは「駆け出し (未熟者)」と、適正に認知・評価されます。学部4年の23歳から、現在32歳、そろそろ33歳!です。5年後の私は、脳のピークを感じ、研究を主で行うのを辞めて、教育に注力し始めるかもしれません。いま修士・博士課程に在籍しているあなたは、5年後に大学や研究所などに就職する確率が高いと思います。研究所に勤めている私の立場からは、あなたがもしも、研究所に勤めるならば、以下の能力・経験を獲得していることを期待しています。(注) いろいろなタイプの研究者がいるので、「私の期待 = すべての研究所の職員の期待」という等式は成り立ちません。
学生のうちに「ぼーっ」と暮らして、研究所に就職したあとに、これらの能力・経験を獲得することは、あまりお勧めできません。研究所の任期は3年程度と短いので、「目に見える業績を出すこと」の優先順位が高くなってしまうからです。だからこそ、いま、学生という研究の基礎能力向上に時間投資することが社会的に許されていて、脳がフレッシュな若いうちに、こうした能力・経験を獲得して欲しいのです。若い学生のうちに、信じられないぐらい基礎的な学習に、膨大な時間を投資して欲しいのです。 5年後のあなたと、私が一緒に研究所で働く確率は、天文学的に低いのですが。。。期待を込めて。
産業界では受動データの集積に伴い「データサイエンティスト」というキャッチーなフレーズが流行っています。高度なデータ解析をできる人材は貴重なので,この職種の方々は高所得者となっているようです。アカデミックな世界で生計を立てている私からは,非常に,羨ましい職種ですけれども。 心理・医学系の研究者の間でも,いわゆるデータ解析に強いヒトは存在します。データ解析に強いヒトの棲み分けは,いくつかあるように思います。 第1カテゴリとして,「プロの統計学者」がいます。こうした方々は,統計学的手法の開発や評価に関心があります。生物統計学や心理統計学などの教室で,PhDを取得しています。数理統計学への知識の深さは,尋常ではない人たちが多いように思います。 第2カテゴリとして,「統計学を活用するのプロの研究者」がいます。公衆衛生学や臨床疫学などの教室で,PhDを取得しています。統計学的手法の開発をしないけれども,統計学を非常に大事にする集団です。こうした人たちは,特定の医学領域の問題解決に関心があり,統計学の応用のレベルを,学術論文としてのAcceptabilityに合わせることに置いていることが多いように思います。私も,その末席にいるつもりです。 第3カテゴリとして,「データアナリスト」がいます。統計学的な手法の開発や評価をせず,特定の医学領域の問題解決にも関心がないけれども,統計学の活用自体に関心がある集団です。生物統計学や心理統計学の教室で,修士の学位を取得しているヒトが多いように思います。こうした人たちは,主著の論文執筆よりも,第2著者以降としてサポートすることを好むことが多いように思います。 こうしたタイプが存在していますが,もっとも大事ことは,データ解析に強くないヒトが,こうした人たちに研究の一部を委託をする際に,何を提供すればWin-Winの関係性が保てるかという点かと思います。第1カテゴリの研究者の場合,現在関心のある統計手法の開発や評価の一環で,Appliedに必要なデータセットを提供できれば,大きなメリットになると思います。第2カテゴリの研究者の場合,現在関心のある医学領域の問題解決に,主体的に関与させることができれば,大きなメリットになると思います。第3カテゴリの研究者の場合,所属機関等で統計相談業務等を本務とする役職を与えることができれば,メリットになると思います。 いずれにせよ重要なことは,専門知識の提供にあたる報酬を含めた契約を結ぶということかと思います。「共著者に入れるから統計解析の相談をしたい」「共著者に入れるから統計解析を依頼したい」と,提案をする方がいらっしゃいます。こうした御依頼を頂いたとき,光栄なことだと思いつつ,「そのような価値が,あなたの研究におありですか?」とストレートに苦言を呈したくなることは少なくありません。「共著者の基準というのは,AMAなどのAuthorshipの基準に該当すればいれるものです。XX時間を要する希少な専門知識を無償で提供するに値する価値は,共著者という役割と対価ではない」と思っています。おそらく,この信念は,タイプに寄らず共有できるかと思います。 データサイエンティストの需要が高まりますが,アカデミアでは,その対価が正当に評価されているとは言えない状況です。専門職の専門職たる評価が,少しでも向上することを願っています。 |
|
|||||||||||
|