統計日記

 
この欄は,私が統計科学を中心とした研究や教育などに関わっていて,思ったこと,知ったこと,感じたこと,などがそこはかとなく書きつづられるページです.ご意見・ご感想をお待ちしてます. E-mail: fujisawa に @ をつけて ism.ac.jp


14 Dec 2007: Call for papers for special topic on Multiple Simultaneous Hypothesis Testing.

機械学習系で有名な雑誌である Journal of Machine Learning Research のトップページに,タイトルに挙げているような文章がありました.これを発見した時は,かなり驚きました.仮説検定は,さすがに,機械学習のグループは,手を出さないだろうと思っていたのです.なぜなら,仮説検定は,かなりシビアな統計的議論を基本としていて,機械学習のグループは,統計でいう推定レベルで思考を止めることで,ダイナミックさを求めているような気がしていたからです.

しかし,まあ,とうとう,ここにまで手を出すのですね....以前に統計日記でも書いたのですが,多重検定(Multiple Simultaneous Hypothesis Testing)は,計算機が発達してから,非常にホットなトピックになっていますし,新しいことに過敏な機械学習のグループが参入したとしても,おかしくはありません.特に,個人的には,昔に統計日記でも触れましたが,Story の一連の論文が,多重検定の難しさを,ある意味で,推定の問題に置き換えているので,それは,ポイントだったのかもしれない,とは感じなくもありません.


13 Dec 2007: ワークショップ「統計的機械学習の理論と応用」

東工大のGCOE「計算世界観の深化と展開」のワークショップの一つである「統計的機械学習の理論と応用」に参加してきました.この二ヶ月くらいは忙しくて,IBISにも参加し損ねたので,これは聞きたいと思っていたんですが,前日夜まで,すっかり忘れていて,打ち合わせ日程などを変えてもらったりして,午後からは参加することができました.

「一言で感想を言いなさい」と言われたら「楽しそうだなあ」と答えます.理論側の人も数式を使いすぎず応用事例との対応をイメージ的に表わしていて,応用側の人も問題設定とデータ解析の基本アイデアと数式の関係をイメージ的に明確にしていました.

個人的には,少し前にIBMの研究員の人の話を聞いて,そのときにIBMの人のスタンスに興味が湧いたので,今回も聞きに行って,また,バイオインフォマティクスに対して,機械学習側の人が,どういうスタンスで向かっているのかにも興味が湧いたので,参加しました.今回ので,いろいろと,掴めました.自分の立ち位置を,あらためて強く意識できました.ここでいう立ち位置は,狭い意味での研究分野としての自分の場所と,研究に対する意識の仕方のスタンスです.明確な人を見ると,自分の位置も明確になります.


12 Dec 2007: 「統計数理研究所の大学院教育」 by 吉田亮さん@統数研

吉田亮さん@統数研が,統計数理研究所ニュースに,「統計数理研究所の大学院教育」というタイトルで原稿を寄せています.このファイルの最後のページです.吉田さんが統数研で過ごした大学院時代に基づいて書かれています.「データ科学」という言葉に対して,ここまで感銘を受けるポジティブな感情を見たのは,初めてかもしれないです.それは吉田さんの経験に裏付けられた土台があるからだろうと思えました.ぜひ大学院生や若手研究者に見てほしい文章です.久しぶりに目が洗われました.


06 Dec 2007: 定期テストで点数が悪かった

非常勤先で定期テストを行った.サービス問題の解答に勘違いが多かった.そして,その勘違いは,自分の講義が悪かったせいであろうと想像できた.

今年は,想像以上に忙しかったというせいもあるけれども,講義の準備が甘く,また,しばしば,疲れていたため,アドリブでの講義進行がさえなかった.そして,講義中に学生に問題を解かせて理解度を確認しながら進む,という基本も完全におろそかになっていた.その結果が如実に出てしまった気がする.こういうとき,学生に申し訳なかったなと思う. 幸いにして,もっとも理解してほしかった部分は,だいたい,予想通りの結果が出ていたので,それが救いだった.

定期テストは,成績のためとか,学生が自分の理解度を確認するためとか,そういうのが一義的なものだが,同時に,先生の講義の自己評価にも使える.

猛烈に忙しかった,この二ヶ月ぐらいが,もうすぐ終わります.


11 Nov 2007: 偶然

一ヶ月ほど前に,神山さん@鉄道総研から,海洋関係の研究所の先生が書いている本を勧められました.その本を読んで,「このデータは,きちんと解析すれば,もっとちゃんと結果が出るのに」とか思っていて,その著者にいつか連絡を取ろうと思っていました.そしたら,自分が出席する結婚式&披露宴に来ると知って,かなりびっくりでした.何とも言えない偶然の繋がり[鉄道-海洋-統計]とタイミングだなあと感じました.

将来的に,データ解析をお手伝いすると思うので,結婚式&披露宴の終了後,とりあえず挨拶しました.データ解析がうまくいけば,このページに,いずれ詳しく書くと思います.ただ,当分は,異常に忙しくて無理そうですけど...そのほかにも,幾つかの偶然が紹介された結婚式&披露宴でした.

ところで,参加した結婚式&披露宴では,司会をしました.冗談っぽく振られたのが二週間ほど前でした.とりあえずは,色々と理由を挙げて,基本的には,お断りしたんですが,色々とあって,どうも,私の方が良いらしく,正式な依頼が10日ほど前に来ました...当初に聞いた話とは大きく変わって,非常にきちんとした結婚式&披露宴になったので,私のような素人で大丈夫だろうかと思っていましたが,とりあえず,大きな失敗はなくてよかったです.


03 Nov 2007: スタンフォード大学&カリフォルニア大学バークレー校訪問

キャンパス内を散策したり,キャンパスの周辺を散策したり,図書室とか施設の中を見たり,教室みたり,セミナー聞いたり.色んな意味で良い経験でした.本当のところは,中に本格的に入りこんでみないと分からないし,そこが重要なのだけれども.

今回は,鳥越さん@東海大が,スタンフォード大学統計学科に,長期滞在しているということで,おじゃまさせて頂きました.本当にいろいろなところに連れて行ってもらい,本当にいろいろな示唆を頂きました.本当にありがとうございました <(_ _)>


22 Oct 2007: 赤池統計学の世界

非常にお勧めです.ここ.統計科学が生き生きと語られています.


21 Oct 2007: 苦労話を語ってください

「ゲノムデータ解析をするにあたって,異分野交流をする上で,いろんな苦労があったことと思います.その苦労話を,若手向けに,語ってください.」 そういう依頼が来ました.

自分が20代のとき,年齢が上の人を見ていて,あんな講演は,どうしたらできるようになるんだろう,と思っていました.どういう経験を積めば,ああいう講演をできるようになるんだろう,と思っていました.当時の自分には想像さえできませんでした.

大学を卒業して15年.大学院を終えてから10年.いつのまにか,苦労話くらいは,堂々と語れるようになっているようです...


14 Oct 2007: give & take,scrap & build

give & take であって,take & give ではない.とりあえず,相手から何かを得ること(take)ばかり考えていて,何かを得ないと give はしないし,よほどの take でないと give しないぞと構えている人は疲れる.気楽に give して,気楽に take する機会がある方が,お互いに楽しいと思うし,重要な give & take は,軽い give & take の後に来ると思う.

scrap & build であって,build & scrap ではない.何かに対して,80%も埋まっているときに,さらに10%を build してしまうと,その後の余力がなくなるし,それ以前に,その build の過程も,もともとの余力が小さいため,効率が悪い.まずは scrap を先に考えて,それによって得られた余力で build した方が,効率が良い.基本的に,scrap & build はセットだと思う.

どちらにせよ,余裕は重要だと思う.


13 Oct 2007: 重要な瞬間は急に訪れる

とある場所で,とあることを,いきなり聞かれる.内容が内容だけに狼狽する.まさか,あの場所で,あんな風に振られるとは思わなかった.狼狽を隠すだけの余力もなく.

かなり真意を測りかねた.しかし,あるときから,自分は,そういうときは,できるだけ正直に答えることにしている.それで失敗しても納得できるし,正直に対応しなくて失敗した場合のデメリットの大きさを,経験的に痛感しているから.

つくづく思うのだけれども,普通に重要な話は,だいたい,流れがあって,想像の範囲内で済むのだけれども,非常に重要な話は,しばしば,突然で,想像の範囲外で,しかも,即決が必要な気がする.まあ,今回は,重要と言っても,そんなに重くはなかったのだけれども.


08 Oct 2007: 勉強

長らくまともに勉強していなかった気がする.必要に応じて勉強はしていたけれども,余裕を持って,身体に覚えさせるまでは行けないことがほとんどだった.というわけで,8月下旬くらいから,全精力を傾けて他が見えなくなるような研究は避けて,曖昧なままにしておいた内容を勉強することを中心にしている.

落ち着いた気持ちで勉強しながら,少しずつ身体で覚えていく.キーワードのメモを作り,キーワードから関連事項全体を確実に構築できるかを,何度か確認する.最後の確認のときには,ホワイトボードの前に立ち,一章から数章分くらいとか,論文だと一つ単位とかで,講義をする要領で,少しずつ丁寧に書き込んでいく.ときどきは,キーワードのメモを見ることだけは許しながら.そして全体を一つとして捉え直す.それが自分の最終儀式.


08 Oct 2007: 研究者ってふだんは何してるの?

「研究者ってふだんは何してるの?」と聞かれたとき,研究してるか,勉強してるか,普通の仕事してる,と答える.そうすると,勉強している,という言葉に突っかかられるときがある.勉強してるだけで給料をもらいやがって,ということらしい.

そういうときは,こう答える.「スポーツ選手って,大会のとき以外は,筋肉を鍛えたりしてるよね.我々の勉強もそれと同じで,いざという研究のときのために,ふだんからスキルを磨いているんだよね.」 スポーツ選手のような理解しやすい(?)人と対比すると納得されやすい気がしている.


03 Oct 2007: 記事へのリンク:博士の就職

博士の就職力、学会も後押し 研究職続行は「3割」 (AERA:2007年09月24日号) ここ
博士売り込み大作戦 就職応援の催し、各地で(asahi.com 記事) ここ

自分も,D3の終わりに,幾つかの理由で,研究職への就職は,一度は完全に諦めたので,こういう記事を見ると,本当に色々と思うことがあります.もう,あれから,10年ほど経ちましたが,今でも,「研究職への就職は諦めて大学院をやめるつもりです」と指導教官に報告したシーンを,ありありと思いだせます.

記事に対しても,現状に対しても,色々と想いはありますが,自粛します.


29 Sep 2007: 現場の人とのふれあいで得られるもの

これまでも何度か触れてきましたが,遺伝研の方と共同研究をしています.そこで得がたい体験をしています.

いろんな文献を調べました.過去文献では,しばしば,ある指標が,非常に良くなっています.しかしながら,我々の方法では,その指標が,あまり良くなりませんでした.方法論としては,明らかに優れているはずなのに,その指標は悪くなる.かなり勉強をすると,データの使い方が過去文献とは違っているようで,しかし,それにしても,あまりにも指標の良さが違いすぎました.何が起きているのか最初は良く見えませんでした.

さらに色々と考えた挙句に,誠に申し訳ないことに,遺伝研の方のデータに,何かしらおかしなことが起きているのではないかとまで疑ってしまい,そのような可能性までも聞いてしまいました.しかし,そのときの,遺伝研の方からの説明が,非常に明確で,自分の疑念はほぼ払拭されました.

それから少ししてからだと思いますが,目の前の数値以外の,本当に様々な方向から,データがもつ性質を検討して頂きました.また,ある方法でデータ解析の見方を変えることで,やはり,提案した方法は,ある程度はきちんと働くことを示唆して頂きました.さらに,現状のデータ採取方法では,ある意味でのデータ解析の限界がありそうな部分まで見せて頂きました.加えて,他の文献は調べ方が甘いようで,我々は本気でデータを解析しようとしているからこそ,データの本当の素性に立ち向かう必要があり,結果的に難しさに直面している,ということも見えてきました.詳細な検討のおかげで,次のステップもクリアに見えてきたようです.

これらは,データを取っている方々との議論がなければ,決して見えなかったことですし,自分だけで行っていたら,必ず迷路に入っていたことでしょう.やはり,本気でデータを解析したければ,データ側の人と統計の人が一緒に行わなければいけないということを,身をもって痛感することができました.頭では分かっていたし,これまでも色々と経験はしてきましたが,今回のは,非常に深い経験になっています.とくに,データに対する思い入れの深さに,本当に感服します.


24 Sep 2007: 「統計科学とは何だろう」 by 赤池弘次

タイトルからして圧倒される.実質5ページの文章.その文章は「統計数理(1994) 42巻1号 3-9」にある.いまではよく言われていることも多い.しかし,おそらく,実体験が深いのだと思われる.文章の迫力がとにかく全く違う.こういう迫力に出会えるのは幸せだと思う.

原稿全体をウェブ上に置きたいけれども,著作権の問題があるので避ける.以下で一部を抜粋する.そのくらいは許されるであろう.

このようにして方法の学として定着した統計学は,果して成功的に展開されて来たであろうか.米国における状況を見るに,戦後の大学における種々の具体的分野に関する知識あるいは経験を持った第一世代の教育者等は,多くの魅力ある問題を提示するとともに他の関連分野の教育研究にも参加協力していた.しかし具体的な研究対象を持たないままに方法の精密化のみを追求する形の研究が主流となるにつれ,統計学の研究は次第に孤立化の傾向を示し,統計学的方法を必要とする個々の分野の研究者等は自らの力で統計的な問題の解決を進めるという状況が目立ち始めた.これがShafer(1990)が問題として取り上げている現在の米国の大学における統計学科の置かれた状況である.なお,この論文については筆者もコメントを求められ,論文と共に印刷されている.


17 Sep 2007: 「非線形計画法」 by 今野浩 & 山下浩

とりあえず理論編を100ページほど読みました.あまり図はないんですが,図的なイメージが自然に醸し出される証明の仕方が多く,非常に読みやすい本でした.

そういえば,一年くらい前に,今野浩先生の「線形計画法」を読んで,やはり読みやすかった記憶があります.そのときの日記はここ

ふと統計日記を振り返ってみると,毎年この時期は,研究ではないことをしているようです.この時期は,夏休みがあったり,連合大会があったり,何かに集中しにくい時期なので,自然に,思考を細切れにしても問題がない勉強などをしているのかもしれません.


12 Sep 2007: 私は基本的には「ものぐさ」である

私は基本的にかなりの「ものぐさ」である.会議などで私の得意な発言の一つは「それは面倒なので止めましょう」である.

もちろん,きちんと深い意味があると思われたことに対して,そういう発言はしない.全体的な空気が前向きでなくて,費用対効果がかなり薄くて,しなければしなくても良いと考えられることに対して,そう言うだけである.また,その逆に,面白くて楽しければ,もしくは,意義が大きいと思えば,私は,そこそこの労力を積極的に行使する.費用対効果が大きければなおさらである.

そのため,目に見えるところでは,この人に仕事を振ったら引き受けてくれるだろう,と思われているような気がするけれども,実際には,納得しないと引き受けないし,責任が持てないと引き受けない.実際に,断ることは,非常に多い.代わりに,引き受けたら,きちんと行おうと努力する.

ちなみに,仕事を依頼するときに良く使われる殺し文句は,それが表層的に使われる限り,私の場合には,ほとんど無駄で,どちらかというと逆効果になる.それに,「○○しなければならない」などと言われると,「本当に○○しなければならないのか」と考えるのが常である.


09 Sep 2007: 統計関連学会連合大会

自分にとっての連合大会は,連合大会のための企画委員会としての仕事がほぼ終わった時点で,同時に終わっていた感じでした.そのため,今年は,連合大会が無事に始まったことの方に感慨が深く,大会本体には,ほとんど感慨がありませんでした...

とは言っても,幾つか感じたことはあります.学習理論系の話がかなり増えて来たこと,その関係の研究者には活発さが感じられること,自分も講演したゲノム関連データ解析のセッションの参加者が非常に多くて,しかも,若い年齢層が非常に多かったこと,でしょうか.

以前に連合大会の事務局をしたときには,これから5年は関連する仕事には関わるまいと思いました.そして,今回も,やはり,これから5年(10年?)は関連する仕事には関わるまいと思いました.もう十二分に関与していると思うからです.

それと,コンペセッションは,もっと,バンバンと質問が出るようにした方が良いと思っています.たとえば,企画委員が分担出席して,質問をバンバンするとか.質問への答え方によって,講演者が,講演内容をどこまで深く認識しているかを,より簡単に評価しやすくなります.また,質問がないコンペに出席した学生は,せっかく頑張ってコンペに申し込んだのに,何の反応もないのは,可哀そうだなあと思うのです.さらに,統計学界全体を良い方向に向かわせるという広く長い目で考えたとき,コンペで質問を増やすのは,費用対効果を考えたとしても,非常に効率的な動きの一つだと思うのです.まあ,理想的には,こういう打算的なことを考えずに,自然にそういう雰囲気になれば良いわけですが.

というわけで,私は,自分の興味があったコンペセッションに参加して,質問がない時には質問してみました.ただ,その質問によって,一方的に利益や不利益をもたらさないような質問を考えるのに,少し苦労しましたけど.色んな人が質問すれば,そんなこと考えなくても,自然と偏りがなくなって,良いわけですが.


25 Aug 2007: 血液型(追記)

私はA型です.厳密にはAO因子を持つA型です.TPOによって,Aが強く出たり,Oが強く出たり,という感じがしています. 研究発表とか飲み会とか,普通に外から見ると,O型に見えるようです. 事務的な仕事を一緒にすると,確実にA型に思われる気がします.

ところで,高校?年生の時まで,自分はO型だと信じていました.周りもO型だと思っていたようです.何かの時に病院に行ったとき,隣が血液型検査をしていて,とても簡単にできると分ったので,自分も調べてもらいました.検査の結果,A型だと言われました.結果を表す試験紙を見せてもらい,血液型との照らし合わせ表みたいなものまでも借り,それでも信じられず,もう一度だけ調べ直してもらいました.やはりA型でした...


15 Aug 2007: 血液型

前々から気にはなっていました.自分の周りにはB因子を持っている人が多すぎる気がする...いつ聞いてもB因子が多いなあとは思っていました.そして,先日に,決定的な場面が二回ありました.

ある部屋で研究職と事務職の人たちがいました.研究職は AB*2,B*1,A*1 で,事務職は AB,B でした.次はお好み焼き店でのお話.学生も含めて研究系の人たち.私はAで,私を除いてみんなB(*5)でした.

なお,日本人の血液型割合は,A:O:B:AB=4:3:2:1 らしいです.自分の周りに起きる様々なことに少し納得してしまいました...


09 Aug 2007: 統計サマーセミナー

本当に良いセミナーです.もう,それ以上の言葉は,必要ないです.二年前の日記を見られていない方は,そのときの日記を参照ください.

いつの間にか,最高年齢層に入ってしまっているようです.次の層は4歳ほど下のようです.うーん,という感じです.

今年は,朝一の講演が特別講演というのが,二日間続きました.そのためでしょうか,夜の飲み会は,最初の二日間は,自然と,すごく早めに切りあげられました.最終日の朝に特別講演がなかったためでしょうか,その前日の夜は,遅くまで飲んでいたようです.

今年は,夜の飲み会の時に,10歳以上年下の学生Kさんに,何となくペースを乱されてしまいました.サマーセミナーのような場では,あまり使われることのないキャラB状態になってしまいました.おかげで,Aさんには,藤澤さんのキャラと違うように言われ,さらに,途中で,Nさんに,話のネタとして,売られてしまいました...別に根幹は変わっていなくて,単に,多種多様な興味があるというだけなんですが...


04 Aug 2007: 吾輩は円錐角膜である

テニスをしていて眼の怪我をしたときに,ついでに書こうと思っていて,現在に至りました.私は眼が円錐角膜です.図で説明すると,こんな感じです.角膜の変形の感じは,まさに円錐という感じです.光の屈折がくるっているので,裸眼だと,すべてのものが,二重以上に見えます.結果的に乱視です.特に,右眼は,強度の円錐角膜です.(しかも近視もひどい...)

昔は眼鏡を使っていたのですが,眼科で,この眼では,眼鏡ではきちんと矯正できないから,コンタクトにしなさい,と言われました.より詳しく調べていくと,かなり強度の円錐角膜と分り,市販されているコンタクトでは,カーブがぎりぎりでした.これ以上,円錐角膜が進んだら,普通のコンタクトでは無理で,円錐角膜専用のコンタクトにする必要があると言われました.

ただ,このときに,コンタクトに変更したおかげで,人生がかなり変わりました.ものがクリアに見えることを初めて知ったぐらいの気分でした.かなり感激ものでした.今でも初めて見えた風景を覚えています.

もともと,ものが見えにくくて疲れやすかったのですが,東工大に移動した頃には,14時ぐらいにはグロッキーになっていました.それは,歳をとって,体力が落ちたためかと思っていました.この年齢でこれでは先が思いやられると思っていました.ところが,コンタクトにしてから,一日中,かなり普通に活動できるようになりました.つまり,眼鏡を使っていた時は,ものがクリアに見えないため,すごい集中してものを見ざるをえないため,疲れやすかったのです.それまでの疲れやすい人生はなんだったんだと思いました.

いつからか忘れましたが,長時間,続けてものが読めなくなっていました.今でも,長時間,続けてものを読むのは,かなりしんどいです.コンタクトにしても,前よりはクリアに見えるようになったという程度で,やはり,ものは少し滲んで見えてしまうので,かなり集中しないと,字などをきちんと読み続けることができないのです.そのため,勉強や研究のときには,短時間で集中して読んで,あとは読むのをやめて,頭の中で空想して論理を作り上げる,という癖がついています.また,シンポなどに参加しても,講演を続けて見るのはしんどいので,途中で適度に休みながら見ることにしています.

眼が悪くて,すごい疲れやすい人は,この業界には多いのではと思います.ものが滲んだり二重に見えたりする人は,私と同じ可能性があります.ぜひコンタクトなどをトライしてみてください.上述したように,私は,人生が変わったといっても過言ではないほど,疲れにくくなりました.もしも円錐角膜の人がいて,その人が,この日記を見て,人生が変わったら,本当に嬉しい限りです.

本当は,円錐角膜には,レーザー矯正が向いているんでしょうが,ちょっとそこまで手を出す気にはなっていません.


16 Jul 2007: 締切は記憶しない

少し前に,ある先生が,「締切を色々と抱えてるんだけど藤澤さんはどう?」という感じで聞かれ,「すぐには思い出せないですね」という感じで答えました.6月途中から仕事は大幅に減った気もしていたからです.ふと気になって研究室に戻ってPCをチェックすると,たくさんの仕事予定が書き込まれていました...しかし,やはり,具体的な締切日はほとんど思い出せません.

よく「何々の締切って何日だよねえ」という会話が出てきます.しかし,私は,本当にしばしば,締切を忘れています.書類などは,依頼されたら,次の三つの選択肢で行動しているのです:

(1) 簡単なものは,すぐに終わらせて,最初から締切をなくしてしまいます.(そのため藤澤は対応が早いと言われます.しかし,対応が早くても遅くても,本人にとっては,仕事時間は変わらないわけです.それなら,さっさと忘れてしまった方が,自分は楽かなと思っています.)
(2) すぐに終わらせる気にならない場合や,時間が必要な仕事の場合は,自分の能力とPC内の予定表から逆算して,だいたいこの日ぐらいに行おうと思って,その開始日時などをPC内の予定表に記憶させて,その開始日時になったら,PC画面にポップアップさせるようにしています.そして締切は記憶していません.
(3) (1)か(2)の行動をすぐに採用できないときや採用したくないときは,やはりPC内の予定表に,簡単に,何々仕事と書き込んで,適当な日時にポップアップさせるか,メイルの場合は分かりやすく置いています.やはり締切は記憶していません.
(*) ただし,日数の必要な仕事は,やはり思い出しやすいようにしておく必要があるため,紙の予定表に書き込んでいます.そのため,紙の予定表は,大きな予定だけ書き込まれています.
PC内の予定表に書き込むことで締切をほぼ完全に意識の外に置いておくことができます.こういう行動をとるというのは,できるだけ人間としての余裕を持ちたいので,できるだけ頭の中にゆとりを作っておきたいからです.それに,研究モードのためには,少しでも余計なものは,完全に思考の外に置きたいのです.本当に深い(数理的)研究をするときには,どれだけの澄みきった時間を確保できるかが,少なくとも自分にとっては重要だと認識しています.

他人の設定した締切で動くなんて,とても厭です.しかし,集団で何かをする以上は,締切は大切だと思っています.だから,可能な限り,自分のリズムで動こうと思っています.同じことをするにしても,その方が楽しいですし.それに,お互いの信頼関係が構築できれば,人間関係をスムーズにすると思っています.


11 Jul 2007: 統計学のための数学入門30講

今年は,とある理由で,数学系でなかった大学院生に,統計学に必要な最低限の数学を教えました.基本的に準備は必要なくて,ほとんど全部が即興でした.というのも,昔から,統計学に必要な最低限の数学とは,つまるところ,線形回帰モデルを理解するために必要な数学であると認識していたからです.そうすると,カリキュラムは,自然に決まります.

そして,しばらくして,そういえば,永田靖先生の「統計学のための数学入門30講:朝倉書店」はどんな章立てだろう,と思って眺めてみました.この本を知ったとき,そういう内容の本をいつか書きたいと思っていたので,少し「あーあ」と思っていました.章立てを初めてきちんと見ると,自分が思っていた内容と,ほぼ同じでした...あんまりにもほぼ同じなのでびっくりしましたが,やはりそういうもんだと思いました.AMAZONでは非常に良く売れ続けているようです.統計学を使っていて,自分に数学力が足りないと思った人が読むには,本当に適切な章立てに思えました.お勧めの本です.

ところで,自分が書いたら,もっと幾何的な直観を優先して理解していけるように書くだろうなと思いましたが,それは,自然に理解するには良いでしょうが,使えるということを優先するという最低限のニーズからは少しずれるから,確かに微妙かなと思いました.


07 Jul 2007: 研究が荒れている

某先生曰く「藤澤さんは,この1,2年くらい,研究が荒れていたね」.藤澤返答「ああ,その通りだと思います」.

自分でも,一年半くらい前から,自分の研究がすごく荒れていることを強く自覚していました.色んなものに対応することの優先順位が高すぎて,深みの優先順位が落ち過ぎていました.ゲノム研究の半端でないスピード感と,理論研究の緻密感という,ある意味で対極を行ったり来たりしていたというのもあります.

そんな荒れた状態を抑えるために,一年くらい前から,少しずつ軌道を修正しています.その当時の状況を鑑みて,自分の中でちょっとした目標を立てました.その目標は,少しずつクリアされていき,もう少ししたら,ほとんどクリアされそうなので,そうなったら,研究スタイルを,ゆったりと散策して冷静に突き詰めていくスタイルに,当分の間は戻したいと思っています.いろんなごたごたで半年くらい時間が余計にかかってしまっている気もするけど...

とにもかくにも,統計学を知りたいんなら,理論も応用もどちらも深くやってみたい.


30 Jun 2007: 今月の記録

今月も,いつの間にか終わってしまった.今月は本当に記録ぐらいしか書く気にならない.面白いセミナーもあったのだけれども,復習するのは,きっとすごく先だろうし...

上旬は連合大会のお仕事.上旬から中旬は論文の改稿.下旬は気力が湧かず,将来的なことを考えて,意識してぼけぼけと過ごした.一か月を通して,少しずつ,遺伝研との共同研究のデータ解析をして,これはめどがついたと思っている.その他にも溜めざるをえなかった色んなお仕事のめどを付けた.

お仕事モードが抜け切れず,全く独創的ではない一ヶ月間だった.でも,来月くらいからは,適度なペースになりそうな予感.


31 May 2007: 今月の記録

今月は,本当に,事務仕事と,ほんの少しの仕事的研究だけだった.新聞はとうとう一日も読めなかった.参加したかったセミナーに4回も参加できなかった.遺伝研への出張も見合わせた.飲み会に3回も参加できなかった.ちなみに,勘違いされやすそうなので書いておくと,今月に忙しかったのは,連合大会の仕事では全くない.

しかし,下に書いてある強烈な刺激や遺伝研からの前向きな報告を見て,目が洗われた.なんとしても早く研究に戻る.


30 May 2007: パラメータ空間が閉凸集合の時のモデル選択規準

パラメータ空間が普通のとき,モデル選択規準の導出は,かなり一般的に見えている.代表がGICである.またCVの妥当性もすぐに証明できる.

しかし,パラメータ空間に順序制約などがある場合は,どうなるのだろうか.とりあえず,微分不可能な点があるので,GICのような考えでは足りない.CVは無理やりに使えるけれど,その妥当性は証明されていないであろう.最近では,LassoのようなL1罰則のタイプも,この枠組みに入る.いろんな各論はあるように思うけど,自分が知る限りでは,一般的な話はないのだと思う.

加藤さん@東大経済D1は,線形モデルで誤差項が正規分布と限っている場合で,たぶん,真のモデルがモデル候補に含まれている場合だと思うけど,そういう場合に,妥当なモデル選択規準の導出に成功しているらしい.「らしい」というのは,自分の必要な数学のレベルが全く足りないため,それが正しそうかどうかさえ,断定的に言えないためである.

数日前に,加藤さんが5月上旬に東大統計輪講で使われたプレゼン資料を送ってもらい,それを電車の中で眺めながら,驚愕であった.ものすごい興奮を覚え,あらためて最初から眺めなおした.久方ぶりに本気で興奮した.

この日,加藤さんと,ゲノムデータ解析においての応用の可能性について雑談をさせて頂いた.私には,Stanford University の Hastie や Tibshirani が提案している方法論が,現場の立場から見て,どういう意味で必要なのか,また,これまでに提案されている方法論以外で強く必要とされている方法論には何があるのか,などを話すぐらいしかできないのが残念だった.

結局,話は自然に流れて,これからの研究の方向に関する雑談に多くの時間を使ったような気がする.加藤さんが目指しているテーマは,Lasso の勉強をし,モデル選択規準に興味があれば,ほとんど誰でも気づき,そして,誰もが避けようとしているテーマなどだった.しかし,加藤さんは,それに正面から向かっていくようで,しかも,現実的に,そのテーマを克服するのではないかと感じられた.

ものすごい空気がそこを支配し,そして,ものすごい勢いを感じた.本当にすごい.それ以外に言葉が見つからない.統計輪講に参加したかった.どんな空気がそこを支配していたんだろう.


12 May 2007: asahi.com: 「失敗恐れないで」ハイリスク研究に補助金

asahi.comに『「失敗恐れないで」ハイリスク研究に補助金』という記事が出ていました.

ちなみに,以前にも書いたと思うのですが,統数研が属している情報・システム研究機構では,「融合研究プロジェクト」というのが,数年前から動いています.私が遺伝研と行っている共同研究はその一部です. 「融合研究プロジェクト」は,異分野の融合によって,まさに,新聞記事の「(2)従来の学問分野を超えた新しい分野の研究」を目指したプロジェクトで,機構長のトップダウンによって始まったようです.少し前から,ある一部から注目されているとは聞いていましたが,それが,今回のような形と関係はあったのかもしれません.

融合研究の試みに関して,機構内のセミナーの夜(夜中?)セッションにおいて,ガンガンと議論をしまくったのを思い出します.例えばですが,アメリカやイギリスでは,ゲノムデータ解析において,統計学者が関与することは,普通に行われているようですが,日本では,普通ではないと感じています.

遺伝研との共同研究で面白いことがあったんですか,きちんと書く余力がありません...


09 May 2007: 自分が書いたものに関わる情報

自分が書いた「確率と統計」という本が,東大本郷生協の理工書の4月売り上げで,第8位になっているようです.素直に嬉しいです.私の本は,東大では,矢島先生@経済によって,「数理統計」という講義(シラバスPDF)の中で,教科書として採用して頂いているようなのですが,それが効いているのかもしれません.しかし,それだけだとは少し思えないので,もしかすると,他でも,教科書とか参考書とかで採用されているのでしょうか? 理由を知りたいです.

「統計データ科学事典(朝倉書店)」が6月下旬にようやく出版されるようです.その宣伝用ビラに自分の担当した部分「重みつきスコアに基づいたロバスト推定」が使われていると知りました(宣伝用PDF).こういうのも素直に嬉しいです.


02 May 2007: とっても疲れています

28 Apr 2007:

とにかく事務仕事が多いです.かなり断っているんですけど.いまだに出口が見えません.小さいのが多すぎてうまく整理できないし.かといって大きいのもあるし.仕事の種類も多様だし.4月に事務仕事で忙しいなんて記憶にないですね.事務仕事以外にも色々とあったし.

そういうときは,俺は研究者ではない事務職だ,と思いきって行動すると,意外と楽になれます.しかし,今回は,そう思う余裕すらないです.

かなりグロッキーです.新聞読んでません.テレビもあまり見ていません.英会話学校をかなりさぼり気味です.最近は料理も手を抜きまくりです.部屋も荒れてます.メイル病の自分がメイルを見たくなくなってます.うーん.

02 May 2007:

ちなみに,変な落ちまでつきました.上記の基本文章を書いたのが,28 Apr 2007 の午前.午後にはテニスに行きました.その最中に眼を怪我してしまった...幸いにして軽かったようですが,完治に数日かかりました.疲労が原因だった気がします.

さらに,壊れてしまったコンタクトレンズの代りを注文したのですが,GW明けにしか手に入らず,乱視のひどい私は,コンタクトレンズがないと,ほとんど何も集中できません...


18 Apr 2007: 教師冥利に尽きる

今年度,教室に入ると,そこに,昨年度に同じ講義を受けた学生がいました.単位はきちんと取っていた学生です.話を聞くと「改めて聞いても勉強になるので復習のために講義に出たい」ということでした.実は,昨年度も,ほんの少しだけ状況は違いますが,同じような学生がいました.(その学生の取った行動はもっとすごかったんですけど.)

本当に教師冥利に尽きます.さすがに心から嬉しいです.


11 Apr 2007: 「好きを貫く」のはそんなに簡単なことではない

昔に書こうかと思ったけど,いまは大学にいないし,このページも研究日記だし,ちょっと書き過ぎかな,などと思って書かなかった内容があった.ある将棋棋士のブログからのリンクとして見つけて,ほとんど自分と同じ考えだったので,ちょっとリンクすることにした.ここまで同じだとちょっと嬉しい.
梅田望夫さんという人のブログへのリンク
直感を信じろ、自分を信じろ、好きを貫け、人を褒めろ、人の粗探ししてる暇があったら自分で何かやれ。
「好きを貫く」のはそんなに簡単なことではない。意識的で戦略的でなければ「好きを貫く」人生なんて送れないよ。
このブログに書いているようなことは,みんなが意識しているもんだと,昔は思っていた.本気で楽しもうとすると,こういうところに行きつくもんだと思っていた.でも,学会とかシンポとか,その他もろもろの場所に参加した経験としては,どうもそうではないらしい.だから自分は,自分のできるささやかな貢献として,学会とかシンポとか普段でも,発表とか雑談とかに対して,できるだけ,良いものは良いとはっきり言うし,面白いものは面白いとはっきり言うようにしている.

他人を褒めるのは,自分が負けていると思う人が多いような気がする.でも,少しくらいなら,負けたっていいじゃんと思う.どうせ全員に勝つなんてないんだし.(牛尾になるんだとさすがに別問題だけど...) それよりも,お互いで良いところを褒めあって,お互いを自然に高めあって,結果的に相乗効果で高みに行く方が「楽しい」と思うから.

自分も「好きを貫く」ために色々と努力している.「好きを貫く」のはそんなに簡単なことではない.自分は,色んな理由もあるので,のんびり生きながら好きをそこそこに貫きたいと思う.それにやっぱり,意識していたとしても,できることもあればできないこともある.できる範囲で貫こうと思う.

まあでも,自分は「好きを貫く」よりも「自分らしいか」「楽しいか」という意識の方が強い気がする.迷った時は,得か損かよりも,それを基準にして,行動を選択する.


03 Apr 2007: ゲノムデータ解析の集中講義

こんなメイルをYSGメイリングリストに流しました.参加申込締切は明日の水曜20時です.


01 Apr 2007: たいへんになりそうな予感

年度末からの空気とか,この二年くらいのもろもろのことを考えると,今年度はたいへんになりそうな予感があります.生活スタイルの変更も考えた方が良いかなと思わなくもありません.いろんな意味で,自分は研究所にいるのだなと思います.(注: 27/Mar/2007 の日記とはあまり関係ないです.)


31 Mar 2007: Prof. Bin Yu の話

Prof. Bin Yu が 3/12 に統数研に来られて講演されました.ただ,講演よりも,面白かったのは,講演後の長時間にわたる雑談でした.世界の本当のトップグループで活躍している人の言葉なので非常に重みがありました.アメリカの統計学社会や学習理論社会や統計学雑誌の動向など,日本にいては得にくいホットな話題も多く,しかも,かなり色々なことを遠慮せずに率直に話されていましたので,本当に参考になる話が満載でした.雑談でこんなに勉強になったのはいつ以来だろうと思いました.

ネット上に,雑談の内容を書きたいんですが,あんまりにも率直な話ばかりだったので,書くのは気がひけます.興味のある人は私に会った時に聞いて下さい.(最近に会った人には自分から積極的に話しました.) 今後の研究スタイルなどを考える上でも参考になると思います.

今月の特記すべきこと: 先月に引き続いて,今月も飲み会(orお食事会)が多かったです.今月は9回でした.(先月は7回でした.) その他にもランチとかでちょっとイベントがあったりしたし.もう当分はおとなしくしていたいです...(でも,誘われたら,もちろん行きますけど (^^; )


27 Mar 2007: 無念

今日は心の底から無念だった.これまでに,色々と対処してきたが,うまくいかなかった.その最中にも,色々と,他の人に相談したり,自分で考えたりしてきた.最終的には,将来的なことも考えて,こういうタイプの行動が自分らしいだろうと,自分なりに得心した.基本的な決断は,かなり前に行っていたのだが,ようやく今日になって実行に移せた.本当に無念だった.

この無念さを晴らすには研究するしかない.研究の仕方を大きく変える必要もあるだろう.こんな年齢になって気づくのは遅すぎる気もするが,気づかないよりは良かったのかもしれないし,気づかない方が幸せだったのかもしれない.


17 Mar 2007: 日記を更新する気力さえなく

少し前に Prof. Bin Yu の雑談を聞いて面白かったので,日記に書こうとか思っていたんですが,年度末の仕事とか企画委員会の仕事とかセミナー参加とかシンポ参加とか会議とか色んな種類の仕事とか歓送会とか飲み会とか何とかかんとかが忙しくて,というか混乱していて,日記を更新したいという気力が全く起きません.購入したPCも3週間以上ほったらかしです.2週間くらいは良くある話なのですが,まだまだ色々と行事があるので,今回は,最長記録になりそうです.いつになったら開けるんだろう...今月は何も書けそうにない気がするので,まあ一ヶ月に一回くらいは,記録だと思って.


24 Feb 2007: 授業をやって良かったなと思う瞬間

東京理科大学で非常勤講師をしています.教えているのは漸近論です.対象はなんと学部の3,4年生です...学部生に漸近論の講義ができるのは,理由があって,東京理科大の数理情報科学科は,統計学関連の講義が充実しているからです.たぶん,その気になれば,学部3年生が終わるまでに,統計学関連の単位を,18単位は取れますし,さらに確率の講義も別にあります.私の講義は,通年で,確率収束の定義から始まり,最後はAICの導出までやっています. 最終レポートを出すと今年はこんな反応がありました:

(1) ある学生はレポートの最後にメッセージを添えていました.本当は抜粋したいんですが,こういうのは,最近は世知辛いので,適当な要約を書きます.「何でこんなことを考えるんだろうという動機付けや各内容の繋がりを丁寧に説明してもらったので統計学の全体的な面が見えるようになった気がする.」という感じでしょうか.漸近論は統計学の中でも思いっきり数理よりです.たとえ思いっきり数理で講義は式ばかりになっても,イメージとか具体例とかで,漸近論の講義でも,その面白さが見えやすいようにすることに最も力を使っているので,こういうメッセージは嬉しいですね.今までもこういうコメントは口頭で何度かもらったことはあるんですが,今回は,執筆したテキストともリンクしてタイムリーだったので,載せてみました.

(2) ある学生は卒論を送ってくれました.卒論の謝辞に私の名前が挙がっていました.ときどき講義の後に質問も受けていたのですが,質問を受けるにつれて,理解度が増していくのが分かったので,楽しい体験でした.

(3) これは極め付けです.最終レポートは,最後の四半期に行った幾つかの難しいテーマ(AICを含む)のうち,どれでもいいから好きなものを選んで,講義ノートを提出せよでした.そうすると,,,GICの導出をやってきた学生がいた...もちろん1996年にBiometrikaに掲載されたGICのことです.恐るべし! どうも小西先生&北川先生の情報量規準の本を勉強して,やってきたらしい.記号の使い方がそっくりだったので.確かに,その本は講義中に紹介したし,真の分布がモデルに入っていない場合も想像できるような感じでは講義も気をつけましたが,さすがに本気で驚きました.日本には大学生でGICをなんとなくでも導出まで含めて理解している学生がいます (^^;

(*) ちょっと話はずれます.昨年の話です.私が執筆したテキストのゲラ刷りを読んでくれた二名の学生は,この漸近論の講義を昨年に受けた学生です.「誰かゲラ刷りを読んでコメントしてくれる人がいたら講義後に声をかけてください」と講義中に言っていたら,手を挙げてもらえました.実際は他にもいたんですが,この二名が積極的だったので,詳細を彼らにお願いしました.

良い授業というのは,単に授業内容をきちんと伝えられるというだけでなく,というよりも,授業を受けた人が,さらに自ら学ぼうとするとか,自ら何らかの行動をしたいと思えるような授業だと思っているので,こういうことがあると,授業をやって良かったなと思います.


21 Feb 2007: 企画委員としてのお仕事

統計関連学会連合大会の企画委員になったので,あんなことやこんなことをしたいと思っていました.(そのときの日記はここ.) 実際はそれ以前に呆然とする現実が待っていました.4年前に日本統計学会の庶務理事だったときに,減らして整理したはずの事務仕事が,増えて混乱している... 理由はだいたい分かりました.あんまりにも呆然の理由でした.ネット上で書くのは避けますが.

今回は,仕方ないので,企画委員会の事務仕事を安定させることに,全力を尽くすことにしました.それ以外に目を向ける余裕はとてもありません.事務仕事をできるだけ分かりやすくて省エネで本質をはずさないようにしたいと思います.(前企画委員会からの引き継ぎ事項でもありました.) 研究に限らず事務仕事にも余力が必要です.そうすれば,さらに面白くて有益なことを考える気になるので.(余力ができたからといって単に仕事を増やされると困りますが...) 連合大会の時には,目に見えないことばかりですが,将来の企画委員が楽になるようにしたいと思います.

ちなみに,自分の中での基準は,次の感じです.今回は端的に言えば省エネ化を目指します.省エネ化するためには,どのように省エネ化するかなどの全体を整理しなおす労力が必要です.これは普通はかなりたいへんです.しかし,省エネ化すれば,省エネ化の恩恵も受けられます.省エネ化を目指すことで増える労力と,省エネ化によって減る労力の,トレードオフがあります.基本的に私は,事務仕事をするときは,トレードオフを考慮しても全体としての労力が大きく減る方向に向かうと予想されるものを選別して,それらを省エネ化することを試みます.将来の関係者だけでなくて,現在携わっている自分や自分の周辺も楽になる道を選びます.

既に,次回の連合大会では,印刷されたプログラムを事前配布しないことに決定されました.プログラムは事前にはネット上だけで閲覧できます.国際会議はもちろんですし,国内でもそういう形式は増えていると思います.こういう新しいことをすると,良い面ばかりでなく,いろんな問題点も考えられるわけですが,それへの対処も考えて,議題として提案して認められました.サービスとしては全体的にはそんなに低下してないはずです.会計的にもデメリットはないようです.事務仕事は相当に楽になりました.


15 Feb 2007: ある意味では全てのものは相対的に存在する

ある小説に似たようなセリフが書かれていた.たとえば,20cmというのは絶対的な尺度のような気がする.しかし,基本的には,1mというものが定義されて,その1/5として定義されている.赤色というのは確かに赤色である.しかし,赤色しかなかったら,色という存在自体がない.そういう意味では赤色も他の色があって始めて赤という色に意味がある.

統計学のことを分かろうと思ったら,たぶん,統計学だけを勉強していても分からない.他の分野も知ることで,初めて相対的に評価でき,統計学の価値や存在意義などが本当の意味で見えてくるような気がする.他の分野を知れば知るほど,統計学との境界がクリアになり,統計学という学問の意義が余計にクリアになる気がする.

自分にとっては,数学,学習理論,最適化,確率過程,バイオインフォマティクス,遺伝学,などを勉強したのは,統計学を理解する上で,とても良かったと思っている.また,様々な分野が,どのように統計学を使っているかを見て,使い方の多様性や統計学の長所と短所を見れたのも,とても良かったと思っている.


12 Feb 2007: 特別な体験

二宮さんとの共同研究の論文が Biometrics に通りました.その内容の概略を書いた日記はここです.

査読報告書は最初からべた褒めでした.あそこまでのはちょっと見たことがありませんでした.しかし,我々の心境は少し複雑でした.そのときの日記はここです.

私と二宮さんは統計学界の中でも数理的な部分に基本スタンスを置いています.今回の内容は,現在生成されているゲノムデータの解析に役に立ちそうだという動機を,確かに持っていました.動機に関しての重要さには少し自信がありました.しかし,それを数学に落とす部分が完全にきれいにいかなかったり,最終的な数式がきれいでなかったり,動機は良いとしても,数学の部分に不満をもっていました.なので,まさか,べた褒めされるとは思っていなかったのです.

今回我々が感じたのは,ゲノムデータをターゲットにした多重比較の問題は,いまこの時点でも,まだまだ本当にホットであるということです.ゲノムデータを解析していると,ホットであるはずだとは思っていましたが,本当の意味でホットさが手元にあるんだ,と心から確認できる状態にいるというのは,本当に特別な体験でした.自分は第二著者ですが,今回の内容は,いろんな意味で二人三脚に進められたので,感慨もひとしおでした.


05 Feb 2007: 普通の並べ替え検定は間違っているらしい

今日は日記のタイトルからしてショッキングです.多くの人は普通に並べ替え検定を使っているはずなので.論文を読んだ自分はもっとショッキングでした.その論文はこれです:
Choice of a null distribution in resampling-based multiple testing.
Pollard, Katherine S.; van der Laan, Mark J.
J. Statist. Plann. Inference 125 (2004), no. 1-2, 85--100.
まだ完全に理解はしていませんが,流れからして,たぶん正しいと思っています.また,前々から,並べ替え検定のときのP値の計算方法には,少し疑問をもっていたので,これで少しすっきりし始めています.

簡単に言えば,並べ替え検定でのP値の計算方法は,データが帰無仮説に従っているというのが前提なのですが,現実のデータは必ずしも帰無仮説からのデータではないので,一般的にはギャップが生じる,という話です.(もちろん全ての場合でギャップが生じるわけではありません.) そのギャップが生じないにはどうすればよいかというのを,かなり一般的な立場から書いています.解決方法は,うまい方向に射影せよ,です.

以下に,自分の理解で,母集団が二つで等平均性を検証するときの並べ替え検定の正しい使い方を書きます.論文とは書き方が違います.ちょっと論文におかしいところがあると思っているので,自分なりに解釈しなおしたものです:

1. 二つの母集団で交換するデータの数は必ずそれぞれの母集団の半分ずつ.
2. 分散の推定値は並べ替え標本で計算しなおさない.
実は前々から上記の設定がいるのではないかと思っていたのです.きちんとフォローしてないので自分の理解が不正確かもしれません.そのときはぜひご指摘ください.しかし,こんな重要な内容がトップジャーナルに掲載されていないのかと,自分の中では少し驚きです.

追記(18 Oct 2008): 重要な部分で誤解を与える記述がありました.以下の記事も合わせて見て頂ければと思います.18 Oct 2008: 並べ替え検定に関する話題を再び


23 Jan 2007: あるタイプの遺伝子発現データからのSNP発見

遺伝研から依頼されている遺伝子発現データをどう解析するかを悩んでいました.もう少ししたら年度末報告会のタイトルとしてネット上に出るので,その程度は内容をネット上で書いてもいいので書くと,あるタイプの遺伝子発現データからSNPを発見するという研究です.まだネット上では詳しく書けないです.すいません.

11月に突貫作業で,まあまあうまく行ったのですが,あれはプロトタイプで,もっと数学的にきれいで,もっとデータ解析的にもうまく行く方法を模索していました.データに合わせる数学的な統計モデルは,だいたいこれで十分だというアイデアが,意外と早く浮かびましたが,もちろん,データ解析というのは,困難はその後に来るわけです.その困難は,データ解析の目的(SNP発見)を達成するために,ロバスト法とか多重比較とか漸近論とか,色々と組み合わせる過程にありました.方法論に合うようにモデルも少しいじったりとか.

相手は63万個のプローブでした.統計的に言うと63万回の検定を行うのです.しかも,これを単純にプローブごとに扱うような単純な話ではなく(そういう話はなんぼでもあるはず),それをある単位で組み合わせて考えていかないと見えないようなものを見ようとしているから,非常にややこしい問題でした.最初に考えた基本的な方法は,かなりうまく行きましたが,もちろん,あるところからうまく行きません.うまく行かないデータセットを見つけてきては,何がうまく行かないかの原因を探って,方法論を少しずつ改良して,プログラムも改良して,試して試して,またまた,うまく行かないところを発見して,改良を続ける.一般理論的には,こっちの推定量がいいんだけど,データの特性からして,こっちの推定量の方が良さそうだなとか.

なんでうまく行かなかったかというと,繰り返し実験回数が少なかったからです.プローブ数は63万個と多いけれども,実験回数は5回です.(これでも実験回数を増やしてもらった...) こういう分野では良くある話です.実験回数がある程度あれば,かなり起こりにくい問題に,真面目に対処する必要がありました.実験回数が少ないと,実験回数が多いときには無視しやすい偶然が起こりやすく,データ解析の結果に大きな影響を与えてしまうのです.63万個もプローブがあれば,そういう偶然は頻繁に見られます.

でも,データをたくさんたくさん眺めていると,そのゆらぎは何とか統計的方法論で抑えられそうなので,その揺らぎのタイプを色々と見つけては,それに対処していったわけです.ようやく十二分に満足いくところに到達できました.かなり充実感があります.でも,講演するときには,小さいことなので,全く触れないんだろうなと,勝手に自己完結しています.

まだ原稿にしてないし,今から遺伝研と詳細を煮詰めていくので,ネット上で詳しく紹介するのは先になります.遺伝研からの了解を得たので,統数研の年度末報告会で話します.ただ時間が短いのでさわりだけでしょう.たぶん,連合大会でも,話すと思います.今後,ミスが見つからなければですが...


11 Jan 2007: 日本統計学会会報に寄稿した新刊紹介文など

次号の日本統計学会会報に次の新刊紹介文を寄稿しました.最後の一文は心からそう思います.
本書では「具体例を動機として確率と統計を少しずつ創っていく」という感覚で テキストを記述してみました.一人でも多くの学生が,面白く楽しく躍動感を感 じながら,確率と統計を学んでくれればと思っています.
何人かからは,テキストについて,ありがたいコメントを頂きました.ありがとうございました.思った以上に広い読者層に受け入れられそうで安心しています.ほかにも,講義のテキストとして検討したいとのお返事なども頂きまして,嬉しい限りです.また,たくさんの本を執筆されているN先生には,研究室の学生のために,10冊も購入して頂いたと聞きました.ありがとうございました.言葉だけでなくて具体的な行動を聞くと余計に嬉しかったです.(そんなに数理がバリバリでない研究室だと思うのですが...) まだまだ,いろいろな方からの感想をお待ちしております.(マイナスのコメントも将来的なことを考えるとウェルカムなのです.) どうぞ宜しくお願いいたします.<(_ _)>

ところで,今だから書きますが,大学で,確率と統計の標準的な講義を,一度しか(しかも非常勤で半年しか)したことのない私に,テキスト執筆を依頼して頂きました編集委員の皆さまには,本当に感謝しております.(この事実を編集委員が知ったら依頼を撤回されるかもと思っていました (^^; ) 自分のしたかったことが一つできました.


07 Jan 2007: 研究日記をネットで書くということ

江口先生がネット上での日記をやめられました.(一時中断というほうが正確なのかもしれませんが.) いろんな思いが見えるような最後の日記でした.自分も,すべてとは言わないまでも,いろいろと同じような感覚を持っています.その中でも,自分にとって象徴的だったのは,次の言葉でした: 「優等生的雰囲気に支配された方向が繰り返されてしまった」.

公式なHPからリンクされたHP上で日記を書く.不必要な誤解を招くような言動は慎まなければならない.必然的に優等生的な文章が多くなる.実際には,そんな優等生的な感情よりも,もっと雑多な感情がうごめいているのに,その中の,本当に一部を取り出して書く.

自分そのものを表現するのではなく,その一部だけを表現するという行為は,かなりバランスの悪いものです.もっとも困るのは,研究をするには,恐ろしいほどたくさんの不毛なことをいとわずに行い続けることが必要なのに,日記では,その真逆な優等生的なことばかりを書き続けることです.そのときに,思考の方向が,ある程度は逆に向けられてしまうのです.そのため,日記は,基本的に,思考を切っても良い週末に書いています.

また,共同研究が増えたことで,共同研究者に迷惑をかけてはいけないと,気を使うことが増えました.いま最も悩んでいることです.

もちろんですが,表現についても,かなり注意して,何度も推敲します.だいたい,書き終えてからオープンにするまで,冷静になるために,普通は数日おきます.結果的にオープンにしないという選択肢を取ることも,しばしばあります.

ネット上で日記を書くことは,研究的にはマイナスなのではないか,と思うことがあります.思うこと自体,既に研究にはマイナスです.しかし,日記を書くことで,自分を冷静に見つめなおすことができるというメリットが自分にもたらされるし,何よりも自分の場合は,日記を書く動機は,必ずしも研究の中だけにはないので,まあ,全体としての収支としては,おつりは来ていると思っています.というよりも何よりも,そんな細かい感情よりも,私の場合は,とにかく書きたいのです.これだけで十二分な理由でしょう.

ところで,私の場合は,ネット上で統計日記を書いていて,最大の問題点は,明らかに幾つかの意味で人格を勘違いされているらしい,という点です.ほかの人に,そりゃああんな日記を書いていて,あんなプレゼンとかしてたら,勘違いされますよ,と言われたこともあります.自分でもそうかなと思わなくはないです.私と雑談とか飲み会を一緒された人は,そんな勘違いは,すぐに飛んじゃうんでしょうけど.そういう理由で日記をやめようかと本気で思ったことがあります.