松浦 健太郎 Profile
松浦 健太郎

@hankagosa

10,228
Followers
568
Following
121
Media
7,098
Statuses

興味:統計モデリング, 因果推論, 強化学習, Stan, R, Python, 理工学書, 仮説実験授業。技術的なブログ, 本, 論文, QAサイトの回答を書いている人が好き。なぜならそれらで独習することが多かったから。

Joined November 2012
Don't wanna be here? Send us removal request.
@hankagosa
松浦 健太郎
3 years
Rつらい→Pythonで解決 ・機械学習一貫してない→scikit-learn ・深層学習つらい→PyTorchなど ・強化学習つらい→Gym, Rayなど ・数式処理→SymPy Pythonつらい→Rで解決 ・データ加工でPandas毎回ググる→dplyr ・可視化でMatplotlib毎回ググる→ggplot ・確率分布や生存時間分析などが少ない→R全般
1
217
1K
@hankagosa
松浦 健太郎
6 years
ヤフーのロッジ、休日めちゃ混んでる。でかい声で「ジョブス」「イノベーション」「CTO」「ハッカソン」「入賞」などが定期的に聞こえてきて心が病みそうになる。
3
485
1K
@hankagosa
松浦 健太郎
3 years
ノーベル物理学賞、共通点は恐らくFortranなので、ノーベル賞を取りたかったらFortranやりなさいというメッセージですわい。
6
326
984
@hankagosa
松浦 健太郎
6 years
東山小学校→東海中→東海高→東大の経歴を持ってて、就活で東芝の面接のときに「どうして弊社を応募したのですか?」という質問に対し「全部 "東"がついてて縁起がいいと思ったらからです!」「お、おう」と面接官を圧倒してそのまま東芝に入った優秀エンジニアの先輩は元気かな?
0
224
833
@hankagosa
松浦 健太郎
2 years
Rのdplyrはほんと覚えやすく書きやすいので、pandasもそう書けたら嬉しいなぁと思ってたけど、polarsが書き味はだいたいdplyrでしかも高速で最高だった。移行するわ。BrainPadの_jintaさんの記事達に圧倒的感謝!
2
165
829
@hankagosa
松浦 健太郎
7 years
友人の少ない僕ですら、周りに離婚組が7組ぐらいあるのですが、一番面白かった離婚事由は「遺伝的多様性を高めるため」ですかね。長期的視点に立ちすぎだろ。
0
410
806
@hankagosa
松浦 健太郎
2 years
RCTではなく、希望者にバランスボール使わせて効果を見てるので、交絡によるバイアスが入る典型例になっちゃってる。和歌山県大丈夫か…
6
162
806
@hankagosa
松浦 健太郎
6 years
ダメそうな本も上げておく。正規分布をこういうモッコリ分布で代用してる本はすべからくダメ。ちゃんとした正規分布を描く手間をケチるような著者の言うことなんか信用できませんわ。
Tweet media one
7
324
777
@hankagosa
松浦 健太郎
2 years
第1話 ベイズモデリングにようこそ!! 第2話 初めてのMCMCっ! 第3話 ドキドキ!同時事後分布っ!? 第4話 ワクワク!Stan導入っ!? 第5話 ドメイン知識 第6話 憤怒 第7話 疲弊 第8話 絶望 第9話 破壊 第10話 忘却 第11話 再起 最終話 LightGBM
0
109
531
@hankagosa
松浦 健太郎
4 years
現在京大の石岡圭一先生が東大にいた時、スペクトル法の授業を受けた。ソースコードがFortranで、自分のC言語の100倍ぐらい速くて短くてビビった。あの頃からコードはこだわろうと思ったね。
0
68
435
@hankagosa
松浦 健太郎
5 years
p値の教育に関しては、僕の中でこれで決まりじゃんというのが最近あった。それは昨日の統計連合大会で発表されたであろう柳川先生の「p値に基づく検定の再現性」です。検定の結果の再現確率を表示するところがポイント。
1
92
416
@hankagosa
松浦 健太郎
4 years
『生態学のための階層モデリング』いただきました。ありがとうございます! コロナのデータ解析したい→生態学おすすめ 尖ったデータサイエンティストになりたい→生態学おすすめ 可視化うまくなりたい→生態学おすすめ ですからね!私も数理生物学出身なのでほぼ親戚です。
Tweet media one
0
68
421
@hankagosa
松浦 健太郎
3 years
世の中の流れには勝てず、顔出し解禁しました。生体信号処理、自然言語処理、画像処理、マーケデータ分析などが得意なデータサイエンティストの皆様ゼヒーッ
@chugai_cc
中外製薬
3 years
デジタル戦略推進部のデータサイエンティストに、当社を選んだ理由や新しい環境の印象、実際の取り組みについて聞きました。 キャリア入社1年目のデータサイエンティストから見た中外製薬|CHUGAI DIGITAL #note
0
26
172
2
73
418
@hankagosa
松浦 健太郎
6 years
わいのおすすめのデータサイエンティストになる方法: 1. ツイッターをやめて統計や機械学習の本を読む 2. ツイッターをやめてプログラミングの練習 3. ツイッターをやめてリアルのデータを解析してブログ書く 4. ツイッターをはじめてフィードバックをもらう
0
160
414
@hankagosa
松浦 健太郎
4 years
TJOさん本人は凄くいい人で悪意はないはず。ただ、数理やコーディングの理解のあやふやさを達者な日本語でぼかしてはいけないと思う。そういう良くない部分だけを真似て、TJOさんに憧れてます!という人が周りに現れはじめて実害が出てきたので、たまに警鐘を鳴らすことにしました。
1
77
388
@hankagosa
松浦 健太郎
6 years
その時点で少し優秀な学生を取り合うインターンよりも、社会人のためのインターンをやってほしい。2週間ぐらい有給とっても行く人は多いんじゃないかな。勧誘されてそのまま転職するもよし。ボコボコになって「あの会社は凄い会社だった…」となるのもよし。
0
148
358
@hankagosa
松浦 健太郎
3 years
8月7日(土) 13:00-17:45 製薬×データサイエンス Meetup「なぜ今、製薬企業のデータサイエンスが 面白いのか?」という勉強会のようなイベントを催します(講演します)。評判良ければ第二回あるかも。興味ある人、参加登録をお願いします!
1
105
365
@hankagosa
松浦 健太郎
7 years
生物がわかる人の中ではプログラミングができ、プログラミングができる人の中では数学ができ、数学がわかる人の中では生物がわかるというポジションで生きてきた。この関係を120度回転すると、各々のガチ勢に全敗やからね。久々に感じましたね。
1
107
350
@hankagosa
松浦 健太郎
8 years
DeNAはいい人もいるけど、基本的には「不幸のデータサイエンティスト」が多くて、クソ記事でいかにSEO効果上げるか、ゲームでいかに射幸心を煽るかなどに携わる人が多い印象。料理に使うべき包丁で人を刺すのと変わらん。若い人は不幸のデータサイエンティストになることなかれ。
1
317
340
@hankagosa
松浦 健太郎
9 months
因果推論のDAGに関する入門者向け講義ならこれがベストと思う。無料です。全コースの9割ぐらいは見ました。
@_MiguelHernan
Miguel Hernán
9 months
"Draw your assumptions before your conclusions" 5 years ago we launched the *free* #CausalDiagrams course @HarvardOnline @edxOnline . Since then, 80,000 people in 180 countries have registered. Check it out if you want to learn about DAGs and SWIGs :
7
165
568
0
51
351
@hankagosa
松浦 健太郎
7 years
『Pythonで体験するベイズ推論』(PyMC本?)頂きました。ありがとうございます!想像以上に理論と例題が丁寧です。著者が金融にも明るいらしく、5章の損失はおいくら?(ベイズ意思決定)、7章のベイズA/Bテストなどユニークな構成です。読んだ後にブログも書く予定。
Tweet media one
0
116
341
@hankagosa
松浦 健太郎
4 years
西浦先生が使っているStanコード公開されたんだね!思ったよりはシンプルで読みやすい。ニコ生で一部解説してくれるといいなぁ。
0
163
343
@hankagosa
松浦 健太郎
4 years
因果推論を勉強したおかげで、(真は絶対に分からないけど)急所を押える統計モデリング能力はかなり重要であることを実感してます。勉強も相乗効果があると楽しいよね。こういうのをポジショントークと言って、統計モデリング沼に引き込む意図があり、フォロワーの皆さんは注意して読む必要があります。
3
45
336
@hankagosa
松浦 健太郎
4 years
TJOさんのブログ記事、業界与太話や書籍写経の記事は良いと思うけど、分析やコーディングの記事は理解があやしいものが多い(ロジスティック回帰、時系列、モデルの評価など)。データサイエンス力を高めたい人は注意深く読もう。他の情報も確認しよう。
0
74
322
@hankagosa
松浦 健太郎
3 years
Gelman先生らの『Regression and Other Stories』が個人利用で無料ダウンロードOKに。7章単回帰、13章ロジスティック回帰、締め(21章)の階層モデルはもちろん、5章シミュレーション、12章変換、16章サンプルサイズ決定、18~19章因果推論など良い章が多い。基礎の次のステップにベストな本だと思う。
0
85
325
@hankagosa
松浦 健太郎
4 years
公的機関の公式発表の末席に突如現れた、株式会社ホクソエム。面白すぎでしょ。
2
127
310
@hankagosa
松浦 健太郎
4 years
>RT ほんとこれ。データ解析の結果を出す場合は、モデルとセットで出す。これ約束ね。どちらのモデルが「正しい」かは議論できないけど、「そっちのモデルは〇〇を考慮してないね。考慮すると結果がだいぶ変わるけど大丈夫ですかね?」みたいな議論はできる。それが重要。
0
89
296
@hankagosa
松浦 健太郎
3 years
昔はギラギラしてたので、大学の入学式、卒業式、成人式、葬式と全て時間の無駄と断定し全ブッチして読書してましたが、振り返ると出とけば良かったなという思いはありません。
0
41
292
@hankagosa
松浦 健太郎
3 years
論文読むのが絶望的に遅くて、研究者の道はほぼ断念してるのだけど、藤子不二雄みたいにペンネームを使って、複数人で1人の研究者になれるんだったら実装担当を頑張りたい。プログラミング外注業者とか言わないでね。
3
30
282
@hankagosa
松浦 健太郎
3 years
・ファッション:深層学習 ・法律:自然言語処理 ・医療:統計モデル、因果推論 ・ロボット:強化学習 のように業界によってよく使う手法が異なるので、先に5年ぐらい興味持てる分野を決めてから、手法を深掘りして勉強するのをオススメしたいです。
0
43
282
@hankagosa
松浦 健太郎
2 years
検定ワークフローの良くないと個人的に思ってる点はいくつかあるけど、一番は、一つ一つの検定手法は帰無仮説が真のときに第一種過誤確率が有意水準以下に抑えられているようにできているけど、こうやってつなげたときにはそれが保証されていないこと。
@TomoCodeHQ
TomoCode 📈PythonでAI/データサイエンス🤖
2 years
統計的仮説検定や統計手法選択が一目でわかる👀 こういうの待ってたー!😭
Tweet media one
Tweet media two
Tweet media three
4
263
2K
1
50
278
@hankagosa
松浦 健太郎
6 years
生きてます。本は読んでます! ・「Pythonで学ぶ強化学習」は自分でPythonのクラスを一から作りながら学ぶところが最高です。帯の文言、いいよね。 ・「たのしいベイズモデリング」は話題が面白すぎる。モデリングを試してみたくなります。
Tweet media one
0
43
262
@hankagosa
松浦 健太郎
10 months
Q「統計を学ぶ上でプログラムを動かして学ぶか、理論から学ぶかどっちがいい?」 坂巻先生A「その人の特性による。データから特徴つかんで理解を深めるのが得意な人、理論から理解を深めるのが得意な人がいる。センスない方を長々とやるのはつらいので、自分のタイプを考えよう」 良いこと言うなぁ!
0
60
268
@hankagosa
松浦 健太郎
4 years
『モンテカルロ統計計算』をいただきました。理論重視の本でレベルはPRMLぐらい。ベイズ統計、乱数生成、ギブスサンプリング、HMCなどを有機的に繋ぎながら証明もある点が良かったです。出てくるRコードはシンプルで勉強になります。最強のサンプリングアルゴリズムを作って一発当てたい人も必読です!
Tweet media one
Tweet media two
1
69
269
@hankagosa
松浦 健太郎
6 years
TJOさんの何が凄いって、ここまでポジション築けてるのに間違っていることを厭わず発信し、指摘を受けてもあっさり自分のものにして知識を増やしていくところ。たしかに最短学習ルートなんだけど、普通の人間の精神じゃできない…
0
67
254
@hankagosa
松浦 健太郎
1 year
有意差完全保証プラン、長年p-hackingして良心の呵責に耐えかねた担当者が「ここまでヤバい宣伝したら、さすがに炎上して問題になって私も解放される!!」と考えて出てきたのでは。いままでよく頑張ったね、、もうしなくていいよ、、
0
84
255
@hankagosa
松浦 健太郎
4 years
個人的にはCausal Inference BookのPart 1,2(特に1-2章, 3.1-3.2節, 6-8章, 11-13章, 15章)がおすすめです。 RコードもPythonコードもあります。
0
48
255
@hankagosa
松浦 健太郎
2 years
小学三年生の国語の教科書より。②の段落を主張するには、ほけん室に来なかった人についても聞かないといかんよね?いつの間にデータサイエンス教育がここまで進んでいたか…
Tweet media one
1
62
253
@hankagosa
松浦 健太郎
8 months
本屋で若者から突然「来春からエンジニアですが、どの言語をやるかは決まってません。今勉強しといて絶対損のない本を教えて下さい」と話しかけられたので「その条件のもとならリーダブルコードかな〜」って勧めたらめちゃ感謝された。ネット情報は豊富過ぎて迷うらしいが、話しかけるのありなのか?!
2
37
249
@hankagosa
松浦 健太郎
4 years
1枚目: 最尤推定の結果 2枚目: MCMCによるベイズ推定の結果(オリジナル) 3枚目 (左上): データの二度漬けやめた (右上): そこからガンマ分布をやめて連続値用ポアソン分布(WinBUGSと同じ)を使った (左下): そこから事前分布消した (右下): そこから報告遅れを考慮しない どれも大体同じ結果。
Tweet media one
Tweet media two
Tweet media three
1
73
239
@hankagosa
松浦 健太郎
6 years
某社「現在の収入を開示していただく必要はありません。しかし、オファー提示前の条件確認の際に、源泉徴収と給与明細を提示してください。」 僕「🤔」
1
131
241
@hankagosa
松浦 健太郎
1 year
無事、博士 (工学) になって卒業できました。絶対何かやらしかてる、まだ油断できない…と思って、今日のこの時間までツイートを躊躇してました…
29
11
246
@hankagosa
松浦 健太郎
4 years
『StanとRでベイズ統計モデリング』のほとんどのコードをPython版で作成している人がいました。(exec/mcmc_tools.pyの中でpystanを使っています) ありがとうございます!
0
61
242
@hankagosa
松浦 健太郎
2 years
エーザイおめでとう!サンプルサイズを約1800人にしたのはナイス手堅さ。近しい人が何人かアルツハイマー病なので素直に嬉しいです。 ただ、エーザイ史上最も小さいp値はSELECT試験(303試験)でしょ、そこを忘れちゃいかん。 (p.25より)
Tweet media one
0
63
225
@hankagosa
松浦 健太郎
8 years
最近気付いてしまったんだが、アカデミックに厳しく、院生がバタバタ死ぬ研究室を生き抜いたOB/OGがラボを持った場合、自分の研究室の院生がバタバタ死ぬことに全く抵抗がない。DVと全く同じだ…。
2
259
216
@hankagosa
松浦 健太郎
3 years
検査数のキャパを考慮したモデリングで実際の感染者数やRtを推定するのをそろそろやったほうがいいのかもしれない。そして「今東京で出かけて〇〇人とすれ違うと〇〇%の確率で感染しますよ」と警告したい。
2
55
219
@hankagosa
松浦 健太郎
5 years
独習歴の長いワイからすると、学習のコツは (1)やってて1〜2週間に1度ぐらい「おぉ!」と思えるような楽しめる対象を (2)他人と比べず焦らずに (3)少なくとも半年ぐらいは時間をかけて接する、に尽きてる。(1)の状態にならない場合はまだ早いか、性格に合ってないと見なしてとりあえず放置します。
0
42
210
@hankagosa
松浦 健太郎
6 months
迷わず買った ・生態学者の統計モデリング・因果推論本は買う ・佐藤俊哉先生の本も買う ・原著が評判良ければ訳書も買う
Tweet media one
0
29
211
@hankagosa
松浦 健太郎
4 years
西浦先生らのRコードとStanコード、ほぼ理解できました。資料でよく見る図はRのoptim関数による最尤推定とprofile尤度を使って求めた信頼区間。Stanコードの統計モデルと最尤推定の統計モデルは微妙に意図が異なっていて、西浦先生の発表資料に忠実なのは最尤推定の方やね。
0
50
202
@hankagosa
松浦 健太郎
8 years
実践ベイズモデリングきた!!凝ったモデルをグラフィカルモデルをひたすら紹介していく18章がたまらん。
Tweet media one
Tweet media two
Tweet media three
0
71
207
@hankagosa
松浦 健太郎
4 years
棋士の年齢効果を求めてるのすごい、面白い!今後も要チェックブログやな。 "ベイズ統計モデリングを使って藤井聡太と全盛期の羽生善治を比べてみた②"
1
67
197
@hankagosa
松浦 健太郎
4 years
統計ができてもデータ解析がうまいわけではない。逆も然り。プログラミングもまた別のスキル。英語ができても翻訳がうまいわけではない。最近、そういうギャップに気をつけてメンバーを選んでる。
0
19
198
@hankagosa
松浦 健太郎
6 years
Google翻訳、たまに数値を改ざんしてくるので楽しい。
Tweet media one
0
91
194
@hankagosa
松浦 健太郎
2 years
まだ校正が1ミリもはじまってないけど、先に書影をAmazonとかに載せて焦らせる戦略、日本だけじゃなく海外でも一緒なのか…
2
46
196
@hankagosa
松浦 健太郎
3 years
論文が出版されました。 Matsuura K, Honda J, Hanafi IE, Sozu T, Sakamaki K. Optimal adaptive allocation using deep reinforcement learning in a dose-response study. 臨床試験において、各患者を各用量にどう割り付けるのが良いかを強化学習を用いて求める方法です。
1
36
186
@hankagosa
松浦 健太郎
6 years
何年か前に似た案件で「趣味の分析したいんですがデータ利用申請できますか?」と某滋賀大DS関係の人に聞いたら「は?趣味で分析?ははっ、だめに決まってるでしょ。なんだよ趣味って。」って言われてから個人的な恨みがある。
0
58
179
@hankagosa
松浦 健太郎
3 years
2年ぐらいかけてやっと論文1報出してわかった大変さ。アカデミアの皆さん、こんなシンドイことよく続けられるなぁ、尊敬の念しかない。一般人がやったら病むわ。
2
19
185
@hankagosa
松浦 健太郎
6 years
ただRは人によってクソコードになりやすい傾向はあると思う。他の言語でやるべきfor文満載の数値計算をしたり、dplyr使わないで集計したりすると遅いし可読性がなくて地獄。そこでr-wakalangというslackに、友人のコードですけどね…とか言って投げて添削してもらうと圧倒的に成長できます。
1
48
180
@hankagosa
松浦 健太郎
3 years
論文出版、オープンアクセスにしたらお金もらえるかと思っていたら、逆に約40万円(平均的らしい)払わなきゃいけなくてビビりました。すげーな。出版社こんなところで稼ぐんや。
1
30
177
@hankagosa
松浦 健太郎
7 years
「Rで楽しむベイズ統計入門」読了しました。良かった点: ・例題が身近(藤井四段の連勝とか)で博識な補足が面白い ・式は割と多いが式変形が凄く丁寧 ・「Rで楽しむ統計」があると2倍楽しめる ・MCMCとHMCの説明が物理出身らしく簡潔 ・ジェフリーズの事前分布を推す考え方
1
39
168
@hankagosa
松浦 健太郎
4 years
広く浅く知ってる人より一点に秀でた人が好きなので、色々勉強しようと迷っている人を見かけると「捨てるところからデータサイエンスははじまってますよ」と煽ってしまいがち。
2
16
175
@hankagosa
松浦 健太郎
5 years
最近は因果推論の勉強をしてて、200時間超えたあたりぐらいからやっと少しずつ分かってきた気がする。新しいことを学ぶとき、はじめの数百時間は結果が多少出なくても迷わず継続的にやるしかないと思ってる。
0
36
172
@hankagosa
松浦 健太郎
5 years
hayashiさんに教えてもらい、渡辺先生の最新の講義資料のリンクをメモ。難解な箇所もありますが、第08回の資料p.18「交差検証あるいはWAICを最小化することで得られたハイパーパラメータはテスト損失を最小にしない。」など勉強になります。
@nhayashi1994
Dr. nhayashi
5 years
これ、資料がW先生のページで公開されてるけどかなり勉強になるというか正則なときのAIC, WAICの高次漸近論とハイパラ選択の話などかなり新しい話も載ってて良い。最終話のFaQは回答が書かれてないのでどんな講義になるのかとても気になる動画みたい
1
4
29
0
47
168
@hankagosa
松浦 健太郎
5 years
統計を検定からベイズモデリングに変えても、Cherry picking experimentsの類はほぼ変わらないと思うけどな。現在の形で論文の出版が評価されている限りは。ゲルマン先生のいうところの「要は結婚式であって決して結婚ではない」。
0
58
164
@hankagosa
松浦 健太郎
6 years
Stan開発チームから新しい論文。 Validating Bayesian Inference Algorithms with Simulation-Based Calibration ベイズ推定がうまくいってるのか判断するのは(特に複雑なモデルで)容易でないが、この手法でグラフィカルに確認でる、とのこと。
@betanalpha
\mathfrak{Michael "Shapes Dude" Betancourt}
6 years
Oh, yeah, you can also identify obstructions to a central limit theorem using that slick new SBC algorithm that all the young kids are talking about, .
0
2
40
0
41
165
@hankagosa
松浦 健太郎
7 years
昨日の資料をアップロードしました。→「MCMCサンプルの使い方 ~見る・決める・探す・発生させる~」 #OsakaStan5
0
67
170
@hankagosa
松浦 健太郎
3 years
コロナのデータを用いて、Stanの微分方程式の機能を使ってmodeling (SIR model + ロックダウン)を改善していく例が論文になっています。チュートリアル論文なのでコードや図も多くあって親切でした。
@triadsou
Triad sou.
3 years
TUTORIAL IN BIOSTATISTICS Bayesian workflow for disease transmission modeling in Stan. Léo Grinsztajn, Elizaveta Semenova, Charles C. Margossian, Julien Riou. Statistics in Medicine.
1
12
60
0
37
170
@hankagosa
松浦 健太郎
6 years
出版社の編集者の「何卒、学部生のような若い方々にも読み進められるようになるべく易しく書いてくだされ〜」という依頼に対し、第一線の研究者から「元学部生のオレの経験からみて今のおまえに足りないものがある。危機感だ」みたいなガチ原稿がくるの、嫌いじゃないです。
1
67
164
@hankagosa
松浦 健太郎
5 years
『入門 統計的因果推論』 Pearl先生のCausal Inference in Statisticsの翻訳。まだ未発売。前の黒木先生が訳したPearl先生の本は、冗談で黒木先生自身がdisっててウケた。こちらは内容を絞って易しめにした印象なので期待してます。
0
42
165
@hankagosa
松浦 健太郎
4 years
ほんとこれ。データサイエンティストも全く同じやぞ。知りたいことが先にある。
0
45
166
@hankagosa
松浦 健太郎
1 year
『Rでできるビジュアル統計学 [解析編]』をいただきました! 私自身いつかggplot2+拡張パッケージの応用の本を書きたいなぁと思っていましたが、ほぼすべて含まれた上位互換な感じでとてもおすすめです!ggplot2系以外のフォレストプロットなども載ってます。写真はぜひ使ってみたいDAGを描くところ。
Tweet media one
Tweet media two
0
27
165
@hankagosa
松浦 健太郎
10 months
観察データを悪く言う気持ちも分からなくもないが、What Ifの3章のアブストに「多くの人類の知識は観察研究から導かれている。進化、プレートテクトニクス、地球温暖化、天体物理学のことを考えてごらん。」という一節があって、観察データもええなと思ったね。
0
37
160
@hankagosa
松浦 健太郎
5 years
ArviZ ("AR-vees"と発音する) というPythonのベイズ統計モデリングの可視化ライブラリがあると知った。ベイズ統計モデリングに限らなくとも使えそうで、とても良さそう。
0
35
159
@hankagosa
松浦 健太郎
3 years
ローゼンバウム統計的因果推論入門いただきました。ありがとうございます!ガチ数式だらけと思いきや、ブルーバックスのような科学的な読み物に近く、実例が面白かったです。興味ある読者向けに数式の補足もきちんとしてます。個人的にはもう少し図が欲しかったかな?是非!
Tweet media one
Tweet media two
0
29
155
@hankagosa
松浦 健太郎
6 years
僕は欠測値の扱いと様々な集計や可視化が必要なのでR一択。深層学習ならPythonが情報が多くし書きやすい。速い数値計算ならJuliaが良さそう。要は使い分け。学ぶ場合は、今後どんな業界のどんなデータを触っていく予定なのかが重要かな、と。
1
55
153
@hankagosa
松浦 健太郎
5 years
『社会科学のためのベイズ統計モデリング』をいただきました!数式かっちりしてるのになぜか読みやすく感じます。社会科学のモデルは非線形モデルがよく使われるようですが、その導出の式変形、KL情報量や自由エネルギーなどが非常に勉強になりました。GitHubのリポジトリ:
Tweet media one
0
38
149
@hankagosa
松浦 健太郎
9 months
ブラウザで動くR、WebRが熱い!|えいつぴ #zenn
0
44
155
@hankagosa
松浦 健太郎
6 years
萩原さんの「基礎からわかる時系列分析 Rで実践するカルマンフィルタ・MCMC・粒子フィルタ」はレビューを手伝いましたが、カルマンフィルタから粒子フィルタの発展的なアルゴリズムまでRでシンプルな実装があって本当に勉強になりました。痒い所にもきちんと手が届きます。
Tweet media one
1
50
150
@hankagosa
松浦 健太郎
3 years
データサイエンスや機械学習の流行は、データ(現実)でワイワイできることが増えて、それが成果として得られやすいからじゃないかな。理論はタイムスケールが長く簡単に成果が得られない。人が少なかろうが重要でかっこいいと思っているよ。
0
16
150
@hankagosa
松浦 健太郎
5 years
馬場さん、新刊出るんだ! 『実践Data Scienceシリーズ RとStanではじめるベイズ統計モデリングによるデータ分析入門』楽しみ。 一瞬PyStan本かと思ったらRStan本!
1
43
153
@hankagosa
松浦 健太郎
2 months
Bayesian Data Analysis 3 (BDA3)の翻訳本『ベイズデータ解析 第3版』はいいぞ|ま #zenn
0
51
157
@hankagosa
松浦 健太郎
6 years
某社リクルーター「松浦様のプロフィール(中略)弊社へぜひ!」 僕「(略)御社に知り合いがいますが、御社の労働時間は非常に長いですね。労働環境を改善したら再度連絡ください。」 リ「(略)松浦様のご活躍を心よりお祈り致します。」 こいつら祈り癖がついてやがる💢
2
50
146
@hankagosa
松浦 健太郎
5 years
このブログ、「StanとRでベイズ統計モデリング」をPyMCでひたすら実行しているのもすごいし、独自のデータ解析も面白い。 gaiaskyの技術メモ
0
31
148
@hankagosa
松浦 健太郎
7 years
あのー、僕の本買ってわかんないところあったら気軽にDMくださいね。捨て垢でも何でもOKです。購入してくれた方限定でStan使えるまでフルサポートします。
4
71
146
@hankagosa
松浦 健太郎
5 years
優秀な人と働きたいので、面接でも「御社で最強の統計家or機械学習人材は誰ですか?次回呼んでもらえませんか?」と必ず言うタイプなのですが、最近そういう人は基本的にアカデミアにいると気づいた。だからコラボしやすい職場が良くて、製薬企業もその点では悪くないです。
0
18
146
@hankagosa
松浦 健太郎
6 years
『データサイエンスを実現するソフトウェア』というタイトルで2ページのコラムを書かせていただきました。まあオマケですが、学部〜院生ぐらい向けに頑張って書いたので宜しければ読んでくださいな!
@_kmt46
s.komata
6 years
数理科学、次号は機械学習か
Tweet media one
0
132
327
0
48
141