俵 Profile Banner
俵 Profile

@tawatawara

3,139
Followers
2,150
Following
4,158
Media
98,758
Statuses

KUIS→社情→社会人(8年目) の Python おじさん / 温泉・サウナ巡り / Kaggle 4x Master() / 元競プロer(超ゆるゆる) / 邦楽ロック好き(ゆるふわ) / 突然可愛い絵をRTする My opinions are my own

渋谷周辺
Joined April 2011
Don't wanna be here? Send us removal request.
Pinned Tweet
@tawatawara
3 years
ボイロ好きで二次元絵もよくRTし、食べ物写真で飯テロし、気ままに散歩して写真を上げまくりつつ映画や音楽の感想を言ったりして、たまに思い出したように ML や Kaggle の話をちょびっとだけするアカウントです
0
2
32
@tawatawara
3 years
機械学習の活用事例系のまとまった資料ないかな~って探してたら、それとは別にちょっと参考になりそうな資料を見つけてしまった... JSAIさんこんなの出してたのね
Tweet media one
Tweet media two
Tweet media three
Tweet media four
3
143
879
@tawatawara
3 years
・国内大学院の博士課程の学費を年間200万円まで支給 ・最大で勤務時間の全てを研究活動に充てられる ・メルカリに2年以上在籍する正社員が対象 ・入学金や学費などを原則3年間支給 ・在学中に社員が生み出した知財特許はメルカリ側も利用可能にする ・研究分野は指定しない ほへー
7
102
645
@tawatawara
3 years
目次としては python 入門って感じだけど、"なぜプログラミングを覚えるべきか"の説明がいいな。『出来そうなことや作業量が想像つく』、『細かいやり方はそのときに調べればよい』ってのはまさに。 これを「プログラマ的感覚」と呼ぶのかはわからんけど、多くの人はこの感覚を持ってるように思う。
Tweet media one
Tweet media two
4
111
435
@tawatawara
4 years
人は Kaggle Master になったときポエムを残すという... ということで書きました。 色々なことを思い出しました。今までで最長の記事なのでご注意ください。 はてなブログに投稿しました Kaggle と出会ってから Master になるまで、そしてこれから。 - 俵言 #はてなブログ
2
52
291
@tawatawara
4 years
奇跡の solo gold を獲得し、遂に Kaggle Master になりました! Kaggle と出会ってから4年半、一念発起して分析コンペに本気で取り組み始めてから1年半、長い旅路でした。 今までチームを組んだり議論したりして下さった皆さん、本当にありがとうございました!これからもよろしくお願い致します!
Tweet media one
16
16
280
@tawatawara
4 years
Kaggle Advent Calendar 16日目の記事です。†闇の力† 欲しくないですか? はてなブログに投稿しました #はてなブログ 黒魔術への招待:Neural Network Stacking の探求 - 俵言
2
24
259
@tawatawara
3 years
最終出社日でした。 これからしばらく無職して、3月から次の会社で働きます。
@tawatawara
3 years
さようなら、横浜。我が第三の故郷よ...
Tweet media one
0
1
25
35
3
243
@tawatawara
1 year
こんなの見たことあったっけな?
Tweet media one
1
24
242
@tawatawara
3 years
ちょっとだけ追記と修正を加えて今日の LT 資料を公開しました。pytorch で画像コンペをやる分には間違いなく最強のライブラリだと思います。 #分析コンペLT "backbone としての timm 入門"
2
34
236
@tawatawara
2 years
大変お久しぶりです。一身上の都合により消息不明になっていましたがこの度復活しました。 ご心配をおかけしてしまった皆様にはお詫び申し上げます。 また適当に呟くのでお付き合いください。
12
5
206
@tawatawara
3 years
世は正に大データサイエンス時代(Kaggle 関連も沢山)
Tweet media one
2
22
205
@tawatawara
4 years
え、え、え、え....?????(言葉が出ない)
Tweet media one
51
9
202
@tawatawara
3 years
cuda & cuda driver install challenge は NVIDIA の佐々木さんの記事のおかげでほぼ問題無くなった気がする。 PyTorch は バイナリ版(pip install で入る)に cuDNN が含まれてるから楽なんやけど TensorFlow は色々めんどい(そもそも Docker 使えという話ではあるが…)
2
31
202
@tawatawara
5 years
今日は途中から特徴量管理のコードを書いてた。この前イベントに参加した甲斐があったなあ
0
22
196
@tawatawara
5 years
統計ガチ勢が怖いけど勉強のために書きました。 投げるならマシュマロで出来たマサカリで勘弁して... はてなブログに投稿しました 効果検証入門 1章の個人的最難関だった t 検定の話 - 俵言 #はてなブログ
1
28
189
@tawatawara
3 years
無職期間が終わり、今日から日本でユーザ数が最大であろうトレーディングカードに関連する会社で働きます。 人や組織のグラフデータの研究開発を主にする予定です。 対戦(?)よろしくお願いします🙇‍♂️
3
9
184
@tawatawara
3 years
それで思い出したけど、 #atmaCup の discussion で教えてもらった ipyplot がめちゃくちゃ便利で仕事で重宝している。 画像(& 結果)の一覧表示のために matplotlib ガチャガチャしなくてよくなったし、タブ分けとかラベルの表示とか拡大とかが手軽に出来るのが本当に良い
0
17
178
@tawatawara
4 years
✌️ Kaggle 3xMaster ✌️
Tweet media one
0
1
161
@tawatawara
4 years
久しぶりにこの資料を読んでる データ分析コンペにおいて 特徴量管理に疲弊している全人類に伝えたい想い
0
12
151
@tawatawara
5 years
EfficientNet-b4 だと各クラスが潜在空間上で離散的になるのに対し ResNeXt50 だと連続的になるのがとても面白い。 こういう、潜在空間の作り方から得意・不得意を判断できんかな? 富士フイルムコンペ: 写真の撮影年推定 - 0.06%足りなかった人の解法 - oniman’s blog
2
31
148
@tawatawara
3 years
Happy to announce that I just became Kaggle 4x Master✌️😎✌️
Tweet media one
4
1
146
@tawatawara
4 years
久々にめちゃくちゃ苦労してブログを書きました。骨折り損感がやばい。 GBDT ガチ勢の人に先にお詫びします。ごめんなさい。 はてなブログに投稿しました LightGBM で強引に Multi-Task(は???) Regression を行う - 俵言 #はてなブログ
0
19
135
@tawatawara
3 years
本日の発表資料です。認知度が低すぎると pytorch-pfn-extras と更に認知度の低い Config Systems の紹介をしました。 これで pfn-extras 使いが増えると嬉しいです🙏 #分析コンペLT
1
22
127
@tawatawara
3 years
Kaggle 4x Master になったよポエムを書きました。各カテゴリについて雑に振り返ってみた感じです。 はてなブログに投稿しました #はてなブログ Kaggle * Master になりました - 俵言
0
10
126
@tawatawara
2 years
やっぱりか!絶対評価バグってると思った! "Overfitting"? Nay, it's called #winning . #kaggle -
Tweet media one
3
14
119
@tawatawara
1 year
日を跨いでしまいましたが、第1回関東Kaggler会のLT資料をアップロードしました。 ハイパラの話しかしてないのに思ったより褒めてもらえてで嬉しかったです。 #kanto_kaggler
1
8
118
@tawatawara
3 years
最終的に頼れるのは公式ドキュメントか異常に詳しい謎の個人ブログって相場が決まってるんだよな
0
15
109
@tawatawara
5 years
はてなブログに投稿しました SPAでKaggleするために回った施設を独断と偏見で紹介する - 俵言 #はてなブログ あと一時間しかないですが一応、kaggle アドカレ(その2) の2日目の記事です。遅れてすみません。 またお気持ちブログになってしまったのをお詫び申し上げます。
2
17
108
@tawatawara
1 year
クソワロタ
Tweet media one
2
14
107
@tawatawara
4 years
やっと書けた!遅刻して申し訳ない(寝落ちしてた) 要点は * 全ての data で学習(cosline anealing) * GAP について component ごとに sSE + GAP を用意 * CutMix/MixUp は使わず RandomErasing を使用 * Single Model (snapshot ensemble) です。お疲れ様でした!
2
16
106
@tawatawara
2 years
そしてこれはシャッの福利厚生で購入した、私を地獄に叩き込む鈍器
Tweet media one
1
6
104
@tawatawara
3 years
面白そうなアドベントカレンダーを見つけてしまった... 創作+機械学習 Advent Calendar 2021 を開催します - kivantium活動日記
1
17
102
@tawatawara
4 years
🕊️🎵の baseline を公開しました。 Topic: Trainig: Inference: 面白いコンペなのに諸々の事情で過疎っているので、出るコンペに迷っているという方はぜひご参加ください!
1
13
101
@tawatawara
1 year
これ怒られないかな...大丈夫かな...(まずかったらいらすとやに差し替える予定)
Tweet media one
0
4
102
@tawatawara
1 year
皆様、今日から atmaCup ですね!対戦よろしくお願いします🎂
Tweet media one
18
0
102
@tawatawara
3 years
31 とかおっさんやん.... いや元々おっさんやけど。
Tweet media one
24
0
101
@tawatawara
6 years
タンパク質コンペで22位になった経緯を描きました。ダラダラ書いてますがご了承ください。kaggler 諸兄は不甲斐ない僕をいくらでも煽ってください > はてなブログに投稿しました kaggle で初めてメダル(silver) を取ったものの、お詫びせざるを得ない件 - 俵言 #はてなブログ
1
22
91
@tawatawara
10 months
昨日の懇親会でも話してたんだけど、R&D内に研究員、PM、MLOpsエンジニア、データエンジニア がいて連携してるのって組織として強いよね 研究開発部メンバーの働き⽅ / Sansan R&D Profile
Tweet media one
0
12
93
@tawatawara
1 year
しゃああああああああああ!!!!!!!!!
@tattaka_sun
tattaka
1 year
YATTAAAA
Tweet media one
17
2
111
11
1
93
@tawatawara
4 years
なってしまった...而立なんて程遠いけど、なんとかやってくしかないかあ
Tweet media one
24
1
88
@tawatawara
1 year
飛行機雲のメダル確定してた!僕自身の力だけでは絶対に無理だったので、チームメイトの tattaka さん( @tattaka_sun )には本当に感謝です🙏 僕の長い長い GM への道はまだまだ続いているので、引き続き気長に頑張ります💪
Tweet media one
5
1
88
@tawatawara
5 years
オレオレ tabular NN を作るべく調べ物してたら pytorch の完成度高い奴見つけたので土日に読んでた。wide+deep+text+image を処理可能。 学習等の部分がかなり抽象化されてるのでお試しに使う分には便利なものの、コンペに使うなら要改造。
1
8
87
@tawatawara
2 years
��職初のおちんぎん��見て忠誠心が上がっている
2
3
87
@tawatawara
5 years
昨日のDSB2019振り返り会の資料をアップロードしました。 LightGBM をカスタム損失で順序ロジットモデルに拡張し、QWKの閾値問題から解放された(かった)というお話です。 運営の方々、参加者の皆様ありがとうございました! #dsb2019 反省会
2
15
85
@tawatawara
3 years
僕は職種的には MLエンジニア(と言っても嘘ではない、多分)なのでちよっと興味があるんですけど、DS の方々のレベルアップの仕方って 初級: 基本的(直感的)な可視化(e.g. 二次元)で関係性の仮説を立てられる。
1
11
82
@tawatawara
3 years
初 perfume ワンマン、とても良かったです! アリーナぶち抜いてステージにするの、値段高くなるけどめっちゃ近くで見れるので他のアーティストでもやって欲しい
1
4
79
@tawatawara
10 months
> Transformer が今では一般攻撃魔法 これすき
0
3
80
@tawatawara
3 years
朝にボソッと呟いたことがちょっといいねされてる。 データサイエンスの入門って機械学習アルゴリズム学ぶよりも集計とかプロットとかでデータを可視化して「こういう関係性がありそう...?」って何となく仮説立てるところからなんじゃないかなって(※DSではない一般人の感想です)
3
12
77
@tawatawara
5 years
うーん例の論文軽く読んでみたけど... * 予測するのが RISE or FALL の二値分類 * "Randomly selecting 25% of images for validation," => 「あっ...(察し)」 * そもそも test set という概念が論文中に出てこない
2
14
76
@tawatawara
2 years
転活時に朧げにイメージしてたのは 1. テックリード的な人 2. プレイングマネージャー 3. 社内にいるなんかやたらと技術に詳しいけど何の仕事やってるかよくわからんおじさん 3を目指したい
@tawatawara
2 years
転したばかりなのでキャリア云々よりもまず明日を生き抜くキャッチアップが求められている
0
0
2
0
13
76
@tawatawara
4 years
この状態で駅ビル通ってきたのかと思うと普通に頭おかしい
Tweet media one
4
7
75
@tawatawara
4 years
> 企業でも最先端のデータサイエンス研究をして論文をだしながらプロダクトに実装する仕事をする人 これ日本に存在するの?砂漠で砂金探してない?
1
10
71
@tawatawara
1 year
新テーブルコンペ来てるやん。手首に付けた加速度計から睡眠状態を判定するタスク。 1系列1ラベルじゃなくて系列中の特定の step に対して予測するっぽいから少しややこしいかも。時系列予測って感じ。
0
5
73
@tawatawara
3 years
DS職にとっては莫大な自社事業データと整った機械学習基盤があるのは魅力的なんだよな
1
7
72
@tawatawara
4 years
pandasくん結構こういうのあるよね。excel関連で「いや公式に書いてよ...」って思ったのは、一枚一枚 (file, sheet)するんじゃなくて、obj = pd.ExcelFile(file) からの obj.parse(sheet) ってした方がめちゃ速く処理できるやつです(JTC特有の何十枚もsheetがあるexcel)
2
10
70
@tawatawara
5 years
ドボン solution 書きました (pool english は許して...). 概要を言うと 1. 異なるアス比のモデルを作って ensemble 2. 魔法陣(GNN)による黒魔術(stacking) 3. image size の情報を meta feature として入れる(微上昇) になります。実は 2 がやりたかっただけなんだ..
6
7
69
@tawatawara
3 years
読んでる途中で心がメッタ刺しにされて泣いてる... いや、確かにわかるんだけど、理屈としてとても正しいことが書かれているのはわかるんだけど、「あーいけませんお客様!昔の私を思い出させる行為はお辞めくださいお客様!」って感じ
1
14
68
@tawatawara
5 years
はてなブログに投稿しました 分析コンペLT会 #1 に参加しました - 俵言 #はてなブログ 朝投稿するつもりだったのですが遅れてしまいました。昨日の分析LT会の感想文です #かぐるーど
6
18
66
@tawatawara
4 years
今回は custom metric 使ってる人ならみんな知ってそうな話です。またもや記事が妙に長くなってしまった... はてなブログに投稿しました 小ネタ:LightGBM の objective を metric から消し去る - 俵言 #はてなブログ
1
4
67
@tawatawara
5 years
結局ロックな時間に公開することになってしまった。学習を回してる間暇だという方は暇つぶしにご覧ください。meetup の復習(?) になるかもしれません。 はてなブログに投稿しました 【感想文】今更ながら Kaggle Tokyo Meetup #6 を振り返る - 俵言 #はてなブログ
1
10
66
@tawatawara
3 years
コンペのお題には一切言及していないので載せますが(ダメだったら消します🙏)、この二つの関数が良い感じにかけたので私は大変満足しています😤 #atmaCup (まあデータ量増えたらメモリ的にしんどい時もあるだろうけど...)
Tweet media one
Tweet media two
@tawatawara
3 years
と言うわけでよわよわ v2 です。個人的には特徴量作成のコードがめっちゃ綺麗に書けた(気がする)ので見てほしい [CV: 0.7938, LB: 0.6958] 勝手によわよわ Baseline 作ってみました![リターンズ] #atmaCup
0
1
3
2
4
66
@tawatawara
4 years
お恵みを頂き、(価値があるかは別として)世にも珍しい Dataset Master になりました。ありがとうございます!
Tweet media one
Tweet media two
@tawatawara
4 years
🕊️🐸 で公開された 🕊️🎵のを流用した notebook に遥か昔に作った Dataset が attach されたままだったんですけど、あと一人...あと一人だったのに...
Tweet media one
Tweet media two
0
0
3
0
4
64
@tawatawara
5 years
Instant Gratificationのメダルが確定し、やっとExpertになりました。一緒に戦って頂いた @gegegegegege さん、 @y4tk38 さん、 @IpGDUBmnRekbPCb さん、 @toshiki_ml さん、本当にありがとうございました! かなり特殊なコンペで金を取ってしまったので、次の金を目指してこれからも頑張ります💪
Tweet media one
7
0
64
@tawatawara
5 years
うおおおおおおおおおおおおおおおお!!!!!!!!!
Tweet media one
6
0
62
@tawatawara
3 years
データサイエンスの基礎と機械学習の基礎は異なるということは気を付けておきたい
0
3
62
@tawatawara
3 years
正直な感想を述べると「Kaggle でメダルを取る方法」よりも「Kaggle を楽しむ方法」を教える講座の方が楽しそう(楽しめたら勝手にメダル取るとこまで行くでしょというお気持ち)
1
1
60
@tawatawara
3 years
遅くなりましたが #atmaCup #11 のソースコードを公開しました。 pfn-extras 使い以外お断り実装になっているのでご注意ください。一応 resnet18d だけは一通り学習をやり直して動作確認しました。
@tawatawara
3 years
Solution を投稿しました。特別なことはしていなくて、結局 1-3 位に入るには ViT 系が必須だったなあという印象です。Self-Supervised Learning の良い勉強になりました。 5th Solution:SimSiam Is My Friend #atmaCup
0
5
50
0
4
62
@tawatawara
6 years
あまりに何も成果を上げられなかったため、せめてプロセスを記録として残すことにした。ブログ触ったのいつぶりだろう... > はてなブログに投稿しました 初めての画像分類コンペでめっちゃ頑張って上位まで行ったが、閾値を攻め過ぎて大爆死した - 俵言 #はてなブログ
1
7
61
@tawatawara
2 years
この右の🐧、何かわかる...? Windows Subsystem for Linux のアイコンなんだぜ...? Ubuntu のアイコンに戻して...戻して...(切実)
Tweet media one
1
17
61
@tawatawara
4 years
自分の計算資源とにらめっこするために各種モデルのパラメータ数を知りたいとき、timm の repository にある表がめっちゃ助かる
1
5
60
@tawatawara
2 years
Kaggle について「1%の精度を〜」っていう人、一からベースラインを作れることの大切さを全くわかってないし、だからエアプだって言われるんだと思う
0
4
59
@tawatawara
4 years
きままにコードを書いて気が向いたらふらっと外に出て散歩したりする。こんな生活がずっと続けばいいのになあ
0
10
59
@tawatawara
3 years
機械学習界隈の会社間異動リスト、誰か作ってくれないかな(単純に眺めてみたいだけ)
1
3
57
@tawatawara
5 years
🐕生成コンペ、 ・インターネットアクセス禁止 ・外部データ禁止(**publicな学習済みモデルも禁止**) ・カーネルへのデータの追加禁止(勿論他のカーネルの出力も使用不可) となっており、僕たちが待ち望んでいた真のkernel-onlyコンペ ってことだから激熱では?
1
11
58
@tawatawara
4 years
MixUp と BC Learning の違い何だったっけと調べたらしこあんニキが良い記事を書いてくれていた。 > もともとの着想は音声認識から > 異なるクラスの異なる2枚の画像 > ... あれ、最近関連しそうなコンペが launch されてませんでしたっけ...🐦
1
12
58
@tawatawara
6 years
やったぜ!初メダルだ!
Tweet media one
5
7
57
@tawatawara
9 months
Kaggle Advent Calendar 2日目の記事です。復習も兼ねて #kaggle_tokyo を振り返りました! はてなブログに投稿しました Kaggle Tokyo Meetup 2023 参加記 - 俵言 #はてなブログ
0
11
58
@tawatawara
4 years
my new gear...
Tweet media one
Tweet media two
Tweet media three
Tweet media four
1
5
56
@tawatawara
4 years
楽しそうな資料を発見した。北大に木が好きな研究室があるって聞いたけどこの人がいるところなのかな。 決定木・回帰木に基づくアンサンブル学習の最近 #decisiontrees #extratrees @SlideShare さんから
0
7
55
@tawatawara
4 years
自信満々に DS・MLエンジニア・Researcher 等を名乗れるのは本物か、(良くない意味で)やばい奴のどちらかな気がする。 多くの人は色んな役割の間を漂い迷っている...
0
2
54
@tawatawara
3 years
RANZCR ちょい shakeup した。.973 の sub を選べなかったのがちょっと悔しいけど、転落しなかったので良かったです。
Tweet media one
1
0
55
@tawatawara
3 years
機械学習とデータサイエンスはイコールではないはず...
2
4
54
@tawatawara
1 year
>ser_idごとにどのanime_idを見たかを0,1で(2000列) >anime_idごとにどのuser_idに見られているかを0,1で(1998列) >上記2つ��特徴量だけでPublic LB 1.1882, Private LB 1.1562 (25位相当)になります。 これびっくりした。面白い 12th place solution #atmaCup
1
0
54
@tawatawara
3 years
久々に EDA Notebook を作りました。前からやってみたかった、公開した Baseline の重みを使って可視化してみるというやつです。 tSNE 使った可視化でこんなにきれいに pos/neg が分かれるの初めてかも... Notebook: Discussion:
Tweet media one
Tweet media two
1
4
54
@tawatawara
3 years
あけましておめでとうございます!
1
0
52
@tawatawara
3 years
ワイの Kaggle での夢は、コンペの完全理解者になってエレガントな解法を提案し、計算機パワーで殴ることしかできない人々に圧倒的勝利を果たすことです (これが出来たら満足して引退するかもしれん)
1
1
51
@tawatawara
8 months
??????????? "Overfitting"? Nay, it's called #winning . #kaggle -
Tweet media one
1
3
50
@tawatawara
4 years
ダメだ、そろそろ会社行く準備しないと... めっちゃ真面目に振り返ってたら超長くなってしまっている(現在1万6千字)、読む人選びそうだなこの記事...
Tweet media one
0
0
49