すずどら Profile Banner
すずどら Profile
すずどら

@sz_dr

1,786
Followers
883
Following
1,122
Media
59,004
Statuses

Search Relevance Engineer/Manager

Joined March 2011
Don't wanna be here? Send us removal request.
Pinned Tweet
@sz_dr
すずどら
1 year
執筆しました!
@oreilly_japan
O'Reilly Japan
1 year
8月発行予定の新刊『機械学習による検索ランキング改善ガイド ―技術解説とハンズオンで学ぶ機械学習ランキングモデルの導入と改善』の情報をAmazonおよび楽天ブックスで公開開始しました!
0
42
131
1
24
128
@sz_dr
すずどら
1 year
これを参考に、弊家もGrafana育児ダッシュボードできてきた あとはswitchbot連携で部屋の温度・湿度を表示できるようにしたら、だいたい完成かなー
Tweet media one
@Dr10_TakeHiro
Dr.10(どく・とぉと読んでください)
1 year
@sz_dr 我が家の最終形態こんな 日中妻が試す→不満・希望を夕方俺に伝達→夜俺が治すみたいなサイクルを2週間回した後の図
Tweet media one
4
144
464
7
355
1K
@sz_dr
すずどら
2 years
数式での説明面白いな…
Tweet media one
1
89
509
@sz_dr
すずどら
5 years
本日は検索技術勉強会で、ヤフーにおける機械学習検索ランキングの取り組みについて紹介します! #searchtechjp 資料↓(後で差し替えるかも)
0
94
368
@sz_dr
すずどら
2 years
メルカリデータセット公開すごいですね! "大学および公的研究機関の研究者を対象として提供します"とのことなので私は触れませんが、このデータセットで色々遊べるんじゃないかなって思います
1
89
292
@sz_dr
すずどら
1 year
子供が生まれました、男の子です👶
Tweet media one
31
0
231
@sz_dr
すずどら
8 years
Hidden Trump Model (HTM)
Tweet media one
0
167
191
@sz_dr
すずどら
9 years
図書館前の撮影会場、ソフマップみを感じる
Tweet media one
0
154
172
@sz_dr
すずどら
5 years
スライド作成テクなんですけど、スライドのカラーテーマをmatplotlibのデフォルト色に合わせておくと、図を貼った時に違和感無いです。そもそもmatplotlib (>= v2.0) のデフォルト色自体もかわいいのでオススメです
Tweet media one
0
24
188
@sz_dr
すずどら
4 years
Facebookのベクトル検索論文、ベクトル検索やりたい勢にかなりオススメ どうやってデータ集めるか/最適化するか・近似最近傍のパラメータどう調整するかなど情報満載 "Embedding-based Retrieval in Facebook Search"
1
39
191
@sz_dr
すずどら
8 years
この画像,任意の学生への心に悪いから止めて欲しい
Tweet media one
0
131
130
@sz_dr
すずどら
4 years
Transformer比較論文で紹介されてたけど、↓が世界で一番分かりやすいTransformer記事な気がする
0
17
172
@sz_dr
すずどら
3 years
ここ数年で弊社の機械学習環境がガンガン進化してます(いつもお世話になってます🙏) ヤフーのAIプラットフォーム紹介 〜 AI開発をより手軽に #ヤフー
0
20
156
@sz_dr
すずどら
2 years
推薦システム実践入門とても良い、、 レコメンドに関わっているいないに関わらず、webデータサイエンティスト全員におすすめです
2
20
151
@sz_dr
すずどら
3 years
恐ろしく質が高い資料群が充実していて、椅子から転げ落ちるくらいびっくりした CAの新卒の方々恵まれていますねと素直に思ってしまった(ので、参考にしながら導入します) 新卒データサイエンティスト研修「DSOps研修」とは何か? | CyberAgent Developers Blog
0
8
138
@sz_dr
すずどら
10 years
論文で使われたデータセットが公開されてないことを知ったときのピカチュウ http://t.co/WYvHgz6rC4
Tweet media one
0
116
119
@sz_dr
すずどら
2 years
@kaitou_ryaku 1001=7×11×13(これは覚えておく) 2002=7×11×13×2 2023=2002+21なので7で割れる というテクを知りました
1
11
122
@sz_dr
すずどら
5 years
うわーこの論文完全に見逃してた… ランク学習というとだいたいみんなLambdaRank(LambdaMART)使ってて、経験的に性能が良いことは知られてるけど、それにちゃんと理論を与えた論文 The LambdaLoss Framework for Ranking Metric Optimization
1
22
107
@sz_dr
すずどら
2 years
『読みやすいコードのガイドライン』読んだ! 『リーダブルコード』の発展本という印象です 自分もBadなコード書いてるところあるな〜と思い直せた本でした コードレビューで、「本のページ◯◯を参考にしてください〜」のような使い方ができるのも良さそう
0
14
106
@sz_dr
すずどら
6 years
@kaitou_ryaku 遺伝的アルゴリズムだ!
1
7
75
@sz_dr
すずどら
3 years
ヤフーにおけるサイエンスの動き方が良くまとまってるインタビューだった (弊チームのエースも👀) ヤフーのデータサイエンティストが語る、データ分析をサービス改善と会社の成長につなげる醍醐味とは #ヤフー
3
19
104
@sz_dr
すずどら
2 years
こちらの本の9章および12章を執筆しました。 著者の私が言うのもなんですが、検索エンジニア・検索システムに関わるデータサイエンティスト必携の書になったのではと思います!!!
@golden_lucky
専門性・売上・原稿
2 years
というわけで、新刊です。これ一冊で検索システムつくれます。少なくとも、作るための第一歩を踏み出せます。すでに作っている人には、もっといい感じの検索を提供するにはどんな手があるのか、ヒントがたくさんあります!
1
198
601
1
22
100
@sz_dr
すずどら
7 years
学振のこと1/2ファーウェイって言うのやめろ
1
51
89
@sz_dr
すずどら
5 years
本日のMachine learning papers reading pitch #5 でお話させていただいた、「E-Commerce検索におけるランキング研究」の発表資料です、みなさまありがとうございました!
0
18
93
@sz_dr
すずどら
3 years
(機械学習に限らないが)A/Bテスト本で各社のA/Bテスト成功率はそもそも低い(GoogleやBing:10-20%など)という話もあるので、うまくいかないことは大いにありうるという認識をしつつ、バットを振り続ける必要がある
0
13
92
@sz_dr
すずどら
4 years
Yahoo! JAPAN Tech Conference 2021で「ヤフーの検索基盤と機械学習検索ランキング」のセッションがあります!興味ある方はぜひー!
0
15
87
@sz_dr
すずどら
3 years
ヤフーの検索エンジニアのポジションが二つオープンされました、ご興味のある方はぜひご連絡・エントリーお願いします🙏 ・機械学習による検索ランキング改善 ・検索エンジン上で動作するランキングプラグインをはじめとした、検索エンジン開発
4
20
82
@sz_dr
すずどら
10 months
「この論文を要約しなさい」というInputに対して、Abstractの項をそのまま出力すれば、LLMいらないかつ超高速かつ超精度良いんですよね
1
6
83
@sz_dr
すずどら
9 years
連番IDを特徴量に入れるの最高,みんなも連番IDを特徴量に入れて予測精度100%達成しような
0
66
71
@sz_dr
すずどら
7 years
卒論発表思い出すシリーズ、「君が何もやっていないことが分かりました」
1
26
68
@sz_dr
すずどら
5 years
機械学習エンジニアって言葉使わない方が良いと思ってる理由に繋がってて、なんで機械学習前提で仕事進めるんだろう的な…
2
9
65
@sz_dr
すずどら
2 years
p値の設定に関してかなり刺されていて面白い 塩野義製薬の新型コロナ治療薬候補・ゾコーバ錠は「継続審議」 第3相パートの成績で再審議 薬食審・合同会議
0
19
69
@sz_dr
すずどら
9 years
Tweet media one
0
75
65
@sz_dr
すずどら
1 year
ぴよログのエクスポート結果をパースしてMySQL(Planetscale)に突っ込むところまではできた エクスポート結果がテキストファイルで視認性が良いのは良いんですが、構造化されていないのでパースがダルいのが辛いポイント、、
Tweet media one
1
17
69
@sz_dr
すずどら
6 years
エレベーター混雑問題、真に解くべきはエレベーター混雑の解消ではなく、エレベーター混雑によるイライラなので、例えば寿司を置いておけば良いと思う
0
38
58
@sz_dr
すずどら
4 years
GBDTの解説、カステラ本とXGBoostドキュメントを両方読んだら絶対混乱すると思う カステラ本は回帰木を擬似残差にフィットさせていくんだよ〜っていうクラシカルな解説をしているけど、XGBoostドキュメントはt本目の木を追加する時の損失関数をテイラー展開して〜って解説をしている
1
7
67
@sz_dr
すずどら
4 years
機械学習コンペ、プロダクションで動かすためのモデルを得るために開催するより、精度上限を見積もるのを目的にするべき?(もちろん、プロダクションで動くモデルもあるんでしょうけど)
1
7
65
@sz_dr
すずどら
4 years
👀 クックパッドにおける推薦(と検索)の取り組み
0
9
63
@sz_dr
すずどら
10 years
今日のゼミの様子です http://t.co/F6N8v1iw0k
Tweet media one
1
22
54
@sz_dr
すずどら
3 years
来期からチームリーダーを務めます、いわゆるプレイングマネージャーな働き方をします、対戦よろしくおねがいします!
1
0
59
@sz_dr
すずどら
3 years
そういえば、「なぜ、mlopsをやるべきか」について、皆さまどうやって説明されてます? 例えば、「mlopsしてもモデルの精度上がらないじゃん?モデルの精度上げる仕事してよ」ってコメントに、どう返してるか…など (念の為、所属組織への不満を表すtweetでは全くありません、、)
5
10
60
@sz_dr
すずどら
2 years
Pinterestの商品embedding論文を読んだ。 PinterestではPin embeddingやPin検索のためのクエリembeddingを作っているが、それを商品にも流用する。 損失関数が昨今のNeural Retrieval手法てんこ盛りセットって感じで笑った、ちゃんとAblation Studyしてるのも偉い
1
4
60
@sz_dr
すずどら
5 years
Alibabaのレコメ論文について発表しますー 目的関数が複数ある(ECレコメだと、売上&クリック率)問題に対して、パレート最適解を求める手法を提案し、A/Bテストで売上&クリック率両方上げられたよ〜という話です RecSys2019論文読み会
0
8
58
@sz_dr
すずどら
10 years
Tweet media one
0
43
44
@sz_dr
すずどら
2 years
RetrievalとRankingとで、モデルの目指す方向性が違うので、別々にモデル組みたい派ですね、、 Retrieval:GoodとBadを見分ける Ranking:Goodの中にいるExcellentを見分ける
@kazunori_279
Kazunori Sato
2 years
TFチームの人と話してると、Two-Towerでembedding取得→ScaNNでANN→さらに検索品質上げるためにRankingモデル適用...ってフローが常識でしょ、みたいに言うから、それどれだけ世の中に広まってるのか知りたい。
1
5
35
1
11
56
@sz_dr
すずどら
3 years
データサイエンスで稼げるのはあと3年、全くそんな気がしないんだけど、まあドメインに依るんでしょうね…
2
2
49
@sz_dr
すずどら
10 years
うちのラボ、もうダメだな、と思う瞬間が、ある…😱 昼休みに、新人が外に出て行くときなんか、まさにそうだ😂 まだ進捗の無い新人なんかに、休みを与えて、いいものだろうか❓❓😤😤😤 新人は、「24時間研究」がセオリーでは、なかっただろうか❓😭 もうオワリだ…😨
0
27
42
@sz_dr
すずどら
5 years
おっAlibabaから面白そうな論文が Beyond the Ground-Truth: An Evaluator-Generator Framework for Group-wise Learning-to-Rank in E-Commerce
3
5
52
@sz_dr
すずどら
5 years
めっちゃグッときた、検索やりたい人みんなにオススメしていきたい 新規サービスの検索システム立ち上げ時に考慮すること #Qiita
0
9
52
@sz_dr
すずどら
1 year
著者献本いただきました🙌
Tweet media one
@oreilly_japan
O'Reilly Japan
1 year
機械学習による検索ランキング改善ガイド
0
7
35
1
2
52
@sz_dr
すずどら
3 years
今日はブリーダーさんの元へ見学に行き、この子を家族に迎えることにしました まだ生後間もないので、お家に来るのはもうちょい後…
Tweet media one
4
0
52
@sz_dr
すずどら
4 years
みんなLightGBMのハイパラ探索してるけど、頑張って探索して劇的に精度変わります…?学習率と木の本数さえ気をつけてれば良く無いですか…?
1
7
47
@sz_dr
すずどら
4 years
情報検索、コンピュータサイエンスのテク全部入りなので、コンピュータサイエンスの全ての分野に精通した人来てくれ頼む…!って感じ
1
9
47
@sz_dr
すずどら
2 years
検索システム本も出たし、推薦システム本も出たし、web業界におけるデータサイエンスの知の高速道路が整備されていくのを感じる
0
5
49
@sz_dr
すずどら
4 years
この論文、検索ランキング改善に携わってる人にめっちゃオススメです。Deep使ってようが使ってなかろうが、ランキング改善の進め方ヒントが満載でした
@rejasupotaro
rejasupotaro
4 years
Airbnbの検索の改善で、前回がトラディショナルなLearning to RankモデルからNNに移行する話で、今回はNNのモデルをどうやって改善したかといういいこと書いてあった / Improving Deep Learning For Airbnb Search
0
16
101
0
1
48
@sz_dr
すずどら
5 years
web企業が機械学習で解きたい課題のおおよそ半分くらいはランキングの問題なので(言い過ぎ)、learning to rankはオススメです
1
4
43
@sz_dr
すずどら
2 years
NAVERさんがGPT-3×商品検索の論文を出しているのを発見した "Ask Me What You Need: Product Retrieval using Knowledge from GPT-3"
1
4
49
@sz_dr
すずどら
3 years
弊社レコメンド基盤開発チームのポジションが公開されました👀 複数サービスに携われるかつリクエストが恐ろしくバンバン飛んでくるので、チャレンジングな経験ができると思います
0
10
47
@sz_dr
すずどら
7 years
新卒一年目給与です(パイセンから煽られた) 控除額がバグってるのは、社食行きまくったり401k枠だったりですね……
Tweet media one
6
13
42
@sz_dr
すずどら
5 years
今日の学びとしては、同棲におけるパートナーの続柄は「婚約者」と記載する、ということです
3
7
40
@sz_dr
すずどら
11 months
RAGの検索部分に求められる点として、精度だけではなくヒット集合の多様性も挙げられそう 例えば「岸田総理の貢献はなに?」という質問に対して、単一のトピックだけ取得するのではなく、なるべく複数のトピックを含めて生成するのが良い
2
5
43
@sz_dr
すずどら
4 years
age+=1
9
0
45
@sz_dr
すずどら
4 years
ハウルの何故か動いている機械学習システムの城
0
6
42
@sz_dr
すずどら
8 years
プログラミングしないの!?えっ!?工業大学なのに!?何すんの!?クリスマスなのに!?えっ!?工業大学なのに!?計算回さないの!?何すんの!?ジョブ投げないの!?クリスマスなのに!?東工大なのに!?設計しないの!?何すんの!?しかも情報系!?何すんの!?
1
29
36
@sz_dr
すずどら
5 years
今日も一日
Tweet media one
0
17
41
@sz_dr
すずどら
5 years
明日は彼女のご実家にご挨拶へ伺うため、もろもろ気合いチャージしている
6
1
41
@sz_dr
すずどら
8 years
卒論・修論tips書いた
1
24
38
@sz_dr
すずどら
2 years
私が感じる検索の楽しさ:web企業がやってることを抽象化すると半分くらいは「検索」になること、情報検索が情報工学の総合格闘技なところ、って感じかなあ
1
5
43
@sz_dr
すずどら
10 years
今日のゼミの様子です http://t.co/q1YqMuAfQA
Tweet media one
0
30
38
@sz_dr
すずどら
4 years
そこまでして頑張らないとニューラルモデル > GBDTにならないのであれば、GBDTで良くないですか…ってお気持ち
0
8
39
@sz_dr
すずどら
5 years
pythonでclassを書いたら、それは既にpythonで書くべきコードではないという過激派もいます
0
4
40
@sz_dr
すずどら
6 years
まーた教員が新入生にtwitterで雑絡みしてる
1
12
34
@sz_dr
すずどら
4 years
いつの間にOptunaにLightGBMTunerCVという神実装が入ってた
0
7
35
@sz_dr
すずどら
8 years
3分くらいで作った自動孵化装置
Tweet media one
0
33
36
@sz_dr
すずどら
7 years
図です
Tweet media one
1
22
35
@sz_dr
すずどら
8 years
卒論謝辞でかのぴっぴに感謝したら、ボスに添削された話はな
0
10
35
@sz_dr
すずどら
4 years
Buttcher本やっていくAdC生やしました、興味ある方は寄稿お願いします! 「情報検索:検索エンジンの実装と評価」(Buttcher本) Advent Calendar 2020
2
6
38
@sz_dr
すずどら
5 years
(少なくとも個人的には)かなり重要な論文かも。レコメ出したおかげで商品買われたんですか?レコメ出さなくてもその商品買われたんじゃないですか?に注目 Uplift-based evaluation and optimization of recommenders
0
2
36
@sz_dr
すずどら
7 years
容姿端麗成績優秀深層学習、今日見た単語で一番パワーに溢れている
1
12
31
@sz_dr
すずどら
4 years
値が小さいほど嬉しい指標は直感的でないのでイケてない 誤差0.000001です!よりも、正確度5000兆です!の方がカッコいいでしょ
1
4
34
@sz_dr
すずどら
4 years
ホワイトボード届いた!!高まる〜〜↑↑
Tweet media one
1
0
35
@sz_dr
すずどら
4 years
Amazonで「独学大全」と検索するとスクショのような結果が返ってくるのですが、これすごくないですか? まず、単純なキーワードマッチはやっていないことが分かるのと、「独学大全」を欲しがる人が読みそうな本がずらっと並んでいる
Tweet media one
1
7
34
@sz_dr
すずどら
5 years
検索、情報分野の集合体なのでめちゃくちゃ面白いですよ、クエリ・文書の自然言語処理から検索エンジンの運用までワイワイ!
1
5
34
@sz_dr
すずどら
3 years
お家に子猫が来ました
Tweet media one
0
1
35
@sz_dr
すずどら
3 years
ワクチン副反応を乗り越えた経験として言えるのは、アイスもっと買っておけば良かったってことですね。 ワクチン副反応に限らずアイスはたくさん食べたいのですが、、
3
6
34
@sz_dr
すずどら
5 years
👀 ベクトル検索(近似最近傍探索)でいい感じの MoreLikeThis を実現する by @moco_beta
0
4
32
@sz_dr
すずどら
5 years
A/Bテスト論文ノックやるか A/Bテストのベストプラクティスと落とし穴 ~KDD2019 レポート~ - Gunosyデータ分析ブログ
0
3
31
@sz_dr
すずどら
2 years
ECサイトにおける書籍のレコメンドよりも、大型書店の陳列の方が圧倒的に気づきが大きく、ついつい購入してしまうので、書籍のレコメンドの伸びしろはまだまだ大きいと思ってるんですよね、、 (一度に目に入るアイテム数が、書店陳列の方が圧倒的に多く、それで良い説)
2
2
34
@sz_dr
すずどら
9 years
内々定もらったので就活終了です
12
0
30