@s1ok69oo
DataScientist @CyberAgent , inc.ABEMAの効果検証.発言はn=1の見解です. ブログ: 登壇資料:
因果推論/EDA|サイエンスでABEMAを動かすデータサイエンティスト募集!(サイバーエージェントグループ)の求人情報です。 | HRMOS
@kslibra
@knights_glenn
@joseanbengo
@StaxtoputaMadre
@WhopWitDaChop
@ibubohay2
@Lagalatzia
@AfocAfoc447810
@CopbkkRTP
@laGattaSakura
@khalidshahs
@kd_174
@brockingtonian
@LockedOnHeels
@TZuercher
@TekaAQW
@LumosNotNox
@Bromund
@myriamthm
@ColoradoCollege
@DutchBKate
@telestomato
@parker_shonts
@sugartacola
@Seveninsan2023
@DanytlawG
@OMATSU_UG
@0xsmac
@mrelonabmusk
@EfsaneKomik
@stwmaniax
@WitsGCI
@621nakata
@kryptcndaughter
@myemtv
@____Oo25t
(図書館学系の話題でもあるからちょっと悩んだけれど、文献読解全般に関する内容だからこちらへ) 既に日々論文をバリバリ読んでいるひとには今更な記事だろうけれど、分野ごとの違いもあって興味深かったのでざっくり記録する。 論文を大量に読む際に、頭から几帳面に読んでいると時間がどれほどあっても足りないし、後から「こんなことが書…
2021年度・2022年度 リクルート エンジニアコース新人研修の講義資料です
2023年2月16日開催、サイバーエージェント メディア事業部主催のデータ活用に関する勉強会「メディアサービスにおけるデータ・AIの活用事例 #2」登壇資料です。 https://cyberagent.connpass.com/event/270224/
機械学習を「社会実装」する際に待ち受けている罠と、その解決方法の考察 (2022年版) です。 ※この資料は、東京大学グローバル消費インテリジェンス寄付講座(GCI)2021 Winterの講義で使用したものです。 https://gci.t.u-tokyo.ac.jp/gci-2021-win…
AI事業本部では,3年ほど前からビジネスへの貢献や課題解決を,「実務者としてのデータサイエンティスト」の大まかな役割として設定し、さまざまな活動を行ってきました。本記事では、その中の中心的な活動の1つであるDSOps研修という新卒DS向けの研修についてご紹介します。
この記事はNuco Advent Calendar 2022の1日目の記事ですはじめにやる気を削ぐ会議術会議(かいぎ)は、関係者が集まり、特定の目的(議題)に関して意見交換・審議し、合意・施策…
はじめに ARISE analytics の近藤です。本記事では、次世代の意思決定技術として注目されている反実 […]
2023/10/09更新Jupyter AIがAmazon Bedrockに対応しましたので早速試しました。Jupyter AI自体も完成度が増している印象です。https://moritalo…
At Netflix, we want to entertain the world through creating engaging content and helping members discover the titles they will love. Key to…
CA Tech Loungeの一期生ML/DSのGoriraTatsuです。この記事はCA Tech Lounge Advent Calendar 2023の8日目の記事になります。普段は都内の私立…
京都大学大学院 医学研究科社会健康医学系専攻 AMED生物統計家育成支援事業聴講コース 臨床研究者のための生物統計学https://ocw.kyoto-u.ac.jp/course/328/「仮説検定とP値の誤解」佐藤 俊哉 医学研究科 教授2017年10月19日00:00 検定とP値のさまざまな誤解 13:43...
Presentation at 2018.11.14 Web Person's Summit in Tokyo https://webtan.impress.co.jp/events/201811 こちらにスライドの内容の解説記事があります https://note.mu/notes/n854…
ブレインパッド社内勉強会での発表スライドを公開しました 本スライドは #OpenBP の活動の一環として公開しています https://twitter.com/search?q=%23OpenBP&src=hashtag_click #OpenBPとは→ https://note.mu/ysd…
はじめに 2023年12月より協業リテールメディアdiv.にてインターンシップをしています。早稲田大 ...
はじめに予測モデル(機械学習モデル)を解釈するのに有用なSHAPを用いて因果関係を説明することができるか、についてPythonによるシミュレーションを交えてまとめました。内容に誤り等ございましたら…
株式会社var社のLT会でデータエンジニア��ついてお話しました。 主観とデータサイエンティストとしてのポジショントークが入り混じった内容になってますので、ツッコミが多い内容だとは思いますが、そこはご容赦いただけますと幸いです。 株式会社var社の会社概要: https://var.co.jp/ …
社内勉強会の発表資料です。高橋先生の「統計的因果推論の理論と実装」のChapter1と2の内容についてまとめています。 参考リンク(マイメディア) - 相関関係と因果関係と疑似相関 https://zenn.dev/s1ok69oo/articles/3d748c399da774 - …
久保拓弥氏(北大)による階層ベイズ法とマルコフ連鎖モンテカルロ法の応用についての講義です。前半は最尤推定やGLMなど入門的なことがらから解き明かしています。 参考文献 「データ解析のための統計モデリング入門: 一般化線形モデル・階層ベイズモデル・MCMC」(岩波書店、 2012)※ニコニコ生放送におけるコメントは...
はじめに因果推論を行う手法の1つとして、線形回帰が挙げられます。今回は、その線形回帰の拡張とも言えるリッジ回帰(Ridge回帰)やラッソ回帰(Lasso回帰)を用いて因果効果を推定してみるとどうな…
私が検索エンジンのABテストでハマってしまったユーザー内相関の落とし穴を突破する方法を紹介します。
2023年6月19日に社内で発表したLT資料です. SHAPでありがちなミスリーディングや,特徴量が予測に与える影響(因果効果)を推定できるケースについて紹介しました. 資料内で出てくるリンクは以下です(参照日: 2023年6月13日) https://arxiv.org/abs/2011.0…
2023年12月2日に開催されたJapan.RのLT資料です。 処置と割当の不一致や効果の異質性によって効果が検出できない際に、操作変数を用いて効果を推定する方法を紹介しています。 因果推論・効果検証に興味のある方は、ぜひご一読いただけますと幸いです。
社内勉強会の発表資料です.高橋先生の「統計的因果推論の理論と実装」のChapter11・12の内容(傾向スコアマッチングや層化解析法,逆確率重み付け法)についてまとめています. 参考リンク - 因果推論で推薦システムを問い直す https://qiita.com/usaito/items/…
本稿は,計量経営学の進展を狙いとし,その要素技術になるデータサイエンスの基本事項を紹介することを目的とする.本稿では,まずデータサイエンスの入力となる「データ」の特性を述べ,「モデル化に対する基本姿勢」を紹介したうえで,主要なツールとなる「統計モデル」と「機械学習モデル」の概要を説明する.また,経 …
機械学習を「社会実装」する際に待ち受けている罠と、その解決方法の考察 (2023年版) です。今回は、機械学習プロジェクトに取り組む私たちに何ができるか?といった内容を盛り込みました。 ※この資料は、東京大学メタバース工学部リスキリング工学教育プログラム GCI 2022 Winterの講義で使用…
AI事業本部では,3年ほど前からビジネスへの貢献や課題解決を,「実務者としてのデータサイエンティスト」の大まかな役割として設定し、さまざまな���動を行ってきました。本記事では、その中の中心的な活動の1つであるDSOps研修という新卒DS向けの研修についてご紹介します。
今回は、メルカリのAnalyticsチームの中でも主にビジネス分析やマーケティング分析を行うGrowth Analytics Teamからの記事です。 Analyticsチームは、以下のミッションを通じて事業に貢献するチームです。 Provide actionable insights and help people make better decisions(実行可能なインサイトを提供し、...
時系列データを上手く活用し、ビジネス成果を生み出す!! 時系列データを上手く調理することは、これらの問に何かしら解を与えることができます。特に予測モデルを上手く活用すると、過去を振り返り、未来を予測し、現在すべきことを導きだし、成果へと繋げることができます。いくら高精度な予測モデルを手にしても、どう活用すべきかわからないと成果は生まれません。そこで本書ではどのように扱うかを、実際のデータを用...
はじめに線形モデルの分位点回帰についてPythonによる実装を交えてまとめました.内容に誤りがありましたら,ご指摘いただけますと幸いです.分位点回帰とは分位点回帰とは,分位点について回帰モデル…
機械学習を「社会実装」する際に待ち受けている罠と、その解決方法の考察 (2023年7月版) です。今回は、LLM等の生成AIの進化が加速し実用化フェーズを迎えた激動の時代において、機械学習プロジェクトに取り組む私たちに何ができるか?といった内容を盛り込みました。 ※この資料は、東京大学メタバース工…
応用数理学会ものづくり研究会(2020/12/18)で発表機会をいただいた、「因果推論の諸理論の統合的理解」をテーマとした発表です。Rubinの潜在反応モデルとPearlの構造的因果モデルの統合的理解がテーマです。(大きなテーマを60分枠に詰め込んだので、ややギチギチした作りになっています。大部分は過去…
こんにちは、メルカリのレコメンデーションチームで Software Engineer をしている @yaginuuun です。主に推薦を通じたホーム画面における体験改善に取り組んでいます。元々はデータアナリストとしてデータ分析関連の業務を担
遊びでA/Bテストの評価をベイズ統計でやってみたら、思いのほか面白かったので記事に残します。 用語の定義 コンバージョン コンバージョン率 A/Bテスト コンバージョンの確率分布 なぜベイズ統計を使うのか 割合の問題点 尤度と最尤法 尤度 最尤法 ベイズ統計 ベイズの定理 共役事前分布 ベータ分布 事後分布の導出 事後…
こんにちは、データテクノロジーユニット D3M 部の @beniyama こと山邉と申します。 D3M とは Data Driven Decision Making の略で、下記の組織概要にありますように『
機械学習を「社会実装」する際に待ち受けている罠と、その解決方法の考察 (2024年版) です。今回は、生成AI時代とも呼ばれる昨今において、我々は機械学習プロジェクトをどのように捉え、どのように向き合えばよいか?の羅針盤になる内容を盛り込みました。 ※この資料は、東京大学メタバース工学部リスキリン…
データサイエンティスト.「Python×データ分析」をメインテーマに執筆しています.内容について誤り等がありましたら.ご指摘いただけますと幸いです.
2022年度前期、社内で「Pearl(2019)『入門統計的因果推論』朝倉書店」を輪読しました。その活動を踏まえて、テキストの概要と活用イメージについて考察し、LT資料にまとめました。 参考リンク(マイメディア) - DoWhyとEconMLによる因果推論の実装 https://speak…
データに基づく因果推論がどのように行われるのか、詳しく説明していきます。因果の定義、因果推論に必要な条件、RCTの意義などいろいろまとめていたら、例のごとくすごいボリュームになってしまいました。なお、本記事で使われる用語は、「疫学」の因果推論で使われているものが基本です。同じコンセプトでも分野によって呼び方が違うので、…
Panasonic様の有志団体の勉強会でお話させていただいた登壇資料です(資料は一部変更しています) ビジネス領域で効果検証(因果推論)をしていく上で必要なマーケティング指標へのアプローチやデータサイエンス手法の応用例についてまとめています。 参考リンク(マイメディア) - A/Bテス…
はじめにクーポン施策を例に、マーケティング施策の効果検証に回帰不連続デザイン(RDDあるいはRD)を応用する手法について、Pythonによるシミュレーションを交えてまとめました。内容に誤り等ござい…
データ活用で利益を上げることが求められるデジタルマーケター。現場で必要な視点を、Q&A形式で解説する。
反実仮想(Counterfactual)─ 起こり得たけれども実際には起こらなかった状況 ─ に関する正確な情報を得ることは、機械学習や意思決定最適化の応用において必要不可欠です。例えば、「現在運用して… - 引用:版元ドットコム
5月21日に『Pythonで学ぶ効果検証入門』という本を上梓することになりました。僭越ながらその紹介をさせてください! Pythonで学ぶ効果検証入門 | 安井 翔太, 伊藤 寛武, 金子 雄祐 |本 | 通販 | Amazon Amazonで安井 翔太, 伊藤 寛武, 金子 雄祐のPythonで学ぶ効果検証入門。アマゾンならポイント還元本が多数。安 amzn.asia どのような本か...
はじめに データマイニング分野の国際会議KDD2023のワークショップである Causal Inference and Machine Learning in Practice にて、リクルートの翁と西村、東京
データサイエンスの経済学 調査・実験,因果推論・機械学習が拓く行動経済学
Martin Tingley with Wenjing Zheng, Simon Ejdemyr, Stephanie Lane, and Colin McFarland
媒介分析シリーズ、第二段です。前回は、よく使われる媒介分析の手法の問題点についてまとめました。 今回は、これらの問題を克服するべく考案された因果媒介分析(Causal Mediation Analysis)を紹介するイントロとして、そもそも「媒介効果」なるものをどうやって定義するのかについてまとめます。話の性質上、少し…