#author("2024-04-07T10:15:18+09:00","default:irrp","irrp")
#author("2024-04-13T21:38:55+09:00","default:irrp","irrp")
→AI/機械学習

→数学(統計学)

→データ処理関連

→開発に役立つデータ

→Python関連

#contents

*一般 [#ye49e8ba]
-[[2024年は生成AIで「データ」が変わる年に:その11の予測 - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報>https://thebridge.jp/2024/01/11-data-predictions-for-ai-centric-enterprise-growth-in-2024]] 2024.1

-[[【書評】Pythonによる時系列予測 | DevelopersIO>https://dev.classmethod.jp/articles/book-python-timeseries-forecasting/]] 2024.1

-[[これからデータサイエンス、AIを本格的に学ぶ人へ 📚 #AI - Qiita>https://qiita.com/DeepTama/items/47cc0bdb888da6be05fa]] 2023.12

-[[データセットの本質的な性質を踏まえないデータ分析には、大抵何の意味もない - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2023/11/11/195106]] 2023.11

-[[マーケティング担当者なら使えるべき5つの超重要な分析手法 #データ分析 - Qiita>https://qiita.com/IkuyaM/items/f0a4fc76cb7c86c49420]] 2023.10
--相関分析、K-means、マーケット・バスケット分析、対応分析、信頼区間・A/Bテスト

-[[スプレッドシートで素早くデータを分析する方法 - Qiita>https://qiita.com/tatsumi_t2/items/66ec9cb685581db725d7]] 2023.10
--ピボットテーブル

-[[アンケートの自由記述の回答からどの単語がよく使われるのかを調べる方法の紹介 - Qiita>https://qiita.com/takatoshiroto/items/84c6b90004e67ed18cef]] 2023.8

-[[【それを言ってはいけない!を言う】「データ分析失敗事例集」 を読んで - 学習する天然ニューラルネット>https://aotamasaki.hatenablog.com/entry/2023/08/05/%E3%80%90%E3%81%9D%E3%82%8C%E3%82%92%E8%A8%80%E3%81%A3%E3%81%A6%E3%81%AF%E3%81%84%E3%81%91%E3%81%AA%E3%81%84%EF%BC%81%E3%82%92%E8%A8%80%E3%81%86%E3%80%91%E3%80%8C%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86]] 2023.8

-[[ごちきか — ごちきか>https://gochikika.ntt.com/index.html]] 2023.6
--時系列データ分析手法の研究開発、お客さまのデータ分析支援や社内データ分析

-[[データサイエンティストの仕事を奪うと話題の「code interpreter」とは?日本での始め方や有効な使い方も解説します。|GPTimes>https://generativeinfo365.com/?p=178]] 2023.5

-[[マーケティングデータ分析で成果を挙げるには「統計分析(MMMなど)+A/Bテスト」のコンビネーションが有用 - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2023/04/26/191100]] 2023.4

-[[PCAによる特徴量自動生成 - Qiita>https://qiita.com/mkdirman/items/f05f5e5031b4795b02a6]] 2023.3

-[[知っておくべきデータサイエンスのユースケース5選 - Qiita>https://qiita.com/Dataiku/items/905dd50d34912c2da5db]] 2023.2
--予測モデリング
--NLP
--画像分析とコンピュータビジョン
--異常検知
--レコメンデーション


-[[GitHub - rougier/scientific-visualization-book: An open access book on scientific visualization using python and matplotlib>https://github.com/rougier/scientific-visualization-book]] 2023.1

-[[講義資料 – 九州大学 数理・データサイエンス教育研究センター>http://mdsc.kyushu-u.ac.jp/lectures]] 2023.1

-[[クラスメソッド データアナリティクス通信(AWSデータ分析編) – 2023年1月号 | DevelopersIO>https://dev.classmethod.jp/articles/cm-da-news-analytics-202301/]] 2023.1

-[[「データ分析の民主化」の在り方を、「社員全員Excel経営」が「社員全員データサイエンス経営」へと進化していった事例に見る - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2022/12/11/170402]] 2022.12

-[[Pythonでデータ分析入門!環境構築不要で今すぐ学べる講座が新登場 - paiza開発日誌>https://paiza.hatenablog.com/entry/2022/11/14/130000]] 2022.11

-[[数理・データサイエンス教育強化拠点コンソーシアム - YouTube>https://www.youtube.com/channel/UCC366-AKKaoqgCxkjh4UloA/videos]] 2022.11

-[[4-4_時系列データの解析 - 4-4_literacy_level_note.pdf>http://www.mi.u-tokyo.ac.jp/consortium2/pdf/4-4_literacy_level_note.pdf]] 2022.11

-[[「データ分析をやるならRとPythonのどちらを使うべき?」への個人的な回答 - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2019/06/27/190000]] 2022.10
--例えば一連のデータ分析作業をバッチ処理にしてシステム上で回すというケースでは、Pythonの方が使いやすい
--「説明」を目的とする統計学的な処理はRの方がPythonよりも使いやすい
--例えば「バルクでCSVファイルに格納されたデータを都度貰ってはその度ごとにデータの性質を精査し、その性質に応じてカスタマイズされた分析処理をする」みたいなケースではRの方がやりやすい
--「予測」を目的とする機械学習的な処理はPythonの方がRよりも使いやすい
--ベイジアンは以前とは異なりRとPythonとで差がなくなってきているが、まだRの方が比較的楽
--Deep LearningはむしろRで使えるフレームワークが殆どなくPythonが必須に近い
--統計分析・機械学習であってもソフトウェア開発を本業にするならC++など速い言語が必須
--結論から言うと「その時々のテーマと必要に応じてRとPythonを巧みに使い分けるべし、そのためにも両方とも習得しておこう」というのが僕の個人的な回答です。


-[[探索的データ解析(EDA)のためのautovizを試してみた - Qiita>https://qiita.com/DS27/items/17a5fb9155a768ff9528]] 2022.9

-[[Data Science for Beginners>https://microsoft.github.io/Data-Science-For-Beginners/#/]] 2022.9

-[[ビジネスアナリスト・データエンジニア・データサイエンティストがDatabricksでCOVID-19データ分析に取り組んだ1日 - Qiita>https://qiita.com/taka_yayoi/items/218e4eddee1e133d6360]] 2022.9

-[[Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing>https://www.autodesk.com/research/publications/same-stats-different-graphs]] 2022.9

-[[今さら聞けない機械学習 - Qiita>https://qiita.com/taka_yayoi/items/51583a581ce5a6ba6558]] 2022.8
--※タイトルは機械学習ですが、内容はデータサイエンスの話のようなのでこちらに置いた

-[[データ分析入門 - 1  はじめに>https://uribo.github.io/tokupon_ds/intro.html]] 2022.7

-[[データマイニング入門 Introduction to Data Mining | UTokyo OCWx>https://ocwx.ocw.u-tokyo.ac.jp/course_11414/]] 2018

-[[高等学校情報科「情報?」教員研修用教材(本編):文部科学省>https://www.mext.go.jp/a_menu/shotou/zyouhou/detail/mext_00742.html]] 2022.7
--[[高等学校情報科「情報?」教員研修用教材 第3章前半 - 20200702-mxt_jogai01-000007843_004.pdf>https://www.mext.go.jp/content/20200702-mxt_jogai01-000007843_004.pdf]] 
--[[高等学校情報科「情報?」教員研修用教材 第3章後半 - 20200609-mxt_jogai01-000007843_007.pdf>https://www.mext.go.jp/content/20200609-mxt_jogai01-000007843_007.pdf]]

-[[【無料】データサイエンス入門:機械学習編全35回まとめと目次>https://datawokagaku.com/ml/]] 2022.6

-[[データを触ってみたいけどどこから手をつけよう?🤔という趣味人の覚書 - Qiita>https://qiita.com/tenteko/items/8ee24c5df394307c1bd4]] 2022.4

-[[データ分析における特徴量エンジニアリング / feature engineering recipes - Speaker Deck>https://speakerdeck.com/s_uryu/feature-engineering-recipes?slide=95]] 2022.4

-[[2022年版:実務の現場で働くデータサイエンティスト向け推薦書籍リスト(初級5冊+中級8冊+テーマ別14冊) - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2022/02/09/170000]] 2022.2

-[[[Looker] データ分析の流れを一緒に確認しましょう #looker | DevelopersIO>https://dev.classmethod.jp/articles/looker-de-bunseki-ichi/]] 2022.1

-[[総務省、無料データサイエンス講座「誰でも使える統計オープンデータ」が開講>https://ledge.ai/stat-opendatalecture2021-2/]] 2022.1
--[[誰でも使える統計オープンデータ | gacco>https://lms.gacco.org/courses/course-v1:gacco+ga084+2022_01/about]] 2022.1

-[[分析結果を現場で使ってもらう技術まとめ - Qiita>https://qiita.com/hidenari_uoi/items/90c755dd8eff77b275b5]] 2021.12

-[[Introduction to Datascience: Learn Julia Programming, Math & Datascience from Scratch.>https://datascience-book.gitlab.io/book.html]] 2021.11

-[[GitHub - The-Japan-DataScientist-Society/skills-checklist>https://github.com/The-Japan-DataScientist-Society/skills-checklist]] 2021.11

-[[2021年版:データサイエンティストを初めとするデータ分析職向け推薦書籍リスト(初級5冊+中級8冊+テーマ別14冊) - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2021/02/05/180000]] 2021.2

-[[eラーニング教材・講義動画配信 | 数理・データサイエンス教育強化拠点コンソーシアム>http://www.mi.u-tokyo.ac.jp/consortium/e-learning.html]] 2021.5

-[[タダで学べるデータサイエンス名著5冊 【日本書は高額でも英語ができれば怖くない】>https://qiita.com/Ringa_hyj/items/5e5a7f3f5ad6c89aec6a]] 2020.5

-[[知らないと損をする「データ分析·サイエンス」サイト37選(ブログ&オンラインコース)>https://qiita.com/Hailee/items/8828a265091f4b0c23d8]] 2019.2



*データサイエンス100本ノック [#c256d77f]
-[[【SQL】データサイエンス100本ノック(構造化データ加工編)に挑戦!! - arms inc. Engineers' Blog>https://tech.arms-soft.co.jp/entry/2023/06/21/090000]] 2023.6
-[[GitHub - The-Japan-DataScientist-Society/100knocks-preprocess: データサイエンス100本ノック(構造化データ加工編)>https://github.com/The-Japan-DataScientist-Society/100knocks-preprocess]] 2021
--[[データサイエンス100本ノックが SageMaker Studio Lab からすぐに学べるようになりました | Amazon Web Services ブログ>https://aws.amazon.com/jp/blogs/news/100knocks-preprocess-sagemaker-studio-lab/]] 2022.9



*数理最適化 [#f16f0b54]
-[[Mathematical Optimization in 60 minutes - Speaker Deck>https://speakerdeck.com/umepon/mathematical-optimization-in-60-minutes]] 2024.4

-[[Python SciPyで手を動かしながら学ぶ数理最適化– 第1回: 数理最適化とは何か? 基本概念の紹介 – – セールスアナリティクス>https://www.salesanalytics.co.jp/datascience/datascience197/]] 2024.1

-[[妻の雑務を最適化したい(Streamlit+PuLPでグループ分け最適化アプリ) #Python - Qiita>https://qiita.com/nukipei/items/ee14f83a436231d3a0e5]]2023.12

-[[『Pythonではじめる数理最適化』の7章「商品推薦のための興味のスコアリング」をStanで解く>https://zenn.dev/tokin_tokin/articles/44daebd2833971]] 2023.12

-[[Python言語による実務で役に立つ100の最適化問題 - YouTube>https://www.youtube.com/playlist?list=PLz8sHu_CzBwPMIdyL_WMEVUw-GOSL-J6w]] 2023.11

-[[数理最適化によって訪問介護のシフトスケジューリングモデルを作ってみた話 - エス・エム・エス エンジニア テックブログ>https://tech.bm-sms.co.jp/entry/2023/03/28/120000]] 2023.3

-[[「そうだ、数理最適化、やろう。」ってなった時にめっちゃ参考になったリンク集&参考書|CO-WRITE>https://gri.jp/media/entry/3309]] 2023.2

-[[数理最適化と機械学習を比較してみる - めもめも>https://enakai00.hatenablog.com/entry/2022/12/18/185201]] 2022.12

-[[数理最適化ことはじめ / Introduction to Mathematical Optimization - Speaker Deck>https://speakerdeck.com/e869120/introduction-to-mathematical-optimization-5cdef842-50f6-4e46-ab2d-549cf85c1b81]] 2022.5

-[[混合整数最適化でスケジューリング問題を扱うテクニック 〜カスタマーサポートのWFMを例に〜 - ZOZO TECH BLOG>https://techblog.zozo.com/entry/mip-wfm-scheduling#%E3%83%AF%E3%83%BC%E3%82%AF%E3%83%95%E3%82%A9%E3%83%BC%E3%82%B9%E3%83%9E%E3%83%8D%E3%82%B8%E3%83%A1%E3%83%B3%E3%83%88%E3%81%A8%E3%81%AF]] 2020



*書籍ほかコンテンツ [#z5157a62]
-[[2024年版:データエンジニア向け推薦本リスト|zono>https://note.com/zono_data/n/n8fc5f8206e83]] 2024.1

-[[九州大学 数理・データサイエンス教育研究センター講義資料>http://mdsc.kyushu-u.ac.jp/lectures]] 2023

-[[2023年版データ分析の100冊 - Qiita>https://qiita.com/aokikenichi/items/29165f719d6e5631d7d0]] 2023.8

-[[GitHub Copilot導入後、初めて使う時。(豊富な使用例付き) - Qiita>https://qiita.com/masakinihirota/items/0e58a6b921e4420a2882]] 2023.6

-[[高校からの統計・データサイエンス活用〜上級編〜>https://www.soumu.go.jp/main_content/000607858.pdf]] 2023.5

-[[演習問題(データサイエンス)|熊本大学数理科学総合教育センター>http://msec.kumamoto-u.ac.jp/problem/problem4.html]] 2023.2

-[[優良データサイエンス関連教材をたっくさんまとめてみた【僕の学習記録】 - Qiita>https://qiita.com/mohki7/items/c3f26916d79a0e3269cc]] 2023.2

-[[2023年版:実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト(初級6冊+中級8冊+テーマ別15冊) - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2023/02/07/170000]] 2023.2

-[[Python Data Science Handbook | Python Data Science Handbook>https://jakevdp.github.io/PythonDataScienceHandbook/]] 2022.4

-[[データ分析初心者向けおすすめ本のご紹介 〜第1弾・データ分析基礎力編〜|Mercari Analytics Blog|note>https://note.com/mercari_data/n/nae878ddd4c0e]] 2021

-[[Python for Data Analysis - Python-for-Data-Analysis.pdf>https://bedford-computing.co.uk/learning/wp-content/uploads/2015/10/Python-for-Data-Analysis.pdf]]
--フリーのO'reilly本(英語)

-[[100+ Best Free Data Science Books For Beginners And Experts>https://www.theinsaneapp.com/2020/12/free-data-science-books-pdf.html]] 2023.1
-[[Free Data Science Books>http://www.learndatasci.com/free-books/]] 2015.9.9
-[[Free Open-Source Statistics Cookbook>http://datascience101.wordpress.com/2012/09/24/free-open-source-statistics-cookbook/]] 2012.9.24


*データサイエンティスト/データアナリスト [#s0471a21]
-[[データサイエンティストの役割は“ほぼ全部”AIに奪われた 尾原和啓氏×橋本大也氏が振り返る、ここ10年のAIの進化 - ログミーBiz>https://logmi.jp/business/articles/329817]] 2023.12

-[[2023年度版「データサイエンティスト スキルチェックリストver.5」および「データサイエンス領域タスクリスト ver.4」を発表ニュース|一般社団法人データサイエンティスト協会>https://www.datascientist.or.jp/news/n-pressrelease/post-1757/]] 2023.10

-[[10年経ってもついに消えずに残った、データサイエンティストという職業 - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2023/08/26/162704]] 2023.8

-[[機械学習エンジニアが目指すキャリアパスとその実話 / My Journey to Become a ML Engineer - Speaker Deck>https://speakerdeck.com/shinyorke/my-journey-to-become-a-ml-engineer]] 2023.1

-[[データサイエンティストとしてどう学んでいくべきか/東京大学講義: データマイニング概論: #10 - Speaker Deck>https://speakerdeck.com/yp_genzitsu/dong-jing-da-xue-jiang-yi-detamainingugai-lun-number-10]] 2023.1

-[[データサイエンティスト人材不足を解決するには – 採用・育成方法も解説 | AI専門ニュースメディア AINOW>https://ainow.ai/2022/12/27/271388/]] 2022.12

-[[データアナリストになるためのロードマップ【決定版】 - Qiita>https://qiita.com/tor-ato/items/aef68b1c9c9d577cbc23]] 2022.12

-[[データサイエンティストに必要な資格とは【比較表】 | AI専門ニュースメディア AINOW>https://ainow.ai/2022/11/19/270198/]] 2022.11

-[[データサイエンティストという職業の10年間の変遷を振り返る - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2022/10/21/190700]] 2022.10

-[[How to become a data scientist | Data Science 101 w NYU Prof Pascal Wallisch | SPodcast EP.5 - YouTube>https://www.youtube.com/watch?v=E8BG8rsgkwY]] 2022.8

-[[データサイエンティストは何を勉強すべきか:「教養」と「必須」と「差別化」と - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2022/07/29/173000]] 2022.7

-[[未経験からのデータサイエンティスト転職までにやったこと | ハピライフ>https://happy-life-entry.com/datascientist-begginer/]] 2022.5

-[[84%が「仕事に将来性を感じている」 データサイエンティストの実態調査 | Ledge.ai>https://ledge.ai/datascientist-changsha-future/]] 2022.4

-[[今後求められる、ビジネス課題解決が得意なデータサイエンティスト | TECH+>https://news.mynavi.jp/techplus/article/20220418-2324561/]] 2022.4

-[[戦力になるレベルのデータサイエンティストを育成することの難しさ - 渋谷駅前で働くデータサイエンティストのブログ>https://tjo.hatenablog.com/entry/2021/07/30/170000]] 2021

-[[データアナリストってなにやってるの? 普段の業務について語ってみた - YouTube>https://www.youtube.com/watch?v=qufQSUU4HbM]] 2022.1

-[[データサイエンティストのインターン面談をして採用側が感じているズレの正体とは? - Qiita>https://qiita.com/He110w0r1d/items/054f988e9a9b01c46572]] 2021.11

-[[データサイエンティストを目指すに当たって、ぜひ揃えておきたいテキストたちを挙げてみる>http://tjo.hatenablog.com/entry/2013/05/07/191000]] 2013.5.7
-[[ITエンジニアがデータサイエンティストを目指すには?>http://www.atmarkit.co.jp/ait/articles/1305/07/news003.html]] 2013.5.7


*活用事例 [#m6214145]
-[[YouTubeタイトルを通じた日本経済の理解 【形態素解析・感情分析】 #Python - Qiita>https://qiita.com/yama_mikazauki/items/38abbd73d68343502205]] 2023.11

-[[ゲームにおけるA/Bテストについて - KAYAC engineers' blog>https://techblog.kayac.com/hyper_casual_ab_testing]] 2023.2

-[[映画概況の最新データを見てみたら"日本のアニメ"が激アツだった。|分析屋|note>https://note.com/bunsekiya_tech/n/ne6429499d4b5]] 2023.2

-[[Pythonで考える少子高齢化と詐欺グラフ - Qiita>https://qiita.com/kaku3/items/6133dfb01c7187dce45c]] 2023.1

-[[最も「ありそうで存在しない漢字」は何か? - Qiita>https://qiita.com/hakatashi/items/e5f803e3476fd4a75b55]] 2023.1

-[[日本vsドイツ 分析してみた|分析屋|note>https://note.com/bunsekiya_tech/n/n6ae5e5b117bc]] 2022.11

-[[データサイエンスで犯罪者を捕まえる - Qiita>https://qiita.com/GridDBnet/items/480bf345224bd6f28ff5]] 2022.8

-[[【Python】東京23区の中古マンション販売価格予測をやってみた - Qiita>https://qiita.com/hidemiya666/items/a65d7fed65ff6443947c]] 2022.7

-[[MoT TechTalk #13 タクシーアプリ『GO』のデータサイエンス〜配車マッチングの継続的改善〜 - Speaker Deck>https://speakerdeck.com/mot_techtalk/mot-techtalk-13]] 2022.7

-[[オープンデータ分析してみたら、「日本を少し変えちゃった」話|朝日新聞社 メディア研究開発センター|note>https://note.com/asahi_ictrad/n/n47f391a81015]] 2022.4

-[[ガラケーしか使えないデジタル音痴だった私が「GISでデータ分析」できるようになるまでの話|NHK取材ノート|note>https://note.com/nhk_syuzai/n/n96fdcdf4200d]] 2022.3


*ビジネスインテリジェンス/PowerBIなど [#ufbb7d2f]
-[[Power BI 101 使い始めた時/学び始めた時に知っておくとよいこと - Japan Power Platform Conference 2022 #JPPC2022 - Qiita>https://qiita.com/PowerBIxyz/items/750a17615b841b2c4f33]] 2022.10
-[[データ分析におけるデータ可視化の極意 - Qiita>https://qiita.com/mimocihz/items/3c1fe6b06cd4da72c131]] 2022.6
-[[初めてBIを使って見よう見まねでデータ分析してみた![PowerBI Desktopで訪日旅行者数データを操る] - Qiita>https://qiita.com/ruritea/items/2d582042dae941c6e133]] 2022.6

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS