画像認識／検出／トラッキングの変更点

追加された行はこの色です。
削除された行はこの色です。
画像認識／検出／トラッキングへ行く。
画像認識／検出／トラッキングの差分を削除
#author("2024-04-12T08:54:18+09:00","default:irrp","irrp")
#author("2024-04-12T08:54:53+09:00","default:irrp","irrp")
いわゆるCVタスクのページ

→画像処理関連

→画像生成

→AI／機械学習

→ディープラーニング

#contents


*一般 [#y60953d6]

-[[AWS入門ブログリレー2024&#12316;Amazon Rekognition編&#12316; | DevelopersIO>https://dev.classmethod.jp/articles/introduction-2024-amazon-rekognition/]] 2024.4

-[[Amazon Rekognitionをアルティメット完全理解する | DevelopersIO>https://dev.classmethod.jp/articles/reintro-managed-ml-rekognition/]] 2024.3
-[[めちゃくちゃ簡単　Amazon Rekognition - Qiita>https://qiita.com/naka46/items/05624e23edb6341a5e27]] 2019


-[[第6章 サンプルアプリケーションの作成>https://manual.atmark-techno.com/armadillo-iot-g4/armadillo-base-os-dev-guide_ja-1.0.0/ch06.html]] 2024.3
--メーターを読むアプリ

-[[【Python】お手軽に顔認証を実装する #Python - Qiita>https://qiita.com/f-paico/items/e27e4eefc8c009ecdeab]] 2024.1
--face-recognition

-[[コンピュータビジョン（CV）の動向 2021 | gihyo.jp>https://gihyo.jp/dev/column/newyear/2021/computer-vision-trends]] 2021

-[[Unity×Teachable Machineで画像分類をやってみた ->https://techceed-inc.com/engineer_blog/10284/]] 2023.10

-[[OpenCVをNPPにした結果→10倍高速に！>https://zenn.dev/turing_motors/articles/14a6ea47794535]] 2023.2
--NPPとはNVIDIA Performance Primitivesの略です

-[[【動画あり】早速YOLOv8を使って自作データセットで物体検出してみた | DevelopersIO>https://dev.classmethod.jp/articles/yolov8-trial-custom-dataset/]] 2023.1

-[[【Detectron2】物体検出/セグメンテーション/骨格検出 Python | みやしんのプログラミングスキル通信>https://miyashinblog.com/detectron2/]] 2022.11

-[[python画像認識による商品分類 - Qiita>https://qiita.com/jamie09/items/7fcf3537fcc6e225e4ae]] 2022.10

-[[【リモートワーク】Web会議で自分の顔を画像に変えるのをmediaPipe+p5jsでやってみた【顔見せNG】 - Qiita>https://qiita.com/suginoko/items/78eaa71468c2f5604721]] 2022.8

-[[Azure Machine LearningのAutoMLで画像分類を試してみた - Qiita>https://qiita.com/tmiyata25/items/4871a30bdad8acf19ae1]] 2022.7

-[[Kapaoで、人物検出と姿勢推定を行う>http://cedro3.com/ai/kapao/]] 2021
-[[PHALPで、人物の3Dモデルをトラッキングする | cedro-blog>http://cedro3.com/ai/phalp/]] 2022.7

-[[2017年に発表された DeepSORT を解説！ | DeepSquare>https://deepsquare.jp/2022/07/deep-sort/]] 2022.7
-[[DeepSort : 人物のトラッキングを行う機械学習モデル. ailia… | by Kazuki Kyakuno | axinc | Medium>https://medium.com/axinc/deepsort-%E4%BA%BA%E7%89%A9%E3%81%AE%E3%83%88%E3%83%A9%E3%83%83%E3%82%AD%E3%83%B3%E3%82%B0%E3%82%92%E8%A1%8C%E3%81%86%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%83%A2%E3%83%87%E3%83%AB-e8cb7410457c]] 2020

-[[現在のトラッキングモデルの基礎ともいえる SORT を解説！ | DeepSquare>https://deepsquare.jp/2022/06/sort/]] 2022.6

*Amazon Rekognition [#xef12e4d]
-[[AWS入門ブログリレー2024&#12316;Amazon Rekognition編&#12316; | DevelopersIO>https://dev.classmethod.jp/articles/introduction-2024-amazon-rekognition/]] 2024.4
-[[Amazon Rekognitionをアルティメット完全理解する | DevelopersIO>https://dev.classmethod.jp/articles/reintro-managed-ml-rekognition/]] 2024.3
-[[めちゃくちゃ簡単　Amazon Rekognition - Qiita>https://qiita.com/naka46/items/05624e23edb6341a5e27]] 2019



*マルチモーダルなLLMによる画像認識 [#h0ae4662]
→ChatGPT関連 ←ChatGPT4Vについてはこちらへ

-[[退屈なことはマルチモーダルLLMにやらせよう（画像解析編） - GMOインターネットグループ グループ研究開発本部>https://recruit.gmo.jp/engineer/jisedai/blog/multimodal_llms_do_the_boring_stuff/]] 2024.4

-[[Google Colab で Claude 3 の Vision を試す｜npaka>https://note.com/npaka/n/n972d94427dd7]] 2024.3

-[[マルチモーダル AI の Claude 3 は、日本独自の「こけし」の画像を認識できるか？ Bedrock のチャットのプレイグラウンドで確認する - サーバーワークスエンジニアブログ>https://blog.serverworks.co.jp/bedrock_claude3_sonnet]] 

-[[類似画像検索にLLMを利用する。｜tdual>https://note.com/tdual/n/n7b645c66ea19]] 2023.8



*OpenAI Vision API [#g04b2fa9]
-[[OpenAI Vision API の使い方や料金について｜ChatGPT研究所>https://chatgpt-lab.com/n/n9322bab6f6f3]] 2023.11
-[[OpenAI GPT-4V の API を使って画像を AI に説明させよう！ #Python - Qiita>https://qiita.com/kenji-kondo/items/87e71bf9645338d59ecb]] 2023.11



*face-api.js [#h76418c4]
-[[face-api.jsのリサイズを理解する【技術メモ】【小ネタ】 - Qiita>https://qiita.com/Shinkijigyo_no_Usagi/items/405e42c36afaeac641ae]] 2022.10
-[[face-api.jsの顔検出速度を比較してみた【技術メモ】【小ネタ】 - Qiita>https://qiita.com/Shinkijigyo_no_Usagi/items/137d70dabb046ec9bcd9]] 2022.10
-[[【うわっ...私の表情、硬すぎ...？】face-api.jsで顔検出して感情と年齢を判定する - Qiita>https://qiita.com/ymmt1089/items/4e35a7ba62d38c568cb6]] 2022.10


* OpenCV [#u15b24f2]
-[[C# で背景透過な 2 つの画像を合成した 1 枚の画像を生成する - OpenCVSharp、ImageSharp、SkiaSharp を使った作例 : @jsakamoto>https://devadjust.exblog.jp/30007598/]] 2024.3

-[[アナログメーターの画像から針の角度を読み取るやつ作ってみた(OpenCV): EeePCの軌跡>https://arkouji.cocolog-nifty.com/blog/2021/09/post-2c82af.html]] 2024.3

-[[【笑い男事件2024】OpenCVで顔を検出して笑い男にする #Python - Qiita>https://qiita.com/HESORIDER/items/ba87a5fa4d994747e4b7]] 2024.2

-[[OpenCVを用いたエッジ検出 #Python - Qiita>https://qiita.com/kakuteki/items/55c00e33cad63f9e440f]] 2024.1

-[[OpenCV + RetinaFaceで顔をぼかす - Qiita>https://qiita.com/yanagi-m/items/7650345068fef8f33113]] 2023.10

-[[OpenCV + YOLOで車をぼかす - Qiita>https://qiita.com/yanagi-m/items/608b90d48f58a7be4547]] 2023.10

-[[OpenCV の使い方をコードと一緒に解説>https://blog.kikagaku.co.jp/python-opencv]] 2023.8

-[[OpenCVの動画のフレーム取得エラー「error while decoding MB 〇 〇, bytestream 〇」 - Qiita>https://qiita.com/BUU-SAN/items/3076b8df3f88fd9a7785]] 2023.7

-[[【OpenCV】画像の差分を取得するとサンリオ間違い探しが高速クリアできる！ - Qiita>https://qiita.com/kagami_t/items/2b4db4e2464439a48fb4]] 2023.6

-[[初めての画像処理&#12316;OpenCVって何ができるの？&#12316; | フューチャー技術ブログ>https://future-architect.github.io/articles/20230424a/]] 2023.4

-[[OpenCV のピクセル形式が BGR である理由 - Qiita>https://qiita.com/yoya/items/bfef7404ded22649a2af]] 2022.12

-[[OpenCVのvideoioモジュールでソースビルドのFFmpegを使う - Qiita>https://qiita.com/dandelion1124/items/4b0b134694abe65ed39f]] 2022.12

-[[Python + OpenCVでらんてくんとキュゥべえの類似点を検出する - Qiita>https://qiita.com/eityamo/items/c53b5669e6718a030f4f]] 2022.12

-[[OpenCVとNumPyでヒストグラムを作成する - Qiita>https://qiita.com/mo256man/items/f5fb06ea07d8a5fd3b11]] 2022.9

-[[OpenCVとYOLOv5を使って動画切り抜きをしてみる - Qiita>https://qiita.com/smiler5617/items/c8a0925373eaa89e2aae]] 2022.9

-[[【機械学習の前処理】OpenCVを使って文字位置を切り出して色調整してみた | DevelopersIO>https://dev.classmethod.jp/articles/opencv-preprocess-for-ml-training/]] 2022.7

-[[Python OpenCVで骨格検出AI OpenPose | みやしんのプログラミングスキル通信>https://miyashinblog.com/openpose/]] 2022.4

-[[【やってみた】OpenCVで動画フレームからパノラマ画像の生成 - 神戸のデータ活用塾！KDL Data Blog>https://kdl-di.hatenablog.com/entry/2022/07/08/113500]] 2022.7

-[[OpenCV.jsをJavaScript/Node.jsで使ってみた | DevelopersIO>https://dev.classmethod.jp/articles/using-opencvjs-with-javascript-and-nodejs/]] 2022.3

-[[[OpenCV] 100行で作るAR - Qiita>https://qiita.com/suo-takefumi/items/231a6f97cd880fe629a5]] 2021.12

-http://opencv.jp/
--[[OpenCVとは>http://ja.wikipedia.org/wiki/OpenCV]]

-[[OpenCVでライブアニメーションから私の愛馬を検出する>https://qiita.com/bianca26neve/items/19085841c9ac6209fe91]] 2021.9

-[[OpenCV（Python）でTemplate Matchingを使用して物体検出をしてみた | DevelopersIO>https://dev.classmethod.jp/articles/search-images-in-an-image-with-opencv-python/]] 2022.3
-[[OpenCVの新しい顔検出を試してみる - Qiita>https://qiita.com/UnaNancyOwen/items/f3db189760037ec680f3]] 2021.12
-[[Pythonで人検知の通知機能プログラムを作成してみる - Qiita>https://qiita.com/smiler5617/items/84c4c811a2d91b976109]] 2021.11
-[[OpenCVを使用して顔検出をする>https://oliversi.com/2019/01/13/python-opencv-face/]] 2019.1
-[[OpenCVで手っ取り早く動体検知してみた - Qiita>https://qiita.com/KMiura95/items/4eed79a7da6b3dafa96d]] 2019


*Vision Transformer/ViT [#m1e85ebf]
→NLPのTransformerについてはTransformer/GPT関連へ

-[[【コード付き】画像用Transformerを利用して衛星画像の分類機械学習モデルを作成する | 宙畑>https://sorabatake.jp/20454/]] 2024.4

-[[CNN vs. ViT - Speaker Deck>https://speakerdeck.com/yushiku/cnn-vs-vit]] 2022.10
--ViTとCNNの勝負は今のところ引き分け

-[[なぜビジョントランスフォーマーはこれほど高性能なのか。 | AI-SCHOLAR | AI：(人工知能)論文・技術情報メディア>https://ai-scholar.tech/articles/transformer/transformer-vs-cnn]] 2022.5

-[[著者陣の視点からVision Transformer入門の執筆の背景と書評を書きます - Seitaro Shinagawaの雑記帳>https://snowman-88888.hatenablog.com/entry/2022/09/17/090000]] 2022.9

-[[Hugging FaceとPyTorch LightningでImageCaptioningモデルを作ってみました！ - CCCマーケティング TECH Labの Tech Blog>https://techblog.cccmk.co.jp/entry/2022/08/23/165231]] 2022.8

-[[近年のHierarchical Vision Transformer>https://www.slideshare.net/ren4yu/hierarchical-vision-transformer]] 2022.1

-[[【PyTorch】Vision Transformer (ViT) を自作しながら解説する - Qiita>https://qiita.com/zisui-sukitarou/items/d990a9630ff2c7f4abf2]] 2022.8
-[[近年のHierarchical Vision Transformer>https://www.slideshare.net/ren4yu/hierarchical-vision-transformer]] 2022.1

-[[Transformer メタサーベイ>https://www.slideshare.net/cvpaperchallenge/transformer-247407256]] 2021

-[[画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説！ - Qiita>https://qiita.com/omiita/items/0049ade809c4817670d7]] 2020


*OCR [#k5b7a87c]
-[[【Python】簡単OCR #Python - Qiita>https://qiita.com/masa1124/items/198ceea22becdf311f31]] 2023.10

-[[GitHub - kha-white/manga-ocr: Optical character recognition for Japanese text, with the main focus being Japanese manga>https://github.com/kha-white/manga-ocr]] 2023.6

-[[画像内の文字を抽出してみた件について - Qiita>https://qiita.com/r-okada/items/eb08c189c04a05787b5c]] 2022.11
--PaddleOCRやEasyOCRを使ってテキスト抽出

-[[【やってみた】EasyOCRで文字認識！ - 神戸のデータ活用塾！KDL Data Blog>https://kdl-di.hatenablog.com/entry/2022/05/13/100000]] 2022.5

-[[【Python】OpenCVとpyocrで画像から文字を認識してみる - Qiita>https://qiita.com/pon187/items/f9a70fd52cc91ddb4ed7]] 2022.3

-[[【手書き文字認識】Azure-AI-OCRの進化がすごい！ - Qiita>https://qiita.com/org-yuta-tanabe/items/bdb11e0fccc4efc488a0]] 2022.2

-[[SmartOCR紹介>http://www.forest.impress.co.jp/article/2005/11/29/smartocrlite.html]]
--独自エンジンで画像から文字を認識し、Word/ExcelファイルやRTF/HTML/CSV/PDF形式で保存できる日本語OCRソフト「SmartOCR Lite Edition」v1.0.3が、17日に公開された。Windows XP/2000に対応するフリーソフトで、現在作者のホームページからダウンロードできる。
画像認識／検出／トラッキング の変更点

画像認識／検出／トラッキングの変更点