#author("2024-04-03T22:20:14+09:00","default:irrp","irrp") いわゆるCVタスクのページ →画像処理関連 →画像生成 →AI/機械学習 →ディープラーニング #contents *一般 [#y60953d6] -[[Amazon Rekognitionをアルティメット完全理解する | DevelopersIO>https://dev.classmethod.jp/articles/reintro-managed-ml-rekognition/]] 2024.3 -[[めちゃくちゃ簡単 Amazon Rekognition - Qiita>https://qiita.com/naka46/items/05624e23edb6341a5e27]] 2019 -[[第6章 サンプルアプリケーションの作成>https://manual.atmark-techno.com/armadillo-iot-g4/armadillo-base-os-dev-guide_ja-1.0.0/ch06.html]] 2024.3 --メーターを読むアプリ -[[【Python】お手軽に顔認証を実装する #Python - Qiita>https://qiita.com/f-paico/items/e27e4eefc8c009ecdeab]] 2024.1 --face-recognition -[[コンピュータビジョン(CV)の動向 2021 | gihyo.jp>https://gihyo.jp/dev/column/newyear/2021/computer-vision-trends]] 2021 -[[Unity×Teachable Machineで画像分類をやってみた ->https://techceed-inc.com/engineer_blog/10284/]] 2023.10 -[[OpenCVをNPPにした結果→10倍高速に!>https://zenn.dev/turing_motors/articles/14a6ea47794535]] 2023.2 --NPPとはNVIDIA Performance Primitivesの略です -[[【動画あり】早速YOLOv8を使って自作データセットで物体検出してみた | DevelopersIO>https://dev.classmethod.jp/articles/yolov8-trial-custom-dataset/]] 2023.1 -[[【Detectron2】物体検出/セグメンテーション/骨格検出 Python | みやしんのプログラミングスキル通信>https://miyashinblog.com/detectron2/]] 2022.11 -[[python画像認識による商品分類 - Qiita>https://qiita.com/jamie09/items/7fcf3537fcc6e225e4ae]] 2022.10 -[[【リモートワーク】Web会議で自分の顔を画像に変えるのをmediaPipe+p5jsでやってみた【顔見せNG】 - Qiita>https://qiita.com/suginoko/items/78eaa71468c2f5604721]] 2022.8 -[[Azure Machine LearningのAutoMLで画像分類を試してみた - Qiita>https://qiita.com/tmiyata25/items/4871a30bdad8acf19ae1]] 2022.7 -[[Kapaoで、人物検出と姿勢推定を行う>http://cedro3.com/ai/kapao/]] 2021 -[[PHALPで、人物の3Dモデルをトラッキングする | cedro-blog>http://cedro3.com/ai/phalp/]] 2022.7 -[[2017年に発表された DeepSORT を解説! | DeepSquare>https://deepsquare.jp/2022/07/deep-sort/]] 2022.7 -[[DeepSort : 人物のトラッキングを行う機械学習モデル. ailia… | by Kazuki Kyakuno | axinc | Medium>https://medium.com/axinc/deepsort-%E4%BA%BA%E7%89%A9%E3%81%AE%E3%83%88%E3%83%A9%E3%83%83%E3%82%AD%E3%83%B3%E3%82%B0%E3%82%92%E8%A1%8C%E3%81%86%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%83%A2%E3%83%87%E3%83%AB-e8cb7410457c]] 2020 -[[現在のトラッキングモデルの基礎ともいえる SORT を解説! | DeepSquare>https://deepsquare.jp/2022/06/sort/]] 2022.6 *マルチモーダルなLLMによる画像認識 [#h0ae4662] →ChatGPT関連 ←ChatGPT4Vについてはこちらへ -[[退屈なことはマルチモーダルLLMにやらせよう(画像解析編) - GMOインターネットグループ グループ研究開発本部>https://recruit.gmo.jp/engineer/jisedai/blog/multimodal_llms_do_the_boring_stuff/]] 2024.4 -[[Google Colab で Claude 3 の Vision を試す|npaka>https://note.com/npaka/n/n972d94427dd7]] 2024.3 -[[マルチモーダル AI の Claude 3 は、日本独自の「こけし」の画像を認識できるか? Bedrock のチャットのプレイグラウンドで確認する - サーバーワークスエンジニアブログ>https://blog.serverworks.co.jp/bedrock_claude3_sonnet]] -[[類似画像検索にLLMを利用する。|tdual>https://note.com/tdual/n/n7b645c66ea19]] 2023.8 *OpenAI Vision API [#g04b2fa9] -[[OpenAI Vision API の使い方や料金について|ChatGPT研究所>https://chatgpt-lab.com/n/n9322bab6f6f3]] 2023.11 -[[OpenAI GPT-4V の API を使って画像を AI に説明させよう! #Python - Qiita>https://qiita.com/kenji-kondo/items/87e71bf9645338d59ecb]] 2023.11 *face-api.js [#h76418c4] -[[face-api.jsのリサイズを理解する【技術メモ】【小ネタ】 - Qiita>https://qiita.com/Shinkijigyo_no_Usagi/items/405e42c36afaeac641ae]] 2022.10 -[[face-api.jsの顔検出速度を比較してみた【技術メモ】【小ネタ】 - Qiita>https://qiita.com/Shinkijigyo_no_Usagi/items/137d70dabb046ec9bcd9]] 2022.10 -[[【うわっ...私の表情、硬すぎ...?】face-api.jsで顔検出して感情と年齢を判定する - Qiita>https://qiita.com/ymmt1089/items/4e35a7ba62d38c568cb6]] 2022.10 * OpenCV [#u15b24f2] -[[C# で背景透過な 2 つの画像を合成した 1 枚の画像を生成する - OpenCVSharp、ImageSharp、SkiaSharp を使った作例 : @jsakamoto>https://devadjust.exblog.jp/30007598/]] 2024.3 -[[アナログメーターの画像から針の角度を読み取るやつ作ってみた(OpenCV): EeePCの軌跡>https://arkouji.cocolog-nifty.com/blog/2021/09/post-2c82af.html]] 2024.3 -[[【笑い男事件2024】OpenCVで顔を検出して笑い男にする #Python - Qiita>https://qiita.com/HESORIDER/items/ba87a5fa4d994747e4b7]] 2024.2 -[[OpenCVを用いたエッジ検出 #Python - Qiita>https://qiita.com/kakuteki/items/55c00e33cad63f9e440f]] 2024.1 -[[OpenCV + RetinaFaceで顔をぼかす - Qiita>https://qiita.com/yanagi-m/items/7650345068fef8f33113]] 2023.10 -[[OpenCV + YOLOで車をぼかす - Qiita>https://qiita.com/yanagi-m/items/608b90d48f58a7be4547]] 2023.10 -[[OpenCV の使い方をコードと一緒に解説>https://blog.kikagaku.co.jp/python-opencv]] 2023.8 -[[OpenCVの動画のフレーム取得エラー「error while decoding MB 〇 〇, bytestream 〇」 - Qiita>https://qiita.com/BUU-SAN/items/3076b8df3f88fd9a7785]] 2023.7 -[[【OpenCV】画像の差分を取得するとサンリオ間違い探しが高速クリアできる! - Qiita>https://qiita.com/kagami_t/items/2b4db4e2464439a48fb4]] 2023.6 -[[初めての画像処理〜OpenCVって何ができるの?〜 | フューチャー技術ブログ>https://future-architect.github.io/articles/20230424a/]] 2023.4 -[[OpenCV のピクセル形式が BGR である理由 - Qiita>https://qiita.com/yoya/items/bfef7404ded22649a2af]] 2022.12 -[[OpenCVのvideoioモジュールでソースビルドのFFmpegを使う - Qiita>https://qiita.com/dandelion1124/items/4b0b134694abe65ed39f]] 2022.12 -[[Python + OpenCVでらんてくんとキュゥべえの類似点を検出する - Qiita>https://qiita.com/eityamo/items/c53b5669e6718a030f4f]] 2022.12 -[[OpenCVとNumPyでヒストグラムを作成する - Qiita>https://qiita.com/mo256man/items/f5fb06ea07d8a5fd3b11]] 2022.9 -[[OpenCVとYOLOv5を使って動画切り抜きをしてみる - Qiita>https://qiita.com/smiler5617/items/c8a0925373eaa89e2aae]] 2022.9 -[[【機械学習の前処理】OpenCVを使って文字位置を切り出して色調整してみた | DevelopersIO>https://dev.classmethod.jp/articles/opencv-preprocess-for-ml-training/]] 2022.7 -[[Python OpenCVで骨格検出AI OpenPose | みやしんのプログラミングスキル通信>https://miyashinblog.com/openpose/]] 2022.4 -[[【やってみた】OpenCVで動画フレームからパノラマ画像の生成 - 神戸のデータ活用塾!KDL Data Blog>https://kdl-di.hatenablog.com/entry/2022/07/08/113500]] 2022.7 -[[OpenCV.jsをJavaScript/Node.jsで使ってみた | DevelopersIO>https://dev.classmethod.jp/articles/using-opencvjs-with-javascript-and-nodejs/]] 2022.3 -[[[OpenCV] 100行で作るAR - Qiita>https://qiita.com/suo-takefumi/items/231a6f97cd880fe629a5]] 2021.12 -http://opencv.jp/ --[[OpenCVとは>http://ja.wikipedia.org/wiki/OpenCV]] -[[OpenCVでライブアニメーションから私の愛馬を検出する>https://qiita.com/bianca26neve/items/19085841c9ac6209fe91]] 2021.9 -[[OpenCV(Python)でTemplate Matchingを使用して物体検出をしてみた | DevelopersIO>https://dev.classmethod.jp/articles/search-images-in-an-image-with-opencv-python/]] 2022.3 -[[OpenCVの新しい顔検出を試してみる - Qiita>https://qiita.com/UnaNancyOwen/items/f3db189760037ec680f3]] 2021.12 -[[Pythonで人検知の通知機能プログラムを作成してみる - Qiita>https://qiita.com/smiler5617/items/84c4c811a2d91b976109]] 2021.11 -[[OpenCVを使用して顔検出をする>https://oliversi.com/2019/01/13/python-opencv-face/]] 2019.1 -[[OpenCVで手っ取り早く動体検知してみた - Qiita>https://qiita.com/KMiura95/items/4eed79a7da6b3dafa96d]] 2019 *Vision Transformer/ViT [#m1e85ebf] →NLPのTransformerについてはTransformer/GPT関連へ -[[CNN vs. ViT - Speaker Deck>https://speakerdeck.com/yushiku/cnn-vs-vit]] 2022.10 --ViTとCNNの勝負は今のところ引き分け -[[なぜビジョントランスフォーマーはこれほど高性能なのか。 | AI-SCHOLAR | AI:(人工知能)論文・技術情報メディア>https://ai-scholar.tech/articles/transformer/transformer-vs-cnn]] 2022.5 -[[著者陣の視点からVision Transformer入門の執筆の背景と書評を書きます - Seitaro Shinagawaの雑記帳>https://snowman-88888.hatenablog.com/entry/2022/09/17/090000]] 2022.9 -[[Hugging FaceとPyTorch LightningでImageCaptioningモデルを作ってみました! - CCCマーケティング TECH Labの Tech Blog>https://techblog.cccmk.co.jp/entry/2022/08/23/165231]] 2022.8 -[[近年のHierarchical Vision Transformer>https://www.slideshare.net/ren4yu/hierarchical-vision-transformer]] 2022.1 -[[【PyTorch】Vision Transformer (ViT) を自作しながら解説する - Qiita>https://qiita.com/zisui-sukitarou/items/d990a9630ff2c7f4abf2]] 2022.8 -[[近年のHierarchical Vision Transformer>https://www.slideshare.net/ren4yu/hierarchical-vision-transformer]] 2022.1 -[[Transformer メタサーベイ>https://www.slideshare.net/cvpaperchallenge/transformer-247407256]] 2021 -[[画像認識の大革命。AI界で話題爆発中の「Vision Transformer」を解説! - Qiita>https://qiita.com/omiita/items/0049ade809c4817670d7]] 2020 *OCR [#k5b7a87c] -[[【Python】簡単OCR #Python - Qiita>https://qiita.com/masa1124/items/198ceea22becdf311f31]] 2023.10 -[[GitHub - kha-white/manga-ocr: Optical character recognition for Japanese text, with the main focus being Japanese manga>https://github.com/kha-white/manga-ocr]] 2023.6 -[[画像内の文字を抽出してみた件について - Qiita>https://qiita.com/r-okada/items/eb08c189c04a05787b5c]] 2022.11 --PaddleOCRやEasyOCRを使ってテキスト抽出 -[[【やってみた】EasyOCRで文字認識! - 神戸のデータ活用塾!KDL Data Blog>https://kdl-di.hatenablog.com/entry/2022/05/13/100000]] 2022.5 -[[【Python】OpenCVとpyocrで画像から文字を認識してみる - Qiita>https://qiita.com/pon187/items/f9a70fd52cc91ddb4ed7]] 2022.3 -[[【手書き文字認識】Azure-AI-OCRの進化がすごい! - Qiita>https://qiita.com/org-yuta-tanabe/items/bdb11e0fccc4efc488a0]] 2022.2 -[[SmartOCR紹介>http://www.forest.impress.co.jp/article/2005/11/29/smartocrlite.html]] --独自エンジンで画像から文字を認識し、Word/ExcelファイルやRTF/HTML/CSV/PDF形式で保存できる日本語OCRソフト「SmartOCR Lite Edition」v1.0.3が、17日に公開された。Windows XP/2000に対応するフリーソフトで、現在作者のホームページからダウンロードできる。