#author("2023-02-28T13:29:21+09:00","default:irrp","irrp")
#author("2024-03-12T09:19:58+09:00","default:irrp","irrp")
→画像処理関連

→動画関連


#contents


*サブトピック [#cd714412]
-音声認識・音声合成


*一般 [#xd5df883]
-[[Web Audio API - Web APIs | MDN>https://developer.mozilla.org/en-US/docs/Web/API/Web_Audio_API]] 2024.3

-[[スコアメーカーZEROダウンロード | KAWAIコンピュータミュージック>https://cmusic.kawai.jp/a/Download/smz]] 2023.7
--楽譜編集

-[[テキストから音声(ため息・笑い声も可)を生成できるBarkのインストール | ジコログ>https://self-development.info/%e3%83%86%e3%82%ad%e3%82%b9%e3%83%88%e3%81%8b%e3%82%89%e9%9f%b3%e5%a3%b0%ef%bc%88%e3%81%9f%e3%82%81%e6%81%af%e3%83%bb%e7%ac%91%e3%81%84%e5%a3%b0%e3%82%82%e5%8f%af%ef%bc%89%e3%82%92%e7%94%9f%e6%88%90/]] 2023.4

-[[Pythonを用いた発話分割【AIボイスチェンジャーの学習で役立つ】 | ジコログ>https://self-development.info/python%e3%82%92%e7%94%a8%e3%81%84%e3%81%9f%e7%99%ba%e8%a9%b1%e5%88%86%e5%89%b2%e3%80%90ai%e3%83%9c%e3%82%a4%e3%82%b9%e3%83%81%e3%82%a7%e3%83%b3%e3%82%b8%e3%83%a3%e3%83%bc%e3%81%ae%e5%ad%a6%e7%bf%92/]] 2023.4

-[[【Python】pydub使ったら音声データの解析がめっちゃ簡単だった - Qiita>https://qiita.com/LabCode/items/0e7bf3cb3b2eae31cc36]] 2022.11

-[[【無料のAI作曲ツール】Musikaのインストール | ジコログ>https://self-development.info/%e3%80%90%e7%84%a1%e6%96%99%e3%81%aeai%e4%bd%9c%e6%9b%b2%e3%83%84%e3%83%bc%e3%83%ab%e3%80%91musika%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab/]] 2022.10

-[[音楽に関連する計算式まとめ - Qiita>https://qiita.com/takayoshi1968/items/f9be70772d5dff8bd50f]] 2022.1

-[[信号処理とか音楽の分析に大活躍しそうなlibrosa>https://qiita.com/tom_m_m/items/91ba624dd8507bc0b746]] 2021.9
--python用のライブラリです

-[[FLACファイルとは?FLACをMP3/OGG/AAC/WAVへ変換するには?>http://cyber-rainforce.net/reading/sound/flac_enc.html]] 2015.6
--https://xiph.org/flac/index.html

-[[Ogg Vorbis download>http://www.free-codecs.com/Ogg_Vorbis_CODEC_for_MSACM_download.htm]]
-[[iTunesでoggを再生する>http://wayohoo.com/ipod/itunesogg_vorbi.html]]
-[[Audio Library Part I:http://www.codeproject.com/useritems/AudioLib.asp]]



* 読み上げ/音声合成/音声言語処理/音声分離 [#q61b527a]
-[[文章から音楽を生成するRiffusionのインストール | ジコログ>https://self-development.info/%e6%96%87%e7%ab%a0%e3%81%8b%e3%82%89%e9%9f%b3%e6%a5%bd%e3%82%92%e7%94%9f%e6%88%90%e3%81%99%e3%82%8briffusion%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab/]] 2022.12

-[[【藤本健のDigital Audio Laboratory】AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す-AV Watch>https://av.watch.impress.co.jp/docs/series/dal/1460920.html]] 2022.12
*音声データ [#z9412859]
-[[【Python】pydub使ったら音声データの解析がめっちゃ簡単だった>https://zenn.dev/labcode/articles/7eaca4f7e9dbcf]] 2024.1

-[[AIが音楽に変える!「text2music」でツイートから音楽を作ってみよう - Qiita>https://qiita.com/rayuron/items/b7238b6de52ecab55a21]] 2022.12
-[[img2musicで、画像から音楽を生成する>http://cedro3.com/ai/img2music/]] 2022.10
-[[【Python】音声区間検出(VAD)による音声データの前処理 | ジコログ>https://self-development.info/%e3%80%90python%e3%80%91%e9%9f%b3%e5%a3%b0%e5%8c%ba%e9%96%93%e6%a4%9c%e5%87%ba%ef%bc%88vad%ef%bc%89%e3%81%ab%e3%82%88%e3%82%8b%e9%9f%b3%e5%a3%b0%e3%83%87%e3%83%bc%e3%82%bf%e3%81%ae%e5%89%8d%e5%87%a6/]] 2023.12

-[[テキストから音楽を作成するMubert-Text-to-Musicのインストール | ジコログ>https://self-development.info/%e3%83%86%e3%82%ad%e3%82%b9%e3%83%88%e3%81%8b%e3%82%89%e9%9f%b3%e6%a5%bd%e3%82%92%e4%bd%9c%e6%88%90%e3%81%99%e3%82%8bmubert-text-to-music%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab/]] 2022.10
-[[ギターのチューナーを作ってみたい【前編】 - Qiita>https://qiita.com/NicoTheDog/items/d5612e8a915deac99c43]] 2023.5
--[[ギターのチューナーを作ってみたい【後編】 - Qiita>https://qiita.com/NicoTheDog/items/fef6c828b1e1904b90c3]] 2023.5

-[[GitHub - MubertAI/Mubert-Text-to-Music: A simple notebook demonstrating prompt-based music generation via Mubert API>https://github.com/MubertAI/Mubert-Text-to-Music]] 2022.10

-[[AudioGen: Textually Guided Audio Generation>https://felixkreuk.github.io/text2audio_arxiv_samples/]] 2022.9

-[[Amazon Pollyを使ってAIに音声を読み上げしてもらおう! - M&Aクラウド開発者ブログ>https://tech.macloud.jp/entry/2023/01/31/135029]] 2023.1
-[[AI音声のAmazon Pollyを使ってみた! | DevelopersIO>https://dev.classmethod.jp/articles/trying_out_amazon_polly_ai_voice_by_hugo_obuchi/]] 2022.9

-[[【Wav2LipによるAI動画編集】動画の人物を無理やりしゃべらせる | ジコログ>https://self-development.info/%e3%80%90wav2lip%e3%81%ab%e3%82%88%e3%82%8bai%e5%8b%95%e7%94%bb%e7%b7%a8%e9%9b%86%e3%80%91%e5%8b%95%e7%94%bb%e3%81%ae%e4%ba%ba%e7%89%a9%e3%82%92%e7%84%a1%e7%90%86%e3%82%84%e3%82%8a%e3%81%97%e3%82%83/]] 2022.9

-[[【Pythonで音声合成(テキスト読み上げ)】gTTSのインストール | ジコログ>https://self-development.info/%e3%80%90python%e3%81%a7%e9%9f%b3%e5%a3%b0%e5%90%88%e6%88%90%ef%bc%88%e3%83%86%e3%82%ad%e3%82%b9%e3%83%88%e8%aa%ad%e3%81%bf%e4%b8%8a%e3%81%92%ef%bc%89%e3%80%91gtts%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9/]] 2022.9

-[[AIで音楽をボーカル・ドラム・ベース・その他に分離できる「Demucs」【レビュー】 - 窓の杜>https://forest.watch.impress.co.jp/docs/review/1437871.html]] 2022.9

-[[音声読み上げアプリ作成 PySimpleGUI, gTTS, Python | みやしんのプログラミングスキル通信>https://miyashinblog.com/text_to_speech_appli/]] 2022.8

-[[How To Transcribe Your Podcast with Python - DEV Community>https://dev.to/deepgram/how-to-transcribe-your-podcast-with-python-32i1]] 2022.8

-[[Python の SpeechRecognizer を用いて音声認識(SpeechRecognizer,Python を使用)(Windows 上)>https://www.kkaneko.jp/tools/win/speechrecog.html]] 2022.8

-[[Creating Your Own Voice Assistant in Python - DEV Community>https://dev.to/codesphere/creating-your-own-voice-assistant-in-python-jfm]] 2022.7

-[[[M1] 音声認識ツール Voskを動かす [Node] | DevelopersIO>https://dev.classmethod.jp/articles/vosk/]] 2022.7
-[[日本語音声のマイク入力をオフラインでリアルタイム音声認識:「VOSK」を JavaScript(Node.js)で扱う - Qiita>https://qiita.com/youtoy/items/649dcad9ecccf75a9d01]] 2022.6

-[[ZOOMの日本語音声を無料で英語に翻訳した字幕をつける。 - Qiita>https://qiita.com/shigeshigeshige/items/ffffd4ea9e29895c5135]] 2022.5
--AzureのSpeech translationの無料枠を使用

-[[VOICEPEAKの音声にほぼドンピシャの字幕ファイルを作成するPythonスクリプト - Qiita>https://qiita.com/mochi_gu_ma/items/a5a9d59865062c7479d3]] 2022.3

-[[入力文字読み上げソフト『VOICEPEAK』を試してみた | DevelopersIO>https://dev.classmethod.jp/articles/tried-using-voicepeak/]] 2022.3

-[[ボカロ(作るところから)はじめました>http://d.hatena.ne.jp/yaneurao/20140420#p1]] 2014.4.20
-[[青空文庫や六法のオーディオブックを無料で作る方法>http://denspe.blog84.fc2.com/blog-entry-104.html]]
-[[Microsoft Speech Platform の日本語音声合成エンジン>http://denspe.blog84.fc2.com/blog-entry-103.html]]

-[[Windows10,WSL2でESPNetのVITS学習レシピを実行する【音声合成】 - Qiita>https://qiita.com/seichi25/items/bde466744f9b3190b0d3]] 2022.3
-[[パソコンにしゃべらせてみよう>http://www.geocities.co.jp/dwakahara/synthesizer/synthesizer.htm]]
-[[AquesTalk>http://www.a-quest.com/products/aquestalk.html]]
--Softalkなどで使われているテキスト読み上げ機能のライブラリ


* 文字起こし/音声認識 [#h82fe814]
-[[超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた - GIGAZINE>https://gigazine.net/news/20230120-reazonspeech/]] 2023.1

-[[アマゾンのAWSで音声の文字起こしサービスを無料で試してみた | Ledge.ai>https://ledge.ai/amazon-transcribe-try/]] 2021.11
-- Amazon Transcribe

-[[アマゾンのAWSでテキストを解析してみた>https://ledge.ai/amazon-comprehend-try/]]
--Amazon Comprehendは、機械学習を使用してテキスト内のインサイトや関係性を検出できる自然言語処理(NLP)サービスです。キーフレーズ抽出、感情分析、実体認識、トピック形成、言語検出 API の利用ができ、アプリケーションへの統合もできます。


**Whisper [#mafa5a3a]
-[[Whisperを使ったリアルタイム音声認識と字幕描画方法の紹介 | さくらのナレッジ>https://knowledge.sakura.ad.jp/34497/#OBS_WebSocket]] 2023.2

-[[Whisper + GPT-3 で会議音声からの議事録書き出し&サマリ自動生成をやってみる! - Qiita>https://qiita.com/sakasegawa/items/3855472a8566ea302a99]] 2023.2

-[[GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++>https://github.com/ggerganov/whisper.cpp]] 2022.12

-[[PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記>https://tadaoyamaoka.hatenablog.com/entry/2022/10/15/175722]] 2022.10

-[[音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day>https://ysdyt.hatenablog.jp/entry/whisper]] 2022

-[[OpenAIリリースのWhisperをCPUだけで動かすために色々試した話 | DevelopersIO>https://dev.classmethod.jp/articles/openai_whisper_only_local_cpu/]] 10

-[[【Whisper】Webアプリ(GUIデモ)のインストール | ジコログ>https://self-development.info/%e3%80%90whisper%e3%80%91web%e3%82%a2%e3%83%97%e3%83%aa%ef%bc%88gui%e3%83%87%e3%83%a2%ef%bc%89%e3%81%ae%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%bc%e3%83%ab/]] 2022.10

-[[音声認識モデル”Whisper”をストリーミング処理対応させる方法 | DevelopersIO>https://dev.classmethod.jp/articles/whisper-streaming/]] 2022.10
-[[文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉>https://blog.takuya-andou.com/entry/youtube_whisper2]] 2022.10
-[[OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する - Qiita>https://qiita.com/daipop/items/de7791f49f86097ce4f0]] 2022.10

-[[高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉>https://blog.takuya-andou.com/entry/youtube_whisper]] 2022.9

-[[【Python】AI音声認識Whisperを使ったSRT字幕ファイルの自動作成 | ジコログ>https://self-development.info/%e3%80%90python%e3%80%91ai%e9%9f%b3%e5%a3%b0%e8%aa%8d%e8%ad%98whisper%e3%82%92%e4%bd%bf%e3%81%a3%e3%81%9fsrt%e5%ad%97%e5%b9%95%e3%83%95%e3%82%a1%e3%82%a4%e3%83%ab%e3%81%ae%e8%87%aa%e5%8b%95%e4%bd%9c/]] 2022.9

-[[無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ - GIGAZINE>https://gigazine.net/news/20220929-openai-whisper-install-and-usage/]] 2022.9

-[[OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO>https://dev.classmethod.jp/articles/whisper-trial-japanese/]] 2022.9

-[[ほぼ完璧な文字起こしができるAI音声認識Whisperのインストール | ジコログ>https://self-development.info/%e3%81%bb%e3%81%bc%e5%ae%8c%e7%92%a7%e3%81%aa%e6%96%87%e5%ad%97%e8%b5%b7%e3%81%93%e3%81%97%e3%81%8c%e3%81%a7%e3%81%8d%e3%82%8bai%e9%9f%b3%e5%a3%b0%e8%aa%8d%e8%ad%98whisper%e3%81%ae%e3%82%a4%e3%83%b3/]] 2022.9

-[[OpenAIの音声認識Whisperがすごいので,Youtube用に字幕生成してみた - Qiita>https://qiita.com/walnut-pro/items/69864b0a074bd773711f]] 2022.9
-[[OpenAIの音声認識Whisperがすごいので,Google Colabで試してみた(Webアプリを作ってデモ編) - Qiita>https://qiita.com/walnut-pro/items/4b57c3cb7a9446f63c21]] 2022.9
-[[OpenAIの音声認識Whisperがすごいので,Google Colabで試してみた - Qiita>https://qiita.com/walnut-pro/items/0124a5a0c83c9b4e2669]] 2022.9


*Sound/Wav [#z9412859]
-[[事業撤退するので、Apple MusicのクローンアプリをOSSにします - Qiita>https://qiita.com/petertakahashi/items/f72c609d40ed13e1ecfb]] 2022.7
-[[Sound recording and encoding in MP3:http://www.codeproject.com/useritems/RecordingAndMP3Encoding.asp]]
-[[WAVファイルにリアルタイムでエフェクトをかける:http://codezine.jp/a/article.aspx?aid=368]]
--C言語によるmmio系処理による


*OSC [#ic068507]
-[[OpenSound Control - Wikipedia>https://ja.wikipedia.org/wiki/OpenSound_Control]] 2022.2
--OpenSound Control(OSC)とは、電子楽器(特にシンセサイザー)やコンピュータなどの機器において音楽演奏データをネットワーク経由でリアルタイムに共有するための通信プロトコルである。カリフォルニア大学バークレー校にある CNMAT(The Center for New Music and Audio Technologies)が開発した。 
--OSC はMIDIの代替となることを意図して設計されている。MIDIは1982年に実装されたもので、最近のマルチメディア用途には適していない部分が多い。通信プロトコルであるため、OSCによって、楽器やMIDIコントローラや各種マルチメディア機器が屋内のネットワーク(TCP/IP、イーサネット)やインターネットを経由して通信することが可能となる。OSCはブロードバンド・ネットワークの通信速度を最大限に活かしてデータ転送を行うため、31.250[kbps]と言う規格上の速度上限があったMIDIでは不可能な新たな利用方法が可能となっている。また、転送データの柔軟性も増しており、より高度なレベルでの通信が可能である。 

-[[TouchDesigner×Pythonで軽率にOSC通信する方法を初心者向けに説明する - Qiita>https://qiita.com/iwaken71/items/f4c9e1c3b789d19657ae]] 2021




*MIDI [#d1128e5f]
*MIDI/DTM [#d1128e5f]
-[[CUIで音楽製作環境の構築(2023年10月版) #MIDI - Qiita>https://qiita.com/kujirahand/items/53b02aaffcb6dd9a6c14]] 2023.10

-[[2万円切るキーボード(USB-CとBluetooth両対応)、また買いました。同メーカーのフルサイズ、2台目は「フォルダブルなマスターキーボード」として(CloseBox) | テクノエッジ TechnoEdge>https://www.techno-edge.net/article/2023/10/30/2163.html]] 2023.10

-[[YouTubeのピアノ演奏動画の全自動採譜(MIDI化) - Qiita>https://qiita.com/burugaria7/items/0f6a4f4030b6b7c60999]] 2022.9
-[[【初投稿】Google Magenta でファイナルファンタジーの戦闘曲を学習させて新曲を作る試み - Qiita>https://qiita.com/Masanori_Aisaka/items/15f3653c0dcd17c895e3]] 2022.6
-[[WSLでMagentaを使ったピアノ耳コピの自動化 - Qiita>https://qiita.com/burugaria7/items/4005724c5d1b5228327e]] 2022.8
-[[世界のプログラミング言語(41) 簡単に音楽をプログラミングできる言語MML | TECH+>https://news.mynavi.jp/techplus/article/programinglanguageoftheworld-41/]] 2022.5
-[[C#によるMIDI toolkit:http://www.codeproject.com/cs/media/MIDIToolkit.asp]]


*ツール [#re02fa8d]
-[[GitHub - facebookresearch/demucs: Code for the paper Hybrid Spectrogram and Waveform Source Separation>https://github.com/facebookresearch/demucs]] 2023.5
--音源文理

-[[AI音声解析・分離ソフトDemucsの検証レポート - Qiita>https://qiita.com/mitzi2funk/items/2a9c3492ac13d0a9f399]] 2023.2

-[[FFmpegによる音声ファイルの分割【ChatGPT活用事例】 | ジコログ>https://self-development.info/ffmpeg%e3%81%ab%e3%82%88%e3%82%8b%e9%9f%b3%e5%a3%b0%e3%83%95%e3%82%a1%e3%82%a4%e3%83%ab%e3%81%ae%e5%88%86%e5%89%b2%e3%80%90chatgpt%e6%b4%bb%e7%94%a8%e4%ba%8b%e4%be%8b%e3%80%91/]] 2023.1

-[[最強コード解析ツール「chordify」の使い方>https://sleepfreaks-dtm.com/dtm-materials/chordify/]] 2017
--YouTubeにアップロードされている楽曲コードを自動で分析

-[[Online tone generator>https://www.szynalski.com/tone-generator/]] 2021.8

-[[Windowsユーザにオススメの万能仮想ミキサー「VoiceMeeter Banana」が凄い>https://av.watch.impress.co.jp/docs/series/dal/1255935.html]] 2020.6
--https://vb-audio.com/Cable/index.htm

-[[Eusing mp3 cutter>http://www.eusing.com/free_mp3_cutter/mp3_cutter.htm]]

-[[ギター練習用音楽再生プレーヤ>http://www.vector.co.jp/soft/dl/winnt/art/se445768.html]]
--主に楽器の練習用に、音楽ファイルの再生速度を遅くしたり音程を変えたりして再生するソフト

-[[読み上げテキスト>http://www.vector.co.jp/soft/cmt/winnt/art/se201341.html]]

-[[青空ろーどく>http://sites.google.com/site/aozorarohdoku/]]
--青空文庫の読み上げ

-http://www35.atwiki.jp/softalk/
--Softalk テキスト読み上げソフト(ゆっくりしていってね!の声とも言われる)

-[[プロ流CDリッピング>http://www.gizmodo.jp/2009/10/post_6209.html]]

-http://www.mediamonkey.com/
--mp3のタグ整理機能

-[[iTunesは今すぐ捨てろ!音楽プレイヤの決定版登場>http://www.oshiete-kun.net/archives/2009/04/itunes_4.html]]
--http://teenspirit.artificialspirit.com/

-[[手持ちの曲の歌詞を全自動で取ってきてくれるCassini>http://www.oshiete-kun.net/archives/2009/03/casshini.html]]
-http://www.crintsoft.com/minilyrics.htm
-[[MP3ファイルをロスレス編集することができるフリーソフト「mp3DirectCut」>http://gigazine.net/index.php?/news/comments/20080508_mp3directcut/]]

-[[Wavacity のダウンロード・使い方 - フリーソフト100>https://freesoft-100.com/review/wavacity.html]] 2023.11
-[[Audacity>http://audacity.sourceforge.net/]]

-[[Adobe Soundbooth:http://labs.adobe.com/technologies/soundbooth/]]
-[[Super C:http://www.erightsoft.net/Superdc.html]]
--あらゆるマルチメディアファイルのコンバート
--ストリームの保存も可能
-[[KKKKK.Net:http://kkkkk.net/]] 音加工ツールがある

-[[iOpenerによるM4P->MP3変換:http://hacks.oreilly.com/pub/h/3092]]
-[[iTunesのメタデータをクリーンナップするTuneUp>http://www.lifehacker.jp/2008/07/tuneup_itunes.html]]
-[[iTunesによるM4A->MP3の変換方法:http://zenkakuzenkaku.at.infoseek.co.jp/m4atomp3/]]


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS