音声処理関連
の履歴(No.1)
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
] [
Twitter
]
履歴一覧
差分
を表示
現在との差分
を表示
ソース
を表示
音声処理関連
へ行く。
1 (2022-12-22 (木) 11:17:15)
2 (2023-01-20 (金) 12:45:55)
3 (2023-01-24 (火) 23:08:31)
4 (2023-01-31 (火) 15:41:19)
5 (2023-02-15 (水) 18:32:58)
6 (2023-02-16 (木) 21:47:23)
7 (2023-02-28 (火) 13:29:21)
8 (2023-03-05 (日) 13:47:02)
9 (2023-03-09 (木) 21:50:09)
10 (2023-03-17 (金) 18:34:29)
11 (2023-03-22 (水) 13:41:53)
12 (2023-03-29 (水) 15:16:57)
13 (2023-04-04 (火) 09:17:44)
14 (2023-04-07 (金) 09:10:30)
15 (2023-04-08 (土) 11:16:47)
16 (2023-04-12 (水) 18:46:38)
17 (2023-04-18 (火) 21:56:46)
18 (2023-04-23 (日) 12:59:55)
19 (2023-04-28 (金) 09:21:07)
20 (2023-04-28 (金) 13:26:32)
21 (2023-05-14 (日) 20:28:05)
22 (2023-05-15 (月) 18:27:42)
23 (2023-05-17 (水) 10:37:54)
24 (2023-05-24 (水) 15:41:43)
25 (2023-06-06 (火) 09:15:46)
26 (2023-07-21 (金) 13:31:28)
27 (2023-07-28 (金) 11:09:52)
28 (2023-08-29 (火) 09:24:12)
29 (2023-09-22 (金) 23:19:55)
30 (2023-10-19 (木) 13:09:32)
31 (2023-10-20 (金) 09:09:02)
32 (2023-10-31 (火) 13:10:05)
33 (2023-10-31 (火) 17:30:48)
34 (2023-11-07 (火) 15:39:17)
35 (2023-11-08 (水) 12:55:47)
36 (2023-11-08 (水) 17:25:36)
37 (2023-11-10 (金) 12:42:57)
38 (2023-11-14 (火) 21:58:12)
39 (2023-12-18 (月) 13:45:19)
40 (2024-01-26 (金) 17:23:14)
→
画像処理関連
→
動画関連
一般
読み上げ/音声合成/音声言語処理/音声認識/音声分離
Whisper
Sound/Wav
OSC
MIDI
ツール
一般
†
【Python】pydub使ったら音声データの解析がめっちゃ簡単だった - Qiita
2022.11
【無料のAI作曲ツール】Musikaのインストール | ジコログ
2022.10
音楽に関連する計算式まとめ - Qiita
2022.1
信号処理とか音楽の分析に大活躍しそうなlibrosa
2021.9
python用のライブラリです
FLACファイルとは?FLACをMP3/OGG/AAC/WAVへ変換するには?
2015.6
https://xiph.org/flac/index.html
Ogg Vorbis download
iTunesでoggを再生する
Audio Library Part I
↑
読み上げ/音声合成/音声言語処理/音声認識/音声分離
†
文章から音楽を生成するRiffusionのインストール | ジコログ
2022.12
【藤本健のDigital Audio Laboratory】AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す-AV Watch
2022.12
AIが音楽に変える!「text2music」でツイートから音楽を作ってみよう - Qiita
2022.12
img2musicで、画像から音楽を生成する
2022.10
テキストから音楽を作成するMubert-Text-to-Musicのインストール | ジコログ
2022.10
GitHub - MubertAI/Mubert-Text-to-Music: A simple notebook demonstrating prompt-based music generation via Mubert API
2022.10
AudioGen: Textually Guided Audio Generation
2022.9
AI音声のAmazon Pollyを使ってみた! | DevelopersIO
2022.9
【Wav2LipによるAI動画編集】動画の人物を無理やりしゃべらせる | ジコログ
2022.9
【Pythonで音声合成(テキスト読み上げ)】gTTSのインストール | ジコログ
2022.9
AIで音楽をボーカル・ドラム・ベース・その他に分離できる「Demucs」【レビュー】 - 窓の杜
2022.9
音声読み上げアプリ作成 PySimpleGUI, gTTS, Python | みやしんのプログラミングスキル通信
2022.8
How To Transcribe Your Podcast with Python - DEV Community
2022.8
Python の SpeechRecognizer を用いて音声認識(SpeechRecognizer,Python を使用)(Windows 上)
2022.8
Creating Your Own Voice Assistant in Python - DEV Community
2022.7
[M1] 音声認識ツール Voskを動かす [Node] | DevelopersIO
2022.7
日本語音声のマイク入力をオフラインでリアルタイム音声認識:「VOSK」を JavaScript(Node.js)で扱う - Qiita
2022.6
ZOOMの日本語音声を無料で英語に翻訳した字幕をつける。 - Qiita
2022.5
AzureのSpeech translationの無料枠を使用
ボカロ(作るところから)はじめました
2014.4.20
青空文庫や六法のオーディオブックを無料で作る方法
Microsoft Speech Platform の日本語音声合成エンジン
Windows10,WSL2でESPNetのVITS学習レシピを実行する【音声合成】 - Qiita
2022.3
パソコンにしゃべらせてみよう
AquesTalk
Softalkなどで使われているテキスト読み上げ機能のライブラリ
↑
Whisper
†
GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++
2022.12
PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
2022.10
音声認識モデルwhisperの全モデル文字起こし比較 - 毎日がEveryday、日々 Day by Day
2022
OpenAIリリースのWhisperをCPUだけで動かすために色々試した話 | DevelopersIO
10
【Whisper】Webアプリ(GUIデモ)のインストール | ジコログ
2022.10
音声認識モデル”Whisper”をストリーミング処理対応させる方法 | DevelopersIO
2022.10
文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉
2022.10
OpenAIの音声認識Whisperを使って好きな洋画やアニメから英語教材を自作する - Qiita
2022.10
高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉
2022.9
【Python】AI音声認識Whisperを使ったSRT字幕ファイルの自動作成 | ジコログ
2022.9
無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ - GIGAZINE
2022.9
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
2022.9
ほぼ完璧な文字起こしができるAI音声認識Whisperのインストール | ジコログ
2022.9
OpenAIの音声認識Whisperがすごいので,Youtube用に字幕生成してみた - Qiita
2022.9
OpenAIの音声認識Whisperがすごいので,Google Colabで試してみた(Webアプリを作ってデモ編) - Qiita
2022.9
OpenAIの音声認識Whisperがすごいので,Google Colabで試してみた - Qiita
2022.9
↑
Sound/Wav
†
事業撤退するので、Apple MusicのクローンアプリをOSSにします - Qiita
2022.7
Sound recording and encoding in MP3
WAVファイルにリアルタイムでエフェクトをかける
C言語によるmmio系処理による
↑
OSC
†
OpenSound Control - Wikipedia
2022.2
OpenSound Control(OSC)とは、電子楽器(特にシンセサイザー)やコンピュータなどの機器において音楽演奏データをネットワーク経由でリアルタイムに共有するための通信プロトコルである。カリフォルニア大学バークレー校にある CNMAT(The Center for New Music and Audio Technologies)が開発した。
OSC はMIDIの代替となることを意図して設計されている。MIDIは1982年に実装されたもので、最近のマルチメディア用途には適していない部分が多い。通信プロトコルであるため、OSCによって、楽器やMIDIコントローラや各種マルチメディア機器が屋内のネットワーク(TCP/IP、イーサネット)やインターネットを経由して通信することが可能となる。OSCはブロードバンド・ネットワークの通信速度を最大限に活かしてデータ転送を行うため、31.250[kbps]と言う規格上の速度上限があったMIDIでは不可能な新たな利用方法が可能となっている。また、転送データの柔軟性も増しており、より高度なレベルでの通信が可能である。
TouchDesigner×Pythonで軽率にOSC通信する方法を初心者向けに説明する - Qiita
2021
↑
MIDI
†
YouTubeのピアノ演奏動画の全自動採譜(MIDI化) - Qiita
2022.9
【初投稿】Google Magenta でファイナルファンタジーの戦闘曲を学習させて新曲を作る試み - Qiita
2022.6
WSLでMagentaを使ったピアノ耳コピの自動化 - Qiita
2022.8
世界のプログラミング言語(41) 簡単に音楽をプログラミングできる言語MML | TECH+
2022.5
C#によるMIDI toolkit
↑
ツール
†
最強コード解析ツール「chordify」の使い方
2017
YouTubeにアップロードされている楽曲コードを自動で分析
Online tone generator
2021.8
Windowsユーザにオススメの万能仮想ミキサー「VoiceMeeter Banana」が凄い
2020.6
https://vb-audio.com/Cable/index.htm
Eusing mp3 cutter
ギター練習用音楽再生プレーヤ
主に楽器の練習用に、音楽ファイルの再生速度を遅くしたり音程を変えたりして再生するソフト
読み上げテキスト
青空ろーどく
青空文庫の読み上げ
http://www35.atwiki.jp/softalk/
Softalk テキスト読み上げソフト(ゆっくりしていってね!の声とも言われる)
プロ流CDリッピング
http://www.mediamonkey.com/
mp3のタグ整理機能
iTunesは今すぐ捨てろ!音楽プレイヤの決定版登場
http://teenspirit.artificialspirit.com/
手持ちの曲の歌詞を全自動で取ってきてくれるCassini
http://www.crintsoft.com/minilyrics.htm
MP3ファイルをロスレス編集することができるフリーソフト「mp3DirectCut」
Audacity
Adobe Soundbooth
Super C
あらゆるマルチメディアファイルのコンバート
ストリームの保存も可能
KKKKK.Net
音加工ツールがある
iOpenerによるM4P->MP3変換
iTunesのメタデータをクリーンナップするTuneUp
iTunesによるM4A->MP3の変換方法