音声認識・音声合成
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
] [
Twitter
]
開始行:
→音声処理関連
→自然言語処理
→画像認識/検出/トラッキング
→画像生成
#contents
*楽曲生成 [#gb42fa95]
-[[Suno AIで、音楽を自動生成する。>http://cedro3.com/ai/s...
-[[AIで作曲できるツールが想像以上にクオリティ高くて驚く→...
* 文字起こし/音声認識 [#h82fe814]
-[[[電話無人対応] Amazon Bedrock + Whisperで、名前のヒア...
-[[話した言葉を文字起こしするアプリの作成 #Python - Qiita...
-[[【初心者向け】Pythonで簡単に音声認識精度をチェック! |...
-[[[Python] 日本語をローマ字に変換する|こはた>https...
-[[ローマ字表記(ヘボン式・日本式・訓令式)の違いについて...
-[[自動文字起こしサービスである、OpenAIの「Whisper API」...
--Whisper APIとAmazon Transcribeを精度という点のみで比較...
--しかし、Whisper APIは音声からの適切な変換に優れている一...
--それに対し、Amazon Transcribeでは句読点が挿入され読みや...
-[[ChatGPT, Python, Whisper APIを活用し、動画ファイルから...
-[[Windowsで音声文字起こし MyWhisper(マイウィスパー) -...
--[[umiyuki/MyWhisper: WindowsでWhisper文字起こしできるア...
-[[ChatGPTによる構造化データの音声入力インターフェースが...
-[[音声文字起こし技術で業務効率化: Google Text to Speech ...
-[[超高精度な国産音声認識AI「ReazonSpeech」が無償公開され...
-[[アマゾンのAWSで音声の文字起こしサービスを無料で試して...
-- Amazon Transcribe
-[[アマゾンのAWSでテキストを解析してみた>https://ledge.ai...
--Amazon Comprehendは、機械学習を使用してテキスト内のイン...
**Whisper [#mafa5a3a]
-[[AWS Lambda でOpenAI の Whisper API を 認識精度の改善も...
-[[Azure OpenAI Whisperの対応コーデックについて(ogaで起こ...
-[[OpenAIのWhisperとChatGPTのAPIでGoogle Colab上で簡易な...
-[[議事録作成の手間を解消?音声ファイルをChatGPTとWhisper...
-[[Whisperで文字起こしをした議事録の発話者の名前を自動的...
-[[議事録作成の手間を解消?音声ファイルをChatGPTとWhisper...
-[[OpenAIが公開したChatGPTとWhisperのAPIをUnityでサクッと...
-[[文字起こしAI「Whisper」を誰でも簡単に使えるようにした...
--[[beyondcode/writeout.ai: Transcribe and translate your...
-[[OpenAIのWhisper APIの25MB制限に合うような調整を検討す...
-[[Whisperを使ったリアルタイム音声認識と字幕描画方法の紹...
-[[Whisper + GPT-3 で会議音声からの議事録書き出し&サマリ...
-[[GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisp...
-[[PCで再生中の音声をWhisperでリアルタイムに文字起こしす...
-[[音声認識モデルwhisperの全モデル文字起こし比較 - 毎日が...
-[[OpenAIリリースのWhisperをCPUだけで動かすために色々試し...
-[[【Whisper】Webアプリ(GUIデモ)のインストール | ジコロ...
-[[音声認識モデル”Whisper”をストリーミング処理対応させる...
-[[文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る...
-[[OpenAIの音声認識Whisperを使って好きな洋画やアニメから...
-[[高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニー...
-[[【Python】AI音声認識Whisperを使ったSRT字幕ファイルの自...
-[[無料でOpenAIの「Whisper」を使って録音ファイルから音声...
-[[OpenAIがリリースした高精度な音声認識モデル”Whisper”を...
-[[ほぼ完璧な文字起こしができるAI音声認識Whisperのインス...
-[[OpenAIの音声認識Whisperがすごいので,Youtube用に字幕生...
-[[OpenAIの音声認識Whisperがすごいので,Google Colabで試...
-[[OpenAIの音声認識Whisperがすごいので,Google Colabで試...
* 読み上げ/音声合成/音声言語処理/音声分離 [#q61b527a]
-[[3秒の音声があれば本人そっくりの声で日本語・英語・中国...
-[[Azure : Speech to Text と OpenAI で動画・音声からテキ...
-[[【AIボイスチェンジャー】確実にわかるRVCの使い方 | ジコ...
-[[無料で自由に使える簡単操作のボーカルリムーバー | ジコ...
-[[文章から音楽を生成するRiffusionのインストール | ジコロ...
-[[【藤本健のDigital Audio Laboratory】AIでボーカル・ドラ...
-[[AIが音楽に変える!「text2music」でツイートから音楽を作...
-[[img2musicで、画像から音楽を生成する>http://cedro3.com/...
-[[テキストから音楽を作成するMubert-Text-to-Musicのインス...
-[[GitHub - MubertAI/Mubert-Text-to-Music: A simple noteb...
-[[AudioGen: Textually Guided Audio Generation>https://fe...
-[[【Wav2LipによるAI動画編集】動画の人物を無理やりしゃべ...
-[[【Pythonで音声合成(テキスト読み上げ)】gTTSのインスト...
-[[AIで音楽をボーカル・ドラム・ベース・その他に分離できる...
-[[音声読み上げアプリ作成 PySimpleGUI, gTTS, Python | み...
-[[How To Transcribe Your Podcast with Python - DEV Commu...
-[[Python の SpeechRecognizer を用いて音声認識(SpeechRec...
-[[Creating Your Own Voice Assistant in Python - DEV Comm...
-[[[M1] 音声認識ツール Voskを動かす [Node] | DevelopersIO...
-[[日本語音声のマイク入力をオフラインでリアルタイム音声認...
-[[ZOOMの日本語音声を無料で英語に翻訳した字幕をつける。 -...
--AzureのSpeech translationの無料枠を使用
-[[VOICEPEAKの音声にほぼドンピシャの字幕ファイルを作成す...
-[[入力文字読み上げソフト『VOICEPEAK』を試してみた | Deve...
-[[読み上げテキスト>http://www.vector.co.jp/soft/cmt/winn...
-[[青空ろーどく>http://sites.google.com/site/aozorarohdok...
--青空文庫の読み上げ
-http://www35.atwiki.jp/softalk/
--Softalk テキスト読み上げソフト(ゆっくりしていってね!...
-[[ボカロ(作るところから)はじめました>http://d.hatena.ne....
-[[青空文庫や六法のオーディオブックを無料で作る方法>http:...
-[[Microsoft Speech Platform の日本語音声合成エンジン>htt...
-[[Windows10,WSL2でESPNetのVITS学習レシピを実行する【音声...
-[[パソコンにしゃべらせてみよう>http://www.geocities.co.j...
-[[AquesTalk>http://www.a-quest.com/products/aquestalk.ht...
--Softalkなどで使われているテキスト読み上げ機能のライブラリ
** OpenAI Text-To-Speech [#t4725ec4]
-[[Google Colab で OpenAI API の Text-to-Speech を試す|n...
-[[GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実...
-[[OpenAI Text-to-Speech(TTS)API の使い方や料金について...
-[[Google Colab で OpenAI API の Text-to-Speech を試す|n...
** Amazon Polly [#ib3c05d5]
-[[Amazon PollyのSSMLを利用し、住所を自然な日本語の発音に...
-[[ChatGPT + Amazon Polly + Android で AI 音声アシスタン...
-[[[初心者向け] Amazon Polly を使って ChatGPT を体感して...
-[[Amazon Polly に歌わせて VTuber デビューさせてみた - bu...
-[[Amazon Pollyを使ってAIに音声を読み上げしてもらおう! -...
-[[AI音声のAmazon Pollyを使ってみた! | DevelopersIO>https...
終了行:
→音声処理関連
→自然言語処理
→画像認識/検出/トラッキング
→画像生成
#contents
*楽曲生成 [#gb42fa95]
-[[Suno AIで、音楽を自動生成する。>http://cedro3.com/ai/s...
-[[AIで作曲できるツールが想像以上にクオリティ高くて驚く→...
* 文字起こし/音声認識 [#h82fe814]
-[[[電話無人対応] Amazon Bedrock + Whisperで、名前のヒア...
-[[話した言葉を文字起こしするアプリの作成 #Python - Qiita...
-[[【初心者向け】Pythonで簡単に音声認識精度をチェック! |...
-[[[Python] 日本語をローマ字に変換する|こはた>https...
-[[ローマ字表記(ヘボン式・日本式・訓令式)の違いについて...
-[[自動文字起こしサービスである、OpenAIの「Whisper API」...
--Whisper APIとAmazon Transcribeを精度という点のみで比較...
--しかし、Whisper APIは音声からの適切な変換に優れている一...
--それに対し、Amazon Transcribeでは句読点が挿入され読みや...
-[[ChatGPT, Python, Whisper APIを活用し、動画ファイルから...
-[[Windowsで音声文字起こし MyWhisper(マイウィスパー) -...
--[[umiyuki/MyWhisper: WindowsでWhisper文字起こしできるア...
-[[ChatGPTによる構造化データの音声入力インターフェースが...
-[[音声文字起こし技術で業務効率化: Google Text to Speech ...
-[[超高精度な国産音声認識AI「ReazonSpeech」が無償公開され...
-[[アマゾンのAWSで音声の文字起こしサービスを無料で試して...
-- Amazon Transcribe
-[[アマゾンのAWSでテキストを解析してみた>https://ledge.ai...
--Amazon Comprehendは、機械学習を使用してテキスト内のイン...
**Whisper [#mafa5a3a]
-[[AWS Lambda でOpenAI の Whisper API を 認識精度の改善も...
-[[Azure OpenAI Whisperの対応コーデックについて(ogaで起こ...
-[[OpenAIのWhisperとChatGPTのAPIでGoogle Colab上で簡易な...
-[[議事録作成の手間を解消?音声ファイルをChatGPTとWhisper...
-[[Whisperで文字起こしをした議事録の発話者の名前を自動的...
-[[議事録作成の手間を解消?音声ファイルをChatGPTとWhisper...
-[[OpenAIが公開したChatGPTとWhisperのAPIをUnityでサクッと...
-[[文字起こしAI「Whisper」を誰でも簡単に使えるようにした...
--[[beyondcode/writeout.ai: Transcribe and translate your...
-[[OpenAIのWhisper APIの25MB制限に合うような調整を検討す...
-[[Whisperを使ったリアルタイム音声認識と字幕描画方法の紹...
-[[Whisper + GPT-3 で会議音声からの議事録書き出し&サマリ...
-[[GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisp...
-[[PCで再生中の音声をWhisperでリアルタイムに文字起こしす...
-[[音声認識モデルwhisperの全モデル文字起こし比較 - 毎日が...
-[[OpenAIリリースのWhisperをCPUだけで動かすために色々試し...
-[[【Whisper】Webアプリ(GUIデモ)のインストール | ジコロ...
-[[音声認識モデル”Whisper”をストリーミング処理対応させる...
-[[文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る...
-[[OpenAIの音声認識Whisperを使って好きな洋画やアニメから...
-[[高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニー...
-[[【Python】AI音声認識Whisperを使ったSRT字幕ファイルの自...
-[[無料でOpenAIの「Whisper」を使って録音ファイルから音声...
-[[OpenAIがリリースした高精度な音声認識モデル”Whisper”を...
-[[ほぼ完璧な文字起こしができるAI音声認識Whisperのインス...
-[[OpenAIの音声認識Whisperがすごいので,Youtube用に字幕生...
-[[OpenAIの音声認識Whisperがすごいので,Google Colabで試...
-[[OpenAIの音声認識Whisperがすごいので,Google Colabで試...
* 読み上げ/音声合成/音声言語処理/音声分離 [#q61b527a]
-[[3秒の音声があれば本人そっくりの声で日本語・英語・中国...
-[[Azure : Speech to Text と OpenAI で動画・音声からテキ...
-[[【AIボイスチェンジャー】確実にわかるRVCの使い方 | ジコ...
-[[無料で自由に使える簡単操作のボーカルリムーバー | ジコ...
-[[文章から音楽を生成するRiffusionのインストール | ジコロ...
-[[【藤本健のDigital Audio Laboratory】AIでボーカル・ドラ...
-[[AIが音楽に変える!「text2music」でツイートから音楽を作...
-[[img2musicで、画像から音楽を生成する>http://cedro3.com/...
-[[テキストから音楽を作成するMubert-Text-to-Musicのインス...
-[[GitHub - MubertAI/Mubert-Text-to-Music: A simple noteb...
-[[AudioGen: Textually Guided Audio Generation>https://fe...
-[[【Wav2LipによるAI動画編集】動画の人物を無理やりしゃべ...
-[[【Pythonで音声合成(テキスト読み上げ)】gTTSのインスト...
-[[AIで音楽をボーカル・ドラム・ベース・その他に分離できる...
-[[音声読み上げアプリ作成 PySimpleGUI, gTTS, Python | み...
-[[How To Transcribe Your Podcast with Python - DEV Commu...
-[[Python の SpeechRecognizer を用いて音声認識(SpeechRec...
-[[Creating Your Own Voice Assistant in Python - DEV Comm...
-[[[M1] 音声認識ツール Voskを動かす [Node] | DevelopersIO...
-[[日本語音声のマイク入力をオフラインでリアルタイム音声認...
-[[ZOOMの日本語音声を無料で英語に翻訳した字幕をつける。 -...
--AzureのSpeech translationの無料枠を使用
-[[VOICEPEAKの音声にほぼドンピシャの字幕ファイルを作成す...
-[[入力文字読み上げソフト『VOICEPEAK』を試してみた | Deve...
-[[読み上げテキスト>http://www.vector.co.jp/soft/cmt/winn...
-[[青空ろーどく>http://sites.google.com/site/aozorarohdok...
--青空文庫の読み上げ
-http://www35.atwiki.jp/softalk/
--Softalk テキスト読み上げソフト(ゆっくりしていってね!...
-[[ボカロ(作るところから)はじめました>http://d.hatena.ne....
-[[青空文庫や六法のオーディオブックを無料で作る方法>http:...
-[[Microsoft Speech Platform の日本語音声合成エンジン>htt...
-[[Windows10,WSL2でESPNetのVITS学習レシピを実行する【音声...
-[[パソコンにしゃべらせてみよう>http://www.geocities.co.j...
-[[AquesTalk>http://www.a-quest.com/products/aquestalk.ht...
--Softalkなどで使われているテキスト読み上げ機能のライブラリ
** OpenAI Text-To-Speech [#t4725ec4]
-[[Google Colab で OpenAI API の Text-to-Speech を試す|n...
-[[GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実...
-[[OpenAI Text-to-Speech(TTS)API の使い方や料金について...
-[[Google Colab で OpenAI API の Text-to-Speech を試す|n...
** Amazon Polly [#ib3c05d5]
-[[Amazon PollyのSSMLを利用し、住所を自然な日本語の発音に...
-[[ChatGPT + Amazon Polly + Android で AI 音声アシスタン...
-[[[初心者向け] Amazon Polly を使って ChatGPT を体感して...
-[[Amazon Polly に歌わせて VTuber デビューさせてみた - bu...
-[[Amazon Pollyを使ってAIに音声を読み上げしてもらおう! -...
-[[AI音声のAmazon Pollyを使ってみた! | DevelopersIO>https...
ページ名: