→画像処理関連
→動画関連
→自然言語処理
読み上げ/音声合成/音声言語処理/音声分離†
Amazon Polly†
文字起こし/音声認識†
アマゾンのAWSでテキストを解析してみた
Amazon Comprehendは、機械学習を使用してテキスト内のインサイトや関係性を検出できる自然言語処理 (NLP)サービスです。キーフレーズ抽出、感情分析、実体認識、トピック形成、言語検出 API の利用ができ、アプリケーションへの統合もできます。
Whisper†
Sound/Wav†
OSC†
OpenSound Control - Wikipedia 2022.2
OpenSound Control(OSC)とは、電子楽器(特にシンセサイザー)やコンピュータなどの機器において音楽演奏データをネットワーク経由でリアルタイムに共有するための通信プロトコルである。カリフォルニア大学バークレー校にある CNMAT(The Center for New Music and Audio Technologies)が開発した。
OSC はMIDIの代替となることを意図して設計されている。MIDIは1982年に実装されたもので、最近のマルチメディア用途には適していない部分が多い。通信プロトコルであるため、OSCによって、楽器やMIDIコントローラや各種マルチメディア機器が屋内のネットワーク(TCP/IP、イーサネット)やインターネットを経由して通信することが可能となる。OSCはブロードバンド・ネットワークの通信速度を最大限に活かしてデータ転送を行うため、31.250[kbps]と言う規格上の速度上限があったMIDIでは不可能な新たな利用方法が可能となっている。また、転送データの柔軟性も増しており、より高度なレベルでの通信が可能である。
MIDI†
ツール†
Last-modified: 2023-06-06 (火) 09:15:46