Update: VibeVoice ASR記事をワンライナー形式に更新
All checks were successful
Deploy Docusaurus Site / deploy (push) Successful in 28s

This commit is contained in:
koide 2026-02-24 01:22:30 +00:00
parent 1fb76254e9
commit 1cfcfd96eb

View File

@ -39,20 +39,40 @@ VibeVoice は Microsoft が開発したオープンソースの音声認識モ
- **Docker** — NVIDIA Container Toolkit 導入済み - **Docker** — NVIDIA Container Toolkit 導入済み
- **VRAM** — 約 8GB 以上 - **VRAM** — 約 8GB 以上
## クイックスタート ## ワンライナーでセットアップ
### 1. リポジトリをクローン
```bash ```bash
cd ~ curl -sL https://docs.techswan.online/scripts/vibevoice-asr/setup.sh | bash -s build
git clone https://github.com/YOUR_REPO/vibevoice-asr.git ```
cd vibevoice-asr
これだけでダウンロード・ビルドが完了します。
### その他のオプション
```bash
# ダウンロードのみ
curl -sL https://docs.techswan.online/scripts/vibevoice-asr/setup.sh | bash
# ダウンロード・ビルド・Gradioデモ起動まで一気に
curl -sL https://docs.techswan.online/scripts/vibevoice-asr/setup.sh | bash -s demo
# 両方のサービスを起動Gradio + Realtime ASR
curl -sL https://docs.techswan.online/scripts/vibevoice-asr/setup.sh | bash -s serve
```
## 手動セットアップ
### 1. ファイルをダウンロード
```bash
curl -sL https://docs.techswan.online/scripts/vibevoice-asr/setup.sh | bash
cd ~/vibevoice-asr
``` ```
### 2. Docker イメージをビルド ### 2. Docker イメージをビルド
```bash ```bash
./setup.sh build docker build -t vibevoice-asr:dgx-spark .
``` ```
ビルドには数分かかりますNGC PyTorch コンテナベース)。 ビルドには数分かかりますNGC PyTorch コンテナベース)。
@ -62,7 +82,9 @@ cd vibevoice-asr
**バッチ ASRGradio UIのみ** **バッチ ASRGradio UIのみ**
```bash ```bash
./setup.sh demo docker run --gpus all --ipc=host --network=host \
-v "$HOME/.cache/huggingface:/root/.cache/huggingface" \
vibevoice-asr:dgx-spark
``` ```
`http://localhost:7860` でアクセス `http://localhost:7860` でアクセス
@ -70,7 +92,10 @@ cd vibevoice-asr
**リアルタイム ASR のみ:** **リアルタイム ASR のみ:**
```bash ```bash
./setup.sh realtime docker run --gpus all --ipc=host --network=host \
-v "$HOME/.cache/huggingface:/root/.cache/huggingface" \
vibevoice-asr:dgx-spark \
python -m realtime.server --host 0.0.0.0 --port 8000
``` ```
→ WebSocket: `ws://localhost:8000/ws/asr/{session_id}` → WebSocket: `ws://localhost:8000/ws/asr/{session_id}`
@ -79,7 +104,9 @@ cd vibevoice-asr
**両方を同時起動:** **両方を同時起動:**
```bash ```bash
./setup.sh serve docker run --gpus all --ipc=host --network=host \
-v "$HOME/.cache/huggingface:/root/.cache/huggingface" \
vibevoice-asr:dgx-spark ./run_all.sh
``` ```
## 使い方 ## 使い方
@ -182,27 +209,6 @@ function sendAudio(pcmData) {
| `--max-sessions` | `10` | 最大同時接続数 | | `--max-sessions` | `10` | 最大同時接続数 |
| `--no-preload` | - | モデルの事前ロードを無効化 | | `--no-preload` | - | モデルの事前ロードを無効化 |
## Docker 手動実行
### バッチ ASR
```bash
docker run --gpus all -p 7860:7860 vibevoice-asr:dgx-spark
```
### リアルタイム ASR
```bash
docker run --gpus all -p 8000:8000 vibevoice-asr:dgx-spark \
python -m realtime.server --host 0.0.0.0 --port 8000
```
### 両方同時
```bash
docker run --gpus all -p 7860:7860 -p 8000:8000 vibevoice-asr:dgx-spark ./run_all.sh
```
## トラブルシューティング ## トラブルシューティング
### GPU メモリ不足 ### GPU メモリ不足