音声コマンドパイプライン
リアルタイム音声処理フロー
音声入力
音声キャプチャ
VAD
音声検出
話者
話者検出
STT (Whisper)
音声テキスト変換
ローカルLLM
ローカルQwenモデル
コマンド
コマンド実行
Whisper ファインチューニングプロセス
カスタムモデル最適化パイプライン
🤖
ベース Whisper (Medium)
📚
カスタムトレーニングデータ
⚙️
ファインチューニング (PyTorch)
⚡
CTranslate2 変換
✅
最適化モデル
🤖
ベース Whisper (Medium)
📚
カスタムトレーニングデータ
⚙️
ファインチューニング (PyTorch)
⚡
CTranslate2 変換
✅
最適化モデル
主な機能
🔒
100% オンプレミス
外部API呼び出しなし、すべてローカル処理
⚡
リアルタイム処理
CTranslate2 最適化で3倍高速化
🎯
ファインチューニング済みモデル
ドメイン特化の精度向上のためのカスタムトレーニング
技術スタック
Python
PyTorch
Whisper
Transformers
CTranslate2
Local LLM
LlamaIndex
ChromaDB
Docling
PyInstaller
C# WPF