音声コマンドパイプライン

リアルタイム音声処理フロー

音声入力

音声キャプチャ

VAD

音声検出

話者

話者検出

STT (Whisper)

音声テキスト変換

ローカルLLM

ローカルQwenモデル

コマンド

コマンド実行

Whisper ファインチューニングプロセス

カスタムモデル最適化パイプライン

🤖

ベース Whisper (Medium)

📚

カスタムトレーニングデータ

⚙️

ファインチューニング (PyTorch)

CTranslate2 変換

最適化モデル

主な機能

🔒

100% オンプレミス

外部API呼び出しなし、すべてローカル処理

リアルタイム処理

CTranslate2 最適化で3倍高速化

🎯

ファインチューニング済みモデル

ドメイン特化の精度向上のためのカスタムトレーニング

技術スタック

Python
PyTorch
Whisper
Transformers
CTranslate2
Local LLM
LlamaIndex
ChromaDB
Docling
PyInstaller
C# WPF