Einen lokalen Agenten per Discord-Voice zu steuern heißt meist: ein gehosteter Bot, in den du nicht reinsiehst und den du nicht kontrollierst.
aktiv v1.0.4
OpenClaw-Discord-Voice
Sprich über einen Discord-Voice-Channel mit einem lokalen OpenClaw-Agenten.
Tritt einem Voice-Channel bei, sprich einen Zug, und die Bridge transkribiert ihn lokal mit Whisper, gibt ihn an deine lokale OpenClaw-Session und spielt die Antwort zurück. Die ganze Pipeline bleibt auf deinem Rechner und sichtbar.
Eine self-hosted Discord.js-Bridge: Opus-Decode, ffmpeg zu WAV, lokale whisper-cli-Transkription, eine Session pro Guild und umschaltbare Stimmen (Piper, macOS say oder ElevenLabs).
Die Sprache bleibt auf deinem Rechner, die Session gehört dir, und jeder Schritt der Pipeline ist einsehbar.
Für self-hosted Agent-Setups, die Voice in Discord wollen, ohne die Runtime an einen gehosteten Bot abzugeben.
Entwickler-Setup
source without GitHub CLI
git clone https://github.com/jx-grxf/OpenClaw-Discord-Voice.git && cd OpenClaw-Discord-Voice source with GitHub CLI
gh repo clone jx-grxf/OpenClaw-Discord-Voice && cd OpenClaw-Discord-Voice latest release
open https://github.com/jx-grxf/OpenClaw-Discord-Voice/releases/tag/v1.0.4 Highlights
- Nimmt einen gesprochenen Zug auf und transkribiert ihn lokal mit whisper-cli — kein Cloud-STT.
- Verbindet direkt mit deiner lokalen OpenClaw-Session, eine pro Discord-Guild.
- Umschaltbare Antworten: Piper, macOS say oder ElevenLabs.
- Eingebaute doctor- und /info-Checks für Env, Binaries, Modellpfad und Discord-Auth.