Zurück zu den Projekten
aktiv v1.0.4

OpenClaw-Discord-Voice

Sprich über einen Discord-Voice-Channel mit einem lokalen OpenClaw-Agenten.

Tritt einem Voice-Channel bei, sprich einen Zug, und die Bridge transkribiert ihn lokal mit Whisper, gibt ihn an deine lokale OpenClaw-Session und spielt die Antwort zurück. Die ganze Pipeline bleibt auf deinem Rechner und sichtbar.

Pipeline diagram for OpenClaw Discord Voice
Problem

Einen lokalen Agenten per Discord-Voice zu steuern heißt meist: ein gehosteter Bot, in den du nicht reinsiehst und den du nicht kontrollierst.

Was ich gebaut habe

Eine self-hosted Discord.js-Bridge: Opus-Decode, ffmpeg zu WAV, lokale whisper-cli-Transkription, eine Session pro Guild und umschaltbare Stimmen (Piper, macOS say oder ElevenLabs).

Ergebnis

Die Sprache bleibt auf deinem Rechner, die Session gehört dir, und jeder Schritt der Pipeline ist einsehbar.

Zielgruppe

Für self-hosted Agent-Setups, die Voice in Discord wollen, ohne die Runtime an einen gehosteten Bot abzugeben.

Entwickler-Setup

source without GitHub CLI git clone https://github.com/jx-grxf/OpenClaw-Discord-Voice.git && cd OpenClaw-Discord-Voice
source with GitHub CLI gh repo clone jx-grxf/OpenClaw-Discord-Voice && cd OpenClaw-Discord-Voice
latest release open https://github.com/jx-grxf/OpenClaw-Discord-Voice/releases/tag/v1.0.4

Highlights

  • Nimmt einen gesprochenen Zug auf und transkribiert ihn lokal mit whisper-cli — kein Cloud-STT.
  • Verbindet direkt mit deiner lokalen OpenClaw-Session, eine pro Discord-Guild.
  • Umschaltbare Antworten: Piper, macOS say oder ElevenLabs.
  • Eingebaute doctor- und /info-Checks für Env, Binaries, Modellpfad und Discord-Auth.