Mit einem lokalen Agenten per Discord-Voice zu reden heißt meist: einem gehosteten Bot vertrauen und die Kontrolle über die Sprach-Pipeline abgeben.
Hermes-Discord-Voice
Self-hosted Voice für den Hermes-Agenten, direkt im Discord-Call.
Der Bot tritt deinem Discord-Voice-Channel bei, nimmt einen gesprochenen Zug auf, transkribiert ihn lokal mit Whisper, schickt den Text an Hermes und spricht die Antwort über die TTS-Stimme deiner Wahl zurück. Nur persönliche Server — kein gehosteter Dienst dazwischen.
Eine self-hosted Discord.js-Bridge mit lokaler whisper-cli-Transkription, einer Hermes-Session pro Guild, einer Sprecher-Allowlist pro Guild und steckbarem TTS — Piper, macOS say, ElevenLabs oder ein eigener Befehl.
Die Spracheingabe bleibt privat und auf deinem Rechner, während der Hermes-Transport und jeder Schritt der Pipeline explizit bleiben.
Für persönliche oder kleine vertraute Discord-Server, die mit einem lokalen Hermes-Agenten reden wollen, ohne einem gehosteten Bot zu vertrauen.
Entwickler-Setup
git clone https://github.com/jx-grxf/Hermes-Discord-Voice.git && cd Hermes-Discord-Voice gh repo clone jx-grxf/Hermes-Discord-Voice && cd Hermes-Discord-Voice open https://github.com/jx-grxf/Hermes-Discord-Voice/releases Highlights
- Tritt Discord-Voice bei, nimmt einen Zug auf und transkribiert ihn lokal mit whisper-cli — kein Cloud-STT.
- Leitet Transkripte standardmäßig per CLI an Hermes, oder über dessen API/Gateway.
- Antwortet über Piper, macOS say, ElevenLabs oder deinen eigenen TTS-Befehl.
- Privat per Default: eine Session pro Guild mit einer Sprecher-Allowlist, die du kontrollierst.