Zurück zu den Projekten
in entwicklung

Hermes-Discord-Voice

Self-hosted Voice für den Hermes-Agenten, direkt im Discord-Call.

Der Bot tritt deinem Discord-Voice-Channel bei, nimmt einen gesprochenen Zug auf, transkribiert ihn lokal mit Whisper, schickt den Text an Hermes und spricht die Antwort über die TTS-Stimme deiner Wahl zurück. Nur persönliche Server — kein gehosteter Dienst dazwischen.

Hermes-Voice wordmark
Problem

Mit einem lokalen Agenten per Discord-Voice zu reden heißt meist: einem gehosteten Bot vertrauen und die Kontrolle über die Sprach-Pipeline abgeben.

Was ich gebaut habe

Eine self-hosted Discord.js-Bridge mit lokaler whisper-cli-Transkription, einer Hermes-Session pro Guild, einer Sprecher-Allowlist pro Guild und steckbarem TTS — Piper, macOS say, ElevenLabs oder ein eigener Befehl.

Ergebnis

Die Spracheingabe bleibt privat und auf deinem Rechner, während der Hermes-Transport und jeder Schritt der Pipeline explizit bleiben.

Zielgruppe

Für persönliche oder kleine vertraute Discord-Server, die mit einem lokalen Hermes-Agenten reden wollen, ohne einem gehosteten Bot zu vertrauen.

Entwickler-Setup

source without GitHub CLI git clone https://github.com/jx-grxf/Hermes-Discord-Voice.git && cd Hermes-Discord-Voice
source with GitHub CLI gh repo clone jx-grxf/Hermes-Discord-Voice && cd Hermes-Discord-Voice
latest release open https://github.com/jx-grxf/Hermes-Discord-Voice/releases

Highlights

  • Tritt Discord-Voice bei, nimmt einen Zug auf und transkribiert ihn lokal mit whisper-cli — kein Cloud-STT.
  • Leitet Transkripte standardmäßig per CLI an Hermes, oder über dessen API/Gateway.
  • Antwortet über Piper, macOS say, ElevenLabs oder deinen eigenen TTS-Befehl.
  • Privat per Default: eine Session pro Guild mit einer Sprecher-Allowlist, die du kontrollierst.