Compare commits
60 Commits
main
...
dev_debian
| Author | SHA1 | Date | |
|---|---|---|---|
| b44bd350f6 | |||
| 082c055683 | |||
| cd239fde3c | |||
| 095d3edc03 | |||
| 091a553452 | |||
| 6703aa2082 | |||
| 0c4e377fa3 | |||
| 4eabde994d | |||
| c069c3d464 | |||
| 27fa7ed96f | |||
| ab0b8921c1 | |||
| 019815b5b1 | |||
| baeca38fcf | |||
| de37178f7a | |||
| 87fabe2489 | |||
| fa90f7b1e6 | |||
| b83de316b3 | |||
| 0578808fc9 | |||
| 01319a2b8c | |||
| 849ad23c64 | |||
| be29a86f1b | |||
| feb648d035 | |||
| 3275c1ee69 | |||
| 6a513768e1 | |||
| ddf0ac1211 | |||
| e11d55c077 | |||
| 16aa40492c | |||
| b9d198497d | |||
| e8242228e4 | |||
| 9468a237e2 | |||
| 055d157283 | |||
| 300960f5ce | |||
| 60a8e1f104 | |||
| b312a09a0c | |||
| 2e8daf6ce1 | |||
| 6b081bbbaf | |||
| 0c085b7546 | |||
| 7b27100302 | |||
| 7fc94ff379 | |||
| 2416581568 | |||
| 9f64ca5c87 | |||
| 132eede43c | |||
| bf941e5c5f | |||
| 1478f24eab | |||
| d571a532b0 | |||
| 10890af8cf | |||
| c1ec3ad1a1 | |||
| f4b9dbfd73 | |||
| 25e56e9ba9 | |||
| 0dae15e84b | |||
| 483cd69fb8 | |||
| 0dff010d59 | |||
| 332e5e214d | |||
| 5d68390a11 | |||
| 48c1155e01 | |||
| a65a362fec | |||
| 7121c18a7d | |||
| 98fbd69f69 | |||
| da9e4dc44a | |||
| b3ebf90965 |
7
.gitignore
vendored
7
.gitignore
vendored
@@ -1,6 +1,8 @@
|
|||||||
# ---> Linux
|
# ---> Linux
|
||||||
*~
|
*~
|
||||||
|
./config/*
|
||||||
|
./venv/*
|
||||||
|
./workspace/
|
||||||
# temporary files which can be created if a process still has a handle open of a deleted file
|
# temporary files which can be created if a process still has a handle open of a deleted file
|
||||||
.fuse_hidden*
|
.fuse_hidden*
|
||||||
|
|
||||||
@@ -20,7 +22,8 @@
|
|||||||
.LSOverride
|
.LSOverride
|
||||||
|
|
||||||
# Icon must end with two \r
|
# Icon must end with two \r
|
||||||
Icon
|
Icon
|
||||||
|
|
||||||
|
|
||||||
# Thumbnails
|
# Thumbnails
|
||||||
._*
|
._*
|
||||||
|
|||||||
0
config/.gitkeep
Normal file
0
config/.gitkeep
Normal file
840
jarvis.py
Normal file
840
jarvis.py
Normal file
@@ -0,0 +1,840 @@
|
|||||||
|
import os
|
||||||
|
import re
|
||||||
|
import sqlite3
|
||||||
|
import asyncio
|
||||||
|
import openai
|
||||||
|
import sys
|
||||||
|
import subprocess
|
||||||
|
import edge_tts
|
||||||
|
|
||||||
|
from google import genai
|
||||||
|
from google.genai import types
|
||||||
|
|
||||||
|
from datetime import datetime
|
||||||
|
from pathlib import Path
|
||||||
|
from dotenv import load_dotenv
|
||||||
|
|
||||||
|
from colorama import init, Fore, Style
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# INITIALISIERUNG
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
init(autoreset=True)
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# PFADE & SETUP
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
BASE_DIR = Path(__file__).resolve().parent
|
||||||
|
CONFIG_DIR = BASE_DIR / "config"
|
||||||
|
DATA_DIR = BASE_DIR / "data"
|
||||||
|
WORKSPACE_DIR = BASE_DIR / "workspace"
|
||||||
|
|
||||||
|
ENV_FILE = CONFIG_DIR / ".env"
|
||||||
|
load_dotenv(ENV_FILE)
|
||||||
|
|
||||||
|
DB_PATH = DATA_DIR / "cluster.db"
|
||||||
|
NOTES_FILE = WORKSPACE_DIR / "NOTIZEN.md"
|
||||||
|
TODO_FILE = WORKSPACE_DIR / "TODO.md"
|
||||||
|
CHAT_LOG_FILE = WORKSPACE_DIR / "chat_history.log"
|
||||||
|
|
||||||
|
WEB_USER_NAME = os.getenv("WEB_USER_NAME", "Meik")
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# TERMINAL FARBEN
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
USER_COLOR = Fore.CYAN
|
||||||
|
JARVIS_COLOR = Fore.GREEN
|
||||||
|
SYSTEM_COLOR = Fore.YELLOW
|
||||||
|
ERROR_COLOR = Fore.RED
|
||||||
|
OUTPUT_COLOR = Fore.MAGENTA
|
||||||
|
INFO_COLOR = Fore.BLUE
|
||||||
|
|
||||||
|
RESET = Style.RESET_ALL
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# ORDNER & DATEIEN
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
for d in [WORKSPACE_DIR, DATA_DIR, CONFIG_DIR]:
|
||||||
|
d.mkdir(parents=True, exist_ok=True)
|
||||||
|
|
||||||
|
for f in [NOTES_FILE, TODO_FILE]:
|
||||||
|
if not f.exists():
|
||||||
|
f.write_text(
|
||||||
|
f"# {f.name}\nHier fängt dein Gedächtnis an, J.A.R.V.I.S.\n",
|
||||||
|
encoding="utf-8"
|
||||||
|
)
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# KI KONFIGURATION
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
AI_PROVIDER = os.getenv("AI_PROVIDER", "google").lower()
|
||||||
|
|
||||||
|
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY", "")
|
||||||
|
GOOGLE_API_KEY = os.getenv("GOOGLE_API_KEY", "")
|
||||||
|
NVIDIA_API_KEY = os.getenv("NVIDIA_API_KEY", "")
|
||||||
|
GROQ_API_KEY = os.getenv("GROQ_API_KEY", "")
|
||||||
|
OLLAMA_BASE_URL = os.getenv(
|
||||||
|
"OLLAMA_BASE_URL",
|
||||||
|
"http://127.0.0.1:11434/v1"
|
||||||
|
)
|
||||||
|
|
||||||
|
GOOGLE_MODEL = os.getenv(
|
||||||
|
"GOOGLE_MODEL",
|
||||||
|
"gemini-2.5-flash"
|
||||||
|
)
|
||||||
|
|
||||||
|
OPENAI_MODEL = os.getenv(
|
||||||
|
"OPENAI_MODEL",
|
||||||
|
"gpt-4o"
|
||||||
|
)
|
||||||
|
|
||||||
|
OLLAMA_MODEL = os.getenv(
|
||||||
|
"OLLAMA_MODEL",
|
||||||
|
"llama3"
|
||||||
|
)
|
||||||
|
|
||||||
|
NVIDIA_MODEL = os.getenv(
|
||||||
|
"NVIDIA_MODEL",
|
||||||
|
"moonshotai/kimi-k2.6"
|
||||||
|
)
|
||||||
|
|
||||||
|
GROQ_MODEL = os.getenv(
|
||||||
|
"GROQ_MODEL",
|
||||||
|
"meta-llama/llama-4-scout-17b-16e-instruct"
|
||||||
|
)
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# DATENBANK
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
def init_db():
|
||||||
|
conn = sqlite3.connect(DB_PATH)
|
||||||
|
|
||||||
|
conn.execute('''
|
||||||
|
CREATE TABLE IF NOT EXISTS nodes (
|
||||||
|
id INTEGER PRIMARY KEY AUTOINCREMENT,
|
||||||
|
name TEXT,
|
||||||
|
ip TEXT UNIQUE,
|
||||||
|
user TEXT,
|
||||||
|
sudo_password TEXT,
|
||||||
|
os TEXT DEFAULT 'Unbekannt',
|
||||||
|
arch TEXT DEFAULT 'Unbekannt',
|
||||||
|
docker_installed INTEGER DEFAULT 0,
|
||||||
|
status TEXT
|
||||||
|
)
|
||||||
|
''')
|
||||||
|
|
||||||
|
conn.commit()
|
||||||
|
conn.close()
|
||||||
|
|
||||||
|
|
||||||
|
init_db()
|
||||||
|
|
||||||
|
|
||||||
|
def get_db():
|
||||||
|
conn = sqlite3.connect(DB_PATH)
|
||||||
|
conn.row_factory = sqlite3.Row
|
||||||
|
return conn
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# DYNAMISCHE PROGRAMM-ERKENNUNG (NEU)
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
def get_installed_gui_apps():
|
||||||
|
"""Scannt das System nach installierten GUI-Programmen und deren Befehlen."""
|
||||||
|
apps_dir = Path("/usr/share/applications")
|
||||||
|
detected_apps = {}
|
||||||
|
|
||||||
|
if apps_dir.exists():
|
||||||
|
for desktop_file in apps_dir.glob("*.desktop"):
|
||||||
|
try:
|
||||||
|
# Wir lesen die .desktop Datei aus
|
||||||
|
content = desktop_file.read_text(encoding="utf-8", errors="ignore")
|
||||||
|
|
||||||
|
# Suchen nach Name und Exec-Befehl
|
||||||
|
name_match = re.search(r"^Name=(.+)$", content, re.M)
|
||||||
|
exec_match = re.search(r"^Exec=([^ \n%]+)", content, re.M) # Nur den reinen Befehl ohne Argumente (%U etc.)
|
||||||
|
|
||||||
|
if name_match and exec_match:
|
||||||
|
app_name = name_match.group(1).strip()
|
||||||
|
app_cmd = exec_match.group(1).strip()
|
||||||
|
|
||||||
|
# Ignoriere Core-Systemkram, der Meik nur nerven würde
|
||||||
|
if not any(x in app_cmd.lower() for x in ["debian", "im-config", "openjdk", "systemd"]):
|
||||||
|
detected_apps[app_name] = app_cmd
|
||||||
|
except Exception:
|
||||||
|
continue
|
||||||
|
|
||||||
|
return detected_apps
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# SYSTEM PROMPT
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
def get_system_prompt():
|
||||||
|
|
||||||
|
prompt_path = CONFIG_DIR / "system_prompt.txt"
|
||||||
|
|
||||||
|
prompt = (
|
||||||
|
prompt_path.read_text(encoding="utf-8")
|
||||||
|
if prompt_path.exists()
|
||||||
|
else f"Hallo {WEB_USER_NAME}, ich bin J.A.R.V.I.S."
|
||||||
|
)
|
||||||
|
|
||||||
|
prompt = prompt.replace("{user_name}", WEB_USER_NAME)
|
||||||
|
prompt = prompt.replace("{workspace_dir}", str(WORKSPACE_DIR))
|
||||||
|
prompt = prompt.replace("{notes_file}", str(NOTES_FILE))
|
||||||
|
prompt = prompt.replace("{todo_file}", str(TODO_FILE))
|
||||||
|
|
||||||
|
# --- DYNAMISCHE PROGRAMME INJIZIEREN ---
|
||||||
|
installed_apps = get_installed_gui_apps()
|
||||||
|
apps_prompt_string = "VERFÜGBARE LOKALE DESKTOP-PROGRAMME (Nutze NUR diese Befehe zum Starten!):\n"
|
||||||
|
for app_name, app_cmd in installed_apps.items():
|
||||||
|
apps_prompt_string += f"- {app_name}: Befehl lautet '{app_cmd}'\n"
|
||||||
|
|
||||||
|
# Wir hängen die Liste einfach an den Prompt an oder ersetzen einen Platzhalter
|
||||||
|
if "{installed_apps}" in prompt:
|
||||||
|
prompt = prompt.replace("{installed_apps}", apps_prompt_string)
|
||||||
|
else:
|
||||||
|
prompt += "\n\n" + apps_prompt_string
|
||||||
|
# ---------------------------------------
|
||||||
|
|
||||||
|
conn = get_db()
|
||||||
|
nodes = conn.execute('SELECT * FROM nodes').fetchall()
|
||||||
|
conn.close()
|
||||||
|
|
||||||
|
node_info = ""
|
||||||
|
for n in nodes:
|
||||||
|
node_info += f"- Name: {n['name']}, IP: {n['ip']}, User: {n['user']}\n"
|
||||||
|
|
||||||
|
return prompt.replace("{node_info}", node_info)
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# KI KOMMUNIKATION
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
async def get_ai_response(user_msg, system_prompt, history_list):
|
||||||
|
|
||||||
|
try:
|
||||||
|
|
||||||
|
if AI_PROVIDER in ["openai", "ollama", "nvidia", "groq"]:
|
||||||
|
|
||||||
|
# ========================================
|
||||||
|
# PAYLOAD WASCHEN (Für strikte APIs wie Groq)
|
||||||
|
# ========================================
|
||||||
|
clean_history = [
|
||||||
|
{
|
||||||
|
"role": msg["role"],
|
||||||
|
"content": msg["content"]
|
||||||
|
}
|
||||||
|
for msg in history_list
|
||||||
|
]
|
||||||
|
|
||||||
|
messages = [
|
||||||
|
{
|
||||||
|
"role": "system",
|
||||||
|
"content": system_prompt
|
||||||
|
}
|
||||||
|
] + clean_history
|
||||||
|
|
||||||
|
if AI_PROVIDER == "ollama":
|
||||||
|
|
||||||
|
url = (
|
||||||
|
OLLAMA_BASE_URL
|
||||||
|
if OLLAMA_BASE_URL.endswith('/v1')
|
||||||
|
else OLLAMA_BASE_URL.rstrip('/') + '/v1'
|
||||||
|
)
|
||||||
|
|
||||||
|
key = "ollama"
|
||||||
|
model_to_use = OLLAMA_MODEL
|
||||||
|
|
||||||
|
elif AI_PROVIDER == "nvidia":
|
||||||
|
|
||||||
|
url = "https://integrate.api.nvidia.com/v1"
|
||||||
|
key = NVIDIA_API_KEY
|
||||||
|
model_to_use = NVIDIA_MODEL
|
||||||
|
|
||||||
|
elif AI_PROVIDER == "groq":
|
||||||
|
url = "https://api.groq.com/openai/v1"
|
||||||
|
key = GROQ_API_KEY
|
||||||
|
model_to_use = GROQ_MODEL
|
||||||
|
|
||||||
|
else:
|
||||||
|
|
||||||
|
url = None
|
||||||
|
key = OPENAI_API_KEY
|
||||||
|
model_to_use = OPENAI_MODEL
|
||||||
|
|
||||||
|
client = openai.AsyncOpenAI(
|
||||||
|
base_url=url,
|
||||||
|
api_key=key
|
||||||
|
)
|
||||||
|
|
||||||
|
response = await client.chat.completions.create(
|
||||||
|
model=model_to_use,
|
||||||
|
messages=messages
|
||||||
|
)
|
||||||
|
|
||||||
|
return response.choices[0].message.content
|
||||||
|
|
||||||
|
elif AI_PROVIDER == "google":
|
||||||
|
|
||||||
|
client = genai.Client(api_key=GOOGLE_API_KEY)
|
||||||
|
|
||||||
|
google_history = [
|
||||||
|
types.Content(
|
||||||
|
role="user" if msg["role"] == "user" else "model",
|
||||||
|
parts=[
|
||||||
|
types.Part.from_text(
|
||||||
|
text=msg["content"]
|
||||||
|
)
|
||||||
|
]
|
||||||
|
)
|
||||||
|
for msg in history_list[:-1]
|
||||||
|
]
|
||||||
|
|
||||||
|
chat = client.chats.create(
|
||||||
|
model=GOOGLE_MODEL,
|
||||||
|
config=types.GenerateContentConfig(
|
||||||
|
system_instruction=system_prompt
|
||||||
|
),
|
||||||
|
history=google_history
|
||||||
|
)
|
||||||
|
|
||||||
|
return chat.send_message(user_msg).text
|
||||||
|
|
||||||
|
except Exception as e:
|
||||||
|
|
||||||
|
return f"Fehler bei der KI-Anfrage: {e}"
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# BEFEHLSAUSFÜHRUNG
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
async def run_task(target, cmd):
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"\n{SYSTEM_COLOR}"
|
||||||
|
f"⚙️ STARTE TASK AUF [{target}]"
|
||||||
|
f"{RESET}"
|
||||||
|
)
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{INFO_COLOR}"
|
||||||
|
f"➡️ {cmd}"
|
||||||
|
f"{RESET}\n"
|
||||||
|
)
|
||||||
|
|
||||||
|
try:
|
||||||
|
|
||||||
|
# ========================================
|
||||||
|
# GUI APPS ERKENNEN
|
||||||
|
# ========================================
|
||||||
|
|
||||||
|
# Holt sich alle bekannten System-GUI-Befehle dynamisch
|
||||||
|
gui_apps = list(get_installed_gui_apps().values())
|
||||||
|
|
||||||
|
first_word = cmd.strip().split()[0]
|
||||||
|
|
||||||
|
is_gui_app = (
|
||||||
|
first_word in gui_apps
|
||||||
|
or cmd.strip().endswith("&")
|
||||||
|
)
|
||||||
|
|
||||||
|
# ========================================
|
||||||
|
# GUI APPS DETACHED STARTEN
|
||||||
|
# ========================================
|
||||||
|
|
||||||
|
if is_gui_app:
|
||||||
|
|
||||||
|
detached_cmd = (
|
||||||
|
f"nohup {cmd.replace('&', '').strip()} "
|
||||||
|
f">/dev/null 2>&1 &"
|
||||||
|
)
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{SYSTEM_COLOR}"
|
||||||
|
f"🖥️ GUI-APP erkannt → Detached Mode"
|
||||||
|
f"{RESET}"
|
||||||
|
)
|
||||||
|
|
||||||
|
if target.lower() in ["localhost", "127.0.0.1"]:
|
||||||
|
|
||||||
|
proc = await asyncio.create_subprocess_shell(
|
||||||
|
detached_cmd
|
||||||
|
)
|
||||||
|
|
||||||
|
else:
|
||||||
|
|
||||||
|
conn = get_db()
|
||||||
|
|
||||||
|
n = conn.execute(
|
||||||
|
'SELECT * FROM nodes WHERE ip=? OR name=?',
|
||||||
|
(target, target)
|
||||||
|
).fetchone()
|
||||||
|
|
||||||
|
conn.close()
|
||||||
|
|
||||||
|
if not n:
|
||||||
|
|
||||||
|
err = (
|
||||||
|
f"Node '{target}' "
|
||||||
|
f"nicht gefunden."
|
||||||
|
)
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{ERROR_COLOR}{err}{RESET}"
|
||||||
|
)
|
||||||
|
|
||||||
|
return err
|
||||||
|
|
||||||
|
ssh_cmd = (
|
||||||
|
f"ssh "
|
||||||
|
f"-o StrictHostKeyChecking=no "
|
||||||
|
f"-o LogLevel=ERROR "
|
||||||
|
f"{n['user']}@{n['ip']} "
|
||||||
|
f"'{detached_cmd}'"
|
||||||
|
)
|
||||||
|
|
||||||
|
proc = await asyncio.create_subprocess_shell(
|
||||||
|
ssh_cmd
|
||||||
|
)
|
||||||
|
|
||||||
|
await proc.wait()
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{JARVIS_COLOR}"
|
||||||
|
f"✅ GUI-Programm gestartet"
|
||||||
|
f"{RESET}\n"
|
||||||
|
)
|
||||||
|
|
||||||
|
return "GUI application started."
|
||||||
|
|
||||||
|
# ========================================
|
||||||
|
# NORMALE COMMANDS
|
||||||
|
# ========================================
|
||||||
|
|
||||||
|
else:
|
||||||
|
|
||||||
|
if target.lower() in ["localhost", "127.0.0.1"]:
|
||||||
|
|
||||||
|
final_cmd = cmd
|
||||||
|
|
||||||
|
else:
|
||||||
|
|
||||||
|
conn = get_db()
|
||||||
|
|
||||||
|
n = conn.execute(
|
||||||
|
'SELECT * FROM nodes WHERE ip=? OR name=?',
|
||||||
|
(target, target)
|
||||||
|
).fetchone()
|
||||||
|
|
||||||
|
conn.close()
|
||||||
|
|
||||||
|
if not n:
|
||||||
|
|
||||||
|
err = (
|
||||||
|
f"Node '{target}' "
|
||||||
|
f"nicht gefunden."
|
||||||
|
)
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{ERROR_COLOR}{err}{RESET}"
|
||||||
|
)
|
||||||
|
|
||||||
|
return err
|
||||||
|
|
||||||
|
final_cmd = (
|
||||||
|
f"ssh "
|
||||||
|
f"-o StrictHostKeyChecking=no "
|
||||||
|
f"-o LogLevel=ERROR "
|
||||||
|
f"{n['user']}@{n['ip']} "
|
||||||
|
f"'{cmd}'"
|
||||||
|
)
|
||||||
|
|
||||||
|
proc = await asyncio.create_subprocess_shell(
|
||||||
|
final_cmd,
|
||||||
|
stdout=asyncio.subprocess.PIPE,
|
||||||
|
stderr=asyncio.subprocess.STDOUT
|
||||||
|
)
|
||||||
|
|
||||||
|
collected_output = []
|
||||||
|
|
||||||
|
# ========================================
|
||||||
|
# KRISENFESTES AUSLESEN MIT TIMEOUT
|
||||||
|
# ========================================
|
||||||
|
try:
|
||||||
|
while True:
|
||||||
|
# Warte maximal 2 Sekunden auf die nächste Zeile
|
||||||
|
line = await asyncio.wait_for(proc.stdout.readline(), timeout=2.0)
|
||||||
|
|
||||||
|
if not line:
|
||||||
|
break
|
||||||
|
|
||||||
|
decoded = line.decode("utf-8", errors="ignore").rstrip()
|
||||||
|
collected_output.append(decoded)
|
||||||
|
|
||||||
|
print(f"{OUTPUT_COLOR}│ {decoded}{RESET}")
|
||||||
|
except asyncio.TimeoutError:
|
||||||
|
# Falls das Tool die Pipe offen hält, lesen wir einfach nicht weiter
|
||||||
|
print(f"{SYSTEM_COLOR}⏳ Ausgabe-Stream stagniert. Erzwinge Prozess-Check...{RESET}")
|
||||||
|
|
||||||
|
# Maximal 2 Sekunden auf das offizielle Ende des Prozesses warten
|
||||||
|
try:
|
||||||
|
await asyncio.wait_for(proc.wait(), timeout=2.0)
|
||||||
|
except asyncio.TimeoutError:
|
||||||
|
print(f"{ERROR_COLOR}⚠️ Prozess reagiert nicht. Setze Ablauf trotzdem fort.{RESET}")
|
||||||
|
# Optional: proc.terminate() falls du ihn hart killen willst
|
||||||
|
|
||||||
|
print()
|
||||||
|
|
||||||
|
except Exception as e:
|
||||||
|
|
||||||
|
err = f"❌ Fehler: {e}"
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{ERROR_COLOR}"
|
||||||
|
f"{err}"
|
||||||
|
f"{RESET}\n"
|
||||||
|
)
|
||||||
|
|
||||||
|
return err
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# FILE LOGGING
|
||||||
|
# ====================================================
|
||||||
|
def log_to_file(role, content):
|
||||||
|
now = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
|
||||||
|
try:
|
||||||
|
with open(CHAT_LOG_FILE, "a", encoding="utf-8") as f:
|
||||||
|
f.write(f"[{now}] {role.upper()}:\n{content}\n{'-'*60}\n")
|
||||||
|
except Exception as e:
|
||||||
|
print(f"{ERROR_COLOR}⚠️ Konnte nicht ins Log schreiben: {e}{RESET}")
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# USER INPUT
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
async def listen_to_user():
|
||||||
|
|
||||||
|
return await asyncio.to_thread(
|
||||||
|
input,
|
||||||
|
f"\n{USER_COLOR}👤 Du:{RESET} "
|
||||||
|
)
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# JARVIS OUTPUT
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
async def speak_to_user(text):
|
||||||
|
print(f"\n{JARVIS_COLOR}🤖 J.A.R.V.I.S.{RESET}")
|
||||||
|
print(f"{JARVIS_COLOR}{'-'*60}{RESET}")
|
||||||
|
print(text)
|
||||||
|
print(f"{JARVIS_COLOR}{'-'*60}{RESET}\n")
|
||||||
|
|
||||||
|
"""Generiert eine hochauflösende KI-Stimme via Edge-TTS und spielt sie ab."""
|
||||||
|
if not text.strip():
|
||||||
|
return
|
||||||
|
|
||||||
|
# Definition der Stimme (Killian und Conrad sind hervorragende deutsche Männerstimmen)
|
||||||
|
VOICE = "de-DE-KillianNeural"
|
||||||
|
OUTPUT_FILE = "/tmp/jarvis_response.mp3"
|
||||||
|
LOCK_FILE = "/tmp/.jarvis_speaking"
|
||||||
|
|
||||||
|
try:
|
||||||
|
# 1. Erstelle die Lock-Datei, damit das Mikrofon im Wakeword-Skript stummschaltet
|
||||||
|
with open(LOCK_FILE, "w") as f:
|
||||||
|
f.write("1")
|
||||||
|
|
||||||
|
print(f"🔊 J.A.R.V.I.S. spricht: {text}")
|
||||||
|
|
||||||
|
# 2. Audio aus der Cloud abrufen (Jetzt sauber mit direktem await!)
|
||||||
|
communicate = edge_tts.Communicate(text, VOICE)
|
||||||
|
await communicate.save(OUTPUT_FILE)
|
||||||
|
|
||||||
|
# 3. Audio ressourcenschonend & asynchron abspielen
|
||||||
|
proc = await asyncio.create_subprocess_exec(
|
||||||
|
"mpv", "--no-video", OUTPUT_FILE,
|
||||||
|
stdout=asyncio.subprocess.DEVNULL,
|
||||||
|
stderr=asyncio.subprocess.DEVNULL
|
||||||
|
)
|
||||||
|
# Warten, bis mpv fertig gesprochen hat
|
||||||
|
await proc.wait()
|
||||||
|
|
||||||
|
except Exception as e:
|
||||||
|
print(f"❌ Fehler bei der Sprachausgabe: {e}")
|
||||||
|
|
||||||
|
finally:
|
||||||
|
# 4. Lock-Datei IMMER löschen, damit J.A.R.V.I.S. wieder zuhört
|
||||||
|
if os.path.exists(LOCK_FILE):
|
||||||
|
os.remove(LOCK_FILE)
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# MAIN LOOP
|
||||||
|
# ====================================================
|
||||||
|
|
||||||
|
async def main_chat_loop():
|
||||||
|
|
||||||
|
print(f"{INFO_COLOR}")
|
||||||
|
|
||||||
|
print("====================================================")
|
||||||
|
print("🤖 J.A.R.V.I.S. Terminal Interface geladen")
|
||||||
|
print(f"🧠 Provider: {AI_PROVIDER.upper()}")
|
||||||
|
print("⌨️ Tippe 'exit', um zu beenden")
|
||||||
|
print("====================================================")
|
||||||
|
|
||||||
|
print(RESET)
|
||||||
|
|
||||||
|
chat_history = []
|
||||||
|
|
||||||
|
while True:
|
||||||
|
|
||||||
|
user_msg = await listen_to_user()
|
||||||
|
|
||||||
|
if user_msg.lower().strip() in ['exit', 'quit']:
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{SYSTEM_COLOR}"
|
||||||
|
f"\nJ.A.R.V.I.S. geht offline."
|
||||||
|
f"{RESET}"
|
||||||
|
)
|
||||||
|
|
||||||
|
break
|
||||||
|
|
||||||
|
if not user_msg.strip():
|
||||||
|
continue
|
||||||
|
|
||||||
|
now = datetime.now().strftime("%d.%m.%Y %H:%M")
|
||||||
|
|
||||||
|
chat_history.append({
|
||||||
|
"role": "user",
|
||||||
|
"content": user_msg,
|
||||||
|
"timestamp": now
|
||||||
|
})
|
||||||
|
|
||||||
|
# LOG: User Eingabe hier schreiben!
|
||||||
|
log_to_file("Du", user_msg)
|
||||||
|
|
||||||
|
print(
|
||||||
|
f"{SYSTEM_COLOR}"
|
||||||
|
f"🧠 J.A.R.V.I.S. denkt nach..."
|
||||||
|
f"{RESET}",
|
||||||
|
end="\r"
|
||||||
|
)
|
||||||
|
|
||||||
|
system_prompt = get_system_prompt()
|
||||||
|
|
||||||
|
ai_response = await get_ai_response(
|
||||||
|
user_msg,
|
||||||
|
system_prompt,
|
||||||
|
chat_history
|
||||||
|
)
|
||||||
|
|
||||||
|
# ============================================
|
||||||
|
# EXECUTE TAGS SUCHEN
|
||||||
|
# Unterstützt:
|
||||||
|
# <EXECUTE>cmd</EXECUTE>
|
||||||
|
# <EXECUTE target="xyz">cmd</EXECUTE>
|
||||||
|
# ============================================
|
||||||
|
|
||||||
|
commands = []
|
||||||
|
|
||||||
|
# Toleranter Regex: Erlaubt Leerzeichen vor dem '>'
|
||||||
|
execute_matches = re.finditer(
|
||||||
|
r'<EXECUTE[^>]*?(?:target="(.*?)")?[^>]*>(.*?)</EXECUTE>',
|
||||||
|
ai_response,
|
||||||
|
re.I | re.S
|
||||||
|
)
|
||||||
|
|
||||||
|
for match in execute_matches:
|
||||||
|
target = match.group(1)
|
||||||
|
cmd = match.group(2)
|
||||||
|
|
||||||
|
if not target:
|
||||||
|
target = "localhost"
|
||||||
|
|
||||||
|
# Markdown-Backticks bereinigen, falls die KI sie in den Tag mogelt
|
||||||
|
cmd = cmd.strip()
|
||||||
|
cmd = re.sub(r'^```[a-zA-Z]*\n?', '', cmd)
|
||||||
|
cmd = re.sub(r'\n?```$', '', cmd)
|
||||||
|
cmd = cmd.strip()
|
||||||
|
|
||||||
|
commands.append((target.strip(), cmd))
|
||||||
|
|
||||||
|
# Die Tags für die Sprach-/Textausgabe sauber entfernen
|
||||||
|
clean_msg = re.sub(
|
||||||
|
r'<EXECUTE[^>]*?>.*?</EXECUTE>',
|
||||||
|
'',
|
||||||
|
ai_response,
|
||||||
|
flags=re.I | re.S
|
||||||
|
).strip()
|
||||||
|
|
||||||
|
# ============================================
|
||||||
|
# JARVIS TEXT
|
||||||
|
# ============================================
|
||||||
|
|
||||||
|
if clean_msg:
|
||||||
|
|
||||||
|
await speak_to_user(clean_msg)
|
||||||
|
|
||||||
|
chat_history.append({
|
||||||
|
"role": "assistant",
|
||||||
|
"content": clean_msg,
|
||||||
|
"timestamp": now
|
||||||
|
})
|
||||||
|
|
||||||
|
# LOG: Jarvis Antwort hier schreiben!
|
||||||
|
log_to_file("J.A.R.V.I.S.", clean_msg)
|
||||||
|
|
||||||
|
# ============================================
|
||||||
|
# COMMANDS AUSFÜHREN
|
||||||
|
# ============================================
|
||||||
|
|
||||||
|
if commands:
|
||||||
|
|
||||||
|
for target, cmd in commands:
|
||||||
|
|
||||||
|
target = target.strip()
|
||||||
|
cmd = cmd.strip()
|
||||||
|
|
||||||
|
action_msg = (
|
||||||
|
f"⚙️ Ich führe jetzt folgenden Befehl "
|
||||||
|
f"auf [{target}] aus:\n\n"
|
||||||
|
f"{cmd}"
|
||||||
|
)
|
||||||
|
|
||||||
|
# ÄNDERUNG: Auch hier nur im Terminal anzeigen, NICHT vorlesen!
|
||||||
|
print(f"\n{SYSTEM_COLOR}{action_msg}{RESET}\n")
|
||||||
|
log_to_file("SYSTEM", action_msg)
|
||||||
|
|
||||||
|
# ========================================
|
||||||
|
# COMMAND AUSFÜHREN
|
||||||
|
# ========================================
|
||||||
|
|
||||||
|
output = await run_task(
|
||||||
|
target,
|
||||||
|
cmd
|
||||||
|
)
|
||||||
|
|
||||||
|
# ========================================
|
||||||
|
# OUTPUT IM CHAT SICHTBAR MACHEN
|
||||||
|
# ========================================
|
||||||
|
|
||||||
|
if output:
|
||||||
|
output_msg = (
|
||||||
|
f"💻 Ergebnis der Ausführung "
|
||||||
|
f"auf [{target}]:\n\n"
|
||||||
|
f"{output}"
|
||||||
|
)
|
||||||
|
else:
|
||||||
|
output_msg = (
|
||||||
|
f"✅ Befehl auf [{target}] "
|
||||||
|
f"erfolgreich abgeschlossen."
|
||||||
|
)
|
||||||
|
|
||||||
|
# Das hier wird weiterhin laut vorgelesen!
|
||||||
|
await speak_to_user(output_msg)
|
||||||
|
|
||||||
|
sys_now = datetime.now().strftime("%d.%m.%Y %H:%M")
|
||||||
|
chat_history.append({
|
||||||
|
"role": "assistant",
|
||||||
|
"content": output_msg,
|
||||||
|
"timestamp": sys_now
|
||||||
|
})
|
||||||
|
log_to_file("SYSTEM", output_msg)
|
||||||
|
|
||||||
|
# ============================================
|
||||||
|
# HISTORY LIMIT
|
||||||
|
# ============================================
|
||||||
|
|
||||||
|
if len(chat_history) > 20:
|
||||||
|
chat_history = chat_history[-20:]
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# EINZEL-BEFEHL MODUS (Für das Sprachskript)
|
||||||
|
# ====================================================
|
||||||
|
async def run_single_command(command_text):
|
||||||
|
"""Verarbeitet einen einzelnen Befehl von außen und beendet sich wieder."""
|
||||||
|
init_db()
|
||||||
|
system_prompt = get_system_prompt()
|
||||||
|
|
||||||
|
# Wir tun so, als käme die Eingabe aus dem Chat-History-Verlauf
|
||||||
|
now = datetime.now().strftime("%d.%m.%Y %H:%M")
|
||||||
|
chat_history = [{
|
||||||
|
"role": "user",
|
||||||
|
"content": command_text,
|
||||||
|
"timestamp": now
|
||||||
|
}]
|
||||||
|
|
||||||
|
log_to_file("Voice-Input", command_text)
|
||||||
|
|
||||||
|
ai_response = await get_ai_response(
|
||||||
|
command_text,
|
||||||
|
system_prompt,
|
||||||
|
chat_history
|
||||||
|
)
|
||||||
|
|
||||||
|
if ai_response is None:
|
||||||
|
return
|
||||||
|
|
||||||
|
# EXECUTE-Tags suchen und ausführen
|
||||||
|
commands = []
|
||||||
|
execute_matches = re.finditer(
|
||||||
|
r'<EXECUTE[^>]*?(?:target="(.*?)")?[^>]*>(.*?)</EXECUTE>',
|
||||||
|
ai_response,
|
||||||
|
re.I | re.S
|
||||||
|
)
|
||||||
|
|
||||||
|
for match in execute_matches:
|
||||||
|
target = match.group(1) or "localhost"
|
||||||
|
cmd = match.group(2).strip()
|
||||||
|
cmd = re.sub(r'^```[a-zA-Z]*\n?', '', cmd)
|
||||||
|
cmd = re.sub(r'\n?```$', '', cmd)
|
||||||
|
commands.append((target.strip(), cmd.strip()))
|
||||||
|
|
||||||
|
clean_msg = re.sub(r'<EXECUTE[^>]*?>.*?</EXECUTE>', '', ai_response, flags=re.I | re.S).strip()
|
||||||
|
|
||||||
|
if clean_msg:
|
||||||
|
await speak_to_user(clean_msg)
|
||||||
|
log_to_file("J.A.R.V.I.S.", clean_msg)
|
||||||
|
|
||||||
|
if commands:
|
||||||
|
for target, cmd in commands:
|
||||||
|
action_msg = f"⚙️ Führe Sprachbefehl auf [{target}] aus:\n{cmd}"
|
||||||
|
|
||||||
|
# ÄNDERUNG: Nur im Terminal anzeigen, NICHT vorlesen!
|
||||||
|
print(f"\n{SYSTEM_COLOR}{action_msg}{RESET}\n")
|
||||||
|
log_to_file("SYSTEM", action_msg)
|
||||||
|
|
||||||
|
# Befehl im Hintergrund ausführen
|
||||||
|
await run_task(target, cmd)
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# START
|
||||||
|
# ====================================================
|
||||||
|
if __name__ == "__main__":
|
||||||
|
try:
|
||||||
|
# Wenn Argumente übergeben wurden (z.B. python3 jarvis.py --voice-cmd "...")
|
||||||
|
if len(sys.argv) > 2 and sys.argv[1] == "--voice-cmd":
|
||||||
|
command_text = sys.argv[2]
|
||||||
|
asyncio.run(run_single_command(command_text))
|
||||||
|
else:
|
||||||
|
# Normaler Terminal-Modus
|
||||||
|
asyncio.run(main_chat_loop())
|
||||||
|
except KeyboardInterrupt:
|
||||||
|
print(f"\n{ERROR_COLOR}⛔ J.A.R.V.I.S. hart beendet.{RESET}")
|
||||||
7
requirements.txt
Normal file
7
requirements.txt
Normal file
@@ -0,0 +1,7 @@
|
|||||||
|
openai
|
||||||
|
google-genai
|
||||||
|
python-dotenv
|
||||||
|
vosk
|
||||||
|
sounddevice
|
||||||
|
numpy
|
||||||
|
colorama
|
||||||
212
setup_x11_jarvis.sh
Executable file
212
setup_x11_jarvis.sh
Executable file
@@ -0,0 +1,212 @@
|
|||||||
|
#!/bin/bash
|
||||||
|
|
||||||
|
# Abbrechen bei Fehlern
|
||||||
|
set -e
|
||||||
|
|
||||||
|
echo "===================================================="
|
||||||
|
echo "🚀 Starte J.A.R.V.I.S. Desktop OS - X11 Openbox Setup"
|
||||||
|
echo "===================================================="
|
||||||
|
|
||||||
|
# Benutzererkennung
|
||||||
|
REAL_USER="${SUDO_USER:-$(logname 2>/dev/null || whoami)}"
|
||||||
|
REAL_HOME=$(getent passwd "$REAL_USER" | cut -d: -f6)
|
||||||
|
|
||||||
|
if [ -z "$REAL_USER" ] || [ "$REAL_USER" = "root" ]; then
|
||||||
|
REAL_USER=$(id -nu 1000 2>/dev/null || echo "meik")
|
||||||
|
REAL_HOME=$(getent passwd "$REAL_USER" | cut -d: -f6)
|
||||||
|
fi
|
||||||
|
|
||||||
|
JARVIS_DIR="$REAL_HOME/jarvis-ai"
|
||||||
|
|
||||||
|
# 1. System aktualisieren & X11 / Openbox Pakete installieren
|
||||||
|
echo "📦 Installiere X11-Server, Openbox und Automatisierungstools..."
|
||||||
|
sudo apt update
|
||||||
|
sudo apt install -y \
|
||||||
|
xserver-xorg \
|
||||||
|
xinit \
|
||||||
|
x11-xserver-utils \
|
||||||
|
openbox \
|
||||||
|
tint2 \
|
||||||
|
rofi \
|
||||||
|
xdotool \
|
||||||
|
wmctrl \
|
||||||
|
firefox-esr \
|
||||||
|
curl \
|
||||||
|
wget \
|
||||||
|
git \
|
||||||
|
sudo \
|
||||||
|
python3 \
|
||||||
|
python3-pip \
|
||||||
|
python3-venv \
|
||||||
|
tilix \
|
||||||
|
geany \
|
||||||
|
fonts-noto-color-emoji \
|
||||||
|
pipewire \
|
||||||
|
pipewire-audio-client-libraries \
|
||||||
|
pipewire-pulse \
|
||||||
|
wireplumber \
|
||||||
|
alsa-utils \
|
||||||
|
libasound2-dev \
|
||||||
|
libportaudio2 \
|
||||||
|
unzip
|
||||||
|
|
||||||
|
# 1.1 Gruppenrechte für Audio und Grafik setzen
|
||||||
|
echo "👥 Setze Gruppenrechte für '$REAL_USER'..."
|
||||||
|
sudo usermod -aG video,render,input,audio "$REAL_USER"
|
||||||
|
|
||||||
|
# 2. Openbox Konfigurationsverzeichnis erstellen
|
||||||
|
echo "⚙️ Konfiguriere Openbox für '$REAL_USER'..."
|
||||||
|
mkdir -p "$REAL_HOME/.config/openbox"
|
||||||
|
|
||||||
|
# 3. Autostart-Datei für Openbox erstellen
|
||||||
|
cat << EOF > "$REAL_HOME/.config/openbox/autostart"
|
||||||
|
# Tint2 Taskleiste im Hintergrund starten
|
||||||
|
tint2 &
|
||||||
|
# Deutsches Tastaturlayout
|
||||||
|
setxkbmap de &
|
||||||
|
# PipeWire Audio-Server starten
|
||||||
|
gentle_pipewire_start() {
|
||||||
|
systemctl --user start pipewire pipewire-pulse wireplumber
|
||||||
|
}
|
||||||
|
gentle_pipewire_start &
|
||||||
|
|
||||||
|
# Falls ein Hintergrundbild gewünscht ist (optional, benötigt 'feh'):
|
||||||
|
# feh --bg-scale /pfad/zum/bild.jpg &
|
||||||
|
|
||||||
|
# J.A.R.V.I.S.-AI starten
|
||||||
|
tilix -e "$JARVIS_DIR/start.sh" &
|
||||||
|
EOF
|
||||||
|
|
||||||
|
chmod +x "$REAL_HOME/.config/openbox/autostart"
|
||||||
|
|
||||||
|
# 4. .xinitrc erstellen (ermöglicht den Start via 'startx' aus der Konsole)
|
||||||
|
cat << EOF > "$REAL_HOME/.xinitrc"
|
||||||
|
#!/bin/sh
|
||||||
|
# X11 Umgebungsvariablen setzen falls nötig
|
||||||
|
export QT_QPA_PLATFORM=xcb
|
||||||
|
export GDK_BACKEND=x11
|
||||||
|
|
||||||
|
# Openbox Session starten
|
||||||
|
exec openbox-session
|
||||||
|
EOF
|
||||||
|
|
||||||
|
chmod +x "$REAL_HOME/.xinitrc"
|
||||||
|
|
||||||
|
# Eigentumsrechte korrigieren
|
||||||
|
chown -R "$REAL_USER:$REAL_USER" "$REAL_HOME/.config" "$REAL_HOME/.xinitrc"
|
||||||
|
|
||||||
|
# J.A.R.V.I.S. .env Template (Leerzeichen bei [ ] und EOF korrigiert)
|
||||||
|
if [ ! -f "$JARVIS_DIR/config/.env" ]; then
|
||||||
|
echo "📝 Erstelle .env Konfigurationsdatei..."
|
||||||
|
# Stelle sicher, dass der config-Ordner existiert
|
||||||
|
mkdir -p "$JARVIS_DIR/config"
|
||||||
|
|
||||||
|
cat << EOF > "$JARVIS_DIR/config/.env"
|
||||||
|
WEB_USER_NAME=$REAL_USER
|
||||||
|
AI_PROVIDER=nvdia
|
||||||
|
OPENAI_API_KEY=dein-openai-key
|
||||||
|
OPENAI_MODEL=
|
||||||
|
GOOGLE_API_KEY=dein-google-key
|
||||||
|
NVIDIA_API_KEY=dein-nvidia-key
|
||||||
|
NVIDIA_MODEL=moonshotai/kimi-k2.6
|
||||||
|
GOOGLE_MODEL=gemini-2.5-flash
|
||||||
|
OLLAMA_BASE_URL=http://127.0.0.1:11434/v1
|
||||||
|
OLLAMA_MODEL=llama3
|
||||||
|
GROQ_API_KEY=dein-groq-key
|
||||||
|
GROQ_MODEL=groq/compound
|
||||||
|
EOF
|
||||||
|
fi
|
||||||
|
|
||||||
|
# J.A.R.V.I.S. Optimierter System-Prompt inkl. wdotool-Handbuch
|
||||||
|
cat << 'EOF' > "$JARVIS_DIR/config/system_prompt.txt"
|
||||||
|
Du bist J.A.R.V.I.S., ein KI-Systemassistent, der direkt auf einem Debian X11-Desktop (Openbox) läuft. Du hast vollen lokalen Zugriff auf das System.
|
||||||
|
UMGEBUNG & GEDÄCHTNIS:
|
||||||
|
Arbeitsverzeichnis: {workspace_dir}
|
||||||
|
Notizen: {notes_file}
|
||||||
|
Todos: {todo_file}
|
||||||
|
DESKTOP STEUERUNG & FENSTER-MANAGEMENT:
|
||||||
|
Du steuerst die grafische Oberfläche (X11/Openbox) über native Befehlszeilen-Tools wie wmctrl und xdotool.
|
||||||
|
Programme & Fenster verwalten
|
||||||
|
Du steuerst Fenster direkt über Konsolenbefehle.
|
||||||
|
Folgende Aktionen sind erlaubt:
|
||||||
|
start (Startet ein Programm in den Hintergrund): firefox &
|
||||||
|
activate (Holt ein Fenster in den Vordergrund): wmctrl -a "Firefox" (Sucht nach dem Namen im Titel)
|
||||||
|
close (Schließt das Fenster sanft): wmctrl -c "Firefox"
|
||||||
|
maximize (Maximiert das Fenster): wmctrl -r "Firefox" -b add,maximized_vert,maximized_horz
|
||||||
|
positionieren/snappen: Nutze wmctrl mit dem Schalter -e (Format: gravity,X,Y,Width,Height).
|
||||||
|
Beispiele:
|
||||||
|
wmctrl -r "Firefox" -b add,maximized_vert,maximized_horz (Maximiert Firefox)
|
||||||
|
wmctrl -a "Terminal" (Holt das Terminal in den Vordergrund)
|
||||||
|
Regel für Multitasking-Fenster: Wenn der User mehrere Instanzen derselben App starten möchte, starte sie im Hintergrund, warte kurz, hole das aktive Fenster mit xdotool und passe es an.
|
||||||
|
Beispiel-Verkettung für das System:
|
||||||
|
firefox & sleep 2 && wmctrl -r "Mozilla Firefox" -e 0,0,0,960,1080 && firefox & sleep 2 && xdotool getactivewindow windowmove 960 0 windowsize 960 1080
|
||||||
|
Tastatur & Maus (Tool: xdotool)
|
||||||
|
Tastatur: xdotool key ctrl+l, xdotool key alt+Tab, xdotool type "Hallo"
|
||||||
|
Maus: xdotool mousemove 500 400 (absolut), xdotool click 1 (1=links, 3=rechts)
|
||||||
|
WICHTIG: Wenn du Tasten an ein Programm senden willst, sorge IMMER dafür, dass es vorher den Fokus hat (z.B. wmctrl -a "Firefox" && xdotool key F5).
|
||||||
|
System- & Display-Infos
|
||||||
|
Bildschirmauflösung ermitteln: xrandr | grep '*' | awk '{print $1}'
|
||||||
|
{installed_apps}
|
||||||
|
WICHTIGE REGELN FÜR DIE AUSFÜHRUNG VON BEFEHLEN:
|
||||||
|
Das Backend-System wertet deine Befehle NUR aus, wenn sie exakt in XML-Tags eingeschlossen sind. Du darfst Systembefehle unter keinen Umständen als einfachen Text oder in Markdown-Codeblöcken (```) ausgeben!
|
||||||
|
|
||||||
|
RICHTIG: <EXECUTE>firefox &</EXECUTE>
|
||||||
|
FALSCH: ```bash firefox & ```
|
||||||
|
|
||||||
|
SPEZIALREGEL FÜR WEBSEITEN & BROWSER:
|
||||||
|
Navigiere NIEMALS mittels xdotool (ctrl+l) zu einer Webseite! Das ist zu fehleranfällig. Übergib die URL stattdessen IMMER direkt als Argument an den firefox-Befehl. Das öffnet die Seite direkt (oder in einem neuen Tab, falls Firefox bereits läuft).
|
||||||
|
RICHTIG: <EXECUTE>firefox "google.de" &</EXECUTE>
|
||||||
|
FALSCH: <EXECUTE>firefox & sleep 2 && xdotool key ctrl+l ...</EXECUTE>
|
||||||
|
|
||||||
|
RICHTIGE VERKETTUNG (für andere Anwendungen):
|
||||||
|
Wenn du mehrere Befehle verknüpfen musst (z.B. App starten und danach pflegen), nutze && innerhalb eines EINZIGEN <EXECUTE>-Blocks.
|
||||||
|
Beispiel:
|
||||||
|
<EXECUTE>tilix & sleep 1 && wmctrl -a "Tilix"</EXECUTE>
|
||||||
|
|
||||||
|
WICHTIGE REGELN FÜR TEXTE IN EDITOREN:
|
||||||
|
Wenn du Texte für den Nutzer in einem Editor wie Geany erstellen sollst, nutze immer temporäre Dateien.
|
||||||
|
RICHTIG:
|
||||||
|
<EXECUTE>cat << 'EOF' > /tmp/notiz.txt
|
||||||
|
Dein generierter Text...
|
||||||
|
'EOF'
|
||||||
|
geany /tmp/notiz.txt &</EXECUTE>
|
||||||
|
Antworte immer mit einem kurzen, lockeren Bestätigungssatz, was du tust, gefolgt von dem <EXECUTE>-Block.
|
||||||
|
Du duzt {user_name} konsequent, dein Tonfall ist locker und technisch versiert.
|
||||||
|
EOF
|
||||||
|
|
||||||
|
|
||||||
|
# 5. Virtuelle Python-Umgebung einrichten (falls noch nicht geschehen)
|
||||||
|
|
||||||
|
echo "🐍 Richte virtuelles Python-Environment ein..."
|
||||||
|
mkdir -p "$JARVIS_DIR"
|
||||||
|
python3 -m venv "$JARVIS_DIR/venv"
|
||||||
|
"$JARVIS_DIR/venv/bin/pip" install --upgrade pip
|
||||||
|
"$JARVIS_DIR/venv/bin/pip" install -r requirements.txt
|
||||||
|
|
||||||
|
####################################
|
||||||
|
# Voice setup
|
||||||
|
####################################
|
||||||
|
|
||||||
|
# Modell herunterladen
|
||||||
|
wget https://alphacephei.com/vosk/models/vosk-model-small-de-0.15.zip
|
||||||
|
# Entpacken
|
||||||
|
unzip vosk-model-small-de-0.15.zip
|
||||||
|
# Ordner umbenennen, damit das Skript ihn leicht findet
|
||||||
|
mv vosk-model-small-de-0.15 model
|
||||||
|
rm vosk-model-small-de-0.15.zip
|
||||||
|
|
||||||
|
# Piper installieren
|
||||||
|
wget https://github.com/rhasspy/piper/releases/download/v1.2.0/piper_amd64.tar.gz
|
||||||
|
tar -xf piper_amd64.tar.gz
|
||||||
|
rm piper_amd64.tar.gz
|
||||||
|
|
||||||
|
# Das eigentliche Sprachmodell (.onnx)
|
||||||
|
wget https://huggingface.co/rhasspy/piper-voices/resolve/main/de/de_DE/thorsten/high/de_DE-thorsten-high.onnx
|
||||||
|
|
||||||
|
# Die dazugehörige Konfigurationsdatei (.json)
|
||||||
|
wget https://huggingface.co/rhasspy/piper-voices/resolve/main/de/de_DE/thorsten/high/de_DE-thorsten-high.onnx.json
|
||||||
|
|
||||||
|
echo "===================================================="
|
||||||
|
echo "✅ X11 Openbox-Umgebung erfolgreich eingerichtet!"
|
||||||
|
echo "👉 Starte die grafische Oberfläche einfach mit dem Befehl: startx"
|
||||||
|
echo "===================================================="
|
||||||
12
start.sh
Executable file
12
start.sh
Executable file
@@ -0,0 +1,12 @@
|
|||||||
|
#!/bin/bash
|
||||||
|
cd "$(dirname "$0")"
|
||||||
|
source venv/bin/activate
|
||||||
|
|
||||||
|
# WICHTIG: Fängt Strg+C ab und beendet alle verknüpften Hintergrundprozesse sauber
|
||||||
|
trap 'echo -e "\n🛑 Beende alle J.A.R.V.I.S. Systeme..."; kill 0' EXIT
|
||||||
|
|
||||||
|
echo "🎙️ Starte Wake-Word-Engine im Hintergrund..."
|
||||||
|
python3 wakeword.py &
|
||||||
|
|
||||||
|
echo "💬 Starte Chat-Interface..."
|
||||||
|
python3 jarvis.py
|
||||||
137
wakeword.py
Normal file
137
wakeword.py
Normal file
@@ -0,0 +1,137 @@
|
|||||||
|
#!/usr/bin/env python3
|
||||||
|
import os
|
||||||
|
import sys
|
||||||
|
import json
|
||||||
|
import queue
|
||||||
|
import time
|
||||||
|
import subprocess
|
||||||
|
import wave
|
||||||
|
import sounddevice as sd
|
||||||
|
import numpy as np
|
||||||
|
from vosk import Model, KaldiRecognizer
|
||||||
|
from pathlib import Path
|
||||||
|
from dotenv import load_dotenv
|
||||||
|
from openai import OpenAI
|
||||||
|
|
||||||
|
# ====================================================
|
||||||
|
# PFADE & ENV SETUP (Aus config/.env lesen)
|
||||||
|
# ====================================================
|
||||||
|
BASE_DIR = Path(__file__).resolve().parent
|
||||||
|
CONFIG_DIR = BASE_DIR / "config"
|
||||||
|
ENV_FILE = CONFIG_DIR / ".env"
|
||||||
|
load_dotenv(ENV_FILE)
|
||||||
|
|
||||||
|
MODEL_PATH = "model"
|
||||||
|
AUDIO_RATE = 48000
|
||||||
|
LOCK_FILE = Path("/tmp/.jarvis_speaking")
|
||||||
|
|
||||||
|
if not os.path.exists(MODEL_PATH):
|
||||||
|
print(f"❌ Modell-Ordner '{MODEL_PATH}' wurde nicht gefunden!")
|
||||||
|
sys.exit(1)
|
||||||
|
|
||||||
|
# OpenAI Client initialisieren
|
||||||
|
if not os.getenv("OPENAI_API_KEY"):
|
||||||
|
print("⚠️ Warnung: Kein OPENAI_API_KEY in der .env gefunden!")
|
||||||
|
openai_client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))
|
||||||
|
|
||||||
|
audio_queue = queue.Queue()
|
||||||
|
|
||||||
|
def audio_callback(indata, frames, time, status):
|
||||||
|
if status:
|
||||||
|
print(status, file=sys.stderr)
|
||||||
|
audio_queue.put(bytes(indata))
|
||||||
|
|
||||||
|
print("🧠 J.A.R.V.I.S. lädt das Sprachmodell für das Wake-Word...")
|
||||||
|
model = Model(MODEL_PATH)
|
||||||
|
|
||||||
|
# Nur noch EIN Recognizer: Ausschließlich für das Wake-Word ("jarvis")
|
||||||
|
wake_recognizer = KaldiRecognizer(model, AUDIO_RATE, '["jarvis", "[unk]"]')
|
||||||
|
|
||||||
|
print("🎙️ J.A.R.V.I.S. läuft im Hybrid-Modus (Vosk + Whisper) und lauscht... (Sag 'Jarvis')")
|
||||||
|
|
||||||
|
with sd.RawInputStream(samplerate=AUDIO_RATE, blocksize=8000, dtype='int16',
|
||||||
|
channels=1, callback=audio_callback):
|
||||||
|
|
||||||
|
while True:
|
||||||
|
data = audio_queue.get()
|
||||||
|
|
||||||
|
# Wenn J.A.R.V.I.S. gerade spricht, leere die Queue und ignoriere das Audio
|
||||||
|
if LOCK_FILE.exists():
|
||||||
|
while not audio_queue.empty():
|
||||||
|
audio_queue.get()
|
||||||
|
wake_recognizer.Reset() # Verhindert alte Bruchstücke
|
||||||
|
continue
|
||||||
|
|
||||||
|
# Phase 1: Auf Wake-Word warten (Lokal via Vosk)
|
||||||
|
if wake_recognizer.AcceptWaveform(data):
|
||||||
|
result = json.loads(wake_recognizer.Result())
|
||||||
|
if "jarvis" in result.get("text", ""):
|
||||||
|
print("\n⚡ [WAKEWORD DETECTED] Ja, Sir?")
|
||||||
|
|
||||||
|
# Bestätigungston abspielen (800 Hz, 0.1 Sekunden)
|
||||||
|
duration = 0.1
|
||||||
|
frequency = 800.0
|
||||||
|
t = np.linspace(0, duration, int(AUDIO_RATE * duration), endpoint=False)
|
||||||
|
beep = np.sin(2 * np.pi * frequency * t) * 0.3
|
||||||
|
sd.play(beep, samplerate=AUDIO_RATE)
|
||||||
|
sd.wait()
|
||||||
|
|
||||||
|
# Warteschlange leeren, um den Beep nicht selbst aufzunehmen
|
||||||
|
while not audio_queue.empty():
|
||||||
|
audio_queue.get()
|
||||||
|
|
||||||
|
print("👂 Höre zu (Befehlsaufnahme)...")
|
||||||
|
collected_chunks = []
|
||||||
|
start_time = time.time()
|
||||||
|
|
||||||
|
# Phase 2: Für 4 Sekunden die Rohdaten aus dem Stream sammeln
|
||||||
|
while time.time() - start_time < 4.0:
|
||||||
|
try:
|
||||||
|
# Kurzer Timeout, damit die Schleife agil bleibt
|
||||||
|
cmd_data = audio_queue.get(timeout=0.2)
|
||||||
|
collected_chunks.append(cmd_data)
|
||||||
|
except queue.Empty:
|
||||||
|
continue
|
||||||
|
|
||||||
|
print("🧠 Sende Audio an OpenAI Whisper API...")
|
||||||
|
|
||||||
|
# Rohe Audio-Bytes zusammenfügen und als WAV speichern
|
||||||
|
wav_path = "/tmp/jarvis_cmd.wav"
|
||||||
|
all_bytes = b"".join(collected_chunks)
|
||||||
|
|
||||||
|
try:
|
||||||
|
with wave.open(wav_path, "wb") as wf:
|
||||||
|
wf.setnchannels(1)
|
||||||
|
wf.setsampwidth(2) # int16 entspricht 2 Bytes
|
||||||
|
wf.setframerate(AUDIO_RATE)
|
||||||
|
wf.writeframes(all_bytes)
|
||||||
|
|
||||||
|
# Whisper API aufrufen
|
||||||
|
with open(wav_path, "rb") as audio_file:
|
||||||
|
transcription = openai_client.audio.transcriptions.create(
|
||||||
|
model="whisper-1",
|
||||||
|
file=audio_file,
|
||||||
|
language="de" # Erzwingt deutsche Texterkennung
|
||||||
|
)
|
||||||
|
command_text = transcription.text.strip()
|
||||||
|
|
||||||
|
except Exception as e:
|
||||||
|
print(f"❌ Fehler bei der Spracherkennung: {e}")
|
||||||
|
command_text = ""
|
||||||
|
|
||||||
|
# Phase 3: Befehl verarbeiten, falls Whisper etwas verstanden hat
|
||||||
|
if command_text:
|
||||||
|
print(f"🗣️ Erkannt (Whisper): '{command_text}'")
|
||||||
|
print("🧠 Übermittle an J.A.R.V.I.S. Gehirn...")
|
||||||
|
|
||||||
|
subprocess.run([
|
||||||
|
"venv/bin/python3",
|
||||||
|
"jarvis.py",
|
||||||
|
"--voice-cmd",
|
||||||
|
command_text
|
||||||
|
])
|
||||||
|
else:
|
||||||
|
print("🔇 Kein Befehl verstanden.")
|
||||||
|
|
||||||
|
print("\n🎙️ Zurück im Standby. Lausche auf 'Jarvis'...")
|
||||||
|
wake_recognizer.Reset()
|
||||||
Reference in New Issue
Block a user