absent-sapphire
absent-sapphire4mo ago

Einfaches Monitoring übers Netz

Moin! Mein Home Lab Server ist nun schon zum zweiten Mal innerhalb einer Woche plötzlich tot. Einfach nicht mehr übers Netz erreichbar. Auf dem Teil läuft Proxmox auf dem wiederum HomeAssistant läuft. Ich habe leider keine Möglichkeit Nachm reboot herauszufinden warum das Teil gestorben ist. Meine Frage: kennt ihr irgend nen lightweight monitoring tool das alle gängige telemetrie überwacht? Sowas wie checkmk ist leider etwas Overkill. Bin für tips dankbar
11 Replies
conscious-sapphire
conscious-sapphire4mo ago
prometheus + grafana eventuell noch alertmanager dazu
conscious-sapphire
conscious-sapphire4mo ago
Tech Tutorials - David McKone
YouTube
Monitoring Proxmox VE With Prometheus And Grafana
Monitoring computers is very important and even more so for hypervisors like Proxmox VE Because if something goes wrong it will likely affect all of the virtual computers that are being run on that physical computer Now an interesting open source combination of monitoring tools that's available for free is Prometheus and Grafana So in this vi...
absent-sapphire
absent-sapphireOP4mo ago
danke, grafana läuft schon, leider innerhalb von home assistant 😄 schau ich mir aber mal an. nice wäre ne all in one lösung. wobei ich gerade sehe dass checkmk in der basisversion kostenlos ist und es n docker gibt das sind übrigens die syslog einträge, nicht wirklich hilfreich
Aug 15 21:45:02 dell smartd[578]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 52
Aug 15 21:45:02 dell kernel: eth0: entered promiscuous mode
Aug 15 21:45:13 dell kernel: eth0: left promiscuous mode
Aug 15 21:50:01 dell kernel: eth0: entered promiscuous mode
Aug 15 21:50:12 dell kernel: eth0: left promiscuous mode
Aug 15 21:55:01 dell kernel: eth0: entered promiscuous mode
Aug 15 21:55:12 dell kernel: eth0: left promiscuous mode
Aug 15 22:00:02 dell kernel: eth0: entered promiscuous mode
Aug 15 22:00:13 dell kernel: eth0: left promiscuous mode
Aug 15 22:05:02 dell kernel: eth0: entered promiscuous mode
Aug 15 22:05:13 dell kernel: eth0: left promiscuous mode
-- Reboot --
Aug 15 21:45:02 dell smartd[578]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 52
Aug 15 21:45:02 dell kernel: eth0: entered promiscuous mode
Aug 15 21:45:13 dell kernel: eth0: left promiscuous mode
Aug 15 21:50:01 dell kernel: eth0: entered promiscuous mode
Aug 15 21:50:12 dell kernel: eth0: left promiscuous mode
Aug 15 21:55:01 dell kernel: eth0: entered promiscuous mode
Aug 15 21:55:12 dell kernel: eth0: left promiscuous mode
Aug 15 22:00:02 dell kernel: eth0: entered promiscuous mode
Aug 15 22:00:13 dell kernel: eth0: left promiscuous mode
Aug 15 22:05:02 dell kernel: eth0: entered promiscuous mode
Aug 15 22:05:13 dell kernel: eth0: left promiscuous mode
-- Reboot --
conscious-sapphire
conscious-sapphire4mo ago
wir haben so ein problem mit vms in azure, keine chance den grund zu finden. ms support ist auch null hilfreich
absent-sapphire
absent-sapphireOP4mo ago
ok checkmk läuft schoin, einfacher als gedacht. mal gucken wie ich den agent auf die kiste bringe
conscious-sapphire
conscious-sapphire4mo ago
haste mal memtest gemacht?
absent-sapphire
absent-sapphireOP4mo ago
Nein noch nicht
conscious-sapphire
conscious-sapphire4mo ago
was hast du für ein homelab setup?
absent-sapphire
absent-sapphireOP4mo ago
Dell Optiplex irgendwas mit nem i5-3xxx Son NUC quasi
correct-apricot
correct-apricot4mo ago
Moin, kannst dir auch mal anschauen 😉 https://www.observium.org/
absent-sapphire
absent-sapphireOP4mo ago
hab inzwischen checkmk in nem container aufm nas laufen, passt. aber das braucht überraschend viel cpu 😄 aber für die paar hosts ausreichend.