Jak pracovat s modulem události & alerting

Obsah:

Jak pracovat s modulem události & alerting

Pokud je v textu chyba či schází nějaká informace, informujte support@cibs.cz, jako předmět uveďte název článku.

Seznam níže uvedených akcí lze nalézt v modulu .

Pojmy

Název	Definice
*Událost*	informace ze zdroje o změně stavu objektu (zařízení) nebo změně nějakého parametru objektu
*Rozpoznaná událost*	událost, která je na základě filtrů a triggerů identifikovaná z množiny surových událostí
*Zdroj události*	zdroj, pomocí kterého byla událost mezi surové události vložena
*Surové události*	halda, do které jsou zachytávány události ze zdrojů
*Filtr*	množina kritérií, pomocí kterých vznikají ze surových událostí identifikované události
*Kritérium*	definice testu, který je aplikován na surovou událost
*Trigger*	nastavení, na základě kterého vznikne na základě identifikované události alert
*Alert*	zpráva nebo upozornění, které je vygenerované na základě předem definovaných filtrů a triggerů z množiny surových událostí

Jaké máme zdroje událostí?

Zdrojem události může být:

SNMP TRAP - Události z tohoto zdroje jsou mezi "Surové události" vkládány na základě SNMP trapů ze zařízení, přijatých DX serverem.
SYSLOG - Události z tohoto zdroje jsou mezi "Surové události" vkládány na základě hlášení, zaslaných zařízeními na syslog server běžící na DX serveru.
Monitoring - dostupnost zařízení - Události s tímto zdrojem jsou v záložce "Surové události" uvedeny v případě, že u zařízení došlo k výpadku nebo obnově činnosti.
Definováno uživatelem - Události z tohoto zdroje mohou být vkládány vlastním monitorovacím nástrojem CP přes dohodnuté rozhraní (například WebServices). Dále jsou jako události z tohoto zdroje evidovány informace o aktualizaci parametrů zařízení, např. aktualizace IPTV STB připojené pod Nangu.
Monitoring - hodnoty - Události s tímto zdrojem jsou uvedeny v záložce "Surové události" pouze v případě, že je nadefinován nějaký filtr s tímto zdrojem a na některém zařízení, na něž je aplikovatelný, dojde ke změně odpovídající hodnoty.

Stručný popis funkcionality

1. Všechny události jenž vygenerují zdroje události jsou zachytávané do záložky Surové události.

2. Pomocí filtrů definovaných v záložce Filtry se z množiny surových událostí vyberou jen ty, které nás zajímají a tím se z nich stanou rozpoznané události.

3. Množinu rozpoznaných událostí lze spatřit v záložce Rozpoznané události – vyfiltrované události ze záložky Surové události.

4. Na tuto vyfiltrovanou množinu lze v záložce Triggery alertů nadefinovat trigger.

5. Pokud identifikovaná událost splňuje podmínky nadefinovaného triggeru, vzniká alert. O historii těchto vygenerovaných a vyexpedovaných alertů nás informuje záložka Historie alertů.

6. Vedle alertů expedovaných pomocí SMS nebo e-mailu je hlavním výstupem tohoto modulu záložka Wallboard, kde operátor zjistí všechna zařízení s aktuálně notifikovaným problémem. Pokud zde není žádné zařízení, je vše v pořádku.

Záložka "Surové události"

Každá událost se váže ke konkrétnímu zařízení, na němž je možné přímo v modulu provést následující operace:

"Online měření zařízení, na kterém byla identifikována vybraná událost"

"Restart zařízení, na kterém byla identifikována vybraná událost"

"Ping na IP adresu zařízení na kterém byla identifikována vybraná událost"

Surové události třídy SIM a GSM Proxy

Pro zařízení třídy SIM a GSM Proxy je možné si v záložce Surové události zobrazit události těchto zařízení, které se využívají pro služby třídy "Hlasová služba GSM" nebo "Balíček GSM".

Seznam surových událostí třídy GSM Proxy

Quadruple.ImportCdr.FileDownload
Quadruple.ImportCdr.UnknownGid (ID služby z CRM Materny)
Quadruple.ImportCdr.SqlError
Quadruple.ImportCdr.FileDelete
Quadruple.ImportEdr.FileDownload
Quadruple.ImportEdr.UnknownGid (ID služby z CRM Materny)
Quadruple.ImportEdr.SqlError
Quadruple.ImportEdr.FileDelete
Quadruple.ImportCdrEdr.DirList
Quadruple.ImportCdrEdr.Login
Quadruple.ImportCdrEdr.Failed

Pro zmíněné události si lze nastavit trigger alertů se šablonou "GSM_IMPORT_NOTIFY".

Seznam surových událostí třídy SIM

Quadruple.SimUpdate.SOAPError
Quadruple.SimUpdate.AppBusError (logování SQL chyb)

Pro zmíněné události si lze nastavit trigger alertů se šablonami "GSM_SOAP_NOTIFY" a "GSM_APPBUS_NOTIFY".

Seznam surových událostí třídy SIM pro EDR notifikace

Příklad použití: nastavení odesílání mailu na konkrétní EDR operaci (třeba při portaci čísel).
Události lze filtrovat na záložce Surové události, dle sloupce Název (úroveň category.operation) a Obsah (úroveň service).

Nastavení pro notifikaci lze provést na záložce Filtr s těmito parametry:

Zdroj události: Zpráva od zařízení
Událost: Udává se výraz ve spojení názvu až do úrovně category.operation, příklad: SRV.ACT-DONE. Pro všechny události SRV lze zapsat znakem % jako SRV.%
Regulérní výraz: v případě, že chcete notifikovat i úroveň service, lze do regulérního výrazu zapsat jako #service=hodnota#, příklad: #service=m_barringByCustomer/outgoingSms#
ostatní parametry dle vzorového snímku

Úroveň category může obsahovat (zdroj MVNE_CDR_format_and_fields):

SUB - Subscription
SRV - Supplemental & VAS Services
ACC - Account Balance & Cost Control
CHG - Charging

Úroveň operation může obsahovat (zdroj MVNE_CDR_format_and_fields):

NEW - new entity is created
ACT-REQ - activation of simProfile service is requested
ACT-DONE - activation of simProfile service is finished by HMNO
DEACT-REQ - deactivation of simProfile service is requested
DEACT-DONE - deactivation of simProfile service is finished by HMNO
SET-REQ - new value of simProfile service is requested
SET-DONE - new valie of simProfile service is set by HMNO"

Seznam úrovní service je k dispozici v akutálním PMW service catalogue.

Příklad nastavení filtru:
SIM management - EDR notifikace

Šablonu pro trigger si CIBS partner nastavuje sám ( modul Šablony ), kdy si tuto šablonu použije v nastavení triggeru .

K těmto zařízením navazují následující funkcionality:

Záložka "Filtry"

Jak vložit skupiny filtrů?

V záložce Filtry, tabulka "Skupiny filtrů" zvolíme akci

"Vložení nové skupiny filtrů".

Při zakládání nového filtru bez ohledu pro jaký zdroj události bude aplikován je nejdříve nutné vybrat následující atributy

4.0.2 Dial VlozeniSkupinyFiltruDefault.jpg

Atribut	Popis
*CIBS partner*	Výběrem konkrétního CIBS partnera výrazně zužíte a zrychlíte vyhledávání zařízení. V položce Zařízení pak budou nabízena i koncová zařízení zákazníků.
*Lokace*	Výběrem konkrétní lokace výrazně zužíte a zrychlíte vyhledávání zařízení. V položce Zařízení pak budou nabízena i koncová zařízení zákazníků.
*Typ zařízení*	Typ zařízení pro který bude tato skupina filtrů platná - je třeba nejpre vybrat položku Třída zařízení.
*Třída zařízení*	Třída zařízení, pro kterou bude tato skupina filtrů platná - tento atribut je povinný poněvadž na základě jeho vybrání jsou vypsány parametry této třídy při použití zdroje události "Monitoring - hodnoty"
*Popis skupiny*	Podrobný popis filtru
*Název skupiny*	Název filtru, tento název je důležitý při vytváření triggeru.
*Zařízení*	Konkrétní zařízení, na které se má tato skupina filtrů aplikovat. Nejprve je třeba vybrat položku Třída zařízení.

Jednotlivé filtry lze dle názvosloví řadit do skupin a s těmito skupinami následně operovat. Jednotlivé skupiny je možné třídit dle zdroje události či stavu filtrů. Filtry nejsou jen pro evidenční účely. Je potřeba, si uvědomit, že tím, co nabývá nějakého stavu, je dvojice "Zařízení - Skupina filtrů". Na zařízení mohu mít více skupin filtrů, které indikují stav zařízení v různých ohledech. Například na DOCSIS modemu mohu mít "Výpadky" (ze zdroje událostí "Monitoring - dostupnost zařízení") a bude "OK", protože modem je dopingatelný a "CNR" (ze zdroje "Monitoring - hodnoty") a ta může být na stejném zařízení "CRITICAL", protože poměr signál/šum je hodně špatný, a díky tomu to v reálném provozu nemusí moc fungovat, i když zařízení není "mrtvé".

Pokud má alertování fungovat správně, je pro většinu smysluplných způsobů použití nezbytné pro každý filtr, který detekuje stav "CRITICAL" nebo "WARNING" mít nadefinován i komplementární filtr, který vygeneruje událost se stavem "OK". Z tohoto důvodu při pokusu o vytvoření skupiny filtrů pouze pro stav "CRITICAL" nebo "WARNING" nám uložení neprojde, dialog zahlásí, že musí být vytvořen i odpovídající filtr pro stav "OK". Když by se to nenakonfigurovalo tímto způsobem tak zařízení, na nichž jednou nastala chyba, by navždy svítita na wallboardu a při dalším výskytu chyby by se nevygeneroval žádný alert (pokud by trigger alertu nebyl nadefinován se zatržítkem "I nezměněný stav").

4.0.2 Dial VlozeniSkupinyFiltruUpozorneni.jpg

Nyní se již nastavení jednotlivých filtrů liší v závislosti na vybraném Zdroji události

1) Ukázka vložení filtru pro zdroj události Monitoring - dostupnost zařízení

Na následujícím obrázku lze spatřit vytváření nové skupiny filtrů s použitím zdroje události Monitoring - dostupnost zařízení.

Atribut	Popis
*Zdroj události*	Vybraná hodnota Monitoring - dostupnost zařízení
*Událost*	Na výběr máme k dispozici událost pro výpadek zařízení, obnovu zařízení nebo nově monitorované zařízení. Poslední zmiňované využijeme v případě, že zařízení nebylo dosud nikdy omonitorováno a my chceme být o jeho prvním monitorování informování. Např. první zapojení modemu zákazníka.
*Stav*	Tento atribut pomáhá popsat stav zařízení, k dispozici jsou nadefinované stavy: / kritický / varování / OK / nemění se. Například když zařízení neodpoví na monitoring v 10 minutovém intervalu chceme být pouze varování, když ovšem neodpoví v 60 minutovém intervalu, pak je již závažnost kritická. Naopak když je vypadlé zařízení obnoveno, pak použijeme stav OK. Poslední stav "Nemění se" lze použít v případě, kdy chceme na daném zařízení filtrovat události, které nutně neznamenají výpadek ani obnovu zařízení, např. na apachi chceme sledovat určité veličiny.
*Pojmenování*	Pojmenování filtru - tento název je zároveň názvem události, identifikované tímto filtrem
*Poznámka*	Nepovinný atribut sloužící pro lidský popis toho co má filtr dělat
*Délka výpadku*	Zde se hodnota vyplňuje pouze v případě, že zvolíme událost "Výpadek zařízení". Kritérium je splněno jestliže zařízení neodpovídá na požadavky monitoringu po tuto dobu.
*Sruzumitelný název*	Atribut určený pro komentář

4.0.2 Dial VlozeniSkupinyFiltruDostupnostZarizeni.jpg

2) Ukázka vložení filtru pro zdroj události SNMP trap

Na následujícím obrázku lze spatřit vytváření nové skupiny filtrů s použitím zdroje události SNMP trap.

Atribut	Popis
*Zdroj události*	Vybraná hodnota SNMP trap
*Událost*	Filtr na druh události, specifický pro zvolený zdroj (například OID identifikující typ trapu pro SNMP trap)
*Stav*	Tento atribut pomáhá popsat stav zařízení, k dispozici jsou nadefinované stavy: / kritický / varování / OK / nemění se. Například když hodnota OID (např. iso.3.6.1.4.1.2021.8.1.100.1) je rovna 0 pak je zařízení v pořádku. Když je ovšem hodnota OID větší než 0 pak je na zařízení problém. Poslední stav "Nemění se" lze použít v případě, kdy chceme na daném zařízení filtrovat události, které nutně neznamenají změnu stavu zařízení).
*Pojmenování*	Pojmenování filtru - tento název je zároveň názvem události, identifikované tímto filtrem
*Poznámka*	Nepovinný atribut sloužící pro lidský popis toho, co má filtr dělat
*OID*	OID z obsahu SNMP trapu, jehož hodnota je porovnávána
*Operátor*	Operátor pro porovnání hodnoty: >, <, >=, <=, =, LIKE
*Hodnota*	Zde se určí číselná hodnota, jež je pomocí zvoleného operátoru porovnána s hodnotou OID
*Sruzumitelný název*	Atribut určený pro komentář

4.0.1 Dial VlozeniSkupinyFiltruSNMPtrap.jpg

3) Ukázka vložení filtru pro zdroj události Syslog

Na následujícím obrázku lze spatřit vytváření nové skupiny filtrů s použitím zdroje události Syslog.

Atribut	Popis
*Zdroj události*	Vybraná hodnota Syslog
*Událost*	Filtr na druh události, specifický pro zvolený zdroj (například OID identifikující typ trapu pro SNMP trap)
*Stav*	Tento atribut pomáhá popsat stav zařízení, k dispozici jsou nadefinované stavy: / kritický / varování / OK / nemění se. Poslední stav "Nemění se" lze použít v případě, kdy chceme na daném zařízení filtrovat události, které nutně neznamenají změnu stavu zařízení).
*Pojmenování*	Pojmenování filtru - tento název je zároveň názvem události, identifikované tímto filtrem
*Poznámka*	Nepovinný atribut sloužící pro lidsky srozumitelný popis toho, co má filtr dělat
*OID*	OID použité pro filtrování
*Operátor*	Nepovinný operátor pro porovnání nalezené match-group se zadanou hodnotou: >, <, >=, <=, =, LIKE
*Hodnota*	Nepovinná hodnota, s níž, jestliže je zadána, bude porovnána nalezená match-group pomocí zvolenáho operátoru
*Sruzumitelný název*	Atribut určený pro komentář

4) Ukázka vložení filtru pro zdroj události Monitoring - hodnoty

Na následujícím obrázku lze spatřit vytváření nové skupiny filtrů s použitím zdroje události Monitoring - hodnoty.

Přes SNMP nyní monitorujeme na zařízení různé hodnoty a ukládáme je do databázových tabulek z nichž pak kreslíme grafy. Díky tomuto zdroji událostí můžeme v okamžiku uložení dat do tabulek zároveň vybrané (operátorem nastavené) hodnoty zkontrolovat a když vybočí z určitého rozsahu, vygenerovat z nich událost, která následně může vyvolat alert (a tedy vést k poslání mailu nebo SMS, případně spuštění workflow). Mail je tak možné poslat například pokud nějaké zařízení začne mít příliš slabý signál. Na níže uvedeném obrázku je nastaven filtr, který hlídá využití CPU na zařízení, k tomuto účelu porovnává OID hodnotu pomocí operátoru s uživatelsky zvolenou konstantou. V případě, že vzroste load CPU nad 50% je vygenerována surová událost na níž tento filtr zareaguje. Dalším postupem může být pro tento filtr nadefinování triggeru, který následně odešle na operátora či servisni skupinu sms, email, případně bude spuštěna automatizace (workflow).

Atribut	Popis
*Zdroj události*	Vybraná hodnota Monitoring - hodnoty
*Událost*	Filtr na druh události, specifický pro zvolený zdroj
*Stav*	Tento atribut pomáhá popsat stav zařízení, k dispozici jsou nadefinované stavy: / kritický / varování / OK / nemění se. Například když hodnota OID (HOST-RESOURCES-MIB::hrProcessorLoad.1) je větší než 50 pak se začíná zvyšovat load procesoru, ohodnotíme to stavem varování a chceme, aby na tento stav reagoval trigger. Když ovšem hodnota OID je menší nebo rovna 50 pak je již load procesoru v pořádku. Poslední stav "Nemění se" lze použít v případě, kdy chceme na daném zařízení filtrovat události, které nutně neznamenají změnu stavu zařízení.
*Pojmenování*	Pojmenování filtru - tento název je zároveň názvem události, identifikované tímto filtrem
*Poznámka*	Nepovinný atribut sloužící pro lidský popis toho co má filtr dělat
*Naměřená hodnota*	OID monitorované na zařízení, jehož hodnotu toto kritérium pomocí zvoleného operátoru porovnává s hodnotou zadanou v kritériu
*Operátor*	Operátor pro porovnání hodnoty: >, <, >=, <=, =, LIKE
*Konstanta / parametr*	Zde máme na výběr dvě možnosti, v případě, že vybereme "Konstanta" bude hodnota zadaná ve formuláři "Hodnota" porovnávána s operátorem. Pokud zvolíme "Parametr", ve formuláři "Hodnota" se zobrazí všechny v databázi nadefinované parametry pro vybranou třídu zařízení. Z tohoto důvodu je atribut "Třída zařízení" povinný a opět dojde k porovnání s operátorem.
*Hodnota*	Číselná hodnota, s níž je pomocí zvoleného operátoru porovnávána konstanta nebo parametr zařízení
*Srozumitelný název*	Atribut určený pro komentář

4.0.2 Dial SkupinaFiltruMonitoringHodnoty.png

Ukázka vložení filtru pro zdroj události TX levelu a CNR modemu

Atribut	Popis
*Událost*	Filtr na druh události, specifický pro zvolený zdroj (například OID identifikující TX level: DOCS-IF-MIB::docslfCmStatusTxPower.2
*Událost*	Filtr na druh události, specifický pro zvolený zdroj (například OID identifikující CNR modemu: DOCS-IF-MIB::docslfSiqQSignalNoise.3

5) Ukázka vložení filtru pro zdroj události Definovaný uživatelem

Na následujícím obrázku lze spatřit vytváření nové skupiny filtrů s použitím zdroje události Definovaný uživatelem.

Např. je možné sledovat úspěšnost provedení aktualizace pro zařízení IPTV SetTopBox nebo OTT identita z NANGu. Jsou k dispozici 2 události: DeviceUpdateError (chyba při konfiguraci zařízení) a DeviceUpdate (úspěšná konfigurace zařízení).

Atribut	Popis
*Zdroj události*	Vybraná hodnota Definovaný uživatelem
*Událost*	Filtr na druh události, specifický pro zvolený zdroj
*Stav*	Tento atribut pomáhá popsat stav zařízení, k dispozici jsou nadefinované stavy: / kritický / varování / OK / nemění se. Poslední stav "Nemění se" lze použít v případě, kdy chceme na daném zařízení filtrovat události, které nutně neznamenají změnu stavu zařízení.
*Pojmenování*	Pojmenování filtru - tento název je zároveň názvem události, identifikované tímto filtrem
*Poznámka*	Nepovinný atribut sloužící pro lidský popis toho co má filtr dělat
*Regulerní výraz*	Zde je možné si sestavit regulerní výraz s požadovanou akcí. Popis výrazu jenž je uveden na obrázku najdete níže.
*Operátor*	Operátor pro porovnání hodnoty: >, <, >=, <=, =, LIKE
*Srozumitelný název*	Atribut určený pro komentář

Příklad pro třídu zařízení IPTV SetTopBox (analogicky lze použít u OTT identity):

4.0.1 Dial VlozeniSkupinyFiltruAktualizaceIPTV.jpg

Popis regulerního výrazu

Znak	Popis
/	ohraničení
^	začátek textu / řádku
$	konec konec textu
()	kulaté závorky ohraničují skupinu
?	žádné nebo jedno opakování předchozího
?	pojmenování skupiny (musí být hned za úvodní závorkou). Objecně se pak jde odkázat na skupinu tímto názvem
*.(tečka)*	jakýkoli znak
*	libovolný počet opakování přechozího znaku skupiny nebo třídy znaků
S	flag, který říká, že jde o víceřádkový regulerní výraz

Toto je samozřejmě pouze stručný komentář regulerních výrazů uvedených na obrázku. Pro bližší pochopení je vhodné si stáhnout dokumentaci k regulerním výrazům.

Při nastavení tohoto filtru se rozpoznané události kromě modulu Události & Alertingu zobrazují také v modulu "Koncová zařízení" nebo "Cesta sítí", tabulka "Události zařízení".

Záložka Rozpoznané události

Každá událost se váže ke konkrétnímu zařízení, na němž je možné přímo v modulu provést následující operace:

"Online měření zařízení, na kterém byla identifikována vybraná událost"

"Restart zařízení, na kterém byla identifikována vybraná událost"

"Ping na IP adresu zařízení na kterém byla identifikována vybraná událost"

Záložka Triggery alertů

Jak vytvořit nový trigger?

V záložce Triggery alertů, tabulka "Skupiny filtrů" zvolíme akci

"Vložení nového triggeru".

Atribut	Popis
*Skupina filtrů*	Skupina filtrů která aktivuje tento trigger.
*Zařízení*	ID zařízení
*Stav sk. filtrů*	Udává stav skupiny filtrů, na výběr jsou hodnoty kritický / varování / OK / nemění se Tyto stavy jsou shodné se stavy když vytváříme nový filtr v záložce "Filtry".
*I nezměný stav*	Triggeruje i události, které nemění stav skupiny filtrů. To, co alertujeme bez tohoto zatržítka, je "ZMĚNA STAVU ZAŘÍZENÍ".
*Typ*	Udává typ upozornění na daný trigger, na výběr jsou hodnoty sms, email, CIBS workflow. Pomocí CIBS workflow lze nastavit jakoukoli akci ze seznamu spustitelných akcí, viz dokumentace workflow (automatizace). Např. aby při výpadku nebo obnově zařízení došlo k vytvoření servisního procesu. Operátor si pouze nadefinuje filtr, který zvolí při vytváření triggeru a jako typ upozornění zvolí CIBS workflow, následně je nutné kontaktovat support, aby toto workflow přidal do databáze.
*Cíl*	Udává cílovou skupinu na kterou bude aplikován trigger, na výběr jsou hodnoty operátor, servisní skupina, členové skupiny
*Šablona*	Udává typ použité šablony ze seznamu nadefinovaných šablon pro příslušný trigger.
*Operátor/Skupina*	Udává jméno konkrétního operátora, případně název skupiny na které bude zasíláno upozornění triggeru. Vzhledem k tomu, že je modul nadlokační jsou zde zobrazeny jména operátorů, kteří mají právo CT na danou lokaci. Pokud mají operátoři LEVEL 255, tak je vidí jen operátoři s LEVEL 255. Ostatní vidí vše co má level menší než 255 nezávisle na tom, zda sami mají větší nebo menší level (operátor s level 50 tedy vidí i operátora s 254, nevidí ale 255).

Ikona obálky ve druhém sloupci charakterizuje způsob zasílání alertu, v tomto konkrétním případě se jedná o upozornění formou emailu.

V případě, že dáme trigger editovat a uložíme, dojde automaticky k vytvoření nového triggeru s nastavením původně editovaného. Původně editovaný trigger se zneaktivní. Důvodem tohoto chování je možnost náhledu na historicky vygenerované události, kde potřebujeme vidět, nastavení triggeru, který byl použit u události v době jejího vytvoření. Pokud bychom při editaci triggeru nevytvářeli nový, ale pouze prováděli přepisování, pak by při zpětném náhledu nebylo možné zjistit původní nastavení triggeru.

Šablony pro trigger alertu se zobrazují následovně:

existuje pouze definice globální šablony = zobrazí se
neexistuje žádná definice globální šablony ani lokační šablony = nevalidní stav, nezobrazí se, není co
existuje pouze definice lokační šablony = zobrazí se
existuje definice globální šablony a i definice lokační šablony a šablony mají shodný název = zobrazí se pouze šablona lokační

Ukázka nastavení triggeru pro TX level a CNR modemu

Definice nastavení monitoringu pro zařízení Mikrotik router

Pro monitoring Mikrotik router je potřeba:

v záložce Triggery alertů vytvořit triggery pro skupinu filtrů "monitoring Mikrotik". Jeden filtr se šablonou MONITORING_NODE_DOWN a druhý filtr MONITORING_NODE_UP, které se liší stavem skupiny filtrů. U filtrů můžete definovat určení cíle triggeru dle potřeby (email, sms), cíle (operátor, servisní skupina, členové skupiny) a operátora/Skupiny. Detailní popis polí v části Jak vytvořit nový trigger? .

v záložce Filtry vytvořit filtr dle postupu v části Ukázka vložení filtru pro zdroj události *Monitoring - dostupnost zařízení s tím rozdílem, že vyberete třídu zařízení "Mikrotik router".

Záložka Historie alertů

Záložka Wallboard

4.0.6 Tab ZarizeniSRozpoznanymProblemem.jpg

Na tomto screenu lze vidět, že v současné situaci existují 2 zařízení u nichž dochází k určité nekonzistenci.

Záznam o provedeném manuálním vložení události se stavem "OK" lze spatřit v modulu Rozpoznané události. Takovouto událost poznáme na první pohled dle popisu ve sloupci "Událost", kde je uvedeno Manual acknowledge. Např. následující screen.

4.0.6 Tab RozpoznaneUdalosti ManualAcknowledge.jpg

Při prokliku na název zařízení se dostaneme do modulu "Cesta sítí", kde v tabulce "Události zařízení" lze spatřit opět záznam o manuálním vložení události se stavem "OK".

4.0.6 Tab UdalostiZarizeni ManualAcknowledge.jpg

Stromová kontrola alertů

Systém událostí a alertů v CIBSu je propojen s CIBSovým monitoringem tak, že využívá jeho data, není ale přímo jeho součástí. Oba subsystémy jsou na sobě relativně nezávislé a v čase asynchronní.

CIBSový monitoring funguje plošně - periodicky se monitorují zařízení jednotlivých typů. Okamžik, kdy bude zařízení monitorováno, tedy nezávisí na jeho zapojení v topologii sítě.

Alerty událostí, týkajících se výpadků a obnovení činnosti zařízení, které jsou generovány monitoringem, je možné nastavit tak, aby alert byl potlačen při výpadku nadřazeného zařízení, tak, aby například při výpadku některého ze zařízení páteřní infrastruktury sítě nebyly zbytečně alertovány výpadky jednotlivých AP a klientských zařízení, k nimž nutně dojde zároveň, ale jsou v tomto případě pouze symptomem problému s nadřazeným zařízením. (Stejný mechanismus potlačení alertu samozřejmě funguje i při výpadku samotného monitoringu.)

Funkcionalita stromová kontrola alertů byla vytvořena za účelem zamezit zbytečným odesíláním alertů. Uvedu na příkladu. Při výpadku zařízení dojde k odeslání alertů na tomto zařízení a všech podřízených zařízeních (v případě, že není síť ve skutečnosti zokruhovaná). V případě sms je odeslání více takovýchto sms zbytečné a proto přichází na řadu stromová kontrola alertů.

Jak stromová kontrola funguje?

Nejdříve je nutno zmínit několik důležitých pojmů týkajících se monitorování zařízení. Každé zařízení monitorujeme buď přes SNMP nebo PING nebo obojí co 5 minut. Uvedu na příkladu. Máme infrastrukturní zařízení (např. viz následující obrázek Router RB433AH) na němž je nastaven filtr se zdrojem události Monitoring - dostupnost zařízení s nastaveným intervalem výpadku 10 minut. Dále máme koncové zařízení (např. viz následující obrázek Wifi klient Nano 5) na němž je nastaven filtr se zdrojem události Monitoring - dostupnost zařízení s nastaveným intervalem výpadku 15 minut.

Modelový příklad jak se vyhodnocuje výpadek zařízení:
Měřeníme každých 5 minut.

1 vzorek měření: Nenaměřili jsme žádné hodnoty pro koncové zařízení.
2 vzorek měření: Nenaměřili jsme žádné hodnoty pro infrastrukturní zařízení jenž je ve stromové struktuře nad koncovým zařízením a opět jsme nenaměřili žádné hodnoty pro koncové zařízení.
3 vzorek měření: Nenaměřili jsme žádné hodnoty pro koncové ani infrastrukturní zařízení.

Tím pádem splňujeme podmínky 15 minutové nečinnosti koncového zařízení a 10 minutové nečinnosti infr. zařízení.

V tomto případě by bez použití funkcionality stromové kontroly alertů pří výpadku infrastrukturního zařízení (Router RB433AH) okamžitě došlo k odeslání alertů např. sms nejen tohoto inf. zařízení, ale také všech zařízení nacházející se pod ním (Wifi klient Nano 5). S použitím funkcionality stromové kontroly alertů je však situace jiná. Před odesláním alertu se zkontroluje stav nadřazeného zařízení:

Pokud je nadřazené zařízení rovněž ve výpadku a má nastavený stejný cíl triggeru, k odeslání alertu nedojde.
V případě, že nadřazené zařízení je rovněž ve výpadku, ale jeho cíl triggeru je jiný k odeslání alertu dojde.
V případě, že nadřazené zařízení není vůbec ve výpadku, pak k odeslání alertu samozřejmě dojde.

Důvodem těchto podmínek je, že když máme u každého zařízení nastaven trigger s jiným cílem např. technikem pak je žádoucí, aby se trigger odeslal oboum lidem. Naproti tomu, když je u obou zařízení nastaven trigger na stejného technika, pak není nutné, aby se technikovi odeslaly sms dvě.

Z dříve uvedeného (relativní nezávislost monitoringu a alertingu a plošná povaha CIBSového monitoringu) však vyplývá, že pokud je hranice pro detekci výpadku nastavena u všech zařízení stejně, není možné zaručit, že při výpadku celé větve sítě (případně i celého monitoringu) vznikne událost o výpadku nadřazeného infrastrukturního zařízení dříve, než události o výpadku podřízených zařízení. A jestliže je výpadek podřízených zařízení je detekován dříve, nemůže popsané potlačení "jejich" alertu na základě kontroly nadřazených zařízení zafungovat.

Z tohoto důvodu velmi doporučujeme v případě, že je požadována funkčnost potlačení alertů výpadku podřízených zařízení při výpadku nadřazených, nastavit pro jednotlivé typy zařízení podle jejich místa v topologii sítě hranice pro detekci výpadku, které nejsou shodné, ale navyšují se směrem k nižším úrovním.

Lze doporučit například tato nastavení:

- Výpadek RM - 10 minut. Kontrola pak je schopná "odchytit" kromě situace, kdy fakticky vypadne RM, i potenciální výpadek samotného monitoringu. Pokud toto není požadováno, lze tuto úroveň vynechat a hranice na dalších úrovních o 5 minut snížit.

- Výpadek infrastrukturních zařízení - 15 minut.

- Výpadek klientských zařízení - 20 minut.

Upozornění na zařízení s notifikovaným problémem formou ikony v nástrojové liště

Systém umožní prostřednictvím práva per operátor zobrazit v nástrojové liště ikonu s notifikovaným problémem na zařízeních např. výpadek zařízení, pokles signálu...V pravé dolní části ikony je v závorce uveden počet těchto zařízení.

Tuto funkcionalitu lze nastavit pomocí práva GLOBAL_NET_ALERTS.VIEW v modulu administrátoři. Funkcionalitu je rovněž možno zapnout pro celou lokaci. V takovém případě je nutné kontaktovat support, který vloží do configu záznam s hodnotou GLOBAL_NET_ALERTS.VIEW

Právo může nabývat následujících hodnot:

INFRASTRUCTURE - notifikace pouze infrastrukturních zařízení
ALL - notifikace všech zařízení bez ohledu na to, zda-li jsou infrastrukturní nebo koncová

V závislosti na nastavené hodnotě se následně zobrazuje příslušný počet notifikovaných zařízení v pravé dolní části ikony.

Zapnutí/vypnutí alertingu na zařízení

Proklikem na název zařízení nacházejícího se na wallboardu se dostaneme na detail zařízení v modulu "Cesta sítí". Zde je možné využít akci

"Dočasné potlačení alertů při výpadku zařízení".

4.0.12-Dial-VypnutiNeboZapnutiAlertingu.jpg

Popis atributů dialogu

Název	Popis
*Vypnutí alertu*	Zapnutí nebo vypnutí alertování
*Datum*	Datum, do kterého bude alerting vypnutý
*Čas*	Čas, do kterého bude alerting vypnutý
*I podřízená zařízení*	Včetně všech podřízených zařízení ve stromové struktuře
*Info*	Podrobný popis akce která nastane

Odesláním dialogu se provede nastavení/vymazání časového razítka do parametrů zařízení. Parametr je editovatelný včetně smazání.

4.0.12-Tab-ParametryZarizeniAJehoRozhranni.jpg

Při generování alertu pro zařízení se tyto parametry kontrolují. Pokud je nastaven do budoucna, pak se alert nevygeneruje, ale do logu (záložka "Historie alertů") se uvede, že nebyl "expedován". Zobrazení je řešeno textovou poznámkou u záznamu alertu s textem například "Na zařízení nastaven downtime do 2014-04-17 07:44:00", dále jsou alerty, jejichž doručení bylo potlačeno buď downtimem nebo stromovou kontrolou zobrazovány jinou barvou (červené pozadí).

Zpět na obsah: Jak pracovat s modulem události & alerting

Související odkazy

Grafické uživatelské rozhraní).

Odkazující články

Zpět na obsah: Jak pracovat s modulem události & alerting

I	Attachment	Action	Size	Date	Who
gif	netevents_ahistory_view_act.gif	manage	1 K	26 Mar 2012 - 09:10	RuzickaResalCz
gif	netevents_events_view_act.gif	manage	1 K	22 Mar 2012 - 14:17	RuzickaResalCz
gif	netevents_filters_view_act.gif	manage	1 K	22 Mar 2012 - 11:01	RuzickaResalCz
gif	netevents_log_view_act.gif	manage	1 K	26 Mar 2012 - 09:33	RuzickaResalCz
gif	netevents_triggers_view_act.gif	manage	1 K	26 Mar 2012 - 06:41	RuzickaResalCz
gif	netevents_wallboard_view_act.gif	manage	1 K	26 Mar 2012 - 09:47	RuzickaResalCz
gif	table_nav_insert.gif	manage	218 bytes	22 Mar 2012 - 11:01	RuzickaResalCz
jpg	tblUdalosti.jpg	manage	104 K	29 Mar 2012 - 11:36	RuzickaResalCz

This topic: Mango > WebHome > CibsDocHowTo > CibsDocHowToEventsAlerting
Topic revision: 09 Dec 2020, smid

Copyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding Foswiki? Send feedback