Čísla, texty, e-maily, data, prostě informace. Za relativně dlouhou dobu rutinního využívání informačních technologií ve firemních prostředích, a je jedno, zda myslíme slovem firma mikrospolečnost o jednom člověku, nebo velkou společnost s tisíci zaměstnanci a pobočkovou organizační strukturou, bylo nashromážděno téměř neuvěřitelné množství informací. A je v tomto smyslu čím dál tím „hůře". Stále pokračující symbiotický vývoj hardwaru a softwaru společně s naším globalizovaným prostředím mají za následek násobné generování dat a informací, mezi které, vedle tradičních textů a čísel v podobě výrobních technologických postupů či finančně-účetních záznamů, nově patří také řada dalších typů, jako například logy technologických zařízení, čárové či QR kódy, ale také audio- nebo videozáznamy a obrázky.

Data a informace můžeme členit, zjednodušeně řekněme, dle jejich organizovanosti, na strukturovaná a nestrukturovaná. Ta strukturovaná jsou generována a tvořena nejméně za poslední tři desetiletí hlavně různými informačními systémy a portály, resp. jejich databázemi jako typickým příkladem přísně strukturovaných dat.

Technodat Exalead CloudView02
Díky technologickému vývoji, konkurenčnímu prostředí (na straně dodavatelů při boji o zakázku, na straně koncových uživatelů při zefektivnění své práce) a jistě také i dotačním finančním prostředkům z EU proběhl v nedávných letech značný boom v používání informačních systémů i v prostředích komerčních společností. Nicméně ani tak není dostupnost informací ve strukturovaných datech databází stoprocentní – např. roztříštěnost aplikací, specializace, verzování, cena licence na uživatele. Nestrukturovaná data jsou tvořena textovými dokumenty v mnoha typech souborů, e-maily, drobnými soubory s nastavením „něčeho", obsahem webových stánek, sděleními v diskusních fórech či na sociálních sítích, SMS zprávami, nicméně také historickými daty před érou podnikových informačních systémů – výčet samozřejmě není kompletní, což zde ani není cílem. Nestrukturovaná data získávají nejen čím dál větší převahu v poměru vůči strukturovaným – některé zdroje hovoří aktuálně až o 85 % ve prospěch nestrukturovaných, ale rovněž obsahují čím dál větší informační hodnotu ve svém sdělení – k tomu je na druhou stranu těžké se dostat pro jejich velké objemy. Otázka tedy zní: Jak se dostat ke strukturovaným i nestrukturovaným informacím společným způsobem a jak je společně lépe využívat?

Technodat Exalead CloudView03
SBA aplikace

„Heuréka! Našel jsem..." Parafrází tohoto starořeckého výroku proneseného po objevení Archimedova zákona svým objevitelem se nabízí odpověď na otázku ze závěru předchozího odstavce, a to díky dnešním vyhledávacím technologiím v SBA aplikacích. SBA = Search-Based Applications. Jak již z doslovného překladu vyplývá, jedná se o aplikace s inovativním přístupem k velkým datům a založené na vyhledávacích nástrojích v různých zdrojích informací. SBA vyhledávací aplikace mají schopnost pracovat s aktuálními daty v reálném čase, analyzovat je a navíc je předkládat uživateli v rozumné a chtěné podobě. Tento článek je specificky zaměřen na jednu konkrétní aplikaci tohoto typu, a to software s názvem EXALEAD CloudView, jehož výrobcem je společnost Dassault Systèmes, která je lídrem na trhu počítačových nástrojů pro podporu vývoje výrobků.

Technodat Exalead CloudView05
EXALEAD CloudView představuje pružně nasaditelný software obsahující všechny základní části potřebné pro řešení přístupu k informacím a zvýšení jejich informační hodnoty. Otevřená architektura poskytuje silné aplikační rozhraní pro napojení zdrojů nebo indexování dat či dokumentů, vytváření analytických pohledů a realizaci prohledávacích dotazů. Rovněž obsahuje monitorovací a administrační platformu, která navíc umožňuje snadnou integraci do jiných softwarových prostředí, jako jsou například veřejné informační portály či systémy pro správu obsahu. Stává se tak unifikující platformou pro přístup k informacím, která podává bohaté komplexní pohledy na data z různých zdrojů, ať již vnitropodnikových nebo z rozsáhlého prostředí webu, strukturovaná či nestrukturovaná. Z hlediska grafické podoby předkládaných výsledků a podoby dat pro koncového uživatele je EXALEAD vybaven řadou předdefinovaných seznamů, pohledů, tabulek, grafů, widgetů, dashboardů a dalších moderních prvků pro zobrazení. Navíc jsou všechny prvky výstavby výsledné aplikace, resp. webového portálu (uživatelským prostředím je běžný internetový prohlížeč), používány drag-n-drop metodou pro snadné používání a vysokou efektivitu.

EXALEAD konektory a index dat

Podstatou řešení SBA aplikací jsou jednak konektory, resp. možnosti napojení na zdroje dat, a jednak indexace informací a obsahu napojených dat, které používá statistické, lingvistické a sémantické zpracování k tomu, aby transformovalo různorodé původní zdroje do jediného originálního nástroje informační inteligence, tedy do vlastního indexu. Nevznikají tedy nové a větší kopie původních databází a původních dokumentů či souborů, nýbrž jejich jedinečný obsahový index. Dále se zde provádí kvalitativní i kvantitativní analýza textových, numerických, dočasných a geografických hodnot, a to obojí během indexace i během uživatelského dotazu.

Technodat Exalead CloudView06

Index lze doplnit o virtuální pole, jež jsou během stavby indexu plněna a počítána (např. Objem prodeje, Poměr nákladů na jednotku prodeje, atd.), potom se informace tedy nejen shromažďují, ale také třídí a řadí, vazebně doplňují a celkově obsahově se v kontextu zvyšuje jejich informační hodnota. Konektory na druhou stranu zajišťují zdroje a zabezpečený a funkční přísun dat. Obecně se lze napojit na jakýkoliv zdroj, ale navíc existují již připravené konektory na vybrané datové zdroje (WWW stránky, File-system, SQL databáze, některé mail servery, atd.). Díky tomu, že při nasazení této SBA aplikace odpadá potřeba klasické a náročné datové integrace nebo kustomizace formou „přeprogramování", je možné základní funkční podobu řešení realizovat i do pár týdnů a celé řešení mít realizované za několik měsíců.

Technodat Exalead CloudView07
Technodat Exalead CloudView08

Je dobré vědět

...že mluvíme o vyhledávání aktuálních i historických dat a povyšování jejich informační hodnoty, navíc ve vnitrofiremním prostředí i na webu. Že se uživatelé nemusí téměř školit, jelikož používají internetový prohlížeč, známé intuitivní uživatelské prostředí v nativním jazyce. Že takto lze nahradit funkční nedostatky stávajících informačních systémů, neboť v sobě uchovávají stále cenná data, ale jejich uživatelský komfort již nedostačuje. Tím šetříme náklady jinak vynaložené do investice na nový software. Že součástí jsou silné prvky pro analýzu, BI a dashboarding (agregace, řazení, median, grafy, drill-down tabulky, widgety a heat-mapy). Že je podporováno přes 320 typů souborů indexování obsahu. Že pomocí konektorů lze napojit ERP, CRM, PLM, SCM, DMS, MS SharePoint, MS Exchange, Lotus Notes/Domino, File-system, System Active Directory, cizí WWW stránky, periférie RFID, QR/barcode, GPS, drobná data a logy technických zařízení (čidla, váhy, snímače). Že lze připravit řešení pro PC/notebook/netbook, smartphone, tablet, infokiosek. A že „kdo správně hledá, ten najde...".

...více informací o této unikátní vyhledávací aplikaci na tradičním semináři společnosti Technodat PLM Forum 2013, který se letos koná ve dnech 13. a 14. června v kongresovém centru Společenský dům Lázně Luhačovice.

Autor článku působí jako obchodně technický manažer ve společnosti Technodat, CAE-systémy.
www.technodat.cz