Adatbányászat

A Wikipédiából, a szabad lexikonból.

Az adatbányászat a nagymennyiségű adatokban rejlő információk fél-automatikus feltárása mesterséges intelligencia algoritmusok alkalmazásával (pl. neurális hálók, szabálygenerálók, asszociációs modellek). A köznyelv és különböző informatikai cégek sok mindent neveznek adatbányászásának, de a szigorúbb szakmai terminológia szerint nem tekinthető adatbányászatnak az adatokból lekérdezésekkel, aggregálásokkal, illetve alap-statisztikai vizsgálatokkal történő információ nyerés.

Az adatbányászat alapadatai egyaránt lehetnek üzleti vagy kutatási, mérési adatok, lényegében bármi. Az adatok két köréhez kötődik az adatbányászat speciális alága, a szövegbányászat (textmining) és a web-bányászat (webmining).

A webmining azt a gépesített dokumentumfeldolgozó szakterületet jelenti, amely az internethez kapcsolódóan a nagymennyiségű weboldalon található képi, szöveges és egyéb alakú adatok feldolgozhatóvá való átalakításával foglalkozik. Az adatok átalakításának a célja a többnyire elektronikus dokumentum gyűjtőnévvel ellátott, különböző modalitású adathordozók megfelelő "finomított" vagy szűrt input kialakítása további, a felhasználó szempontjából értékes adatok kinyerésére. Ezt speciális OCR és MI alakfelismerő programok végzik, míg a megrendelők általában a kereskedelmi és egyéb hírszerzés területéről való cégek.

Az adat (számítástechnika) szócikk írta, hogy "az adatoknak önmagukban nincs jelentésük ... Az adatok az értelmezéstől, azok feldolgozásának módjától, alkalmazásuktól nyernek értelmet, és válhatnak információvá, hasznos adatokká. Ebből következik, hogy minden ilyen adatbányászat hipotézisekkel indul, azzal az előfeltételezéssel, hogy létezik olyan adat (szándék, törekvés, folyamat) az interneten is akár, amely figyelmet érdemel nemzetvédelmi vagy cégvédelmi szempontból, azaz ellenséges világban élünk, az vesz körül bennünket.

A honvédelemen, cégvédelmen kívül lényeges alkalmazási terület a gyógyszeripari, vegyipari és biotechnológiai tárgyú közleményeket veszi célba, amelyeknek az elemzésével, az azokból leszűrt következtetések (inferencia) segítségével új anyagok létezésére, szükségességére és számos stratégiai döntést illető kérdés megválaszolására lehet eljutni.

A szakterület társadalmi fontosságát az adja meg, hogy e high-tech kategóriájú téren dolgozó technokraták ugyanazokat a dilemmákat érik meg, mint az ötven-hatvan évvel ezelőttiek: vagy a megrendelőik paranoiáját kell tisztelniük, vagy a sajátjukat kell eladniuk.

[szerkesztés] Külső hivatkozások

[szerkesztés] Az adatbányászok nem bányászok

A világ vezető adatbányász cégei: