Matematický realismus organizace znalostí

Feb 17, 2023—by cernockyd

Jak algoritmické přístupy a umělá inteligence ovlivňují paradigma organizace znalostí?

Využití algoritmických přístupů strojového zpracování dat a principů umělé inteligence resp. strojového učení je v organizaci znalostí patrné zejména s rozvojem internetu v případě aplikací, kde je veliké množství dat, která je obtížné organizovat. Podmínkou pro využití strojového učení je možnost rychlého vyhodnocování efektivity vyhledávání pro zpětnovazebné učení algoritmů. Zpravidla se jedná o prostředí, kde historicky nemáme vysoké nároky na obhajovatelnost výsledků a kde upřednostňujeme rychlost a nízkou cenu organizace znalostí nad kvalitou. Obor AI se v posledních letech těší vyšší zralosti. Kdysi experimentální postupy jsou nyní poměrně zaběhlé a otestované. Lze předpokládat také postupnou demokratizaci použití AI, kterou slibují specialisté vyvíjející infrastruktury pro aplikaci AI v nejrůznějších oblastech. Cílem tohoto textu je mé vlastní ujasnění si toho, jak se s využitím AI proměňují základní principy organizace znalostí. Mým osobním cílem je snaha popsat mnou dosud nepoznané téma. Jde mi spíše o pokus o spekulaci a vyjádření intuice.

‚Předpokladem porozumění principů organizace znalostí je pochopení základních otázek ontologických („co je“), epistemologických („jakým způsobem to poznáváme“) a teleologických („za jakým účelem“)’ [1].

Smyslem organizace znalostí je v užším vymezení podle Kučerové [2] podpora nalezení schody mezi obsahem znalosti a její potřebou. Ve srovnání s příbuzným oborem reprezentace znalostí, který spojujeme s počátky oboru umělé inteligence a vývojem expertních systémů, se organizace znalostí nesoustřeďuje tolik na podporu řešení problémů, jako na samotnou organizaci znalostí jednotlivých domén či celé vědy a jejich standardizaci [3]. Nelze však vyloučit, že i smyslem organizace znalostí je podpora vytváření nových znalostí, inovace a řešení problémů v praktických situacích.

Knihovníci, katalogizátoři a další specialisté organizace znalostí k tomu tradičně kombinují mnoho přístupů, které umožňují analyzovat informační potřeby cílových skupin uživatelů; analýzu znalostí, přičemž znalost chápeme jako metaforu pro jakýkoli znalostní objekt resp. informační zdroj; a nakonec vnášením určitého řádu a struktury do spravovaného fondu znalostí [4]. Každý ze své zkušeností ví, že se nám v seznamu osobních kontaktů vyhledává lépe a rychleji, pokud je řazen alespoň abecedně. Právě struktura, která znalosti propojuje určitým, užitečným způsobem, umožňuje efektivně vyhledávat informace nebo je vzájemně vyměňovat. Na příkladu osobního adresáře bychom mohli nalézt jiné způsoby třídění kontaktů. Tedy strukturu, která by byla pro naše hledání efektivnější a zohledňovala i další faktory v závislosti na kontextu hledání, jako jsou např. povolání dané osoby, společní známí, datum posledního setkání nebo naposledy společně probírané téma. Zde se již poměrně patrně dotýkáme ontologické otázky toho, „co je“ součástí znalostí i epistemologické otázky, jak to můžeme poznat.

Začněme nejprve tím, co se myslí samotným pojmem ontologie. Vysvětlení tohoto pojmu nám totiž pomůže pochopit dva rozdílné pohledy, které jsou pro organizaci znalostí stěžejní. Neobejdeme se však bez mírně abstraktního jazyka. Pojem ontologie je často používán v mnoha různých významech. Může být matoucí, že pojmem ontologie v organizaci znalostí označujeme schéma či výčet možných entit digitálního systému a vztahů mezi nimi. Jedná se o přímou inspiraci z ontologie jako disciplíny první filozofie tedy metafyziky, která usiluje o zkoumání principů, které všemu předchází. Nyní ontologií myslíme ontologii v tomto smyslu, jako studium bytí. Bytí pro nás sice může být velmi abstraktním pojmem, nicméně pro naši uváhu pomůže rozlišení jeho dvou hlavních dimenzí: esence a existence. Dimenze esence se zabývá tím, „co je daná entita“ [5] a tím se dostáváme k jádru organizace znalostí - k pojmu kategorie.

Aristotelés [6], jeden z nejstarších filozofů, usiloval o rozlišení určitých základních kategorií bytí. Ve svém slavném spisu Kategorie podává výčet 10 základních kategorií, které by dále nemělo být možné redukovat či více zobecnit. Aristotelés chtěl s pomocí nalezení základních kategorií pochopit svět. Kategorie jsou jedním ze základních pojmů v organizaci znalostí právě v tomto smyslu - tvoří totiž uspořádání pojmů do nejobecnějších tříd ekvivalence. Osobně nad kategorizací přemýšlím z ekologického pohledu, kdy je motivace pro hledání kategorií poměrně jednoduchá, protože v kategoriích do určité míry myslíme. Obecně lze říci, že kategorizace, tedy hledání esence, jako jakési podstaty věcí je ztrátová komprese vnímání našeho světa. Jedná se o činnost, kterou děláme všichni, kdykoli něco nazveme slovem. Je to způsob, jakým se orientujeme ve světě a předcházíme totálnímu zahlcení informacemi. Pokud dovedeme všechny objekty, které používáme jako stůl označit slovem ‚stůl‘, zjednoduší se nám touto redukcí komunikace i přemýšlení.

Pokud předpokládáme, že identifikací základních kategorií dovedeme pochopit svět, ve kterém žijeme, zaujímáme objektivistický přístup. Podle tohoto přístupu existuje určitá objektivní, předem daná struktura, kterou objevujeme. V organizaci znalostí je tento přístup překonaný společně s představou o lidské mysli jako stroji, který pouze manipuluje se symboly. Na základě výzkumů kognitivní psychologie a lingvistiky nevnímáme kategorie jako objektivní nýbrž jako subjektivní a silně závislé na naší tělesné a smyslové zkušenosti stejně jako na kolektivním a kulturním kontextu a určité tradici našeho myšlení a komunikace [7]. Z těchto předpokladů vycházejí různé přístupy v organizaci znalostí. Fasetová analýza představuje systémový přístup ke zkoumaným problémům a umožňuje třídění pojmů na základě více kritérií. Doménová analýza zase legitimizuje sociální kontext komunikace a myšlení. S pomocí klasifikace uživatelů do tzv. „domén“ tj. určitých skupin či person, pomáhá při návrhu systémů. Autorsky či uživatelsky definované systémy organizace znalostí tzn. folksonomie se vyznačují subjektivitou a nízkou konzistencí [8] .

Dosud jsme se v otázce bytí nezabývali dimenzí existence. Existencí myslíme „zda daná entita je či ne“ nebo také ‚jak je‘. Stěžejním konceptem pro pochopení vztahů mezi realitou, myšlením a jazykem je sémiotický trojuhelník, který znázorňuje vztahy mezi tím, co poznáváme, poznaným významem, a symbolem či znakem, který používáme pro formulaci. Asi nás nepřekvapí, že nepoznáváme pouze entity materiální povahy. Zejména v knihovnictví často organizujeme poznání nejrůznějších humanitních věd, sociologie, ale i dalších oblastí, kde jsou koncepty sice velice abstraktní ale současně také užitečné. Užitečnost je jakýmsi hlediskem, které nám pomáhá překonat spor mezi realismem a nominalismem. Podle realismu obecné pojmy jako jsou „člověk“, či „zvíře“ skutečně existují. Naproti tomu podle nominalismu jsou reálné pouze jednotliviny či konkrétní instance - konkrétní člověk či konkrétní zvíře [1]. Můžeme zde vidět určitou paralelu s výzkumem povahy jazyka, ve kterém zjišťujeme jeho subjektivitu a imaginativnost, přesto však považujeme myšlenku či předpokládání jakéhosi jednoho obecnějšího jazyka za užitečné. Pro některé filosofy je v otázce existence duležitější spíše otázka „jak daná entita je“. Podstatné je, jak se entity podílí na formování naší reality [9] .

Filip Doušek[10] ve své eseji Seeing the Invisible (And How to Think About Machine Learning) trénuje změnu paradigmatu ve vnímání abstraktního světa [10]. Abstraktní svět matematiky, statistických modelů a pravděpodobností chce vidět a vidí na stejné ontologické úrovni jako ten materiální. Jinými slovy připouští jeho existenci. Doušek dlouhodobě poukazuje na zakořeněnost nominalistického chápání světa ve společnosti. Ostatně i jeho román Hejno bez ptáků představuje výzvu pro systémy organizace znalostí. Kniha je totiž rozdělena do dvou svazků, které však mají tvořit jednu knihu, nikoli knihu o dvou svazcích. Sám doušek tvrdí, že to, co knihu tvoří, je právě vztah jejich částí. Kantková [11] v rozhovoru s Douškem zmiňuje příhodu, kdy v knihovně narazila pouze na jeden svazek jeho románu a tudíž byly oba svazky umístěny odděleně. Doušek odpovídá „(…) knihovník místo jedné knihy zadá do systému dvě. Změní její reprezentaci. Tím ale změnil nejen filozofický význam, ale i reálné chování té věci ve světě. Ty dva svazky se kvůli jiné reprezentaci následně fyzicky oddělily a putují po světě každý zvlášť. Je to elegantní důkaz filozofie knihy: změňte svůj pohled, svoji reprezentaci světa a změníte svět“ [11].

Tuto myšlenku osobně považuji za důležitou jednak minimálně v tom, že dává abstraktnímu světu váhu, a druhak v tom, že se svět vztahů, pravděpodobností a statistických modelů již silně podílí právě na formování naší reality. Když se podíváme na systémy organizace znalostí, můžeme nabýt dojmu, že matematické modely hrají spíše sekundární roli a jsou považovány za doplňkový nástroj pro vyhodnocení přesnosti výsledků a určení efektivity organizace znalostí [12]. Při vytváření a šíření znalostí dnes ve skutečnosti matematické modely hrají naprosto zásadní roli a to zejména v masově rozšířených aplikacích. Zde mají matematické vztahy mezi znalostmi zachycené pomocí metod dolování dat a strojového učení přinejmenším stejnou váhu jako tradičnější přístupy.

Systém organizace znalostí nemusí být vyjádřen pouze pomocí vymezených pojmů (tříd ekvivalence), jakým se k popisu a kategorizaci informací používají tradiční metadata či exaktních vztahů, které umožňují zachytit ontologie. Lze jej vyjádřit například matematickou škálou, pomocí klastrů založených na sémantické blízkosti pojmů a konceptů získaných metodami umělé inteligence, resp. pomocí hlubokých neuronových sítí. Takové matematické vyjádření zároveň neznamená naprostrosté vypuštění vágnosti zpracované znalosti a převedení do zcela exaktního světa. Nalezení kýžené znalosti není otázkou přesné shody hledaných pojmů v metadatovém indexu, ale otázkou hledání sémanticky podobných znalostí ve vektorovém prostoru. Multidimenzionalitou prostoru můžeme zachytit různé vztahy mezi znalostmi i v závislosti na jejich kontextu. Pozice reprezentovaného pojmu v prostoru potom může být na základě zpětné vazby a nově přibývajících znalostí postupně kalibrována. Tomuto modelu reprezentace znalostí odpovídá např. jazykový model Word2Vec. Můžeme ho srovnat s tradičním fulltextovým vyhledáváním, kde jsou jednotlivá slova a jejich synonyma opatřena identifikátory pro snadné vyhledávání. Při analýze dokumentů potom konstruujeme výčet použitých slov a ukládáme do metadat odkazy na jejich index. Model Word2Vec však zachycuje sémantickou podobnost slov, což dobře ilustruje aritmetika se slovy, kterou model umožňuje a která přispěla jeho popularizaci [13]. Příklad „král - muž + žena = královna“ čteme jako: odečteme-lid od vektoru slova „král“ vektor slova „muž“ a přičteme-li k němu vektor slova „žena“, získáme vektor, který je velmi blízký vektoru slova „královna“. Iterace tohoto přístupu vedly k dalším modelům, které umožňují reprezentovat ve vektorovém prostoru celé věty, dokumenty ale také obrázky či ukázky kódu [14].

Proces organizace znalostí jako hledání matematických vztahů vnímám jako zcela legitimní přístup, který bychom měli aktivně zahrnovat do teorie organizace znalostí. Pokusil jsem se nastínit, že se nemusí jednat pouze o doplňující disciplínu přinejmenším z toho důvodu, že dnes tuto perspektivu zkrátka nelze opomíjet. Neznamená to však, že bychom tento přístup měli vnímat vymezeně vůči tradičním přístupům. Toto vymezení je užitečné pro komunikaci posunu ve vnímání procesů organizace znalostí což je částečně i smyslem tohoto textu. V teorii i praxi organizace znalostí bychom měli usilovat o syntetizující pohled, který pojme a zváží kompromisy různých přístupů k organizaci. Těžko se v době rozmachu AI obejdeme od lidského vstupu, který unikátními limity vlastního těla a vědomí konečnosti vnáší do organizace dimenzi smyslu a nelze vždy předpokládat, že je smysl vždy dobře obsažen v samotných jednotkách, které organizujeme. Na druhou stranu se ocitáme v nebývalé situaci pokud jde o množství dat, potřebu je třídit a nalézat nové inovativní znalosti. Jak máme přistupovat k organizaci znalostí, když máme k dispozici stále dostupnější technologie a nebývalý výkon?

„Představte si, že sedíte v právě přilétajícím letadle. Kdybyste se mohli podívat očima autopilota, viděli byste ne jedno, ale miliony přistání, všechna překrývající se najednou. Minulá přistání na Newark. Minulá přistání Boeingů na jiných letištích, v různých časech a povětrnostních podmínkách. Tyto miliony přistání by poskytly kontext vašemu současnému skutečnému přistání a informovaly autopilota o nejlepším způsobu, jak se přiblížit k přistávací dráze. Věděli byste, co je normální, co je anomálie, jaké známé problémy v této situaci existují, kdy je řešit a kdy přistání přerušit. To je to co, „vidí“ algoritmus a jak se učí s každým novým přistáním po celém světě. Vidíte snad vy miliony přistání, které vás obklopují, když sedíte letadle?“ [10] .

Reference

[1] Josef Schwarz, ‘Organizace znalostí - Teleologický princip | Princip semiózy’, 2022.

[2] H. Kučerová,Organizace znalostí: klíčová témata. Univerzita Karlova: Nakladatelství Karolinum, 2017.

[3] J. Qin, ‘Knowledge Organization and Representation under the AI Lens’,Journal of Data and Information Science, vol. 5, no. 1, pp. 3–17, Feb. 2020, doi: 10.2478/jdis-2020-0002.

[4] B. Hjørland, ‘What is Knowledge Organization (KO)?’,KO, vol. 35, no. 2–3, pp. 86–101, 2008, doi: 10.5771/0943-7444-2008-2-3-86.

[5] D. Harper, ‘ontology’,Etymonline.com. https://www.etymonline.com/word/ontology

[6] Aristotelés,Kategorie. OIKOYMENH, 2018.

[7] G. Lakoff and D. Lukeš,Ženy, oheň a nebezpečné věci: co kategorie vypovídají o naší mysli, Vyd. 1. Praha: Triáda, 2006.

[8] C. Holstrom, ‘Social Tagging: Organic and Retroactive Folksonomies’, inProceedings of the 18th ACM/IEEE on Joint Conference on Digital Libraries, Fort Worth Texas USA, May 2018, pp. 179–182. doi: 10.1145/3197026.3197065.

[9] A.-M. Willis, ‘Ontological Designing’,Design Philosophy Papers, vol. 4, no. 2, pp. 69–92, Jun. 2006, doi: 10.2752/144871306X13966268131514.

[10] F. Doušek, ‘Seeing the Invisible (And How to Think About Machine Learning)’,10-Year Horizon, Dec. 07, 2021. https://dousek.substack.com/p/invisible (accessed Feb. 05, 2023).

[11] Kristýna Kantková, ‘Filip Doušek: VŠE jsem studoval jako odpočinek’, 9 2021. http://www.ilist.cz/clanky/filip-dousek-vse-jsem-studoval-jako-odpocinek (accessed Feb. 05, 2023).

[12] R. R. Souza, D. Tudhope, and and M. B. Almeida, ‘Towards a Taxonomy of KOS: Dimensions for Classifying Knowledge Organization Systems’,KO, vol. 39, no. 3, pp. 179–192, 2012, doi: 10.5771/0943-7444-2012-3-179.

[13] T. Mikolov, K. Chen, G. Corrado, and J. Dean, ‘Efficient Estimation of Word Representations in Vector Space’. arXiv, Sep. 06, 2013. doi: 10.48550/arXiv.1301.3781.

[14] Q. V. Le and T. Mikolov, ‘Distributed Representations of Sentences and Documents’. arXiv, May 22, 2014. doi: 10.48550/arXiv.1405.4053.