![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
скачал левенчуковский редактор 15926, потыкал в него. в процессе возникло несколько мыслей, как по поводу собственно редактора, так и вообще.
1. текст: это пока что не human-readable. [hasSubclass for posccaesar.org/rdl/RDS905886631 : Specialization], really? вместо: [TANK is FLUID STORAGE DEVICE], а уж все остальные детали мелким шрифтом или в отдельной панели.
2. графика: представление в виде дерева is just wrong. не надо даже пытаться. ну 2014 год на дворе, можно же уже динамический граф нарисовать на экране.
3. рассматривая данные, пришёл к выводу, что модель subject-predicate-object не работает. или, другими словами, работает плохо. потому что subject сам по себе обычно не определён или определён плохо. например, слово TANK может означать совершенно разные вещи в разных контекстах. то есть -predicate-subject должно прилепляться не к subject, а к subject-in-context. как замоделировать subject-in-context? ну вот, например, очень похожая идея в ворднете называется synset. это позволит сразу избавиться от 90% шума, генерируемого нерелевантными предикатами в модели triples.
4. мне сейчас скажут, что задачей всех этих owl, rdf, triples, и проч. является data integration, а не то, что я подумал. а я скажу, что, во-первых, неправда - декларируемая "большая цель" - это knowledge representation, и текущий подход сильно смахивает на dead end. а во-вторых, самое интересное-то зачем нужен knowledge representation - это natural language processing, AI, smart interfaces. а просто две системы интегрировать - это программисты и так захардкодят как-нибудь худо-бедно.
1. текст: это пока что не human-readable. [hasSubclass for posccaesar.org/rdl/RDS905886631 : Specialization], really? вместо: [TANK is FLUID STORAGE DEVICE], а уж все остальные детали мелким шрифтом или в отдельной панели.
2. графика: представление в виде дерева is just wrong. не надо даже пытаться. ну 2014 год на дворе, можно же уже динамический граф нарисовать на экране.
3. рассматривая данные, пришёл к выводу, что модель subject-predicate-object не работает. или, другими словами, работает плохо. потому что subject сам по себе обычно не определён или определён плохо. например, слово TANK может означать совершенно разные вещи в разных контекстах. то есть -predicate-subject должно прилепляться не к subject, а к subject-in-context. как замоделировать subject-in-context? ну вот, например, очень похожая идея в ворднете называется synset. это позволит сразу избавиться от 90% шума, генерируемого нерелевантными предикатами в модели triples.
4. мне сейчас скажут, что задачей всех этих owl, rdf, triples, и проч. является data integration, а не то, что я подумал. а я скажу, что, во-первых, неправда - декларируемая "большая цель" - это knowledge representation, и текущий подход сильно смахивает на dead end. а во-вторых, самое интересное-то зачем нужен knowledge representation - это natural language processing, AI, smart interfaces. а просто две системы интегрировать - это программисты и так захардкодят как-нибудь худо-бедно.