109: (animated-1)
109 ([personal profile] 109) wrote2014-09-19 12:24 pm
Entry tags:

15926

скачал левенчуковский редактор 15926, потыкал в него. в процессе возникло несколько мыслей, как по поводу собственно редактора, так и вообще.

1. текст: это пока что не human-readable. [hasSubclass for posccaesar.org/rdl/RDS905886631 : Specialization], really? вместо: [TANK is FLUID STORAGE DEVICE], а уж все остальные детали мелким шрифтом или в отдельной панели.

2. графика: представление в виде дерева is just wrong. не надо даже пытаться. ну 2014 год на дворе, можно же уже динамический граф нарисовать на экране.

3. рассматривая данные, пришёл к выводу, что модель subject-predicate-object не работает. или, другими словами, работает плохо. потому что subject сам по себе обычно не определён или определён плохо. например, слово TANK может означать совершенно разные вещи в разных контекстах. то есть -predicate-subject должно прилепляться не к subject, а к subject-in-context. как замоделировать subject-in-context? ну вот, например, очень похожая идея в ворднете называется synset. это позволит сразу избавиться от 90% шума, генерируемого нерелевантными предикатами в модели triples.

4. мне сейчас скажут, что задачей всех этих owl, rdf, triples, и проч. является data integration, а не то, что я подумал. а я скажу, что, во-первых, неправда - декларируемая "большая цель" - это knowledge representation, и текущий подход сильно смахивает на dead end. а во-вторых, самое интересное-то зачем нужен knowledge representation - это natural language processing, AI, smart interfaces. а просто две системы интегрировать - это программисты и так захардкодят как-нибудь худо-бедно.

[identity profile] ignik.livejournal.com 2014-09-19 08:39 pm (UTC)(link)
Я не понимаю, зачем всё это хозяйство на странном рожается. 15926 как бы сам намекает про клиент-серверную ориентацию тулзы. Чудные дела ихуейные.

[identity profile] 109.livejournal.com 2014-09-19 08:57 pm (UTC)(link)
> про клиент-серверную ориентацию

чё-то я вообще не понимаю, о чём ты, если честно.

[identity profile] ignik.livejournal.com 2014-09-19 09:03 pm (UTC)(link)
Ребята в несколько рыл бацают странный софт под windows под стандарт, по сути работающий на уровне open data. Я понямаю, что "им так удобнее", но не понимаю что мешало тупо взять web интерфейс, внешнюю базу и нарисовать большую часть на хранимых в базе процедурах. Понятно, что в каждой игрушке свои избушки... Я давеча в сторону ckan смотрел (да, это из другой области, но тоже обработка) и потихоньку сравниваю.

[identity profile] sasha-gil.livejournal.com 2014-09-19 09:38 pm (UTC)(link)
так а что, у всех этих owl, rdf, triples принципиальных различий нет? Их адепты наверняка друг с другом спорят, что правильнее / удобнее (я поверхностно темой интересовался по работе, но у меня был UI-й конец сильно далеко от собственно хранимой на сервисе семантики).

[identity profile] 109.livejournal.com 2014-09-20 12:07 am (UTC)(link)
ну вроде owl - это rdf 2.0, а triples - это детали их имплементации, как-то так. и сама по себе эта фигня примерно равномощна реляционной алгебре. то есть что угодно можно замоделировать и relationally, и semantically. и даже автоматически транслировать туда-сюда. мои претензии, скорее, заключаются в том, что для knowledge representation ни тот, ни другой не очень подходят, хотя именно для этого и создавались. с одной стороны, too generic, с другой - нет таких базовых вещей, как, например, различия между lemma и synset, говоря ворднетовским языком.
Edited 2014-09-20 00:10 (UTC)
wizzard: (Default)

[personal profile] wizzard 2014-09-19 10:19 pm (UTC)(link)
я за графы скажу. опенсорсных либ нет, клозедсорсные скорее всего давит жаба покупать лицензии, ибо адекватных ровно две (Go $5000 за платформу, yFiles $35000 + сколько-то за платформу), и изменения ситуации не предвидится, потому что на коленке такая либа не пишется :-)

[identity profile] 109.livejournal.com 2014-09-19 11:36 pm (UTC)(link)
у нас ещё в 2009 чувак написал front end с графами на какой-то микрософтовской либе. на силверлайте, вроде. не верю что она клозедсорсная.
wizzard: (Default)

[personal profile] wizzard 2014-09-19 11:46 pm (UTC)(link)
она тоже платная, хотя вроде там что-то разумное, типа $500

но щас линки как на триал так и на buy битые
wizzard: (Default)

[personal profile] wizzard 2014-09-19 10:22 pm (UTC)(link)
и да, я не сильно верю в онтологии потому что они предусматривают Обьективную Upper Ontology, но задача быстрой интеграции всегда есть, и попытки сделать ее доступной для "двух инженеров из двух разных контор без привлечения программистов" это, в целом, благо.

SPO работает плохо, контексты нужны, это тоже верно. ну то есть это как на ассемблере писать. и дерево это тоже в некотором смысле "я его слепила из того что было".

[identity profile] 109.livejournal.com 2014-09-19 11:48 pm (UTC)(link)
> Upper Ontology

я, собственно, о том же. из педивикии: WordNet, for instance, is successful and useful precisely because it does not pretend to be a general-purpose upper ontology

то есть я не верю в language-independent upper ontology, а так-то почему бы и нет.

но мой главный пойнт в том, что без различения того, что в ворднете называется term или lemma, и того, что называется sense, или synset, никак не обойтись.