15926

Sep. 19th, 2014 12:24 pm
109: (animated-1)
[personal profile] 109
скачал левенчуковский редактор 15926, потыкал в него. в процессе возникло несколько мыслей, как по поводу собственно редактора, так и вообще.

1. текст: это пока что не human-readable. [hasSubclass for posccaesar.org/rdl/RDS905886631 : Specialization], really? вместо: [TANK is FLUID STORAGE DEVICE], а уж все остальные детали мелким шрифтом или в отдельной панели.

2. графика: представление в виде дерева is just wrong. не надо даже пытаться. ну 2014 год на дворе, можно же уже динамический граф нарисовать на экране.

3. рассматривая данные, пришёл к выводу, что модель subject-predicate-object не работает. или, другими словами, работает плохо. потому что subject сам по себе обычно не определён или определён плохо. например, слово TANK может означать совершенно разные вещи в разных контекстах. то есть -predicate-subject должно прилепляться не к subject, а к subject-in-context. как замоделировать subject-in-context? ну вот, например, очень похожая идея в ворднете называется synset. это позволит сразу избавиться от 90% шума, генерируемого нерелевантными предикатами в модели triples.

4. мне сейчас скажут, что задачей всех этих owl, rdf, triples, и проч. является data integration, а не то, что я подумал. а я скажу, что, во-первых, неправда - декларируемая "большая цель" - это knowledge representation, и текущий подход сильно смахивает на dead end. а во-вторых, самое интересное-то зачем нужен knowledge representation - это natural language processing, AI, smart interfaces. а просто две системы интегрировать - это программисты и так захардкодят как-нибудь худо-бедно.

(no subject)

Date: 2014-09-19 08:39 pm (UTC)
From: [identity profile] ignik.livejournal.com
Я не понимаю, зачем всё это хозяйство на странном рожается. 15926 как бы сам намекает про клиент-серверную ориентацию тулзы. Чудные дела ихуейные.

(no subject)

Date: 2014-09-19 08:57 pm (UTC)
From: [identity profile] 109.livejournal.com
> про клиент-серверную ориентацию

чё-то я вообще не понимаю, о чём ты, если честно.

(no subject)

Date: 2014-09-19 09:03 pm (UTC)
From: [identity profile] ignik.livejournal.com
Ребята в несколько рыл бацают странный софт под windows под стандарт, по сути работающий на уровне open data. Я понямаю, что "им так удобнее", но не понимаю что мешало тупо взять web интерфейс, внешнюю базу и нарисовать большую часть на хранимых в базе процедурах. Понятно, что в каждой игрушке свои избушки... Я давеча в сторону ckan смотрел (да, это из другой области, но тоже обработка) и потихоньку сравниваю.

(no subject)

Date: 2014-09-19 09:38 pm (UTC)
From: [identity profile] sasha-gil.livejournal.com
так а что, у всех этих owl, rdf, triples принципиальных различий нет? Их адепты наверняка друг с другом спорят, что правильнее / удобнее (я поверхностно темой интересовался по работе, но у меня был UI-й конец сильно далеко от собственно хранимой на сервисе семантики).

(no subject)

Date: 2014-09-19 10:19 pm (UTC)
wizzard: (Default)
From: [personal profile] wizzard
я за графы скажу. опенсорсных либ нет, клозедсорсные скорее всего давит жаба покупать лицензии, ибо адекватных ровно две (Go $5000 за платформу, yFiles $35000 + сколько-то за платформу), и изменения ситуации не предвидится, потому что на коленке такая либа не пишется :-)

(no subject)

Date: 2014-09-19 10:22 pm (UTC)
wizzard: (Default)
From: [personal profile] wizzard
и да, я не сильно верю в онтологии потому что они предусматривают Обьективную Upper Ontology, но задача быстрой интеграции всегда есть, и попытки сделать ее доступной для "двух инженеров из двух разных контор без привлечения программистов" это, в целом, благо.

SPO работает плохо, контексты нужны, это тоже верно. ну то есть это как на ассемблере писать. и дерево это тоже в некотором смысле "я его слепила из того что было".

(no subject)

Date: 2014-09-19 11:36 pm (UTC)
From: [identity profile] 109.livejournal.com
у нас ещё в 2009 чувак написал front end с графами на какой-то микрософтовской либе. на силверлайте, вроде. не верю что она клозедсорсная.

(no subject)

Date: 2014-09-19 11:46 pm (UTC)
wizzard: (Default)
From: [personal profile] wizzard
она тоже платная, хотя вроде там что-то разумное, типа $500

но щас линки как на триал так и на buy битые

(no subject)

Date: 2014-09-19 11:48 pm (UTC)
From: [identity profile] 109.livejournal.com
> Upper Ontology

я, собственно, о том же. из педивикии: WordNet, for instance, is successful and useful precisely because it does not pretend to be a general-purpose upper ontology

то есть я не верю в language-independent upper ontology, а так-то почему бы и нет.

но мой главный пойнт в том, что без различения того, что в ворднете называется term или lemma, и того, что называется sense, или synset, никак не обойтись.

(no subject)

Date: 2014-09-20 12:07 am (UTC)
From: [identity profile] 109.livejournal.com
ну вроде owl - это rdf 2.0, а triples - это детали их имплементации, как-то так. и сама по себе эта фигня примерно равномощна реляционной алгебре. то есть что угодно можно замоделировать и relationally, и semantically. и даже автоматически транслировать туда-сюда. мои претензии, скорее, заключаются в том, что для knowledge representation ни тот, ни другой не очень подходят, хотя именно для этого и создавались. с одной стороны, too generic, с другой - нет таких базовых вещей, как, например, различия между lemma и synset, говоря ворднетовским языком.
Edited Date: 2014-09-20 12:10 am (UTC)

Profile

109: (Default)
109

March 2019

S M T W T F S
     12
3456789
101112131415 16
17181920212223
24252627282930
31      

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags