Keven’s Blog 数图研究

十月 13, 2005

解释Annotation

类归于: 未分类 — keven @ 11:30 下午

明?朋?问:

请问这里的annotation作何解?仅仅是置标??解决信?系统语义异构的方案中,为什么?对资?进行标注呢??是对资?的什么进行标注呢(是对??映资?内容的主题进行自动标注?)?

我明白?对资?进行标注,?是?太清楚?标注哪些东西?如何自动标注,呵呵。

简答如下:

Annotation to an elephant by different perspectives 我 们?以将Annotation(资?标注)直观地?解为标引,?进行字段检索(高级检索)就必须进行标引,使信?资?结构化。由此??, annotation与置标(?Markup或称编?Encode)还是有一些区别的,annotation?以对已?置标的东西?,例如对用HTML语 言置标的网页进行标注,标注也?以用任何语言/标签,??你的应用系统能够识别。而且标注?以附带在原件上,也?以?独存在?指?原件。并且一个信?资? ?以有多?标注。

标引是??高检索效果(查全/查准)的最好办法,?过标引的信?资??以认为是结构化的,结构化实际上是一?有?化。 标注的基本目的就是使信?资?产生一??观上的秩?,使得人能够按照??目的?纵资?。语义标注就是?示信?资?语义结构?使信?资?在语义上“有??的 一?方法。我们用DC标注/标引了网页,就能够结构化地检索它们,我们用OWL写的本体标注了一个网站,我们就能够按照??关系?层次结构展示网站中?组 /?类实体的关系。

如何进行标注??图书馆的人认为?以在数字资?生产(或模拟资?数字化)的时候人工/自动添加元数?,进行标注。 而计算机专家?信这一套。一是?现实。??能?求大家都承担这样的?外负担,?使大家都?了也会由于??原因而?乱无章,甚至?能??而加大了信?熵,乱到 还?如?标注(特别是因为Spam)。这也是为什么DC元 数?没能应用于网页和?索引擎的主?原因。二是??能。对?样的信?资???的人?解的角度??,能够满足??的信?需求,事先的标引无论如何??能完全 满足未?的信?需求。而且计算机专家们总是相信冥冥之中会有?为人察觉的“秩???以通过??高阶函数关系?示出?,什么??啊概率啊等等,仿佛洞悉了上 ?掷骰?的规律,信?体的“秩??就是一组??的公?(例如Google的Pagerank算法)。这是简?通过事先的标注所永远??到的。

(全文…)

Blog at WordPress.com.