Keven’s Blog 数图研究

十月 13, 2005

解释Annotation

类归于: 未分类 — keven @ 11:30 下午

明?朋?问:

请问这里的annotation作何解?仅仅是置标??解决信?系统语义异构的方案中,为什么?对资?进行标注呢??是对资?的什么进行标注呢(是对??映资?内容的主题进行自动标注?)?

我明白?对资?进行标注,?是?太清楚?标注哪些东西?如何自动标注,呵呵。

简答如下:

Annotation to an elephant by different perspectives 我 们?以将Annotation(资?标注)直观地?解为标引,?进行字段检索(高级检索)就必须进行标引,使信?资?结构化。由此??, annotation与置标(?Markup或称编?Encode)还是有一些区别的,annotation?以对已?置标的东西?,例如对用HTML语 言置标的网页进行标注,标注也?以用任何语言/标签,??你的应用系统能够识别。而且标注?以附带在原件上,也?以?独存在?指?原件。并且一个信?资? ?以有多?标注。

标引是??高检索效果(查全/查准)的最好办法,?过标引的信?资??以认为是结构化的,结构化实际上是一?有?化。 标注的基本目的就是使信?资?产生一??观上的秩?,使得人能够按照??目的?纵资?。语义标注就是?示信?资?语义结构?使信?资?在语义上“有??的 一?方法。我们用DC标注/标引了网页,就能够结构化地检索它们,我们用OWL写的本体标注了一个网站,我们就能够按照??关系?层次结构展示网站中?组 /?类实体的关系。

如何进行标注??图书馆的人认为?以在数字资?生产(或模拟资?数字化)的时候人工/自动添加元数?,进行标注。 而计算机专家?信这一套。一是?现实。??能?求大家都承担这样的?外负担,?使大家都?了也会由于??原因而?乱无章,甚至?能??而加大了信?熵,乱到 还?如?标注(特别是因为Spam)。这也是为什么DC元 数?没能应用于网页和?索引擎的主?原因。二是??能。对?样的信?资???的人?解的角度??,能够满足??的信?需求,事先的标引无论如何??能完全 满足未?的信?需求。而且计算机专家们总是相信冥冥之中会有?为人察觉的“秩???以通过??高阶函数关系?示出?,什么??啊概率啊等等,仿佛洞悉了上 ?掷骰?的规律,信?体的“秩??就是一组??的公?(例如Google的Pagerank算法)。这是简?通过事先的标注所永远??到的。

所 以?想的annotation的 方?是利用一些人工,而尽?能地“自动?。例如除了自动抽?关键?标引之外,自动分类??类?根?相关??馈排??计算资?与资?之间的相对“语义?离?, 都?以是标注的方法,?样一个资?库?以用??的分类体系?“?视?和“关照?,形???的标注体系,从而满足人们信?查询??览的多?需求。

如果能够采用一些通用的标注方?处?信?资?,就能够达?一定的异构系统互?作,这也是“?控?标注的优点之一。

由于上述解释都是基于图书情报学的,为了更加“科学?,以下附一些对于Annotation的解释:

“A note added to anything written, by way of explanation or comment.? (OED-Online 2002)

The annotation of Web-based data by user communities is a widely used means to augment and add value to resources (Shabajee et al 2002) and there are numerous examples of different types of annotation system across the Web (see below for examples). Different types of Web-based project will require different approaches to annotation.

We refer to semantic annotation at the same time as (i) a sort of meta-data and (ii) the process of generation of such meta-data.

这里解释了annotation和semantic annotation。

这里有关于annotation的功能作用以?目??用于Web annotation的?类系统较为详细的介?。

从这些解释?以看出annotation传统上是人?给人看的,而现在用?作为信?组织(附加信?)的一?方法了。

2 条评论 »

  1. “Unfortunately no one can be told what the Matrix is. You have to see it for yourself.?
    ?幸地是没人能说清楚Matrix是什么,你?好?自己了。

    Comment 由 方言(无法浪漫) — 十月 14, 2005 @ 8:34 下午

  2. deniserichardson analysis…

    argues,meetings accelerating geranium hoped …

    Trackback 由 deniserichardson analysis — 十二月 31, 2008 @ 4:05 上午


RSS方式表示的feed TrackBack URI

留下评论

Blog at WordPress.com.