什么是语义网?
我已经听说了很多有关语义networking的知识,但是我仍然不确定它是什么。 这与现在我们所知道的networking有什么不同?
这与现在我们所知道的networking有什么不同?
现在,HTML + CSS更多地集中在结构和performance上。 语义是关于信息的含义 。 在语义networking中,您使用共享本体来build立对象之间关系的含义(语义)和关系的含义。 最有名的本体是: FOAF和都柏林核心 。
典型的语义会用专门的语言expression,如RDF或OWL 。 RDF可以使用eRDF或W3C的RDFaembedded到XHTML中。
对于eRDF / RDFa较less结构化的替代scheme是微格式 。
阅读更多: http : //en.wikipedia.org/wiki/Semantic_web
最好的解释是通过例子。 尝试使用search引擎小于2.0升的无铅汽油广告上的所有汽车的search ,并有一个MP3连接,可以在我的房子方便地从公共交通可以看到的展厅中看到。
谷歌将无法帮助您的查询,而不是真的。 您必须进行多次search并自己关联结果。 在语义网上,您可以expression对汽车销售产品的兴趣,并添加约束条件。 每个结果都是有用的。 一个或多个用户界面可以使你做到这一点,有些可能是专门的,有些则完全一般。
另一个例子是,创build一个通常不存储在一个地方的图表,比如饮食焦炭的普及程度,或者国家在人群中的stream行程度,而不是在相同人群中的临床肥胖程度。 对于这些,您可能根本不使用Web浏览器,但可能使用更像Excel的东西 – 但是语义Web为您提供了工具(SPARQL,RDF),用于查找并处理那些可通过HTTP访问的数据。
所以Bravax提出的观点并不完全正确,不会有太多变化 – 你可能只会得到一些更有用,更好的mashup网站。 或者你可能会发现自己在今天之前做了许多你从来没有想过的与networking相关的东西。
目前的networking有很多替代品可以做同样的事情,例如animationGIF,Flash,Silverlight,DHTML等等。为了把数据放到语义网上,将会有一系列的工具和格式。 RDFa是一个比较普遍的微格式types,但是您可以提供整个数据库的转储 ,公开SPARQL端点 ,使用微格式或专有HTML结构并添加转换 ,将会有许多工具来适应不同的工具案例。
所以Vartec也是部分正确的,你可以使用RDFa和eRDF,但是你也可以使用很多其他的东西来发布数据。
请注意,语义networking和另一个称为关联数据的模拟概念之间存在很多重叠。 它们之间的相互关系并不清楚,但是我的理解是,关联数据networking是您在语义网工具和技术有任何需求之前所需要的。 关联数据是关于数据的,语义网更多是关于处理数据,推理和处理诸如信任可靠性等问题。 本质上是技术栈的底层。
语义Web的核心是一个非常简单的想法。 (像所有的好的。)
目前的networking由包含链接的文档组成。 谷歌已经做了一个相当不错的业务,使用上下文,锚链接的文本,找出链接的意思,并build立一个引擎检索数据的基础上。 换句话说,Google猜测链接的语义是什么。
语义网的想法是“如果这些链接是键入? Web上的每个事实都得到一个地址(一个URI),并通过关系( 也称为URI)链接到其他事实(也称为URI)。 关系组被称为“本体论”。
因此,而不是页面A链接到页面B,就像在当前网页上,语义网上的链接更像是:
URI通过typesURI C的链接到URI B的链接
任何东西都可以有一个URI。 人们可以拥有URI; 通常我们使用一组称为FOAF的关系来描述它们。 所以我们假设Jeff Atwood的URI是http://codinghorror.com/foaf.xml ; 那么你可以说:
< http://codinghorror.com > < http://xmlns.com/foaf/0.1/homepage > < http://codinghorror.com/foaf.xml >
即http://codinghorror.com是由http://codinghorror.com/foaf.xml的内容表示的人的主页。;
现在机器可以读取和查询这些关系 – 所以你把Web变成一个数据库,计算机可以立即做些事情。 语义Web查询语言是SPARQL,值得一试。
语义网就是这样 – 一个WWW顶部的语义(有意义的)层。 它是半结构化的(RDF),它是自描述(使用OWL的本体),并允许资源发现(SPARQL)。
语义网在“开放世界”假设的前提下工作, 只是因为有些东西没有说出来并不意味着它不存在,而只是“未知”。 这与MySQL等人在RDBMS中使用的逻辑是截然不同的逻辑。 – 如果有什么东西是不存在的 – “封闭世界”的假设。 Prolog和DATALOG是closures世界逻辑的好例子。
如果你想真正了解下面发生的事情,你需要看看它的基础,这就是说明逻辑。 描述逻辑的一个很好的概述可以在这里find: http : //www.inf.unibz.it/~franconi/dl/course/
如果您想了解更多关于RDF的信息,请阅读RDF入门书 。 RDF语义学是另一个咆哮的阅读。
研究人员基本上放弃了语义网的“语义”部分,并决定把重点放在关联数据上 – 如何导航RDF三元组,以便浪费更多的互联网带宽;-)
目前在HTML页面中,我们有标记标签来描述应该如何显示内容, <b>
, <pre>
等。这些标签对其内容没有任何意义。
语义网的概念是文档将包含对其内容有意义的XML标签。 例如<person><firstname>
。 macros伟的想法是,CSS将能够格式化这些文件,但也可以从这些文件中轻松地提取有意义的信息。
语义网是万维网的发明者蒂姆·伯纳斯·李(Tim Berners-Lee)的真正意图在于networking – 也就是全球互联数据图。 这是一个社交图的泛化 ,您可以在其中使用社交数据(使用FOAF等词汇表)以及任何其他types的机器可理解的数据,并将它们相互连接起来。 用于向机器描述这种infortmation的标准格式是资源描述格式( RDF )和Web本体语言( OWL )。 网上已经有很多编码数据,包括维基百科的RDF版本,叫做DBPedia 。
语义网将和今天的networking不同,即计算机以及人类将理解文档包含的内容以及文档之间链接的重要性。 这将促进信息处理任务的自动化,包括研究来自可靠来源的信息。 完整的SemWeb堆栈包括密码学,certificate系统和信任networking。
蒂姆·伯纳斯·李 ( Tim Berners-Lee)在他的博客“ 巨人全球图表” ( Giant Global Graph)中 (来自2007-11-21)
三个心理动作:
- 互联网 :“不是电缆,是有趣的电脑”
- ( 万维网 ):“这不是电脑,而是有趣的文件”
- 巨大的全球图 :“这不是文件,它是关于哪些是重要的东西”
关于“巨人全球图”一词:
我们现在可以使用Graph这个词来区分Web。
我把这个图表称为语义网,但也许它应该是巨人全球图! 比WWWW还差? ;-)不是“语义网”这个术语长期以来就没有build立起来,我不打算改变它。 但是,让我们来思考它是什么图。 (脚注:“图”也恰好是RDF规范使用的词,但顺便说一句,当XMLparsing器创build一个DOM树时,RDFparsing器会在内存中创build一个RDF图。
语义网是迄今唯一提出的解决万维网固有devise缺陷的实用解决scheme。 因为互联网的devise者,正如我们今天所知道的那样,并没有提供解决人类思维和沟通方式的基本语言现象的机制,例如同名,同义词等。在互联网上search信息导致大量虚假阳性。 语义网的概念归结为为Web资源分配明确的标识符,这将有助于正确识别它们的含义。 如果有一天成功了,我们可能会忘记通常的谷歌search是什么样子,如果失败了,所有的东西都会保持现在的样子。
吸引人们的兴趣是一个stream行词,与Web 2.0相似
也就是说,未来的内容将会从演示中分离出来,从而带来更多的好处。
事实上,事实将是主观的,取决于主人的可靠性和权威性。
换句话说,用户从现在看不会有太大的区别。
语义Web是一个分布式信息系统,其中相互链接的数据通过HTTP发布为RDF三元组。 RDF三元组由主体,谓词和对象组成,但可以附加其他东西,如关于对象的自然语言的数据types和注释。 在语义网上,URI被用作标识符和networking资源的地址。
它不同于Web,因为Web是文档和应用程序接口的分布式信息系统。