文献综述(或调研报告)
因为网络的不断发展,网络设备的数量变得异常庞大,随之而来的则是网络设备的配置工作变得愈发困难。网络配置的困难不仅是因为来自不同供应商的网络设备,还因为来自相同供应商不同版本的网络设备。物联网的卓越发展同样为网络设备的异构性做出了很大的贡献。网络配置协议(NETCONF)是一项新兴的网络协议,它用YANG数据模型来描述配置网络元素[1]。
如今的网络是异构网络,这样的一个网络包含来自不同供应商的各种版本的设备,所以它们有不同的语法和命令。网络设备存在2种异构性:
- 供应商中的异构性:由于没有配置数据的语法和命令标准,所以每个供应商的设备都有不同的语法,因此要配置这些设备,必须使用其自带的语法和命令手动配置它们。
- 相同供应商不同版本设备的异构性:不仅仅在供应商之间存在差异,来自相同供应商的不同版本的设备也有不同的语法,这也就导致了异构性,可能有两个来自同一厂商的设备但是有不同的语法,因为它们不同的版本。
而解决这类问题的基本思想是找出等价的部分,并将它们当作是同一内容,这样就将两个不同语法和命令编写的配置信息相适配。
虽然NETCONF没有一种统一的建模语言,但是YANG模型可读性和可理解性都很强,和同类的建模语言如XSD等相比更能让人接受,更不用说YANG还支持NETCONF所需要具备的特征。因此YANG被广泛的使用,在参考文献[6]中,作者提出了基于YANG语言规范生成网络知识本体的基本原则和构建方法,在本课题中也将以此方法来进行YANG模型的网络知识图谱化。从知识层面统一描述YANG模型,通过这种方式解决网络大数据的异构性问题。
在面对这样的复杂网络时,不同的供应商或者是同一供应商的不同版本配置信息,所建立的YANG模型也存在差异。而我们希望可以用某一套YANG模型就能够对大部分设备进行配置,这也就是本课题希望达成的目标。网络知识图谱可以让我们更直观的了解YANG模型,而且我们也可以通过对网络知识图谱进行融合,将不同的YANG模型相适配。
知识融合是本课题解决YANG模型适配所采取的手段,而且中面临的主要技术挑战主要有两大类,分别是数据质量方面和数据规模方面,具体如下[10]:
- 数据质量的挑战:
命名模糊,数据输入错误,数据丢失,数据格式不一致,缩写等;
- 数据规模的挑战:
不再仅仅通过名字匹配,多种关系,更多链接等。
其中较为关键的部分在于通过计算属性相似度以及实体相似度进行记录链接。对于属性相似度,我们可以使用编辑距离(基于字符)、集合相似度计算和基于向量的相似度计算。而对于实体相似度计算,我们可以使用基于聚类的方法(层次聚类,相关性聚类,Canopy K-means)以及基于知识表示学习的方法。
以上是文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。