基于服务数据挖掘的DNS性能优化的方法研究

浙江工业大学硕士学位论文基于服务数据挖掘的DNS性能优化的方法研究作者姓名:苏珊珊指导教师:陈庆章教授浙江工业大学信息工程学院2010年10月16日 ,Dissertati

浙江工业大学硕士学位论文

基于服务数据挖掘的DNS性能优化的方法研究

作者姓名:苏珊珊

指导教师:陈庆章教授

浙江工业大学信息工程学院

2010年10月16日

,

DissertationSubmittedtoZhejiangUniversityofTechnology

fortheDegreeofMaster

Service--basedDataMiningMethodforDNS

PerformanceOptimizationCandidate:ShanShanSuAdvisor:QingZhangChenCollegeofInformationEngineeringZhejiangUniversityofTechnology

oct16,2010

,

浙江工业大学

学位论文原创性声明

本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。

作者签名:0知沁卵日期:>olo年f渺日

学位论文版权使用授权书

本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

本学位论文属于

1、保密口,在年解密后适用本授权书。

2、不保密叭

(请在以上相应方框内打“√”)

作者签名:

导师签名:日期:卯j牟1"7,-月嘶p耖I胡z胡日期:如t声,V●一

,

基于服务数据挖掘的DNS性能优化的方法研究

摘要

域名系统是互联网中最重要的基础设施和中枢神经系统,它的服务质量是衡量互联网服务提供商服务品质的重要参数。随着因特网用户规模的发展,域名系统日益成为保障整体网络结构正常运作最为重要的部分之一。域名系统的故障会直接造成用户无法访问网络资源,所以各大网络运营商越来越重视域名系统安全问题。同时随着用户规模的发展,域名系统的服务容量扩充问题也摆在了各大运营商面前,对域名系统如何进行扩容,何时扩容,而扩容的依据又是什么?都是需要重视和解决的问题。

传统的依靠人工评估来实现域名系统扩容和性能优化的作法,常常会出现要么满足不了实际需求,不得不再次扩容,要么是扩容余量太大,造成资源浪费。为实现以客观依据为基础的域名服务系统规划和性能优化,本研究采用数据挖掘技术对某电信运营商城域网内现有域名服务系统的数据进行深度处理,对其承载特性进行量化分析。通过对DNS系统的解析请求进行完整地采集、统计和挖掘,,获知域名系统负载的总量、时域特征、解析对象及宽带拨号用户负载的地域分布,精确地量化DNS服务器网络流量及承载能力。通过数据挖掘和量化分析,针对原有公共域名服务系统采用传统的单机单地址结构,系统存在多故障隐患点、抗攻击能力弱、服务可用性低、服务器负载调控手段有限等一系列问题,给出DNS优化的方案。

本研究主要工作和贡献是:

1.针对DNS系统的解析请求,采用SNMP工具和SYSLOG服务器分别对域名服务器的流量和日志进行全量数据采集,并对服务数据进行挖掘。首次提出以量化方法标定某电信运营商DNS服务系统的承载能力,确定DNS系统的服务承载模型。

2.建立以Anycast为技术基础的DNS服务系统,在增强系统可靠性和可扩展性的同时保持用户界面的唯一性。根据数据挖掘分析结果,给出DNS服务系统优化方案,使得单台服务器吞吐量,单机解析成功率,平均解析延时等指标都得到大幅度提高。

3.重新设计DNS服务系统的安全防护体系,在确保系统安全的同时取消原系统中的性能和可靠性瓶颈,同时全系统的抗DoS攻击模式由单机转变为集群。

,

4.建立和完善DNS服务监测系统,使该系统不仅覆盖原有网管软件的所有监测项目,而且将覆盖原系统未覆盖的CPU负载、内存利用量、交换区利用量、系统进程数、在线时间、网络流量和硬盘空间等项目。

通过上述工作,所构建的新的DNS系统,既节省了建设资金,又提高了性能,系统的可靠性也大幅提高。通过本次项目分析结果,对系统采用安全过滤的措施,可提升10%的系统能力,节约投资8万元;另外通过本次项目得出的结果,如果合理的根据用户使用网络的特性进行区域规划,至少又可节省投资20万元。关键词:DNS,AN/CAST,数据挖掘,数据采集,OSPF,BIND,CNS,DOS,DDOS

,

SERvICE.BASEDDATAMIN矾GoPT舢ZATIoNMETHoDFoR

DNSPERFoRM喳NCE

ABSTRACT

InteractDomainNameSystemisthemostbasicinfrastructureservingasthecemtralnervoussystem,itsqualityofserviceisanimportantparameterformeasuringservicesprovidedbyInternets酬ce璐.WiththedevelopmentofbroadbandInternetuse瑙,thedomainilamesystem,theoverallnetworkstructureisincreasinglybecomingthemostimportantparttoensurethefunctioningoftheoverallnetwork.ThefailureofthedomainrlRmesystemwillleadtotheparalysisofthewholenetworkresultingintheunavailabilityoftheintemetresources,SOthemajorcarriersispayingincreasedattentiontothesecurityofthedomainnamesystem.Atthesametimeasthescaleoftheu翻口expands.Theintemetcal'rielsarcconfrontedwiththeexpansionofthedomiannamesystem,includinghowtoexpand,whentoexpandandwhatisthebasisofexpansion.Alltheseconcernedrequirsattentionandsolution

Toachievetheobjectiveevidence-baseddomainnameservicesystemplanningandperformanceoptimization,Thestudyemploysthetechniqueofstatisticsn洫ingtomakeain-depthhandlingoftheexistingdomainservicesystemwithintheareaofatelecommunicationsoperator.ThroughtheDNSanalysisrequests,thesystemhaveperformedacompletecollection,statisticsandminninginacquiringthetotalamountofload,time-domainfeatures,analysisandbroadbanddial—upuserstargetthegeographicaldistributionoftheloadinordertoaccuratelyquantifytheDNSservernetworktramcandloadcapacity.Basedonthedataminingandquantitativeanalysis,theoptimizationforDNSareofferedconcerningthattheoriginalpublicdomainfortheservicesystemwasinuseofthetraditionalstand-alonesingle-addressstructure,whichleadstoproblemslikemultiplefaultsofhiddenspots,weakanti—attackcapability,lowserviceavailability,limitedserverload-controlmeans.

Theresearchfocusandthemaincontributionofthisstudyareasfollows:

1.InaccordancewiththeDNSrequirment,thesystemuseSNMPtools,andSYSLOGdomainnameservertraffic,respectively,tocollecttheoverallflowrateandlogandtomineservicedataMethodwasfirstproposedtoquantifythecalibrationofaDNSservicecarrierscarryingcapacityofthesystemtodeterminetheDNSsystem,theserviceloadmodel.

2.Toestablishtechnology-basedAnycastforDNSSclwicesystem,aindngforenhancingsystemreliabilityandscalabilitywhilemaintainingtheuniquenessoftheuser'sinerface.DNS

,

ser以cesystemopftmizationprogramisgivenOnthebasisoftheoutcomeofdatamining,aUowingtheimprovementofthethroughputofasingleserver,singleresolutionSUCCESSrate,averagedelayandothertargets.

3.Tore-designtheDNSSCt'vic,esystemsecurityprotectionsystemtoensuresystemsecuritywhilecanceltheobstaclesintheoriginalsystemperformanceandreliability,meanwhilesystem-wideanti—DoSattackpatternswillshiftfromstand-alonedusterstothegroupdusters.

4.ToestablishandimprovetheDNSservicemom'toringsystem,SOthatthesystemwillnotonlyCOVel"sanoftheexistingnetworkmanagementsoftwareformonitoringprojects,andwillalsoCOVeI"theCPUload,memoryutilization,swaputilization,thenumberofsystemprocesses,on-linetime,networktra伍canddiskspaceandotherprojectsthattheoriginalsystemWaSnotabletoCOVeI'.

Throughtheaboveefforts,thenewDNSsystemconstmctgdwillnotonly姗capitalbutalsoimproveperfor-dmueeandreliabilityofthesystem.Theoutcomeoftheprojecthasdearlyshowsthepurposeoftheu母e培forusingtheintemetwithintheurbannetwrk,whichhasprovidedobjectiveevidenceforthebuildingofthecontentsandchoiceofthe球IrI嬲ininformationservice.BasedOntheresultsoftheresearch,Weproposesafefilteringforthesystemin纽efforttoupdate10%ofthesystem’seapabifityandtosaveinvestmentof∞,000.Inaddition,anotherconclusionhasbeendrawnfromtheprojectthatisanother20,000callbesavedifthelocalplanningisachievedaccordingtothepropertiesofusers’susingintemet.

KeyWords:dm,anyeast,Datamining,dataacquisition,ospf,bind,c璐,dos,&los

,

目录

摘要S第1章绪论.1l1.1域名系统的概念…………………………………………………….1l1.2针对域名服务器的数据挖掘……………………………………………。l41.3相关研究工作………………………………l61.4用户背景及现状分析……………….l71.5论文目标及组织结构………….l8第2章针对电信运营商的数据挖掘知识介绍2O2.1电信运营商数据挖掘现状简介………………………….

2.2数据分析处理现状…202.3数据挖掘方法及步骤…………。2l2.4统计学与数据挖掘…………………………~……………………222.5小结…………………………………………………………….

第3章域名系统的统计分析.~。…….一—。.。

3.1域名系统的性能指标构成……………………

3.2域名系统负载的总量分析………。

3.2.IDNS负载来源的用户群分布…………………………………~…….……….263.2.2单台服务器负载分析……………………。

3.3域名系统的时域分析………………………

3.3.1域名系统负载的时域特性………………………………….293.3.2各类用户DNS解析量的时域特性…………

3.3.3上网高峰期DNS负载来源……………………………………………….323.4解析对象的地域分析………………………………………………。……………………333.4.1宽带拨号用户负载的地域分布特性……………………………………………………333.4.2解析对象及解析类型……………………………………….…….343.5域名系统网络流量及承载能力分析………...

3.5.1DNS服务器网络流量…………………………。

3.5.2DNS服务器CPU负载……………………..363.5.3

3.6

第4章

4.1

4.2

4.2.1

4.2.2系统结构………………j………………一….…484.2.3服务收敛速度…………。…50

,

4.2.4服务器集群内的解析负载均衡……………………………………………………5l4.3域名服务器的软件评估……………………………………………534.3.1评估策略及评估环境………………………………。

4.3.2评估结果.

4.3.2.1功能对比……………………~………….

4.3.2.2基本性能参数………………

4.3.2.3ACL对性能的影响….

4.3.2.4压力测试…………….

4.3.2.5在线测试……………

4.3.3评估结果总结…………………………………………………….

4.4域名服务器软件性能优化…。

4.4.1城域网DNS系统的用户承载能力………。

4.5域名系统安全优化设计……………….…………………。634.5.1系统监测………………………………………………………。…………………。634.5.2安全防护……………………………………………

第5章总结与展望….....一…——……—一。一一—一—一。——。—一二……。—~。67

l;I|蜀乏....一...。。........。....一..……。。——……...……。。…......一。。...............——.。。..。。..............7jI致谢78攻读学位期间参加的科研项目和成果79

,

浙江工业大学硕士学位论文

第1章绪论

1.1域名系统的概念

1.1.1域名系统

域名系统(DNS)的主要作用是将以字符形式可以简单易记的远程主机URL地址转换为口地址。在未知远程主机地址的情况下,将域名转换为口地址是互联网主机间进行通信时要经历的首要步骤。由此,域名解析服务成为互联网应用系统重要的支撑类服务,也是互联网重要的基础设施和中枢神经。

域名系统采用树形结构组织信息,一个域名是一个从根到叶子节点的路径,其构成方式是自底向上,各层域名串联组成,中间以搿.一隔开。每一级域名服务器负责管理其子节点的域名相关信息。

域名系统解析有两种工作方式:递归查询解析和迭代查询解析。

递归查询解析(RecursiveQueryResolution),是指域名解析请求要求某个域名服务器完成全部转换。递归解析请求的回答要么是要查看的P地址,要么是一个表示无此域名对应的口地址的回答。

迭代查询解析(IterativeQueryResolution),是指域名解析请求要求每一次联系一个不同的域名服务器。在服务器层次间逐步寻找一个管辖该域名的服务器的过程,仅在服务器要解析域名时使用。

无论采用哪一种解析方式,客户机软件都将形成域名查询,然后将查询请求发送给域名服务器。域名服务器完成域名解析后,将结果返回给客户机。通常客户机上的解析器软件请求递归解析。将一个域名解析为一个对等的P地址。而当一个服务器成为另一个域名服务器的客户时,它将请求迭代解析在服务器层次间每次一层地逐层查找。

当域名服务器收到查询请求时,它首先检查解析请求中的域名是否属于它授权管理的范围。如果在管理范围之内,它就检索本地数据库把域名转换成m地址,并将解析的结果附加到查询中,然后发送给客户机。如果服务器发现到达查询请求中的域名不在自己的11

标签: