第10章 因特网
第十章 因特网-Internet1 Internet简介1.1 什么是InternetInternet是世界是最大的计算机互连网,是成千上万条信息资源的总称。这些资源以电子文件的形式,在线地分布在世界
第十章 因特网-Internet
1 Internet简介
1.1 什么是Internet
Internet是世界是最大的计算机互连网,是成千上万条信息资源的总称。这些资源以电子文件的形式,在线地分布在世界各地的数百万台计算机上;Internet 上开发了许多应用系统, 供接入网上的用户使用,网上的用户可以方便地交换信息,共享资源。Internet 也可以认为 是各种网络组成的网络,它是使用TCP/IP协议(传输控制协议/网间协议) 互相通信的数据网络集体。Internet 是一个无级网络,不专门为某个个人或组织所拥有及控制,人人都可以参 与。
1.2 Internet的发展
Internet起源于美国、现在已连通全世界的一个超级计算机互联网络。Internet 在美国分为三个层次:底层为大学校园网或企业网,上一层为地区网,最高层为全国主干网,如国家自 然科学基金网NSFnet(National Science Foundation Network)等主干网,它们连通了美国东西海岸,并通过海底电缆或卫星通信等手段连接到世界各国。
Internet是近几年来最活跃的领域和最热门的话题。而且发展势头迅猛。成为一种不可抗拒的潮流。 根据有关资料表明:到1996年上半年为止,Internet 已连接5万多个网络,500万台计算机, 拥有5000万个用户。据预测,到2000年,Internet 将连接100万个网络,1亿台计算机,拥有10亿个用户
1.3 Internet的特点
Internet之所以获得如此迅猛的发展,主要归功于如下的特点: (1)它是一个全球计算机互联网络
(2)它是一个巨大的信息资料
(3)最重要的是Internet 是一个大家庭,有几千万人参与,共同享用着人类自己创造的财富( 即资源)
,1.4Internet 的构成
如前所述,Internet 是一个网络,凡是采用TCP/IP协议并且能够与
Internet 中的任何一台主 机进行通信的计算机,都可以看成是Internet 的一部分。Internet 的网络空间可以看作是受 计算机控制的空间。Internet 采用了目前分布式网络最为流行的客户机/服务器方式,大大增强了网络信息服务的灵活性。
Internet 最初宗旨是为大学和科研单位服务。由于其信息丰富、收费低廉,目前不但已成为服务于全社会的通用信息网络,而且近年来已明显地出现了商业化的趋势。美国在Internet 骨干网的经营方面也有此趋势。美国国家科学基金会把NSFNET 的经营权交给了美国最大的三 家电信公司,即SPRINT ,MCI 和ANS 。NSFNET 也将分成SPRINTNET ,MCINET 和ANSNET 三部分, 由上述三家公司管理和经营,并建立一系列的网络存取点(NETWORK ACCESS POINT),它实际上是一个集中存放路由器的路由服务站,可为客户提供入网服务。该Internet 的网络结构如图10-1所示。
2 TCP/IP协议
TCP/IP有100多个网络传输协议,FTP 、Telnet 是两个使用得很广泛的协议。其中,最重要的两个协议是传输控制协议TCP(Tuansmission Control Protocol) 和网间互联协议IP(Interne t Protocol)。IP 协议负责按地址在计算机之间传输信息,TCP 则保证传输的信息是正确的。

2.1 TCP/IP协议的结构
TCP/IP协议的四层结构如图10-2所示。 图中的网络相当于物理传输的媒介。数据在实际传输时,每通过一层要在数据上加上一个报头,其中的数据供接收端的同一层协议使用。到达接收端时,每经过一层要把用过的一个报头去掉。这种方式可以保证接收的数据和传输的数据完全一致,以及发送端和接收端相同层上的数据都有相同的格式。
,
TCP/IP协议所采用的通信方式是分组交换方式。数据在传输时分成若干段,每个数据段称为一个分组。TCP/IP协议的基本传输单位是数据报,可以把数据看成是一封长信,分装在几个信封中邮寄出去。
2.2 TCP/IP协议的功能
TCP/IP协议在数据传输过程中主要完成以下功能:
①TCP协议先把数据分成若干数据报,并给每个数据报加上一个TCP 信封(即报头) ,上面写上数据报的编号,以便在接收端把数据还原成原来的格式。 ②IP协议把每个TCP 信封再套上一个IP 信封,在上面写上接收主机的地址。有了IP ,信封就可以在物理网络上传送数据了。IP 协议还具有利用路由算法进行路由选择的功能。
③上述信封可以通过不同的传输途径(路由) 进行传输,由于路径不同以及其他原因,可能出现顺序颠倒,数据丢失,数据重复等问题。这些问题由TCP 协议来处理,它具有检查和处理错误的功能,必要时还可以请求发送端重发。 因此,可以说,IP 协议负责数据的传输,而TCP 协议负责数据的可靠传输。
2.3 信息按TCP/IP协议的传输过程
TCP/IP是怎样工作的呢? 信息是怎样在Internet 上传送的呢?Internet 上各种网络之间是通过 路由器(Router)连接的,信息的传送是通过路由器来实现的,如图10-3所示。
,
我们把与路由器相连接的主机称为站点。一个路由器并不连接所有的站点, 它只连通相邻的站点。信息是由路由器一个一个站点传送到目的地的。路由器知道下一个站点(NextHOP)是 什么? 哪一个站点距离目的地近? 由此,路由器可决定将信息送往那儿。

路由器是怎样知道信息的目的地呢? 这就像邮寄信件要有信封、地址一样,Internet 上的信 息在传送前要加一个信息头,其中包括信息的地址,Internet 上叫IP 地址,负责Internet 地 址管理的协议叫IP 协议。由于受传输硬件的限制,长的信息是分组传送的,每组都有编号, 当信息被传送到目的地后再重新组合起来。负责将信息拆开、分组、编号、再重新组合起来 的协议叫TCP 协议。信息在每经过一层协议时需要附加一些信息,组成新的信息包。例如, 经过TCP 协议时,要附加编组号、校验码等组成TCP 包,经过IP 协议时要附加地址信息等组成 IP包。当信息被传送到目的地后再拆包,丢弃附加信息,还原为原始数据,其过程如图10- 4所示。
总之,TCP/IP是一个非常庞大的协议族,其中,最重要的两个协议是TCP 和I P。IP 负责信 息的实际传送,而TCP 则保证所传送信息的正确性。它们和其它100多个协议一起使Internet 上千万台计算机组成一个巨大的因特网,协同工作,并提供各种各样的服务。
2.4 TCP/IP协议的主要内容
TCP/IP协议的主要内容见表10-1。
,
①SMTP(Simple Mail Transfer Puotocol)-简单邮件协议,主要用来传输电子邮件。
②域名(Domain Name)-IP 地址的文字表现形式。它的实现是依靠DNS(Domain Name Service )和DSP(Domain Service Protocol)。
③FTP(File Transfer Protocol)-文件传输协议,主要用来进行远程文件传输。
④TELNET的远程登录(Renote Login)-用来与远程主机建立仿真终端。 ⑤UDP(User Datagram Protocol)-用户数据报协议。该协议可以代替TCP 协议,与IP 协议和其他协议共同使用。利用UDP 协议传输数据时不必使用报头,也不处理丢失,出错和失序等意外情况,若发生问题,可通过请求重发的办法来解决。因此它的效率较高,且比TCP 简单 得多。该协议适合传输较短的信息。 ⑥HTTP(即WWW) 、GOPHER 和WAIS -既是通信协议,又是实现协议的软件。 需要强调的是:电子邮件、文件传输和远程登录是Internet 三大基本功能,
而域名与IP 地址 同等重要。
3 Internet的地址和域名
为了在网络环境下实现计算机之间的通信,网络中任何一台计算机必须有一个地址,而且该地址在网络上是唯一的。在进行数据传输时,通信协议必须在所传输的数据中增加发送信息的计算机地址(源地址) 和接收信息的计算机地址(目标地址) 。
3.1 IP地址
,Internet网络中所有计算机均称为主机,并有一个称为IP 的地址。 IP地址是Internet 主机的一种数字型标识,它由网络标识(Netid)和主机标识(Hostid)组成 。
目前使用的IP 协议版本规定是:IP 地址的长度为32位(bit)。Internet 的网络地址可分为A 、 B、C 三类。每类网络中IP 地址的结构,即网络标识长度和主机标识长度都不一样。
整个internet 的地址空间可以分为A 类网络地址空间,B 类网络地址空间和C 类网络地址空间 三个子空间。A 类网络地址空间包括126个网络地址空间和16387064台网络主机,B 类网络地 址空间包括16256个网络地址和64516台网络主机,C 类网络地址空间包括2064512个网络地址 和254台网络主机。整个Interet 的IP 地址空间包括200多万个各类网络,可包括36亿台主机 。A 类网络适用于主机较多的大型网络,B 类网络适用于中等规模网络,C 类网络适用于主机 较少的小型网络。
目前Internet 上大约有6万多个网络和400万台主机,占用网络地址和主机地址资源很少,但却出现了IP 地址不够用的现象,这是因为许多地址已分配给申请者而没有充分利用。因此, 合理地使用地址资源是每个Internet 用户必须注意的问题。
需要说明的是,Internet 网络信息中心(NIC)是按照网络(Internet的子网) 分配地址的,因此只有在谈到网络地址时才可以使用A 类,B 类,或C 类地址的说法。
3.2 域名
上面所讲到的IP 地址是一种数字型网络和主机标识。数字型标识对使用网络的人来说有不便记忆的缺点,因而提出了字符型的域名标识。目前使用的域名是一种层次型命名法,它与In ternet网的层次结构相对应。 域名使用的字符包括字母、数字和连字符,而且必须以字母或数字开头和结尾。整个域名总长度不得超过255个字符。在实际使用中,每个域名的长度一般小于8个字符。
由于Internet 起源于美国,所以美国通常不使用国家代码作为第一级域名,其他国家一般采 用国家代码作为第一级域名。
,Internet 地址中的第一级域名和第二级域名由网络信息中心(NIC)管理。我国国家域名的国家代码是Cn 。Internet 目前有三个网络信息中心,INTERNIC 负责北美地区,APNIC 负责亚太地区,还有一个NIC 负责欧洲地区。第三级以下的域名由各个子网的NIC 或具有NIC 功能的节点自己负责管理。
一台计算机可以有多个域名(一般用于不同的目的) ,但只能有一个IP 地址。一台主机从一个 地方移到另一个地方,当它属于不同的网络时,其IP 地址必须更换,但是可以保留原来的域名。
把域名翻译成IP 地址的软件称为“域名系统(Domain Name System)DNS”。DNS 的功能相当于 一本电话号码簿,已知一个姓名就可以查到一个电话号码,号码的查找是自动完成的。完整的域名系统可以双向查找。装有域名系统的主机叫做域名服务器(Domain Name Server)。
域名采用层次结构,每一层构成一个子域名,子域名之间用园点隔开,自左至右分别为计算机名、网络名、机构名、最高域名。例如:
indi.shcnc.ac.cn 该域名表示中国(cn)科学院(ac)上海网络中心(Shcnc)的一台计算机(indi)。
3.3 域名的查找过程
为了实现域名的查找,需要在域名服务器之间建立许多指针(Pointer)。 例如,一个中国的用户要通过域名查找英国某个主机的IP 地址,系统首先要查找中国的域名服务器,经过识别后自动转移到一个装有英国域名服务器的主机并查出它的IP 地址,然后把IP 地址送回到中国域名服务器。如图10-5所示。

例如,中国科技信息研究所的VAX7610主机的IP 地址是168、160、1、110(B类网络地址) ,其 域 名为ISTIC 、STI 、AC 、CN(ISTIC是中国科技信息研究所的缩写,STI 表示科技信息机构,AC 表示学术界。CN 表示中国) ,若要与英国域名为PARADISC 、ULCC ,UK 的主机进行通信,则首先要利用管理STI 子域的域名服务(设在中国科技信息研究所) ,通过指针找到管理AC 子域的域名服务器,再利用同样的方法找到最高域名CN 的域名服务器。CN 域名服务器应存有所有其
,他国家最高级域名的服务地址,即指针。这样可找到UK 域名服务器的地址,并由此找到PARA DISC 及ULCC ,即128、86、8、56。查找过程完成后,就把该地址送到发出查询请求的ISTIC 、STI 、AC 、CN 的主机,从而完成了两个主机之间的连接过程,如图10-6所示。

4 Internet的应用
Internet能为用户提供的服务项目很多,主要包括电子邮件(E-mail) 、远程登录(Telnet) 、文件传输(FTP)以及信息查询服务,例如用户查询服务(Finger)、文档查询服务(Archie) 、专题讨论(Usenet News)、查询服务
(Gopher)、广域信息服务(WAIS)和万维网(WWW),这里 着重介绍电子邮件、远程登录、文件传输三项基本服务内容以及信息查询服务中的万维网。
4.1 电子邮件(E-mail)
电子邮件是Internet 的一个基本服务。通过电子邮件,用户可以方便快速地交换信息,查询信息。用户还可以加入有关的信息公告,讨论与交换意见,获取有关信息。用户向信息服务 器上查询资料时,可以向指定的电子邮箱发送含有一系列信息查询命令的电子邮件,信息服务器将自动读取,分析收到的电子邮件中的命令,并将检索结果以电子邮件的形式发回到用户的信箱。
早期Internet 所用的电子邮件软件是许多Internet 主机所用UNIX 操作系统下的程序,如MAIL ,ELM 及PINE 等。最近出现了新一代的程序,如流行的EUDORA 程序。不同的程序使用的命令和用法会稍有不同,但地址格式是统一的。Internet 统一使用DNS 来编定信息的地址,因而I nternet中所有的地址均具有同样的格式,其格式为用户名称@及主机名称。 Internet 的电子邮件系统遵循简单邮件传送协议,即SMTP 协议标准。
4.2 远程登录(Telnet)
远程登录是Internet 上最诱人和重要的服务工具之一,它可以超越时空的界限,让用户访问远地的计算机,当然这些计算机必须连在Internet 上。我们
,把连在Internet 上的计算机叫做 Internet主机。远程登录能把本地计算机连接并登录到Internet 主机上,它是一种特殊的通 信方式。在UNIX 计算机上,用rlogin(Remote Login) 命令可以达到同样的目的,所以,我们把Telnet 称作远程登录。
(1)分时系统
我们通常使用的微机是一个单CPU 的系统,其操作系统DOS 是一个单任务的操作系统,就是说 ,在任何一个时刻,系统中只能有一个应用程序在运行。当要运行一个应用程序时,必须终 止目前正在运行的程序。当要继续运行刚才终止的程序时,必须重新将它装到内存中。对于 大型的计算机系统,采用的是分时多任务操作系统,就是说,在计算机中好像同时在运行着 多个程序。 用户通过计算机终端来使用大型计算机的资源,终端只是完成用户输入和结果显示的任务。 由于主机在多个用户之间快速切换,用户感觉不到主机还在运行其他用户的程序。当然,若有多个用户同时使用主机的某一种共享资源,如打印机等,可能就需要等待。远程登录就是基于主机的多任务而实现的。 远程登录也是Internet 上应用非常广泛的资源,用户可以通过远程登录来使用主机的强大的运算能力。通常,用户使用的微机在运行大的、复杂的程序时要耗费大量的时间,甚至根本 无法完成。这样,用户可以登录到一台他具有合法帐户的主机上,在该主机上运行他的程序 。主机完成运行后,将结果传送到用户的计算机中。其次,用户还可以登录到别的主机中来运行该机中的程序。例如,工作站上的软件非常昂贵,一般用户无法完全配齐,这样,不同工作站的拥有者可以协商购买不同的软件,他们互相向对方提供帐户就可以运行各种软件了 。
与普遍使用的微型计算机一样,Internet 上的主机也有其操作系统。由于网络上有各种各样的计算机,因而存在着多种操作系统,UNIX 是最常用的一种多用户、多任务的操作系统。
(2)Telnet登录方法
Telnet 提供两种登录远地Internet 主机的方法:第一种方法要求使用 帐号,也就是说,只要用户在任意一台Internet 主机上有帐号(对UNIX 主机来说是合法的用 户码和密码) ,就可以通过Telnet 使用该台主机。第二种方法不要求用户申请帐号。
,Internet 上有许多主机允许公众访问。当用户使用Telnet 登录到这些主机时,它们并不要求 输入密码。Internet 上许多资源正是通过这种方式让公众访问的。
(3)Telnet工作模式
Telnet使用客户机/服务器模式。用户在本地主机上运行一个称为Teln et的客户程序,客户程序可与远地机上的Telnet 服务程序建立连链,连接一旦建立,用户在本地键盘上输入的命令或数据会通过Telnet 程序传送给远地计算机,而远地计算机的输出内容会通过Telnet 显示在用户的本地计算机的屏幕上。本地机就好象是直接连在远地计算机上的一个终端。
(4)Telnet基本功能
利用远程登录,用户可以实时使用远地计算机上对外开放的全部资源 ,可以查询数据库、检索资料,或利用远程计算完成只有巨型机才能做的工作。 另外,Internet 上有许多服务是通过Telnet 来访问的,例如Auchie 、Gopher 等,这类系统通常开放公用帐号,无需输入密码。
4.3 不具名的文件传输协议(Anonymous FTP)
文件传输协议FTP(File Transfer Protocol)和前面所介绍的E -mail 、Telnet 是Internet 提供的三项基本服务。
(1)主要功能 FTP的主要功能是在两台联网的计算机之间传输文件。除此之外,FTP 还提供 登录、目录查询、文件操作、命令执行及其他会话控制功能。 (2)工作原理 FTP的工作原理并不复杂,它采用客户机/服务器模式。FTP 客户机是请求端, FTP服务器为服务端。FTP 客户机根据用户需求发出文件传输请求,FTP 服务器响应请求,两者协同完成文件传输作业。
为了保护你的资源,客户程序在请求连接时,FTP 服务器会要求用户输入用户码和通行密码 。如果用户自愿将资料提供给网络上公用,则应该开放一个公用的帐号。Internet 约定,FT P的公用帐号是anonymous ,密码是用户的E -mail 地址。Internet 中已经有上千个使用anony mous公开帐号的FTP 服务器,为网络中数以千万计的客户提供文件共享服务。我们称Interne t提供的这种服务为不具名(Anonymous)FTP服务。