万维网WWW(World Wide Web)是一个大规模的,联机式的信息储藏所,英文简称Web。万维网是一个分布式的超媒体(Hypermedia)系统,是超文本系统的扩充。
WWW通过超文本向用户提供全方位的多媒体信息,从而为全世界的Internet用户提供了一种获取信息、共享资源的全新途径。一个超文本由多个信息源链接成,而这些信息源的数目实际上是不受限制的。利用一个链接可使用户找到另一个文档,而这又可链接到其他的文档(以此类推)。这些文档可以位于世界上任何一个接在因特网上的超文本系统中。超文本是万维网的基础。
WWW系统是基于服务器/客户模式的。WWW是Internet上分布式的信息资源,是置于Web服务器中的互联起来的超媒体资源,是客户端程序可以浏览和检索的WWW文档。超媒体与超文本的区别就是文档内容不同。超文本文档仅包含文本信息,而超媒体文档还包含其他表示方式的信息,如图形、图像、声音、动画,甚至活动视频图像。
客户端/服务器间的传输协议为超文本转换协议HTTP(Hyper Text Translation Protocol)。HTTP是一个应用层协议,它使用TCP连接进行可靠的传送。为了使不同作者不同分格的万维网文档都能在因特网上的各种计算机上显示出来,同时用户可以清楚知道在什么地方存在着超链接,万维网使用超文本标记语言HTTP(Hyper Text Translation Protocol),使得万维网页面的设计可以很方便地用一个超链从本页面的某处链接到因特网上的任何一个万维网页面,并且能够在自己的计算机屏幕上将这些页面显示出来。
1.WWW的工作流程
Web是由互相链接在一起的网页构成的,这些网页是由普通文本、超文本,图表、地图、照片等构成的。用户通过浏览器Browser软件来观看网页,浏览器取回所请求的网页,解释其中所含的文本和格式命令,并显示出来。网页中的文本串若指向其他网页(称为超级链接Hyperlink,此文本串称为超文本Hypetext),会被特别地显示出来,用户若选择此超级链接,浏览器会将此超级链接所指的网页取回。
当超文本网页中包含声音、动画等其他媒体时,网页被称为是超媒体的。浏览器一般通过外挂的帮助程序(Helper Application)来显示这些超媒体信息。
WWW基于如下的工作流程:
(1)启动WWW客户程序(浏览器),输入查看的主页地址(唯一资源定位器URL)
URL是用来找到目标网页的,URL由3部分组成:
1)协议类型(HTTP、FTP、TELNET等)
2)网页所在机器的地址(域名或IP地址)
3)包含网页的文件名称
(2)在每个WEB服务器上有一个服务进程在TCP的80端口上监听由浏览器发来的建立连接请求;在连接建立之后,浏览器和服务器之间使用超文本传输协议HTTP协议进行信息传输。
(3)HTTP协议由从浏览器发往服务器的请求和从服务器发往浏览器的响应组成。
(4)浏览器确定URL,通过DNS解析IP地址,建立TCP连接。向服务器发出请求,并获取所需要的网页,释放连接。
(5)浏览器显示网页内容。如此循环往复。
2.URL
在因特网的建议标准中对URL是这样定义的:“统一资源定位符URL是对可以从因特网上得到的资源的位置和访问方法的一种简洁的表示。URL给资源的位置提供一种抽象的识别方法,并用这种方法给资源定位。只要能够对资源定位,系统就可以对资源进行各种操作,如存取、更新、替换和查找其属性。”
上述的“资源”是指在因特网上可以被访问的任何对象,包括文件目录、文件、文档、图像、声音等,以及与因特网相连的任何形式的数据。“资源”还包括电子邮件的地址和Usenet新闻组,或Usenet新闻组中的报文。
URL相当于一个文件名在网络范围的扩展。因此URL是与因特网相连的机器上的任何可访问对象的一个指针。由于对不同对象的访问方式不同(如通过WWW,FTP等),所以URL还指出读取某个对象时所使用的访问方式。这样,URL的一般形式为
<URL的访问方式>://<主机>:<端口>/<路径>
在上式冒号左边的<URL访问方式>,中,最常用的有3种,即ftp(文件传送协议FTP),http(超文本传送协议HTTP)和news(Newsnet新闻)。
上式冒号的右边部分,<主机>一项是必须的,而<端口>和<路径>则有时可省略。
注意,在URL中的字符对大写或小写没有要求。
例如,对于万维网的网点访问要使用HTTP协议。HTTP的URL的一般形式是:
http://<主机>:<端口>/<路径>
HTTP默认的端口号是80,通常可以省略。(www.xing528.com)
例如http://www.ncepu.edu.cn/index.html
各个部分所表示的意义:
(1)在冒号“:”前面的部分表示用户要调用哪种形式(协议)的文件,http表示超文本文件,用户还可以调用gopher或ftp文件,要在冒号“:”前输入gopher或FTP。
(2)双斜线“//”后面表示Web服务器的主机地址,如www.ncepu.edu.cn。
(3)单斜线“/”后面表示的是一个信息所在的目录路径,如果一个文件名的后缀是html,表示是一个超文本文件,如果后缀是au,表示声音格式文件,如果后缀是gif,表示是一个图像文件。
3.WWW的客户机软件——浏览器
基于图形界面的WWW客户机软件就是浏览器,用于浏览Internet资源,目前流行着3种主要的WWW浏览器。
NCSA Mosaic Browser
它是最早诞生的浏览器,在1993年由美国伊利诺依大学的国家超级计算应用中心NCSA开发成功,并且是免费的。这套浏览器主要支持3种平台:UNIX、Macintosh、Windows。
Netscape Navigator
是目前使用广泛的一种浏览器,功能强大,可以访问各种服务器,浏览文字、声音、图片、动画等。
Microsoft Internet Explorer
微软公司开发的IE不仅可以作为通用浏览器,还可以集成目前微软的各种产品。
其他浏览器还有Hotjava,Albert,Webexplorer,Websurfer等。
4.WWW的服务器软件——网站
WWW服务器就是我们常说的网站(Web Site)。
网站发布主要信息,这些信息表现为一台主机(服务器)上的一些文件。
网站地址一般用域名表示,如http://www.ncepubd.edu.cn.
网页(Webpage)就是组成网站的HTML文件,即浏览者所见到的内容。网页是用超文本标识语言HTML(Hyperlink Text Makeup Language)编写的文件,HTML是一种简单的脚本标识语言。
主页(Homepage)是浏览者进入站点后见到的第一个网页,一般的默认值为index.htm(l)、default.htm(l)等。
5.超文本标记语言
现在计算机使用的宇处理器种类繁多而版本各异,某一台计算机屏幕上显示出的文件,在另一台机器上就未必能显示出来。万维网要使任何一台计算机都能显示出任何一个万维网服务器上的页面,就必须解决页面制作的标准化问题。超文本标记语言HTML就是一种制作万维网页面的标准语言,它消除了各个计算机之间信息交流的障碍。
超文本标记语言HTML(HyPerText Markup Language)中的Markup的意思就是“设置标记”。因此HTML也常译为超文本置标语言。这就像在出版社图书编辑经常要在书稿文档上写上各种版式记号,指明在何处应当用何种字体等。因此也有人将HTML译为超文本排版语言。
HTML定义了许多用于排版的命令,即“标签”(Tag)。HTML就将各种标签嵌入到万维网的页面中。这样就构成了所谓的HTML文档。HTML文档是一种可以用任何文本编辑器(例如,Widows的记事本Notepad)创建的ASCII码文件。但应注意,仅当HTML文档是以.html或.htm为后缀时,浏览器才对这样的HTML文档的各种标签进行解释。如果HTML文档改换以.txt为其后缀,则HTML解释程序就不对标签进行解释,而浏览器只能看见原来的文本文件。
当浏览器从服务器读取某个页面的HTML文档后,就按照HTML文档中的各种标签,根据浏览器所使用的显示器的尺寸和分辨率大小,重新进行排版并恢复出所读取的页面。现有的一些字处理软件都不具有像HTML这样的功能。
目前已开发出了很好的制作万维网页面的软件工具,使我们能够像使用Word字处理器那样很方便地制作各种页面。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。