您现在正在浏览:首页 > 职教文章 > 职教论文 > 论数字化

论数字化

日期: 2012/11/29 浏览: 1 来源: 学海网收集整理 作者: 学海网

论数字化

清华大学哲学系教授 蔡曙山

数字化是信息技术革命的导因和发展的动力,这是由于信息技术的基础是计算机和网络技术,而计算机和网络技术的基础则是数字化。由此可以说,数字化引起计算机和网络技术革命,计算机和网络技术引发了信息技术革命,而信息技术革命则引发了全球化过程。

对数字化的研究具有十分重大的理论意义和现实意义。只有对数字化的理论问题进行深入研究,才能深刻认识信息技术革命的意义,掌握信息技术发展的动力,进一步加快数字化和信息技术的发展,全面提高我们以信息技术为支撑的科技、经济、政治、文化、军事实力和综合国力,也才能在全球化进程中立于不败之地。

一、基于二值逻辑的数字化系统

逻辑是数学的基础,也是数字化的基础。在目前的计算机系统中,信息的加工、传输和存储都是以二进制数的方式进行的,即用二进制的两个数0和1来表示。我们把二进制数的一个位称为一个“比特”(bit)。计算机中所有信息对象如数字和运算、字符、声音、颜色、图形、图像,连同计算机指令,都用“比特”来表示,这一关键技术被称为“数字化”(digitalization)。因此,我们对数字化的认识应该从当前计算机系统的数字化理论开始,从基于二值逻辑的数字化系统开始。

首先我们简述数字化的对象和方法。计算机最基本的功能是数值与逻辑运算。二值逻辑计算机系统的电子线路只有开和关两种状态,它非常适合做二进制数学运算和二值逻辑运算。数学运算将十进制数转化为二进制数,经过计算机系统运算以后再转化为十进制数。同时,数值运算系统要将所有的数学运算转换为算术运算,并将所有的算术运算转换为加法运算。这样,计算机系统的数值运算只需做二进制的加法运算就可以了。二值逻辑运算有(非)、(与)、(或)、(若,则)、(等值)。表示二值逻辑运算规则的真值表,也只需用0(表示“假”)和1(表示“真”)便可定义。在二值逻辑计算机系统中,二进制算术与二值逻辑运算是由“算术逻辑运算器”(ALU)来完成的。

字符是另一个重要的数字化对象。我们将8个“比特”作为一个单位,称为一个“拜特”(byte),或称为一个“字节”。一个字节能表达28=256种不同的情况。这样,我们就能将所有的数字和字符(英文字母、标点符号和常用符号)都进行编码。目前计算机使用的基本字符代码是ASCII码,它是“用于信息交换的美国标准代码”的英文缩写,计算机的发明者美国人的标准成为国际标准。

仅有ASCII码是远远不够的。英文之外的文字表达就是一个问题。汉字等非拼音文字都是大字库,其单字数量远远超过256个,在ASCII码的框架内是无法表达的。计算机科学家们采用了汉字编码的双字节技术,即每个汉字采用两个字节编码,并且每个字节都是高位为1的扩展的ASCII码。这样用两个字节就能够表示27×27=16384个不同的汉字。采用这种编码技术不仅能够表示所有汉字,而且每个汉字都和ASCII码字符区别开来。汉字双字节技术是汉字信息处理的关键技术和重大突破。

多媒体技术是指计算机处理声音、颜色、图形和图像的技术。计算机喇叭可以发出不同频率的音响,我们只需考虑如何控制发音的频率。首先考虑怎样把声音转换为二进制数。可以把声波看成一种正弦波,它的横轴表示时间,纵轴表示频率(频率范围37-32767赫芝)。现在我们对这段声波进行采样。每个样品的信息量可以通过把相应的声波分割成相同的单元来获得。8位采样就是把每个样品分割成256个相同的单元,16位采样则是把每个样品分割成65536个相同的单元。当计算机以与取样相同的速度来处理这些字节时,原来录入的声音就被重放出来。

黑白图片是以黑白二色和不同的灰度来表现的。我们把一张黑白图片划成尽量精密的网格,并把这张图片与某一矩阵相对应,图片的每一个格子对应于矩阵的一个坐标。对于矩阵的每一坐标,我们用一个字节来记录其颜色。由于一个字节可以存储256种不同的信息,就可以表示不同的灰度。用这种方法就可以记录并重现这张黑白图片。彩色图片的记录和重现是完全类似的,只需将不同的色彩按一定的规律排列,而用一个字节(256色)或多个字节(更多颜色)来记录各种不同的色彩就行了。

根据颜色记录和重放的原理,我们也可以处理图形。这需要很多的“比特”。图形需要尽量精确,因此我们以计算机显示器的最小单元“象素”作为一个单位来处理。例如适配增强VGA卡的显示器,可以处理1024×768=786432个象素,每个象素要用一个字节来记录其颜色的信息,这样形成的一幅完整画面,称为一帧。一帧画面由786432个象素组成,每个象素可以有256种不同的颜色,因此,一帧画面要用786432个字节来存储。可见要作图形,需要处理很多的“比特”。

图像是要让图形“动”起来,这就需要在单位时间处理更多的“比特”。如果电子枪扫描的速度是每秒60帧(低于这个速度则不能看到高质量的影像),则中央处理器(CPU)的处理速度应不低于每秒786432×60=47185920个字节。因此,要在计算机上看到运动的图像,CPU的处理速度应不低于每秒47兆字节!设想我们要看一个小时的电影,多达170吉(1吉等于1024兆)字节的信息将被存储和处理!

计算机指令是一组二进制代码,由操作码和操作数两大部分构成。计算机指令指挥计算机作特定的操作,有时是十分复杂的操作,但它自身却十分简单。例如,加法的操作码是01100001,它可以对两个复杂的参数作加法运算。再用一个循环命令,它就可以连续作加法运算。由于计算机指令可以简化为只击几个键或点一下鼠标,尼葛洛庞蒂说:“为数不多的几个比特就可以创立宗教,发动战争或者带来和平。”

在目前的计算机系统中,知识表示是用数据库来实现的。数据库技术是计算机三大前沿领域之一(其他两项是人工智能和网络)。数据库是数据的集合,它的逻辑结构是具有某种关系的二维表。由于数据是可以积累的,因此数据库可以是很大型的,这一点与人类知识的积累方式是完全相同的。事实上,在目前的计算机系统中,知识的积累不论从速度到规模,都是人所不能企及的。在数字化时代,一个国家对数据库的占有程度甚至被用作衡量这个国家“数字化贫富程度”的重要标志,所谓“数字鸿沟”(digital gap)也以国家对数据库的拥有量作为衡量标准。

二、多值逻辑与数字化

从理论上说,数字化并不必然使用二值逻辑和二进制的方法,它还可以使用多值逻辑和其他进制的方法。例如,我们可以把三值逻辑作为数字化的基础。在三值逻辑系统中,每一命题变元和命题函数除了取t(真)、f(假)为值,还可以取第三种值。由于对第三种值可以作不同的解释,从而可以建立不同的三值逻辑系统。例如,克林、卢卡西维兹、波克万分别将第三种值解释为“非决定的(u)”、“中间的(i)”和“无意义的(m)”,他们的三值逻辑系统也有不同的特征和作用。克林解释的最初动因是要接纳非决定的数学陈述;卢卡西维兹则是要处理亚里士多德的未来可能陈述;波克万的解释则直接受到语义悖论的启发并试图解决语义悖论。

在多值逻辑的基础上,我们同样可以用多进制表达上节所说的数字、字符、声音、颜色、图形和图像。三值逻辑的数字化系统以0,1,2三个数字为信息载体,多值逻辑的数字化系统以0,1,…,n等多个数字为信息载体,从而以完全不同的方式实现数字化的信息化。

如果我们在电子线路中能够实现多值逻辑运算和多进制的算术运算,就有可能制成与基于二值逻辑和二进制的计算机完全不同的新型计算机。目前正在研发的量子计算机,就有可能成为一种基于多值逻辑和多进制的新型计算机。在这样的计算机系统中,其逻辑特征与数字化表达方式又有什么不同?其智能化的知识系统又有那些可能的应用?它对数字化和信息技术革命又会产生哪些影响呢?

我们以莱欣巴赫的三值逻辑系统为例,该系统有三种否定:循环否定、对立否定、完全否定;二元联结词有析取、合取、蕴涵、等值。我们取完全否定和蕴涵为基本联结词,推理规则只有以下一条:

从A和AB可以得到B。

显然,分离规划是保值t或i的,因为在的真值表中,只有当前件t后件f时,才取值f,在其他情况下,它都取值t或i。因此,使用分离规划,从重言式只能得到重言式。

记这个系统为R,在R中,考虑排中律的否定(pp),我们有

i

t,当 /pp/ =

/(pp)/= f

i,当 /pp/ = t

因此,(pp)是重言式。现在,我们选取R中合适的取值为t或i的公式作为公理,我们可以证明R的可靠性和完全性,即,一个公式是R的重言式,当且仅当它是R的定理。这样我们就能够证明(pp)是R的定理,而明显地,(pp)不是经典二值逻辑的定理。

这一结论说明,多值逻辑不仅有与经典二值逻辑不同的解释,而且它还有经典二值逻辑不具备的推理作用。例如,对于R,由于它的公理可以取值t或i,它就可以保证,当作为推理前提的命题取中间值时,推理能够无矛盾地进行。

现在我们将三值逻辑用作量子力学的逻辑基础。在量子力学中,测不准原理的逻辑表达是一个难题。我们用x和px分别表示一个粒子在某一时刻的坐标和动量,用x和px分别表示x和p的误差,它们的关系满足

xpx

就是说,粒子的坐标和动量不可能同时准确地测量到。因此,量子力学的规律只能是概率性的,因果决定论的原则必须抛弃。设有一个命题p,它表示在确定条件下某一量子现象出现的可能性,显然在经典二值逻辑系统中,无法表达该命题的语法和语义。而根据我们前面对莱欣巴赫的三值逻辑系统R的讨论,它不仅有适合作为量子力学推理的语法,也有适合的语义。这样,R为量子力学提供了一个合适的逻辑模型。

智能化的围棋程序就可以使用三值逻辑系统来编制。因为在围棋棋盘上共有1919个“位”,每个“位”共有3种可能的着法(黑、白、空),而在三值逻辑的计算机系统中,逻辑和数值运算是以三值逻辑和三进制的方式实现的,对上述围棋程序的设计和运算都非常方便。在这样的系统中,由于对第三种值还可以作智能化的解释,就可以编制出智能化的围棋程序。可以预见,随着多值逻辑计算机的出现,可以击败专业棋手的智能化围棋程序一定会编制出来,这在目前的二值逻辑系统中也是无法实现的。

多值逻辑在知识表示的方法和知识系统的特征上也与二值逻辑不同。首先,在使用多值逻辑和多进制的数字化系统中,对象的表达式更加简短。在二值逻辑的数字化系统中,每个“位”能够表达2种不同的情况,8个位构成一个“字节”,每个字节能够表达28=256种不同的情况,在三值逻辑的数字化系统中,每个“位”能够表达3种不同的情况,8个位能够表达38=6561种不同的情况。在这个系统中,其知识表达式的长度只是二值逻辑数字化系统中的3/4,而它能表达的知识对象比目前在二值逻辑的数字化系统中所表达的一切对象还要多。其次,在使用多值逻辑和多进制的数字化系统中,知识系统的特征是智能型的,这是因为命题具有真假之外的第三种值或更多种值的逻辑系统,更符合人类思维的特征,因此它能够实现表现人类思维特征的智能化推理。其三,在多值逻辑系统中,由于对中间值解释和对重言式定义的多样性,就能构造出不同的多值逻辑系统,这些具有不同性质的多值逻辑系统在经验推理中具有更广泛的用途。

三、数字化的哲学问题

数字化系统是一种特殊的、只有两个初始符号0和1的形式化系统,数字化方法是形式化方法的继承和发展。这是因为:第一,数字化的对象和方法都直接来源于形式化,没有形式化就不可能有数字化;第二,数字化是一种“只有比特”的形式化方法,即以“比特”为语言材料,并以“比特”表达其形式公理和形式推理规则的形式化方法。第三,数字化是计算机科学的基本理论和基本技术,它直接应用于计算机并促进计算机的发展。所以,形式化是数字化的直接根源,而数字化是形式化的最新表现形式。

数字化使哲学基本范畴的内涵发生了根本的变化。它的合理部分也应该为马克思主义哲学所吸取。我们来看数字化的一些基本概念对马克思主义哲学基本范畴产生的影响。

赛博空间(Cyberspace):“赛博空间”一词始见于20世纪80年代中期,随着计算机软硬件和网络技术的发展,“赛博空间”被赋予更多的涵义。目前,我们可以把“赛博空间”定义为数字化技术和计算机网络提供的信息存储、加工和传输的方式,从而也是一种新的物质存在方式。也许“赛博时空(连续统)”(Cyber space- time continuum)这一新概念更适合描述这种新的物质存在方式。由于数字化技术和计算机网络已经确立了新的时空关系,马克思主义哲学也必须发展和改变自己的时空观。事实上我们已经有很多的以Cyber为前缀的术语,如“赛博文化”(Cyber culture)、“赛博社会”(Cyber society)等等,需要我们对之作哲学的思考。

虚拟现实(Virtual reality):虚拟现实主要是由计算机多媒体技术、三维动画技术实现的数字化仿真效果。Virtual一词译为“虚拟的”对中国人可能会产生“误导”,其实它的英文原意还有“实际上起作用的”、“事实上存在的”、“因内在力而能产生作用的”等等。根据我们前面的研究,一切认识对象如数字、字符、声音、图形、图像等等都可以被数字化,从而被虚拟化。由于数字化对象的客观实在性,它在数字化时空(Digital space-time)里又具有明确的现实性。虚拟现实技术已经被广泛应用于工业设计、远程教育、电子商务、军事训练等众多的领域之中。可见,Virtual reality无论从辞源意义上说,还是从实际意义上说,都是一种实实在在的现实,我们也应该对之作深入的哲学思考。

数字化存在(Being digital):计算机和网络技术发展到今天,尼葛洛庞蒂使用的“数字化存在”也许是一个最带根本性的哲学概念,甚至可以说是一个新的哲学范畴。“数字化存在”不仅用指物的存在,而且也用指人的存在,指人在数字化的世界中获得了一种新的存在方式,当然也可能是一种新的异化方式。可以预言,在21世纪由于信息技术和基因技术的发展与结合,完全可能制造出Original I(可译为“本我”)之外的一个或者若干个Virtual me(可译为“虚我”,甚至也可译为“真我”或“实我”)。对于这些新的重要概念,马克思主义哲学家也应该对之进行哲学思考。

在这种情况下,马克思主义哲学的其他范畴和基本概念如思维和存在、时间和空间、生命和进化、认识和实践、历史和社会、自由和必然、人的解放和人的异化等等,恐怕都不得不重新考虑,并增加新的内涵。

四、数字化的意义

1.数字化是信息时代的新阶段。

1995年,网络从神话变为现实,美国“新经济”开始出现奇迹。也是在这一年,美国麻省理工学院教授兼媒体实验室主任尼葛洛庞蒂出版了他的《数字化生存》 一书,宣布以“比特”为存在物的数字化时代已经到来。雷·海蒙德认为,信息时代经历两个发展阶段:物质化(physical)信息时代和数字化(digital)信息时代。 在物质化信息时代,信息载体是“原子”,如书籍、报纸、杂志、包括模拟信号的电话、电视及传真,它们都是由原子构成。在这个时期,人们对信息的消费表现为对某种物质的消费,例如,人们必须购买书籍,订阅报纸、杂志,安装电话机、电视机和传真机。人们对信息的传递也主要依靠这些工具。在数字化信息时代,计算机和网络成为加工和传输信息的统一工具,对信息的加工和传输不再需要传统的书写工具和运输工具——计算机和网络已经完全取代了它们。这是数字化信息时代区别于物质化信息时代的第一个特征。其二,信息载体实现了完全统一。任何信息对象,无论是数字、文字或符号,还是声音、图形或图像,都只需用“比特”来承载。传输“比特”的速度是光速,这是一切速度的上限,而传送“原子”的速度最快的是音速和亚音速,当然无法与光速相比。其三,在网络上传播的数字化信息具有开放性,其通信方式具有自主性,其通信主体具有平等性。其四,在物质化信息时代,人们对信息的接受和消费是完全被动的,而在数字化信息时代,人们对信息的接受和消费却是相当主动的。

2.数字化制约全球化进程。

尼葛洛庞蒂早在5年前就预言全球化会到来。他说:“数字化存在有四个强有力的特质,这四个特质是:分散权力、全球化、追求和谐、赋予权力。”全球化果然如约前来,它是数字化的必然结果,它的规则是数字化的规则,因此,应该从数字化的特征来理解全球化的本质。

全球化涉及人类生活的各个方面,它必须遵循一定的规则。我们仅以全球化的商业为例,说明全球化规则的一些特征。第一,只有一个市场。在全球化的条件下,客户要在世界各地采购,公司必须提供这种服务,否则只有被淘汰。公司的竞争目标是国际市场,而不仅仅是国内市场。第二,只有一个标准。在全球化的条件下,公司提供的产品质量在全世界都应该是一样的。可口可乐、耐克、IBM、海尔能够成为世界品牌,就是因为它们实行了全球统一的质量标准。第三,只有一种经营方式,那就是数字化的电子通关贸易。第四,只有一个基础。全球化的这些规则必须是参与这场游戏的各个主体共同接受的,而且它必须是能够数字化的,因为只有这样才能采用计算机和网络加以管理。显然,在全球化的经济、政治、文化、科技、军事等各个领域,也必须遵循类似的规则。

3.数字化推动人类文明的进步。

数字化是人类文明的新形式。我们现在已经有了数字化书籍、数字化报刊杂志、数字化图书馆、数字化博物馆、数字化学校等等,将来还会有数字化社区、数字化政府和数字化社会。就目前我们对数字化的认识而言,我认为对数字化与人类文明的最重要的命题是:人类所创造的一切文明都可以数字化。人类基因组的破译说明,甚至代表人类文明最高成就的人自身也可以数字化。数字化不仅可以推动人类文明进步,而且可以保护人类文明不至毁灭。也许有一天,科学技术会发展到这一步,人类的全部文明可以存储在一个微小致密的物质载体之中。如果到了这一天,即使人类毁灭,人类所创造的文明也会得到保存。

在这样一个令人激动的数字化时代,我们面临的是难得的机遇与严峻的挑战。

孙中山先生在本世纪初曾经感言:“世界潮流,浩浩荡荡,顺之者昌,逆之者亡。”在人类即将迈入新世纪的时刻,我们面对的是以数字化为基础的信息技术所引发的全球化潮流。在这样一种形势下,我们如何才能抓住机遇,迎接挑战?这确实是我们必须冷静思考,沉着应对的大问题。

(“语言逻辑及其在人工智能中的应用”阶段成果)


论数字化.doc

返回顶部