王选

        王选,计算机技术专家,1937年2月生于上海,1958年毕业于北京大学数学力学系计算数学专业,中国科学院院士,中国工程院院士,第三世界科学院院士,现任北大方正技术研究院院长,北京大学计算机科学技术研究所所长,文字信息处理技术国家重点实验室主任,博士生导师,第八届政协委员。九三学社中央副主席。
        王选1958—1974年期间从事计算机逻辑设计、体系结构和高级语言编译系统等方面的研究工作。他和北京大学另三位同志合作,于1967年完成了DJS21机ALGOL60编译系统。该系统采用标准的、未加限制的ALGOL60语言,具有在源语言一级上的调试措施和动态错误检测和准确指示出错位置等功能,受到用户欢迎,是国内最早的几个实用编译系统之一。基于硬件和软件两方面的实践经验,王选于60年代中期到70年代初,提出了适合软件的新型计算机体系结构的若干设想,其中某些设想与国外专家差不多同时提出。
        1975年起王选主持汉字计算机激光照排系统的研制。由于汉字字数多,字体和字号也很多,精密照排分辨率很高,因而精密汉字字形点阵的存储量高达几百亿字节,王选根据这一特点于1975—1976年研制成功了高倍率字形信息压缩和高速复原技术,其内容构成了欧洲专利EP0095536的主要内容,使字形信息量的总体压缩率高达500:1。1976年作出了“跳过第二代光机式照排机、第三代阴极射线管照排机、直接研制第四代激光照排系统”的技术决策,为我国照排技术赶超世界先进水平起了重要作用。
        1975—1991年王选具体负责以上述发明为基础的华光Ⅰ,Ⅱ,Ⅲ,Ⅳ型和新一代方正91电子出版系统的核心硬件——栅格图象处理器的研制。1988年投放市场的华光Ⅳ型采用超大规模集成电路实现上述欧洲专利的各种算法,字形复原速度高达710字/秒(对于100×100点阵),是国产照排系统走向成熟的标志。1993年推出的方正93系统采用专用协处理器芯片,进一步提高了性能价格比。华光和方正系统自投入市场以来累计产值达20亿元,产生了重大的经济效益和社会效益,引起我国报业和印刷业的一场技术革命。
        华光和方正系统由于其先进的技术和良好的性能获国内外奖励20多项,如1986年获第14届日内瓦国际发明展览金牌;1987年获国家科技进步一等奖;1989年获中国发明专利金奖;1991年获国家重大技术装备成果奖特等奖;1993年获年度北京市科技进步特等奖;1995年获国家科技进步一等奖。
        王选个人也多次受到国家表彰,如1986年,他被国家授予“国家级有突出贡献的中青年专家”称号;1987年,他获得首届毕昇奖;同年获首届森泽信夫奖;1990年,获陈嘉庚奖技术科学奖;1993年获全国教育战线劳动模范称号;1994年获美洲工程师协会奖;1995年获联合国教科文组织科学奖。
        王选,计算机技术专家。1937年2月5日出生于上海。1958年毕业于北京大学数学力 学系并留校任教,1985年担任北京大学计算机研究所所长、教授。1991年当选为中国科学院院士,1993年当选为第三世界科学院院士,1994年当选为中国工程院院士。1963—1966年从事高级语言编译系统的研制,并研究适合高级语言的新型计算机体系结构。由王选负责总体设计的DJS21机ALGOL60编译系统是60年代国内几个最早的实用高级语言编译系统之一。该系统采用标准的ALGOL60语言,具有较强的运行状态下错误检查措施和源语言一级上的调试措施,受到了用户的欢迎。
        1975年5月王选开始负责精密照排系统的研制。精密照排系统是用于报纸和书刊等正式出版物的,对文字质量要求很高。王选认为激光扫描输出和数字存储是未来的发展方向,一个汉字只要用足够高分辨率的点阵表示,其质量是最高的。为了保证书刊的文字质量,分辨率必须达30线/毫米;为了保证照片的质量,分辨率还应更高。这样,对于书刊上出现的正文五号字,起码应该用100×100点阵表示,字号越大,点阵越大,对于特大标题字,点阵将超过1000×1000。我国印刷用汉字起码需20多种字号,20多种字体,而常用汉字数就达7000左右,这点与西文系统只有26个字母是大不相同的。对于阴极射线管输出的三代机,由于可以改变光点直径,一套点阵可以表示6—8种不同字号。但是先进的第四代激光照排机却不能瞬间改变光点直径,因此不同大小的字号不得不用不同大小的点阵来表示;若系统允许22种字号,则必须有对应的22种不同大小的点阵,这意味着存储量的增大。若把中国报纸和书刊印刷用的各种字体和字号的所有常用汉字,均以高分辨率的数字化点阵表示,其存储量高达几百亿字节之多。
        当时国外的西文照排系统中,字形存储量的矛盾并不尖锐,因为西文字数少。从60年代中期到80年代初期,他们也采用了某些信息压缩的办法,最普遍的是黑白段压缩法,这是60年代德国Hell公司首先在第三代阴极射线管照排机Digiset上采用的方法,70年代西方大多数照排系统均沿用此法,并作了少量改进。黑白段描述法只记录字形水平方向上每条线的各个黑段和白段的长度,而不存储整个点阵。字形点阵可以毫不失真地复原,但有下述缺点:一是压缩倍数很低。存储量只减少一半或一半多一点,仍不得不用大硬盘来存放汉字字形,而硬盘的存取时间限制了向输出设备提供字形点阵的速度。二是不易产生变形字,也不易对字形作旋转等操作,而这些是报纸、杂志、地图和广告编排中所渴望的。
        1976年王选提出了一种描述汉字字形和文字变倍的新方法。这一方法把汉字笔划区分成规则笔划和曲线形式的不规则笔划;前者指横、竖、折三类笔划,据统计,占汉字笔划的一半以上。规则笔划由直线段、起笔笔锋、收笔笔锋和转折笔锋等组成,这些笔锋是规则笔划中主要的变化部分,但这些笔锋的形状变化都是很有限的,可以把这些有限数量的笔锋的形状事先存入计算机中。这样,只需少量参数信息就可以表示规则笔划的始点x,y坐标,长度,宽度,倾斜度和各种起笔、收笔和转折笔锋;对于不规则笔划,则用信息描述笔划的轮廓。
        对于横宽和竖宽,用参数描述,在变倍时作特殊处理以保证彼此的一致性,这是华光和方正系统文字质量、尤其是小字质量高的主要原因。80年代中期,美国科学家采用“提示信息”(HINT)对西文字母中诸如宽度等敏感部份作附加描述,以控制变倍后的匀称。这一方法与王选1976年提出的宽度参数描述方法在原理上是类似的,但在具体描述和实现方面作了很大发展。
        王选1976年提出的汉字字形描述方法的压缩倍数很高。4种基本字体,21种不同字号,7000汉字仅占3.2M字节的存储空间,从而解决了高分辨率汉字字形存储量大的困难。把向量形式的轮廓描述高速转换成点阵是另一重要问题,1976年王选设计了一套易于硬件实现的算法,并用标记点阵作为中间表示形式,可以把字形压缩信息高速复原成高分辨率点阵,该算法以及上面所述的对字形采用向量轮廓和参数描述相结合的方法,后来成为欧洲专利EP0095536的主要内容。
        面对汉字数字化字形信息量大的困难,数学系毕业的王选想到了采用数学方法描述信息压缩和复原的途径;但是在70年代、80年代初期和中期,计算机速度还不够快,用软件实现上述算法,速度太慢。由于王选有多年从事硬件和软件两方面第一线实践的经验,所以很快想到可以用软、硬件相结合的方法实现上述算法:对于速度瓶颈部分,设计专门的硬件,使速度提高几十倍;对于非瓶颈部分,用微程序实现以降低造价。华光Ⅰ,Ⅱ,Ⅲ,Ⅳ型和方正91的照排控制器(或称栅格图象处理器)就是采用这一方针设计的。第四代激光照排机只能逐线扫描,而不能像第三代阴极射线管照排机那样可以逐字扫描。针对这一困难,王选于1976年提出了逐段生成版面点阵、逐段缓冲的方法以减少版面缓冲存储器的容量。这些技术困难找到解决方案后,1976年8月王选作出了跳过第二代、第三代照排机,直接发展当时国外尚无商品的第四代激光照排系统的技术决策,并负责系统的总体设计和关键硬件照排控制器的具体设计。王选于1976年开始设计华光Ⅰ型的控制器;1979年开始设计华光Ⅱ型控制器,采用了双极型位片微处理器与专门硬件相结合的途径;1984年开始设计华光Ⅳ型栅格图像处理器,采用了双极型微处理器与专用芯片(ASIC)相结合的技术,所设计的ASIC等价于400片常规的中小规模集成电路,使体积大大缩小,可靠性显著提高,字形复原速度达到710字/秒(对于100×100点阵)。华光Ⅳ型可产生倾斜字和旋转字,能产生多种变形字和作字形修饰,例如空心字、灰色字、阴影字、立体字、边框字等,还能处理花边、图形和照片等。华光Ⅳ型系统是国产照排系统趋于成熟的标志,1988年投入市场后很快得到推广。
        1984年,美国Adobe公司提出了页面描述语言PostScript,1986年Linotype照排系统首先支持这一语言。PostScript用三次曲线描述西文字形和图形的轮廓,使大字质量很好,而向量(折线)轮廓描述的字形在放大时能看出折线痕迹。80年代后期PostScript语言逐步成为事实上的国际标准页面描述语言,把三次Bezier。曲线表示的轮廓转换成点阵是一件很费时间的操作。对于西文系统,由于当前使用的字体、字号不多,西文字母又只有几十个,所以只需转换一次,然后把点阵在高速RAM中暂存,以后就可以反复使用。由于汉字字数太多,这样做是不现实的。由此可见,中文系统对字形转换速度要求是很高的。王选于1990年提出:设计一个专用的协处理器芯片,解决Post Script语言解释中三次曲线转换的瓶颈问题。王选的博士研究生阳振坤提出了一个把Bezier曲线转换成最邻近的阶梯点(即标记点阵)的快速算法,这一算法特别适合于专用芯片的平行处理。王选又进一步改进了自己的欧洲专利EP0095536中把标记点阵转换成最终点阵的方法,并主持设计了新的0.7μm线宽专用协处理器芯片,把上述新算法用芯片内部高度并行的操作实现,从而显著提高了中文PostScript的解释速度,而且使图形处理速度大大提高。1993年推出的北大方正93电子出版系统即基于这些新技术。
        王选主持研制的华光和方正出版系统在国内已销售1.5万套以上,累计产值20亿元,并出口海外。中国大陆99%的报纸编排系统,90%的书刊照排系统都采用这一国产系统,香港、澳门、马来西亚、北美绝大多数的华文报,以及台湾一些有影响的报社也采用方正系统。这一技术引起我国报业和印刷业的一场技术革命。华光和方正系统获30多项奖励(包括国家科技进步一等奖),王选于1986年获日内瓦国际发明展览金牌,1987年获毕昇奖,1989年获中国专利金奖,1990年获陈嘉庚奖,1994年获美洲华人工程师学会成就奖,1995年获联合国教科文组织科学奖。
        此外,王选还在国内外刊物上发表过多篇论文,并获国内外九项专利。

京ICP备号
版权所有 何梁何利基金
THE HO LEUNG HO LEE FOUNDATION