初冬的燕园寒意渐浓,未名湖畔才斋内,北京大学《儒藏》编纂与研究中心一片火热,专家学者正就古籍编纂细节以及数字化工作等进行讨论,共同推进这一盛世修典伟大事业。
《儒藏》是新中国成立以来最大规模地系统整理海内外儒学典籍的一项基础性文化建设工程,分《儒藏》“精华编”编纂与全本《儒藏》编纂两步。
已出版的《儒藏》“精华编”
经过20余年的持续努力,目前,《儒藏》“精华编”中国部分510种282册全部整理完成,已由北京大学出版社出版,总字数近2亿。韩国之部、日本之部和越南之部正在推进中。“这标志着《儒藏》‘精华编’主体部分顺利完成,全本《儒藏》编纂工作已正式启动。”北京大学副校长、《儒藏》编纂与研究中心主任王博表示。
同时,“精华编”数据库也试运行上线,通过数字人文的最新成果运用,更好地整理、传承、展示儒学经典,为弘扬中华优秀传统文化作出新贡献。
超时代的意义
在源远流长的中华文明中,孔子开创的儒家占据着特殊重要的地位,是中国传统文化的主体,对世界文明亦有深远影响。但千百年来,始终没有一部完备的儒家著述总集。尽管明清两代就有学者倡议并试图编纂《儒藏》,却终因工程浩大而未能实行。
已故中国著名哲学家、北京大学哲学系教授汤一介曾认为:“这不仅与儒家在中国传统文化中的主流地位极不相称,更不能适应中国乃至世界儒家文化研究的迫切需要。”本世纪初,他提出编纂《儒藏》,得到了季羡林、张岱年、饶宗颐、李学勤等先生和众多学者的支持。
于是便有了围绕《儒藏》编纂的如下时间线——
2002年,北京大学广邀专家学者,举办了多次《儒藏》项目论证会;
2003年,以汤一介先生为首席专家的“《儒藏》编纂与研究”作为哲学社会科学研究重大课题攻关项目在教育部立项,季羡林先生任首席总编纂;
2004年,为给该项目实施提供有力保障,北京大学《儒藏》编纂与研究中心成立,负责组织实施编纂工作,《儒藏》工程正式启动;
2014年,“汤先生去世后,由我担任首席专家,李中华教授、魏常海教授实际担负起执行总编纂的职责,继续推进‘精华编’的工作。”王博说。
这是一项规模宏大的学术文化工程,任务十分艰巨,凝聚着几代人的心血,从汤一介先生、庞朴先生、孙钦善先生、安平秋先生四位总编纂,到以李中华教授、魏常海教授、王博教授为代表的编委们,再到更年轻一辈的学人,无不全心投入,殚精竭虑。
现已80岁高龄的北京大学哲学系教授魏常海的案头上,《儒藏》工程的资料整齐摞放,他认为,编纂《儒藏》有其超时代的意义。“之前儒学文献都是零散化的或影印式的整理,而《儒藏》是系统性规模化的整理和编纂,是更有价值的基础性的学术工作。”他进一步阐释,通过系统且专业化的整理和集大成,不仅对当代中国,更是为世界、为后世提供了一个了解中国传统文化主流、了解儒学的可靠版本,这是《儒藏》无可替代的价值意义所在。
《儒藏》整理手稿
拥抱数字化
近几年,随着技术的快速更迭进步,数智化时代到来,数字人文领域亦发展迅速,在古籍整理、研究和普及中的作用日益显著。
从相关顶层设计的加强中可见其重要性。2022年4月,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,提出推进古籍数字化、加强古籍数字化资源管理和开放共享等。同年5月,两办印发《关于推进实施国家文化数字化战略的意见》明确,到2035年,中华文化全景呈现,中华文化数字化成果全民共享。国家“十四五”规划纲要提出,实施国家古籍数字化工程。
如此背景下,北大和《儒藏》也积极利用数字人文的最新成果,推进古籍数字化,搭建教育、学术和国际交流综合平台,使资源得到最大化利用。
自2022年起,北大与字节跳动共开展两期“古籍数字化与智能化开发与利用项目”,字节跳动共捐赠1500万元,支持项目资源建设、数据加工以及学术活动开展。由双方共同设计、字节跳动建设研发的古籍数字化平台“识典古籍”于2022年10月正式上线,为公众提供超过1万本数字化古籍,并持续开展面向行业、高校学生、公众的数字化古籍学术活动。
“识典古籍”首页截图
“‘识典古籍’是面向公众免费开放的古籍资源平台。”北京大学数字人文研究中心主任王军介绍,对《儒藏》编纂工作来说,“识典古籍”一方面可以大大提升整理古籍的效率,原本全需手工的整理过程,在平台上效率可成倍提升;另一方面可提升团队协作效率,分布式协作平台的特点,使项目管理、任务分配、审核校对等环节都可在线上实现。
自动文字识别、自动标点、自动分段、自动校勘、自动翻译……可以说,依托功能强大且丰富的平台功能,“识典古籍”形成了全流程的古籍整理体系。
同时,在数智化时代,“识典古籍”平台前端为大众提供清晰简洁且功能丰富的古籍阅读界面,后端作为整理平台向广大志愿者开放,在智能手段的辅助下,将传统古籍加工成易于理解的文本。
技术使专业门槛限制得以打破,任何通过培训的志愿者都可担任“校书官”的角色,负责比对自动文字识别结果与古籍影像,在实践中体验古籍整理的魅力。
就在2024年12月9日,北京字节跳动公益基金会向北京大学教育基金会一次性捐赠2500万元,以支持北京大学更好地组织《儒藏》的编纂与研究工作。北京字节跳动公益基金会理事长张羽说:“《儒藏》工程中的很多工作是可以在人工智能技术的辅助下被解决和提效的,我们希望通过‘识典古籍’智能整理平台助力《儒藏》数字化整理。”
走出象牙塔
作为可以传世的经典著作,《儒藏》不能只收藏在象牙塔里,还需推向社会,面向大众。
在《儒藏》“精华编”编纂过程中,没有采取相对容易的影印方式,而是采取繁体竖排、现代标点附校勘记的形式,既方便现代读者阅读,也为之后与数字化接轨提供了必要基础。
张羽表示,未来《儒藏》的相关成果将陆续在“识典古籍”阅读端上线,实现全民共享,让中国传统文化、儒家文化能够被更多人以更方便的方式去检索和阅读。
字节跳动的这次捐赠无疑为《儒藏》的编纂及数字化工程提供了更大底气。“在数字化关键环节上,让我们有了启动的最基本保障,而且在后续数字技术的运作当中,也有了经费保证。”魏常海说。
从更广阔的维度看,字节跳动对古籍数字化与智能化的资助,目的是让更多古籍能够以数字形态被更多人利用,给大众带来精品古籍阅读体验,同时推动优秀古籍编纂工作及科技成果转化。
具体来说,目前,“识典古籍”公益性古籍阅读平台已提供1万余部古籍全文阅读检索,包括首次公开的40册《永乐大典》及其他经史子集等数字化古籍内容。此次计划合作引入的全本《儒藏》多为经过精准标点、精审校勘的内容,将有效支持“识典古籍”古籍资源扩充,为更多用户带来精品的古籍阅读使用体验。
科技成果转化是北京字节跳动公益基金会的重点资助范围。此次字节具体是与北京大学《儒藏》编纂与研究中心合作,将借助数字化形式推动《儒藏》编纂工作及数据库建设,同时持续提升“识典古籍”平台产品功能优化。
如今,全本《儒藏》编纂工作已在紧锣密鼓展开,《儒藏》编纂与研究中心副主任沙志利表示:“全本选目过程中最难的就是要在存世的近20万种古籍、50万个版本中挑出符合《儒藏》入选标准的书,剔除重复,有序编排,既要考虑到实用性,又要考虑到理论自洽。”
而将古籍编纂从纸质信息环境迁移到数智化信息环境,能极大程度节省研究者的精力和时间,由人工智能完成枯燥繁琐、机械重复的大部分工作,专家只需进行专业程度高和需要重点解决的工作。同时,编审校等环节可以在数字化平台上同步,加快编纂进度。
如是优势还有许多,这是一个等不得也急不得的工作,《儒藏》工程的首席总编纂季羡林先生在工程启动之初就提出:“《儒藏》的好坏,全在质量。要尽量减少错误,宁可慢一点,也要保证质量。”
《儒藏》编纂与研究中心制定了科学的整理体例和严格的学术把关制度,负责出版的北京大学出版社实行严格的编校流程,以及《儒藏》编纂团队在底本选择、标点校勘等方面皆秉持严谨审慎、精益求精的专业态度——更可靠、更有价值的《儒藏》文本,正加速孕育,以期在创造性转化和创新性发展中赓续中华文脉。
来源:瞭望东方周刊
来源:新华社