90岁牛津词典在线更新 新词“存活”5年才收录

来源:新民晚报 作者:翟桂叶 玖田​ 发表时间:2019-03-28 17:38

在线更新适应数字时代坚持不放弃纸质出版物

90岁《牛津词典》“变”中求生

词典编纂者伯纳黛特·帕顿正在为《牛津英语词典》起草一个全新的单词条目“snowflake”。这个最早出现在1983年英文文本“每个人都是一片雪花,没有任何两个人一模一样”、意为“雪花”的单词一度用来被指代“千禧一代”,而在2016年它成了一个意指“具有玻璃心的90后年轻人”的热词。像“snowflake”这类帕顿和同事们需要为《牛津英语词典》更新或是新建的单词条目目前总共有大约3万个,并且每年以7000个的速度在增长。

一年修正一个单词

编纂坚持严谨态度

尽管身处在一个“以快为美”的网络时代,但在牛津大学出版社办公室里《牛津英语词典》的编纂者们显得“格格不入”,甚至有人花费一整年的时间来修正“go”这个英文单词的释义。“每个人都觉得我们太慢了,但实际上,这样的处理速度已经是相当快的了。”帕顿说。

“低效”的纸质《牛津英语词典》出版物该不该叫停?它应当如何适应数字时代并生存下去?

对于使用者来说,词典是一份人们使用或曾经使用过的单词清单,可以说明这些单词曾经或者现在的意义。对于编纂者来说,没有比词典更复杂的了,谁使用了这些单词?何时何地?你是如何得知的?哪些词语被收录过,依据是什么?你又如何将这一含义区别于另一个含义?追根溯源,这个单词的词根是什么……

为了要修正《牛津英语词典》中“go”这个单词的解释,帕顿和同事们不仅需要收集这个由两个字母组成的、最古老的英文动词之一的词义变化,甚至还要抓取最近十多年里人们在社交媒体上的口舌之争中使用“go”的痕迹。经过他们的考证,在数千年里“go”出现了多达537种不同的语义,而这耗费了他们12个月的时间。但对于《牛津英语词典》的编纂者来说,他们编纂这样一部词典的目的就是要赋予这些英文单词应有的庄严。

总共花费71年心血

完成世界最大词典

然而,这样费神费力的英语词典编纂工作在16世纪“启动”之初仅仅只是零碎单词的罗列,由古老的盎格鲁-日耳曼语、挪威语、拉丁语和希腊语杂糅而成。但随着16世纪中期的政治动荡和伴随殖民贸易而来的新移民潮,英语这个语言开始充斥着混乱的拼写和词义使用,毫无规范可言。而科学与医学的发展更是“火上浇油”,制造了更多的混乱。1582年,英国历史上一个著名的中学校长理查德·马尔卡斯特呼吁,把“我们在英语中使用的所有词语汇集成一本词典”,明确英语词汇的“正确使用”规则。

1857年,在伦敦语言学会的呼吁下,《牛津英语词典》的前身《新英语词典》的编纂工作开始了,但谁也不会料到它会成为“时间杀手”。1876年,苏格兰教师和文学家詹姆斯·莫里接手主编工作。为了能加快进度,莫里印发了一份倡议书,希望找到志愿者能够协助从报纸和图书馆的书籍中摘抄例句,提供给编纂者用来说明某个单词随着时间发生的变化。

莫里的“人海战术”得到了来自世界各地各行各业2000多名志愿者的响应,他们收集了大约500万条例句。尽管如此,在这个项目正式实施5年之后,编纂团队的工作进度条依然只覆盖了一半A打头的单词。1879年,牛津大学出版社经过商议同意承担出版工作。5年后,《新英语词典》开始定期结册出版,直到1928年第十卷出版,这部词典涵盖了约41.48万个词条和短语,每个条目都有注释、写明了词源,此外还有180万条例句。它也被后人视为第一版的《牛津英语词典》。

尽管“迟到”了太久,出版商对这个“世界最大”的英语辞典的宣传语是“最高权威,没有竞争对手”。而为了庆祝这个花费71年心血最终编纂完成的辞典,英国人更是为之举办了一场晚宴以示庆祝。

遭遇数字时代挑战

纸质词典举步维艰

但在内行人看来,这个大部头的《新英语词典》的缺陷是显而易见的。1928年第一版完成时,A至C的词汇是在将近50年前编纂的,早就不符合当时英语语言发展的最新趋势。其他条目依托的科技知识也落伍了。唯一的解决方案就是修订。

1933年,《新英语词典》第一次增补版出版,同时它也有了新名字《牛津英语词典》。1972年至1986年,第二次增补分四卷出版,新增了共计6.93万多项新词条。1989年,汇集了初版和增补本、20卷的第二版《牛津英语词典》问世。现如今,第三版的修订工作仍在进行过程中。

然而,编纂英语词典是一项永远不可能完成的工作。除了将英语作为第一语言的人口,世界上近四分之一的人口使用英语作为第二语言。从西印度洋群岛到东非,再到威尔士英语、印度英语、中式英语……英语已经成了一门一直处于变化之中的“混合语言”。互联网的发展,尤其是社交网络的流行更加速了这门语言的变化,就像“snowflake”这样一个简单的单词也开始“涉足”更多的领域,甚至你根本无法看出“千禧一代”这个意思与“snowflake”有什么直接的联系。在不同地区、不同媒介中使用的英语正在以越来越快的速度彼此交织,每年都会有大约7000个新单词出现。因此,当1989年3月《牛津英语词典》第二版出版时,有人抱怨说它根本不是什么“新版”词典,只是一个换了排版方式的、早就落伍的旧版词典。

而现在,当人们需要查询某个单词的意思或者使用方法,纸质版的词典或许已经不再是首选,更别提大部头的《牛津英语词典》了。打开电脑,登录谷歌或者维基百科之类的搜索引擎,一查便可知晓;有时你甚至只需要冲着苹果手机上的Siri或者智能音箱大喊一声,便能得到答案。纸质词典的销售濒临崩溃,实体书的出版商纷纷合并或走到了尽头。对于用户来说,如果完全可以通过操作智能手机来查找词义,那为什么还要拿起一本书呢?

科技带来全新工具

内容修订走出纸面

如何让这个90岁高龄的《牛津英语词典》在数字时代重获生机,编纂者必须做点什么。

数字时代给辞典编纂者带来了压力,也带来了新的工具——语料库语言学出现了。在过去,传统的辞典编纂模式通过整理并依据已知的单词及其注释,寻找证据证实编纂者认为的词义。但如今,以计算机为主导的语料库语言学要求编纂者通过数字技术批量获取人们真实使用着的语言,比如社交网络用语等,并以此为依据来编纂辞典。

牛津大学出版社的一名主管兴奋地说,辞典编纂与语料库语言学资源结合,“可以实现一些不一般的事”,这种说法一点也不夸张。目前为辞典提供原材料的语料库所包含的词汇远远超出编纂者最疯狂的想象。整理包含特定词语的短语,可以让编纂者“解开”这个词不同的涵义,观察一个词如何被“误用”,可以发现它的词意重心正在变化。在俚语专家、《牛津英语词典》顾问乔纳森·格林看来,长期以来俚语词典编纂者追踪词汇的不同使用形式的梦想如今终于通过即时交流软件和语料库实现了,甚至他们几乎可以在新词被创造出来的那一刻就及时跟上进度,将其编入词典中。

从与技术“联手”发现新词起,《牛津英语词典》的编纂就走上了一条数字化道路。编纂团队也逐渐意识到,随着更多线上词典竞争对手的出现,《牛津英语词典》的出版也不能再依赖于“慢一步”的纸张印刷,只有借助网络才能实现词典的时时更新。从2000年起,《牛津英语词典》的全部内容修订走出纸面,开始以在线形式呈现,按季度更新,每次更新包含数千个修订过的词条以及数百个新词。

但即时在线更新并不意味着所有新词都会被收录,仍然希望确保自己权威地位的《牛津英语词典》并不愿意被潮流牵着鼻子走,在他们看来,即便在数字时代收录一个新词依然是一件十分严肃的事情。作为规定,一个新词依然需要“存活”5年时间才会被收录进在线版的《牛津英语词典》,因为一旦它被收录进了词典,就不会被删除。

牛津大学出版社全球业务总裁及词典部总裁卡斯珀·格莱斯沃尔已经在牛津大学出版社工作超过20年。从纸质图书印刷到现在的在线词典,他亲眼见证了牛津大学出版社的历史,也见证了整个科技演变的过程及其对行业带来的影响。“我们并不是想要把纸质的字典变成电子的词典,不是一个简单的重复过程,而是希望词典的内容和使用,能够融合在语言学习的过程当中。”格莱斯沃尔说。团队也开始与美国硅谷的一些科技公司合作,将团队搜集到的所有语料交由科技公司转换为智能语言数据,并开发成各种应用程序,为英语学习者提供数字产品和服务。

步入数字时代的《牛津英语词典》依然没有放弃印刷版的想法。“我们会完成的。”《牛津英语词典》现任总编辑迈克尔·普罗菲特坚持道,再版这个大部头的“高龄”词典可能要等到2037年。

翟桂叶 玖田

编辑:白茶
数字报
90岁牛津词典在线更新 新词“存活”5年才收录
新民晚报  作者:翟桂叶 玖田​  2019-03-28

在线更新适应数字时代坚持不放弃纸质出版物

90岁《牛津词典》“变”中求生

词典编纂者伯纳黛特·帕顿正在为《牛津英语词典》起草一个全新的单词条目“snowflake”。这个最早出现在1983年英文文本“每个人都是一片雪花,没有任何两个人一模一样”、意为“雪花”的单词一度用来被指代“千禧一代”,而在2016年它成了一个意指“具有玻璃心的90后年轻人”的热词。像“snowflake”这类帕顿和同事们需要为《牛津英语词典》更新或是新建的单词条目目前总共有大约3万个,并且每年以7000个的速度在增长。

一年修正一个单词

编纂坚持严谨态度

尽管身处在一个“以快为美”的网络时代,但在牛津大学出版社办公室里《牛津英语词典》的编纂者们显得“格格不入”,甚至有人花费一整年的时间来修正“go”这个英文单词的释义。“每个人都觉得我们太慢了,但实际上,这样的处理速度已经是相当快的了。”帕顿说。

“低效”的纸质《牛津英语词典》出版物该不该叫停?它应当如何适应数字时代并生存下去?

对于使用者来说,词典是一份人们使用或曾经使用过的单词清单,可以说明这些单词曾经或者现在的意义。对于编纂者来说,没有比词典更复杂的了,谁使用了这些单词?何时何地?你是如何得知的?哪些词语被收录过,依据是什么?你又如何将这一含义区别于另一个含义?追根溯源,这个单词的词根是什么……

为了要修正《牛津英语词典》中“go”这个单词的解释,帕顿和同事们不仅需要收集这个由两个字母组成的、最古老的英文动词之一的词义变化,甚至还要抓取最近十多年里人们在社交媒体上的口舌之争中使用“go”的痕迹。经过他们的考证,在数千年里“go”出现了多达537种不同的语义,而这耗费了他们12个月的时间。但对于《牛津英语词典》的编纂者来说,他们编纂这样一部词典的目的就是要赋予这些英文单词应有的庄严。

总共花费71年心血

完成世界最大词典

然而,这样费神费力的英语词典编纂工作在16世纪“启动”之初仅仅只是零碎单词的罗列,由古老的盎格鲁-日耳曼语、挪威语、拉丁语和希腊语杂糅而成。但随着16世纪中期的政治动荡和伴随殖民贸易而来的新移民潮,英语这个语言开始充斥着混乱的拼写和词义使用,毫无规范可言。而科学与医学的发展更是“火上浇油”,制造了更多的混乱。1582年,英国历史上一个著名的中学校长理查德·马尔卡斯特呼吁,把“我们在英语中使用的所有词语汇集成一本词典”,明确英语词汇的“正确使用”规则。

1857年,在伦敦语言学会的呼吁下,《牛津英语词典》的前身《新英语词典》的编纂工作开始了,但谁也不会料到它会成为“时间杀手”。1876年,苏格兰教师和文学家詹姆斯·莫里接手主编工作。为了能加快进度,莫里印发了一份倡议书,希望找到志愿者能够协助从报纸和图书馆的书籍中摘抄例句,提供给编纂者用来说明某个单词随着时间发生的变化。

莫里的“人海战术”得到了来自世界各地各行各业2000多名志愿者的响应,他们收集了大约500万条例句。尽管如此,在这个项目正式实施5年之后,编纂团队的工作进度条依然只覆盖了一半A打头的单词。1879年,牛津大学出版社经过商议同意承担出版工作。5年后,《新英语词典》开始定期结册出版,直到1928年第十卷出版,这部词典涵盖了约41.48万个词条和短语,每个条目都有注释、写明了词源,此外还有180万条例句。它也被后人视为第一版的《牛津英语词典》。

尽管“迟到”了太久,出版商对这个“世界最大”的英语辞典的宣传语是“最高权威,没有竞争对手”。而为了庆祝这个花费71年心血最终编纂完成的辞典,英国人更是为之举办了一场晚宴以示庆祝。

遭遇数字时代挑战

纸质词典举步维艰

但在内行人看来,这个大部头的《新英语词典》的缺陷是显而易见的。1928年第一版完成时,A至C的词汇是在将近50年前编纂的,早就不符合当时英语语言发展的最新趋势。其他条目依托的科技知识也落伍了。唯一的解决方案就是修订。

1933年,《新英语词典》第一次增补版出版,同时它也有了新名字《牛津英语词典》。1972年至1986年,第二次增补分四卷出版,新增了共计6.93万多项新词条。1989年,汇集了初版和增补本、20卷的第二版《牛津英语词典》问世。现如今,第三版的修订工作仍在进行过程中。

然而,编纂英语词典是一项永远不可能完成的工作。除了将英语作为第一语言的人口,世界上近四分之一的人口使用英语作为第二语言。从西印度洋群岛到东非,再到威尔士英语、印度英语、中式英语……英语已经成了一门一直处于变化之中的“混合语言”。互联网的发展,尤其是社交网络的流行更加速了这门语言的变化,就像“snowflake”这样一个简单的单词也开始“涉足”更多的领域,甚至你根本无法看出“千禧一代”这个意思与“snowflake”有什么直接的联系。在不同地区、不同媒介中使用的英语正在以越来越快的速度彼此交织,每年都会有大约7000个新单词出现。因此,当1989年3月《牛津英语词典》第二版出版时,有人抱怨说它根本不是什么“新版”词典,只是一个换了排版方式的、早就落伍的旧版词典。

而现在,当人们需要查询某个单词的意思或者使用方法,纸质版的词典或许已经不再是首选,更别提大部头的《牛津英语词典》了。打开电脑,登录谷歌或者维基百科之类的搜索引擎,一查便可知晓;有时你甚至只需要冲着苹果手机上的Siri或者智能音箱大喊一声,便能得到答案。纸质词典的销售濒临崩溃,实体书的出版商纷纷合并或走到了尽头。对于用户来说,如果完全可以通过操作智能手机来查找词义,那为什么还要拿起一本书呢?

科技带来全新工具

内容修订走出纸面

如何让这个90岁高龄的《牛津英语词典》在数字时代重获生机,编纂者必须做点什么。

数字时代给辞典编纂者带来了压力,也带来了新的工具——语料库语言学出现了。在过去,传统的辞典编纂模式通过整理并依据已知的单词及其注释,寻找证据证实编纂者认为的词义。但如今,以计算机为主导的语料库语言学要求编纂者通过数字技术批量获取人们真实使用着的语言,比如社交网络用语等,并以此为依据来编纂辞典。

牛津大学出版社的一名主管兴奋地说,辞典编纂与语料库语言学资源结合,“可以实现一些不一般的事”,这种说法一点也不夸张。目前为辞典提供原材料的语料库所包含的词汇远远超出编纂者最疯狂的想象。整理包含特定词语的短语,可以让编纂者“解开”这个词不同的涵义,观察一个词如何被“误用”,可以发现它的词意重心正在变化。在俚语专家、《牛津英语词典》顾问乔纳森·格林看来,长期以来俚语词典编纂者追踪词汇的不同使用形式的梦想如今终于通过即时交流软件和语料库实现了,甚至他们几乎可以在新词被创造出来的那一刻就及时跟上进度,将其编入词典中。

从与技术“联手”发现新词起,《牛津英语词典》的编纂就走上了一条数字化道路。编纂团队也逐渐意识到,随着更多线上词典竞争对手的出现,《牛津英语词典》的出版也不能再依赖于“慢一步”的纸张印刷,只有借助网络才能实现词典的时时更新。从2000年起,《牛津英语词典》的全部内容修订走出纸面,开始以在线形式呈现,按季度更新,每次更新包含数千个修订过的词条以及数百个新词。

但即时在线更新并不意味着所有新词都会被收录,仍然希望确保自己权威地位的《牛津英语词典》并不愿意被潮流牵着鼻子走,在他们看来,即便在数字时代收录一个新词依然是一件十分严肃的事情。作为规定,一个新词依然需要“存活”5年时间才会被收录进在线版的《牛津英语词典》,因为一旦它被收录进了词典,就不会被删除。

牛津大学出版社全球业务总裁及词典部总裁卡斯珀·格莱斯沃尔已经在牛津大学出版社工作超过20年。从纸质图书印刷到现在的在线词典,他亲眼见证了牛津大学出版社的历史,也见证了整个科技演变的过程及其对行业带来的影响。“我们并不是想要把纸质的字典变成电子的词典,不是一个简单的重复过程,而是希望词典的内容和使用,能够融合在语言学习的过程当中。”格莱斯沃尔说。团队也开始与美国硅谷的一些科技公司合作,将团队搜集到的所有语料交由科技公司转换为智能语言数据,并开发成各种应用程序,为英语学习者提供数字产品和服务。

步入数字时代的《牛津英语词典》依然没有放弃印刷版的想法。“我们会完成的。”《牛津英语词典》现任总编辑迈克尔·普罗菲特坚持道,再版这个大部头的“高龄”词典可能要等到2037年。

翟桂叶 玖田

编辑:白茶
新闻排行榜