平面辞书"权威"优势没变 "融媒辞书"是必走之路
一年前,上海辞书出版社将“搜狗百科”告上法庭,认为其提供给用户的词条涉嫌侵权出版社的拳头产品《汉语大词典》;一年后,《汉语大词典》有了正版化的数字资源,在上海书展期间,上海辞书出版社与掌阅科技股份有限公司在沪签订战略合作协议,以特大型汉语语文工具书《汉语大词典》为基础,首次尝试基于“工具书数据开放平台”的产品合作。
掌阅目前为安卓平台最大的阅读品牌,未来,使用掌阅产品阅读的用户,如有汉语查询需求,只需简单操作,即可从工具书数据开放平台调取《汉语大词典》权威释义并予以呈现。
侵权看似“方便”实则“多输”
侵犯《汉语大词典》著作权,影响互联网汉语工具书产品的生态环境,乃至汉语语词的纯净性。
始编于1975年的《汉语大词典》,至1994年12卷出齐。这是我国第一部特大型汉语词典,前后有1000余位作者、编辑参与编纂出版,首次比较完整、系统地勾勒出汉语词汇的轮廓和数千年发展史,是目前我国规模最大的汉语语文工具书。出版方上海辞书出版社则是我国第一家工具书专业出版社,同时承担编纂出版《辞海》《大辞海》等国家重大出版工程。
2018年6月,因认为“搜狗百科”未经许可使用《汉语大词典》词条内容,上海辞书出版社将北京搜狗信息服务有限公司诉至法院,要求赔礼道歉并赔偿2369万余元。目前市面所售《汉语大词典》套装全23册,总计约37万词条、近5000万字。上海辞书出版社诉“搜狗百科”侵权词条共计2633.2万字,约占全部内容的一半。
“搜狗百科”为搜狗公司于2013年开始运作的内容平台,其词条创建多为网友编撰,通过多人协作方式更新词条。搜狗公司将“搜狗百科”定义为信息分享、传播及获取平台。在用户协议中,“搜狗百科”提到,用户在百科上发表的全部原创内容“著作权均归您本人所有”,并表示任何经由百科制作、编辑、保存、上传、下载、发布的内容,均由相应用户承担责任,与搜狗无关。在知识分享大行其道的当下,这场基于互联网又牵涉知识分享的工具书版权纠纷,格外引人关注。
签约仪式上,上海辞书出版社社长秦志华说,《汉语大词典》在过去十多年里,被众多互联网、移动互联网公司甚至个人网站有意无意侵权、盗版,利用其内容资源开发各类产品,或任意增删,或与其他内容混编,导致内容支离破碎、错漏百出,不仅误导读者,侵犯《汉语大词典》著作权,也影响互联网汉语工具书产品的生态环境,乃至汉语语词的纯净性。这些侵权盗版现象,看似“造福”网民、“方便”受众,实际上隐患重重,形成“多输”局面。据悉,海淀区法院已正式立案并启动法律程序,目前已进行两次交换证据工作,即将正式开庭。今年,上海辞书出版社还将对其他侵权公司发起维权行动。
5G时代促进辞书“智能化”
数字时代的辞书用户群发生巨变,“网络原住民”渐成主体,网页检索、APP检索等成为主流。
与维权行动同步的是,探索互联网时代文化产品生产、传播、使用合理模式,一直是摆在辞书编纂机构面前的课题。数字时代的辞书用户群发生巨变,“网络原住民”逐渐成为主体,在辞书查检习惯上,网页检索、APP检索等方式成为主流。
“网络已经是人们遇到问题第一查检的地方。”中国辞书学会会长李宇明认为,平面辞书“内容权威”的优势没有改变,“融媒辞书”是必走之路,要将传统辞书的权威内容与互联网技术结合,形成全新的内容生产方式。换言之,就是将网络辞书的灵活性和传统辞书的扎实内容融合,迎接5G时代和语言智能时代的到来,促进辞书“智能化”。
秦志华回忆称,七八年前,上海辞书出版社曾采用内容授权模式,授权第三方企业开发相关产品。如授权同方知网开发《汉语大词典》数据库版,但因其主要面向机构用户销售,读者知晓度不高,市场影响力有限。更关键的是,作为出版机构,无法掌握终端用户的使用反馈,比如用户经常查检哪些词,哪些词是用户较大查检需求而条目中未收录的等等。没有这些用户反馈,无法有效提升产品,更好地满足用户。去年上海书展期间,辞书出版社推出第一款自主开发的数字应用,依托《中国文学鉴赏辞典大系》打造的中华优秀传统文化权威数字学习与欣赏平台“问道国学”APP。“这款APP取得一定的社会反响,产品评价不错。但通过一年来的运营,我们也认识到,如今移动互联网市场环境下的运营打法,并非传统出版企业在一夜之间就能通过学习掌握并熟练运用的。”
工具书开放数据平台,就是在以上认知和实践的基础上诞生的。所谓“工具书数据开放平台”,首先是把工具书内容按词条最大程度细粒化后,进行结构化加工、云端存储,构建一个系统、可信的工具型数据仓库;其次,通过标准化的数据接口,向合作方开放工具书数据,共享工具书数据,进行合法授权访问;第三,通过第三方应用,将工具书数据动态载入,嵌入各大阅读APP或搜索引擎,以响应和解决不同应用场景、不同用户群体在阅读过程中的检索查阅需要;最终,用户的检索需求也将及时反馈到工具书数据开放平台,为出版机构进一步完善词条数据、增补数据、完善服务提供有效来源和渠道。目前,该平台一期放入的主要是《汉语大词典》(第一版)数据。
是知识服务和商业模式创新
工具书数据具有通用性。有了开放平台,应用开发企业无需重复加工海量高度专业化的工具书数据。
近年来,国内出版社在辞书数字化方面也作出一些探索。2017年,由商务印书馆推出的《新华字典》APP上线,完整收录《新华字典》(第十一版)纸书内容,同时支持动态和静态两种标准笔顺,提供“我来写写看”等功能,通过跟写和默写等交互技术,让学习者了解正确笔顺笔画,再通过由《新闻联播》原播音员李瑞英录制的原声播读及闯关竞赛等内容服务,提供读者在社交网络上分享学习的乐趣。
正在编纂中的《中国大百科全书》第三版,也将采用先进的信息技术和网络技术,结合专家编纂权威性与大众参与开放性,实现文字、图片、音频、视频等内容形式的有机结合,满足互联网时代新需求。
上海辞书出版社将于年内发行的《辞海》(第七版)将同步推出网络版和纸质版,实体书附有二维码,扫描二维码注册会员,就能登陆《辞海》网络版,随时随地查询内容。《辞海》十年一修,第七版修订过程中,开发数字化编纂平台,不仅大幅提升编纂工作效率,也提高《辞海》的内容质量。
上海译文出版社《英汉大词典》(第三版)计划推出微信端网络版、APP版和纸质版三种产品,编纂过程中通过互联网邀请用户提供语料素材。同时,《英汉大词典》现有纸质版内容数字化,读者在线查询的频次也成为编纂参考。“网友提供素材,编辑精加工。我们找的不是简简单单的例句,而是‘例证’。所谓‘证’,就是可以追溯生活的源头,不是编者闷在书斋里拍脑袋想出来的。”主编朱绩崧说。
在业内人士看来,工具书数据开放平台的诞生,对传统出版数字化转型来说,是知识服务的创新,也是商业模式的创新。工具书数据具有通用性,在数据开放平台基础上,下游应用开发企业无需重复加工海量的高度专业化的工具书数据,可以发挥产品设计、产品营销的能力,更好地服务读者。
可持续合作而非掠夺性开发
出版社与互联网企业共建正版授权、分工合作、多方共赢的内容出版产业链,形成良性知识服务生态圈。
辞书转型不仅是中国出版人的课题,以当今世界最知名的百科全书《不列颠百科全书》为例,在2012年售出最后一套纸质出版物后,有着244年历史的纸质版宣告停印。早在上世纪70年代中期,第十五版《不列颠百科全书》就把内容全部制作成电子版。1994年,不列颠百科全书公司又推出网络版,成为网络上的第一部百科全书。发出停印通告后,不列颠百科全书公司总裁豪尔赫·考斯说:“印刷版本并非唯一能成就《不列颠百科全书》的,最重要的是《不列颠百科全书》是实用的,尽力给知识探索者提供专业的知识。”
“上世纪50年代,欧美家庭书架上放套《不列颠百科全书》,就像车库里停辆旅行车或房间里摆台名牌电视机一样,既实用又能彰显身份。后来,数字化日益拷问着词典在物理维度上的存在。”不列颠百科全书公司资深副总裁迈克尔·罗斯曾表示,不列颠百科全书数字版依据不同受众群的知识接受程度和喜好,量身定制阶梯式网站或客户端,为个人、中小学、高校、图书馆打造分层“私人书房”,公司约50%利润来源于此。
对国内辞书出版机构来说,目前阶段,技术是数字化转型的一大掣肘。“出版社数字转型刚起步,没有太多项目锻炼数字技术人才,与技术公司的合作又牵涉到对方人员的稳定性,难免磕磕绊绊。”曾有词典编纂负责人这样表示。
出版社与互联网企业各展所长的“数据开放平台”将成为一种转型模式。“数字化转型的首要目标是在互联网时代重塑品牌工具书影响力,一方面通过借鉴吸收互联网百科产品特点,为用户提供权威准确系统的知识服务;另一方面,辞书编纂机构应坚持内容提供商的角色定位,与互联网企业就内容、流量、数据等方面探索合作。”上海世纪出版集团副总裁毛文涛说,数据开放平台维护了产业链各主体的利益诉求,是可持续的合作模式,而非掠夺性的开发。出版社与互联网企业共建正版授权、分工合作、多方共赢的内容出版产业链,从而形成良性的知识服务产业链和生态圈。
- 标签:
- 编辑:夏学礼
- 相关文章