万方数据相似性检测服务升级 精准度更高

2017-9-12 15:11:34   来源:中华网   

论文是科研工作的重要成果,但是学术造假行为却屡禁不绝,为此论文相似性检测成为当下论文审查、质量评估工作的重要工具。市面上的检测系统不少,常用的三大主流系统来自万方数据、知网、维普,各有所长。近日,笔者了解到万方数据文献相似性检测服务进行了全新改版升级,并拿到了体验帐号。接下来就来为大家揭开此次改版升级的“面纱”,也通过此次体验来帮助大家更深入的了解关于论文查重的那些事儿。

对比数据质量、容量大幅提升

在论文检测时,大家最先关注的就是对比数据的质量和容量。据了解,万方检测系列产品目前资源总量大概超过了一亿篇。这次产品升级的重要改变是,一方面对已有的期刊、会议、学位及网页数据的缺刊、漏刊进行了补齐,另一方面新增了比对库数据类型,增加中文专利全文数据等。因此,可以说万方数据检测系统对比数据覆盖的数据范围已经比较完整,有利于用户在更广阔的范围中进行相似性检测。

此次产品升级也对数据质量进行了规范,实现了结构化文本。所谓的结构化文本是指根据文献内容结构,将文本内容解析并映射到指定分类下,以学位论文为例:题名、作者、声明、摘要、章节段落、参考文献、致谢等都将按规则进行结构化处理。通过这种结构化文本,可以改善之前存在的空白及乱码等情况,提升对比数据的质量、检测的精准度,以满足用户对送检内容个性化检测的需求。

算法更精准、智能

目前各大检测系统的算法并不相同,各有特点。升级后的万方数据文献相似性检测服务采用的是“基于正交基的软聚类+分词倒排”的快速检测技术,以及“基于LCS(公共子串)+CP算法(相同词)”的精确匹配技术。

听上去有点复杂,在这里说明下算法带来的效果。以前,小篇幅文章抄袭检测效果不够十分理想,检测结果匹配不精确,仅能进行单个比对库检测。而改版后的系统通过最新的检测技术和匹配技术,可以实现精度更高的小粒度精确检测和精确匹配。基于最新的算法下,检测结果为0的情况将会很少出现,概率大约能控制在2%以内。因此可以说,新版产品检测精度更高,相似内容匹配更准确,检测结果更客观。

更明确的场景化产品细分

旧版本的产品主要为批量新论文检测、单篇新论文检测、已发表论文检测、大学生论文检测等。此次产品升级,基于用户检测场景进行了进一步的产品细分,新增服务研究所、企事业单位、培训机构等客户群体的全新产品。目前针对机构提供的专属服务包括万方检测的硕博论文版、职称论文版、本科论文版、学术预审版、作业检测版。此外更推出了面向个人提供的专属服务,提供万方检测的个人文献版,也是为了方便个人用户在论文送审发布之前的自检自查。万方数据的产品相对而言更具完整性,可以满足企事业单位、科研院所、高校、图书馆、期刊编辑部、出版社、职称评审以及个人在论文相似性检测上的需求。

增加亮点设计、提升用户体验

万方数据文献相似性检测此次增加了不少针对性的亮点设计,比如职称论文版特有“可能引用本人学位论文相似比”,一页式存档报告便于职称评审过程中档案保存与传递;而学术预审版系统则同时具备新论文检测与已发表论文检测功能,满足无特定检测场景用户的普遍性检测需求。

产品特色功能进一步加强,如“定向检测”。定向检测是指将单篇送检论文与由用户指定的单篇或多篇文献资源进行检测比对,实现一对一、一对多定向性文献检测,这种检测方式可以提升检测的效率,缩短评测的时间。

整体产品在检测流程上也得到了优化,例如部分产品中删除送检前必须添加任务要求,改为通过灵活的文件夹功能管理送检文献;增加了离线检测功能,批量送检文献后可直接离开浏览器,至检测完成后回到系统查看结果。

为了更方便用户,系统提供了简明下载版、详细下载版、简明在线版、详细在线版、在线全文比对版,便于用户针对性阅读与保存。

  结语:

总体而言,升级后的万方数据文献相似性检测服务无论是在对比数据、检测算法、用户体验上都有了很大的改善,产品的场景细分也更好的满足了不同类型用户的个性化需求,再加上针对性的定价,让万方数据成为既具有高精准度又具备高性价比的一款相似性检测产品。据了解,万方数据于2010年3月推出论文相似性检测服务,国内近百家高等学府和核心期刊出版机构已将该系统纳入论文、稿件的评审系统。当万方数据相似性检测走向更高的精准度,相信会获得更多用户的青睐。