首页 理论教育 数据样本选取:手工操作的优化

数据样本选取:手工操作的优化

时间:2023-07-03 理论教育 版权反馈
【摘要】:中国裁判文书网命名方式通常为“原告+被告+案由+审判程序+案件类型”,所以为提高检索效率和准确率,通过“高级检索”进行。截至2021年3月27日,在“高级检索”菜单中选择“判决结果:会展”,搜索结果显示共检索到3688篇文书,再对无关案件进行排除,最终得出真正与“会展”有关的案例。这种基于手工操作获取的数据,简称“手工数据”。但是直至2021年4月初,2020年审结的会展相关案件仍未完全发布至中国裁判文书网。

数据样本选取:手工操作的优化

1.数据获取方式与步骤

手工案例整理主要针对我国各级法院在2016—2020年所审理的会展企业(含会展行业协会)涉诉案件。中国裁判文书网命名方式通常为“原告+被告+案由+审判程序+案件类型”,所以为提高检索效率和准确率,通过“高级检索”进行。截至2021年3月27日,在“高级检索”菜单中选择“判决结果:会展”,搜索结果显示共检索到3688篇文书,再对无关案件进行排除,最终得出真正与“会展”有关的案例。这种基于手工操作获取的数据,简称“手工数据”。

2.手工检索结果及不足(www.xing528.com)

案例检索整理至2021年3月27日。但是直至2021年4月初,2020年审结的会展相关案件仍未完全发布至中国裁判文书网。在检索到的3688篇案件文书基础上,对中国裁判文书网重复发布的案件进行了去重处理,把合并审理且案号相连的会展案件合并处理为一个案件。数据最终清理完毕后,共整理出会展企业结案案件1734件,这些案件包括一审终审案件、二审终审案件、申请再审案件以及案件执行。

限于检索方式对数量的限制以及人力负担,此次案件整理并没能涵盖所有的会议、展览、演艺和赛事等企业和活动类型。另外,由于访问量巨大,中国裁判文书网也会出现卡顿、乱码等检索状况,这些都或多或少地影响了人工检索。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈