开源工具支持的专利数据清洗流程研究
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

中国医学科学院中央级公益性科研院所基本科研业务费“科技创新环境下医学科研机构科技成果转化能力评价研究”(项目编号:2017PT63004);中国医学科学院医学与健康科技创新工程“医学科技创新评价与卫生服务体系构建研究”(项目编号:2016-I2M-3-018)。


Study on Patent Data Cleaning Process Supported by Open Source Tools
Author:
Affiliation:

Fund Project:

  • 摘要
  • 图/表
  • 访问统计
  • 参考文献
  • 相似文献
  • 引证文献
  • 资源附件
  • 文章评论
    摘要:

    分析专利数据清洗需求,提出专利数据清洗步骤和框架,包括数据导入、规范、字段拆分、机构清洗、数据标引等环节,对可利用的开源工具进行对比分析并以OpenRefine为例开展实践研究。

    Abstract:

    The paper analyzes patent data cleaning requirements, proposes patent data cleaning procedures and frameworks including data input, standards, field split, organization cleaning, data indexing and other sections, carries out contrastive analysis on available open source tools and makes a practical study by using OpenRefine as an example.

    参考文献
    相似文献
    引证文献
引用本文

钟华,李艳梅,安新颖.开源工具支持的专利数据清洗流程研究[J].医学信息学杂志,2019,40(5):60-64

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:2018-12-07
  • 录用日期:
  • 在线发布日期: 2019-06-14
  • 出版日期:

扫码关注

官方微信