基于Web数据挖掘的失眠症人群特征分析 |
修订日期:2017-07-05 点此下载全文 |
引用本文:王林峰,晏峻峰,刘欢庆.基于Web数据挖掘的失眠症人群特征分析[J].医学信息学杂志,2017,38(8):64-68 |
摘要点击次数: |
全文下载次数: |
|
基金项目:湖南省高校创新平台开放基金(项目编号:13K076);国家重点学科中医诊断学开放基金(项目编号:2013ZYZD08);湖南省2011数字中医药协同创新中心建设项目。 |
|
中文摘要:对Web数据挖掘中的一些常用方法进行介绍,包括网络爬虫技术、中文分词、关键词提取算法等,通过网络爬虫技术获取在线医疗网站中与失眠相关的数据,对数据进行清洗和分类处理,基于规则对文本数据进行分词、关键词提取,分析失眠患者的性别、年龄分布情况以及症状、病因等特征。 |
中文关键词:Web数据挖掘 分词 失眠 关键词提取 |
|
Analysis on the Characteristics of Insomnia Groups Based on Web Data Mining |
|
|
Abstract:The paper introduces some common methods (including web crawler technology, Chinese words segmentation and keyword extraction algorithm) of Web data mining, acquires the data related to insomnia in the online medical website through the web crawler technology, classifies and processes the data, carries out words segmentation and keywords extraction of the text data based on the rules, and analyzes the gender and age distribution situations, symptoms, causes of disease and other characteristics of patients with insomnia. |
keywords:Web data mining Text segmentation Insomnia Keywords extraction |
查看全文 查看/发表评论 下载PDF阅读器 |