基于语义相似度计算的临床诊断自动编码算法研究
投稿时间:2015-10-29    点此下载全文
引用本文:宁温馨,于明.基于语义相似度计算的临床诊断自动编码算法研究[J].医学信息学杂志,2016,37(2):52-56
摘要点击次数:
全文下载次数:
作者单位
宁温馨 清华大学工业工程系 北京 100084 
于明 清华大学工业工程系 北京 100084 
中文摘要:提出一种为中文临床诊断自动进行ICD-10编码的算法,利用分布式语义相似度计算方法计算文本语义相似度,考虑到中文的语言特点,不仅基于词语构建词向量,还基于汉字构建词向量,测试二者对查准率和查全率的影响.结果显示该算法在测试集上获得较高的准确率.
中文关键词:自动编码  语义相似度  分布式语义  ICD-10
 
Algorithmic Research on Automatic Coding of Clinical Diagnoses Based on Semantic Similarity Calculation
Abstract:The paper proposes an algorithm which can implement ICD-10 coding automatically for clinical diagnoses in Chinese and calculate the semantic similarity of texts by the calculation method of distributed semantic similarity. In consideration to the linguistic features of Chinese, it constructs term vectors based on both words and Chinese characters and tests their influences on the precision ratio and recall ration. The results indicate that this algorithm has a higher precision ration in the test set.
keywords:Automated code assignment  Semantic similarity  Distributional semantics  ICD-10
查看全文  查看/发表评论  下载PDF阅读器

京公网安备 11010502037823号

美女meinvmeinvmeinvmeinvmeinv