首页>>学术检索

基于写作风格的中文Web信息作者同一认定方法

标题: 基于写作风格的中文Web信息作者同一认定方法
英文标题: Chinese Web Information Identical Cognizance Method Based on Stylometry
作者: 马建斌,滕桂法,常淑惠
英文作者: MA Jian-bin,TENG Gui-fa,CHANG Shu-hui
出版时间: 2011-01-01
机构: 河北农业大学
关键词: 写作风格,中文,Web信息,同一认定,支持向量机
英文关键词: writing style,Chinese,Web information,identical cognizance,support vector machine
刊名: 郑州大学学报(理学版)
英文刊名: JOURNAL OF ZHENGZHOU UNIVERSITY(NATURAL SCIENCE EDITION)
ISSN: 1671-6841
期号: 043
卷号: 002
基金: ^A河北省自然科学基金^BF2006000537^D1
页码: 52-56
分类号: TP391
摘要: 为了阻止网上非法信息现象发生,提出了一种同一认定Web信息作者的方法,通过分析中文Web信息作者的写作风格,提取能表达Web信息作者写作特点的三种特征,包括词汇特征、结构特征和格式特征,利用支持向2机分类学习算法,同一认定Web信息的作者,为计算机取证提供证据.在Blog、电子邮件数据集上实验的分类识别正确率超过8000,表明所提出的方法是有效的,用于计算机取证是切实可行的.
英文摘要: To prevent illegal information in the Internet from happening,one Web information identical cognizance method was provided.By analyzing Chinese Web information author''s writing style,lexical features,structural features,format features which could express Web information author''s writing habit were extracted.Support vector machine algorithm was used to cognize Web information''s author identically.The purpose of the method was to investigate evidence to computer forensic.The accuracy exceeded 80 percent by e...