首页 > 下载中心  > 实用工具  > 文字处理  > 文件下载

ICTCLAS2009版中文分词 2009

评价:
简介:
操作系统: NT/Win2000/XP/2003
文件类型: 文字处理
授权方式: 共享(收费)软件
语        言: 简体中文
版        本:
整理日期: 2009-02-24
联系信息:
下载统计: 597次

中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级7次,目前已经升级到了ICTCLAS2009
用户词典接口扩展
用户可以动态增加、删除用户词典中的词,调节分词的效果。提高了用户词典使用的灵活性。
分词粒度可调
可以控制分词结果的粒度。共享版本提供两种分词粒度,标准粒度和粗粒度,满足不同用户的需求。
词性标注功能加强
多种标注级的选择,系统可供选择的标注级有:计算所一级标注级,计算所二级标注集,北大一级标注集,北大二级标注集。
关键词提取
自动抽取出能很好地代表文档主题的若干个词或短语。关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤、文档摘要等各种智能文本信息处理领域,具有很好的应用价值。
指纹提取
根据文章的内容,结构,词语间的关系,分析出能够表示该文章的语义指纹,使用数字序列表示。

特别提示:
1、本站所有软件及资料皆从互联网收集整理而来,仅供个人试用、教学和学习交流之用,请勿用于商业目的。
2、如需购买正版软件,请向软件著作者或公司联系。
3、若有侵犯您的软件版权,请告知,以便我们修正和撤消。
下载地址:
本网站不再提供该文件下载
文件大小:9.68 M
首页 | 国际工业自动化 | 造车网 | 汉南国译 | 用户注册 | 下载中心 | 主题信息 | 免责声明 | 关于我们
北京市朝阳区广渠门外大街8号优士阁B座1703  电话: 010-58612588 传真: 010-58612665
Copyright ©1997-2024 blueai.net.cn All rights reserved