当前位置: 首页 > news >正文

法律垂直问答网站怎样做/seo工资

法律垂直问答网站怎样做,seo工资,做网站 怎么发布,怎么做电商网站汉语分词一直来说都是进行文本分析的瓶颈,这里介绍一个汉语分词系统ICTCLAS,全球很受欢迎的汉语分词开源系统,曾获得首界国际分词大赛综合排名第一,国家973评测第一名;支持词典,多级词性标注,支…

汉语分词一直来说都是进行文本分析的瓶颈,这里介绍一个汉语分词系统ICTCLAS,全球很受欢迎的汉语分词开源系统,曾获得首界国际分词大赛综合排名第一,国家973评测第一名;支持词典,多级词性标注,支持人名、地名、组织名,分词速500KB/s左右,分词精度98.45%,API不超过100KB,各种词典数据压缩后不到3M。一个非常优秀的分词系统,具体下载地址:http://ictclas.org/

下面是它的可视化界面:

点击查看原图

       该分词系统是开源的,可以供多种程序语言API进行调用 ,下面介绍一个java调用方法:

首先,下载java相应的win平台下的api,网址:http://ictclas.org/ictclas_feedback.aspx?packetid=50&packeturl=down/50/ICTCLAS50_Windows_32_JNI.rar

然后,解压打开API文件夹,里面共有8个文件

点击查看原图

新建一个java项目,除ICTCLAS文件夹外,所有的文件均拷到java项目的根目录下,ICTCLAS文件夹整个拷到java项目中的src文件夹中,以供调用,如下:

  • Data目录:主要存放系统自带的各个词典文件、词性标注映射集及用户自定义词典等,在初始化时会根据配置文件的配置信息加载本目录下的词典
  • Configure.xml文件:系统配置文件,主要有data目录的路径信息、日志文件信息、词典修改信息等
  • usr.lic:授权文件,缺少合法的授权文件将无法成功加载
  • ICTCLAS50.dll:ICTCLAS的动态链接库,各个接口的实现

点击查看原图

 

ICTCLAS_Init及ICTCLAS_Exit接口之所以放在一块是因为,无论在什么程序下,这两个接口都应该被调用。

1、ICTCLAS_Init(byte[] sPath)接口:

    * Method:     ICTCLAS_Init<!读取配置文件,加载词典等>
    * Parameter:  byte[] sPath<!配置文件configure.xml,授权文件user.lic及data文件夹所在路径的字节编码 >
    * Returns:      bool<!初始化是否成功>
    * Description: 调用其它任何接口前,必须保证本接口调用成功!

2、ICTCLAS_Exit()接口:

    * Method:     ICTCLAS_Exit<! 退出,释放相关资源>
    * Returns:     ICTCLAS_API bool<! 退出是否成功>
    * Description: 所有操作完成后,请调用本接口释放相关资源!

下面是给出的测试代码:

package tokenization;
import ICTCLAS.I3S.AC.ICTCLAS50;
public class test {public static void main(String[] args){       ICTCLAS50 testICTCLAS50 = new ICTCLAS50();try{//分词所需库的路径String argu = ".";//初始化if (testICTCLAS50.ICTCLAS_Init(argu.getBytes("GB2312")) == false){System.out.println("Init Fail!");return;}else {System.out.println("Init Succeed!");}String sInput="点击下载超女纪敏佳深受观众喜爱。禽流感爆发在非典之后。";byte nativeBytes[] = testICTCLAS50.ICTCLAS_ParagraphProcess(sInput.getBytes("GB2312"), 0, 1);System.out.println(nativeBytes.length);String nativeStr = new String(nativeBytes, 0, nativeBytes.length, "GB2312");System.out.println("The result is :" + nativeStr);testICTCLAS50.ICTCLAS_Exit();}catch (Exception ex){}finally{}}}


结果如下:

点击查看原图

http://www.lbrq.cn/news/1242721.html

相关文章:

  • wordpress启用两个主题/百度seo优化关键词
  • 找人做网站需要多少钱/营销案例最新
  • 怎样建淘宝客网站/网店无货源怎么做
  • 西安网站建设案例/投放广告的渠道有哪些
  • 海口网站建设服务/b2b网站平台有哪些
  • 做外贸没有企业网站/seo英文全称
  • 衡东建设局网站/长春百度推广电话
  • 江门seo方法/进行优化
  • 网上购物软件排行榜/关键词优化推广
  • 动态网站的制作流程/nba体育新闻
  • 付费电影网站源码/网站seo设置是什么意思
  • 万维网站建设/重庆网站推广软件
  • 网站被屏蔽怎么访问/最新热点新闻事件
  • 最专业的网站建设机构/中山网站建设
  • 大型网站 jquery/seo网站优化培训怎么做
  • 做网页到哪个网站找素材/百度云官方网站
  • 专业做网站价格/免费引流app下载
  • 深圳宝安医院的网站建设/怎么做推广
  • 广西建设官方网站/免费网站推广平台
  • 太原网站制作推荐/长沙市最新疫情
  • 做网站骗老外的钱/免费网站建设哪个好
  • 如何制作网站后台/软文营销范文100字
  • wordpress可以放视频播放器/长沙网站托管seo优化公司
  • wordpress一键/北京seo优化外包
  • 企业网站建设方案对比汇报/百度认证号码平台
  • 做网站要提供什么/徐州网站建设
  • 设计好用的网站/快速排名工具免费
  • 国内美妆博主从哪个网站开始做/国内好用的搜索引擎
  • 手机淘宝客网站怎么做的/阿里云网站搭建
  • 省建设厅网站安徽/欧美网站建设
  • Day25-对称二叉树-
  • 知识蒸馏 - 基于KL散度的知识蒸馏 HelloWorld 示例
  • 操作系统:远程过程调用( Remote Procedure Call,RPC)
  • java实现运行SQL脚本完成数据迁移
  • C语言字符函数和字符串函数全解析:从使用到模拟实现
  • SpringCloud(一)微服务基础认识