Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API - 开源中国社区
Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API
vz 2019年03月13日

Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API

vz vz 发布于2019年03月13日 收藏 47

开发四年只会写业务代码,分布式高并发都不会还做程序员? >>>  

Go 语言高效分词,支持英文、中文、日文等

词典用双数组 trie(Double-Array Trie)实现, 分词器算法为基于词频的最短路径加动态规划, DAG 和 HMM (Viterbi) 算法分词, 新增 API 基本和结巴分词保持一致.

支持普通、搜索引擎、全模式、精确模式和 HMM模式多种分词模式,支持用户词典、词性标注,可运行 JSON RPC 服务。

项目地址: https://github.com/go-ego/gse

Snake River

Add

  • [NEW] Add more common APIs and more examples
  • [NEW] Export seg.Find() function
  • [NEW] Add AddToken and AddTokenForce func
  • [NEW] Update dictionary code, add LoadNoFreq and MinTokenFreq parameter configuration
  • [NEW] Update examples code, add more examples and documents
  • [NEW] Optimize benchmark test tools code
  • [NEW] Add seg.Find() test
  • [NEW] Add AddToken and AddTokenForce test code
  • [NEW] Add crf.go file directory

Update

  • [NEW] Add more hmm is bool judge
  • [NEW] Update test dictionary and example code
  • [NEW] Update segmenter test code
  • [NEW] Add clear some internal api name and update godoc
  • [NEW] Add go1.12.x remove go1.10.x
  • [NEW] Add AddToken and AddTokenForce  example code
  • [NEW] Add custom dictionary example to example.go
  • [NEW] Update godoc
  • [NEW] Update CHANGELOG.md

Fix

  • [FIX] Optimize code wait todo load model
  • [FIX] Fixed some README.md benchmark
  • [FIX] Fixed link break
  • [FIX] Fixed goroutines benchmark code open path
本站文章除注明转载外,均为本站原创或编译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动共创开源社区。
转载请注明:文章转载自 开源中国社区 [http://www.oschina.net]
本文标题:Gse v0.40.0 发布,Go 高性能分词,增加更多常用 API
分享
评论(7)
最新评论
0
先安装一下go语言
0

引用来自“Nathan416”的评论

看了,不错。
🤝
0

引用来自“houseme”的评论

好东西哦 go go go ~!
🤝
0

引用来自“lemonwater”的评论

能不能用来做电商网站的内部的搜索?
可以
0
看了,不错。
0
能不能用来做电商网站的内部的搜索?
0
好东西哦 go go go ~!
顶部