0
点赞
收藏
分享

微信扫一扫

深度解析:用Python爬虫逆向破解某查查加密数据!

香小蕉 2023-12-02 阅读 44

写在前面

这是官方介绍:盘古分词是一个中英文分词组件。作者eaglet 曾经开发过KTDictSeg 中文分词组件,拥有大量用户。作者基于之前分词组件的开发经验,结合最新的开发技术重新编写了盘古分词组件。

盘古分词组件需要配合其字典文件使用,该组件提供了多重输出解决分词粒度和分词精度权衡的问题,可配合Lucene.net一起使用实现精准的全文检索功能。还支持中文词性的识别,当然也支持英文分割。

可通过NuGet获取组件

代码实现

    public static class SplitWordMgr
    {

        /// <summary>
        /// 分词
        /// </summary>
        public static List<string> SplitContent(string word)
        {
            var seg = new Segment();
            ICollection<WordInfo> splitWords = seg.DoSegment(word);
            var words = new List<string>();
            for (int i = 0; i < splitWords.Count; i++)
            {
                words.Add(splitWords.ElementAt(i).Word);
            }
            return words;
        }

    }

 

资源及说明

链接:https://pan.baidu.com/s/1zTHOX5ioTPxQEO2CEhfXlg 
提取码:llos 

请将资源压缩包里的Dictionaries文件夹改名为Dict后,复制到项目的bin目录下。

举报

相关推荐

0 条评论