月白色的大狒

关注

【LangChain概念】了解语言链️:第2部分

月白色的大狒

关注

阅读 89

2023-08-16

文章目录

        • 分词
          • jieba分词
          • 关键词提取
        • python处理形成共现矩阵
        • gephi导入共现矩阵
          • 过滤边的权重进行优化
        • 最终效果

分词

本文研究不同文章中的关键词出现次数,因此将出现在同一篇文章中的关键词都定义为”共现”。

jieba分词

对不同后缀文件(txt、docx、pdf)进行不同处理,提取文章内容为字符串,之后使用jieba库的lcut函数进行分词。

if path+'.txt' in lis:
        path += 

相关推荐

野见

BPMN: (第2部分 - 事件和网关 )

野见 70 0 0

上古神龙

第2部分:物联网模式在行动

上古神龙 26 0 0

mm_tang

BPMN: (第5部分 - 消息)

mm_tang 182 0 0

南陵王梁枫

BPMN : (第1部分 - 简介 )

南陵王梁枫 107 0 0

闲嫌咸贤

第1部分语言篇-第2章循环结构程序设计-2.5习题

闲嫌咸贤 50 0 0

小典典Rikako

[开心学go语言]2、简单了解语法

小典典Rikako 40 0 0

泠之屋

BPMN: (第4部分 - 子进程)

泠之屋 100 0 0

吓死我了_1799

学习Rust的第22天:mini_grep第2部分

吓死我了_1799 13 0 0

彪悍的鼹鼠

【linux】单行命令-第2部分:Bioinformatics one-liners

彪悍的鼹鼠 59 0 0

捌柒陆壹

洛谷 深基 第1部分 语言入门 第2章 顺序结构程序设计

捌柒陆壹 37 0 0

精彩评论(0)

0 0 举报