黑洞资源笔记
14:33 · Sep 30, 2022 · Fri
用于计算各种文本特性并用它们轻松分析数据集和模型的库
这是一个简单的数据分析工具包,由以下组件组成:
实现多种文本特征
用于计算所有尺度数据的这些指标的工具(单个文本 -> 十亿令牌语料库)
使用计算的特征的工具:
-可视化和分析给定文本语料库上的特征分布
-找出文本属性与模型性能之间的相关性。
该工具包正在进行中,工具和分析仍在添加中。
项目地址
Home