开发者友好的NLP库(JavaScript)

winkNLP | #NLP
对比学习在NLP中的应用,很不错的资源汇总

目前的NLP模型在很大程度上依赖于有效的表示学习算法。对比学习就是这样一种技术,它可以学习一个嵌入空间,使相似的数据样本对具有接近的表征,而不相似的样本则彼此相距甚远。它可以在有监督或无监督的情况下使用不同的损失函数来产生特定任务或通用的表征。虽然它最初使视觉任务获得了成功,但近年来,对比性NLP的出版物越来越多。这第一线的工作不仅在各种NLP任务中提供了有希望的性能改进,而且还提供了理想的特征,如任务无关的句子表示、忠实的文本生成、在0-shot和少量设置中的数据高效学习、可解释性和可解释性。

Github | #NLP
百度飞桨发布了一款 NLP 全流程自动化开发平台,用户只需进行简单拖拉拽,无需编写任何算法与代码,即可实现诸多 NLP 应用落地。

其中包括文本分类、文本创作、情感倾向分析、短文本相似度匹配、实体抽取、实体关系抽取、评论观点抽取等任务类型。

近日,该平台已将底层「文心大模型 ERNIE」升级至 3.0,新增了海量中文数据知识储备、小样本快捷训练、任务效果平均提升至90%以上、多场景创作等特性。

针对此项目,开发者们将在本周开放一场公开课,主要讲解 NLP 应用开发的常见问题及解决方案,产业应用落地实现, NLP 项目实战等内容,感兴趣的同学可以参与一下。

在线体验 | 报名地址 | 使用文档 | #NLP
直播时间: 本周四,晚上 20:00
funNLP,几乎最全的中文 #NLP 资源库。包括中英文敏感词、语言检测、中外手机 / 电话归属地 / 运营商查询、名字推断性别、手机号抽取、身份证抽取等内容
NLP 中文学习笔记 作者是来自华中科技大学的硕士生,里面主要记录了一些作者在学习过程中阅读过且感觉不错的论文。对于一些经典或思路很新奇的论文,会进行精读,并写一些阅读笔记同步上传更新至知乎CSDN #NLP
百度技术团队在 GitHub 开源了一个 #NLP 工具包:PaddleNLP

具备易用的文本领域 API, 多场景的应用示例、和高性能分布式训练三大特点,旨在提升开发者在文本领域的开发效率,并提供丰富的 NLP 应用示例。

对该开源项目有兴趣的同学,可参加他们在本周的几场公开课,主要讲解多场景 NLP 任务流设计、快速提升模型效果、机器翻译项目实践等内容。
NLP 开源知识库:NLPer-Arsenal,主要收录 #NLP 竞赛经验贴、通用工具、学习资料等内容,覆盖文本分类、机器翻译、语义解析、实体识别等类别
一份 #NLP 教程列表:NLP Tutorial
内容含有新闻分类、电影评价分类、问答匹配、神经网络机器翻译等等
Mynlp: 高性能、模块化、可扩展的中文NLP工具包 #NLP #工具
 
 
Back to Top