可视化教程开启BERT之旅

评论(0)

翻译自Jay Alammar 的文章:A Visual Guide to Using BERT for the First Time。 近几年,处理语言的机器学习模型的发展迅速。并且驱动了一些数码产品的落地。 本篇文章是一个用 BERT的扩展版本来做句子分类的简...

word2vec 基于 gensim 包的实现以及 预训练模型的再训练

评论(0)

先占个坑,基于 Python gensim模块进行word2vec的训练相对容易,在此基础上根据选择相应的预训练的word2vec 向量,基于自有数据的再训练更符合实际应用。 官方文档 关于模型的训练就不说了,主要说下预训练模型的...

Lucene7 的加权检索(Boost)

评论(0)

总体来说,lucene可以设置两个阶段的权重: 建立索引时对文档设置权重: 然而,在lucene 7.0发布时移除了索引时boost: LUCENE-6819: Index-time boosts are not supported anymore. As a replacement, index-time...

Neo4j导入思知OwnThink开源的知识图谱

评论(54)

环境: 1.Neo4j database: 4.0.1 (是Neo4j graph数据库版本,非 neo4j desktop版本) 2.jdk11 (neo4j 4.0.1要求jdk需要11) OwnThink开源了史上最大规模(1.4亿)中文知识图谱,地址:https://github.com/ownthin...

智能问答

评论(3)

问题: 提交 答案:这是答案 项目介绍: 医药知识问答部分结合开源项目:医药知识图谱 ;通过python自带的wsgi服务器构建HTTP接口;并导入知识实体到Neo4j数据库。实现了医药相关的问答。 3.26号 update :将导入...