CS224N lecture01 笔记

发布于 19 天前

仅仅列出提纲和简略描述 Slides WordNet 来自NLTK中的一个工具,可以实现得到词典中同义词等功能 Discrete …


一些经常用的Linux命令

发布于 2020-04-02

做毕设要用到老板实验室里头的显卡,全都运行在linux服务器里头。这些命令啥的和单词一样我总是记不住,干脆集中一个地方放着然后复制 …


ELMo源码阅读流水账

发布于 2020-03-01

一个关于allennlp中ELMo实现的源码阅读笔记 前向 1. 从输入开始 输入是经过分词,去停用词等操作后的语料库,可以有一些 …


ELMo笔记

发布于 2020-02-15

Q: ELMo相比之前的word embedding来说有什么进步的地方? A:之前的word embedding方法比如word …


bangumi接口二三事

发布于 2020-01-30

寒假在家瞎折腾,想通过调用bangumi接口获得的数据丰富下个人blog的acg清单页面,流水账记录下杂七杂八的东西。 1. 获得 …


ML中的小tips(不定期更新)

发布于 2019-11-25

1.测试集与验证集在标准化(standardisation)时,要使用训练集中一样的参数,比如说训练集的均值与方差。 稍微查了一下 …


word2vec模型的参数更新过程(三)

发布于 2019-11-21

优化模型效率 训练一个隐藏层→输出层的权重矩阵W‘是非常耗费资源的(计算yj),有下面两种措施可以提高效率。 1. Hierarc …