第四节文本情绪分析（第9页）

好书推荐

女神angler董事长赘婿电视剧36集免费完整观看欲拒还迎没想到你是这样的人作文300字遗嘱夫妻双方共同立吗提灯映桃花周晖真身是什么心跳失调我全家是穿来的免费阅读岁岁长宁目成心许全文免费阅读虫族恋爱法则38 青梅熟了笔趣阁半人半尸的mm的无限道武者路无弹窗弃女医妃王爷宠妻无度没想到你是这样的白月光百度镜花缘歌曲最新的华娱一盏逢春炩岚全文免费阅读女帝的总管我本闲凉by时镜TXT 变成丧尸后我面瘫了42 在夏夜熙攘之前by浮瑾免费阅读岁岁长宁百度水浒传萌娘百科囚禁身心强制爱阶下囚君上带球跑偏执竹马爱我心跳失律怎么办倒数说爱你电影免费观看不会说话的omega百度

天才一秒记住【畅想小说网】地址：http://www.cxtra.net

下述参数表示对每个输入词向量训练函数的句子迭代的次数。

这可以理解为用

来向训练函数中输入数据的迭代器的迭代次数，通常情况下，训练函数第一

次接收数据用来收集单词并计算词频，第二次及以后，用来做神经网络训练。

因为会迭代iterations+1次，所以此参数至少为1。

也可以更大，用以增加对

每个输入的训练次数，但训练速度会更慢。

现在模块的训练函数中，指明了

build_vo操作，所以就是训练一次。

这样做，而不是直接用

gensimodels.Word2Vec（corpus）是为了可以处理输入数据不能重复的情

况，扩展性更好。

'''

&ions=1

n_exposures=10#训练中，出现频率低于10次的词会被忽略

window_size=10#训练中考虑的上下文的最大长度

batch_size=32

n_epoch=10

ih=100

#并行cpu的数量，可设置为cpu的核心数量

ultiprog.t（）

#定义加载语料库函数

defloadcorpus（）：

#读取语料库，文件格式txt，编码utf-8

corpus=code（'语料_sep.txt'，'w'，'utf-8'）

source=code（"语料.txt"，eng='utf-8'）

line=soure（）

#分词

whileli;"：

&rip（'n'）

&=jieba.e，cut_all=False）#精确模式

output=''.joi））#空格拼接

corpus.write（output+''）#空格取代换行'rn'

line=soure（）

else：

corpus.write（'rn'）

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！

如遇章节错误，请点击报错(无需登陆)

上一章目录加书签下一章

新书推荐

星宝三岁半被六个舅舅团宠了初唐峥嵘剑装直播写纯爱文的我在虫族封神混沌冠冕帝霸谍影风云高武：我有一个合成栏超级全能系统老祖她靠快穿修仙成神太太请自重全职高手之世邀赛同人青珂浮屠我在民国当道士从洪荒逃走当幕后黑手我真不是大佬港综世界完美人生麻衣道祖问鼎之谋局者玄门妖王铁血强国洪荒之妖皇逆天逃荒：她从空间掏出千万物资魔王追妻：纨绔妖神妃开局爆出熟练度面板