0
点赞
收藏
分享

微信扫一扫

NLP之文本情感分析的完善

AbrahamW 2022-01-12 阅读 53
pickle.dump(obj, file,[protocol=None])
  • pickle模块可以将任意的对象序列化成二进制的字符串写入到文件中。
    还可以从文件中读取并且转为写入时候类型。
  • 存储:pickle.dump(obj, file,[protocol=None])
    序列化对象,将对象obj保存到文件file中去
这个报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x93 in position 596: illegal multibyte sequence
  • 在open()中加上
    encoding='utf-8'
  • 编码问题

torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2, scale_grad_by_freq=False, sparse=False)

  • num_embeddings - 词嵌入字典大小,即一个字典里要有多少个词。
  • embedding_dim - 每个词嵌入向量的大小。
model.parameters()
  • parameters()会返回一个生成器(迭代器),生成器每次生成的是Tensor类型的数据.
举报

相关推荐

0 条评论