小百科
百科知识指南
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
文章总数 50000  • 
小百科 › 标签  ›  文本分类
飘逸的领带  · 中文分词 博客园 文本分类 文本分析  ·  3 月前
2017年5月16日 ... 文本的向量表示和文本特征提取 · 精确模式,试图将句子最精确地切开,适合文本分析; · 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是;...
飘逸的领带  · 中文分词 自然语言处理 文本分类 云系统  ·  3 月前
2018年1月16日 ... 出于对大规模数据计算需求的考虑,spark 的词频计算是用特征哈希(HashingTF)来计算的。特征哈希是一种处理高维数据的技术,经常应用在文本和分类数据集上。
飘逸的领带  · spark 文本分类 spark源码分析 mllib  ·  3 月前
2017年1月22日 ... 基于Spark的行为日志分析系统设计与实现.zip · 它支持批处理、交互式查询(Spark SQL)、流处理(Spark Streaming)和机器学习(MLlib)等多种应用场景,使得数据;...
朝气蓬勃的面包  · 大数据 上下文 自然语言处理 文本分类  ·  3 月前
2023年6月28日 ... 由于预训练模型已经通过大规模无监督学习进行了初始化,微调过程通常只需要较少的训练数据和较少的迭代次数。 微调的目标是将预训练模型的泛化能力与目标;...