数据改变世界-数据谷数据谷

好好睡觉
熬夜的不要

最新发布

语言模型困惑度-数据谷
自然语言处理

语言模型困惑度

selfcs阅读(11)评论(0)赞(0)

PP(S)=2^{-\frac{1}{N}\sum log(P(w_i))} 上面式子中S就是一句话,N 是这句话的长度,如果是中文,那就是分词后词的个数,N的作用实际上也相当于标准化,使得不同长度的句子困惑度可以在一个量级下比较。 Pyt...

自动文档摘要评价方法-数据谷
自然语言处理

自动文档摘要评价方法

selfcs阅读(9)评论(0)赞(0)

自动文档摘要评价方法大致分为两类: (1)内部评价方法(Intrinsic Methods):提供参考摘要,以参考摘要为基准评价系统摘要的质量。系统摘要与参考摘要越吻合, 质量越高。 (2)外部评价方法(Extrinsic Methods)...

经典决策树模型-数据谷
机器学习基础

经典决策树模型

selfcs阅读(27)评论(0)赞(0)

常用的决策树算法有ID3、C4.5、CART,它们构建树所使用的启发式函数各是什么?除了构建准则之外,它们之间的区别与联系是什么?首先,我们回顾一下这几种决策树构造时使用的准则。 人 年龄 长相 工资 写代码 类别 小A 老 帅 高 不会 ...

特征值与特征向量-数据谷
代数学

特征值与特征向量

selfcs阅读(15)评论(0)赞(0)

定义 设A为n阶矩阵, x为非零向量, 若存在数\lambda使得: Ax = \lambda x 成立, 则称\lambda为A的特征值。x为A的属于\lambda的一个特征向量。 例题 求解矩阵A的特征值和特征向量 A = \begin...