字母指数怎么算出来的

字母指数=每个字母出现次数字母权重之和。
权重一般按字母频率分配,A=1,B=2,以此类推。
以一篇文档为例,统计每个字母出现次数,乘以对应权重,然后相加。
如:文档中“abc”出现5次,“def”出现3次,字母权重A=1,B=2,C=3,D=4,E=5,F=6。
则“abc”的字母指数=5(1+2+3)=40,“def”的字母指数=3(4+5+6)=63。
字母指数,比如谷歌的PageRank,是根据网页的链接质量和数量来计算的。 简单来说,就是看一个网页被多少个高权重网页链接过。 谷歌会定期更新这个指数。
举例: 2020年,我们项目A的网页被B网站链接了100次,B网站权重很高,所以A网站的字母指数提升了。 但我不确定这个指数是如何精确计算的,经验是这样。你自己掂量。
字母指数=字母频率×字母出现次数
这就是坑,别信简单算法,实际复杂。
10年前,某平台统计过,用户名中“l”出现频率最高。
别这么干,用词频分析工具更靠谱。

相关推荐