您现在的位置是:首页 >学无止境 >[Algorithm] 科学家的h-index的理解与算法实现(Python)网站首页学无止境
[Algorithm] 科学家的h-index的理解与算法实现(Python)
简介[Algorithm] 科学家的h-index的理解与算法实现(Python)
1. h-index有什么用?☕️
h指数是一种学术评价指标,用于衡量学术作者的学术影响力和产出数量之间的平衡。通过分析作者的论文引用次数来计算,考虑了作者的高引用论文数量以及这些论文的引用次数。
2. h-index的定义是什么??️
一个学者的H指数是指TA的论文数量中至少有h篇论文被引用了至少h次,而其他论文的引用次数不超过h次。
3. 如何计算h-index? ?
假设有一个研究人员,他的论文被引用次数如下:
论文1:10次
论文2:8次
论文3:5次
论文4:3次
论文5:2次
首先,将论文按照引用次数从高到低排序:
论文1:10次
论文2:8次
论文3:5次
论文4:3次
论文5:2次
然后,从最高引用次数的论文开始计数,找到最大的h值,即至少有h篇论文被引用了至少h次。在这个例子中,因为,10 >= 1; 8 >= 2; 5 >= 3; 3 !>= 4
我们可以看到有3篇论文满足这个条件(论文1、论文2和论文3)。因此,该研究人员的H指数为3。
4. 编写算法实现 ?
⚠️:注意极限情况下的细节问题。
def h_index(arr):
if len(arr) == 0:
return 0
list(arr)
arr.sort(reverse=True)
for index, num in enumerate(arr):
if index + 1 == len(arr):
return index + 1
if index + 1 <= num:
continue
else:
return index
if __name__ == "__main__":
print(h_index([8, 7, 6, 5, 5, 4, 4, 3, 2, 1])) # 5
print(h_index([10, 9, 0, 0, 0])) # 2
print(h_index([0, 1, 0, 3, 4, 1, 0])) # 2
print(h_index([0, 0, 0, 0, 0])) # 0
print(h_index([])) # 0
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。