有什么算法/解决方案可以用来指示两组范围的相似性(重叠/精度/召回率/...)。
我可以想到(或在网上找到)数百个类似的问题,但从未找到完全相同的,但肯定已经发明了这个“轮子”...
假设输入数据如下:
Real [ ## ### # ] or [(1,2),(4,6),(9,10)]
Predicted [ ## # ] or [(1,2),(4,4)]
输出应该约为50%。
例如,如果我要使用位图AND操作,应该使用区间树还是其他什么?是否有一种好的功能性或简单编写的算法?任何有意义的相似度度量都可以,任何合理的输入格式也可以。
谢谢。
(实际长度约为4000,每个集合中不超过50个间隔)