我正在开发一个手语识别应用程序,希望使用隐马尔可夫模型作为分类阶段。这意味着我将对手势/姿势进行分类,以获取相关字母或单词。
目前,我已经完成了第一阶段的手部检测。我可以获取一些参数(特征),例如:手的凸包、凸点、质心、旋转椭圆/矩形的边界(例如,在旋转方面获得所需的任何角度)、手的轮廓和矩。这些都可以通过openCv实现。
我的问题是:一旦我拥有了所有这些特征,如何执行'特征提取'阶段?也就是说,如果一个机器学习算法,例如HMM需要一组概率,我该如何使用上述信息?
一个想法是创建一个特殊的数据结构,其中包含这些信息,以唯一地识别每个手势,但我该如何将其输入到机器学习技术中? (在这种情况下,隐马尔可夫模型)
请问是否能指导我至少在这个阶段应该搜索什么,或者指导我显示我真正遇到的困难是什么?
目前,我已经完成了第一阶段的手部检测。我可以获取一些参数(特征),例如:手的凸包、凸点、质心、旋转椭圆/矩形的边界(例如,在旋转方面获得所需的任何角度)、手的轮廓和矩。这些都可以通过openCv实现。
我的问题是:一旦我拥有了所有这些特征,如何执行'特征提取'阶段?也就是说,如果一个机器学习算法,例如HMM需要一组概率,我该如何使用上述信息?
一个想法是创建一个特殊的数据结构,其中包含这些信息,以唯一地识别每个手势,但我该如何将其输入到机器学习技术中? (在这种情况下,隐马尔可夫模型)
请问是否能指导我至少在这个阶段应该搜索什么,或者指导我显示我真正遇到的困难是什么?