考虑以下两个字符串,第一个是代码,第二个是英语句子(确切来说是短语)。我如何检测第一个是否为代码而第二个不是。
我正在考虑计算特殊字符(如"=",";","++"等),并将其设置为某个阈值。是否有更好的方法来实现这一点?是否有任何Java库可用?
请注意,代码可能无法解析,因为它不是完整的方法/语句/表达式。
我的假设是英语句子非常规则,它很可能只包含“,”,“。”,“_”,“(”,“)”等。它们不包含像这样的内容:
1. for (int i = 0; i < b.size(); i++) {
2. do something in English (not necessary to be a sentence).
我正在考虑计算特殊字符(如"=",";","++"等),并将其设置为某个阈值。是否有更好的方法来实现这一点?是否有任何Java库可用?
请注意,代码可能无法解析,因为它不是完整的方法/语句/表达式。
我的假设是英语句子非常规则,它很可能只包含“,”,“。”,“_”,“(”,“)”等。它们不包含像这样的内容:
write("the whole lot of text");