有没有任何图书馆,最好是Python但至少是开源的,可以总结和/或简化自然语言文本?
有没有任何图书馆,最好是Python但至少是开源的,可以总结和/或简化自然语言文本?
也许你可以尝试使用sumy。它是我用Python编写的一个相当小的库。实现了Luhn和Edmundson方法、LSA方法、SumBasic、KL-Sum、LexRank和TextRank算法。它采用Apache2许可证,支持捷克语、斯洛伐克语、英语、法语、日语、中文、葡萄牙语、西班牙语和德语。
如果你有什么需要的功能,随时打开一个问题(issue)或发送拉取请求(pull request)。
我不确定当前是否有任何库可以完成这个任务,因为文本摘要,或者至少是易于理解的文本摘要,并不是一个简单的即插即用的库就能轻松完成的事情。
以下是一些我能找到的与文本摘要相关的项目/资源链接,希望能帮助你入门:
希望对你有所帮助 :)
我也需要同样的东西,但我无法在Python中找到任何有助于我获得全面结果的东西。
所以我发现这个Web服务非常有用,他们有一个免费的API提供JSON结果,我想与你分享。
点击这里查看:http://smmry.com
虽然不是Python,但MEAD可以做文本摘要(它是用Perl编写的)。通常情况下,输出的结果是可理解的,但并非总是特别流畅。此外,请查看summarization.com以获取有关文本摘要任务的大量优质信息。
前一段时间,我使用NLTK编写了一个Python的摘要库,使用了来自Classifier4J库的算法。它非常简单,但可能适合任何需要摘要的人:https://github.com/thavelick/summarize