8得票2回答
处理OCR / 计算机视觉结果以匹配收据结构。

我正在使用微软计算机视觉来读取收据。 我得到的结果被分成由列组成的区域,例如数量、产品名称和金额在三个不同的区域中。 我希望整个产品列表是一个区域,并且每行都是一个产品。 是否有任何方法可以配置计算机视觉以实现此目的,或者更有可能的是是否有任何好的技术或库可以在结果的后处理中使用,因为所...

7得票1回答
如何使用Microsoft Cognitive Services - Vision API的OCR识别功能仅获取文本?

我将使用提供在Computer Vision API C# Quick Start的示例。我能够获得示例中显示的JSON结果,但无法获取仅文本内容。JSON的示例格式如下: { "textAngle": 0.020943951023932542, "orientation": "No...

7得票1回答
在企业参考应用中路由Microsoft LUIS请求和Bot Framework - 最好的方式是什么?

我和我的同事正在使用Microsoft bot框架和Microsoft LUIS构建一个非常大的应用程序。主要是试图创建一个机器人,组织中的人可以通过Slack向机器人发送消息并接收相关信息。不同类型的请求涉及不同的主题领域(销售、营销、物流和研发)。如何将多个LUIS模型、实体和子实体链接在...

7得票2回答
为什么我新部署的Azure OpenAI出现404资源未找到的错误?

我已经完成了快速入门,并创建了我的Azure OpenAI资源+创建了一个模型部署,状态为成功。我还在https://oai.azure.com/上进行了测试,它在那里可以正常工作。 但是,如果我尝试从REST API访问它,则会返回404资源未找到的错误。 我定义了api-key头,并从游...

7得票1回答
使用Microsoft Azure(REST API)进行批量转录。

我希望使用 Microsoft 的 REST API 转录较长的音频文件(至少 5 分钟)。有许多不同的产品和名称,例如语音服务 API 或必应语音 API。到目前为止,我尝试过的所有 REST API 都不支持转录较长的音频文件。文档说明有一个专门用于此情况的 REST API:https:...

7得票1回答
通过Xamarin.Android连接到微软的认知说话人识别API

我正在构建一个测试应用程序,通过微软认知说话人识别API对用户进行身份验证。这似乎很简单,但正如他们的API文档中所提到的,当创建Enrollment时,我需要发送我记录的音频文件的byte[]。现在,由于我使用的是Xamarin.Android,我能够录制并保存音频。现在,根据微软认知说话人...

7得票2回答
必应拼写检查API,在128个字符后停止工作

我正在尝试使用Bing拼写检查API v5,但遇到了很多问题。 当使用以下句子请求spell或proof时,它会返回没有标记的令牌。 这是一个有错误的长句子。它应该是一个问题,但我想不出一个长问题。也许这意味着我没有什么重要的问题要问吗? {"_type": "SpellCheck"...

7得票1回答
Azure认知服务提示“404资源未找到”

我已经订阅了“Azure认知服务”,并尝试将语言从英语翻译成丹麦语。 我使用Postman进行了POST请求,但每次都收到以下错误: { "error": { "code": "404", "message": "Resource not found"...