160得票7回答
如何从字符串中提取浮点数

我有一些类似于当前级别:13.4 db。的字符串,我想提取其中的浮点数。我说浮点数而不是十进制数是因为有时它是整数。正则表达式能做到这一点吗,还是有更好的方法?

22得票2回答
使用FFmpeg提取特定帧的列表

我正在尝试使用FFmpeg提取特定帧的视频,这些帧由它们的帧编号指定。比如说,我想从“test_video.mp4”中仅提取一个帧,具体是第150帧。我可以使用以下命令: ffmpeg -i test_video.mp4 -vf "select=gte(n\, 150)" -vframes 1...

22得票2回答
将PostgreSQL查询导入Excel表格

我需要将一些数据从PostgreSQL导出到Excel(客户的迫切需求),上次使用COPY命令导出的csv文件存在诸多问题(换行符、utf-8编码等),导致Excel打开或导入文件时严重出现问题,最好情况下需要花费一个小时来解决。 是否有人知道一种快速而优雅的解决方案,可以生成真正的Exce...

14得票4回答
如何提取Google地图上标记的经纬度?

我想从一个Google地图网页中提取大约50-100个标记的纬度和经度。我无法控制该页面,也只需要执行一次,因此我正在寻找一种快速且简单的方法。我有安装了FireBug插件的Firefox和Chrome浏览器,所以我需要的是比重新输入数字更容易的方法。

14得票4回答
PostgreSQL到数据仓库:最佳方法进行近实时ETL / 数据提取

背景: 我有一个为OLTP(联机事务处理)进行了大量优化的PostgreSQL(v8.3)数据库。 我需要以半实时的方式从中提取数据(肯定会有人问半实时是什么意思,答案是尽可能频繁地,但我会采取务实的方式,作为基准,假设我们希望每15分钟提取一次),并将其馈送到数据仓库。 有多少数据?在...

12得票2回答
如何从网页中提取有意义且有用的内容?

我希望能够解析网页并从中提取有意义的内容。所谓有意义,是指用户想在特定页面中看到的内容(仅限文本数据,不包括广告、横幅、评论等)。我想确保当用户保存页面时,只保存他想阅读的数据,而不是其他任何内容。 简而言之,我需要构建一个与Readability类似的应用程序(http://www.rea...

11得票2回答
Ruby:从嵌套的JSON中提取字段

我正在尝试自学 Ruby 并解决工作中的一个问题。我的最终目标是从 API 的 JSON 响应中提取出三个字段中的多个字段之一,对其进行操作并将其倾倒到 CSV 中以供管理层报告。 JSON 的结构如下:{ "status": 200, "data": { "total": ...

8得票2回答
Paradox数据库文件

我发现了不同扩展名的Paradox数据库文件。 有db文件、mb文件、dat文件、px文件、XG0文件、XG1文件、XG2文件、XG3文件、XG4文件、YG0文件、YG1文件、YG2文件、YG3文件和YG4文件。 我已经找到了使用gnumeric电子表格打开db文件和px文件的方法。我从d...

7得票2回答
从扫描的文档图像中提取没有网格线和边框的表格数据

从数字化PDF中提取表格数据已经可以通过camelot和tabula轻松实现。然而,当表格不具备边框和内部网格时,该解决方案无法处理扫描图像的文档页面。我一直在尝试使用OpenCV生成垂直和水平线条。然而,由于扫描图像会有轻微旋转角度,因此很难继续使用这种方法。 如何利用OpenCV为包含表...

7得票3回答
如何从SCADA CIMPLICITY软件的DAT和IDX文件中提取数据?

我被委托从旧软件CIMplicity HMI Plant Edition 6.0的数据文件中提取数据。这是一款2002年的SCADA软件。我有一个包含许多*.DAT和*.IDX文件的数据文件目录副本。我需要将这些数据提取到CSV或SQL数据库中。一些DAT文件只是普通文本,但其他文件具有类似二...