软件发布

手机版,更便捷!

下载排行榜首页软件下载安卓下载资讯教程推荐专题装机必备
当前位置:电脑软件 > 网络软件 > 网页辅助 > XPath2Doc1.0.0.1正式版

XPath2Doc 1.0.0.1正式版 网站数据采集工具

101人评分

  • 软件大小:14.8MB
  • 更新时间:2019-06-26
  • 授权:免费软件
  • 软件类型:国产软件
  • 软件类别:国产软件
  • 语言:简体中文
  • 平台:Win7/Win8/Win10/WinALL
  • 平台检测:
立即下载 已有 次下载

XPath2Doc是一款专业的网站数据采集工具。网站数据怎么采集?有一种最简单的方式,那就是通过 XPath2Doc 来采集!这是一个半自动收集网页生成Word docx文件的工具,具有企业搜索,天眼搜索配置,使用XPath2Doc手动登录WebBrowser窗口,找到所需的数据页面,然后单击程序按钮收集,因此它是半自动的网页数据填充了Docx工具。

配置说明:

1,该程序需要三个配置文件:General.ini,custom .ini,custom template.docx。最后两个文件名由它们自己定义。

General.ini文件定义存储INI文件和Docx模板文件的目录。你可以留空。默认值是程序所在的目录。

自定义.ini,自定义template.docx是软件用户用来创建XPath语句和最后生成的文件的Docx模板。有关详细信息,请参阅ini文件中的说明。请注意,Docx模板文件中的“@ <#0001#> @”等字符是INI文件中定义的标记字符串,用于替换网页集的内容。替换关键字的后缀和模板文件名在ini文件中定义。

2.在使用此程序之前,请创建您自己的INI配置文件和Docx模板文件。 (详情请参阅附件公司文件,二维配置文件和起诉模板)

需要注意的是,模板文件支持要收集的文档不同部分的不同URL,注意Url的设置。

XPath2Doc

工作准则:

网页的每个元素都可以表示为XPath语句,因此我们可以阅读浏览器打开的网站页面的源代码,并通过XPath语句获取网页元素中的文本。

如何获取XPath语句:

通常我们可以使用谷歌的Chrome浏览器打开网站页面,按F12打开开发者工具界面。在“ELements”选项卡下,当鼠标移动时,您可以看到Web内容被阴影覆盖。单击三角形符号以进一步。找到确切的位置,直到找到所需的最终数据位置。右键单击找到的文本,在弹出菜单中选择Copy-Copy XPath,然后将其粘贴到记事本中以获取所需的XPath语句。

需要在此解释:如果复制的XPath语句中的/ Tbody将影响集合,则问题由程序在内部处理,但在某些特殊情况下可能会影响数据收集,并且可以手动删除。

软件说明:

启动程序 - 选择模板 - 单击“捕获数据”按钮旁边的黑色三角形,单击下拉菜单,然后单击要捕获的部分。等待浏览器加载网页,手动输入需要查询的内容,单击查询,找到数据的特定页面,然后单击“收集数据”按钮以查看列表中是否有所需数据在右边。继续打开下拉菜单,然后选择要收集的下一个部分。如果URL更改,请等待浏览器加载并找到所需的数据页。单击“收集数据”按钮以查看是否在右侧列表中获取了数据的第二部分。重复此过程,直到完全收集数据。

如果两个部分的URL相同,则需要在单击下一部分中的下拉菜单之前在浏览器中重新查询新数据。新数据页出来后,单击下拉菜单以选择要收集的下一个部分。 (如果URL相同,单击下一部分将直接从网页获取数据。如果浏览器未更改页面,则数据错误。)如果需要重新获取部件,请单击下拉菜单中该部分的名称,然后单击捕获按钮以重复收集(您可以在此时更改浏览器的数据页面,并获取不同公司的数据)。

如果列表中收集的数据存在任何偏差,您可以单击以自行修改。如果XPath语句中有任何错误,您可以自己修改测试结果(XPath语句将在修改后立即重新抓取浏览器数据,因此浏览器最好是一个有效的数据页),修改后的XPath语句程序,不会保存到INI文件,请自行保存。

如果列表中的数据正确且预览窗口中Docx模板的内容正确,则可以单击“创建文档”按钮以填写要生成的文件的名称。该软件将使用捕获的网页数据替换模板中的索引字符串并自动生成。 Docx文档。

应该注意的是,右下角的Docx预览窗口不能完全支持Word文档。对于非标准文档,文本可能丢失或放错地方。在这种情况下,您可以忽略它或将模板文件更改为规范文本格式(s单行间距)。

上一篇:超级网页设计器 下一篇:ChrisPC Free Ads Blocker

应用截图

  • XPath2Doc截图(1)

相关专题

  • 电台app软件

    电台app哪个好,久友小编今天为大家整理了一批常用的有声电台软件。涵盖听书、广播、音乐等电台应用。其中,听书电台,网罗各大经典名气小说,类型丰富,持续不断更新,让你一饱耳福,享受听书乐趣的同时,放松你的眼睛。在线听、下载听、边走边听,想怎么听都行!音乐为大家提供了国内外热搜音乐,让你随时随地聆听悦耳的歌曲。广播电台可以为大家带来各个频道的最新消息,充实你的大脑世界。儿童电台可以培养孩子的想象力和好奇心,是父母必备的育儿神器。以下就是小编为大家提供的电台app,大家可以选择需要的下载使用哦。 更多详细 >

人气软件

  • 马风窝网站网址采集器评分:5 

    下载

    马风窝网站网址采集器马风窝网站网址采集器拥有非常强大的后台搜索能力,无论你想找什么,它都可以帮你搞定,绝对是你身边必备的搜索利器!有需要的用户欢迎来久友下载站下载~ 大小:17.3MBMB  更新:03-24  类型:网页辅助  国产软件  简体中文

  • TrackOFF评分:5 

    下载

    TrackOFFTrackOFF可以帮助用户对一些数据信息加密,强力有效的保护用户的隐私。可以阻止第三方将您的身份关联上电脑。可以从电脑上删除包含您访问过的网站等机密信息的文件。防护功能非常强大丰富。有需要的用户欢迎来久友下载站下载~ 大小:43.6MBMB  更新:04-28  类型:网页辅助  国产软件  简体中文

  • Responsive Site Designer评分:5 

    下载

    Responsive Site DesignerResponsive Site Designer拥有功能强大的文本编辑器编写,支持拖放内容元素,如标题,图像,按钮,图标等。具有相应媒体查询的移动优先和桌面下行工作流程。功能非常丰富。有需要的用户欢迎来久友下载站下载~ 大小:175.5MBMB  更新:04-30  类型:网页辅助  国产软件  简体中文

  • FreshHTML Pro评分:5 

    下载

    FreshHTML ProFreshHTML Pro适用于几乎没有手绘网站经验的人,支持许多不同的代码插入选项,支持彩色HTML代码页,支持常用语法 外部链接直接插入。功能非常丰富。有需要的用户欢迎来久友下载站下载~ 大小:9.7MBMB  更新:05-08  类型:网页辅助  国产软件  简体中文

  • 超级网页设计器评分:5 

    下载

    超级网页设计器超级网页设计器可以设计计算机网页和移动网页,支持全鼠标拖放控制排列界面,支持计算机网页和手机自动切换功能。功能非常丰富实用。有需要的用户欢迎来久友下载站下载~ 大小:23.6MBMB  更新:06-19  类型:网页辅助  国产软件  简体中文

最新评论

软件分类

热门排行榜

回顶部 去下载