为了更好地理解如何利用数据抓取功能,让我们创建一个从 Amazon 提取一些特定信息的自动化程序。
注意:建议您在 InternetExplorer 11 及以上、MozillaFirefox 50 或更高版本或最新版本的 Google Chrome 上运行 Web 自动化。
假设您是一家体育用品供应商,您有兴趣在网上了解排球的最新价格。您可以这样做:
1. 打开 IE 浏览器,导航到 www.amazon.com 。
2.在搜索框中,键入volleyball ball 并按 Enter 将结果显示在网页中。
3.在 Studio 中,在 Design 选项卡上的 Wizards 按钮组,单击 Data Scraping,将显示 Extract Wizard 。
Extract Wizard
4.在向导之后,选择网页中列表的第一项和最后一项。显示 Configure Columns 向导步骤。
操作提示:UiPath 通过网页列表中的第一项和最后一项推测整个列表,然后读取列表中的数据。这一步操作至关重要,如果选择的元素不对就会导致无法识别网页中的列表。
5.选中 Extract URL 复选框。(这意味中将会在数据中导出 Items 带有的超链接)
6.更改列标题的名称。
7.单击 Next,将显示数据的预览,您选择的字段将在 Web 浏览器中突出显示。
8. 点击 Extract Correlated Data 按钮,再次显示 Extract Wizard 窗口
9. 在向导之后再次指出项目的价格。您将进入 Configure Columns 步骤
10.更改新列的名称,然后单击 Next, 显示数据预览
数据预览
11. (可选)通过拖动列的位置来改变列的顺序。
12. 单击 Finish,将显示 Indicate Next Link 窗口,提示您在跨越多个页面时指示 Next 按钮。
提示:运行时,UiPath 将会帮你自动点击该按钮,就好像你手工翻看下一页数据一样。直到获取的数据达到 Maximun number of results 设定的数值为止(这里设定的是 100,即获取 100 条记录)
13. 单击 Yes 并在 amazon 中选择 Next Page 按钮。该项目保存并显示在 Designer 面板中。注意,DataTable 变量 ExtractDataTable 已经自动生成。
14. 拖一个 Excel Application Scope 活动到 Data Scraping 容器中。
注意:使用 Manage Packager 安装了 UiPath.Excel.Activities 才可以访问Excel 相关的活动,否则你是无法在面板中找到 Excel Application Scope 的。
UiPath.Excel.Activities
15. 在 Properties 面板的 WorkbookPath 字段中,键入要将数据写入的现有 Excel 文件的文件路径。
16.在 Variables 面板中,将自动生成的数据表变量的范围更改为 Sequence,使 ExtractDataTable 可以被外部的活动访问。
17. 拖拽一个 Write Range 活动到 Excel Application Scope 内部。
18.在Properties 面板中的 DataTable 字段添加变量名 ExtractDataTable 。项目最终如下图所示:
项目最终效果
19. 点击 F5 运行
20. 打开在步骤 15 设定的 Excel 文件。注意,表格中正确填充了来自网页的数据。
项目运行结果
注:本文改编自 UiPath 文档,笔者在原文档的基础上添加了更加详细的说明和注意要点。
<本节教程完>
更多 UiPath 相关的资讯,请关注本公众号:UiPath 教程
权所有,如需转载,请先联系。
转发不属于转载行为,欢迎你转发到朋友圈、微信群,分享给微信朋友。