【例学 UiPath】抓取网络数据

为了更好地理解如何利用数据抓取功能,让我们创建一个从 Amazon 提取一些特定信息的自动化程序。

注意:建议您在 InternetExplorer 11 及以上、MozillaFirefox 50 或更高版本或最新版本的 Google Chrome 上运行 Web 自动化。

假设您是一家体育用品供应商,您有兴趣在网上了解排球的最新价格。您可以这样做:

1. 打开 IE 浏览器,导航到 www.amazon.com

2.在搜索框中,键入volleyball ball 并按 Enter 将结果显示在网页中。

3.在 Studio 中,在 Design 选项卡上的 Wizards 按钮组,单击 Data Scraping,将显示 Extract Wizard 。

Extract Wizard

4.在向导之后,选择网页中列表的第一项最后一项。显示 Configure Columns 向导步骤。

操作提示:UiPath 通过网页列表中的第一项和最后一项推测整个列表,然后读取列表中的数据。这一步操作至关重要,如果选择的元素不对就会导致无法识别网页中的列表。

5.选中 Extract URL 复选框。(这意味中将会在数据中导出 Items 带有的超链接)

6.更改列标题的名称。

7.单击 Next,将显示数据的预览,您选择的字段将在 Web 浏览器中突出显示。

8. 点击 Extract Correlated Data 按钮,再次显示 Extract Wizard 窗口

9. 在向导之后再次指出项目的价格。您将进入 Configure Columns 步骤

10.更改新列的名称,然后单击 Next, 显示数据预览

数据预览

11. (可选)通过拖动列的位置来改变列的顺序。

12. 单击 Finish,将显示 Indicate Next Link 窗口,提示您在跨越多个页面时指示 Next 按钮。

提示:运行时,UiPath 将会帮你自动点击该按钮,就好像你手工翻看下一页数据一样。直到获取的数据达到 Maximun number of results 设定的数值为止(这里设定的是 100,即获取 100 条记录)

13. 单击 Yes 并在 amazon 中选择 Next Page 按钮。该项目保存并显示在 Designer 面板中。注意,DataTable 变量 ExtractDataTable 已经自动生成。

14. 拖一个 Excel Application Scope  活动到 Data Scraping 容器中。

注意:使用 Manage Packager 安装了 UiPath.Excel.Activities  才可以访问Excel 相关的活动,否则你是无法在面板中找到 Excel Application Scope 的。


 UiPath.Excel.Activities 

15. 在 Properties 面板的 WorkbookPath 字段中,键入要将数据写入的现有 Excel 文件的文件路径

16.在 Variables 面板中,将自动生成的数据表变量的范围更改为 Sequence,使 ExtractDataTable 可以被外部的活动访问。

17. 拖拽一个 Write Range 活动到 Excel Application Scope 内部。

18.在Properties 面板中的 DataTable 字段添加变量名 ExtractDataTable 。项目最终如下图所示:

项目最终效果

19. 点击 F5 运行

20. 打开在步骤 15 设定的 Excel 文件。注意,表格中正确填充了来自网页的数据。

项目运行结果


注:本文改编自 UiPath 文档,笔者在原文档的基础上添加了更加详细的说明和注意要点。



<本节教程完>

更多 UiPath 相关的资讯,请关注本公众号:UiPath 教程

权所有,如需转载,请先联系。

转发不属于转载行为,欢迎你转发到朋友圈、微信群,分享给微信朋友。


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容