锐眼视点:
- OpenAI 创造虚拟相扑手,让未来的机器人身手不凡;
- 斯坦福公布 3D 街景数据集:2500 万张图像,8 个城市模型;
- 高通 5G 芯片组成功实现数据连接。
[业界新闻] OpenAI 创造虚拟相扑手,让未来的机器人身手不凡
Elon Musk 创建的非盈利性人工智能组织 OpenAI 发布了一款看似简单的相扑游戏(如上图所示),名为 RoboSumo。这款游戏并非由人来操作,而是由机器学习软件控制。“相扑选手”也并非提前编程设计好动作,而是通过机器学习不断试错,学会这项运动。OpenAI 的工程师 Igor Mordatch 表示这类竞技游戏可以让人工智能系统进行比赛,因为现如今人工智能代理商都面临着对手复杂变化的技术改变。这有助于让机器学习软件学到有价值的技巧,从而应用于机器人和现实活动中。也就是说,这款相扑小游戏能让未来的 AI 更聪明。在实验开始,游戏中的小人甚至不会走路,而他们的任务就是通过不断实践,学习如何走路,最终击败对方。经过大约十亿次的训练,机器人学会了一些策略,例如蹲下,让自己保持稳定,或者让对手一不小心摔落竞技场。研究人员已经开发了新的学习算法,使玩家能够在一场比赛中调整自己的策略,甚至预测出对手何时会改变战术。也许这个相扑小游戏不能产生什么实际价值,但是它的影响非常广泛,因为机器在游戏中学习到的技巧可以迁移到其他场景中去。例如,若把一位“相扑选手”放入另一个吹着强风的虚拟场景中,他就知道如何控制自己的身体保持平衡。OpenAI 的这一项目是突破机器学习局限性的佳作。以往常用的的机器学习软件都是通过处理大量的标签数据获得新技能,这种方式在翻译、语音识别和面部识别等领域都有所成就。但是对于更加复杂的技能来说,却并不实用。例如,想用 AI 控制家用机器人,就无法用以前的手段实现。
原文链接:OpenAI’s Goofy Sumo-Wrestling Bots Are Smarter Than They Look
[业界新闻] 斯坦福公布 3D 街景数据集:2500 万张图像,8 个城市模型
近日,斯坦福大学的研究人员公布了一个数据集,其中包含带有相机姿态的街景数据、8个城市的3D模型和拓展的元数据。这个数据集数据量庞大,街景数据集就包含2500万张图像和1.18亿个匹配的图像对。数据集可用于学习6DOF相机姿态估计/视觉运动、图像匹配及各种三维估计。比如上图的这个例子。为了得到这个数据集,斯坦福的研究人员开发了一个系统,整合来自谷歌街景图像和地理元数据的城市间地理信息系统,这其中并不需要人工标注。这个数据集涵盖了纽约、芝加哥、华盛顿、拉斯维加斯、佛罗伦萨、阿姆斯特丹、旧金山和巴黎市中心及周边地区。研究人员正逐步放出这些城市的3D模型、街景图片和元数据。模型是通过本身的地理标注和加工生成的生成的,下面是一些3D模型的示例快照。
原文链接:GENERIC 3D REPRESENTATION VIA POSE ESTIMATION AND MATCHING
[业界新闻] 高通 5G 芯片组成功实现数据连接
今日高通宣布,成功基于一款面向移动终端的 5G 调制解调器芯片组实现 5G 数据连接。骁龙 X50 5G 调制解调器芯片组实现了千兆级速率以及在 28GHz 毫米波频段上的数据连接,推动全新一代蜂窝技术向前发展,同时加快为消费者提供支持 5G 新空口的移动终端。此外,Qualcomm Technologies 还预展了其首款 5G 智能手机参考设计,旨在于手机的功耗和尺寸要求下,对 5G 技术进行测试和优化。此次 5G 数据连接演示在位于圣迭戈的 Qualcomm Technologies 实验室中进行。通过利用数个 100 MHz 5G 载波实现了千兆级下载速率,并且在 28 GHz 毫米波频段上演示了数据连接。5G 新空口毫米波是移动领域的一项全新前沿技术,如今通过 5G 新空口标准得以实现,预计它将开创下一代用户体验并显著提高网络容量。除骁龙 X50 5G 调制解调器芯片组之外,演示还采用了 SDR051 毫米波射频收发器集成电路(IC)。演示采用了是德科技(Keysight Technologies)的全新 5G 协议研发工具套件和 UXM 5G 无线测试平台(UXM 5G Wireless Test Platform)。