要你从10短视频里面找出所有“狗”出现的画面,要花多久时间呢?对Google来说,可能只要不到一秒钟。
美国时间8日登场的Google Cloud Next云端大会上,Google云端人工智慧暨机器学习首席科学家李飞飞,发表了Google通过深度学习技术打造的云端影音智能应用程序介面 (Cloud Video Intelligence API)。
从现场的示范可以看到,现在Google的机器学习已经不只能做到图片或语音、文字识别,也可以精准地找出每段视频中特定物件出现的时间点,或者也可以用于挖掘出同类型影音内容。
例如只要搜寻“老虎”,资料库中所有出现“老虎”的相关视频都会被标列出来,可以说是机器学习在影音领域的一大突破。
虽然目前云端影音智能应用程序介面还是在封闭测试阶段(Private Beta),但就像李飞飞说的:
“我们就像是在黑暗中为数字世界点燃一盏烛光。”
可以想像未来如YouTube、媒体公司、监控系统从业者,或者是Google提到的消费科技公司等等,都可能因此更容易建立媒体分类、并也更有效地做内容管理和应用,或是在这样的基础上发展出更多的变化。