潘云鹤:“视觉知识”推动AI 2.0突破

  • 时间:
  • 浏览:4
  • 来源:新极速快3_大发快三计划软件

调查问提加载中,请稍候。

若长时间无响应,请刷新本页面

  记者 韩扬眉

  人类对世界的认知中,50%的信息来自视觉,亲戚大伙儿 希望人工智能未来都上能 像人一样敏锐地观测、认知和预测世界。在中国工程院院士潘云鹤看来,实现视觉知识表达、推理、学习和应用的技术将是人工智能(AI)2.0取得突破的重要方向之一。

  近日,潘云鹤首次系统地提出“视觉知识”概念,在接受《中国科学报》专访时对其进行了具体阐述和解释。

  《中国科学报》:您提出视觉知识这人概念的背景是哪几种?

  潘云鹤:视觉出理 技术对AI发展有重要影响。

  首先,近年来,图像识别水平的快速提升推动了AI热潮的形成。图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物价值形式、医学图片等识别的准确率,或者进一步推动了智能制造等领域的发展。中国科学技术发展战略研究院按技术分类对2018年中美AI企业数量进行了统计,都上能 看出,提供和应用图像识别技术的企业占一半以上。

  其次,传统的知识表达方法有显著严重不足。早期图像识别和计算机视觉建立在图像出理 技术之上;深层神经网络的使用以数据驱动的方法来学习价值形式表达,有效提高了图像分类和识别的准确率。

  不过,作为AI知识表达的并不是方法,深层神经网络难以解释、不可推理,以及因需一定量标识的数据训练网络参数而难以出理 地会引入数据偏见等严重不足。或者,亲戚大伙儿 前要研究并不是全新的知识表达——视觉知识。

  这启示亲戚大伙儿 ,数字视觉领域是推动AI发展的重要领域;更好的知识表达是推动数字视觉发展的关键技术;克服深层神经网络严重不足是“视觉知识”研究的关键方向。

  《中国科学报》:哪几种是视觉知识?它有哪几种价值形式?

  潘云鹤:视觉知识是知识表达的并不是新形式,它能表达世界的旧时空价值形式与变化价值形式。计算机图形学经过长期发展,提供了视觉知识表达与操作的技术基础。或者,对视觉知识进行表达及其推理等操作,还需在此基础换成以改造与重构。

  视觉知识与迄今为止人工智能所用知识表达方法不同。视觉概念具有典型与范畴价值形式、层次价值形式与动作价值形式等累积。视觉概念能构成视觉命题,包括场景价值形式与动态价值形式。视觉命题能构成视觉叙事。重构计算机图形学成果可实现视觉知识表达及其推理与操作,重构计算机视觉成果可实现视觉知识学习。

  实现视觉知识表达、推理、学习、使用的理论和技术将是AI 2.0取得突破的重要方向之一。

  视觉知识原困难以用语言符号表达,曾被统归为常识,而以往AI研究的一大弱点便是视觉知识研究严重不足。或者,视觉知识的研究与运用原困是AI 2.0的有一个重要发展方向。

  《中国科学报》:如保构建视觉知识体系?

  潘云鹤:视觉知识体系构建与利用前要出理 的首要问提是视觉知识学习,这也是有一个知识学习的无人区。建立有一个系统的知识体系,往往更前要自顶向下的设计,在这人过程中,诸如3D价值形式重建等计算机视觉研究成果为系统的视觉知识学习提供了发展土壤。

  不过,视觉知识学习要将目标从视觉价值形式重建进一步深入到视觉知识重建,还前要对现有计算机视觉技术作进一步研究,比如,重建3D价值形式的层次价值形式,定位其在概念范畴中的位置等。

  除了视觉概念,前要研究视觉命题与视觉叙事的表达和学习。

  《中国科学报》:视觉知识有哪几种应用?

  潘云鹤:从当前AI热潮中视觉识别技术的广泛渗透,可推知视觉知识的应用极广。这里我举例说明视觉知识的各种应用。

  基于知识的识别方法,如用于图像识别。相似“猫”,根据“猫”的视觉概念的典型与范畴等,使用综合推理方法自动生成猫的范畴内外各种图像大数据,并根据范畴内外自动标识为正、负范例。或者,用上述范例大数据训练多层神经网络,最后,用训练过的多层神经网络识别图像。

  事实上,视觉知识有着独特的优点,都上能 提供综合生成能力、旧时空比较能力和形象显示能力,而哪几种正是字符知识所严重不足的重都上能 力。它们能在创造、预测和人机融合等方面为AI新发展提供基础动力。

  《中国科学报》:关于视觉知识,未来,亲戚大伙儿 前要关注的重点还有哪几种?

  潘云鹤:建设视觉知识词典将是十分重要的,这是有一个巨大而实用的知识平台和数据平台,应当联合全球人工智能、计算机图形学和计算机视觉科技工作者一起建设。为了顺利而高效地完成视觉知识词典的建设,群智组织模式不可或缺。

[ 责编:宋雅娟 ]

阅读剩余全文(