您的当前位置:首页国外认知智能发展趋势

国外认知智能发展趋势

2021-05-01 来源:六九路网
国外认知智能发展趋势

作者:暂无

来源:《上海信息化》 2020年第8期

认知智能是未来数十年人工智能领域重要的研究方向,也是新一代人工智能技术浪潮向更高、更新推进的源动力。国外认知智能的研发目的,是希望赋予机器认知推理能力,实现模型的可解释性、具有小样本学习能力的新智能。

文 曹东

人工智能的发展可以粗略划分为三个阶段:计算智能、感知智能和认知智能。计算智能通俗来讲就是计算机可以存储记忆、会运算,在这方面,计算机的智能水平早已经远远超过人类。感知智能就是计算机具备类似人类视觉和听觉等方面的能力,比如听到了什么,对应语音识别;看到了什么,对应图像的分类检测和语义分割。其中,人脸识别就是包含感知智能技术的一种人工智能应用。近年来,随着深度学习在视觉感知领域的蓬勃发展,机器在感知智能方面的性能已经可与人类媲美,在许多场景下甚至已经超过人类。

认知智能被认为是人工智能领域最难、最重要的技术领域,认知智能能否突破,将决定是否能够真正实现机器对世界的认知、思考和回应。国外在认知智能方面的新研究,或可为新一代人工智能技术的发展添砖加瓦。

认知智能研究重点

认知智能强调知识、推理等技能,要求机器能理解、会思考。机器从计算智能发展到感知智能,标志着人工智能走向成熟;从感知智能发展到认知智能,可谓人工智能质的飞跃。认知智能与人的语言、知识、逻辑相关,是人工智能的更高阶段,涉及语义理解、知识表示、小样本学习甚至零样本学习、联想推理和自主学习等等。相比计算智能和感知智能,认知智能是更复杂、更困难的任务,因此,实现认知智能,是全球人工智能领域未来数十年最重要的研究方向。

人类在做推理的时候,会运用两个系统:系统A为直觉系统;系统B为理性系统,包括推理、逻辑思考、决策等。直觉系统在被给定某个关系以后,只要算出相似度,就可以立即给出匹配结果。相较推理而言,可以更快形成信息关联。人工智能的深度学习应该融合系统A与系统B,让机器学习与人的逻辑思考、常识知识图谱结合起来,其中,构建图神经网络是重要方法。

人类的智能基于多模态,不是纯粹语言符号能够闭环自洽的,语言只是人类智慧的载体和表层,如果只在文字符号层面做认知智能,可能会很快触及上限,使得人工智能的发展严重受限。目前国外认知智能发展面临的挑战在于,机器难以像人类一样,做到基于物体与时空感知的序列记忆和预测。在语言之外,人类智慧的本质有一个“通式”,这个“通式”定义了人类对物体在三维空间加一维时间坐标下的序列感知、记忆和预测能力。人工智能如要实现认知智能,需要在这个过程中实现物体、空间和时间的感知,并融合到一起,进一步实现推理能力,才能最终形成类似人类的智慧。

认知推理发展

1950年,美国数学家、信息论创始人香侬提出“计算机博弈”;1954年,英国数学家、逻辑学家图灵提出“图灵测试”,两者拉开了人工智能发展序幕。其后,到二十世纪六十年代,伴随自然语言处理和人机对话技术的发展,人工智能发展的第一波浪潮出现;知识库、专家系

统以及机器人系统等的诞生与发展,使得第二波人工智能浪潮在二十世纪八十年代得以形成;二十世纪九十年代,以语义为基础的知识网和知识表达、深度学习,标志着第三次人工智能浪潮到来。在这一次浪潮中,涌现出大量引领前沿技术的公司和产品,包括谷歌的自动驾驶系统、IBM的Watson平台、苹果的自然语言问答工具等。

回顾过往三次技术浪潮发展的脉络,我们对人工智能未来发展趋势逐渐有了清晰的认识:从感知到认知,以深度学习为代表的算法是目前的研究重点。从自然语言处理的角度来看,人工智能在认知智能领域发力,谷歌提出的BERT代表预训练算法得到了快速发展。之后,卡内基梅隆大学与谷歌AI大脑联合提出的XLNet通过双向网络的方法超过了BERT的性能。接着,谷歌研究院创建AI模型ALBERT,在性能上进一步“碾压”BERT和XLNet。

在机器视觉领域,英伟达提出的Video-to-Video Synthesis(视频到视频的合成)通过预训练模型,实现了高清视频的自动生成。DeepMind把代表性的关联关系生成到Graph Networks(图网络模型原理详解)中,使得在网络中可以实现一定的推理。Facebook提出以

Contrastive Learning(对比学习)为基础的MoCo及MoCo2,在无监督学习状态下,其结果超过了监督学习,标志着预训练模型技术达到崭新高度。Google Research团队研发了SimCLR(视觉表示对比学习的简单框架),作为简化版的Contrastive Learning,其超过了MoCo,紧接着发展的MoCo2又超过了SimCLR。可见,当下的算法时代,预训练算法模型大放异彩。

然而,正在酝酿中的全球第四次人工智能新浪潮方向在哪里?或者说新一代(第三代)人工智能的理论框架体系如何构建?对此,中国科学院院士张钹指出:建立可解释、鲁棒性的人工智能理论和方法;发展安全、可靠、可信及可扩展的人工智能技术;推动人工智能创新应用。在具体实施上,要与脑科学融合,发展脑启发的人工智能理论;数据与知识融合的人工智能理论与方法。构建认知图谱,其核心就是知识图谱、认知推理和逻辑表达。

认知智能机器人

在认知智能机器人领域,未来的发展趋势是训练AI机器,从而使其获取智慧本质的“通式”。具体来说,就是借鉴人类智慧的特点,通过构建多模态序列记忆建模和预测,来实现知识积累和智慧应用。

美国加州大学伯克利分校最新开发了机器人BLUE。这款机器人的特点是低成本(不到5000美元)、基于AI控制,而且可以在非结构化的环境中执行人类的日常任务,比如叠衣服、刷碗等。

广义的认知智能机器人是人工智能技术和先进制造技术与工艺的集大成者,包括传感器与信号处理、目标识别与语音识别、语义理解;机器人对环境理解与地图创建等。规划方面包括任务规划、运动规划、路径规划。控制方面包括机械臂控制、机械手控制和足式机器人控制。人机交互方面,包括识别人、与人交流、与人协作等。虽然人体识别在机器视觉中已经有了很多成果,但是在人机交互过程中,机器人不仅要识别到人的存在,还要能判断人的动作、意图,并做出相应反馈,与人交流以及与人协作。国外具有领先工业机器人技术的企业有ABB集团、FANUC(发那科)、库卡和安川等,未来也将在认知智能机器人的研发上发力。

认知智能机器人以认知图谱为实现手段和技术路线。该智能技术模仿人类智能,包括系统A和系统B的组合实现。系统A作为知识的扩展,系统B做决策和推理。系统B中,模块的推理决策功能可以用卷积神经网络或者图神经网络来实现,相当于把系统A中提取的各种信息汇聚过来,判断是否是其需要的答案,然后做出决策,这样就能把两个神经网络系统整合到一起。在此基础上,有望实现新一代人工智能机器人的新突破。

总之,认知智能是人工智能发展的高级阶段。从国外的研究趋势来看,AI能否更智能,认知智能技术的突破是关键所在。未来,人工智能将成为具有认知推理能力、实现模型的可解释性、具有小样本学习能力的新智能。

因篇幅问题不能全部显示,请点此查看更多更全内容