什么是自然语言啊

广义的“语言”是任何一种有结构的符号系统。人类的语言、手势、体态,

器的指令、命令、程序,

排版时的格式说明,

公路上的交通图标……都属于这种广

义的

“语言”。其中,

最重要的两类语言,

是自然语言和形式语言。

狭义的“语言”指“自然语言”,

即人类在其社会生活中发展出来的用来互相

交际的声音符号系统。现已发现数千种不同的自然语言。“自然语言理解”指的就

是使计算机来按照这种语言所表达的意义作出相应的反应的机制。

语言学上对语言有这样的层次划分:

第一层次是语音和文字,

即基本语言信号

的构成

第二层次是词法和句法(合称“语法”),

即语言基本运用单位的构成和组

合的形式规律

第三层次是语义,

即语言所要表达的概念结构

第四层次是语用,

即语言与语言使用环境的相互作用。一般说来,

人和计算机打交道,

目前是采用键

盘输入字符的方式,

但语音的文字方式由于语音和文字的识别的进展也已经开始进

入实用的水平

自然语言理解的关键,

仍然是文字进入计算机以后的词法和句法分

析、语义分析和语用分析。现在已经有一些计算机程序能在受限制的领域内“懂得”

英语等自然语言,

比如根据数据库里的信息回答问题或处理事务,

按照自然语言的

命令做一些简单的事情等等。要实现不限领域的自然语言理解,

目前在技术上还面

临很艰巨的挑战。

首先,

自然语言是极其复杂的符号系统。一个人尽管可以对自己的母语运用自

如,

但却无法把自己母语的构成规律、意义的表达规律和语言使用的规律用计算机

可以接受的方式彻底说清楚。传统的语言学是在没有计算机参照的条件下发展起来

的,

虽然为自然语言理解积累了宝贵的财富,

但那是讲给人的,

真正要让语言学知

识变成计算机上可操作的,

绝不是那么简单,

也不能那么模糊。这个目标的实现,

需要大量又懂语言学又懂计算机的人在正确的技术路线的指导下一起做非常大规模

的基本建设,

绝不是一拍脑袋想出个“绝招”就能解决的。

其次,

自然语言的各个层次上都含有巨大的不确定性。在语音和文字层次上,

有一字多音、一音多字的问题

在词法和句法层次上,

有词类词性、词边界、句法

结构的不确定性问题

在语义和语用层次上,

也有大量的因种种原因造成的内涵、

外延、指代、言外之义的不确定性。语言学上把这些不确定性叫做“歧义”。歧义

一般不能通过发生歧义的语言单位自身获得解决,

而必须借助于更大的语言单位乃

至非语言的环境背景因素和常识来解决。人类有很强的依靠整体消除局部不确定性

的能力和常识推理能力,

体现在语言上就是利用语境信息和常识消除歧义的能力。

使计算机获得同样强大的能力,

是从事自然语言理解的学者梦寐以求的目标。

另外,

自然语言不是一成不变的死的语言,

它在社会生活中发展,

在操不同语

言和同一语言的不同变体的人们之间的相互影响中变化。一个词、一个说法可能在

一夜之间突然流行起来

特殊的人群结构变化会导致新的语言或新的语言变体

(如

方言)

的出现。这些都要求理解自然语言的计算机程序要具有对外界语言环境的应

变能力。

最后一点,

自然语言是人们交流思想的工具。既然交流的是思想,

那思想本身

在计算机里的组织结构就显得格外重要。在人工智能里,

这就是“知识表示”的问

题。可以说,

在知识表示问题上的突破,

对于自然语言理解的进展将产生决定性的

影响。

在上述四个方面,

都有许多学者在勇敢地迎接挑战,

使计算机程序一步步地朝

着不限领域的自然语言理解的远大目标前进。善解人意的计算机系统一定会在不远

的将来造福人类。

自然语言是指人类语言集团的本族语,如汉语、英语等,它是相对于人造语言而言的,如C语言、JAVA语言等计算机语言。语言是思维的载体,是人际交流的工具,人类历史上以语言文字形式记载和流传的知识占到知识总量的80%以上。就计算机应用而言,有85%左右的应用都是用于语言文字的信息处理。在信息化社会中,语言信息处理的技术水平和每年所处理的信息总量已成为衡量一个国家现代化水平的重要标志之一。

自然语言理解作为语言信息处理技术的一个高层次的重要研究方向,一直是人工智能领域的核心课题,也是困难问题之一,由于自然语言的多义性、上下文有关性、模糊性、非系统性和环境密切相关性、涉及的知识面广等原因,使得很多系统不得不采取回避的方法;另外,由于理解并非一个绝对的概念,它与所应用的目标相关,如是用于回答问题、执行命令,还是用于机器翻译。因此,关于自然语言理解,至今尚无一致的、各方可以接受的定义。从微观上讲,自然语言理解是指从自然语言到机器内部的一个映射;从宏观上看,自然语言是指机器能够执行人类所期望的某些语言功能。这些功能包括:

 回答问题:计算机能正确地回答用自然语言输入的有关问题;

 文摘生成:机器能产生输入文本的摘要;

 释义:机器能用不同的词语和句型来复述输入的自然语言信息;

 翻译:机器能把一种语言翻译成另外一种语言。

自然语言有两种基本的形式:口语和书面语。书面语比口语结构性要强,并且噪声也比较小。口语信息包括很多语义上不完整的子句,如果听众关于演讲主题的主观知识不是很了解的话,听众有时可能无法理解这些口语信息。书面语理解包括词法、语法和语义分析,而口语理解还需要加上语音分析。本章我们只涉及书面语的理解问题,不考虑口语的分析。

如果计算机能够理解、处理自然语言,人-机之间的信息交流能够以人们所熟悉的本族语言来进行,将是计算机技术的一项重大突破。另一方面,由于创造和使用自然语言是人类高度智能的表现,因此对自然语言处理的研究也有助于揭开人类高度智能的奥秘,深化对语言能力和思维本质的认识。自然语言理解这个研究方向在应用和理论两个方面都具有重大的意义。

计算机自然语言是自然语言处理。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

计算机一般是指电子计算机,电子计算机(electronic computer)通称电脑,是现代一种用于高速计算的电子计算机器。可以进行数值计算.逻辑计算,具有存储记忆功能,能够按照程序运行,自动.高速处理海量数据。它由硬件系统和软件系统所组成,没有安装任何软件的计算机称为裸机。计算机被用作各种工业和消费设备的控制系统,包括简单的特定用途设备.工业设备及通用设备等。计算机是20世纪最先进的科学技术发明之一,对人类的生产活动和社会活动产生了极其重要的影响,并以强大的生命力飞速发展。它的应用领域从最初的军事科研应用扩展到社会的各个领域,已形成了规模巨大的计算机产业,带动了全球范围的技术进步,由此引发了深刻的社会变革,计算机已遍及一般学校.企事业单位,进入寻常百姓家,成为信息社会中必不可少的工具。它是人类进入信息时代的重要标志之一。随着互联网的提出发展,计算机与其他技术又一次掀起信息技术的革命,根据中国物联网校企联盟的定义,物联网是当下几乎所有技术与计算机.互联网技术的结合,实现物体与物体之间环境以及状态信息实时的共享以及智能化的收集.传递.处理。


欢迎分享,转载请注明来源:民族网

原文地址:https://www.minzuwang.com/life/1101803.html

最新推荐

发表评论

评论将在审核通过后展示