???疑问:到底什么是模式识别

模式识别=客体认知 模式识别=客体认知结果的计算机逼近。 模式识别=客体认知过程的仿真 到底,什么事认知意义上的模式识别呢? 模式识别的基本定义如下: 模式识别(英语:Pattern Recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别、语音识别系统。 模式识别是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科。 模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。 (资料来源:百度百科) 较为具体的揭示: http://wenku.baidu.com/link?url=ZaQoHXlOMXqIGTIor94hxQgfD571-dMxbpwvoZL9hWBhIE9VN2Vl3qobUDkc0_M9zgNuHDvlJsu8oPOXZj-McPQ25fGIZvoBFG954s2jYkm ...
Read More

Web挖掘研究(韩家炜)

Web挖掘 Web内容挖掘 Web结构挖掘 权威页面:根据Web中包含的一个页面指向另一个页面的超链接 Page-rank方法(较简单) 一个页面被多次引用,则这个页面很可能是重要的;一个页面尽管没有被多次引用,但被一个重要页面引用,则这个页面很可能是重要的;一个页面的重要性被均分并被传递到它所引用的页面。  Hub/authority方法(较复杂,没看懂) 一个hub是指一个或多个Web页面,它提供了指向权威页面的链接集合.hub页面本身可能并不突出,或者说可能没有几个链接指向它们.但是,hub页面却提供了指向就某个公共话题而言最为突出的站点链接.此类页面可以是主页上的推荐链接列表。好的hub是指向许多好的权威的页面;好的权威是指由许多好的hub所指向的页面. Web使用记录的挖掘         个人想法:是否可以用上面的方法在Web的结构挖掘找出权威的页面,并从页面中进行内容挖掘来获取概念。 可预见的问题:怎样的权威程度才可以用于获取概念?动态性?             ...
Read More

【评论】三脑认知模型

三脑认知模型,让人信服指出体现于,其从进化论的观点,叙述了大脑的三层结构为什么会如此明晰,也体现了进化中常见的迭代演变,旧者保留遗迹的情况。 但人脑是如麦克里恩所说逐步演变,还是在冰川季之后发生了突发性的变异,尚不可知。正如寒武纪大爆发,生物的演变不一定是渐进式的,也有可能在某一个阶段由于某些因素的影响,突然爆发出来。 若果真如此,则该模型的合理性将受到质疑。 魏昕宇 ...
Read More

【转载】三脑结构论(保罗 麦克里恩)

脑的三位一体理论 http://article.yeeyan.org/view/32269/45604   l         保罗.麦克里恩提出的“脑的三位一体”假设 l         爬行动物脑 l         边缘系统(古哺乳动物脑) l         新皮质(新哺乳动物脑) l         链接     神经学专家保罗.麦克里恩提出假设,设想人类颅腔内的脑并非只有一个,而是三个。这三个脑作为人类进化不同阶段的产物,按照出现顺序依次覆盖在已有的脑层之上,如同考古遗址一样,保罗称其为“人脑的三位一体”构造。麦克里恩现在是位于美国马里兰州浦尔斯维的“脑进化与行为”实验室的主管,他说这三个脑的运行机制就像“三台互联的生物电脑,各自拥有独立的智能、主体性、时空感与记忆”。他将这三个脑分别称作新皮质或新哺乳动物脑,边缘系统或古哺乳动物脑,以及爬行动物脑,即脑干和小脑(见上图)。每个脑通过神经与其他两个相连,但各自作为独立的系统分别运行,各司其职。   该假设已经成为了一个颇具影响力的脑研究范式,催生了对人脑功能机制的从新思考。在此之前,研究者们认为新皮质作为人脑的最高层,控制着其他的低端脑层。麦克里恩否定了这一说法,指出,控制情感的边缘系统,虽然生理上位于新皮质之下,但在必要的时候能够干扰甚至阻止新皮质高阶精神功能的实现。   有趣的是,许多带有神秘色彩、年代久远的灵性修行团体也宣扬过与此类似的观点,比如“意识的三种境界”,甚至同样有人提出过“三个不同的大脑”一说。例如葛吉夫,他曾经称人类是“有三个大脑的生物”,他们分别掌控着人的意识、灵魂和身体。卡巴拉教、柏拉图主义,以及其他一些地方也可以见到类似的观点,他们基本上都提出了“意识—脑袋(真实的大脑)”、“灵魂—心脏”、“身体—腹腔”这类功能与器官的对应关系。我们不由想到了脉轮范式(chakra,音译为:查克拉),它与以上那些说法一脉相承且更加细化,认为人类的身体或脊椎一侧依次分布着若干个穴位,分别与不同的意识节点相对应。       爬行动物脑.  旧皮质,又称原始(爬行动物)脑或“基础脑”,包括脑干和小脑,是最先出现的脑成分,麦克里恩称其为“R-复合区”。它由脑干—延髓、脑桥、小脑、中脑,以及最古老的基底核——苍白球与嗅球组成。对于爬行动物来说,脑干和小脑对物种行为起着控制作用,出于这个原因,人们把旧皮质称为“爬行动物脑”。在爬行动物脑操控下,人与蛇、蜥蜴有着相同的行为模式:呆板、偏执、冲动、一成不变、多疑妄想,如同“在记忆里烙下了祖先们在蛮荒时代的生存印记”。无休止地复制着相同的行为方式,从不会从以前的错误中学习教训(与室利.阿罗频多所说的机械心灵相对应)。这个大脑控制着身体的肌肉、平衡与自动机能,诸如呼吸与心跳。大脑的这个部分一直保持活跃状态,即使在深度睡眠中也不会休息。       边缘系统(古哺乳动物脑).  1952年麦克里恩第一次创造了“边缘系统”这个词,用来指代大脑中间的部分,这部分同样可以称作旧大脑皮层或中间脑(古哺乳动物脑),与大部分尤其是进化早期的哺乳动物脑相对应。位于边缘系统的古哺乳动物脑,与情感、直觉、哺育、搏斗、逃避、以及性行为紧密相关。如麦克里恩所察,情感系统一向是爱恨分明的,一件事物要么“宜人”要么“不宜”,没有中间状态。在恶劣的环境中,正是依赖这种简单的“趋利避害”原则,生存才得到保证。 当这部分大脑受到弱电流的刺激,多种情绪(恐惧、欢乐、愤怒、愉悦、痛苦等等)便会滋生。虽然各类情绪在特定位置存留的时间很短暂,但整个边缘系统却似乎是孕育情绪、注意力以及情感(情绪主导)记忆的主要温床。从生理上看,边缘系统包括下丘脑、海马体以及杏仁核。它帮助人类判断事物的基本价值(例如,你对某物是持肯定还是否定态度,佛教称此为vedena—“感”)和特别之处(例如,什么吸引了你的注意力),还有助于人类感知不确定性因素,进行创造性活动。边缘系统与新皮质有着千丝万缕的深入连接,二者联合操控着脑功能的发挥,任何一方都无法独立垄断人脑运行。 麦克里恩提出,教条化与偏执狂、自卑感、对欲望的合理化等行为倾向都可以在边缘系统中找到生物学基础。他认为边缘系统中蕴含的力量如果全部爆发,危险性实在不容小觑。按照他的理解,发出价值判断指令的指挥室,往往不是处于更高进化阶段的新皮质,而是边缘系统中相对低阶的古哺乳动物脑。前者产生的想法好不好,正确与否,都由后者来加以判断。     新皮质,大脑、脑皮质,或者换个词:新皮层,就是我们所知道的高级脑或理性脑,它几乎将左右脑半球(由一种进化较新的皮质类型组成,称为新皮质)全部囊括在内,还包括了一些皮层下的神经元组群。脑皮质对应的是灵长类哺乳动物脑,人类当然包括在内。正是脑皮质中所具有的高阶认知功能,令人类从动物群体中脱颖而出,麦克里恩将脑皮质称作是“发明创造之母,抽象思维之父”。人类大脑中,新皮质占据了整个脑容量的三分之二,而其他动物种类虽然也有新皮质,但是相对来说很小,少有甚至没有褶皱(意味着新皮质的表面积、复杂度与发达程度)。老鼠失去了脑皮质,仍然可以正常活动(至少从表面上看是如此),而人类一旦失去脑皮质,那他将与蔬菜无异。   脑皮质分为左右两个半球,就是为人们所熟知的的左右脑。左侧的脑皮质控制着身体的右侧,右侧的脑皮质控制着身体的左侧。并且,右脑更多地决定了人的空间感、抽象思维、音乐感与艺术性,而左脑则更多控制着人的线性逻辑,理性思考与言语能力。 ...
Read More

形式概念分析学术研讨会

感觉:脑对直接作用于感觉器官的客观事物个别属性的反映。 知觉:脑对直接作用于感觉器官的客观事物整体属性的反映。 ①客体相似性内涵:心理距离取向;特征取向;结构取向;转换取向。②客体相似性表征:是指可以反复指代某事物的任何符号和符号集。③事物可比较性和不可比较性公理;事物相容性和不相容性公理。 世间万物都可以用多层次,变尺度,多簇集的偏序结构来表示 研究“属性的属性”“背景的背景” 属性的可分支:最大共有属性VS共有属性VS独有属性VS矛盾属性(区别于对立属性)VS互斥属性VS互不包含属性(三支决策问题)VS伴生属性VS最近伴生属性VS多属性伴生属性VS类独有属性。 必然特征和似然特征概念区分; 考虑问题,考虑主要特征外,还应考虑到基础比率问题。 动态三支决策三原则: 知识越多,三支决策越有效; 分组决策的效率高于统一决策; 能够诱导出相协调决策的知识会被筛选出来。 ...
Read More

【论文阅读】《基于属性度的属性排序算法》

文中在引言部分提到“一个良好的属性选取与排序 ,可以有效减小子过程的运算量,无论是对于传统的串行运算或是并行运算,都将使得整体运算量降低。”深刻理解这一过程的意义,必须实际进行基于属性拓扑的概念计算,深入的学习探索而不是浅尝辄止。 借用与老师讨论属性偏序转换时猜到的度的想法,文中首先定义了属性节点的出度和入度的概念。即与其相邻的相容属性个数。 在此基础上定义了度比,即出度比入度,这是在不断尝试之后得到的集成创新的结果。 文中提出了若干定理 %%%%%%%%%%%%%%%%%%%%%% 顶层属性度比大于1ß-------->顶层属性的定义导致的 %%%%%%%%%%%%%%%%%%%%%%% 文中,对动度的定义中。ID即为入度。出现在本小节开头。 总体来说,这是小白拓扑分裂中的一部分,是根据计算概念的需要产生的,要明晰这一点需要进一步研究概念计算的过程。...
Read More

《人工智能形式概念分析系统》之一

书目:《人工智能形式概念分析系统》 作者:危辉 出版社:科学出版社 第一章 概念系统的重要性 立论: 自然语言理解,问题求解,网上信息处理,场景分类——————————————————>>>>>共性问题: 人的认知系统使用知识完成多种不同类型的智能任务,其核心是可外显和可陈述的知识体系,支撑这个体系的事概念系统。 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 人工智能中概念系统作用的体现: 场景理解————————————对比PLSA # 人工智能的两种主要研究方法: 结构模拟:How we know 功能模拟:What we know 参考文献(Levine and Aparicio,1994) # 本体(ontology):描述概念及概念之间关系的概念模型,通过概念之间的关系来描述概念的语义,是知识工程领域的一个新的研究方向。 不适用于领域开放的常识性问题求解,适合特定领域,定义明确规整的专业知识<<>>专家系统 心理学是怎么看的 认知心理学认为概念既是存在于人脑知识结构中的一种知识内容,又是主体所进行的一种认知加工过程。 知识表征方法: 局部表征(localist representation)VS分布式表征(distributed representation) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 参考截图: ...
Read More

有关大数据ppt部分内容

从文本数据到异构网络的构建 1, 从海量的文本数据中挖掘短语(最小语义单位) 2, 实体识别与类型 3, 关系提取 4, 异构信息网络的构建 为什么从海量的语料库中挖掘短语? 1单词是模糊不清的,但是短语是自然的,明确的语义单元 例如:“United”, vs. United States, United Airline, United Parcel Service 2挖掘语义有意义的短语 将文本数据从字粒度变换到短语粒度 利用信息网络增强处理未结构化数据的能力 3短语挖掘,大多数自然语言处理方法可能需要注释和训练 注释数百个文档作为训练数据 基于部分语音特征的训练模型 ?限制:高标注成本 ?可能不能扩展到特定领域的动态的,新兴的应用程序 ?科学领域,查询日志,或者社会媒体,例如Yelp,推特 最少的/没有训练的但是能够充分利用大规模的语料库 短语挖掘策略 策略1:同时推断短语和主题 1二元局部模型,n元局部模型和短语发现主题模型 2高模型复杂度:倾向于高度拟合,推理成本高,慢 策略2:话题建模短语构造 标签的话题,Turbo话题和KERT 在同一个短语中的短语可能分为不同的主题 例如,knowledge discovery using least squares support vector machine (基于最小二乘支持向量积的知识发现) 解决方案1: 首先短语挖掘然后话题建模(没有训练数据) 解决方案2: 短语挖掘和文档分割相结合(以最少的训练数据) 整体短语挖掘框架 1首先短语构建,然后主题挖掘 与KERT对比,首先主题建模,然后短语挖掘 2框架 a进行频繁的连续模式挖掘来提取候选短语和计数 b执行相邻元的凝聚合并作为评分的指导意义-这一段每一个文件变成一个包短语。 c最新形成的包短语作为PhraseLDA的输入,LDA的延伸,这限制了每一个分享相同的潜在主题的短语的所有单词。 什么样的短语是“高质量” 1. 判断短语的质量 通俗性 信息检索和跨语言的语言检索 2. 一致性 “powerful tea” vs. “strong tea”  “active learning” vs. “learning classification” 3. 忠实度 “this paper” (frequent but not discriminative, not informative) 4.完整性 “vector machine” vs. “support vector machine” 为什么需要短语分割 1. 短语分割可以告诉我们那一个词语是更合适的 提高短语分割 1. 再循环提高短语分割 2. 反馈 a. 利用整流频率,重新计算这些基于原始频率先前计算的特征。 3. 过程:用一小组标签或者用通用知识库远程训练进行分类。 分类—>短语分割 //SegPhrase —>分类—>短语分割 //SegPhrase+ 4. 计算质量分数的影响 实验:基于短语的相似性搜索 1. 响应用户的短语查询,SegPhrase+生成高质量的,语义上相似的短语 在多语言中挖掘高质量短语 至page23 以下来自大数据文摘 数据挖掘有哪些方法? 1. 分类:首先从数据中选出分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。 2. 聚类(Clustering):就是将数据分组成多个类(Cluster)。在同一个类内对象之间具有较高的相似度,不同类之间的差别较大。 3. ...
Read More

关联规则发现的铺垫:属性拓扑概念计算回顾

在形势概念分析中,最基本的概念计算应属于甘特尔在书籍第2章《概念格的确定与表示》中,提到的,利用不断求交的方式获取概念。但是,如何清晰简单的理解此种过程可以不重不漏的获得形势背景中的所有概念,概念的应用意义又是什么. ps:不能添加图片,此处就引用一下吧,在2.1节《一个背景的所有概念开篇》 补充材料: 提及到章节的电子版: http://yunpan.cn/cmCXbpmUzCU57 访问密码 8d98 ...
Read More