您现在的位置:融合网首页 > 工信 > 其他 >

漫谈人工智能之一(2)

来源:褚达晨 作者:褚达晨 责任编辑:方向 发表时间:2017-03-06 12:03 
核心提示:计算机发明出来就是帮人类处理大数据的,你把成千上万乃至上亿的数据一排一排列出来,超高维不足为奇。用什么方法来破解超高维数据蕴含的秘密?就看各家功夫了。线性方法最易于理解和计算(比如Andrew Ng老师讲机器

计算机发明出来就是帮人类处理大数据的,你把成千上万乃至上亿的数据一排一排列出来,“超高维”不足为奇。用什么方法来破解超高维数据蕴含的秘密?就看各家功夫了。线性方法最易于理解和计算(比如Andrew Ng老师讲机器学习的经典课程就是从线性回归讲起的),但是“直来直去”的缺陷也很明显。各派武功中,计算机学家们喜欢用离散的数据结构,推出各种“树”和“森林”等遍历搜索方法;统计学家们信奉“存在即合理”的贝叶斯理论,正过来P(A|B)不好算我就倒过来算P(B|A),效果相当不错;古典数学流派祭出“核变换”的秘籍,把高维空间的一个椭球变成低维空间的一个线性平面(还记得高中解析几何里教的球坐标吧?就是它!),然后还能把低维平面的边界距离远近都算的清清楚楚。这招叫SVM,也称霸武林十几年。

但这些武功有一个问题,就是只用了单层复杂函数来模拟现实。现实世界是复杂的,用单层复杂模型难免会顾此失彼,别说在图像识别这种领域里“鼻子眼睛眉毛”这些特征都很难用一句话说清楚,计算机的表现差强人意就不奇怪了。

深度学习的前生叫“神经网络”,单层神经网络叫“感知机”,名字取得挺好听,实际上啥也感知不了,武功弱爆了,基本被上面说的各派武功秒杀。好在“神经网络派”虽小,但是几位长老不甘心,孤心苦诣研究出多层神经网络,终在几次华山论剑中大胜,从此名动江湖,有了人工智能的今天。

啰嗦了半天,到底多层神经网络(深度学习)为什么牛?最重要的一点就是深度学习用非线性的拟合函数一层一层套下去,无限逼近任何函数数据模型!N层网络套下来,这个函数在纸上根本都写不下。相当于在高维非线性空间里创造出一个可以任意弯曲的超级粒子“深度子”!(函数即粒子,恕我借用了量子力学中“波粒二象性”的观点)。这个“深度子”能量超高,具备万有逼近能力,前面说的“树子”,“SVM子”等等处理相对简单的“小数据”问题还行,在比拼模拟真实复杂世界的能力上,一下子就输给“深度子”了(比如说图像识别大赛)。

驾驭“深度子”非常不易,神经网络派长老们用了王重阳的办法,以多打一,用“天罡北斗七星阵”,结阵御敌。层数一多,阵中参数上亿,变化玄妙,人类不能参透。长老们陆续想出了一些方法,比如说

1、下山法(GD算法):深度学习要做得事情其实就是找到给定高维空间中目标函数的最小值。这如同要求“深度子”在有无数崎岖山峰的大山中寻找最低点,牛顿300多年前发明的“下山法”就帮上忙了,“深度子”每到一处就丈量四周坡度,找个最陡的角度往下俯冲;

2、回溯法(BP算法):“深度子”找最低点不可能一蹴而就,长老们就在终点检查“深度子”交的作业,如果结果不理想,长老们就沿着“北斗七星阵”逆流回溯,哪个节点做得最差就让从哪里改起,逐步优化(只听王重阳喝到:孙不二,你这剑力量弱了,让敌人跑了,赶紧加力)。

3、卷积法(CNN):比如说要从千万张的二维图像中分辨中是猫、狗、猴子,“深度子”先化身为一个小范围扫描仪,扫遍全图分析结果。这样一遍一遍扫下来,“深度子”就逐步能认出毛发,眉眼,再到面貌,最后给长老交作业:这是猫!那是狗!嗯,这个不太确定,像是个猴子。

4、循环法(RNN):深度神经网络阵法一经催动,变幻如流水;流水川流不息,就算最后在入海口能通过CNN辨别万象,但是逝者如斯夫,不会形成“记忆”;这样处理时序问题就不太行。循环算法大致就是让阵中前后相连的神经元捉对循环演练(孙不二和郝大通互相推手N次再练下一招,这样孙不二就对郝大通的武功有了记忆)。RNN有个变种叫LSTM,特别适合做语义理解和机器翻译。(责任编辑:方向)

  • “扫一扫”关注融合网微信号

免责声明:我方仅为合法的第三方企业注册用户所发布的内容提供存储空间,融合网不对其发布的内容提供任何形式的保证:不保证内容满足您的要求,不保证融合网的服务不会中断。因网络状况、通讯线路、第三方网站或管理部门的要求等任何原因而导致您不能正常使用融合网,融合网不承担任何法律责任。

第三方企业注册用户在融合网发布的内容(包含但不限于融合网目前各产品功能里的内容)仅表明其第三方企业注册用户的立场和观点,并不代表融合网的立场或观点。相关各方及作者发布此信息的目的在于传播、分享更多信息,并不代表本网站的观点和立场,更与本站立场无关。相关各方及作者在我方平台上发表、发布的所有资料、言论等仅代表其作者个人观点,与本网站立场无关,不对您构成任何投资、交易等方面的建议。用户应基于自己的独立判断,自行决定并承担相应风险。

根据相关协议内容,第三方企业注册用户已知悉自身作为内容的发布者,需自行对所发表内容(如,字体、图片、文章内容等)负责,因所发表内容(如,字体、图片、文章内容等)等所引发的一切纠纷均由该内容的发布者(即,第三方企业注册用户)承担全部法律及连带责任。融合网不承担任何法律及连带责任。

第三方企业注册用户在融合网相关栏目上所发布的涉嫌侵犯他人知识产权或其他合法权益的内容(如,字体、图片、文章内容等),经相关版权方、权利方等提供初步证据,融合网有权先行予以删除,并保留移交司法机关查处的权利。参照相应司法机关的查处结果,融合网对于第三方企业用户所发布内容的处置具有最终决定权。

个人或单位如认为第三方企业注册用户在融合网上发布的内容(如,字体、图片、文章内容等)存在侵犯自身合法权益的,应准备好具有法律效应的证明材料,及时与融合网取得联系,以便融合网及时协调第三方企业注册用户并迅速做出相应处理工作。

融合网联系方式:(一)、电话:(010)57722280;(二)、电子邮箱:2029555353@qq.com dwrh@dwrh.net

对免责声明的解释、修改及更新权均属于融合网所有。

新闻关注排行榜

热门推荐 最新推荐

热门关键字

关于我们 - 融合文化 - 媒体报道 - 在线咨询 - 网站地图 - TAG标签 - 联系我们
Copyright © 2010-2020 融合网|DWRH.net 版权所有 联系邮箱:dwrh@dwrh.net 京公网安备 11011202002094号 京ICP备11014553号