登陆注册
9086800000204

第204章 无心插柳柳成荫

“人景分离项目……”

叶晓奇心说,来了,认真的聆听状,对这个项目非常关心。

“目前遇到了一些问题,主要是由于图片集数据量不够,导致我们的在此基础上建立的特征库,识别准确度非常低下。同时由于美工设计师的不足,在人工剥离人像上也显得资源缺乏。”

“唉……”

叶晓奇心里轻轻的叹了一口气,到此为止,最关心的两个项目,都遇到了各自的困难。一个是自身的不足,自动化基因缺乏。一个是世界性难题,深度学习需要海量的图片,世界各国的数据集都还在建,imageNet的数据集也还很弱小,中生代的勤工俭学数据集计划也才开展没多久。

“所以针对这两个问题,我们基础架构研发部,一方面加大美工的招人力度,另一方面我们开辟了一个新的思路,那就是把包含人像的视频按帧拆分,作为我们的图片素材来源。”

“在此过程中,我们发现,通过对眼睛特征和嘴唇特征的综合表现,可以计算出一个人的情绪;通过眼睛和嘴唇的连续变化,可以得到一个人的情绪变化指数;通过唇形的连续变化,可以大致的知道这个人说什么话……”

正在失望之中的叶晓奇,震惊的问道:“你是说,读唇?”

霍蓓蕾拨了拨发梢,答道:“是这样的,没错,这将是我们后续的参考研发方向。”

“你是说,因为相应的图片集不足,所以你们就把脑筋动在了视频上。然后,就得到了这个东西?”

霍蓓蕾点点头,“没错。”

叶晓奇却感到有些凌乱,科研树发展基本方向不应该是这样的。

图像AI技术大发展是建立在imageNet的深度学习理论的基础之上的,深度学习得到的特征库是一系列相关计算的核心,而深度学习依赖海量的图片。

所以图片不足,你们就特么去拆视频?拆视频就算了,美工不足所以你们直接就把人脸识别那套搬过来了,结果大把的资源撒下去,人景分离还是没整出来,却发现了可以做情绪识别和读唇术?

这下总算知道刚刚香取绫汇报的大笔支出花在哪了……

真真的应了那句话:有心栽花花不开,无心插柳柳成荫

“准确率多少?”

任何图片项目都是有准确率作为标尺的,就以人脸识别来说,准确率低于50%的研究没有任何意义,商用阶段起码要拥有80%以上的准确率才行。

“情绪识别准确率高达64%,主要包括哭、笑、怒、乐、难过、伤心等词缀,目前还在进一步学习,因为分类决策比较少,所以这个学习进展非常快。唇语识别,目前仅限于普通话中文,我们主要是采用央视某套有字幕的节目进行学习的,经测试,对特定的几个主持人的口型识别准备率接近74%,而此类泛用视频的识别率……不足5%……”

74%……不足5%……

情绪识别抛开不提,单说唇语识别。

74%什么概念,就是一句话识别正确的字数到七成,就以“人类是低等植物”这几个字来说,可能意思完全相反,但是对人类来说,猜到它的正确意思一点困难都没有。而实际错误发生的地方都是随机的,也不一定会错的这么离谱,比如“黑灰花卉会挥发”这句话,就如同正常人笔误一样。

叶晓奇不禁为那几个主持人感到默哀,估计他们要是知道他们说的话被天网研究透彻到了这个地步,以后路过中生代都会远远的绕道走。

当然只针对这几个人的研究是没有意义的,所以才有泛用的说法。

泛用识别率不足5%,听起来似乎不那么靠谱。可是事实不是这样的,万事皆有开头,只要研究大方向上没错,后续只是时间的问题。

就以5%来说,基本接近于平行世界2015年底牛津大学提出的研究成果所能达到的目标。随后牛津大学和谷歌合作,在三个月内,也就是16年的三月份迅速把这个识别率学习到了46%。紧跟着不到一年,谷歌就据此发布了唇语识别特征库,面向世界开放,因此项技术收益的项目和企业随之纷纷成立。

当然谷歌的技术仅限于英文,但是原理是一样的,中文读唇术依旧是采用这个原理。

只要研究方向得当,整个过程真的只是时间和算力的问题。

而且46%也绝不是计算机所能达到的极限,通过结合上下文语义分析和语义联结,辅以更大的数据训练,只需要经过两三年的商用落地沉淀,这个准确率就很快可以超越90%。

想想电影里的那些唇语识别桥段吧,这可是超级特工才有的专精技能。而人类经过十几年专业训练的唇语专家,很遗憾,平均识别度仅有不到13%。

计算机以其自身的特点和优势,在效率和成果上,在这方面是足以秒杀人类的。

那么唇语识别能做什么?

能做的事情很多……

特种任务案情分析、监控预警、人质交涉、视频自动字幕……

怀疑某某在春晚上是假唱对吧?声音对不上?没关系,来唇语识别测一测,真唱假唱一测既知。

怀疑某些小鲜肉在电视里只是装作念台词对吧?来咱唇语识别测一测,口型起码要对上。

进一步想像下,有了读唇术,在结合语音识别技术呢?两者相加可以使计算机对人类的语言理解准确到令人发指的程度,这就为和语音智能企业的进一步深入合作提供了可能性,而不是现在的单纯技术买入。

对于某些残障人士呢?试想下,没有人愿意生下来就耳不能闻、口不能述,还不得不去学习一些复杂的手语来和人交流,而这种交流对于普通人来说可能难以理解。但是读唇术可以改变这一些,通过对口型的学习,再通过读唇术翻译,就能正常的与其他人交流!

不能为人类服务的机器人研究,对人类来说,是没有意义的,如果真的出现了这样的研究:请拍死他!

同样,不能为人类服务的AI技术,亦是没有价值的。

读唇术有没有价值?

必须有。

高度成熟的AI技术,是诞生高度发达的机器人的先决条件。

AI技术的发展,绝对不止是像物流机器人一样,代替人类的某些工种,去跟人类抢饭吃。它可以使人类的生活变得更安逸和“懒惰”,比如扫地机器人。它也可以代替人类的某些高危工种,执行一些人类难以执行的任务,充当某些领域的敢死队和马前卒。

这方面最典型的例子就是“好奇者号”,虽然好奇者号在后世看来可能比较落伍,但是其“大脑”一定是拥有了初步的自我判断能力的,否则也无法在长达20多分钟的电波延迟中,脱离人类指挥生存。

假如有一天,人类要进军外太空,人类怎么去指挥机器人?人机协同才是最聪明的方式,机器人的重要性是无可取代的,那么使用传统按键操控方式吗?

笨重的防护服可能不允许人类这么做。势必有着其他指挥方式,例如手势、声音等,读唇术就为人机协同作业提供了额外的可能性。

太空中如此,深海中呢?

高空作业?嘈杂环境作业?

读唇术,及其所属的图像识别,其未来发展前景,是无限……是真正的星辰大海……

同类推荐
  • 都市至尊帝师

    都市至尊帝师

    逐鹿之战,执掌帝印,怒斩魔神蚩尤。武王伐纣,持封神榜破诛仙剑阵,重创通天教主。春秋战国,化身大秦帝师,助秦皇一统天下。三皇五帝尊他为师,秦皇汉武拜他为傅!现在,他来到了繁华都市。你三年前被驱逐出家族,身怀血海深仇?来来来,为师传你一套仙术,让你复仇!你女朋友嫌贫爱富,跟富二代跑了?为师这里有个神豪系统,拿去挥霍拿去爽!他叫君师琅,他是帝师!
  • 和仙女小姐姐的网恋

    和仙女小姐姐的网恋

    莫北意外捡到了一个仙女丢在地球上的漂流瓶,从此开始了不一样的人生。
  • 重生从传奇开始

    重生从传奇开始

    这一年,欧元在欧盟各成员国范围内正式发行。这一年,盐湖城冬季奥运会在美国盐湖城举行。这一年,瓦良格号历经2年8个月时间,终于回到祖国。这一年,中国男足首次进入世界杯的决赛圈,五星巴西诞生。这一年,卫家回到了这里,开始了他的传奇!
  • 回来当个女儿奴

    回来当个女儿奴

    君邪,三界最强圣人,一人镇压三界,成为第五任天庭之主,封号逍遥仙帝,掌管三界数万年来,一直没有后代。某一天,仙帝感受到一阵同脉血源的脉动,自此三界少了一位仙帝,而凡尘多了一位女儿奴。
  • 韩娱之炽爱

    韩娱之炽爱

    2014年的夏天,李珂遇见金孝渊,开启了他们俩疯狂的炽爱之旅
热门推荐
  • 刘君祖完全破解易经密码(第5辑)

    刘君祖完全破解易经密码(第5辑)

    《刘君祖完全破解易经密码》系列书是海内外公认的易学大家刘君祖先生历时四年多,对《易经》六十四卦作透彻详尽的解读,以深入浅出的方式洞悉决策模式,把《易经》智慧延伸在现代生活中,更进一步通过依经解经的方式,以易理和其他学术相印证,如儒家、道家、佛家、兵家,以及中医养生与企业管理等,在在圆融无碍,使得我们对《易经》六十四卦爻符号的无字天书不再陌生,进而欲罢不能、意犹未尽。
  • 绝世独宠:嚣张祸妃很倾城

    绝世独宠:嚣张祸妃很倾城

    她携带异能,意外穿越,一朝醒来,竟成了亡国巫女。他是北莫皇朝最为尊贵的王爷,拥有至高无上的权利,奈何只钟情于她,为了得到她,他不惜一切毁了她的国,将她拐到北莫,对她戏上加戏,他勾唇冷笑:“苏若言,你以为你逃得出本王的手掌心吗?”某女抖了抖,一脸不屑的看着他:“北莫沉,你还真把自己当回事了?”“你这不知天高地厚的性子,只能由本王亲自调教!”好吧,某女认命,一把将他扑倒强吻:“竟然如此,那休怪我没手下留情!”…………
  • 坏茶

    坏茶

    这个世界究竟是谁设下的圈套?为了什么而设下?我不知,只希望,你我能如初见时那班温柔相待……
  • 农家女儿也自强

    农家女儿也自强

    善良到软弱的奶奶,无良的爷爷,强势的娘亲,花心的父亲,能干心软的姑姑,爱玩的哥哥,纠缠不清的亲戚。吕飒飒穿越到了大楚朝一个普通的农户家里,家里的顶梁柱爷爷和父亲都靠不住,化身为李莎莎的吕飒飒带领全家通过神奇的随身空间一齐努力奔小康。另有过百万完结书“重生合家欢”,大家有兴趣可以去看看!新书“重生1978年”隆重推出,坑品有保证,筒子们可以先收藏,养肥了再宰!
  • 重生罪恶之冠

    重生罪恶之冠

    天启病毒消灭后,日本摆脱了GHQ的掌控,开始了蓬勃地发展,可世界的意志,并没有因此而改变!死亡,重生,天启病毒是为何而存在?交织的命运,无尽的轮回,为何我……一直活着!(有喜欢罪恶王冠的书友吗?那就来支持刀剑!)书友群472362319,欢迎进群。新书《我成了活死人》已经开启,如果有喜欢都市灵异的书友,可以移步一观。
  • 弗洛伊德文集1:癔症研究

    弗洛伊德文集1:癔症研究

    本卷包括中文版主编车文博所著的《导论》和《弗洛伊德略传》,以及由弗洛伊德与约瑟夫·布洛伊尔合著的《癔症研究》三部分。《导论》和《弗洛伊德略传》是中文版主编车文博研究弗洛伊德的精髓所在,可以帮助读者更好地了解弗洛伊德和精神分析理论。《癔症研究》最初于1895年在德国出版,书中对癔症的症状、病因做了详细的分析和解说,开始提出癔症创伤理论,是其精神分析理论的奠基和正式起点的标志。
  • 神级孵化

    神级孵化

    自从接收了来自星空深处的一枚彩蛋,张明轩不可避免地在牛比的道路上越走越远。只要许愿的功夫深,彩蛋就能孵化出他想要的任何东西。于是,畅销作家、科技巨子、行业领袖、超级偶像、武道宗师,无数的头衔砸到了他头上,他引领了时代风潮!可是张明轩总是心累,高级货孵化得太多,他总是得想办法消化掉。
  • 对你情不自禁:不能没有你

    对你情不自禁:不能没有你

    他说:“董知微,我想要你。”他没有说我想追求你,没有说我喜欢你,更没有说我爱你,他只是说“董知微,我想要你”。他从未在她面前露出这样焦躁不安的样子,这样的袁景瑞让董知微感到陌生与心软,之前的战栗被一种深切的悲哀替代。“不!”她在自己窒息之前开口说话,阻止他任何进一步的动作。她不是不知道他深爱着她,不是不知道他用情多深,只是在受过伤后,她不再勇敢、不再自信。她能做的,只能是拒绝与逃避。而这些,他不懂!
  • 江山多娇之问情

    江山多娇之问情

    她有一颗玲珑剔透心,她真诚善良、济世为怀,一边是自由和爱恋,一边是历史的轨迹,一个被命运安排却又不甘心服从命运的现代“白骨精”,她会如何选择?大是大非,天下苍生,她将何去何从?江山多娇,因爱问情!
  • 萝莉老妈:天才龙凤胎

    萝莉老妈:天才龙凤胎

    =弃坑,勿入==弃坑,勿入=“签了它滚吧,以后不要再出现在我面前,我会给你一笔丰厚的赡养费足够你以后生活无忧。”眼前英俊的男人丢下一纸离婚协议书头也不回的走出她的视线,独留被泪水模糊了双眼的她.五年后。“叔叔,他们说你是我的爹地,你是吗?”一个小破孩屁颠屁颠走到男人面前拉着男人的西装裤疑惑的看着他。“女人,你敢偷偷生下我的孩子,几年不见,胆子长肥了不少啊!”男人调笑的看着已经今非昔比的女子,发现她早已不是当年那个单纯的小女孩,自己究竟错过了什么?