天才一秒记住【畅想小说网】地址:http://www.cxtra.net
宋教授:“之前我们做的机器图像识别,无法像人一样,从事物的不同状态中提取出某种底层不变性。
抱歉我又要拿猫举例子,一只猫胖了瘦了,掉毛了生病了,或者给它穿戴上各种装饰品,它打个呵欠、发怒、舔舌头,它都是同一只猫。
而对于机器来说,图像的尺寸、背景、光照、位移、旋转、畸变、遮挡……都会影响它的判断,它只能根据既定算法进行有限层级的映射,而无法模仿人脑通过多层神经网络进行分层递阶的多粒度计算……”
主持人:“抱歉打断您一下,这部分内容或许对于欠缺背景知识的我们来说有点难以理解,那么您发明的IP系统是如何解决这个问题的呢?”
宋教授面露尴尬:“不好意思,一不小心就说多了。
确切地说,我们的一只脚才刚刚跨过门槛,离真正解决问题还早着呢,这个系统也只是整个大计划中的一个前驱项目。
我们的灵感其实来自语义分析,大家知道,信息的意义其实并不在于信息本身,而存在于其结构中,就像文本意义存在于上下文,图像的意义存在于时空结构之中。
我们能否通过索引对象存在于整个时空结构中的信息来帮助机器识别对象,这是整个项目灵感的源起。”
主持人:“我问一个外行话,如果机器都无法准确识别对象,怎么能去寻找它存在于……嗯,所谓时空结构中的信息呢?”
宋教授:“你这个问题提得非常好。
就像照片里的小猫,你是先知道什么是猫,再去找猫在哪儿,还是先知道猫在哪儿,再去识别什么是猫?这就是一个鸡生蛋蛋生鸡的悖论。
目前我们的神经科学和生理学知识尚无法解释人类的认知过程是如何发生的,更不用说教会机器了。
于是我们采用了另一种思路。”
主持人:“这听起来就像是推理小说啊。”
宋教授:“呵呵,这个比喻有意思。
我们是这么做的,从语义上给定一个对象,通过对接外部数据库去抓取相关的信息,包括语义和图像,并按时间序列构建起意义连续体,然后我们把真实的对象摆到机器面前。
比如说,一只猫,机器会在捕捉到的动态画面与意义连续体之间寻找可能的流形映射,当它确定两者之间能够建立映射时,也就是说它‘认出’这只猫时,就会‘咔嚓’一下,按下快门。
当然这只是个简化的比喻,背后有许多艰深的算法,我们希望以这种倒推方式找到提升机器识别能力的办法,它更多是一个数学上的问题。”
主持人:“听起来蛮有意思的,那怎么会想到把这项技术从实验室里带到CCES呢?”
宋教授:“嗯,这个我不确定能不能说,之后我跟领导确认一下,如果不方便公布你们就剪掉吧。”
主持人:“没问题。”
宋教授:“其实这个项目除了来自国家的专项基金外,还有几家大科技公司的资助,他们希望能从前期就介入,看看这项技术商业化的前景如何;另外一点,我们需要更多的样本帮助机器进行深度学习,而真实环境中的对象远远比实验室里的模拟条件来得复杂。
正好我的组里有一个狂热的摄影爱好者,他帮忙设计了这个,我们称之为‘锦上添花’的照相模块,包括调焦、光圈、快门以及滤镜库的调用等功能。”
主持人:“这会不会涉及数据隐私的问题?”
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!